Standard deviation ng formula ng bilang ng mga biktima. Pagkalkula ng standard deviation sa Microsoft Excel

bahay / Nanliligaw na asawa

Karaniwang lihis(kasingkahulugan: karaniwang lihis, karaniwang lihis, parisukat na paglihis; mga kaugnay na termino: karaniwang lihis, karaniwang pagkalat) - sa teorya at istatistika ng posibilidad, ang pinakakaraniwang tagapagpahiwatig ng pagpapakalat ng mga halaga ng isang random na variable na nauugnay sa inaasahan ng matematika nito. Sa limitadong mga arrays ng mga sample ng mga value, sa halip na ang mathematical expectation, ang arithmetic mean ng set ng mga sample ay ginagamit.

Encyclopedic YouTube

  • 1 / 5

    Ang karaniwang paglihis ay sinusukat sa mga yunit ng pagsukat ng random na variable mismo at ginagamit kapag kinakalkula ang karaniwang error ng arithmetic mean, kapag bumubuo ng mga pagitan ng kumpiyansa, kapag sinusukat ng istatistika ang mga hypotheses, kapag sinusukat ang linear na relasyon sa pagitan ng mga random na variable. Tinukoy bilang square root ng variance ng isang random variable.

    Karaniwang lihis:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\kaliwa(x_(i)-(\bar (x))\kanan)^(2)));)
    • Tandaan: Kadalasan mayroong mga pagkakaiba sa mga pangalan ng MSD (Root Mean Square Deviation) at STD (Standard Deviation) sa kanilang mga formula. Halimbawa, sa numPy module ng Python programming language, ang std() function ay inilalarawan bilang "standard deviation", habang ang formula ay sumasalamin sa standard deviation (division by the root of the sample). Sa Excel, ang STANDARDEVAL() function ay iba (dibisyon sa ugat ng n-1).

    Karaniwang lihis(pagtantiya ng standard deviation ng isang random variable x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\kanan) ^(2))).)

    saan σ 2 (\displaystyle \sigma ^(2))- pagpapakalat; x i (\displaystyle x_(i)) - i ika elemento ng pagpili; n (\displaystyle n)- laki ng sample; - arithmetic mean ng sample:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. Sa pangkalahatang kaso, imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang pagtatantya batay sa walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

    Alinsunod sa GOST R 8.736-2011, ang karaniwang paglihis ay kinakalkula gamit ang pangalawang formula ng seksyong ito. Mangyaring suriin ang mga resulta.

    Tatlong sigma na panuntunan

    Tatlong sigma na panuntunan (3 σ (\displaystyle 3\sigma )) - halos lahat ng mga halaga ng isang normal na ipinamamahagi na random na variable ay nasa pagitan (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Mas mahigpit - na may humigit-kumulang na probabilidad na 0.9973, ang halaga ng isang karaniwang ibinabahagi na random na variable ay nasa tinukoy na agwat (sa kondisyon na ang halaga x ¯ (\displaystyle (\bar (x))) totoo, at hindi nakuha bilang resulta ng pagpoproseso ng sample).

    Kung ang tunay na halaga x ¯ (\displaystyle (\bar (x))) ay hindi kilala, kung gayon hindi mo dapat gamitin σ (\displaystyle \sigma ), A s. Kaya, ang panuntunan ng tatlong sigma ay binago sa panuntunan ng tatlo s .

    Interpretasyon ng standard deviation value

    Ang isang mas malaking karaniwang halaga ng paglihis ay nagpapakita ng isang mas malaking pagkalat ng mga halaga sa ipinakita na hanay na may average na halaga ng hanay; ang isang mas maliit na halaga, nang naaayon, ay nagpapakita na ang mga halaga sa hanay ay pinagsama-sama sa average na halaga.

    Halimbawa, mayroon kaming tatlong hanay ng numero: (0, 0, 14, 14), (0, 6, 8, 14) at (6, 6, 8, 8). Ang lahat ng tatlong set ay may mga mean value na katumbas ng 7, at standard deviations, ayon sa pagkakabanggit, katumbas ng 7, 5 at 1. Ang huling set ay may maliit na standard deviation, dahil ang mga value sa set ay pinagsama-sama sa average na halaga; ang unang hanay ay may pinakamalaking karaniwang halaga ng paglihis - ang mga halaga sa loob ng hanay ay lubos na nag-iiba mula sa average na halaga.

    Sa pangkalahatang kahulugan, ang karaniwang paglihis ay maaaring ituring na isang sukatan ng kawalan ng katiyakan. Halimbawa, sa physics, ginagamit ang standard deviation upang matukoy ang error ng isang serye ng sunud-sunod na mga sukat ng ilang dami. Napakahalaga ng halagang ito para sa pagtukoy ng katumpakan ng hindi pangkaraniwang bagay na pinag-aaralan kung ihahambing sa halaga na hinulaang ng teorya: kung ang average na halaga ng mga sukat ay naiiba nang malaki sa mga halaga na hinulaan ng teorya (malaking standard deviation), pagkatapos ay ang mga nakuha na halaga o ang paraan ng pagkuha ng mga ito ay dapat na muling suriin. nakilala sa panganib sa portfolio.

    Klima

    Ipagpalagay na mayroong dalawang lungsod na may parehong average na maximum na pang-araw-araw na temperatura, ngunit ang isa ay matatagpuan sa baybayin at ang isa ay nasa kapatagan. Ito ay kilala na ang mga lungsod na matatagpuan sa baybayin ay may maraming iba't ibang pinakamataas na temperatura sa araw na mas mababa kaysa sa mga lungsod na matatagpuan sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng pinakamataas na pang-araw-araw na temperatura para sa isang baybaying lungsod ay magiging mas mababa kaysa sa pangalawang lungsod, sa kabila ng katotohanan na ang average na halaga ng halagang ito ay pareho, na sa pagsasanay ay nangangahulugan na ang posibilidad na ang pinakamataas na temperatura ng hangin sa anumang partikular na araw ng taon ay magiging mas mataas na naiiba mula sa average na halaga, mas mataas para sa isang lungsod na matatagpuan sa loob ng bansa.

    Palakasan

    Ipagpalagay natin na mayroong ilang mga koponan ng football na na-rate sa ilang hanay ng mga parameter, halimbawa, ang bilang ng mga layunin na nakapuntos at natanggap, mga pagkakataon sa pag-iskor, atbp. Malamang na ang pinakamahusay na koponan sa pangkat na ito ay magkakaroon ng mas mahusay na mga halaga sa higit pang mga parameter. Kung mas maliit ang standard deviation ng team para sa bawat isa sa mga ipinakitang parameter, mas predictable ang resulta ng team; balanse ang mga naturang team. Sa kabilang banda, ang isang koponan na may malaking standard deviation ay mahirap hulaan ang resulta, na kung saan ay ipinaliwanag ng isang kawalan ng timbang, halimbawa, isang malakas na depensa ngunit isang mahinang pag-atake.

    Ang paggamit ng karaniwang paglihis ng mga parameter ng koponan ay ginagawang posible, sa isang antas o iba pa, upang mahulaan ang resulta ng isang laban sa pagitan ng dalawang koponan, pagtatasa ng mga lakas at kahinaan ng mga koponan, at samakatuwid ang mga napiling paraan ng pakikipaglaban.

    • Mga sagot sa mga tanong sa pagsusulit sa pampublikong kalusugan at pangangalaga sa kalusugan.
    • 1. Pampublikong kalusugan at pangangalagang pangkalusugan bilang isang agham at lugar ng praktikal na aktibidad. Pangunahing layunin. Bagay, paksa ng pag-aaral. Paraan.
    • 2. Pangangalaga sa kalusugan. Kahulugan. Kasaysayan ng pag-unlad ng pangangalagang pangkalusugan. Mga modernong sistema ng pangangalagang pangkalusugan, ang kanilang mga katangian.
    • 3. Patakaran ng estado sa larangan ng pagprotekta sa kalusugan ng publiko (Batas ng Republika ng Belarus "Sa Pangangalagang Pangkalusugan"). Mga prinsipyo ng organisasyon ng sistema ng pampublikong pangangalaga sa kalusugan.
    • 4. Insurance at pribadong paraan ng pangangalagang pangkalusugan.
    • 5. Pag-iwas, kahulugan, mga prinsipyo, mga modernong problema. Mga uri, antas, direksyon ng pag-iwas.
    • 6. Mga programa sa pambansang pag-iwas. Ang kanilang papel sa pagpapabuti ng kalusugan ng publiko.
    • 7. Medikal na etika at deontolohiya. Kahulugan ng konsepto. Mga modernong problema ng medikal na etika at deontology, mga katangian.
    • 8. Malusog na pamumuhay, kahulugan ng konsepto. Mga aspetong panlipunan at medikal ng isang malusog na pamumuhay (healthy lifestyle).
    • 9. Pagsasanay at edukasyon sa kalinisan, kahulugan, mga pangunahing prinsipyo. Mga pamamaraan at paraan ng pagsasanay at edukasyon sa kalinisan. Mga kinakailangan para sa panayam, sanitary bulletin.
    • 10. Kalusugan ng populasyon, mga salik na nakakaimpluwensya sa kalusugan ng publiko. Formula sa kalusugan. Mga tagapagpahiwatig na nagpapakilala sa kalusugan ng publiko. Iskema ng pagsusuri.
    • 11. Demograpiko bilang isang agham, kahulugan, nilalaman. Ang kahalagahan ng demograpikong data para sa pangangalagang pangkalusugan.
    • 12. Mga istatistika ng populasyon, mga pamamaraan ng pag-aaral. Mga census ng populasyon. Mga uri ng istruktura ng edad ng populasyon.
    • 13. Mechanical na paggalaw ng populasyon. Mga katangian ng mga proseso ng paglipat, ang epekto nito sa mga tagapagpahiwatig ng kalusugan ng populasyon.
    • 14. Ang pagkamayabong bilang isang medikal at panlipunang problema. Pamamaraan para sa pagkalkula ng mga tagapagpahiwatig. Mga antas ng pagkamayabong ayon sa data ng WHO. Mga modernong tendensya.
    • 15. Mga espesyal na tagapagpahiwatig ng pagkamayabong (mga tagapagpahiwatig ng pagkamayabong). Pagpaparami ng populasyon, mga uri ng pagpaparami. Mga tagapagpahiwatig, mga pamamaraan ng pagkalkula.
    • 16. Mortalidad bilang problemang medikal at panlipunan. Pamamaraan ng pag-aaral, mga tagapagpahiwatig. Pangkalahatang antas ng namamatay ayon sa datos ng WHO. Mga modernong tendensya.
    • 17. Ang pagkamatay ng sanggol bilang isang medikal at panlipunang problema. Mga salik na tumutukoy sa antas nito.
    • 18. Maternal at perinatal mortality, pangunahing sanhi. Mga tagapagpahiwatig, mga pamamaraan ng pagkalkula.
    • 19. Likas na paggalaw ng populasyon, mga salik na nakakaimpluwensya dito. Mga tagapagpahiwatig, mga pamamaraan ng pagkalkula. Mga pangunahing pattern ng natural na paggalaw sa Belarus.
    • 20. Pagpaplano ng pamilya. Kahulugan. Mga modernong problema. Mga organisasyong medikal at serbisyo sa pagpaplano ng pamilya sa Republika ng Belarus.
    • 21. Morbidity bilang isang medikal at panlipunang problema. Mga modernong uso at tampok sa Republika ng Belarus.
    • 22. Medikal at panlipunang aspeto ng neuropsychic na kalusugan ng populasyon. Organisasyon ng pangangalaga sa psychoneurological
    • 23. Alkoholismo at pagkagumon sa droga bilang problemang medikal at panlipunan
    • 24. Mga sakit ng sistema ng sirkulasyon bilang isang medikal at panlipunang problema. Mga kadahilanan ng peligro. Mga direksyon ng pag-iwas. Organisasyon ng pangangalaga sa puso.
    • 25. Malignant neoplasms bilang isang medikal at panlipunang problema. Mga pangunahing direksyon ng pag-iwas. Organisasyon ng pangangalaga sa oncological.
    • 26. Internasyonal na istatistikal na pag-uuri ng mga sakit. Mga prinsipyo ng konstruksiyon, pamamaraan para sa paggamit. Ang kahalagahan nito sa pag-aaral ng morbidity at mortality ng populasyon.
    • 27. Mga pamamaraan para sa pag-aaral ng morbidity ng populasyon, ang kanilang mga comparative na katangian.
    • Pamamaraan para sa pag-aaral ng pangkalahatan at pangunahing morbidity
    • Mga tagapagpahiwatig ng pangkalahatan at pangunahing morbidity.
    • Mga tagapagpahiwatig ng nakakahawang morbidity.
    • Pangunahing mga tagapagpahiwatig na nagpapakilala sa pinakamahalagang di-epidemya na morbidity.
    • Mga pangunahing tagapagpahiwatig ng morbidity na "na-ospital":
    • 4) Mga sakit na may pansamantalang kapansanan (tanong 30)
    • Mga pangunahing tagapagpahiwatig para sa pagsusuri ng morbidity sa VUT.
    • 31. Pag-aaral ng morbidity ayon sa preventive examinations ng populasyon, mga uri ng preventive examinations, procedure. Mga pangkat ng kalusugan. Ang konsepto ng "pathological affection".
    • 32. Morbidity ayon sa datos sa mga sanhi ng kamatayan. Pamamaraan ng pag-aaral, mga tagapagpahiwatig. Sertipiko ng medikal na kamatayan.
    • Mga pangunahing tagapagpahiwatig ng morbidity batay sa mga sanhi ng kamatayan:
    • 33. Ang kapansanan bilang problemang medikal at panlipunan Kahulugan ng konsepto, mga tagapagpahiwatig. Mga uso sa kapansanan sa Republika ng Belarus.
    • Mga uso sa kapansanan sa Republika ng Belarus.
    • 34. Pangunahing pangangalaga sa kalusugan (PHC), kahulugan, nilalaman, tungkulin at lugar sa sistema ng pangangalagang pangkalusugan para sa populasyon. Pangunahing pag-andar.
    • 35. Mga pangunahing prinsipyo ng pangunahing pangangalaga sa kalusugan. Mga organisasyong medikal ng pangunahing pangangalaga sa kalusugan.
    • 36. Organisasyon ng pangangalagang medikal na ibinibigay sa populasyon sa isang outpatient na batayan. Mga pangunahing prinsipyo. Mga institusyon.
    • 37. Organisasyon ng pangangalagang medikal sa isang setting ng ospital. Mga institusyon. Mga tagapagpahiwatig ng pagkakaloob ng pangangalaga sa inpatient.
    • 38. Mga uri ng pangangalagang medikal. Organisasyon ng espesyal na pangangalagang medikal para sa populasyon. Mga sentro para sa espesyal na pangangalagang medikal, ang kanilang mga gawain.
    • 39. Mga pangunahing direksyon para sa pagpapabuti ng inpatient at espesyal na pangangalaga sa Republika ng Belarus.
    • 40. Pagprotekta sa kalusugan ng kababaihan at mga bata sa Republika ng Belarus. Kontrolin. Mga organisasyong medikal.
    • 41. Mga modernong problema sa kalusugan ng kababaihan. Organisasyon ng obstetric at gynecological na pangangalaga sa Republika ng Belarus.
    • 42. Organisasyon ng pangangalagang medikal at pang-iwas para sa mga bata. Mga nangungunang problema sa kalusugan ng mga bata.
    • 43. Organisasyon ng pangangalagang pangkalusugan para sa populasyon sa kanayunan, mga pangunahing prinsipyo ng pagbibigay ng pangangalagang medikal sa mga residente sa kanayunan. Mga yugto. Mga organisasyon.
    • Stage II – territorial medical association (TMO).
    • Stage III - rehiyonal na ospital at rehiyonal na institusyong medikal.
    • 45. Medikal at panlipunang pagsusuri (MSE), kahulugan, nilalaman, mga pangunahing konsepto.
    • 46. ​​Rehabilitasyon, kahulugan, mga uri. Batas ng Republika ng Belarus "Sa Pag-iwas sa Kapansanan at Rehabilitasyon ng mga May Kapansanan".
    • 47. Medikal na rehabilitasyon: kahulugan ng konsepto, mga yugto, mga prinsipyo. Serbisyong medikal na rehabilitasyon sa Republika ng Belarus.
    • 48. Klinika ng lungsod, istraktura, mga gawain, pamamahala. Mga pangunahing tagapagpahiwatig ng pagganap ng klinika.
    • Mga pangunahing tagapagpahiwatig ng pagganap ng klinika.
    • 49. Ang lokal na prinsipyo ng pag-oorganisa ng outpatient na pangangalaga para sa populasyon. Mga uri ng plot. Teritoryal na therapeutic area. Mga pamantayan. Mga nilalaman ng gawain ng isang lokal na manggagamot-therapist.
    • Organisasyon ng gawain ng isang lokal na therapist.
    • 50. Opisina ng mga nakakahawang sakit ng klinika. Mga seksyon at pamamaraan ng trabaho ng isang doktor sa opisina ng mga nakakahawang sakit.
    • 52. Mga pangunahing tagapagpahiwatig na nagpapakilala sa kalidad at pagiging epektibo ng pagmamasid sa dispensaryo. Paraan ng kanilang pagkalkula.
    • 53. Kagawaran ng medikal na rehabilitasyon (MR) ng klinika. Istruktura, mga gawain. Ang pamamaraan para sa pagre-refer ng mga pasyente sa OMR.
    • 54. Klinika ng mga bata, istraktura, mga gawain, mga seksyon ng trabaho. Mga tampok ng pagbibigay ng pangangalagang medikal sa mga bata sa mga setting ng outpatient.
    • 55. Ang mga pangunahing seksyon ng gawain ng isang lokal na pediatrician. Mga nilalaman ng paggamot at gawaing pang-iwas. Komunikasyon sa trabaho sa iba pang mga institusyong panggagamot at pang-iwas. Dokumentasyon.
    • 56. Mga nilalaman ng preventive work ng isang lokal na pediatrician. Organisasyon ng pangangalaga sa pag-aalaga para sa mga bagong silang.
    • 57. Istraktura, organisasyon, nilalaman ng gawain ng antenatal clinic. Mga tagapagpahiwatig ng trabaho sa paglilingkod sa mga buntis na kababaihan. Dokumentasyon.
    • 58. Maternity hospital, istraktura, organisasyon ng trabaho, pamamahala. Mga tagapagpahiwatig ng pagganap ng maternity hospital. Dokumentasyon.
    • 59. Ospital ng lungsod, mga gawain nito, istraktura, mga pangunahing tagapagpahiwatig ng pagganap. Dokumentasyon.
    • 60. Organisasyon ng gawain ng departamento ng pagtanggap ng ospital. Dokumentasyon. Mga hakbang upang maiwasan ang mga impeksyon sa nosocomial. Therapeutic at proteksiyon na rehimen.
    • Seksyon 1. Impormasyon tungkol sa mga dibisyon at instalasyon ng organisasyong panggagamot at pang-iwas.
    • Seksyon 2. Mga tauhan ng organisasyon ng paggamot at pag-iwas sa pagtatapos ng taon ng pag-uulat.
    • Seksyon 3. Trabaho ng mga doktor ng klinika (klinika ng outpatient), dispensaryo, mga konsultasyon.
    • Seksyon 4. Preventive na medikal na eksaminasyon at trabaho ng dental (dental) at surgical office ng isang medikal at preventive na organisasyon.
    • Seksyon 5. Trabaho ng mga medikal at auxiliary na departamento (mga opisina).
    • Seksyon 6. Pagpapatakbo ng mga departamento ng diagnostic.
    • 62. Taunang ulat sa mga aktibidad ng ospital (form 14), pamamaraan para sa paghahanda, istraktura. Mga pangunahing tagapagpahiwatig ng pagganap ng ospital.
    • Seksyon 1. Komposisyon ng mga pasyente sa ospital at mga resulta ng kanilang paggamot
    • Seksyon 2. Komposisyon ng mga bagong silang na may sakit na inilipat sa ibang mga ospital sa edad na 0-6 na araw at ang mga resulta ng kanilang paggamot
    • Seksyon 3. Kapasidad ng kama at paggamit nito
    • Seksyon 4. Surgical na gawain ng ospital
    • 63. Ulat sa pangangalagang medikal para sa mga buntis na kababaihan, kababaihan sa panganganak at mga babaeng postpartum (f. 32), istraktura. Mga pangunahing tagapagpahiwatig.
    • Seksyon I. Mga aktibidad ng antenatal clinic.
    • Seksyon II. Obstetrics sa isang ospital
    • Seksyon III. Pagkamatay ng ina
    • Seksyon IV. Impormasyon tungkol sa mga kapanganakan
    • 64. Medikal na genetic counseling, mga pangunahing institusyon. Ang papel nito sa pag-iwas sa perinatal at infant mortality.
    • 65. Mga istatistikang medikal, mga seksyon nito, mga gawain. Ang papel ng istatistikal na pamamaraan sa pag-aaral ng kalusugan ng populasyon at ang pagganap ng sistema ng pangangalagang pangkalusugan.
    • 66. Istatistikong populasyon. Kahulugan, uri, katangian. Mga tampok ng pagsasagawa ng istatistikal na pananaliksik sa isang sample na populasyon.
    • 67. Sample na populasyon, mga kinakailangan para dito. Ang prinsipyo at pamamaraan ng pagbuo ng isang sample na populasyon.
    • 68. Yunit ng pagmamasid. Kahulugan, mga katangian ng mga katangian ng accounting.
    • 69. Organisasyon ng istatistikal na pananaliksik. Mga katangian ng mga yugto.
    • 70. Mga nilalaman ng plano at programa ng istatistikal na pananaliksik. Mga uri ng mga plano sa pagsasaliksik sa istatistika. Programa sa pagmamasid.
    • 71. Statistical observation. Tuloy-tuloy at hindi tuloy-tuloy na istatistikal na pananaliksik. Mga uri ng hindi kumpletong istatistikal na pananaliksik.
    • 72. Statistical observation (pagkolekta ng mga materyales). Mga error sa statistical observation.
    • 73. Pagpapangkat at buod ng istatistika. Typological at variational na pagpapangkat.
    • 74. Mga talahanayan ng istatistika, mga uri, mga kinakailangan sa pagtatayo.

    81. Standard deviation, paraan ng pagkalkula, aplikasyon.

    Ang isang tinatayang paraan para sa pagtatasa ng pagkakaiba-iba ng isang serye ng variation ay upang matukoy ang limitasyon at amplitude, ngunit ang mga halaga ng variant sa loob ng serye ay hindi isinasaalang-alang. Ang pangunahing karaniwang tinatanggap na sukatan ng variability ng isang quantitative na katangian sa loob ng isang variation series ay karaniwang lihis (σ - sigma). Kung mas malaki ang standard deviation, mas mataas ang antas ng fluctuation ng seryeng ito.

    Ang pamamaraan para sa pagkalkula ng karaniwang paglihis ay kinabibilangan ng mga sumusunod na hakbang:

    1. Hanapin ang arithmetic mean (M).

    2. Tukuyin ang mga paglihis ng mga indibidwal na opsyon mula sa arithmetic mean (d=V-M). Sa mga medikal na istatistika, ang mga paglihis mula sa average ay itinalaga bilang d (malihis). Ang kabuuan ng lahat ng mga paglihis ay zero.

    3. Kuwadrado ang bawat paglihis d 2.

    4. I-multiply ang mga parisukat ng mga deviations sa mga katumbas na frequency d 2 *p.

    5. Hanapin ang kabuuan ng mga produkto (d 2 *p)

    6. Kalkulahin ang standard deviation gamit ang formula:

    kapag ang n ay higit sa 30, o
    kapag ang n ay mas mababa sa o katumbas ng 30, kung saan ang n ay ang bilang ng lahat ng mga opsyon.

    Standard deviation value:

    1. Inilalarawan ng karaniwang paglihis ang pagkalat ng variant na nauugnay sa average na halaga (ibig sabihin, ang pagkakaiba-iba ng serye ng variation). Kung mas malaki ang sigma, mas mataas ang antas ng pagkakaiba-iba ng seryeng ito.

    2. Ang standard deviation ay ginagamit para sa isang comparative assessment ng antas ng pagsusulatan ng arithmetic mean sa variation series kung saan ito kinakalkula.

    Ang mga pagkakaiba-iba ng mass phenomena ay sumusunod sa batas ng normal na pamamahagi. Ang kurba na kumakatawan sa distribusyon na ito ay mukhang isang makinis na hugis ng kampana na simetriko na kurba (Gaussian curve). Ayon sa teorya ng posibilidad, sa mga phenomena na sumusunod sa batas ng normal na pamamahagi, mayroong isang mahigpit na kaugnayan sa matematika sa pagitan ng mga halaga ng arithmetic mean at ang standard deviation. Ang teoretikal na pamamahagi ng isang variant sa isang homogenous na serye ng variation ay sumusunod sa tatlong-sigma na panuntunan.

    Kung sa isang sistema ng hugis-parihaba na mga coordinate ang mga halaga ng isang quantitative na katangian (mga variant) ay naka-plot sa abscissa axis, at ang dalas ng paglitaw ng isang variant sa isang variation series ay naka-plot sa ordinate axis, pagkatapos ay ang mga variant na may mas malaki at mas maliit Ang mga halaga ay pantay na matatagpuan sa mga gilid ng arithmetic mean.

    Ito ay itinatag na sa isang normal na pamamahagi ng katangian:

    68.3% ng mga halaga ng opsyon ay nasa loob ng M1

    95.5% ng mga halaga ng opsyon ay nasa loob ng M2

    99.7% ng mga halaga ng opsyon ay nasa loob ng M3

    3. Ang karaniwang paglihis ay nagpapahintulot sa iyo na magtatag ng mga normal na halaga para sa mga klinikal at biological na mga parameter. Sa medisina, ang pagitan ng M1 ay karaniwang kinukuha bilang normal na saklaw para sa phenomenon na pinag-aaralan. Ang paglihis ng tinantyang halaga mula sa arithmetic mean ng higit sa 1 ay nagpapahiwatig ng paglihis ng pinag-aralan na parameter mula sa pamantayan.

    4. Sa medisina, ang tatlong-sigma na panuntunan ay ginagamit sa pediatrics para sa indibidwal na pagtatasa ng antas ng pisikal na pag-unlad ng mga bata (paraan ng paglihis ng sigma), para sa pagbuo ng mga pamantayan para sa damit ng mga bata

    5. Ang karaniwang paglihis ay kinakailangan upang makilala ang antas ng pagkakaiba-iba ng katangiang pinag-aaralan at upang kalkulahin ang error ng arithmetic mean.

    Ang halaga ng karaniwang paglihis ay karaniwang ginagamit upang ihambing ang pagkakaiba-iba ng serye ng parehong uri. Kung ang dalawang serye na may magkakaibang mga katangian ay inihambing (taas at timbang, average na tagal ng paggamot sa ospital at pagkamatay sa ospital, atbp.), kung gayon ang isang direktang paghahambing ng mga laki ng sigma ay imposible. , kasi ang standard deviation ay isang pinangalanang halaga na ipinahayag sa mga ganap na numero. Sa mga kasong ito, gamitin ang koepisyent ng pagkakaiba-iba (Cv) , na isang kamag-anak na halaga: ang ratio ng porsyento ng karaniwang paglihis sa arithmetic mean.

    Ang koepisyent ng pagkakaiba-iba ay kinakalkula gamit ang formula:

    Mas mataas ang coefficient ng variation , mas malaki ang pagkakaiba-iba ng seryeng ito. Ito ay pinaniniwalaan na ang isang koepisyent ng pagkakaiba-iba ng higit sa 30% ay nagpapahiwatig ng qualitative heterogeneity ng populasyon.

    Ang karaniwang paglihis ay isang klasikong tagapagpahiwatig ng pagkakaiba-iba mula sa mga istatistikang naglalarawan.

    Karaniwang lihis, standard deviation, standard deviation, sample standard deviation (eng. standard deviation, STD, STDev) - isang napakakaraniwang indicator ng dispersion sa mga deskriptibong istatistika. Pero, kasi Ang teknikal na pagsusuri ay katulad ng mga istatistika; ang tagapagpahiwatig na ito ay maaaring (at dapat) gamitin sa teknikal na pagsusuri upang makita ang antas ng pagpapakalat ng presyo ng nasuri na instrumento sa paglipas ng panahon. Tinutukoy ng simbolong Griyego na Sigma "σ".

    Salamat kina Carl Gauss at Pearson sa pagpapahintulot sa amin na gumamit ng standard deviation.

    Gamit standard deviation sa teknikal na pagsusuri, iikot natin ito "index ng pagpapakalat""V "tagapagpahiwatig ng pagkasumpungin", pinapanatili ang kahulugan, ngunit binabago ang mga termino.

    Ano ang standard deviation

    Ngunit bukod sa mga intermediate auxiliary kalkulasyon, ang standard deviation ay medyo katanggap-tanggap para sa independiyenteng pagkalkula at mga aplikasyon sa teknikal na pagsusuri. Bilang isang aktibong mambabasa ng aming magazine burdock nabanggit, " Hindi ko pa rin maintindihan kung bakit hindi kasama ang standard deviation sa set ng standard indicators ng domestic dealing centers«.

    Talaga, masusukat ng standard deviation ang pagkakaiba-iba ng isang instrumento sa isang klasiko at "dalisay" na paraan. Ngunit sa kasamaang-palad, ang tagapagpahiwatig na ito ay hindi pangkaraniwan sa pagsusuri ng mga mahalagang papel.

    Paglalapat ng standard deviation

    Ang manu-manong pagkalkula ng karaniwang paglihis ay hindi masyadong kawili-wili, ngunit kapaki-pakinabang para sa karanasan. Maaaring ipahayag ang standard deviation formula STD=√[(∑(x-x ) 2)/n] , na parang ugat ng kabuuan ng mga squared na pagkakaiba sa pagitan ng mga elemento ng sample at ng mean, na hinati sa bilang ng mga elemento sa sample.

    Kung ang bilang ng mga elemento sa sample ay lumampas sa 30, kung gayon ang denominator ng fraction sa ilalim ng ugat ay kukuha ng halaga n-1. Kung hindi n ay ginagamit.

    Hakbang-hakbang karaniwang pagkalkula ng paglihis:

    1. kalkulahin ang arithmetic mean ng sample ng data
    2. ibawas ang average na ito sa bawat sample na elemento
    3. parisukat namin ang lahat ng mga resultang pagkakaiba
    4. buuin ang lahat ng resultang mga parisukat
    5. hatiin ang resultang halaga sa bilang ng mga elemento sa sample (o sa n-1, kung n>30)
    6. kalkulahin ang square root ng resultang quotient (tinatawag na pagpapakalat)

    X i - random (kasalukuyang) variable;

    Xᅳ ang average na halaga ng mga random na variable para sa sample ay kinakalkula gamit ang formula:

    Kaya, ang pagkakaiba ay ang average na parisukat ng mga deviations . Iyon ay, ang average na halaga ay unang kinakalkula, pagkatapos ay kinuha ang pagkakaiba sa pagitan ng bawat orihinal at average na halaga ay parisukat , ay idinagdag at pagkatapos ay hinati sa bilang ng mga halaga sa populasyon.

    Ang pagkakaiba sa pagitan ng isang indibidwal na halaga at ang average ay sumasalamin sa sukatan ng paglihis. Ito ay parisukat upang ang lahat ng mga paglihis ay maging eksklusibong positibong mga numero at upang maiwasan ang magkaparehong pagkasira ng mga positibo at negatibong mga paglihis kapag nagbubuod ng mga ito. Pagkatapos, dahil sa mga squared deviations, kinakalkula lang namin ang arithmetic mean.

    Ang sagot sa magic word na "dispersion" ay nasa tatlong salitang ito lamang: average - square - deviations.

    Standard deviation (MSD)

    Ang pagkuha ng square root ng variance, nakuha namin ang tinatawag na " karaniwang lihis". May mga pangalan "standard deviation" o "sigma" (mula sa pangalan ng letrang Griyego σ .). Ang formula para sa karaniwang paglihis ay:

    Kaya, ang dispersion ay sigma squared, o ang standard deviation squared.

    Ang karaniwang paglihis, malinaw naman, ay nagpapakilala rin sa sukat ng pagpapakalat ng data, ngunit ngayon (hindi tulad ng pagpapakalat) maaari itong ihambing sa orihinal na data, dahil mayroon silang parehong mga yunit ng pagsukat (ito ay malinaw mula sa formula ng pagkalkula). Ang hanay ng variation ay ang pagkakaiba sa pagitan ng matinding mga halaga. Ang karaniwang paglihis, bilang isang sukatan ng kawalan ng katiyakan, ay kasangkot din sa maraming istatistikal na pagkalkula. Sa tulong nito, natutukoy ang antas ng katumpakan ng iba't ibang mga pagtatantya at pagtataya. Kung ang pagkakaiba-iba ay napakalaki, kung gayon ang karaniwang paglihis ay magiging malaki din, at samakatuwid ang pagtataya ay magiging hindi tumpak, na ipahahayag, halimbawa, sa napakalawak na mga pagitan ng kumpiyansa.

    Samakatuwid, sa mga pamamaraan ng pagpoproseso ng istatistikal na data sa mga pagtatasa ng real estate, depende sa kinakailangang katumpakan ng gawain, ginagamit ang dalawa o tatlong tuntunin ng sigma.

    Upang ihambing ang dalawang-sigma na panuntunan at ang tatlong-sigma na panuntunan, ginagamit namin ang formula ng Laplace:

    F - F ,

    kung saan ang Ф(x) ay ang Laplace function;



    Pinakamababang halaga

    β = pinakamataas na halaga

    s = halaga ng sigma (standard deviation)

    a = karaniwan

    Sa kasong ito, ang isang partikular na anyo ng formula ng Laplace ay ginagamit kapag ang mga hangganan α at β ng mga halaga ng random variable X ay pantay na pagitan mula sa gitna ng pamamahagi a = M(X) ng isang tiyak na halaga d: a = a-d, b = a+d. O kaya (1) Tinutukoy ng Formula (1) ang probabilidad ng isang naibigay na paglihis d ng isang random na variable X na may normal na batas sa pamamahagi mula sa inaasahan nitong matematika M(X) = a. Kung sa formula (1) ay kukuha tayo ng sunud-sunod na d = 2s at d = 3s, makukuha natin ang: (2), (3).

    Dalawang sigma na panuntunan

    Ito ay halos mapagkakatiwalaan (na may posibilidad ng kumpiyansa na 0.954) na ang lahat ng mga halaga ng isang random na variable X na may isang normal na batas sa pamamahagi ay lumihis mula sa kanyang inaasahan sa matematika M(X) = a sa halagang hindi hihigit sa 2s (dalawang standard deviations ). Ang posibilidad ng kumpiyansa (Pd) ay ang posibilidad ng mga kaganapan na karaniwang tinatanggap bilang maaasahan (ang kanilang posibilidad ay malapit sa 1).

    Ilarawan natin ang dalawang-sigma na tuntunin sa geometriko. Sa Fig. Ang Figure 6 ay nagpapakita ng isang Gaussian curve na may sentro ng pamamahagi a. Ang lugar na limitado ng buong curve at ang Ox axis ay katumbas ng 1 (100%), at ang lugar ng curvilinear trapezoid sa pagitan ng abscissas a–2s at a+2s, ayon sa two-sigma rule, ay pantay. hanggang 0.954 (95.4% ng kabuuang lugar). Ang lugar ng mga shaded na lugar ay 1-0.954 = 0.046 (»5% ng kabuuang lugar). Ang mga lugar na ito ay tinatawag na kritikal na rehiyon ng random variable. Ang mga halaga ng isang random na variable na bumabagsak sa kritikal na rehiyon ay hindi malamang at sa pagsasanay ay karaniwang tinatanggap bilang imposible.

    Ang posibilidad ng mga kondisyon na imposibleng halaga ay tinatawag na antas ng kahalagahan ng isang random na variable. Ang antas ng kahalagahan ay nauugnay sa posibilidad ng kumpiyansa sa pamamagitan ng formula:

    kung saan ang q ay ang antas ng kabuluhan na ipinahayag bilang isang porsyento.

    Tatlong sigma na panuntunan

    Kapag nilulutas ang mga isyu na nangangailangan ng higit na pagiging maaasahan, kapag ang posibilidad ng kumpiyansa (Pd) ay kinuha na katumbas ng 0.997 (mas tiyak, 0.9973), sa halip na ang dalawang-sigma na panuntunan, ayon sa formula (3), ang panuntunan ay ginagamit tatlong sigma



    Ayon kay tatlong sigma na panuntunan na may posibilidad na kumpiyansa na 0.9973, ang kritikal na lugar ay ang lugar ng mga halaga ng katangian sa labas ng pagitan (a-3s, a+3s). Ang antas ng kahalagahan ay 0.27%.

    Sa madaling salita, ang posibilidad na ang ganap na halaga ng paglihis ay lalampas sa tatlong beses sa karaniwang paglihis ay napakaliit, katulad ng 0.0027 = 1-0.9973. Nangangahulugan ito na 0.27% lamang ng mga kaso ang mangyayari. Ang ganitong mga kaganapan, batay sa prinsipyo ng imposibilidad ng hindi malamang na mga kaganapan, ay maaaring ituring na halos imposible. Yung. ang sampling ay lubos na tumpak.

    Ito ang kakanyahan ng tatlong sigma na panuntunan:

    Kung ang isang random na variable ay ibinahagi nang normal, kung gayon ang ganap na halaga ng paglihis nito mula sa inaasahan sa matematika ay hindi lalampas sa tatlong beses sa standard deviation (MSD).

    Sa pagsasagawa, ang tatlong-sigma na panuntunan ay inilalapat tulad ng sumusunod: kung ang distribusyon ng random na variable na pinag-aaralan ay hindi alam, ngunit ang kundisyon na tinukoy sa panuntunan sa itaas ay natutugunan, kung gayon may dahilan upang ipagpalagay na ang variable na pinag-aaralan ay normal na ipinamamahagi. ; kung hindi, ito ay hindi karaniwang ipinamamahagi.

    Ang antas ng kahalagahan ay kinukuha depende sa pinahihintulutang antas ng panganib at ang gawaing nasa kamay. Para sa pagtatasa ng real estate, karaniwang ginagamit ang isang hindi gaanong tumpak na sample, kasunod ng two-sigma rule.

    Aralin Blg. 4

    Paksa: “Mga istatistikal na naglalarawan. Mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa pinagsama-samang"

    Ang pangunahing pamantayan para sa pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay: limitasyon, amplitude, standard deviation, coefficient of oscillation at coefficient of variation. Sa nakaraang aralin, tinalakay na ang mga average na halaga ay nagbibigay lamang ng isang pangkalahatang katangian ng katangian na pinag-aaralan sa pinagsama-samang at hindi isinasaalang-alang ang mga halaga ng mga indibidwal na variant nito: minimum at maximum na mga halaga, sa itaas ng average, sa ibaba karaniwan, atbp.

    Halimbawa. Mga average na halaga ng dalawang magkaibang pagkakasunud-sunod ng numero: -100; -20; 100; 20 at 0.1; -0.2; 0.1 ay ganap na magkapareho at pantayTUNGKOL SA.Gayunpaman, ang mga scatter range ng mga relatibong mean sequence data na ito ay ibang-iba.

    Ang pagpapasiya ng nakalistang pamantayan para sa pagkakaiba-iba ng isang katangian ay pangunahing isinasagawa na isinasaalang-alang ang halaga nito sa mga indibidwal na elemento ng istatistikal na populasyon.

    Ang mga tagapagpahiwatig para sa pagsukat ng pagkakaiba-iba ng isang katangian ay ganap At kamag-anak. Ang mga ganap na tagapagpahiwatig ng variation ay kinabibilangan ng: hanay ng variation, limitasyon, standard deviation, dispersion. Ang coefficient ng variation at ang coefficient ng oscillation ay tumutukoy sa mga relatibong sukat ng variation.

    Limitasyon (lim)– Ito ay isang criterion na tinutukoy ng matinding halaga ng isang variant sa isang variation series. Sa madaling salita, ang pamantayang ito ay nililimitahan ng pinakamababa at pinakamataas na halaga ng katangian:

    Amplitude (Am) o saklaw ng pagkakaiba-iba - Ito ang pagkakaiba sa pagitan ng mga matinding opsyon. Ang pagkalkula ng pamantayang ito ay isinasagawa sa pamamagitan ng pagbabawas ng pinakamababang halaga nito mula sa pinakamataas na halaga ng katangian, na nagpapahintulot sa amin na tantiyahin ang antas ng scatter ng opsyon:

    Ang kawalan ng limitasyon at amplitude bilang pamantayan ng pabagu-bago ay ganap silang umaasa sa mga matinding halaga ng katangian sa serye ng pagkakaiba-iba. Sa kasong ito, ang mga pagbabago sa mga halaga ng katangian sa loob ng isang serye ay hindi isinasaalang-alang.

    Ang pinakakumpletong paglalarawan ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay ibinigay ng karaniwang lihis(sigma), na isang pangkalahatang sukatan ng paglihis ng isang opsyon mula sa average na halaga nito. Ang karaniwang paglihis ay madalas na tinatawag karaniwang lihis.

    Ang standard deviation ay batay sa paghahambing ng bawat opsyon sa arithmetic mean ng isang naibigay na populasyon. Dahil sa pinagsama-samang mayroong mga pagpipilian na parehong mas mababa at higit pa kaysa dito, ang kabuuan ng mga paglihis na may sign na "" ay kakanselahin ng kabuuan ng mga deviations na may sign "", i.e. ang kabuuan ng lahat ng deviations ay zero. Upang maiwasan ang impluwensya ng mga palatandaan ng mga pagkakaiba, ang mga paglihis mula sa arithmetic mean squared ay kinuha, i.e. . Ang kabuuan ng mga squared deviations ay hindi katumbas ng zero. Upang makakuha ng isang koepisyent na maaaring masukat ang pagkakaiba-iba, kunin ang average ng kabuuan ng mga parisukat - ang halagang ito ay tinatawag mga pagkakaiba-iba:

    Sa esensya, ang pagpapakalat ay ang average na parisukat ng mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa average na halaga nito. Pagpapakalat parisukat ng karaniwang paglihis.

    Ang pagkakaiba ay isang dimensional na dami (pinangalanan). Kaya, kung ang mga variant ng isang serye ng numero ay ipinahayag sa metro, kung gayon ang pagkakaiba ay nagbibigay ng square meters; kung ang mga opsyon ay ipinahayag sa kilo, kung gayon ang pagkakaiba ay nagbibigay ng parisukat ng sukat na ito (kg 2), atbp.

    Karaniwang lihis– square root ng variance:

    , pagkatapos ay kapag kinakalkula ang dispersion at standard deviation sa denominator ng fraction, sa halip nadapat ilagay.

    Ang pagkalkula ng karaniwang paglihis ay maaaring nahahati sa anim na yugto, na dapat isagawa sa isang tiyak na pagkakasunud-sunod:

    Application ng standard deviation:

    a) para sa paghusga sa pagkakaiba-iba ng mga serye ng variation at paghahambing na pagtatasa ng typicality (representativeness) ng mga arithmetic average. Ito ay kinakailangan sa differential diagnosis kapag tinutukoy ang katatagan ng mga sintomas.

    b) upang muling buuin ang serye ng variation, i.e. pagpapanumbalik ng frequency response nito batay sa tatlong sigma panuntunan. Sa pagitan (М±3σ) 99.7% ng lahat ng variant ng serye ay matatagpuan sa pagitan (М±2σ) - 95.5% at nasa hanay (М±1σ) - 68.3% na opsyon sa hilera(Larawan 1).

    c) upang matukoy ang mga opsyon na "pop-up".

    d) upang matukoy ang mga parameter ng pamantayan at patolohiya gamit ang mga pagtatantya ng sigma

    e) upang kalkulahin ang koepisyent ng pagkakaiba-iba

    f) upang kalkulahin ang average na error ng arithmetic mean.

    Upang makilala ang anumang populasyon na mayroonnormal na uri ng pamamahagi , sapat na upang malaman ang dalawang parameter: ang arithmetic mean at ang standard deviation.

    Figure 1. Tuntunin ng Three Sigma

    Halimbawa.

    Sa pediatrics, ang standard deviation ay ginagamit upang masuri ang pisikal na pag-unlad ng mga bata sa pamamagitan ng paghahambing ng data ng isang partikular na bata na may kaukulang standard indicator. Ang arithmetic average ng pisikal na pag-unlad ng malusog na mga bata ay kinuha bilang pamantayan. Ang paghahambing ng mga tagapagpahiwatig na may mga pamantayan ay isinasagawa gamit ang mga espesyal na talahanayan kung saan ang mga pamantayan ay ibinigay kasama ang kanilang kaukulang mga sukat ng sigma. Ito ay pinaniniwalaan na kung ang tagapagpahiwatig ng pisikal na pag-unlad ng isang bata ay nasa loob ng pamantayan (arithmetic mean) ±σ, kung gayon ang pisikal na pag-unlad ng bata (ayon sa tagapagpahiwatig na ito) ay tumutugma sa pamantayan. Kung ang tagapagpahiwatig ay nasa loob ng pamantayan ± 2σ, pagkatapos ay mayroong isang bahagyang paglihis mula sa pamantayan. Kung ang tagapagpahiwatig ay lumampas sa mga limitasyong ito, kung gayon ang pisikal na pag-unlad ng bata ay naiiba nang husto mula sa pamantayan (posible ang patolohiya).

    Bilang karagdagan sa mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga ganap na halaga, ang istatistikal na pananaliksik ay gumagamit ng mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga kaugnay na halaga. Oscillation coefficient - ito ang ratio ng hanay ng variation sa average na halaga ng katangian. Ang koepisyent ng pagkakaiba-iba - ito ang ratio ng standard deviation sa average na halaga ng katangian. Karaniwan, ang mga halagang ito ay ipinahayag bilang mga porsyento.

    Mga formula para sa pagkalkula ng mga relatibong tagapagpahiwatig ng pagkakaiba-iba:

    Mula sa mga formula sa itaas ay malinaw na mas malaki ang koepisyent V ay mas malapit sa zero, mas maliit ang pagkakaiba-iba sa mga halaga ng katangian. Ang higit pa V, mas maraming variable ang sign.

    Sa pagsasagawa ng istatistika, ang koepisyent ng pagkakaiba-iba ay kadalasang ginagamit. Ito ay ginagamit hindi lamang para sa isang paghahambing na pagtatasa ng pagkakaiba-iba, ngunit din upang makilala ang homogeneity ng populasyon. Ang populasyon ay itinuturing na homogenous kung ang koepisyent ng variation ay hindi lalampas sa 33% (para sa mga distribusyon na malapit sa normal). Sa aritmetika, ang ratio ng σ at ang arithmetic mean ay neutralisahin ang impluwensya ng ganap na halaga ng mga katangiang ito, at ang ratio ng porsyento ay ginagawang ang coefficient ng variation ay isang walang sukat (walang pangalan) na halaga.

    Ang resultang halaga ng koepisyent ng pagkakaiba-iba ay tinatantya alinsunod sa mga tinatayang gradasyon ng antas ng pagkakaiba-iba ng katangian:

    Mahina - hanggang 10%

    Average - 10 - 20%

    Malakas - higit sa 20%

    Ang paggamit ng koepisyent ng pagkakaiba-iba ay ipinapayong sa mga kaso kung saan kinakailangan upang ihambing ang mga katangian na naiiba sa laki at sukat.

    Ang pagkakaiba sa pagitan ng koepisyent ng pagkakaiba-iba at iba pang pamantayan ng scatter ay malinaw na ipinakita halimbawa.

    Talahanayan 1

    Komposisyon ng mga manggagawa sa negosyong pang-industriya

    Batay sa mga istatistikal na katangian na ibinigay sa halimbawa, maaari tayong gumawa ng isang konklusyon tungkol sa kamag-anak na homogeneity ng komposisyon ng edad at antas ng edukasyon ng mga empleyado ng negosyo, dahil sa mababang propesyonal na katatagan ng surveyed contingent. Madaling makita na ang isang pagtatangka na hatulan ang mga panlipunang uso sa pamamagitan ng karaniwang paglihis ay hahantong sa isang maling konklusyon, at ang pagtatangkang ihambing ang mga katangian ng accounting na "karanasan sa trabaho" at "edad" sa tagapagpahiwatig ng accounting na "edukasyon" ay karaniwang magiging. hindi tama dahil sa heterogeneity ng mga katangiang ito.

    Median at percentiles

    Para sa ordinal (ranggo) na mga distribusyon, kung saan ang criterion para sa gitna ng serye ay ang median, ang standard deviation at dispersion ay hindi maaaring magsilbi bilang mga katangian ng dispersion ng variant.

    Ang parehong ay totoo para sa open variation serye. Ang pangyayaring ito ay dahil sa katotohanan na ang mga paglihis kung saan ang pagkakaiba at σ ay kinakalkula ay sinusukat mula sa arithmetic mean, na hindi kinakalkula sa bukas na serye ng variation at sa serye ng mga distribusyon ng mga katangiang husay. Samakatuwid, para sa isang naka-compress na paglalarawan ng mga distribusyon, isa pang parameter ng scatter ang ginagamit - dami(kasingkahulugan - "percentile"), na angkop para sa paglalarawan ng mga katangian ng husay at dami sa anumang anyo ng kanilang pamamahagi. Ang parameter na ito ay maaari ding gamitin upang i-convert ang mga quantitative na katangian sa mga qualitative. Sa kasong ito, ang mga naturang rating ay itinalaga depende sa kung aling pagkakasunud-sunod ng dami tumutugma sa isang partikular na opsyon.

    Sa pagsasagawa ng biomedical na pananaliksik, ang mga sumusunod na dami ay kadalasang ginagamit:

    – panggitna;

    , – quartile (quarters), kung saan – lower quartile, nangungunang kuwarts.

    Hinahati ng mga quantiles ang lugar ng mga posibleng pagbabago sa isang serye ng variation sa ilang mga agwat. Ang Median (quantile) ay isang opsyon na nasa gitna ng isang variation series at hinahati ang seryeng ito sa kalahati sa dalawang pantay na bahagi ( 0,5 At 0,5 ). Hinahati ng isang quartile ang isang serye sa apat na bahagi: ang unang bahagi (lower quartile) ay isang opsyon na naghihiwalay sa mga opsyon na ang mga numerical na halaga ay hindi lalampas sa 25% ng maximum na posible sa isang naibigay na serye; ang isang quartile ay naghihiwalay ng mga opsyon na may numerical na halaga ng hanggang sa 50% ng maximum na posible. Ang itaas na quartile () ay naghihiwalay ng mga opsyon hanggang sa 75% ng pinakamataas na posibleng halaga.

    Sa kaso ng asymmetric distribution variable na may kaugnayan sa arithmetic mean, ang median at quartiles ay ginagamit upang makilala ito. Sa kasong ito, ang sumusunod na anyo ng pagpapakita ng average na halaga ay ginagamit - Meh (;). Halimbawa, ang pinag-aralan na tampok - "ang panahon kung saan ang bata ay nagsimulang lumakad nang nakapag-iisa" - ay may walang simetrya na pamamahagi sa pangkat ng pag-aaral. Kasabay nito, ang mas mababang quartile () ay tumutugma sa simula ng paglalakad - 9.5 na buwan, ang median - 11 buwan, ang itaas na quartile () - 12 buwan. Alinsunod dito, ang katangian ng average na trend ng tinukoy na katangian ay ipapakita bilang 11 (9.5; 12) na buwan.

    Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral

    Ang istatistikal na kahalagahan ng data ay nauunawaan bilang ang antas kung saan ito tumutugma sa ipinakitang katotohanan, i.e. Ang data na makabuluhang istatistika ay ang mga hindi nakakasira at wastong sumasalamin sa layunin ng katotohanan.

    Ang pagtatasa sa istatistikal na kahalagahan ng mga resulta ng pananaliksik ay nangangahulugan ng pagtukoy sa kung anong posibilidad na mailipat ang mga resultang nakuha mula sa sample na populasyon sa buong populasyon. Ang pagtatasa ng istatistikal na kabuluhan ay kinakailangan upang maunawaan kung gaano karami ng isang phenomenon ang maaaring gamitin upang hatulan ang phenomenon sa kabuuan at ang mga pattern nito.

    Ang pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik ay binubuo ng:

    1. mga error sa pagiging kinatawan (mga error ng average at relative values) - m;

    2. mga limitasyon ng kumpiyansa ng average o kamag-anak na mga halaga;

    3. pagiging maaasahan ng pagkakaiba sa average o kamag-anak na mga halaga ayon sa pamantayan t.

    Standard error ng arithmetic mean o pagkakamali sa pagiging kinatawan nailalarawan ang pagbabagu-bago ng average. Dapat tandaan na kung mas malaki ang laki ng sample, mas maliit ang pagkalat ng mga average na halaga. Ang karaniwang error ng mean ay kinakalkula gamit ang formula:

    Sa modernong siyentipikong panitikan, ang arithmetic mean ay isinusulat kasama ng error sa representasyon:

    o kasama ng karaniwang paglihis:

    Bilang halimbawa, isaalang-alang ang data sa 1,500 mga klinika ng lungsod sa bansa (pangkalahatang populasyon). Ang average na bilang ng mga pasyente na nagsilbi sa klinika ay 18,150 katao. Ang random na pagpili ng 10% ng mga site (150 klinika) ay nagbibigay ng average na bilang ng mga pasyente na katumbas ng 20,051 katao. Ang error sa sampling, malinaw naman dahil sa katotohanan na hindi lahat ng 1500 na klinika ay kasama sa sample, ay katumbas ng pagkakaiba sa pagitan ng mga average na ito - ang pangkalahatang average ( M gene) at sample mean ( M napili). Kung bubuo tayo ng isa pang sample na may parehong laki mula sa ating populasyon, magbibigay ito ng ibang halaga ng error. Ang lahat ng sample na ito, na may sapat na malalaking sample, ay karaniwang ipinamamahagi sa paligid ng pangkalahatang mean na may sapat na malaking bilang ng mga pag-uulit ng sample ng parehong bilang ng mga bagay mula sa pangkalahatang populasyon. Standard error ng mean m- ito ang hindi maiiwasang pagkalat ng sample na paraan sa paligid ng pangkalahatang mean.

    Sa kaso kapag ang mga resulta ng pananaliksik ay ipinakita sa mga kamag-anak na dami (halimbawa, mga porsyento) - kinakalkula karaniwang error ng fraction:

    kung saan ang P ay ang indicator sa %, n ang bilang ng mga obserbasyon.

    Ang resulta ay ipinapakita bilang (P ± m)%. Halimbawa, ang porsyento ng paggaling sa mga pasyente ay (95.2±2.5)%.

    Sa kaganapan na ang bilang ng mga elemento ng populasyon, pagkatapos ay kapag kinakalkula ang mga karaniwang error ng mean at ang fraction sa denominator ng fraction, sa halip nadapat ilagay.

    Para sa isang normal na distribusyon (normal ang distribusyon ng sample na paraan), alam natin kung anong bahagi ng populasyon ang nasa loob ng anumang pagitan sa paligid ng mean. Sa partikular:

    Sa pagsasagawa, ang problema ay ang mga katangian ng pangkalahatang populasyon ay hindi alam sa amin, at ang sample ay ginawa nang tumpak para sa layunin ng pagtantya sa kanila. Nangangahulugan ito na kung gumawa kami ng mga sample ng parehong laki n mula sa pangkalahatang populasyon, pagkatapos ay sa 68.3% ng mga kaso ang pagitan ay maglalaman ng halaga M(sa 95.5% ng mga kaso ito ay nasa pagitan at sa 99.7% ng mga kaso - sa pagitan).

    Dahil isang sample lamang ang aktwal na kinuha, ang pahayag na ito ay nabuo sa mga tuntunin ng posibilidad: na may posibilidad na 68.3%, ang average na halaga ng katangian sa populasyon ay nasa pagitan, na may posibilidad na 95.5% - sa pagitan, atbp.

    Sa pagsasagawa, ang isang agwat ay binuo sa paligid ng sample na halaga na, na may ibinigay na (sapat na mataas) na posibilidad, posibilidad ng kumpiyansa -"sasaklawin" ang tunay na halaga ng parameter na ito sa pangkalahatang populasyon. Ang agwat na ito ay tinatawag agwat ng kumpiyansa.

    probabilidad ng kumpiyansaP ito ang antas ng kumpiyansa na ang agwat ng kumpiyansa ay talagang maglalaman ng tunay (hindi kilalang) halaga ng parameter sa populasyon.

    Halimbawa, kung ang posibilidad ng kumpiyansa R ay 90%, nangangahulugan ito na 90 sample sa 100 ang magbibigay ng tamang pagtatantya ng parameter sa populasyon. Alinsunod dito, ang posibilidad ng error, i.e. maling pagtatantya ng pangkalahatang average para sa sample ay katumbas ng porsyento: . Para sa halimbawang ito, nangangahulugan ito na ang 10 sample sa 100 ay magbibigay ng maling pagtatantya.

    Malinaw, ang antas ng kumpiyansa (confidence probability) ay nakasalalay sa laki ng agwat: mas malawak ang pagitan, mas mataas ang kumpiyansa na mahuhulog dito ang isang hindi kilalang halaga para sa populasyon. Sa pagsasagawa, hindi bababa sa dalawang beses ang sampling error ay ginagamit upang bumuo ng isang confidence interval upang magbigay ng hindi bababa sa 95.5% kumpiyansa.

    Ang pagtukoy sa mga limitasyon ng kumpiyansa ng mga average at kamag-anak na mga halaga ay nagbibigay-daan sa amin upang mahanap ang kanilang dalawang matinding halaga - ang pinakamababang posible at ang maximum na posible, kung saan ang pinag-aralan na tagapagpahiwatig ay maaaring mangyari sa buong populasyon. Batay sa mga ito, mga limitasyon ng kumpiyansa (o agwat ng kumpiyansa)- ito ang mga hangganan ng average o kamag-anak na mga halaga, na higit sa kung saan dahil sa mga random na pagbabagu-bago ay mayroong isang hindi gaanong posibilidad.

    Ang agwat ng kumpiyansa ay maaaring muling isulat bilang: , kung saan t– pamantayan ng kumpiyansa.

    Ang mga limitasyon ng kumpiyansa ng arithmetic mean sa populasyon ay tinutukoy ng formula:

    M gene = M pumili + t m M

    para sa relatibong halaga:

    R gene = P pumili + t m R

    saan M gene At R gene- mga halaga ng average at kamag-anak na mga halaga para sa pangkalahatang populasyon; M pumili At R pumili- mga halaga ng average at kamag-anak na mga halaga na nakuha mula sa sample na populasyon; m M At m P- mga error ng average at kamag-anak na mga halaga; t- criterion ng kumpiyansa (criterion ng katumpakan, na itinatag kapag nagpaplano ng pag-aaral at maaaring katumbas ng 2 o 3); t m- ito ay isang confidence interval o Δ - ang pinakamataas na error ng indicator na nakuha sa isang sample na pag-aaral.

    Dapat pansinin na ang halaga ng criterion t sa isang tiyak na lawak na nauugnay sa posibilidad ng isang walang error na pagtataya (p), na ipinahayag sa %. Pinili ito ng mismong mananaliksik, ginagabayan ng pangangailangang makuha ang resulta na may kinakailangang antas ng katumpakan. Kaya, para sa posibilidad ng isang walang error na forecast na 95.5%, ang halaga ng criterion t ay 2, para sa 99.7% - 3.

    Ang ibinigay na mga pagtatantya sa pagitan ng kumpiyansa ay katanggap-tanggap lamang para sa mga istatistikal na populasyon na may higit sa 30 na mga obserbasyon. Sa isang mas maliit na laki ng populasyon (maliit na mga sample), ang mga espesyal na talahanayan ay ginagamit upang matukoy ang t criterion. Sa mga talahanayang ito, ang nais na halaga ay matatagpuan sa intersection ng linya na tumutugma sa laki ng populasyon (n-1), at isang column na tumutugma sa antas ng posibilidad ng isang walang error na pagtataya (95.5%; 99.7%) na pinili ng mananaliksik. Sa medikal na pananaliksik, kapag nagtatatag ng mga limitasyon ng kumpiyansa para sa anumang tagapagpahiwatig, ang posibilidad ng isang walang error na pagtataya ay 95.5% o higit pa. Nangangahulugan ito na ang halaga ng indicator na nakuha mula sa sample na populasyon ay dapat matagpuan sa pangkalahatang populasyon sa hindi bababa sa 95.5% ng mga kaso.

      Mga tanong sa paksa ng aralin:

      Kaugnayan ng mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa isang istatistikal na populasyon.

      Pangkalahatang katangian ng absolute variation indicators.

      Standard deviation, pagkalkula, aplikasyon.

      Mga kamag-anak na sukat ng pagkakaiba-iba.

      Median, quartile na marka.

      Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral.

      Standard error ng arithmetic mean, formula ng pagkalkula, halimbawa ng paggamit.

      Pagkalkula ng proporsyon at ang karaniwang error nito.

      Ang konsepto ng posibilidad ng kumpiyansa, isang halimbawa ng paggamit.

    10. Ang konsepto ng isang agwat ng kumpiyansa, ang aplikasyon nito.

      Subukan ang mga gawain sa paksa na may karaniwang mga sagot:

    1. MGA GANAP NA INDICATOR NG VARIATION AY TUNGKOL SA

    1) koepisyent ng pagkakaiba-iba

    2) koepisyent ng oscillation

    4) panggitna

    2. MGA RELATIVE INDICATOR NG VARIATION RELATE

    1) pagpapakalat

    4) koepisyent ng pagkakaiba-iba

    3. CRITERION NA TINUTUKOY NG MGA SOBRANG HALAGA NG ISANG OPTION SA ISANG VARIATION SERIES

    2) amplitude

    3) pagpapakalat

    4) koepisyent ng pagkakaiba-iba

    4. ANG PAGKAKAIBA NG MGA SOBRANG OPTION AY

    2) amplitude

    3) karaniwang paglihis

    4) koepisyent ng pagkakaiba-iba

    5. ANG AVERAGE SQUARE NG MGA PAGLILIHIS NG INDIBIDWAL NA HALAGA NG ISANG KATANGIAN MULA SA AVERAGE NA HALAGA NITO AY

    1) koepisyent ng oscillation

    2) panggitna

    3) pagpapakalat

    6. ANG RATIO NG SCALE OF VARIATION SA AVERAGE VALUE NG ISANG CHARACTER AY

    1) koepisyent ng pagkakaiba-iba

    2) karaniwang paglihis

    4) koepisyent ng oscillation

    7. ANG RATIO NG AVERAGE SQUARE DEVIATION SA AVERAGE VALUE NG ISANG KATANGIAN AY

    1) pagpapakalat

    2) koepisyent ng pagkakaiba-iba

    3) koepisyent ng oscillation

    4) amplitude

    8. ANG OPTION NA NASA GITNA NG VARIATION SERIES AT HINATI ITO SA DALAWANG PANTAY NA BAHAGI AY

    1) panggitna

    3) amplitude

    9. SA MEDIKAL NA PANANALIKSIK, KAPAG NAGTATATAG NG MGA LIMITASYON NG PAGTIWALA PARA SA ANUMANG INDICATOR, ANG PROBABILIDAD NG WALANG ERROR NA PREDICTION AY TATANGGAP.

    10. KUNG 90 SAMPLE SA 100 ANG NAGBIBIGAY NG TAMANG TANTA NG ISANG PARAMETER SA POPULASYON, IBIG SABIHIN NITO NA ANG PROBABILIDAD NG PAGTIWALA P PANTAY

    11. KUNG 10 SAMPLE SA 100 ANG MAGBIBIGAY NG MALING PAGTAYA, ANG PROBABILIDAD NG ERROR AY PANTAY.

    12. MGA LIMITASYON NG AVERAGE O KAUGNAY NA MGA HALAGA, HIGIT PA NA DAHIL SA RANDOM OSCILLATIONS AY MAY MALIIT NA PROBABILIDAD – ITO AY

    1) agwat ng kumpiyansa

    2) amplitude

    4) koepisyent ng pagkakaiba-iba

    13. ISANG MALIIT NA HALIMBAWA AY ITINURAD NA POPULASYON NA KUNG SAAN

    1) ang n ay mas mababa sa o katumbas ng 100

    2) ang n ay mas mababa sa o katumbas ng 30

    3) ang n ay mas mababa sa o katumbas ng 40

    4) ang n ay malapit sa 0

    14. PARA SA PROBABILIDAD NG WALANG ERROR na PAGTATAYA 95% NA HALAGA NG CRITERION t AY

    15. PARA SA PROBABILIDAD NG WALANG ERROR na PAGTATAYA 99% NA HALAGA NG CRITERION t AY

    16. PARA SA MGA DISTRIBUTION NA MALAPIT SA NORMAL, ANG POPULASYON AY ITINUTURING HOMOGENEOUS KUNG ANG COEFFICIENT OF VARIATION AY HINDI HIGIT SA

    17. OPTION, SEPARATING OPTIONS, ANG NUMERICAL VALUES NA HINDI HIGIT SA 25% NG MAXIMUM POSIBLE SA ISANG BIGAY NA SERYE – ITO AY

    2) mas mababang quartile

    3) upper quartile

    4) quartile

    18. ANG DATOS NA HINDI NAKAKABIT AT TAMA NA NAGSASALIN ANG LAYUNIN NA REALIDAD AY TINAWAG

    1) imposible

    2) pantay na posible

    3) maaasahan

    4) random

    19. AYON SA PANUNTUNAN NG "THREE Sigma", NA MAY NORMAL NA PAGHAHATID NG KATANGIAN SA LOOB.
    MATATAGPUAN

    1) 68.3% na opsyon

© 2023 skudelnica.ru -- Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway