• 6. Tipuri de grupări statistice, semnificația lor cognitivă.
  • 7. Tabele statistice: tipuri, reguli de construcție, tehnici de citire
  • 8. Valori absolute: tipuri, valoare cognitivă. Condiții de utilizare științifică a indicatorilor absoluti și relativi.
  • 9. Valori medii: conținut, tipuri, tipuri, condiții științifice de aplicare.
  • 11.Proprietăți de dispersie. Regula de adunare (descompunere) a varianței și utilizarea acesteia în analiza statistică.
  • 12. Tipuri de grafice statistice în funcție de conținutul sarcinilor de rezolvat și metode de construcție.
  • 13. Serii de dinamică: tipuri, indicatori de analiză.
  • 14. Metode de identificare a tendințelor în serii de timp.
  • 15. Indici: definiție, elemente principale ale indicilor, sarcini rezolvate cu ajutorul indicilor, sistem de indici în statistică.
  • 16. Reguli pentru construirea indicilor dinamici și teritoriali.
  • 17. Fundamente ale teoriei metodei de eșantionare.
  • 18. Teoria probelor mici.
  • 19. Metode de selectare a unităților din eșantion.
  • 20. Tipuri de relații, metode statistice de analiză a relațiilor, conceptul de corelație.
  • 21.Conținutul analizei de corelație, modele de corelație.
  • 22. Evaluarea rezistenţei (etanşeităţii) corelaţiei.
  • 23. Sistemul de indicatori ai statisticii socio-economice.
  • 24. Grupări și clasificări de bază în statistica socio-economică.
  • 25. Averea națională: conținutul categoriei și componența.
  • 26. Conținutul de carte funciară. Indicatori ai compoziției terenului după forma de proprietate, scop și tipuri de teren.
  • 27. Clasificarea mijloacelor fixe, metode de evaluare și reevaluare, indicatori de mișcare, stare și utilizare.
  • 28. Sarcinile statisticii muncii. Conceptul și conținutul principalelor categorii ale pieței muncii.
  • 29. Statistici privind utilizarea forței de muncă și a timpului de lucru.
  • 30. Indicatori ai productivității muncii și metode de analiză.
  • 31. Indicatori ai producției agricole și a randamentelor culturilor. Culturi și pământuri.
  • 32. Indicatori ai producției animale și a productivității animalelor de fermă.
  • 33. Statistica costurilor sociale și a costurilor de producție.
  • 34. Statistica salariilor și a costurilor forței de muncă.
  • 35. Statistica producției și venitului brut.
  • 36. Indicatori de circulație și vânzări de produse agricole.
  • 37. Sarcini de analiză statistică a întreprinderilor agricole.
  • 38. Statistica preţurilor şi bunurilor din sectoarele economiei naţionale: sarcini şi metode de analiză.
  • 39. Statistica pieţei de bunuri şi servicii.
  • 40. Statistica indicatorilor producţiei sociale.
  • 41. Analiza statistică a prețurilor de pe piața de consum.
  • 42. Statistica inflației și principalii indicatori ai evaluării acesteia.
  • 43. Sarcinile de statistică financiară a afacerilor.
  • 44.Principalii indicatori ai rezultatelor financiare ale întreprinderilor.
  • 45.Sarcinile statisticii bugetului de stat.
  • 46. ​​​​Sistemul de indicatori ai statisticii bugetului de stat.
  • 47. Sistemul de indicatori ai statisticii circulaţiei monetare.
  • 48. Statistica compoziției și structurii masei monetare din țară.
  • 49. Principalele sarcini ale statisticii bancare.
  • 50.Indicatorii de bază ai statisticii bancare.
  • 51. Conceptul și clasificarea creditului. Sarcinile studiului său statistic.
  • 52. Sistemul de indicatori ai statisticii creditului.
  • 53. Indicatori de bază și metode de analiză a afacerii de economii.
  • 54. Sarcini de statistică a pieţei de valori şi a valorilor mobiliare.
  • 56. Statistica burselor de mărfuri: sarcini și sistem de indicatori.
  • 57. Sistemul conturilor naționale: concepte, categorii principale și clasificare.
  • 58.Principii de bază pentru construirea SNS.
  • 59. Indicatori macroeconomici de bază - conținut, metode de determinare.
  • 60. Echilibrul intersectorial: concepte, sarcini, tipuri de gloate.
  • 62. Statistica veniturilor și cheltuielilor populației
  • 18. Teoria probelor mici.

    La numere mari distribuția unităților de eșantionare (n>100). erori aleatorii media eșantionului în conformitate cu teorema lui A.M. Lyapunov este normală sau se apropie de normal pe măsură ce crește numărul de observații.

    Cu toate acestea, în practica cercetării statistice într-o economie de piață, este din ce în ce mai necesar să se ocupe de eșantioane mici.

    Un eșantion mic este o astfel de observație eșantion, al cărei număr de unități nu depășește 30.

    La evaluarea rezultatelor mostra mica dimensiunea populației nu este utilizată. Pentru a determina posibilele marje de eroare se folosește criteriul Student.

    Valoarea lui σ este calculată pe baza datelor de observare a eșantionului.

    Această valoare este utilizată numai pentru populația studiată și nu ca o estimare aproximativă a σ în populația generală.

    O estimare probabilistică a rezultatelor unui eșantion mic diferă de o estimare a unui eșantion mare prin aceea că, cu un număr mic de observații, distribuția probabilității pentru medie depinde de numărul de unități selectate.

    Totuși, pentru un eșantion mic, valoarea coeficientului de încredere t este legată de estimarea probabilistică într-un mod diferit decât pentru un eșantion mare (deoarece legea distribuției diferă de cea normală).

    Conform legii de distribuție stabilită de Student, eroarea probabilă de distribuție depinde atât de valoarea coeficientului de încredere t, cât și de dimensiunea eșantionului B.

    Eroarea medie a unui eșantion mic este calculată prin formula:

    unde este varianța unui eșantion mic.

    În MW, coeficientul n/(n-1) trebuie luat în considerare și trebuie corectat. La determinarea varianței S2, numărul de grade de libertate este:

    .

    Eroarea marginală a unui eșantion mic este determinată de formulă

    În acest caz, valoarea coeficientului de încredere t depinde nu numai de probabilitatea de încredere dată, ci și de numărul de unități de eșantion n. Pentru valorile individuale ale lui t și n, probabilitatea de încredere a unui eșantion mic este determinată de tabele speciale Student, în care sunt date distribuțiile abaterilor standardizate:

    Evaluarea probabilistică a rezultatelor SW diferă de evaluarea din BV prin aceea că, cu un număr mic de observații, distribuția probabilității pentru medie depinde de numărul de unități selectate

    19. Metode de selectare a unităților din eșantion.

    1. Proba trebuie să fie suficient de mare ca număr.

    2. Structura populației eșantionului ar trebui să reflecte cel mai bine structura populației generale.

    3. Metoda de selecție trebuie să fie aleatorie

    În funcție de faptul dacă unitățile selectate participă la eșantion, metoda se distinge - nerepetitivă și repetată.

    Selecția nerepetitivă este o astfel de selecție, în care unitatea care a intrat în eșantion nu este returnată populației din care se efectuează selecția ulterioară.

    Calculul erorii medii a unui eșantion aleator nerepetitiv:

    Calculul erorii marginale a eșantionării aleatorii nerepetitive:

    În timpul reselectării, unitatea care a intrat în eșantion după înregistrarea caracteristicilor observate revine la populația inițială (generală) pentru a participa la procedura de selecție ulterioară.

    Calculul erorii medii a eșantionării aleatorii simple repetate se efectuează după cum urmează:

    Calculul erorii marginale a eșantionării aleatorii repetate:

    Tipul de formare a probei este împărțit în - individual, grup și combinat.

    Metoda de selecție - determină un mecanism specific de prelevare a unităților din populația generală și se împarte în: efectiv - aleatoriu; mecanic; tipic; serial; combinate.

    De fapt, aleatoriu cea mai comună metodă de selecție într-un eșantion aleatoriu, se mai numește și metoda loteriei, în care se pregătește un bilet cu un număr de serie pentru fiecare unitate a populației statistice. În continuare, numărul necesar de unități ale populației statistice este selectat aleatoriu. În aceste condiții, fiecare dintre ei are aceeași probabilitate de a fi inclus în eșantion.

    Prelevare mecanică de probe. Este folosit în cazurile în care populația generală este într-un fel ordonată, adică există o anumită secvență în aranjarea unităților.

    Pentru a determina eroarea medie a eșantionării mecanice, formula erorii medii este utilizată pentru selecția corectă aleatorie nerepetitivă.

    selecție tipică. Este utilizat atunci când toate unitățile populației generale pot fi împărțite în mai multe grupuri tipice. Selecția tipică implică selecția de unități din fiecare grup în sine - aleatoriu sau mecanic.

    Pentru un eșantion tipic, valoarea erorii standard depinde de acuratețea determinării mediilor de grup. Deci, în formula pentru eroarea marginală a unui eșantion tipic, se ia în considerare media variațiilor de grup, i.e.

    selecție în serie. Se folosește în cazurile în care unitățile populației sunt combinate în grupuri mici sau serii. Esența eșantionării în serie constă în selecția reală aleatorie sau mecanică a seriilor, în cadrul căreia se efectuează un studiu complet al unităților.

    La eșantionarea în serie, mărimea erorii de eșantionare nu depinde de numărul de unități studiate, ci de numărul de serii (seri) chestionate și de valoarea varianței intergrup:

    Selecție combinată poate parcurge unul sau mai mulți pași. Un eșantion se numește o singură etapă dacă unitățile populației selectate odată sunt supuse studiului.

    Eșantionul este numit în mai multe etape, dacă selecția populației trece prin etape, etape succesive, iar fiecare pas, etapă de selecție are propria sa unitate de selecție.

    "

    În procesul de evaluare a gradului de reprezentativitate a datelor de observare a eșantionului, problema mărimii eșantionului devine importantă. coeficient de conversie eșantion student

    Ea determină nu numai mărimea limitelor pe care eroarea de eșantionare nu le va depăși cu o probabilitate dată, ci și metodele de determinare a acestor limite.

    Cu un număr mare de unități de eșantionare (), distribuția erorilor aleatoare a eșantionului înseamnă în conformitate cu teorema lui Lyapunov normal sau se apropie de normal pe măsură ce crește numărul de observații.

    Probabilitatea ca o eroare să depășească anumite limite este estimată pe baza unor tabele integrala Laplace . Calculul erorii de eșantionare se bazează pe valoarea varianței generale, deoarece în general coeficientul cu care se înmulțește varianța eșantionului pentru a obține varianța generală nu joacă un rol important.

    În practica cercetării statistice, se întâlnesc adesea eșantioane mici, așa-zise mici.

    Un eșantion mic este o astfel de observație eșantion, al cărei număr de unități nu depășește 30.

    Dezvoltarea teoriei eșantionării mici a fost începută de un statistician englez V.S. Gosset (publicat sub pseudonim Student ) în 1908. A dovedit că estimarea discrepanței dintre media unui eșantion mic și media generală are o lege specială de distribuție.

    Pentru a determina posibilele marje de eroare, așa-numitele Criteriul elevului, determinat de formula

    unde este o măsură a fluctuațiilor aleatoare ale mediei eșantionului în

    mostra mica.

    Valoarea este calculată pe baza datelor de observare a eșantionului:

    Această valoare este utilizată numai pentru populația studiată și nu ca o estimare aproximativă în populația generală.

    Cu o dimensiune mică a eșantionului, distribuția Student diferă de normal: valorile mari ale criteriului au o probabilitate mai mare aici decât cu o distribuție normală.

    Eroarea marginală a unui eșantion mic în funcție de eroarea medie este prezentată ca

    Dar, în acest caz, mărimea este legată diferit de estimarea probabilă decât cu un eșantion mare.

    Conform distributiei Student , estimarea probabilă depinde atât de mărimea, cât și de mărimea eșantionului dacă eroarea marginală nu depășește eroarea medie la eșantioanele mici.

    Tabelul 3.1 Distribuția probabilității în eșantioane mici în funcție de din coeficientul de încredere și dimensiunea eșantionului


    După cum se vede din fila. 3.1 , cu creșterea acestei distribuții tinde spre cea normală și la , deja diferă puțin de ea.

    Să arătăm cum să folosiți tabelul de distribuție Student.

    Să presupunem că un sondaj prin sondaj a lucrătorilor dintr-o întreprindere mică a arătat că lucrătorii au petrecut timp (min.) pe una dintre operațiunile de producție: . Găsiți costurile medii ale eșantionului:

    Varianta eșantionului

    De aici eroarea medie a unui eșantion mic

    De fila. 3.1 constatăm că pentru coeficientul de încredere și dimensiunea unui eșantion mic, probabilitatea este egală.

    Astfel, se poate argumenta cu probabilitate că discrepanța dintre eșantion și media generală se află în intervalul de la până la, i.e. diferența nu va depăși în valoare absolută ().

    Prin urmare, timpul mediu petrecut în întreaga populație va fi în intervalul de la până la.

    Probabilitatea ca această ipoteză să fie de fapt greșită și eroarea din motive aleatorii va fi mai mare decât este egală cu: .

    Tabelul de probabilitate Student adesea prezentate într-o formă diferită de tabelul 3.1 . Se crede că, în unele cazuri, această formă este mai convenabilă pentru utilizare practică ( fila. 3.2 ).

    Din fila. 3.2 rezultă că pentru fiecare număr de grade de libertate se indică o valoare limită, care cu o probabilitate dată nu va fi depășită din cauza fluctuațiilor aleatorii ale rezultatelor eșantionului.

    Bazat pe fila. 3.2 se determină cantitățile intervale de încredere : și.

    Aceasta este aria acelor valori ale mediei generale, trecând dincolo de care are o probabilitate foarte mică, egală cu:

    Ca nivel de încredere într-un control cu ​​două fețe, de regulă, sau, care nu exclude, totuși, alegerea altora care nu sunt menționate în fila. 3.2 .

    Tabelul 3.2 Unele sensuri -Repartizarea elevilor

    Probabilitățile unei ieșiri aleatorii a valorii medii estimate dincolo de limitele intervalului de încredere, respectiv, vor fi egale și, i.e. sunt foarte mici.

    Alegerea dintre probabilități și este într-o anumită măsură arbitrară. Această alegere este determinată în mare măsură de conținutul acelor sarcini pentru care se folosește un eșantion mic.

    În concluzie, observăm că calculul erorilor într-un eșantion mic diferă puțin de calcule similare eșantion mare. Diferența este că, cu un eșantion mic, probabilitatea afirmației noastre este ceva mai mică decât cu un eșantion mai mare (în special, în exemplul de mai sus și respectiv).

    Totuși, toate acestea nu înseamnă că puteți utiliza o probă mică atunci când aveți nevoie de o probă mare. În multe cazuri, discrepanțele dintre limitele găsite pot atinge dimensiuni semnificative, ceea ce cu greu îi satisface pe cercetători. Prin urmare, un eșantion mic ar trebui utilizat într-un studiu statistic al fenomenelor socio-economice cu mare atenție, cu justificarea teoretică și practică corespunzătoare.

    Deci, concluziile bazate pe rezultatele unui eșantion mic sunt de importanță practică numai cu condiția ca distribuția caracteristicii în populația generală să fie normală sau asimptotic normală. De asemenea, este necesar să se țină seama de faptul că acuratețea rezultatelor unui eșantion mic este încă mai mică decât în ​​cazul unui eșantion mare.

    A.M. Nosovsky1*, A.E. Pihlak2, V.A. Logachev2, I.I. Chursinova3, N.A. Mutyeva2 STATISTICA PROBE MICI ÎN CERCETAREA MEDICALĂ

    „Centrul Științific de Stat Federația Rusă- Institutul de Probleme Biomedicale Academia Rusă Sciences, 123007, Moscova, Rusia; 2A.I.Evdokimov Universitatea de Stat de Medicină și Stomatologie din Moscova, Ministerul Sănătății al Rusiei, 127473, Moscova, Rusia; Spitalul Artrologic 3ANO NPO SKAL, 109044, Moscova, Rusia

    *Nosovsky Andrey Maksimovici, e-mail: [email protected]

    ♦ Caracteristicile criteriilor statistice sunt găsite experimental. Ca urmare, a fost calculată valoarea statisticilor W. Ansari-Bradley (Ansari-Bradly) și K. Klotts (Klotz). Pentru fiecare statistică inițială, se calculează o aproximare normală (Z-statistic) și un nivel de semnificație p al ipotezei nule despre absența diferențelor în răspândirea valorilor celor două eșantioane. Dacă p>

    Metodele propuse de statistică matematică fac posibilă confirmarea fiabilității diferențelor rezultatelor obținute chiar și în grupuri mici de observații, dacă diferențele sunt suficient de semnificative. Exemple clinice de pacienți cu patologie osteoarticulară au servit drept ilustrație. Cuvinte cheie: eșantion mic, puterea criteriului, coxartroză, artrită gută

    A.M. Nosovskiy1, A.E.Pikhlak2, V.A. Logachev2, I.I. Chursinova3, N.AMuteva2 ANALIZA STATISTICĂ A DATELOR MICI ÎN STUDII MEDICALE

    1Centrul de cercetare-institut de stat al problemelor biologice medicale al Academiei de științe medicale din Rusia, 123007 Moscova, Rusia; 2 Universitatea de Stat de Medicină și Stomatologie din Moscova, numită după A.I. Evdokimov, 127473 Moscova, Rusia; 3 Spitalul de artrologie al asociației științifice și practice SKAL, 109044 Moscova, Rusia

    ♦ Experimental s-au constatat caracteristicile criteriilor statistice. Ca rezultat, a calculat valoarea statisticilor de W. An-sari-Bradly și K. Klotz. Pentru fiecare sursă de statistică calculată aproximarea normală (Z-statistica) și nivelul de semnificație al lui p al ipotezei nule de nicio diferență în răspândirea valorilor celor două eșantioane. Atp>0,05 poate fi acceptată ipoteza nulă. Metodele sugerate de statistică matematică pot fi confirmarea acurateței diferențelor rezultatelor, chiar și în grupuri mici de observații, dacă diferențele sunt suficient de semnificative.

    Am folosit cazuri medicale ale pacienților cu patologie articulară și osoasă.

    Cuvinte cheie: analiza datelor mici, puterea criteriilor, coxartroză, artrită gută

    Principiile medicinei bazate pe dovezi impun cerințe mari asupra fiabilității evaluării comparative a rezultatelor cercetării obținute. Acest lucru devine cu atât mai important cu cât majoritatea medicilor au o înțelegere foarte superficială a metodelor de prelucrare statistică, limitându-se în publicațiile lor, pe lângă calculul procentelor, în cel mai bun caz, după criteriul /-Studentului.

    Cu toate acestea, pentru o analiză completă a rezultatelor studiului, în unele cazuri acest lucru nu este suficient. De obicei, nu există nicio îndoială cu privire la fiabilitatea regularităților revelate atunci când numărul de observații este de câteva mii sau chiar sute. Dacă sunt câteva zeci? Dacă avem doar câteva cazuri? Într-adevăr, în medicină există boli destul de rare, chirurgii efectuează uneori operații unice atunci când numărul de observații este foarte mic. Unde este acea linie, acea cantitate necesară și suficientă de cercetare care ne permite să afirmăm prezența neîndoielnică a uneia sau aceleia regularități?

    Această întrebare este de mare importanță nu numai în evaluarea studiilor deja efectuate, ci și în planificare munca stiintifica. Este suficient să observați 20 de pacienți sau este necesar un minim de 40? Sau poate vor fi suficiente 10 cazuri? De un răspuns corect și în timp util la această întrebare depind nu numai fiabilitatea concluziilor trase, ci și momentul cercetării, costul acestora, necesarul de personal, echipamente etc.

    Statistica modernă cunoaște destul de multe trucuri cu ajutorul cărora poți determina fiabilitatea rezultatelor chiar și cu un număr mic de observații. Acestea sunt metode „eșantioane mici”. Este în general acceptat că începutul statisticii eșantionului mic a fost stabilit în primul deceniu al secolului al XX-lea prin publicarea lucrării lui U.

    set, unde el, sub pseudonimul „Student” (student), a postulat așa-numita /-distribuție. Spre deosebire de teorie distributie normala, teoria distribuției pentru eșantioane mici nu necesită cunoștințe a priori sau estimări exacte așteptări matematiceși varianța populației și nu necesită ipoteze cu privire la parametri. În distribuția /, una dintre abaterile de la media eșantionului este întotdeauna fixă, deoarece suma tuturor acestor abateri trebuie să fie egală cu zero. Acest lucru afectează suma pătratelor atunci când se calculează varianța eșantionului ca o estimare imparțială a varianței populației și duce la faptul că numărul de grade de libertate df este egal cu numărul de măsurători minus unul pentru fiecare eșantion. Prin urmare, în formulele și procedurile de calcul /-statistici pentru a testa ipoteza nulă df=w-1. De asemenea, sunt cunoscute lucrările clasice ale celui mai mare statistician englez R.A. Fisher (după care distribuția ^ și-a primit numele) privind analiza varianței - o metodă statistică care se concentrează în mod clar pe analiza eșantioanelor mici. Dintre numeroasele statistici care pot fi aplicate în mod rezonabil eșantioanelor mici, putem menționa: testul exact al probabilității lui Fisher; analiză neparametrică (rang) cu doi factori a varianței Friedman; coeficient de corelare a rangului / Kendall; factorul de concordanță al lui Kendall; Testul R Kruskal-Wallace pentru analiza unidirecțională a varianței neparametrică (rang); ^/-testul Mann-Whitney; criteriul median; criteriul semnului; coeficient de corelație de rang Dl Spearman; /-Testul Wilcoxon.

    Nu există un răspuns cert la întrebarea cât de mare ar trebui să fie un eșantion pentru a fi considerat mic. Cu toate acestea, granița condiționată dintre un eșantion mic și cel mare este considerată a fi df=30. fundație

    pentru aceasta, într-o oarecare măsură, servește o soluție arbitrară, rezultatul comparării distribuției / (pentru eșantioane mici) cu distribuția normală (r). Discrepanța dintre valorile lui / și r tinde să crească odată cu descreșterea și să scadă odată cu creșterea De fapt, 1 începe să se apropie îndeaproape de b cu mult înainte de cazul limită când / = r. O simplă examinare vizuală a valorilor tabelului / vă permite să vedeți că această aproximare devine destul de rapidă, începând cu ^=30 și mai sus. Valorile comparative ale lui / (la t=30) și r sunt, respectiv: 2,04 și 1,96 pentru p=0,05; 2,75 și 2,58 pentru p=0,01; 3,65 și 3,29 pentru p=0,001.

    În statistica matematică, se utilizează factorul de încredere /, valorile funcției sunt tabulate pentru diferitele sale valori și se obțin nivelurile corespunzătoare de încredere (Tabelul 1).

    Coeficientul de încredere vă permite să calculați eroarea marginală de eșantionare AX, calculată prin formula AXav = 1tsav, adică. eroarea marginală de eșantionare este egală cu /-fold numărul de erori medii de eșantionare .

    Astfel, valoarea erorii marginale de eșantionare poate fi stabilită cu o anumită probabilitate. După cum se poate observa din ultima coloană a tabelului 1, probabilitatea unei erori egală sau mai mare decât triplul erorii medii de eșantionare, adică AXs = 3tss, este extrem de mică și egală cu 0,003 (1-0,997). Astfel de evenimente improbabile sunt considerate practic imposibile și, prin urmare, valoarea AX = 3cs poate fi luată ca limită a posibilei erori de eșantionare p3].

    Intervalul în care, cu un grad de probabilitate dat, se va încheia cantitate necunoscută parametrul estimat se numește încredere, iar probabilitatea P - probabilitatea de încredere. Cel mai adesea, probabilitatea de încredere este luată egală cu 0,95 sau 0,99, apoi coeficientul de încredere de 1 este egal cu 1,96 și, respectiv, 2,58.

    Aceasta înseamnă că intervalul de încredere probabilitate dată conţine media generală.

    Cu cât valoarea erorii marginale de eșantionare este mai mare, cu atât este mai mare valoarea intervalului de încredere și, în consecință, cu atât acuratețea estimării este mai mică.

    Aplicarea acestei abordări poate fi ilustrată prin observarea a 20 de pacienți cu coxartroză care au fost tratați la Spitalul Artrologic NPO „SKAL” (Asociația științifică și de producție „Curs de specialitate în ambulatoriu”) din Moscova.

    La testarea unei ipoteze statistice sunt posibile erori. Există două tipuri de erori. Eroarea de tip I este de a respinge ipoteza nulă, în timp ce în realitate această ipoteză este adevărată. O eroare de tip II apare atunci când ipoteza nulă este acceptată când, de fapt, ipoteza nulă este falsă.

    Probabilitatea unei erori de tip I se numește nivel de semnificație și se notează cu a. Astfel, a=P(W¥ | H0), adică nivelul de semnificație a este probabilitatea evenimentului (Ce¥), calculată în ipoteza că ipoteza nulă H0 este adevărată.

    Nivelul de semnificație și puterea testului sunt combinate în conceptul de funcție de putere a testului - funcție care determină probabilitatea ca ipoteza nulă să fie respinsă. Funcția de putere depinde de regiunea critică ¥ și de distribuția reală a rezultatelor observațiilor. În parametric

    tabelul 1

    Factorul de încredere t și nivelurile de încredere corespunzătoare

    t 1,00 1,96 2,00 2,58 3,00

    F(0 0,683 0,950 0,954 0,990 0,997

    În problema testării ipotezelor, distribuția rezultatelor observațiilor este dată de parametrul 0. În acest caz, funcția de putere se notează cu M(¥,0) și depinde de regiunea critică ¥ și de valoarea reală a parametrul studiat 0. Dacă H0: 0=00, H1: 0=01, atunci M (¥,00) \u003d a, M(¥,01) \u003d 1-c, unde a este probabilitatea unei erori de primul fel, b este probabilitatea unei erori de al doilea fel. Apoi, puterea testului este probabilitatea ca ipoteza nulă să fie respinsă atunci când ipoteza alternativă este adevărată.

    Funcția de putere M(¥,0) în cazul unui parametru unidimensional 0 atinge de obicei un minim egal cu a la 0=00, crește monoton cu distanța de la 00 și se apropie de 1 la | 0 - 00 | ^ da.

    Să estimăm puterea necesară a criteriilor statistice (Fig. 1), care ar putea fi utilizată pentru a analiza tratamentul a 20 de pacienți cu coxartroză.

    După cum puteți vedea, cu o abatere standard de 3,0, ceea ce este extrem de rar, rezultatele vor fi obținute cu un grad ridicat de fiabilitate /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

    Pentru a determina nivelul de semnificație p, se folosește de obicei o aproximare normală aproximativă 2 a statisticii corespunzătoare. Această aproximare oferă o bună aproximare pentru dimensiuni suficient de mari ale eșantionului. Cu o dimensiune mică a eșantionului și valori p apropiate de 0,05, am testat concluzia despre ipoteza nulă comparând

    Curba puterii alfa=0,05, sigma=

    Curba puterii alfa=0,05, sigma=1,

    Adevărata diferență între mijloace

    Adevărata diferență între mijloace

    Orez. 1. Caracteristicile statistice găsite experimental

    criterii.

    Masa 2 .

    Grupuri de observare

    Grupa 1 Grupa 2 Grupa 3 Total observații

    Nimesulid, vitamine, condroprotectori, terapie cu exerciții ++ 20

    Kinetoterapie --- + + 15

    Masaj... --- + 8

    Durere la mișcare

    Durere în repaus 43±13 27±17

    calculul valorii calculate a statisticilor cu valoare critică în tabelul distribuției corespunzătoare din manualul de statistică.

    Criterii pentru diferențele de schimb (poziție). Am folosit aceste criterii pentru a testa următoarele ipoteze:

    ♦ nu există diferenţe în poziţia reciprocă (mediane) a celor două eşantioane studiate;

    ♦ deplasarea probelor unele față de altele este egală cu o anumită valoare d;

    ♦ mediana unei probe analizate este egală cu valoarea d.

    În cazul b) a fost necesar să se reducă toate valorile celui de-al doilea eșantion cu valoarea d: yi=yi-d.

    În cazul c), este necesar să se pregătească o probă pereche auxiliară, toate elementele care sunt egale cu d.

    Ca urmare, am calculat:

    ♦ valoarea statisticii lui W. Wilcoxon (Wilco-xon) - suma rangurilor Rxi a elementelor unuia dintre eșantioanele din eșantionul cotat combinat;

    ♦ valoarea statisticii van der Varden V bazată pe utilizarea metodei „mărci arbitrare”.

    Pentru fiecare statistică, s-au calculat o aproximare normală (statistică Z) și un nivel de semnificație P al ipotezei nule de lipsă de diferență în deplasare unul față de celălalt. Dacă p>0,05 poate fi acceptată ipoteza nulă.

    Unele pachete și autori sugerează utilizarea testului Mann-Whitney ^/-test și a testului Wald-Wolfowitz. Cu toate acestea, s-a dovedit de mult timp că criteriul Mann-Whitney este echivalent, adică. are aceleași capacități ca și criticul

    Tabelul 3.

    Indicatori medii ai intensității durerii (în puncte conform VAS)

    Grupa 1 (n= 5) Grupa 2 (n=7) Grupa 3 (n= =8)

    Parametru Începutul urmăririi Sfârșitul urmăririi Scăderea durerii Începutul urmăririi Sfârșitul urmăririi Scăderea durerii Începutul urmăririi Sfârșitul urmăririi Scăderea durerii

    Tabelul 4

    Datele examinării de laborator a pacientului B.

    Nr. Indicator Normă Rezultatul penultimului Rezultatul ultimului

    el în vizită în vizită

    Hematocrit, % 40-48 38,7

    Limfocite, % 19-37 42

    VSH, mm/oră 2-10 39

    Acid uric, µmol/l 200-416 504

    Creatinină, µmol/l 44-106 238

    Hormon paratiroidian, pg/ml 7-53 76,8

    Fibrinogen, g/l 1,69-3,92 5,7

    Proteine ​​în urină, g/l 0-0,1 1

    43,5 39 10 489 202 101 3

    penultima

    Ultimul lucru

    Orez. 2. valorile p ale indicatorilor clinici ai pacientului B. la penultima și ultima examinare.

    testul Wilcoxon, iar testul Wald-Wolfowitz suferă de sensibilitate relativ scăzută.

    Criterii de diferență de scară (împrăștiere). Am folosit aceste criterii pentru a testa următoarele ipoteze:

    ♦ ipoteza că nu există diferenţe în scalele (în răspândirea sau dispersia valorilor) probelor studiate;

    ♦ ipoteza că raportul scalelor eșantionului este egal cu o valoare dată a lui g.

    În acest din urmă caz, este necesar să se modifice mai întâi valorile celui de-al doilea eșantion y1=(y1-m0)^ , unde m0 este mediana comună a celor două spectre studiate.

    Dacă medianele populaţiilor din care sunt extrase probele nu sunt egale ca mărime, ci lor

    se aplică după modificarea uneia dintre selecții, de exemplu, în selecția yi=yi-m2+mr

    Dacă medianele nu sunt egale și nu sunt cunoscute, atunci ipoteza absenței diferențelor în schimbare ar trebui confirmată sau metoda ar trebui utilizată pentru a detecta alternative arbitrare.

    Ca urmare, a fost calculată valoarea statisticilor lui W. Ansari-Bradley (Ansari-Bradly) și K. Klotz (Klotz), care sunt analogi conceptuali ai statisticilor lui Wilcoxon și Van der Waerden.

    Pentru fiecare statistică inițială se calculează o aproximare normală (Z-statistică) și un nivel de semnificație P al ipotezei nule despre absența diferențelor în împrăștierea valorilor celor două eșantioane. Dacă />>0,05, ipoteza nulă poate fi acceptată.

    Astfel, metodele de statistică matematică propuse mai sus fac posibilă confirmarea fiabilității diferențelor

    rezultate obţinute chiar şi în grupuri mici de observaţii, dacă diferenţele sunt suficient de semnificative.

    Două exemple clinice de pacienți cu patologie osteoarticulară pot servi drept ilustrație.

    Exemplul clinic nr. 1. La 20 de pacienți cu coxartroză a fost utilizat un complex de tratament de bază, incluzând administrarea orală de nimesulid, condroprotectori, injecții intramusculare de vitamine și exerciții de fizioterapie. În plus, la 15 dintre ele s-a folosit kinetoterapie, iar la 6 pacienți a fost folosit masaj. Astfel, s-au format 3 grupuri de pacienți cu un număr mic (de la 5 la 8) de observații (Tabelul 2).

    Printre alți parametri, înainte de începerea tratamentului și după finalizarea cursului (21 ± 2 zile), intensitatea durerii în timpul mișcării și în repaus a fost evaluată cu ajutorul unei scale vizuale analogice (VAS) de 100 de puncte.

    Următoarele metode statistice au fost utilizate de W. Ansari-Bradly și K. Klotz (Tabelul 3).

    Conform datelor obținute (Tabelul 3), s-a remarcat că reducerea durerii în repaus în grupa 1 la finalul observației nu a fost semnificativă. Cu toate acestea, au fost găsite valori semnificative pentru toți ceilalți parametri studiați. Exemplul clinic luat în considerare indică posibilitatea de a obține rezultate fiabile pe o dimensiune mică a eșantionului.

    În exemplul clinic nr. 2, datele de laborator ale pacientului B., care suferă de poliartrită gutoasă cronică, nefropatie gutoasă cu simptome de CRF, care au fost în afara valorilor de referință, sunt luate în considerare în dinamică (Tabelul 4).

    Să calculăm probabilitatea ca rezultatele analizei să depășească semnificativ statistic limitele normei clinice. Pentru aceasta, folosim calculatorul probabilistic al pachetului statistic „STATISTICA 6.0”. În acest caz, valoarea p caracterizează eroarea de primul tip: probabilitatea de a respinge ipoteza corectă când de fapt aceasta este adevărată. În cele mai multe cazuri, rezultatele penultimei vizite au fost statistic semnificativ diferite de norma (Fig. 2). Deoarece nivelul prag de semnificație în acest caz, luăm egal cu 0,05, rezultatele hematocritului, limfocitelor, VSH, fibrinogenului s-au îmbunătățit semnificativ statistic la ultima vizită. În consecință, indicatorii clinici ai acidului uric, creatininei, hormonului paratiroidian și proteinei din urină, în ceea ce privește statisticile matematice, nu s-au îmbunătățit.

    Astfel, la planificarea unui studiu, este important să se țină cont de puterea criteriilor statistice aplicate, care sunt determinate de variabilitatea eșantionului și de nivelul de semnificație dat.

    Abordarea propusă poate fi de interes pentru specialiștii din domeniul medicinei personalizate pt

    analiza în dinamica metodelor de tratament și a medicamentelor utilizate, urmărind în același timp măsurile terapeutice și diagnostice în derulare.

    LITERATURĂ

    1. Bolşev L.N., Smirnov N.V. Tabele de statistici matematice. M.: Nauka; 1995.

    2. Korn G., Korn T. Manual de matematică pentru oameni de știință și ingineri. M.: Nauka; 2003.

    3. Kobzar A.I. Aplicat statistici matematice. Pentru ingineri și oameni de știință. Moscova: FIZMATLIT; 2006.

    4. Pravetsky N.V., Nosovsky A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Fundamentarea matematică a unui număr suficient de măsurători pentru o evaluare fiabilă a parametrilor înregistrați în biologia și medicina spațială. Biologie spațială și medicină aerospațială. M.: Medicină; 1990; 5:53-6.

    5. HollenderM., Wulf D.A. Metode neparametrice de statistică. M.: Finanțe și statistică; 1983.

    6. Nosovski A.M. Aplicarea modelelor probabilistice pe un cerc în cercetarea biomedicală. Biologie spațială și medicină aerospațială. Rezumate a IX-a Conferință Uniune. Kaluga, 19-21 iunie 1990.

    7. Nosovsky A.M., Pravetsky N.V., Kholin S.F. Abordare matematică a evaluării acurateței măsurătorilor unui parametru fiziologic prin diverse metode. Biologie spațială și medicină aerospațială. M.: Medicină; 1991; 6:53-5.

    1. Bol "shev L.N., Smirnov N.V. Tables of Mathematical Statistics. Moscova: Nauka; 1995 (în rusă).

    2. Korn G., Korn T. Manual de matematică pentru oameni de știință și ingineri. Moscova: Nauka; 2003 (în rusă).

    3. Kobzar" A.I. Statistica matematică aplicată. Pentru ingineri și oameni de știință. Moscova: FIZMATLIT; 2006 (în rusă).

    4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Justificare matematică a unui număr suficient de măsurători pentru evaluarea fiabilă a parametrilor înregistrați în biologia și medicina spațială. Biologie spațială și medicină aerospațială. Moscova: Meditsina; 1990; 5:53-6 (în rusă).

    5. Khollender M., Vul "f D.A. Metode statistice non-parametrice. Moscova: Finansy i statistika; 1983 (în rusă).

    6. Nosovskiy A.M. Utilizarea modelelor probabilistice asupra cercului în cercetarea biomedicală. Biologie spațială și medicină aerospațială. Rezumate ale Conferinței a IX-a a întregii uniuni. Kaluga, 19-21 iunie 1990 (în rusă).

    7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Abordare matematică a preciziei estimării parametrului fiziologic prin diferite metode. Biologie spațială și medicină aerospațială. Moscova: Me-ditsina; 1991; 6:53-5 (în rusă).

    La controlul calității mărfurilor în cercetarea economică, un experiment poate fi efectuat pe baza unui eșantion mic. mostra mica se înțelege ca o anchetă statistică necontinuă, în care populația eșantion este formată dintr-un număr relativ mic de unități ale populației generale. Dimensiunea unui eșantion mic de obicei nu depășește 30 de unități și poate ajunge până la 4 - 5 unități. Eroarea medie a unui eșantion mic este calculată prin formula:, unde este varianța unui eșantion mic. La determinarea varianței, numărul de grade de libertate este n-1: . Eroarea marginală a unui eșantion mic este determinată de formula: În acest caz, valoarea coeficientului de încredere t depinde nu numai de probabilitatea de încredere dată, ci și de numărul de unități de eșantion n. Pentru valorile individuale ale lui t și n, probabilitatea de încredere a unui eșantion mic este determinată de tabele speciale Student (Tabelul 9.1.), în care sunt date distribuțiile abaterilor standardizate: apoi următoarele indicații ale distribuției Student sunt utilizate pentru a determinați eroarea marginală a unui eșantion mic:

    Metode de extindere a caracteristicilor eșantionului la populația generală. Metoda de eșantionare este folosită cel mai adesea pentru a obține caracteristicile populației generale în funcție de indicatorii relevanți ai eșantionului. În funcție de obiectivele cercetării, aceasta se realizează fie prin recalcularea directă a indicatorilor eșantionului pentru populația generală, fie prin calcularea factorilor de corecție. metoda de calcul direct. Constă în faptul că indicatorii ponderii eșantionului sau mediei se extind la populația generală, ținând cont de eroarea de eșantionare.Astfel, în comerț se determină numărul de produse nestandard primite într-un lot de mărfuri. Pentru a face acest lucru (ținând cont de gradul de probabilitate acceptat), indicatorii ponderii produselor nestandard din eșantion sunt înmulțiți cu numărul de produse din întregul lot de mărfuri. Metoda factorilor de corecție. Este folosită în cazurile în care scopul metodei de eșantionare este de a rafina rezultatele unui recensământ complet.În practica statistică, această metodă este utilizată pentru a rafina datele recensămintelor anuale ale animalelor deținute de populație. Pentru a face acest lucru, după rezumarea datelor de contabilitate completă, se practică o anchetă prin eșantion de 10% cu determinarea așa-numitului „procent de subestimare”. Metode de selectare a unităților din populația generală.În statistică, se folosesc diverse metode de formare a seturilor de eșantioane, care sunt determinate de obiectivele studiului și depind de specificul obiectului de studiu.Condiția principală pentru efectuarea unei anchete prin sondaj este prevenirea apariției erorilor sistematice care decurg din încălcarea principiului egalitatea de șanse hit-uri în eșantionul fiecărei unități a populației generale. Prevenirea erorilor sistematice se realizează ca urmare a utilizării unor metode bazate științific pentru formarea unei populații eșantion. Există următoarele metode de selectare a unităților din populația generală: 1) selecția individuală - unitățile individuale sunt selectate în eșantion; 2) selecția de grup - sunt incluse în eșantion grupuri sau serii de unități în studiu calitativ omogene; 3) selecția combinată. este o combinație de selecție individuală și de grup. Metodele de selecție sunt determinate de regulile de formare a unei populații de eșantion.Eșantionul poate fi: - de fapt aleatoriu; - mecanic; - tipic; - serial; - combinat. Eșantionare auto-aleatorie constă în faptul că eşantionul se formează ca urmare a selecţiei aleatorii (neintenţionate) a unităţilor individuale din populaţia generală. În acest caz, numărul de unități selectate în setul de eșantion este de obicei determinat pe baza proporției acceptate din eșantion. Ponderea eșantionului este raportul dintre numărul de unități ale populației eșantionului n și numărul de unități ale populației generale N, adică deci, cu un eșantion de 5% dintr-un lot de mărfuri de 2.000 de unități. dimensiunea eșantionului n este de 100 de unități. (5 * 2000:100), iar cu o probă de 20% vor fi 400 de unități. (20*2000:100) etc. Prelevare mecanică de probe constă în faptul că selecţia unităţilor din eşantion se face din populaţia generală, împărţită în intervale (grupe) egale. În același timp, dimensiunea intervalului în populația generală este egală cu reciproca ponderii eșantionului, deci, cu un eșantion de 2%, se selectează fiecare a 50-a unitate (1: 0,02), cu un eșantion de 5%, fiecare Unitatea a 20-a (1: 0,05), etc. Astfel, în conformitate cu proporția acceptată de selecție, populația generală este, parcă, împărțită mecanic în grupuri egale. Din fiecare grup din eșantion este selectată o singură unitate.O caracteristică importantă a eșantionării mecanice este că formarea unei populații eșantion poate fi realizată fără a recurge la listare. În practică, este adesea folosită ordinea în care sunt plasate efectiv unitățile de populație. De exemplu, secvența de producție a produselor finite de pe un transportor sau linie de producție, ordinea în care unitățile dintr-un lot de mărfuri sunt plasate în timpul depozitării, transportului, vânzării etc. Probă tipică. Cu un eșantion tipic, populația este mai întâi împărțită în grupuri tipice omogene. Apoi, din fiecare grup tipic, o selecție individuală de unități din eșantion este făcută printr-un eșantion aleator sau mecanic.Eșantionarea tipică este de obicei utilizată în studiul complexului agregate. De exemplu, într-o anchetă prin eșantion privind productivitatea muncii a lucrătorilor din comerț, constând din grupuri separate de calificare. O caracteristică importantă a unui eșantion tipic este că oferă rezultate mai precise în comparație cu alte metode de selectare a unităților dintr-o populație eșantion. eroarea unei probe tipice se folosesc următoarele formule: reselectare , selecție nerepetitivă , Dispersia este determinată de următoarele formule: , At o singură etapăÎn eșantion, fiecare unitate selectată este imediat supusă studiului pe o bază dată. Acesta este cazul eșantionării aleatorii și în serie adecvate. în mai multe etape eșantionul este selectat din populația generală a grupurilor individuale, iar unitățile individuale sunt selectate din grupuri. Așa se face un eșantion tipic cu o metodă mecanică de selectare a unităților din populația eșantionului. Combinate proba poate fi în două etape. În acest caz, populația generală este mai întâi împărțită în grupuri. Apoi sunt selectate grupurile, iar în cadrul acestora din urmă sunt selectate unități individuale.

    Pe lângă eșantionul aleatoriu în sine, cu justificarea sa probabilistică clară, există și alte eșantioane care nu sunt absolut aleatorii, dar sunt utilizate pe scară largă. Trebuie remarcat faptul că aplicarea strictă a selecției aleatorii efective a unităților din populația generală nu este în niciun caz întotdeauna posibilă în practică. Astfel de eșantioane includ eșantionarea mecanică, tipică, în serie (sau imbricată), cu mai multe faze și o serie de altele.

    Rareori se întâmplă ca populația generală să fie omogenă; aceasta este mai mult o excepție decât o regulă. Prin urmare, dacă în populația generală există diferite tipuri de fenomene, este adesea de dorit să se asigure o reprezentare mai uniformă a diferitelor tipuri în populația eșantion. Acest obiectiv este atins cu succes prin utilizarea unui eșantion tipic. Principala dificultate este că trebuie Informații suplimentare despre întreaga populație generală, ceea ce în unele cazuri este dificil.

    Un eșantion tipic se mai numește și eșantion stratificat sau stratificat; este, de asemenea, folosit pentru a reprezenta mai uniform diferite regiuni din eșantion, caz în care eșantionul se numește eșantion de regiune.

    Deci sub tipic Un eșantion este înțeles ca un astfel de eșantion în care populația generală este împărțită în subgrupuri tipice formate din unul sau mai multe caracteristici esențiale(de exemplu, populația este împărțită în 3-4 subgrupe în funcție de venitul mediu pe cap de locuitor sau de nivelul de studii - primar, secundar, superior etc.). În plus, din toate grupurile tipice, este posibilă selectarea unităților din eșantion în mai multe moduri, formând:

    a) o probă tipic distanțată uniform, de unde tipuri diferite(straturi) este selectat un număr egal de unități. Această schemă funcționează bine dacă în populația generală straturile (tipurile) nu diferă foarte mult între ele în numărul de unități;

    b) eșantionare tipică cu plasare proporțională, când se cere (spre deosebire de plasarea uniformă) ca proporția (%) de selecție pentru toate straturile să fie aceeași (de exemplu, 5 sau 10%);

    c) un eşantion tipic cu plasare optimă, când se ţine cont de gradul de variaţie a caracteristicilor în diferite grupuri ale populaţiei generale. Odată cu această plasare, proporția de selecție pentru grupurile cu o fluctuație mare a trăsăturii crește, ceea ce duce în cele din urmă la o scădere a erorii aleatorii.

    Formula pentru eroarea medie în selecția tipică este similară cu eroarea obișnuită de eșantionare pentru un eșantion aleatoriu în sine, cu singura diferență că, în loc de variația totală, este coborâtă media variațiilor private intragrup, ceea ce duce în mod natural la o scădere a erorii în comparație cu un eșantion aleatoriu adecvat. Cu toate acestea, aplicarea sa nu este întotdeauna posibilă (din multe motive). Dacă nu este nevoie de o mare precizie, este mai ușor și mai ieftin să utilizați eșantionarea în serie.

    Serial eșantionarea (cuibată) constă în faptul că în eșantion nu sunt selectate unități ale populației (de exemplu, elevi), ci serii sau cuiburi separate (de exemplu, grupuri de studiu). Cu alte cuvinte, cu selecția în serie (cuiburi), unitatea de observație și unitatea de selecție nu coincid: sunt selectate anumite grupuri de unități adiacente între ele (cuiburi), iar unitățile incluse în aceste cuiburi sunt supuse examinării. Astfel, de exemplu, într-o anchetă prin sondaj a condițiilor de locuire, putem selecta aleatoriu un anumit număr de gospodării (unitatea de eșantionare) și apoi putem afla condițiile de viață ale familiilor care locuiesc în aceste case (unități de observare).

    Serii (cuiburi) constau din unități interconectate geografic (raioane, orașe etc.), organizațional (întreprinderi, ateliere etc.) sau în timp (de exemplu, un set de unități de produse produse într-o anumită perioadă de timp).

    Selecția în serie poate fi organizată sub formă de selecție într-o etapă, în două etape sau în mai multe etape.

    Serii alese aleatoriu sunt supuse cercetării continue. Astfel, eșantionarea în serie constă în două etape de selecție aleatorie a seriilor și studiul continuu al acestor serii. Selecția în serie oferă economii semnificative de forță de muncă și resurse și, prin urmare, este adesea folosită în practică. Eroarea de selecție în serie diferă de eroarea reală de selecție aleatorie prin aceea că se folosește varianța interserială (intergrup) în locul valorii variației totale și se folosește numărul de serii în loc de dimensiunea eșantionului. Precizia nu este de obicei foarte mare, dar în unele cazuri este acceptabilă. Eșantionarea în serie poate fi repetată și nerepetată, iar seriile pot fi egale și inegale.

    Eșantionarea în serie poate fi organizată în funcție de diferite scheme. De exemplu, este posibil să se formeze un set de eșantionare în două etape: mai întâi se selectează aleatoriu seriile de examinat, apoi se selectează aleatoriu din fiecare un anumit număr de unități de observat direct (măsurate, cântărite etc.). seria selectată. Eroarea unui astfel de eșantion va depinde de eroarea de selecție în serie și de eroarea de selecție individuală, adică eșantionarea în mai multe etape dă în general rezultate mai puțin precise decât eșantionarea într-o singură etapă, ceea ce se explică prin apariția erorilor de reprezentativitate la fiecare etapă de eșantionare. În acest caz, este necesară utilizarea formulei erorii de eșantionare pentru selecția combinată.

    O altă formă de selecție este selecția în mai multe faze (1, 2, 3 faze sau etape). Această selecție diferă în structura sa de selecția în mai multe etape, deoarece în selecția în mai multe faze, aceleași unități de selecție sunt utilizate în fiecare fază. Erorile în selecția în mai multe faze sunt calculate pentru fiecare fază separat. caracteristica principală eşantionarea în două faze constă în faptul că probele diferă între ele după trei criterii în funcţie de: 1) proporţia de unităţi studiate în prima fază a eşantionului şi reincluse în faza a doua şi ulterioară; 2) din observarea egalității de șanse a fiecărei unități de probă din prima fază să fie din nou obiect de studiu; 3) asupra mărimii intervalului care separă fazele una de cealaltă.

    Să ne oprim asupra unui alt tip de selecție, și anume mecanic(sau sistematic). Această selecție este probabil cea mai comună. Acest lucru se datorează aparent faptului că dintre toate metodele de selecție, aceasta este cea mai simplă. În special, este mult mai simplă decât selecția aleatoare, care implică capacitatea de a utiliza tabele cu numere aleatoare și nu necesită informații suplimentare despre populația generală și structura acesteia. În plus, selecția mecanică este strâns împletită cu selecția stratificată proporțională, ceea ce duce la o scădere a erorii de eșantionare.

    De exemplu, utilizarea unei selecții mecanice a membrilor unei cooperative de locuințe dintr-o listă întocmită în ordinea admiterii în această cooperativă va asigura reprezentarea proporțională a membrilor cooperativei cu vechime diferite. Utilizarea aceleiași tehnici pentru a selecta respondenții dintr-o listă alfabetică de persoane oferă șanse egale pentru nume de familie care încep cu litere diferite și așa mai departe. Utilizarea personalului sau a altor liste în întreprinderi sau în institutii de invatamant iar altele pot asigura proporţionalitatea necesară în reprezentarea lucrătorilor cu vechime în muncă diferită. Rețineți că selecția mecanică este utilizată pe scară largă în sociologie, în studiul opiniei publice etc.

    Pentru a reduce amploarea erorii și mai ales costul eșantionării, diverse combinații anumite tipuri selecție (mecanică, în serie, individuală, multifazică etc.) În astfel de cazuri, trebuie calculate erori de eșantionare mai complexe, care constau în erori care apar în diferite etape ale studiului.

    Un eșantion mic este un set de unități mai mici de 30. Eșantioanele mici sunt destul de comune în practică. De exemplu, numărul de cazuri de boli rare sau numărul de unități cu o trăsătură rară; în plus, se folosește un eșantion mic atunci când cercetarea este costisitoare sau cercetarea implică distrugerea produselor sau a mostrelor. Eșantioanele mici sunt utilizate pe scară largă în domeniul anchetelor de calitate a produselor. Baza teoretica pentru a determina erorile unui eșantion mic au fost puse de savantul englez W. Gosset (pseudonim Student).

    Trebuie reținut că atunci când se determină eroarea pentru un eșantion mic, în loc de dimensiunea eșantionului, se ia valoarea ( n- 1) sau, înainte de a determina eroarea medie de eșantionare, calculați așa-numita varianță de eșantionare corectată (la numitor în loc de n ar trebui să pun ( n- unu)). Rețineți că o astfel de corecție se face o singură dată - la calcularea varianței eșantionului sau la determinarea erorii. Valoare ( n– 1) se numește grad de libertate. De asemenea, distribuția normală este înlocuită t-distribuție (distribuția Student), care este tabelată și depinde de numărul de grade de libertate. Singurul parametru al distribuției Student este valoarea ( n- unu). Subliniem încă o dată că amendamentul ( n– 1) este importantă și semnificativă numai pentru populațiile mici din eșantion; la n> 30 și peste, diferența dispare, apropiindu-se de zero.

    Până acum, am vorbit despre mostre aleatorii, adică. astfel atunci când selecția unităților din populația generală se face aleatoriu (sau aproape aleatoriu) și toate unitățile au o probabilitate egală (sau aproape egală) de a fi incluse în eșantion. Cu toate acestea, selecția unităților se poate baza pe principiul selecției non-aleatorie, atunci când principiul accesibilității și al scopului este în prim-plan. În astfel de cazuri, este imposibil să vorbim despre reprezentativitatea eșantionului obținut, iar calculul erorilor de reprezentativitate se poate face doar dacă avem informații despre populația generală.

    Sunt cunoscute mai multe scheme de formare a eșantionării non-aleatorie, care s-au răspândit și sunt utilizate în principal în cercetare sociologică: selecția unităților de observare disponibile, selecția prin metoda Nürnberg, eșantionarea țintă la determinarea experților etc. Important este și eșantionul cotă, care este format de cercetător în funcție de un număr mic de parametri semnificativi și oferă o potrivire foarte strânsă cu populatia generala. Cu alte cuvinte, selecția cotelor ar trebui să ofere cercetătorului o potrivire aproape completă între eșantion și populația generală în funcție de parametrii aleși de acesta. Realizarea intenționată a proximității a două populații într-o gamă limitată de indicatori se realizează, de regulă, folosind un eșantion de o dimensiune semnificativ mai mică decât atunci când se utilizează selecția aleatorie. Această circumstanță este cea care face ca selecția cotelor să fie atractivă pentru un cercetător care nu este capabil să se concentreze pe un eșantion aleatoriu auto-ponderat de o dimensiune mare. Trebuie adăugat că o reducere a dimensiunii eșantionului este cel mai adesea combinată cu o reducere a costurilor bănești și a calendarului studiului, ceea ce mărește avantajele acestei metode de selecție. De asemenea, remarcăm că, cu un eșantion de cotă, există destul de multe informații preliminare despre structura populației generale. Principalul avantaj aici este că dimensiunea eșantionului este semnificativ mai mică decât în ​​cazul unui eșantion aleatoriu. Caracteristicile identificate (cel mai adesea socio-demografice - gen, vârstă, educație) ar trebui să se coreleze strâns cu caracteristicile studiate ale populației generale, i.e. obiect de studiu.

    După cum sa menționat deja, metoda de eșantionare face posibilă obținerea de informații despre populația generală cu mult mai puțini bani, timp și efort decât cu observarea continuă. De asemenea, este clar că un studiu continuu al întregii populații generale este imposibil într-o serie de cazuri, de exemplu, la verificarea calității produselor ale căror mostre sunt distruse.

    Alături de aceasta, însă, trebuie subliniat că populația generală nu este complet o „cutie neagră” și mai avem câteva informații despre aceasta. Efectuând, de exemplu, un studiu selectiv privind viața, modul de viață, starea proprietății, veniturile și cheltuielile studenților, opiniile, interesele acestora etc., avem în continuare informații despre numărul lor total, gruparea după sex, vârstă, stare civilă. , locul de reședință , cursul de studii și alte caracteristici. Aceste informații sunt întotdeauna utilizate într-un studiu eșantion.

    Există mai multe varietăți de distribuție a caracteristicilor eșantionului la populația generală: metoda recalculării directe și metoda factorilor de corecție. Recalcularea caracteristicilor eșantionului se realizează, de regulă, luând în considerare intervalele de încredere și poate fi exprimată în valori absolute și relative.

    Este oportun să subliniem aici că cel mai mult informatii statistice privind viața economică a societății în cele mai diverse manifestări și tipuri, se bazează pe date eșantion. Desigur, acestea sunt completate cu date complete de înregistrare și informații obținute în urma recensămintelor (de populație, întreprinderi etc.). De exemplu, toate statisticile bugetare (cu privire la veniturile și cheltuielile populației) furnizate de Rosstat se bazează pe datele sondajului prin sondaj. Informațiile despre prețuri, volume de producție, volume comerciale, exprimate în indicii corespunzători, se bazează, de asemenea, în mare măsură pe date eșantionate.

    Ipoteze statistice și teste statistice. Noțiuni de bază

    Conceptele de test statistic și ipoteză statistică sunt strâns legate de eșantionare. O ipoteză statistică (spre deosebire de alte ipoteze științifice) constă în asumarea unor proprietăți ale populației generale care pot fi testate pe baza datelor dintr-un eșantion aleatoriu. Trebuie amintit că rezultatul obținut este de natură probabilistică. În consecință, rezultatul studiului, care confirmă validitatea ipotezei prezentate, nu poate servi aproape niciodată drept bază pentru acceptarea finală a acesteia și invers, rezultatul, neconform cu acesta, este destul de suficient pentru a respinge ipoteza prezentată ca eronat sau fals. Acest lucru se datorează faptului că rezultatul obținut poate fi în concordanță cu alte ipoteze, și nu numai cu cea propusă.

    Sub criteriu statistic este înțeles ca un set de reguli care permit să se răspundă la întrebarea sub ce rezultate ale observației ipoteza este respinsă și sub care nu este respinsă. Cu alte cuvinte, un test statistic este a regula de decizie, care asigură acceptarea unei ipoteze adevărate (adevărate) și respingerea unei ipoteze false cu într-o mare măsură probabilități. Testele statistice sunt unilaterale și cu două fețe, parametrice și neparametrice, mai mult sau mai puțin puternice. Unele criterii sunt folosite frecvent, altele sunt folosite mai rar. Unele dintre criterii sunt concepute pentru a rezolva probleme speciale, iar unele criterii pot fi folosite pentru a rezolva o clasă largă de probleme. Aceste criterii au devenit larg răspândite în sociologie, economie, psihologie, Stiintele Naturii etc.

    Să introducem câteva concepte de bază ale testării ipotezelor statistice. Testarea ipotezei începe cu ipoteza nulă H 0, adică oarecare presupunere a cercetătorului, precum și o ipoteză alternativă competitivă H 1, care o contrazice pe cea principală. De exemplu: H 0: , H 1: sau H 0: , H 1: (unde A- media generală).

    Scopul principal al cercetătorului atunci când testează o ipoteză este de a respinge ipoteza propusă de acesta. După cum a scris R. Fisher, scopul testării oricărei ipoteze este de a o respinge. Testarea ipotezelor se bazează pe contrar. Prin urmare, dacă credem că, de exemplu, salariile medii ale muncitorilor, obținute din datele unui anumit eșantion și egale cu 186 de unități monetare pe lună, nu coincid cu salariile efective pentru întreaga populație, atunci se presupune ca o ipoteză nulă că aceste salarii sunt egale.

    Ipoteze concurente H 1 poate fi formulat în diferite moduri:

    H 1: , H 1: , H 1: .

    Următorul este determinat eroare de tip I(a), care stabilește probabilitatea ca o ipoteză adevărată să fie respinsă. Evident, această probabilitate ar trebui să fie mică (de obicei de la 0,01 la 0,1, cel mai adesea implicit 0,05, sau așa-numitul nivel de semnificație de 5%). Aceste niveluri decurg din metoda de eșantionare, conform căreia eroarea dublă sau triplă reprezintă limitele dincolo de care de cele mai multe ori nu trece variația aleatorie a caracteristicilor eșantionului. Eroare de tip II(b) este probabilitatea ca ipoteza greșită să fie acceptată. De regulă, eroarea de tip I este mai „periculoasă”; Ea este cea care este fixată de statistician. Dacă la începutul studiului dorim să fixăm a și b în același timp (de exemplu, a = 0,05; b = 0,1), atunci pentru aceasta trebuie mai întâi să calculăm dimensiunea eșantionului.

    Zona critică(sau zonă) este un set de valori criteriu sub care H 0 este respins. punct critic T kr este punctul care separă regiunea de acceptare a ipotezei de regiunea de abatere sau zona critică.

    După cum sa menționat deja, eroarea de tip I (a) este probabilitatea de a respinge o ipoteză corectă. Cu cât a mai mic, cu atât este mai puțin probabil să facă o eroare de tip I. Dar, în același timp, când a scade (de exemplu, de la 0,05 la 0,01), este mai dificil să respingi ipoteza nulă, care, de fapt, este ceea ce își propune cercetătorul. Subliniem încă o dată că o scădere suplimentară a a la 0,05 și mai departe va duce de fapt la faptul că toate ipotezele, adevărate și false, vor intra în zona acceptării ipotezei nule și vor face imposibilă distingerea între ele. .

    O eroare de tip II (b) apare atunci când se acceptă H 0 , dar de fapt ipoteza alternativă este adevărată H unu . Valoarea g = 1 – b se numește puterea criteriului. Eroarea de tip II (adică acceptarea eronată a unei ipoteze false) scade odată cu creșterea dimensiunii eșantionului și creșterea nivelului de semnificație. De aici rezultă că este imposibil să scazi a și b în același timp. Acest lucru se realizează numai prin creșterea dimensiunii eșantionului (ceea ce nu este întotdeauna posibil).

    Cel mai adesea, sarcinile de testare a unei ipoteze se reduc la compararea a două medii sau cote eșantionare; să compare media generală (sau cota) cu eșantionul; compararea distribuțiilor empirice și teoretice (criterii de fitness); compararea a două varianțe de eșantion (criteriul c 2); compararea a doi coeficienți de corelație de eșantion sau coeficienți de regresie și alte comparații.

    Decizia de a accepta sau respinge ipoteza nulă constă în compararea valorii efective a criteriului cu cea tabulară (teoretică). Dacă valoarea reală este mai mică decât valoarea tabelului, atunci se ajunge la concluzia că discrepanța este aleatorie, nesemnificativă, iar ipoteza nulă nu poate fi respinsă. Situația opusă (valoarea reală este mai mare decât valoarea tabelului) duce la respingerea ipotezei nule.

    La verificare ipotezele statistice cel mai frecvent utilizate sunt tabelele de distribuție normale, distribuțiile c 2 (a se citi: chi-pătrat), t-distribuţii (distribuţii Student) şi F-distribuţii (distribuţii Fisher).