• 6. Vrste statističkih grupacija, njihov kognitivni značaj.
  • 7. Statističke tablice: vrste, pravila građenja, tehnike čitanja
  • 8. Apsolutne vrijednosti: vrste, kognitivna vrijednost. Uslovi za naučnu upotrebu apsolutnih i relativnih indikatora.
  • 9. Prosječne vrijednosti: sadržaj, vrste, vrste, naučni uslovi primjene.
  • 11. Svojstva disperzije. Pravilo sabiranja (dekompozicije) varijanse i njegova upotreba u statističkoj analizi.
  • 12. Vrste statističkih grafova prema sadržaju zadataka koji se rješavaju i načinu izrade.
  • 13. Serija dinamike: vrste, indikatori analize.
  • 14. Metode za identifikaciju trendova u vremenskim serijama.
  • 15. Indeksi: definicija, glavni elementi indeksa, zadaci koji se rješavaju uz pomoć indeksa, sistem indeksa u statistici.
  • 16. Pravila za konstruisanje dinamičkih i teritorijalnih indeksa.
  • 17. Osnove teorije metode uzorkovanja.
  • 18. Teorija malih uzoraka.
  • 19. Metode odabira jedinica u uzorku.
  • 20. Vrste odnosa, statističke metode za analizu odnosa, koncept korelacije.
  • 21. Sadržaj korelacione analize, korelacioni modeli.
  • 22. Procjena čvrstoće (zategnutosti) korelacije.
  • 23. Sistem indikatora socio-ekonomske statistike.
  • 24. Osnovna grupisanja i klasifikacije u socio-ekonomskoj statistici.
  • 25. Nacionalno bogatstvo: sadržaj kategorije i sastav.
  • 26. Sadržaj zemljišne knjige. Pokazatelji sastava zemljišta prema obliku vlasništva, namjeni i vrstama zemljišta.
  • 27. Klasifikacija osnovnih sredstava, metode vrednovanja i revalorizacije, pokazatelji kretanja, stanja i upotrebe.
  • 28. Zadaci statistike rada. Pojam i sadržaj glavnih kategorija tržišta rada.
  • 29. Statistika upotrebe radne snage i radnog vremena.
  • 30. Pokazatelji produktivnosti rada i metode analize.
  • 31. Pokazatelji biljne proizvodnje i prinosa usjeva. Kulture i zemlje.
  • 32. Pokazatelji stočarske proizvodnje i produktivnosti domaćih životinja.
  • 33. Statistika društvenih troškova i troškova proizvodnje.
  • 34. Statistika plata i troškova rada.
  • 35. Statistika bruto proizvodnje i prihoda.
  • 36. Pokazatelji kretanja i prodaje poljoprivrednih proizvoda.
  • 37. Zadaci statističke analize poljoprivrednih preduzeća.
  • 38. Statistika cijena i roba sektora nacionalne privrede: zadaci i metode analize.
  • 39. Statistika tržišta roba i usluga.
  • 40. Statistika pokazatelja društvene proizvodnje.
  • 41. Statistička analiza cijena potrošača na tržištu.
  • 42. Statistika inflacije i glavni indikatori njene procjene.
  • 43. Zadaci statistike poslovnih finansija.
  • 44.Glavni indikatori finansijskih rezultata preduzeća.
  • 45.Zadaci statistike državnog budžeta.
  • 46. ​​Sistem indikatora statistike državnog budžeta.
  • 47. Sistem indikatora statistike monetarnog opticaja.
  • 48. Statistika sastava i strukture novčane mase u zemlji.
  • 49. Glavni zadaci bankarske statistike.
  • 50.Osnovni pokazatelji bankarske statistike.
  • 51. Pojam i klasifikacija kredita. Zadaci njegovog statističkog proučavanja.
  • 52. Sistem indikatora kreditne statistike.
  • 53. Osnovni pokazatelji i metode analize poslovanja štednje.
  • 54. Zadaci statistike tržišta akcija i hartija od vrijednosti.
  • 56. Statistika robnih berzi: zadaci i sistem indikatora.
  • 57. Sistem nacionalnih računa: pojmovi, glavne kategorije i klasifikacija.
  • 58.Osnovni principi za izgradnju SNS.
  • 59. Osnovni makroekonomski pokazatelji - sadržaj, metode utvrđivanja.
  • 60. Međusektorska ravnoteža: pojmovi, zadaci, vrste mob.
  • 62. Statistika prihoda i rashoda stanovništva
  • 18. Teorija malih uzoraka.

    At veliki brojevi distribucija jedinica uzorkovanja (n>100). slučajne greške srednja vrijednost uzorka u skladu sa teoremom A.M. Lyapunova je normalna ili se približava normalnoj kako se broj opažanja povećava.

    Međutim, u praksi statističkih istraživanja u tržišnoj ekonomiji, sve je više potrebno baviti se malim uzorcima.

    Mali uzorak je takvo promatranje uzorka, čiji broj jedinica ne prelazi 30.

    Prilikom evaluacije rezultata mali uzorak veličina populacije se ne koristi. Za određivanje mogućih margina greške koristi se Studentov kriterijum.

    Vrijednost σ se izračunava na osnovu podataka posmatranja uzorka.

    Ova vrijednost se koristi samo za proučavanu populaciju, a ne kao približna procjena σ u općoj populaciji.

    Vjerovatnosna procjena rezultata malog uzorka razlikuje se od procjene u velikom uzorku po tome što, uz mali broj opservacija, raspodjela vjerovatnoće za srednju vrijednost ovisi o broju odabranih jedinica.

    Međutim, za mali uzorak, vrijednost koeficijenta pouzdanosti t je povezana s vjerovatnoćom na drugačiji način nego za veliki uzorak (pošto se zakon raspodjele razlikuje od normalnog).

    Prema zakonu raspodjele koji je ustanovio Student, vjerovatna greška distribucije ovisi kako od vrijednosti koeficijenta povjerenja t tako i od veličine uzorka B.

    Prosječna greška malog uzorka izračunava se po formuli:

    gdje je varijansa malog uzorka.

    U MW, koeficijent n / (n-1) se mora uzeti u obzir i mora se korigovati. Prilikom određivanja varijanse S2, broj stupnjeva slobode je:

    .

    Granična greška malog uzorka određena je formulom

    U ovom slučaju, vrijednost koeficijenta povjerenja t ovisi ne samo od date vjerovatnoće povjerenja, već i od broja jedinica uzorka n. Za pojedinačne vrijednosti t i n, vjerovatnoća pouzdanosti malog uzorka određena je posebnim Studentovim tablicama, u kojima su date distribucije standardiziranih odstupanja:

    Vjerovatnosna procjena rezultata SW razlikuje se od procjene u BV po tome što, uz mali broj zapažanja, raspodjela vjerovatnoće za srednju vrijednost ovisi o broju odabranih jedinica

    19. Metode odabira jedinica u uzorku.

    1. Uzorak mora biti dovoljno velik po broju.

    2. Struktura populacije uzorka treba najbolje odražavati strukturu opšte populacije.

    3. Metoda odabira mora biti slučajna

    U zavisnosti od toga da li odabrane jedinice učestvuju u uzorku, razlikuje se metoda - neponavljajuća i ponovljena.

    Neponovljiva selekcija je takva selekcija, u kojoj se jedinica koja je ušla u uzorak ne vraća u populaciju iz koje se vrši dalja selekcija.

    Izračun prosječne greške slučajnog uzorka koji se ne ponavlja:

    Izračun granične greške nerepetitivnog slučajnog uzorkovanja:

    Prilikom ponovne selekcije jedinica koja je pala u uzorak, nakon registrovanja uočenih karakteristika, vraća se u prvobitnu (generalnu) populaciju radi učešća u daljem postupku selekcije.

    Proračun prosječne greške ponovljenog jednostavnog slučajnog uzorkovanja izvodi se na sljedeći način:

    Izračun granične greške ponovljenog slučajnog uzorkovanja:

    Tip formiranja uzorka dijeli se na - individualni, grupni i kombinovani.

    Metoda selekcije - utvrđuje specifičan mehanizam za uzorkovanje jedinica iz opšte populacije i deli se na: stvarno - slučajan; mehanički; tipično; serijski; kombinovano.

    Zapravo, nasumično najčešći metod odabira u slučajnom uzorku, naziva se i metodom lutrije, u kojoj se za svaku jedinicu statističke populacije priprema listić sa serijskim brojem. Zatim se nasumično bira potreban broj jedinica statističke populacije. Pod ovim uslovima, svaki od njih ima istu verovatnoću da bude uključen u uzorak.

    Mehaničko uzorkovanje. Koristi se u slučajevima kada je opća populacija na neki način uređena, odnosno postoji određeni redoslijed u rasporedu jedinica.

    Da bi se odredila prosječna greška mehaničkog uzorkovanja, koristi se formula prosječne greške za pravilan slučajni nerepetitivni odabir.

    tipičan izbor. Koristi se kada se sve jedinice opće populacije mogu podijeliti u nekoliko tipičnih grupa. Tipična selekcija uključuje odabir jedinica iz svake grupe same - nasumično ili mehanički.

    Za tipičan uzorak, vrijednost standardne greške ovisi o tačnosti određivanja srednjih vrijednosti grupe. Dakle, u formuli za marginalnu grešku tipičnog uzorka uzima se u obzir prosjek grupnih varijansi, tj.

    serijski izbor. Koristi se u slučajevima kada su jedinice stanovništva kombinovane u male grupe ili serije. Suština serijskog uzorkovanja leži u stvarnom slučajnom ili mehaničkom odabiru serija, u okviru kojeg se vrši kompletan pregled jedinica.

    Kod serijskog uzorkovanja, veličina greške uzorkovanja ne ovisi o broju proučavanih jedinica, već o broju ispitanih serija (s) i vrijednosti međugrupne varijanse:

    Kombinovani izbor može proći kroz jednu ili više faza. Uzorak se naziva jednostepenim ako su jedinice populacije odabrane jednom podvrgnute proučavanju.

    Uzorak se zove višestepeni, ako selekcija populacije prolazi kroz korake, uzastopne faze, a svaki korak, faza selekcije ima svoju jedinicu selekcije.

    "

    U procesu procene stepena reprezentativnosti podataka posmatranja uzorka, pitanje veličine uzorka postaje važno. koeficijent konverzije uzorka student

    On određuje ne samo veličinu granica koje greška uzorkovanja neće preći sa datom vjerovatnoćom, već i metode za određivanje ovih granica.

    Uz veliki broj jedinica uzorkovanja (), distribucija slučajnih grešaka uzorka srednja u skladu sa Ljapunovljeva teorema normalno ili se približava normalnom kako se broj opažanja povećava.

    Vjerovatnoća da greška pređe određene granice procjenjuje se na osnovu tabela Laplaceov integral . Proračun greške uzorkovanja zasniva se na vrijednosti opšte varijanse, budući da u velikoj mjeri koeficijent kojim se varijansa uzorka množi da bi se dobila opšta varijansa ne igra veliku ulogu.

    U praksi statističkih istraživanja često se susreću sa malim, takozvanim malim uzorcima.

    Mali uzorak je takvo promatranje uzorka, čiji broj jedinica ne prelazi 30.

    Razvoj teorije malog uzorka započeo je engleski statističar V.S. Gosset (objavljeno pod pseudonimom Student ) 1908. godine. Dokazao je da procjena neslaganja između prosjeka malog uzorka i opšteg prosjeka ima poseban zakon raspodjele.

    Za određivanje mogućih granica greške, tzv Studentov kriterijum, određena formulom

    gdje je mjera slučajnih fluktuacija srednje vrijednosti uzorka u

    mali uzorak.

    Vrijednost se izračunava na osnovu podataka posmatranja uzorka:

    Ova vrijednost se koristi samo za studijsku populaciju, a ne kao približna procjena u općoj populaciji.

    Uz malu veličinu uzorka, distribucija Student razlikuje se od normalnog: velike vrijednosti kriterija ovdje imaju veću vjerovatnoću nego kod normalne distribucije.

    Granična greška malog uzorka kao funkcija srednje greške prikazana je kao

    Ali u ovom slučaju, veličina je drugačije povezana s vjerovatnom procjenom nego kod velikog uzorka.

    Prema distribuciji Student , vjerojatna procjena ovisi i o veličini i o veličini uzorka ako marginalna greška ne prelazi prosječnu grešku u malim uzorcima.

    Tabela 3.1 Distribucija vjerovatnoće u malim uzorcima u zavisnosti od iz koeficijenta pouzdanosti i veličinu uzorka


    Kao što se vidi iz tab. 3.1 , sa povećanjem ova raspodjela teži normalnoj i pri , već se malo razlikuje od nje.

    Hajde da pokažemo kako da koristimo Studentovu tabelu raspodele.

    Pretpostavimo da je uzorak anketiranja radnika u malom preduzeću pokazao da radnici troše vrijeme (min.) na jednu od proizvodnih operacija: . Pronađite prosječne troškove uzorka:

    Varijanca uzorka

    Otuda prosječna greška malog uzorka

    By tab. 3.1 nalazimo da je za koeficijent pouzdanosti i veličinu malog uzorka vjerovatnoća jednaka.

    Dakle, sa vjerovatnoćom se može tvrditi da se neslaganje između uzorka i opšteg prosjeka nalazi u rasponu od do, tj. razlika neće premašiti apsolutnu vrijednost ().

    Stoga će prosječno vrijeme provedeno u cijeloj populaciji biti u rasponu od do.

    Vjerovatnoća da je ova pretpostavka zapravo pogrešna i da će greška iz slučajnih razloga biti veća od jednaka je: .

    Tabela vjerovatnoće Student često predstavljen u drugačijem obliku od tabela 3.1 . Vjeruje se da je u nekim slučajevima ovaj oblik prikladniji za praktičnu upotrebu ( tab. 3.2 ).

    Od tab. 3.2 slijedi da je za svaki broj stupnjeva slobode naznačena granična vrijednost, koja sa datom vjerovatnoćom neće biti prekoračena zbog slučajnih fluktuacija u rezultatima uzorka.

    Na osnovu tab. 3.2 količine su određene intervali poverenja : i.

    Ovo je područje onih vrijednosti opšteg prosjeka, preko kojih ima vrlo malu vjerovatnoću, jednaku:

    Kao nivo pouzdanosti u dvostranoj provjeri obično koriste ili, što, međutim, ne isključuje izbor drugih koji nisu navedeni u tab. 3.2 .

    Tabela 3.2 Neka značenja -Distribucija učenika

    Vjerovatnoće slučajnog izlaska procijenjene prosječne vrijednosti izvan granica intervala povjerenja, respektivno, biće jednake i, tj. su veoma mali.

    Izbor između vjerovatnoća i je u određenoj mjeri proizvoljan. Ovaj izbor je u velikoj mjeri određen sadržajem onih zadataka za koje se koristi mali uzorak.

    U zaključku, napominjemo da se izračunavanje grešaka u malom uzorku malo razlikuje od sličnim proračunima veliki uzorak. Razlika je u tome što je kod malog uzorka vjerovatnoća naše tvrdnje nešto manja nego kod većeg uzorka (posebno u primjeru iznad i respektivno).

    Međutim, sve ovo ne znači da možete koristiti mali uzorak kada vam je potreban veliki uzorak. U mnogim slučajevima, odstupanja između pronađenih granica mogu dostići značajne veličine, što teško da zadovoljava istraživače. Stoga, mali uzorak treba koristiti u statističkom proučavanju društveno-ekonomskih pojava sa velikom pažnjom, uz odgovarajuće teorijsko i praktično opravdanje.

    Dakle, zaključci na osnovu rezultata malog uzorka su od praktične važnosti samo pod uslovom da je distribucija osobine u opštoj populaciji normalna ili asimptotski normalna. Također je potrebno uzeti u obzir činjenicu da je tačnost rezultata malog uzorka još uvijek niža nego kod velikog uzorka.

    A.M. Nosovsky1*, A.E. Pihlak2, V.A. Logačev2, I.I. Chursinova3, N.A. Mutyeva2 STATISTIKA MALIH UZORAKA U MEDICINSKOM ISTRAŽIVANJU

    „Državni naučni centar Ruska Federacija- Institut za biomedicinske probleme Ruska akademija nauke, 123007, Moskva, Rusija; 2A.I. Evdokimov Moskovski državni univerzitet medicine i stomatologije, Ministarstvo zdravlja Rusije, 127473, Moskva, Rusija; Artrološka bolnica 3ANO NPO SKAL, 109044, Moskva, Rusija

    *Nosovski Andrej Maksimovič, E-mail: [email protected]

    ♦ Eksperimentalno se utvrđuju karakteristike statističkih kriterijuma. Kao rezultat, izračunata je vrijednost statistike W. Ansari-Bradley (Ansari-Bradly) i K. Klotts (Klotz). Za svaku početnu statistiku izračunava se normalna aproksimacija (Z-statistika) i nivo značajnosti p nulte hipoteze o odsustvu razlika u širenju vrijednosti dva uzorka. Ako je p>

    Predložene metode matematičke statistike omogućavaju da se potvrdi pouzdanost razlika u rezultatima dobivenim čak i u malim grupama promatranja, ako su razlike dovoljno značajne. Kao ilustracija poslužili su klinički primjeri pacijenata sa osteoartikularnom patologijom. Ključne riječi: mali uzorak, snaga kriterija, koksartroza, gihtni artritis

    A.M. Nosovskiy1, A.E.Pihlak2, V.A. Logačev2, I.I. Chursinova3, N.AMuteva2 STATISTIČKA ANALIZA MALIH PODATAKA U MEDICINSKIM STUDIJAMA

    1Državni istraživački centar-institut za medicinsko biološke probleme Ruske akademije medicinskih nauka, 123007 Moskva, Rusija; 2Moskovski državni univerzitet medicine i stomatologije nazvan po A.I. Evdokimov, 127473 Moskva, Rusija; 3 Artrološka bolnica naučno-praktične asocijacije SKAL, 109044 Moskva, Rusija

    ♦ Eksperimentalno su utvrđene karakteristike statističkih kriterijuma. Kao rezultat, izračunali su vrijednost statistike W. An-sari-Bradly i K. Klotz. Za svaki izvor statistike izračunata je normalna aproksimacija (Z-statistika) i nivo značajnosti p nulte hipoteze da nema razlike u širenju vrijednosti dva uzorka. Atp>0,05 nulta hipoteza se može prihvatiti. Predložene metode matematičke statistike mogu biti potvrđivanje tačnosti razlika rezultata, čak iu malim grupama posmatranja, ako su razlike dovoljno značajne.

    Koristili smo medicinske slučajeve pacijenata sa patologijom zglobova i kostiju.

    Ključne riječi: analiza malih podataka, moć kriterija, koksartroza, gihtni artritis

    Principi medicine zasnovane na dokazima postavljaju visoke zahtjeve za pouzdanost uporedne procjene dobijenih rezultata istraživanja. Ovo postaje sve važnije jer većina lekara vrlo površno razume metode statističke obrade, ograničavajući se u svojim publikacijama, pored izračunavanja procenata, u najboljem slučaju, Studentovim /-kriterijumom.

    Međutim, za potpunu analizu rezultata studije, u nekim slučajevima to nije dovoljno. Obično nema sumnje u pouzdanost otkrivenih pravilnosti kada je broj zapažanja nekoliko hiljada ili čak stotina. Šta ako je nekoliko desetina? Šta ako imamo samo nekoliko slučajeva? Zaista, u medicini postoje prilično rijetke bolesti, hirurzi ponekad izvode jedinstvene operacije kada je broj promatranja vrlo mali. Gdje je ta granica, ta neophodna i dovoljna količina istraživanja koja nam omogućavaju da potvrdimo nesumnjivo prisustvo ove ili one pravilnosti?

    Ovo pitanje je od velike važnosti ne samo u evaluaciji već sprovedenih studija, već iu planiranju naučni rad. Da li je dovoljno posmatrati 20 pacijenata ili je potrebno minimalno 40? Ili će možda 10 slučajeva biti dovoljno? Od pravovremenog i tačnog odgovora na ovo pitanje zavisi ne samo pouzdanost izvedenih zaključaka, već i vremenski rokovi istraživanja, njihova cijena, potreba za osobljem, opremom itd.

    Moderna statistika poznaje dosta trikova pomoću kojih možete odrediti pouzdanost rezultata čak i uz mali broj zapažanja. Ovo su metode "malog uzorka". Općenito je prihvaćeno da je početak statistike malog uzorka položen u prvoj deceniji 20. stoljeća objavljivanjem rada U.

    set, gdje je on, pod pseudonimom "Student" (student), postulirao tzv. /-distribuciju. Za razliku od teorije normalna distribucija, teorija raspodjele za male uzorke ne zahtijeva apriorno znanje ili tačne procjene matematičko očekivanje i varijansu populacije, i ne zahtijeva pretpostavke o parametrima. U /-distribuciji, jedno od odstupanja od srednje vrijednosti uzorka je uvijek fiksno, jer zbir svih takvih odstupanja mora biti jednak nuli. Ovo utiče na zbir kvadrata prilikom izračunavanja varijanse uzorka kao nepristrasne procjene varijanse populacije i dovodi do činjenice da je broj stupnjeva slobode df jednak broju mjerenja minus jedan za svaki uzorak. Dakle, u formulama i postupcima za izračunavanje /-statistike za testiranje nulte hipoteze df=w-1. Poznata su i klasična djela najvećeg engleskog statističara R.A. Fišera (po kome je ^-distribucija dobila ime) o analizi varijanse - statističkoj metodi koja je jasno fokusirana na analizu malih uzoraka. Od brojnih statistika koje se razumno mogu primijeniti na male uzorke, možemo spomenuti: Fisherov egzaktni test vjerovatnoće; dvofaktorska neparametrijska (rang) analiza varijanse Friedman; koeficijent korelacije ranga / Kendall; Kendallov faktor konkordancije; Kruskal-Wallace R-test za neparametarsku (rang) jednosmjernu analizu varijanse; ^/-Mann-Whitney test; srednji kriterijum; kriterij znaka; koeficijent korelacije ranga Mr. Spearman; /-Wilcoxon test.

    Ne postoji definitivan odgovor na pitanje koliki bi uzorak trebao biti da bi se smatrao malim. Međutim, smatra se da je uslovna granica između malog i velikog uzorka df=30. temelj

    za ovo donekle služi proizvoljno rješenje, rezultat poređenja /-distribucije (za male uzorke) sa normalnom distribucijom (r). Nesklad između vrijednosti / i r ima tendenciju da se povećava sa smanjenjem i smanjuje s povećanjem U stvari, 1 počinje da se približava b mnogo prije graničnog slučaja kada / = r. Jednostavan vizuelni pregled vrednosti tabele / omogućava vam da vidite da ova aproksimacija postaje prilično brza, počevši od ^=30 i više. Komparativne vrijednosti / (pri t=30) i r su: 2,04 i 1,96 za p=0,05; 2,75 i 2,58 za p=0,01; 3,65 i 3,29 za p=0,001.

    U matematičkoj statistici se koristi faktor pouzdanosti /, vrijednosti funkcije su tabelarno prikazane za njene različite vrijednosti i dobijaju se odgovarajući nivoi pouzdanosti (Tablica 1).

    Koeficijent pouzdanosti vam omogućava da izračunate graničnu grešku uzorkovanja AX, izračunatu po formuli AXav = 1tsav, tj. granična greška uzorkovanja jednaka je /- puta broju srednjih grešaka uzorkovanja.

    Dakle, vrijednost granične greške uzorkovanja može se postaviti sa određenom vjerovatnoćom. Kao što se može vidjeti iz posljednje kolone tabele 1, vjerovatnoća greške jednake ili veće od trostruke prosječne greške uzorkovanja, tj. AXs = 3tss, izuzetno je mala i jednaka je 0,003 (1-0,997). Ovakvi nevjerovatni događaji se smatraju praktično nemogućim, pa se vrijednost AX = 3cs može uzeti kao granica moguće greške uzorkovanja p3].

    Interval u kojem će se, sa datim stepenom vjerovatnoće, zaključiti nepoznata količina procijenjeni parametar se naziva povjerenje, a vjerovatnoća P - vjerovatnoća povjerenja. Najčešće, vjerovatnoća povjerenja se uzima jednakom 0,95 ili 0,99, tada je koeficijent pouzdanosti 1 jednak 1,96 i 2,58, respektivno.

    To znači da je interval povjerenja data verovatnoća sadrži opšti prosek.

    Što je veća vrijednost marginalne greške uzorkovanja, to je veća vrijednost intervala povjerenja i, posljedično, niža je tačnost procjene.

    Primenu ovog pristupa može se ilustrovati posmatranjem 20 pacijenata sa koksartrozom koji su liječeni u Artrološkoj bolnici NPO „SKAL“ (Naučno-proizvodno udruženje „Specijalizovani kurs ambulantnog lečenja“) u Moskvi.

    Prilikom testiranja statističke hipoteze moguće su greške. Postoje dvije vrste grešaka. Greška tipa I je odbijanje Nulta hipoteza, dok je u stvarnosti ova hipoteza tačna. Greška tipa II nastaje kada se prihvati nulta hipoteza, a zapravo je nulta hipoteza netačna.

    Vjerovatnoća greške tipa I naziva se nivo značajnosti i označava se a. Dakle, a=P(W¥ | H0), tj. nivo značajnosti a je vjerovatnoća događaja (Ce¥), izračunata pod pretpostavkom da je nulta hipoteza H0 tačna.

    Nivo značajnosti i snaga testa kombinovani su u konceptu funkcije snage testa - funkcije koja određuje vjerovatnoću da će nulta hipoteza biti odbačena. Funkcija snage zavisi od kritičnog područja ¥ i stvarne distribucije rezultata posmatranja. U parametarskom

    Tabela 1

    Faktor pouzdanosti t i odgovarajući nivoi povjerenja

    t 1,00 1,96 2,00 2,58 3,00

    F(0 0,683 0,950 0,954 0,990 0,997

    U problemu testiranja hipoteza, distribucija rezultata posmatranja je data parametrom 0. U ovom slučaju, funkcija snage je označena sa M(¥,0) i zavisi od kritične oblasti ¥ i stvarne vrednosti parametra koji se proučava 0. Ako je H0: 0=00, H1: 0=01, tada je M (¥,00) = a, M(¥,01) = 1-c, gdje je a vjerovatnoća greške prve vrste , b je vjerovatnoća greške druge vrste. Zatim, snaga testa je vjerovatnoća da će nulta hipoteza biti odbačena kada je alternativna hipoteza tačna.

    Funkcija snage M(¥,0) u slučaju jednodimenzionalnog parametra 0 obično dostiže minimum jednak a na 0=00, monotono raste sa rastojanjem od 00 i približava se 1 na | 0 - 00 | ^ da.

    Procijenimo potrebnu snagu statističkih kriterija (Sl. 1), koji bi se mogli koristiti za analizu liječenja 20 pacijenata sa koksartrozom.

    Kao što vidite, sa standardnom devijacijom od 3,0, što je izuzetno rijetko, rezultati će se dobiti s visokim stupnjem pouzdanosti /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

    Da bi se odredio nivo značajnosti p, obično se koristi približna normalna 2-aproksimacija odgovarajuće statistike. Ova aproksimacija daje dobru aproksimaciju za dovoljno velike veličine uzorka. Sa malom veličinom uzorka i p vrijednostima blizu 0,05, testirali smo zaključak o nul hipotezi poređenjem

    Kriva snage alfa=0,05, sigma=

    Kriva snage alfa=0,05, sigma=1,

    Prava razlika između sredstava

    Prava razlika između sredstava

    Rice. 1. Eksperimentalno utvrđene karakteristike statističkih

    kriterijuma.

    Tabela 2.

    Grupe za posmatranje

    Grupa 1 Grupa 2 Grupa 3 Ukupno zapažanja

    Nimesulid, vitamini, hondroprotektori, tjelovježba + + + 20

    Fizioterapija --- + + 15

    Masaža... --- + 8

    Bol pri kretanju

    Bol u mirovanju 43±13 27±17

    izračunavanje izračunate vrijednosti statistike sa kritičnom vrijednošću u tabeli odgovarajuće distribucije iz statističkog priručnika.

    Kriterijumi za razlike u pomaku (položaju). Koristili smo ove kriterije da testiramo sljedeće hipoteze:

    ♦ nema razlika u međusobnom položaju (medijana) dva proučavana uzorka;

    ♦ pomak uzoraka jedan u odnosu na drugi jednak je nekoj vrijednosti d;

    ♦ medijan jednog analiziranog uzorka jednak je vrijednosti d.

    U slučaju b) bilo je potrebno smanjiti sve vrijednosti drugog uzorka za vrijednost d: yi=yi-d.

    U slučaju c) potrebno je pripremiti pomoćni upareni uzorak čiji su svi elementi jednaki d.

    Kao rezultat toga, izračunali smo:

    ♦ vrijednost W. Wilcoxon-ove statistike (Wilco-xon) - zbir rangova Rxi elemenata jednog od uzoraka u kombinovanom rangiranom uzorku;

    ♦ vrijednost van der Varden V statistike zasnovane na korištenju metode "arbitrarnih oznaka".

    Za svaku statistiku izračunata je normalna aproksimacija (Z-statistika) i nivo značajnosti P nulte hipoteze o nepostojanju razlike u pomaku jedna u odnosu na drugu. Ako je p>0,05, nulta hipoteza se može prihvatiti.

    Neki paketi i autori predlažu korištenje Mann-Whitney ^/-testa i Wald-Wolfowitz testa. Međutim, odavno je dokazano da je Mann-Whitneyjev kriterij ekvivalentan, tj. ima iste mogućnosti kao i kritični

    Tabela 3.

    Srednji pokazatelji intenziteta bola (u bodovima prema VAS)

    Grupa 1 (n= 5) Grupa 2 (n=7) Grupa 3 (n= =8)

    Parametar Početak praćenja Kraj praćenja Smanjenje bola Početak praćenja Kraj praćenja Smanjenje bola Početak praćenja Kraj praćenja Smanjenje bola

    Tabela 4

    Podaci laboratorijskog pregleda pacijenta B.

    Br. Indikator Norma Rezultat pretposljednjeg Rezultat posljednjeg

    on u posjeti u posjeti

    Hematokrit, % 40-48 38.7

    Limfociti, % 19-37 42

    ESR, mm/sat 2-10 39

    Mokraćna kiselina, µmol/l 200-416 504

    Kreatinin, µmol/l 44-106 238

    Paratiroidni hormon, pg/ml 7-53 76.8

    Fibrinogen, g/l 1,69-3,92 5.7

    Proteini u urinu, g/l 0-0,1 1

    43,5 39 10 489 202 101 3

    pretposljednji

    Poslednja stvar

    Rice. 2. p-vrijednosti kliničkih pokazatelja bolesnika B. na pretposljednjem i posljednjem pregledu.

    Wilcoxon test, a Wald-Wolfowitz test pati od relativno niske osjetljivosti.

    Kriterij razlike u skali (raspršenje). Koristili smo ove kriterije da testiramo sljedeće hipoteze:

    ♦ hipoteza da ne postoje razlike u skalama (u širenju ili disperziji vrijednosti) proučavanih uzoraka;

    ♦ hipoteza da je omjer skala uzorka jednak datoj vrijednosti g.

    U potonjem slučaju potrebno je prvo promijeniti vrijednosti drugog uzorka y1=(y1-m0)^, gdje je m0 zajednički medijan dva proučavana spektra.

    Ako medijani populacija iz kojih se uzimaju uzorci nisu jednaki po veličini, već po njihovoj

    primijeniti nakon izmjene jednog od odabira, na primjer, u selekciju yi=yi-m2+mr

    Ako medijani nisu jednaki i nisu poznati, onda treba potvrditi hipotezu o nepostojanju razlika u pomaku ili koristiti metodu za otkrivanje proizvoljnih alternativa.

    Kao rezultat, izračunata je vrijednost statistike W. Ansari-Bradley (Ansari-Bradly) i K. Klotz (Klotz), koje su konceptualni analogi statistike Wilcoxona i Van der Waerdena.

    Za svaku početnu statistiku izračunava se normalna aproksimacija (Z-statistika) i nivo značajnosti P nulte hipoteze o odsustvu razlika u raspršenosti vrijednosti dva uzorka. Ako />>0,05, nulta hipoteza se može prihvatiti.

    Dakle, gore predložene metode matematičke statistike omogućavaju da se potvrdi pouzdanost razlika

    dobili rezultate čak iu malim grupama posmatranja, ako su razlike dovoljno značajne.

    Kao ilustracija mogu poslužiti dva klinička primjera pacijenata sa osteoartikularnom patologijom.

    Klinički primjer br. 1. Kod 20 pacijenata sa koksartrozom primijenjen je osnovni kompleks liječenja koji uključuje oralnu primjenu nimesulida, hondroprotektora, intramuskularne injekcije vitamina i terapiju vježbanjem. Osim toga, fizioterapija je primijenjena kod njih 15, a masaža kod 6 pacijenata. Tako su formirane 3 grupe pacijenata sa malim (od 5 do 8) brojem opservacija (tabela 2).

    Između ostalih parametara, prije početka liječenja i nakon završetka kursa (21 ± 2 dana), intenzitet bola tokom kretanja i u mirovanju procijenjen je pomoću 100-stepene vizuelne analogne skale (VAS).

    Sljedeće statističke metode su koristili W. Ansari-Bradly i K. Klotz (Tabela 3).

    Prema dobijenim podacima (Tabela 3), uočeno je da smanjenje boli u mirovanju u grupi 1 na kraju posmatranja nije bilo značajno. Međutim, nađene su značajne vrijednosti za sve ostale proučavane parametre. Razmatrani klinički primjer ukazuje na mogućnost dobijanja pouzdanih rezultata na maloj veličini uzorka.

    U kliničkom primjeru br. 2, u dinamici su razmotreni laboratorijski podaci bolesnika B. koji boluje od kroničnog gihtnog poliartritisa, gihtne nefropatije sa simptomima CRF-a koji su bili izvan referentnih vrijednosti (Tabela 4).

    Izračunajmo vjerovatnoću da rezultati analize statistički značajno prelaze granice kliničke norme. Za to koristimo probabilistički kalkulator statističkog paketa "STATISTICA 6.0". U ovom slučaju, p-vrijednost karakterizira grešku prvog tipa: vjerovatnoću odbacivanja ispravne hipoteze kada je u stvari tačna. U većini slučajeva, rezultati pretposljednje posjete su se statistički značajno razlikovali od norme (slika 2). Budući da je prag značajnosti u ovom slučaju, uzimamo jednak 0,05, rezultati hematokrita, limfocita, ESR, fibrinogena su se statistički značajno poboljšali pri posljednjoj posjeti. Shodno tome, klinički pokazatelji mokraćne kiseline, kreatinina, paratiroidnog hormona i proteina u urinu, u smislu matematičke statistike, nisu se poboljšali.

    Stoga je pri planiranju studije važno uzeti u obzir snagu primijenjenih statističkih kriterija, koji su određeni varijabilnosti uzorka i datim nivoom značajnosti.

    Predloženi pristup može biti od interesa za specijaliste iz oblasti personalizovane medicine za

    analizu u dinamici metoda liječenja i primijenjenih lijekova, uz praćenje tekućih terapijskih i dijagnostičkih mjera.

    LITERATURA

    1. Bolshev L.N., Smirnov N.V. Tabele matematičke statistike. M.: Nauka; 1995.

    2. Korn G., Korn T. Priručnik iz matematike za naučnike i inženjere. M.: Nauka; 2003.

    3. Kobzar A.I. Primijenjeno matematička statistika. Za inžinjere i naučnike. Moskva: FIZMATLIT; 2006.

    4. Pravetsky N.V., Nosovsky A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Matematičko utemeljenje dovoljnog broja mjerenja za pouzdanu procjenu snimljenih parametara u svemirskoj biologiji i medicini. Svemirska biologija i vazduhoplovna medicina. M.: Medicina; 1990; 5:53-6.

    5. HollenderM., Wulf D.A. Neparametarske metode statistike. M.: Finansije i statistika; 1983.

    6. Nosovsky A.M. Primjena probabilističkih modela na krug u biomedicinskim istraživanjima. Svemirska biologija i vazduhoplovna medicina. Abstracts IX All-Union Conference. Kaluga, 19-21. juna 1990.

    7. Nosovsky A.M., Pravetsky N.V., Kholin S.F. Matematički pristup procjeni tačnosti mjerenja fiziološkog parametra različitim metodama. Svemirska biologija i vazduhoplovna medicina. M.: Medicina; 1991; 6:53-5.

    1. Bol "shev L.N., Smirnov N.V. Tabele matematičke statistike. Moskva: Nauka; 1995. (na ruskom).

    2. Korn G., Korn T. Matematički priručnik za znanstvenike i inženjere. Moskva: Nauka; 2003 (na ruskom).

    3. Kobzar" A.I. Primenjena matematička statistika. Za inženjere i naučnike. Moskva: FIZMATLIT; 2006 (na ruskom).

    4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Matematička opravdanost dovoljnog broja mjerenja za pouzdanu evaluaciju zabilježenih parametara u svemirskoj biologiji i medicini. Svemirska biologija i svemirska medicina. Moskva: Medicina; 1990; 5:53-6 (na ruskom).

    5. Khollender M., Vul "f D.A. Neparametarske statističke metode. Moskva: Finansy i statistika; 1983 (na ruskom).

    6. Nosovskiy A.M. Upotreba probabilističkih modela na krug u biomedicinskim istraživanjima. Svemirska biologija i svemirska medicina. Sažeci IX Svesavezne konferencije. Kaluga, 19-21. jun 1990. (na ruskom).

    7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Matematički pristup procjeni tačnosti fiziološkog parametra različitim metodama. Svemirska biologija i svemirska medicina. Moskva: Me-ditsina; 1991; 6:53-5 (na ruskom).

    Prilikom kontrole kvaliteta robe u ekonomskim istraživanjima, eksperiment se može izvesti na osnovu malog uzorka mali uzorak se podrazumijeva kao nekontinuirano statističko istraživanje, u kojem se populacija uzorka formira od relativno malog broja jedinica opšte populacije. Volumen malog uzorka obično ne prelazi 30 jedinica i može dostići do 4 - 5 jedinica. Prosječna greška malog uzorka izračunava se po formuli:, gdje je varijansa malog uzorka. Prilikom određivanja varijanse, broj stepeni slobode je n-1: . Granična greška malog uzorka određena je formulom: U ovom slučaju, vrijednost koeficijenta pouzdanosti t ne zavisi samo od date vjerovatnoće povjerenja, već i od broja jedinica uzorka n. Za pojedinačne vrijednosti t i n, vjerovatnoća pouzdanosti malog uzorka određena je posebnim Studentovim tabelama (tabela 9.1.), u kojima su date distribucije standardiziranih devijacija: tada se koriste sljedeće indikacije Studentove distribucije za odrediti marginalnu grešku malog uzorka:

    Metode za proširenje karakteristika uzorka na opću populaciju. Metoda uzorkovanja se najčešće koristi za dobijanje karakteristika opšte populacije prema relevantnim pokazateljima uzorka. Ovisno o ciljevima istraživanja, to se provodi ili direktnim preračunavanjem indikatora uzorka za opštu populaciju, ili izračunavanjem faktora korekcije. direktna metoda proračuna. Sastoji se u tome da se pokazatelji udjela uzorka ili prosjeka proširuju na opštu populaciju, uzimajući u obzir grešku uzorkovanja.Tako se u trgovini utvrđuje broj nestandardnih proizvoda primljenih u seriji robe. Da bi se to postiglo (uzimajući u obzir prihvaćeni stepen vjerovatnoće), pokazatelji udjela nestandardnih proizvoda u uzorku se množe sa brojem proizvoda u cijeloj seriji robe. Metoda korekcije faktora. Koristi se u slučajevima kada je svrha metode uzorkovanja da se preciziraju rezultati kompletnog popisa, au statističkoj praksi se koristi za preciziranje podataka godišnjih popisa stoke u vlasništvu stanovništva. Da bi se to postiglo, nakon sumiranja podataka kompletnog računovodstva, praktikuje se anketa uzorka od 10% uz određivanje takozvanog „procenta potcjenjivanja“. Metode odabira jedinica iz opće populacije. U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i zavisi od specifičnosti predmeta proučavanja.Osnovni uslov za sprovođenje ankete uzorka je da se spreči pojava sistematskih grešaka koje proizilaze iz kršenje principa jednake mogućnosti pogoci u uzorku svake jedinice opće populacije. Prevencija sistematskih grešaka postiže se upotrebom naučno zasnovanih metoda za formiranje uzorka populacije. Postoje sljedeće metode odabira jedinica iz opšte populacije: 1) individualna selekcija - pojedinačne jedinice se biraju u uzorak; 2) grupna selekcija - u uzorak spadaju kvalitativno homogene grupe ili serije jedinica koje se proučavaju; 3) kombinovani odabir je kombinacija individualne i grupne selekcije. Metode selekcije određene su pravilima za formiranje populacije uzorka.Uzorak može biti: - stvarno slučajan, - mehanički, - tipičan, - serijski, - kombinovan. Samonasumično uzorkovanje sastoji se u tome što se uzorak formira kao rezultat slučajnog (nenamjernog) odabira pojedinačnih jedinica iz opće populacije. U ovom slučaju, broj jedinica odabranih u skupu uzoraka se obično određuje na osnovu prihvaćenog udjela uzorka. Udio uzorka je omjer broja jedinica populacije uzorka n prema broju jedinica opšte populacije N, dakle, sa 5% uzorka iz serije robe od 2.000 jedinica. veličina uzorka n je 100 jedinica. (5 * 2000:100), a sa uzorkom od 20% to će biti 400 jedinica. (20*2000:100) itd. Mehaničko uzorkovanje sastoji se u tome da se odabir jedinica u uzorku vrši iz opće populacije, podijeljene u jednake intervale (grupe). Istovremeno, veličina intervala u opštoj populaciji jednaka je recipročnom udjelu uzorka.Tako se kod uzorka od 2% bira svaka 50. jedinica (1:0,02), a kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu sa prihvaćenom proporcijom selekcije, opšta populacija je takoreći mehanički podijeljena u jednake grupe. Iz svake grupe u uzorku bira se samo jedna jedinica.Važna karakteristika mehaničkog uzorkovanja je da se formiranje populacije uzorka može izvršiti bez pribjegavanja popisu. U praksi se često koristi redoslijed kojim su jedinice stanovništva zapravo raspoređene. Na primjer, redoslijed izlaza gotovih proizvoda sa transportera ili proizvodne linije, redosljed kojim se jedinice serije robe postavljaju tokom skladištenja, transporta, prodaje itd. Tipičan uzorak. Sa tipičnim uzorkom, populacija se prvo dijeli na homogene tipične grupe. Zatim se iz svake tipične grupe vrši individualna selekcija jedinica u uzorak slučajnim ili mehaničkim uzorkom.Tipično uzorkovanje se obično koristi u proučavanju složenih agregati. Na primjer, u uzorku istraživanja produktivnosti rada trgovačkih radnika, koji se sastoji od odvojenih grupa vještina. Važna karakteristika tipičnog uzorka je da daje tačnije rezultate u poređenju sa drugim metodama odabira jedinica u populaciji uzorka. prosječna greška tipičnog uzorka, koriste se sljedeće formule: ponovni odabir , neponovljiva selekcija , Disperzija se određuje prema sljedećim formulama: , At single stage U uzorku, svaka odabrana jedinica se odmah podvrgava proučavanju po datoj osnovi. Ovo je slučaj sa pravilnim slučajnim i serijskim uzorkovanjem. višestepeni uzorak se bira iz opće populacije pojedinačnih grupa, a pojedinačne jedinice se biraju iz grupa. Ovako se pravi tipičan uzorak mehaničkom metodom odabira jedinica u populaciji uzorka. Kombinovano uzorak može biti dvostepeni. U ovom slučaju, opća populacija se prvo dijeli na grupe. Zatim se biraju grupe, au okviru ovih se biraju pojedinačne jedinice.

    Pored samog slučajnog uzorka sa svojim jasnim probabilističkim opravdanjem, postoje i drugi uzorci koji nisu apsolutno slučajni, ali se široko koriste. Treba napomenuti da striktna primjena stvarnog slučajnog odabira jedinica iz opće populacije nije uvijek moguća u praksi. Takvi uzorci uključuju mehaničko uzorkovanje, tipično, serijsko (ili ugniježđeno), višefazno i ​​niz drugih.

    Retko se dešava da je opšta populacija homogena, to je više izuzetak nego pravilo. Stoga, ako postoje različite vrste fenomena u općoj populaciji, često je poželjno osigurati ravnomjerniju zastupljenost različitih tipova u populaciji uzorka. Ovaj cilj se uspješno postiže korištenjem tipičnog uzorka. Glavna poteškoća je u tome što moramo Dodatne informacije o cjelokupnoj općoj populaciji, što je u nekim slučajevima teško.

    Tipičan uzorak se takođe naziva stratifikovani ili stratifikovani uzorak; takođe se koristi za ravnomernije predstavljanje različitih regiona u uzorku, u kom slučaju se uzorak naziva uzorkom regiona.

    Tako ispod tipično Pod uzorkom se podrazumijeva uzorak u kojem je opća populacija podijeljena na tipične podgrupe koje formira jedna ili više njih bitne karakteristike(na primjer, stanovništvo je podijeljeno u 3-4 podgrupe prema prosječnom dohotku po glavi stanovnika ili stepenu obrazovanja - osnovno, srednje, više itd.). Nadalje, iz svih tipičnih grupa moguće je odabrati jedinice u uzorku na nekoliko načina, formirajući:

    a) tipičan ravnomjerno raspoređen uzorak, odakle različite vrste(slojevi) je odabran jednak broj jedinica. Ova šema dobro funkcioniše ako se u opštoj populaciji slojevi (tipovi) ne razlikuju mnogo jedni od drugih po broju jedinica;

    b) tipično uzorkovanje sa proporcionalnim postavljanjem, kada se zahteva (za razliku od uniformnog postavljanja) da proporcija (%) selekcije za sve slojeve bude ista (na primer, 5 ili 10%);

    c) tipičan uzorak sa optimalnim rasporedom, kada se uzima u obzir stepen varijacije karakteristika u različitim grupama opšte populacije. Ovakvim smještajem povećava se udio selekcije za grupe sa velikom fluktuacijom osobine, što u konačnici dovodi do smanjenja slučajne greške.

    Formula za srednju grešku u tipičnoj selekciji je slična uobičajenoj grešci uzorkovanja za odgovarajući slučajni uzorak, sa jedinom razlikom što se umesto ukupne varijanse upisuje prosek pojedinačnih varijansi unutar grupe, što prirodno vodi do smanjenja greške u poređenju sa odgovarajućim slučajnim uzorkom. Međutim, njegova primjena nije uvijek moguća (iz mnogo razloga). Ako nema potrebe za velikom preciznošću, lakše je i jeftinije koristiti serijsko uzorkovanje.

    Serial(ugniježđeno) uzorkovanje se sastoji u tome da se u uzorku ne biraju jedinice populacije (na primjer, studenti), već zasebne serije ili gnijezda (na primjer, studijske grupe). Drugim riječima, kod serijske (gniježđene) selekcije jedinica promatranja i jedinica selekcije se ne poklapaju: odabiru se određene grupe jedinica koje se nalaze jedna uz drugu (gnijezda), a jedinice uključene u ta gnijezda podliježu ispitivanju. Tako, na primjer, u uzorku istraživanja uslova stanovanja možemo nasumično odabrati određeni broj domaćinstava (jedinica uzorka), a zatim saznati uslove života porodica koje žive u tim kućama (jedinice posmatranja).

    Serije (gnijezda) se sastoje od jedinica koje su međusobno povezane geografski (okruzi, gradovi, itd.), organizacijski (preduzeća, radionice itd.), ili vremenski (na primjer, skup jedinica proizvoda proizvedenih u datom vremenskom periodu).

    Serijska selekcija se može organizovati u vidu jednostepene, dvostepene ili višestepene selekcije.

    Slučajno odabrane serije su podvrgnute kontinuiranom istraživanju. Dakle, serijsko uzorkovanje se sastoji od dvije faze slučajnog odabira serija i kontinuiranog proučavanja ovih serija. Serijski odabir omogućava značajne uštede u radnoj snazi ​​i resursima i stoga se često koristi u praksi. Greška serijskog odabira razlikuje se od stvarne greške slučajnog odabira po tome što se umjesto ukupne varijanse koristi međuserija (međugrupa), a umjesto veličine uzorka koristi se broj serija. Preciznost obično nije velika, ali je u nekim slučajevima prihvatljiva. Serijsko uzorkovanje može se ponavljati i ne ponavljati, a serije mogu biti jednake i nejednake.

    Serijsko uzorkovanje se može organizovati prema različitim šemama. Na primjer, moguće je formirati skup uzorka u dvije faze: prvo se nasumično odabire serije koje se ispituju, zatim se iz svake od njih nasumično odabire određeni broj jedinica koje će se direktno promatrati (mjeriti, vagati itd.). odabrana serija. Greška takvog uzorka zavisiće od greške serijske selekcije i od greške individualne selekcije, tj. višestepena selekcija obično daje manje precizne rezultate od jednostepene selekcije, što se objašnjava pojavom grešaka reprezentativnosti u svakoj fazi uzorkovanja. U ovom slučaju, potrebno je koristiti formulu greške uzorkovanja za kombinirani odabir.

    Drugi oblik selekcije je višefazna selekcija (1, 2, 3 faze ili faze). Ova selekcija se po svojoj strukturi razlikuje od višestepene selekcije, jer se u višefaznoj selekciji koriste iste jedinice selekcije u svakoj fazi. Greške u višefaznom odabiru izračunavaju se za svaku fazu posebno. glavna karakteristika dvofazno uzorkovanje se sastoji u tome da se uzorci međusobno razlikuju po tri kriterijuma u zavisnosti od: 1) udjela jedinica proučavanih u prvoj fazi uzorka i ponovno uključenih u drugu i naredne faze; 2) iz uočavanja jednakosti šansi svake jedinice uzorka prve faze da ponovo bude predmet proučavanja; 3) na veličinu intervala koji razdvaja faze jedna od druge.

    Hajde da se zadržimo na još jednoj vrsti selekcije, naime mehanički(ili sistematski). Ovaj izbor je vjerovatno najčešći. Ovo je očigledno zbog činjenice da je od svih metoda selekcije ova najjednostavnija. Konkretno, mnogo je jednostavniji od slučajnog odabira, koji uključuje mogućnost korištenja tablica slučajnih brojeva i ne zahtijeva dodatne informacije o općoj populaciji i njenoj strukturi. Osim toga, mehanička selekcija je usko isprepletena s proporcionalnom stratificiranom selekcijom, što dovodi do smanjenja greške uzorkovanja.

    Na primjer, korištenjem mehaničkog odabira članova stambene zadruge sa liste sastavljene po redoslijedu prijema u ovu zadrugu osigurat će se proporcionalna zastupljenost članova zadruge sa različitim stažom. Korištenje iste tehnike za odabir ispitanika sa abecednog popisa osoba daje jednake šanse za prezimena koja počinju na različita slova, itd. Upotreba kadrovskih ili drugih spiskova u preduzećima ili u obrazovne institucije a drugi mogu obezbijediti potrebnu proporcionalnost u zastupljenosti radnika sa različitim stažom. Imajte na umu da se mehanička selekcija široko koristi u sociologiji, u proučavanju javnog mnijenja itd.

    Kako bi se smanjila veličina greške, a posebno trošak uzorkovanja, razne kombinacije određene vrste selekcija (mehanička, serijska, pojedinačna, višefazna, itd.) U takvim slučajevima treba izračunati složenije greške uzorkovanja koje se sastoje od grešaka koje se javljaju u različitim fazama studije.

    Mali uzorak je skup jedinica manjih od 30. Mali uzorci su prilično česti u praksi. Na primjer, broj slučajeva rijetkih bolesti ili broj jedinica sa rijetkim svojstvom; osim toga, mali uzorak se koristi kada je istraživanje skupo ili istraživanje uključuje uništavanje proizvoda ili uzoraka. Mali uzorci se široko koriste u oblasti ispitivanja kvaliteta proizvoda. Teorijska osnova za utvrđivanje grešaka malog uzorka postavio je engleski naučnik W. Gosset (pseudonim Student).

    Mora se imati na umu da prilikom određivanja greške za mali uzorak, umjesto veličine uzorka, uzmite vrijednost ( n- 1) ili, prije određivanja prosječne greške uzorkovanja, izračunajte tzv. korigovanu varijansu uzorkovanja (u nazivniku umjesto n treba staviti ( n- jedan)). Imajte na umu da se takva korekcija vrši samo jednom - prilikom izračunavanja varijanse uzorka ili prilikom utvrđivanja greške. vrijednost ( n– 1) naziva se stepen slobode. Također, normalna distribucija je zamijenjena t-distribucija (Studentova distribucija), koja je tabelarno i zavisi od broja stepeni slobode. Jedini parametar Studentove distribucije je vrijednost ( n- jedan). Još jednom naglašavamo da je amandman ( n– 1) važan je i značajan samo za male populacije uzoraka; at n> 30 i više, razlika nestaje, približavajući se nuli.

    Do sada smo govorili o slučajnim uzorcima, tj. kao kada se odabir jedinica iz opće populacije vrši nasumično (ili gotovo nasumično) i sve jedinice imaju jednaku (ili skoro jednaku) vjerovatnoću da budu uključene u uzorak. Međutim, odabir jedinica može se zasnivati ​​na principu neslučajnog odabira, kada je u prvom planu princip pristupačnosti i svrsishodnosti. U takvim slučajevima nemoguće je govoriti o reprezentativnosti dobijenog uzorka, a proračun reprezentativnih grešaka se može izvršiti samo ako imamo podatke o opštoj populaciji.

    Poznato je nekoliko shema za formiranje neslučajnog uzorkovanja, koje su postale široko rasprostranjene i koriste se uglavnom u sociološko istraživanje: izbor raspoloživih jedinica posmatranja, izbor po Nirnberškoj metodi, ciljno uzorkovanje pri određivanju eksperata itd. Važan je i kvotni uzorak koji istraživač formira prema malom broju značajnih parametara i daje vrlo blisko podudaranje sa opšta populacija. Drugim riječima, odabir kvota bi trebao istraživaču pružiti gotovo potpunu podudarnost između uzorka i opće populacije prema parametrima koje je on odabrao. Namjerno postizanje blizine dvije populacije u ograničenom rasponu indikatora postiže se, po pravilu, korištenjem uzorka znatno manje veličine nego slučajnim odabirom. Upravo ta okolnost čini odabir kvote privlačnim istraživaču koji nije u stanju da se fokusira na samoponderisani slučajni uzorak velike veličine. Treba dodati da se smanjenje veličine uzorka najčešće kombinuje sa smanjenjem novčanih troškova i vremenskog rasporeda istraživanja, što povećava prednosti ove selekcijske metode. Također napominjemo da kod kvotnog uzorka postoji dosta preliminarnih informacija o strukturi opće populacije. Glavna prednost ovdje je da je veličina uzorka znatno manja nego kod slučajnog uzorka. Utvrđene karakteristike (najčešće socio-demografske – spol, starost, obrazovanje) treba da budu u bliskoj korelaciji sa proučavanim karakteristikama opšte populacije, tj. predmet proučavanja.

    Kao što je već pomenuto, metoda uzorkovanja omogućava dobijanje informacija o opštoj populaciji sa mnogo manje novca, vremena i truda nego uz kontinuirano posmatranje. Također je jasno da je kontinuirano proučavanje cjelokupne opće populacije nemoguće u nizu slučajeva, na primjer, prilikom provjere kvaliteta proizvoda čiji su uzorci uništeni.

    Uz to, međutim, treba istaći da opća populacija nije u potpunosti „crna kutija“ i da još uvijek imamo neke podatke o njoj. Provodeći, na primjer, selektivnu studiju o životu, životu, imovinskom stanju, prihodima i rashodima učenika, njihovim mišljenjima, interesovanjima i sl., još uvijek imamo podatke o njihovom ukupnom broju, grupisanju po spolu, starosti, bračnom statusu, mjestu. prebivališta, smjera studiranja i drugih karakteristika. Ove informacije se uvijek koriste u uzorku studije.

    Postoji nekoliko varijanti distribucije karakteristika uzorka na opštu populaciju: metoda direktnog preračunavanja i metoda korekcijskih faktora. Ponovno izračunavanje karakteristika uzorka vrši se, po pravilu, uzimajući u obzir intervale povjerenja i može se izraziti u apsolutnim i relativnim vrijednostima.

    Ovdje je prikladno naglasiti da većina statističke informacije o ekonomskom životu društva u njegovim različitim manifestacijama i tipovima, zasnovano je na uzorku podataka. Naravno, oni su dopunjeni potpunim podacima o registraciji i informacijama dobijenim kao rezultat popisa (stanovništva, preduzeća, itd.). Na primjer, sva budžetska statistika (o prihodima i rashodima stanovništva) koju daje Rosstat zasniva se na podacima ankete uzorka. Informacije o cijenama, obimu proizvodnje, obimu trgovine, izražene u odgovarajućim indeksima, također su u velikoj mjeri zasnovane na podacima uzorka.

    Statističke hipoteze i statistički testovi. Osnovni koncepti

    Koncepti statističkog testa i statističke hipoteze usko su povezani sa uzorkovanjem. Statistička hipoteza (za razliku od drugih naučnih hipoteza) sastoji se u pretpostavci nekih svojstava opšte populacije koja se mogu testirati na osnovu podataka iz slučajnog uzorka. Treba imati na umu da je dobijeni rezultat vjerovatnoće po prirodi. Shodno tome, rezultat studije, koji potvrđuje valjanost postavljene hipoteze, gotovo nikada ne može poslužiti kao osnova za njeno konačno prihvatanje, i obrnuto, rezultat, koji je u suprotnosti s njim, sasvim je dovoljan da odbaci postavljenu hipotezu kao pogrešno ili netačno. To je zato što dobijeni rezultat može biti u skladu s drugim hipotezama, a ne samo s onom iznesenom.

    Ispod statistički kriterijum se shvata kao skup pravila koja omogućavaju odgovor na pitanje pod kojim se rezultatima posmatranja hipoteza odbacuje, a pod kojim ne. Drugim riječima, statistički test je a pravilo odluke, što osigurava prihvatanje istinite (istinite) hipoteze i odbacivanje lažne hipoteze sa u velikoj mjeri vjerovatnoće. Statistički testovi su jednostrani i dvostrani, parametarski i neparametarski, manje ili više moćni. Neki kriterijumi se koriste često, drugi se koriste rjeđe. Neki od kriterijuma su dizajnirani za rešavanje posebnih problema, a neki kriterijumi se mogu koristiti za rešavanje široke klase problema. Ovi kriterijumi su postali široko rasprostranjeni u sociologiji, ekonomiji, psihologiji, prirodne nauke itd.

    Hajde da uvedemo neke osnovne koncepte testiranja statističkih hipoteza. Testiranje hipoteze počinje nultom hipotezom H 0 , tj. neka pretpostavka istraživača, kao i konkurentna, alternativna hipoteza H 1, što je u suprotnosti sa glavnim. Na primjer: H 0: , H 1: ili H 0: , H 1: (gde a- opšti prosjek).

    Glavni cilj istraživača prilikom testiranja hipoteze je da odbaci hipotezu koju je on iznio. Kao što je napisao R. Fisher, cilj testiranja bilo koje hipoteze je da se ona odbaci. Testiranje hipoteza zasniva se na suprotnom. Dakle, ako vjerujemo da se, na primjer, prosječne plate radnika, dobijene prema podacima određenog uzorka i jednake 186 novčanih jedinica mjesečno, ne poklapaju sa stvarnim zaradama za cijelu populaciju, onda se pretpostavlja kao nultu hipotezu da su ove plate jednake.

    Konkurentna hipoteza H 1 se može formulirati na različite načine:

    H 1: , H 1: , H 1: .

    Dalje je određeno greška tipa I(a), koji postavlja vjerovatnoću da će istinita hipoteza biti odbačena. Očigledno, ova vjerovatnoća bi trebala biti mala (obično od 0,01 do 0,1, najčešće po defaultu 0,05, ili tzv. nivo značajnosti od 5%). Ovi nivoi proizilaze iz metode uzorkovanja, prema kojoj dvostruka ili trostruka greška predstavlja granice preko kojih slučajna varijacija karakteristika uzorka najčešće ne ide. Greška tipa II(b) je vjerovatnoća da će pogrešna hipoteza biti prihvaćena. Po pravilu, greška tipa I je „opasnija“; Ona je ta koja je fiksirana od strane statističara. Ako na početku studije želimo istovremeno popraviti a i b (na primjer, a = 0,05; b = 0,1), za to prvo moramo izračunati veličinu uzorka.

    Kritična zona(ili područje) je skup vrijednosti kriterija pod kojim H 0 je odbijeno. kritična tačka T kr je tačka koja odvaja područje prihvatanja hipoteze od područja odstupanja, odnosno kritične zone.

    Kao što je već spomenuto, greška tipa I (a) je vjerovatnoća odbacivanja ispravne hipoteze. Što je manje a, manja je vjerovatnoća da ćete napraviti grešku tipa I. Ali u isto vrijeme, kada se a smanji (na primjer, sa 0,05 na 0,01), teže je odbaciti nultu hipotezu, što je, zapravo, ono što istraživač sam postavlja. Još jednom naglašavamo da će daljnje smanjenje a na 0,05 i dalje zapravo dovesti do toga da će sve hipoteze, istinite i netačne, pasti u područje prihvatanja nulte hipoteze, te će onemogućiti njihovo razlikovanje. .

    Greška tipa II (b) se javlja kada se prihvati H 0 , ali u stvari je alternativna hipoteza tačna H jedan . Vrijednost g = 1 – b naziva se snaga kriterija. Greška tipa II (tj. pogrešno prihvatanje lažne hipoteze) opada sa povećanjem veličine uzorka i povećanjem nivoa značajnosti. Iz ovoga slijedi da je nemoguće istovremeno smanjiti a i b. To se postiže samo povećanjem veličine uzorka (što nije uvijek moguće).

    Najčešće se zadaci testiranja hipoteze svode na poređenje dva uzorka srednje vrijednosti ili udjela; uporediti opšti prosjek (ili udio) sa uzorkom; poređenje empirijskih i teorijskih distribucija (kriterijumi sposobnosti); poređenje dva uzorka varijanse (c 2 -kriterijum); poređenje dva koeficijenta korelacije uzorka ili koeficijenta regresije i neka druga poređenja.

    Odluka o prihvatanju ili odbijanju nulte hipoteze sastoji se u poređenju stvarne vrednosti kriterijuma sa tabelarnom (teorijskom). Ako je stvarna vrijednost manja od vrijednosti u tabeli, onda se zaključuje da je neslaganje slučajno, beznačajno i da se nulta hipoteza ne može odbaciti. Obrnuta situacija (stvarna vrijednost je veća od tabelarne) dovodi do odbacivanja nulte hipoteze.

    Prilikom provjere statističke hipoteze najčešće se koriste tablice normalne distribucije, distribucije c 2 (čitaj: hi-kvadrat), t-distribucije (Studentove raspodjele) i F-distribucije (Fisher distribucije).