STATISTIČKA PROVJERA STATISTIČ

Koncept statističke hipoteze.

Vrste hipoteza. Greške prve i druge vrste

Hipoteza- ovo je pretpostavka o nekim svojstvima proučavanih pojava. Ispod statistička hipoteza razumjeti bilo koju izjavu o opštoj populaciji koja se može provjeriti statistički, odnosno na osnovu rezultata opservacija u slučajnom uzorku. Razmatraju se dvije vrste statističkih hipoteza: hipoteze o zakonima distribucije stanovništva i hipoteze o parametrima poznate distribucije.

Dakle, hipoteza da se vrijeme utrošeno na sklapanje strojnog sklopa u grupi mašinskih radionica koje proizvode istoimene proizvode i imaju približno iste tehničko-ekonomske uslove proizvodnje raspodjeljuju po normalnom zakonu je hipoteza o zakonu distribucije. . A hipoteza da se produktivnost rada radnika u dva tima koji obavljaju isti posao pod istim uvjetima ne razlikuje (dok produktivnost rada radnika u svakom timu ima normalan zakon raspodjele) je hipoteza o parametrima distribucije.

Hipoteza koja se testira se zove null, ili osnovni, i označeno H 0 . Nul hipoteza je suprotstavljena nadmetanje ili alternativa hipoteza, koja je H jedan . Po pravilu, konkurentska hipoteza H 1 je logična negacija glavne hipoteze H 0.

Primjer Nulta hipoteza može biti sljedeće: srednje vrijednosti dvije normalno raspoređene populacije su jednake, onda se konkurentska hipoteza može sastojati od pretpostavke da srednje vrijednosti nisu jednake. Simbolično je napisano ovako:

H 0: M(X) = M(Y); H 1: M(X) M(Y) .

Ako se nulta (predložena) hipoteza odbije, onda postoji konkurentska hipoteza.

Postoje jednostavne i složene hipoteze. Ako hipoteza sadrži samo jednu pretpostavku, onda je to - jednostavno hipoteza. Kompleks hipoteza se sastoji od konačnog ili beskonačnog broja jednostavnih hipoteza.

Na primjer, hipoteza H 0: str = str 0 (nepoznata vjerovatnoća str jednaka hipotetičkoj vjerovatnoći str 0 ) je jednostavna, a hipoteza H 0: str < str 0 - složena, sastoji se od bezbroj jednostavnih hipoteza forme H 0: str = str i, gdje str i- bilo koji broj manji od str 0 .

Predložena statistička hipoteza može biti tačna ili netačna, pa je to neophodno verify na osnovu rezultata posmatranja u slučajnom uzorku; vrši se verifikacija statistički metode, pa se zove statistička.

Prilikom testiranja statističke hipoteze koristi se posebno sastavljena slučajna varijabla tzv statistički kriterijum(ili statistika). Prihvaćeni zaključak o ispravnosti (ili netačnosti) hipoteze zasniva se na proučavanju distribucije ovog slučajna varijabla prema podacima uzorka. Stoga je statističko testiranje hipoteza po prirodi vjerovatnoće: uvijek postoji rizik od greške pri prihvatanju (odbacivanju) hipoteze. U ovom slučaju moguće su greške dvije vrste.

Greška tipa I je da će nulta hipoteza biti odbačena iako je u stvari tačna.

Greška tipa II je da će nulta hipoteza biti prihvaćena, iako je konkurentska u stvari tačna.

U većini slučajeva, posljedice ovih grešaka su nejednake. Što je bolje ili lošije ovisi o specifičnoj formulaciji problema i sadržaju nulte hipoteze. Razmotrite primjere. Pretpostavimo da se u preduzeću kvalitet proizvoda ocenjuje na osnovu rezultata selektivne kontrole. Ako frakcija uzorka braka ne prelazi unaprijed određenu vrijednost str 0 , tada je serija prihvaćena. Drugim riječima, postavlja se nulta hipoteza: H 0: str str 0 . Ako se napravi greška tipa I u testiranju ove hipoteze, odbacićemo dobar proizvod. Ako se napravi greška druge vrste, onda će odbijenica biti poslana potrošaču. Očigledno, posljedice greške tipa II mogu biti mnogo ozbiljnije.

Drugi primjer se može dati iz oblasti jurisprudencije. Rad sudija ćemo smatrati radnjama za provjeru pretpostavke nevinosti okrivljenog. Glavna hipoteza koju treba testirati je hipoteza H 0 : okrivljeni je nevin. Zatim alternativna hipoteza H 1 je hipoteza: optuženi je kriv za zločin. Očigledno je da sud može napraviti greške prve ili druge vrste prilikom odmjeravanja kazne okrivljenom. Ako je učinjena greška prve vrste, onda to znači da je sud kaznio nevinog: optuženi je osuđen iako u stvari nije počinio krivično delo. Ako su sudije napravile grešku druge vrste, onda to znači da je sud doneo presudu da nije kriv, a zapravo je optuženi kriv za krivično delo. Očigledno je da će posljedice greške prve vrste za optuženog biti mnogo teže, dok su za društvo najopasnije posljedice greške druge vrste.

Vjerovatnoća počiniti greška prva vrsta pozvao nivo značajnosti kriterijuma i označiti .

U većini slučajeva, nivo značajnosti kriterijuma se uzima jednak 0,01 ili 0,05. Ako se, na primjer, nivo značajnosti uzme jednak 0,01, to znači da u jednom od stotinu slučajeva postoji rizik od greške tipa I (odnosno, odbacivanja ispravne nulte hipoteze).

Vjerovatnoća počiniti greška tipa II označiti . Vjerovatnoća
ne napraviti grešku tipa II, odnosno odbaciti nultu hipotezu kada je netačna, naziva se moć kriterijuma.

Statistički kriterijum.

Kritična područja

Statistička hipoteza se testira pomoću posebno odabrane slučajne varijable čija je točna ili približna distribucija poznata (označavamo je To). Ova slučajna varijabla se zove statistički kriterijum(ili jednostavno kriterijum).

U praksi se koriste različiti statistički kriterijumi: U- i Z-kriterijumi (ove slučajne varijable imaju normalnu distribuciju); F-kriterijum (slučajna varijabla se distribuira prema Fisher-Snedekorovom zakonu); t-kriterijum (prema Studentovom zakonu); -kriterijum (prema zakonu "hi-kvadrat") itd.

Skup svih mogućih vrijednosti kriterija može se podijeliti na dva podskupa koja se ne preklapaju: jedan od njih sadrži vrijednosti kriterija pod kojim je nulta hipoteza prihvaćena, a drugi - pod kojim se odbacuje.

Poziva se skup vrijednosti testa pod kojim se nulta hipoteza odbacuje kritično područje. Kritično područje ćemo označiti sa W.

Poziva se skup vrijednosti kriterija pod kojim se prihvata nulta hipoteza područje prihvatanja hipoteze(ili raspon prihvatljivih vrijednosti kriterija). Ovu oblast ćemo pozvati kao .

Da bismo provjerili valjanost nulte hipoteze, prema podacima uzorka, izračunavamo uočena vrijednost kriterija. Mi ćemo ga označiti To obs.

Osnovni princip testiranja statističkih hipoteza može se formulisati na sledeći način: ako je posmatrana vrednost kriterijuma pala u kritično područje (tj.
), tada se nulta hipoteza odbacuje; ako je uočena vrijednost kriterija pala u područje prihvatanja hipoteze (tj.
), onda nema razloga za odbacivanje nulte hipoteze.

Koje principe treba slijediti prilikom izgradnje kritične regije W ?

Pretpostavimo da je hipoteza H 0 je zapravo istina. Zatim ispunjavanje kriterijuma
u kritično područje, na osnovu osnovnog principa testiranja statističkih hipoteza, podrazumijeva odbacivanje ispravne hipoteze H 0 , što znači napraviti grešku tipa I. Dakle, vjerovatnoća udarca
regionu W ako je hipoteza tačna H 0 treba da bude jednak nivou značajnosti kriterijuma, tj.

.

Imajte na umu da je vjerovatnoća pravljenja greške tipa I odabrana da bude dovoljno mala (po pravilu,
). Zatim ispunjavanje kriterijuma
do kritičnog područja W ako je hipoteza tačna H 0 može se smatrati gotovo nemogućim događajem. Ako je, prema podacima uzorkovanja, događaj
ipak se dogodilo, onda se može smatrati nekompatibilnim s hipotezom H 0 (koji se kao rezultat odbija), ali kompatibilan sa hipotezom H 1 (što je na kraju prihvaćeno).

Pretpostavimo sada da je hipoteza tačna H 1 . Zatim ispunjavanje kriterijuma
u područje prihvatanja hipoteze dovodi do usvajanja pogrešne hipoteze H 0 što znači činjenje greške tipa II. Zbog toga
.

Od događaja
i
su međusobno suprotne, onda je vjerovatnoća dostizanja kriterija
do kritičnog područja Wće biti jednaka snazi ​​kriterija ako je hipoteza H 1 istina, tj

.

Očigledno, kritično područje treba izabrati tako da, na datom nivou značaja, moć kriterija
bila maksimalna. Maksimiziranje snage testa će osigurati minimalnu vjerovatnoću pravljenja greške tipa II.

Treba napomenuti da koliko god bila mala vrednost nivoa značajnosti, kriterijum koji spada u kritično područje je samo malo verovatan, ali ne i apsolutno nemoguć događaj. Stoga je moguće da će s istinitom nultom hipotezom vrijednost kriterija izračunata iz podataka uzorka i dalje biti u kritičnom području. Odbijanje hipoteze u ovom slučaju H 0 , pravimo grešku tipa I sa vjerovatnoćom . Što je manji, manja je vjerovatnoća da ćete napraviti grešku tipa I. Međutim, sa smanjenjem, kritično područje se smanjuje, što znači da postaje manje moguće da posmatrana vrijednost padne u njega. To obs, čak i kada je hipoteza H 0 je pogrešno. Kod =0 hipoteza H 0 uvijek će biti prihvaćeno bez obzira na rezultate uzorka. Dakle, smanjenje podrazumeva povećanje verovatnoće prihvatanja netačne nulte hipoteze, odnosno pravljenja greške tipa II. U tom smislu se nadmeću greške prve i druge vrste.

Kako je nemoguće isključiti greške prve i druge vrste, potrebno je barem u svakom konkretnom slučaju nastojati da se gubici od ovih grešaka minimiziraju. Naravno, poželjno je smanjiti obje greške istovremeno, ali pošto se one takmiče, smanjenje vjerovatnoće da se napravi jedna od njih dovodi do povećanja vjerovatnoće da se napravi druga. Jedini način simultano smanjiti rizik od greške leži u povećanje veličine uzorka.

Ovisno o vrsti konkurentske hipoteze H 1 grade jednostrano (desno i lijevo) i dvostrano kritične regije. Tačke koje razdvajaju kritični region
iz oblasti prihvatanja hipoteze , zvao kritične tačke i označiti k Crete. Za pronalaženje kritične regije morate znati kritične tačke.

desna ruka kritično područje se može opisati nejednakošću
To>k Crete. pr, pri čemu se pretpostavlja da je desna kritična tačka k Crete. pr >0. Takav region se sastoji od tačaka koje se nalaze na desnoj strani kritične tačke k Crete. pr, odnosno sadrži skup pozitivnih i dovoljno velikih vrijednosti kriterija TO. Za pronalaženje k Crete. pr postavi prvo nivo značajnosti kriterijuma. Dalje desno kritična tačka k Crete. pr se nalazi iz uslova . Zašto baš ovaj zahtjev definira kritičnu regiju desnog dijela? Budući da je vjerovatnoća događaja (TO>k Crete. itd ) je mala, onda, zbog principa praktične nemogućnosti malo verovatnih događaja, ovaj događaj ne bi trebalo da se dogodi ako je nulta hipoteza tačna u jednom testu. Ako je ipak došlo, odnosno do uočene vrijednosti kriterija izračunate iz podataka uzoraka
pokazalo se više k Crete. pr, ovo se može objasniti činjenicom da nulta hipoteza nije u skladu sa podacima opservacije i stoga je treba odbaciti. Dakle, zahtjev
određuje takve vrijednosti kriterija pod kojima se nulta hipoteza odbacuje, a one čine desnu kritičnu regiju.

Ako
pao u raspon prihvatljivih vrijednosti kriterija , to je
< k Crete. pr, onda se glavna hipoteza ne odbacuje, jer je kompatibilna sa podacima opservacije. Imajte na umu da je vjerovatnoća dostizanja kriterija
u rasponu prihvatljivih vrijednosti ako je nulta hipoteza tačna, jednaka je (1-) i blizu 1.

Mora se imati na umu da je pogodak kriterija vrijednosti
u rasponu prihvatljivih vrijednosti nije rigorozan dokaz valjanosti nulte hipoteze. To samo ukazuje da ne postoji značajna neslaganja između predložene hipoteze i rezultata uzorka. Stoga u takvim slučajevima kažemo da su podaci opservacije u skladu sa nultom hipotezom i da nema razloga da je odbacimo.

Slično su konstruisana i druga kritična područja.

dakle, llijevo kritično područje je opisano nejednakošću
To<k Crete. l, gde k crit.l<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k crit.l, odnosno skup negativnih, ali dovoljno velikih modulo vrijednosti kriterija. kritična tačka k crit.l se nalazi iz uslova
(To<k Crete. l)
, odnosno vjerovatnoća da kriterij ima vrijednost manju od k crit.l, jednak je prihvaćenom nivou značajnosti ako je nulta hipoteza tačna.

bilateralni kritično područje
je opisan sljedećim nejednačinama: ( To< k crit.l ili To>k Crete. pr), gdje se pretpostavlja da k crit.l<0 и k Crete. pr >0. Takvo područje je skup dovoljno velikih modulo vrijednosti kriterija. Kritične tačke se nalaze iz zahteva: suma verovatnoća da će kriterijum poprimiti vrednost manju od k Crete. l ili više k Crete. pr, treba da bude jednak prihvaćenom nivou značajnosti ako je nulta hipoteza tačna, tj.

(TO< k Crete. l )+
(TO>k Crete. itd )= .

Ako je distribucija kriterija To simetrično oko ishodišta, tada će kritične tačke biti locirane simetrično oko nule, dakle k Crete. l = - k Crete. itd. Tada dvostrano kritično područje postaje simetrično i može se opisati sljedećom nejednakošću: > k Crete. dw, gdje k Crete. dw = k Crete. pr Kritična tačka k Crete. dw se može naći iz uslova

P(K< -k Crete. dv )=P(K>k Crete. dv )= .

Napomena 1. Za svaki kriterijum To kritične tačke na datom nivou značaja
može se naći iz stanja
samo brojčano. Rezultati numeričkih proračuna k crit su dati u odgovarajućim tabelama (vidi, na primjer, dodatak 4 - 6 u datoteci "Prilozi").

Napomena 2. Gore opisani princip testiranja statističke hipoteze još ne dokazuje njenu istinitost ili neistinu. Prihvatanje hipoteze H 0 uporedio sa alternativnom hipotezom H 1 ne znači da smo sigurni u apsolutnu ispravnost hipoteze H 0 - samo hipoteza H 0 slaže se sa opservacijskim podacima koje imamo, to jest, to je prilično uvjerljiva izjava koja nije u suprotnosti sa iskustvom. Moguće je da s povećanjem veličine uzorka n hipoteza H 0 će biti odbijena.

5. Glavni problemi primijenjene statistike - opis podataka, procjena i testiranje hipoteza

Ključni koncepti koji se koriste u testiranju hipoteza

Statistička hipoteza - svaka pretpostavka koja se tiče nepoznate distribucije slučajnih varijabli (elemenata). Evo formulacija nekoliko statističkih hipoteza:

1. Rezultati opservacija imaju normalnu distribuciju sa nultim matematičkim očekivanjem.
2. Rezultati promatranja imaju funkciju distribucije N(0,1).
3. Rezultati posmatranja imaju normalnu distribuciju.
4. Rezultati posmatranja u dva nezavisna uzorka imaju istu normalnu distribuciju.
5. Rezultati opservacija u dva nezavisna uzorka imaju istu distribuciju.

Postoje nulte i alternativne hipoteze. Nul hipoteza je hipoteza koja se testira. Alternativna hipoteza je svaka važeća hipoteza osim nulte hipoteze. Nul hipoteza je H 0 , alternativa - H 1(od Hipoteza - “hipoteza” (engleski)).

Izbor jedne ili druge nulte ili alternativne hipoteze određen je primijenjenim zadacima pred menadžerom, ekonomistom, inženjerom, istraživačem. Razmotrite primjere.

Primjer 11. Neka je nulta hipoteza hipoteza 2 sa gornje liste, a alternativna hipoteza 1. To znači da je stvarna situacija opisana probabilističkim modelom, prema kojem se rezultati posmatranja smatraju realizacijom nezavisnih identično raspoređenih slučajnih varijabli sa funkcijom distribucije N(0,σ), pri čemu je parametar σ statističaru nepoznat. U ovom modelu, nulta hipoteza se piše na sljedeći način:

H 0: σ = 1,

i ovakva alternativa:

H 1: σ ≠ 1.

Primjer 12. Neka je nulta hipoteza i dalje hipoteza 2 sa gornje liste, a alternativna hipoteza hipoteza 3 sa iste liste. Zatim, u probabilističkom modelu menadžerske, ekonomske ili proizvodne situacije, pretpostavlja se da rezultati promatranja čine uzorak iz normalne distribucije N(m, σ) za neke vrijednosti m i σ. Hipoteze se pišu ovako:

H 0: m= 0, σ = 1

(oba parametra imaju fiksne vrijednosti);

H 1: m≠ 0 i/ili σ ≠ 1

(tj. bilo m≠ 0, ili σ ≠ 1, ili oboje m≠ 0 i σ ≠ 1).

Primjer 13 Neka H 0 je hipoteza 1 sa gornje liste, i H 1 - hipoteza 3 sa iste liste. Tada je probabilistički model isti kao u primjeru 12,

H 0: m= 0, σ je proizvoljan;

H 1: m≠ 0, σ je proizvoljan.

Primjer 14 Neka H 0 je hipoteza 2 sa gornje liste, a prema H 1 rezultati opservacije imaju funkciju distribucije F(x), ne odgovara standardnoj funkciji normalne distribucije F(x). Onda

H 0: F(x) = F(x) za sve X(napisano kao F(x) ≡ F(x));

H 1: F(x 0) ≠ F (x 0) kod nekih x 0(tj. nije tačno da F(x) ≡ F(x)).

Bilješka. Ovdje ≡ je znak identične podudarnosti funkcija (tj. podudarnosti za sve moguće vrijednosti argumenta X).

Primjer 15 Neka H 0 je hipoteza 3 sa gornje liste, a prema H 1 rezultati opservacije imaju funkciju distribucije F(x), ne biti normalan. Onda

Za neke m, σ;

H 1: za bilo koje m, σ postoji x 0 = x 0(m, σ) takav da .

Primjer 16 Neka H 0 - hipoteza 4 sa gornje liste, prema probabilističkom modelu, dva uzorka su izvučena iz populacija sa funkcijama distribucije F(x) i G(x), koji su normalni sa parametrima m 1 , σ 1 i m 2 , σ 2 respektivno, i H 1 - negacija H 0 . Onda

H 0: m 1 = m 2 , σ 1 = σ 2 , i m 1 i σ 1 su proizvoljni;

H 1: m 1 ≠ m 2 i/ili σ 1 ≠ σ 2 .

Primjer 17. Neka je, pod uslovima iz primjera 16, dodatno poznato da je σ 1 = σ 2 . Onda

H 0: m 1 = m 2 , σ > 0, i m 1 i σ su proizvoljni;

H 1: m 1 ≠ m 2 , σ > 0.

Primjer 18. Neka H 0 - hipoteza 5 sa gornje liste, prema probabilističkom modelu, dva uzorka su izvučena iz populacija sa funkcijama distribucije F(x) i G(x) odnosno, i H 1 - negacija H 0 . Onda

H 0: F(x) G(x) , gdje F(x)

H 1: F(x) i G(x) su proizvoljne funkcije raspodjele, i

F(x) G(x) sa nekima X.

Primjer 19. Neka se u uslovima primjera 17 dodatno pretpostavlja da distribucijske funkcije F(x) i G(x) razlikuju se samo u pomaku, tj. G(x) = F(x- a) kod nekih a. Onda

H 0: F(x) G(x) ,

gdje F(x) je proizvoljna funkcija distribucije;

H 1: G(x) = F(x- a), a ≠ 0,

gdje F(x) je proizvoljna funkcija distribucije.

Primjer 20. Neka se u uslovima primera 14 dodatno zna da je prema verovatnom modelu situacije F(x) je normalna funkcija raspodjele s jediničnom varijansom, tj. ima oblik N(m, jedan). Onda

H 0: m = 0 (oni. F(x) = F(x)

za sve X); (napisano kao F(x) ≡ F(x));

H 1: m 0

(tj. nije tačno da F(x) ≡ F(x)).

Primjer 21. U statističkom regulisanju tehnoloških, ekonomskih, upravljačkih ili drugih procesa uzorak se uzima iz agregata sa normalna distribucija i poznate varijanse i hipoteze

H 0: m = m 0 ,

H 1: m= m 1 ,

gdje je vrijednost parametra m = m 0 odgovara utvrđenom toku procesa, a prelazak na m= m 1 ukazuje na kvar.

Primjer 22. Sa statističkom kontrolom prihvatljivosti, broj neispravnih jedinica proizvoda u uzorku podliježe hipergeometrijskoj distribuciji, nepoznati parametar je str = D/ N je nivo defekta, gdje N- zapreminu serije proizvoda, Dukupan broj neispravne stavke u seriji. Koristeći se u regulatornoj, tehničkoj i komercijalnoj dokumentaciji (standardi, ugovori o nabavci, itd.), planovi kontrole često imaju za cilj testiranje hipoteze

H 0: str < AQL

H 1: str > LQ,

gdje AQL – nivo prihvatanja kvara, LQ je nivo neispravnosti defekata (očigledno, AQL < LQ).

Primjer 23. Kao pokazatelji stabilnosti tehnološkog, ekonomskog, menadžerskog ili drugog procesa koriste se brojne karakteristike distribucija kontrolisanih indikatora, a posebno koeficijent varijacije v = σ/ M(X). Treba testirati nultu hipotezu

H 0: v < v 0

pod alternativnom hipotezom

H 1: v > v 0 ,

gdje v 0 je neka unaprijed određena granična vrijednost.

Primjer 24. Neka je probabilistički model dva uzorka isti kao u primjeru 18, označimo matematička očekivanja rezultata posmatranja u prvom i drugom uzorku M(X) i M(At) odnosno. U nekim situacijama se testira nulta hipoteza

H 0: M(X) = M(Y)

protiv alternativne hipoteze

H 1: M(X) ≠ M(Y).

Primjer 25. Gore je navedeno veliki značaj u matematičkoj statistici funkcija distribucije simetrične u odnosu na 0, prilikom provjere simetrije

H 0: F(- x) = 1 – F(x) za sve x, inače F proizvoljno;

H 1: F(- x 0 ) ≠ 1 – F(x 0 ) kod nekih x 0 , inače F proizvoljno.

U probabilističko-statističkim metodama odlučivanja koriste se i mnoge druge formulacije problema za testiranje statističkih hipoteza. Neki od njih su razmatrani u nastavku.

Specifičan zadatak testiranja statističke hipoteze je u potpunosti opisan ako se daju nulta i alternativna hipoteza. Izbor metode za testiranje statističke hipoteze, svojstva i karakteristike metoda određuju se i nultom i alternativnom hipotezom. Za testiranje iste nulte hipoteze pod različitim alternativnim hipotezama, općenito govoreći, treba koristiti različite metode. Dakle, u primjerima 14 i 20 nulta hipoteza je ista, dok su alternativne različite. Stoga u uslovima primera 14 treba koristiti metode zasnovane na kriterijumima uklapanja sa parametarskom familijom (tip Kolmogorov ili tip omega kvadrata), a u uslovima primera 20 metode zasnovane na Studentovom testu ili Cramer-Welch testu. Ako se u uslovima iz primjera 14 koristi Studentov kriterij, onda on neće riješiti postavljene zadatke. Ako, u uslovima primjera 20, koristimo test ispravnosti tipa Kolmogorov, onda će, naprotiv, riješiti postavljene zadatke, iako, možda, lošije od Studentovog kriterija posebno prilagođenog za ovaj slučaj.

Prilikom obrade stvarnih podataka od velike je važnosti ispravan izbor hipoteza. H 0 i H jedan . Pretpostavke, kao što je normalnost distribucije, moraju biti pažljivo opravdane, posebno statističkim metodama. Imajte na umu da se u velikoj većini specifičnih primijenjenih postavki distribucija rezultata posmatranja razlikuje od normalne.

Često se javlja situacija kada oblik nulte hipoteze proizilazi iz formulacije primijenjenog problema, a oblik alternativne hipoteze nije jasan. U takvim slučajevima treba razmotriti alternativnu hipotezu. opšti pogled i koristiti metode koje rješavaju problem za sve moguće H jedan . Konkretno, kada se hipoteza 2 (sa gornje liste) testira kao null, treba koristiti kao alternativnu hipotezu H 1 iz primjera 14, a ne iz primjera 20, ako ne postoje posebna opravdanja za normalnost distribucije rezultata opservacija pod alternativnom hipotezom.

Prethodno

Budući da se statistika kao istraživačka metoda bavi podacima u kojima su obrasci od interesa za istraživača iskrivljeni različitim slučajnim faktorima, većina statističkih proračuna je praćena testiranjem nekih pretpostavki ili hipoteza o izvoru ovih podataka.

Pedagoška hipoteza (naučna hipoteza o prednostima jedne ili druge metode) u procesu Statistička analiza prevedeno na jezik statističke nauke i preformulisano u najmanje dve statističke hipoteze.

Postoje dvije vrste hipoteza: prva vrsta - deskriptivan hipoteze koje opisuju uzroke i moguće posljedice. Druga vrsta - objašnjavajuće : daju objašnjenje mogućih posledica određenih uzroka, a takođe karakterišu uslove pod kojima će te posledice nužno uslediti, odnosno objašnjava se na osnovu kojih faktora i uslova će ta posledica biti. Deskriptivne hipoteze nemaju predviđanje, dok eksplanatorne hipoteze imaju. Eksplanatorne hipoteze navode istraživače da pretpostave postojanje određenih pravilnih odnosa između pojava, faktora i stanja.

Hipoteze u pedagoškom istraživanju mogu sugerisati da će jedno od sredstava (ili grupa njih) biti efikasnije od drugih sredstava. Ovdje se postavlja hipotetička pretpostavka o komparativnoj djelotvornosti sredstava, metoda, metoda, oblika obrazovanja.

Viši nivo hipotetičkog predviđanja je da autor studije pretpostavlja da će neki sistem mjera biti ne samo bolji od drugog, već se među nizom mogućih sistema čini optimalnim u smislu određenih kriterija. Za takvu pretpostavku je potreban rigorozniji i stoga detaljniji dokaz.

Kulaichev A.P. Metode i alati za analizu podataka u Windows okruženju. Ed. 3., revidirano. i dodatne - M: InKo, 1999, str. 129-131

Psihološko-pedagoški rečnik za nastavnike i rukovodioce obrazovnih ustanova. - Rostov-n / D: Phoenix, 1998, str

Kao rezultat proučavanja ovog poglavlja, student treba da:

znam

  • šta je statistička hipoteza;
  • omjer teorijskih, eksperimentalnih i statističkih hipoteza;
  • razlike između nulte i alternativnih hipoteza;
  • logika vrednovanja, prihvatanja i odbacivanja statističkih hipoteza;
  • pojmovi grešaka prve i druge vrste, statistički značaj(pouzdanost);
  • razlike između parametarske i neparametarske statistike, mogućnosti i ograničenja ova dva tipa statističkih testova;

biti u mogućnosti

  • testirati najjednostavnije hipoteze o korištenju srednje vrijednosti t - Studentov test za uparene (povezane) i nesparene (nezavisne) uzorke;
  • procijeniti homogenost dva uzorka koristeći t - Učenički test i F - Fišerov test;
  • izgraditi intervale pouzdanosti za procijenjene parametre;

vlastiti

  • metodološka aparatura i osnovne vještine za predlaganje i testiranje statističkih hipoteza;
  • vještine procjene statističkih hipoteza i konstruiranja intervala povjerenja.

Opća strategija

Već znate da je u statističkoj analizi uobičajeno praviti razliku između pojmova "parametar" i "statistika". Ove razlike su detaljno razmotrene u Pogl. jedan; u tabeli. 2.1 rezimira diskusiju koja je održana.

Podsjetimo da se svaka distribucija može okarakterizirati određenim teorijskim parametrima. Matematičko očekivanje, varijansa, asimetrija, kurtozis su primjeri takvih parametara distribucije slučajne varijable u općoj populaciji. Sve su one, još jednom napominjemo ovu važnu činjenicu, teorijske veličine koje se u praksi gotovo nikada ne poznaju. U praktičnoj aktivnosti istraživača, one se mogu samo procijeniti s različitim stupnjevima tačnosti računanjem različitih statistika, koji nisu uvijek jednaki teorijskim vrijednostima parametara, kao i jedni drugima, kao što smo već vidjeli u paragrafu 1.4, s obzirom na praktične primjere procjene različitih parametara distribucije takve osobine ličnosti kao što je ženstvenost - muškosti.

Tabela 2.1

Odnos između parametara i statistike

I to nije iznenađujuće: na kraju krajeva, statistika odražava ponašanje slučajnih varijabli samo u uzorku koji je formirao eksperimentator, a ne u samoj populaciji. Stoga se eksperimentator može zapitati kako izračunata statistika korelira sa teorijskim parametrima distribucije. Drugim riječima, eksperimentatora može zanimati da li su podaci uzorka koji su mu na raspolaganju zapravo izvučeni iz opće populacije koju karakteriziraju parametri distribucije pretpostavljeni u teoriji. Da bi odgovorio na ovo pitanje, eksperimentator postavlja i testira statističke hipoteze.

Statističke hipoteze nazivaju se pretpostavkama o mogućim vrijednostima parametara distribucije slučajne varijable u općoj populaciji. Testiranje i analiza statističkih hipoteza vrši se kao rezultat prikupljanja i konstruisanja statistike. Alati za ovaj rad su statistički testovi, ili kriterijuma od kojih je svaki neki skup standardiziranih pravila. Na osnovu ovih pravila donosi se odluka o istinitosti ili netačnosti statističke hipoteze.

Razmotrite ponovo primjer bacanja novčića. Može se pretpostaviti da je vjerovatnoća pada "glava" prilikom bacanja normalnog, nelažnog i neoštećenog novčića 50%. To znači da očekivanu vrijednost takav događaj sa 100-strukim bacanjem novčića će biti jednak 50. Test ove hipoteze će se sastojati od sprovođenja sličnog testa, procene parametra od interesa za nas kao rezultat izračunavanjem odgovarajuće statistike i korišćenja ove statistike za testirati pouzdanost postavljene hipoteze. Na primjer, izvođenjem 100 pokušaja na novčiću, možemo potvrditi da se svaka strana zapravo pojavila 50 puta. Međutim, vjerovatno je da će rezultat takvog testa ipak biti nešto drugačiji od teorijski očekivanog. Drugim riječima, čak i ako se glave pojave nešto manje ili nešto više od 50 puta, malo je vjerovatno da ćemo imati razloga vjerovati da je novčić krivotvoren. Situacija će biti sumnjiva kada takvo odstupanje od teoretski očekivanih vrijednosti dostigne veće vrijednosti, na primjer, kada "orao" ne padne niti jednom u 100 pokušaja novčića. Takav aranžman se čini malo vjerojatnim, s obzirom da je s novčićem sve u redu.

Dakle, jasno je da ako je u toku 100-strukog bacanja novčića "orao" ispao tačno 50 puta, sve je u redu sa novčićem. Ako "orao" nikada nije ispao, postoji razlog za vjerovanje da nešto nije u redu s novčićem. Ali gdje je granica koja razdvaja pozitivne i negativne zaključke? Ovo pitanje se odnosi na izabrani kriterijum odluke. Upravo su ovi kriterijumi razvijeni u matematičkoj statistici za testiranje statističkih hipoteza, statističkih testova, koji se stoga često nazivaju statističkim kriterijumima.

Dakle, testiranje statističkih hipoteza se vrši kao rezultat procjene vjerovatnoće slučajni događaj, što se smatra vrijednošću statistike. Ako se ova vjerovatnoća pokaže kao vrlo mala pod uslovom da je predložena hipoteza tačna, statistička hipoteza koja se testira se odbacuje, u suprotnom hipoteza se prihvata.

Teškoća ovog postupka, međutim, može biti u činjenici da možda ne znamo unaprijed specifičnu vrijednost parametra distribucije analizirane slučajne varijable. Na primjer, u slučaju novčića, može se pretpostaviti da je novčić krivotvoren, pa se vjerovatnoća pada glava manje-više razlikuje od 50%. U ovom slučaju, nakon sprovođenja serije testova, nećemo moći da procenimo stepen razlike između dobijene statistike, koja karakteriše vrednost matematičkog očekivanja analiziranog događaja, i njegove stvarne vrednosti. A onda testiranje statističke hipoteze može izgledati nemoguće. Izlaz iz ove situacije, međutim, može biti procjena vjerovatnoće hipoteze suprotne od one koja je iznesena. Drugim riječima, u ovom slučaju moguće je, na primjer, postaviti hipotezu o jednakosti teorijske vjerovatnoće od 50%. Ako se ispostavi da je ova hipoteza netačna, prihvata se alternativna hipoteza.

Zaista, prilikom testiranja statističkih hipoteza, istraživač se uvijek bavi ne jednom, već dvije hipoteze, koje se označavaju kao H 0 i H 1. Jedna od ovih hipoteza se naziva nultom, a druga alternativna, tj. opovrgavanje nule.

Nulta hipoteza H 0 je uvijek specifično. Uvijek potvrđuje neku specifičnu vrijednost parametra distribucije. Na primjer, hipoteza očekivanja može se formulirati na sljedeći način: μ = ALI, gdje ALI je neka specifična vrijednost μ, a hipoteza o jednakosti dvije veličine varijanse je σ1 = σ2.

Alternativna hipoteza H 1 je uvijek manje konkretno formulisan, na primjer: μ > ALI ; * σ2 itd. Ali, po pravilu, ispada da eksperimentatora ne zanima određena nulta hipoteza H 0, ali samo manje specifična alternativna hipoteza H 1, budući da je to ono što je više u skladu sa naučnom hipotezom koju je testirao u eksperimentu.

Provodeći empirijsku procjenu teorijskog parametra, eksperimentator utvrđuje statističku značajnost dobivenog rezultata, uzimajući kao osnovu pretpostavku istinitosti H 0. Statistička značajnost je vjerovatnoća da ćemo u beskonačnom broju eksperimenata koji u potpunosti reproduciraju uslove eksperimenta dobiti istu ili čak veću vrijednost konstruisane statistike. Ako se vjerojatnost da se dobije ovakva, pa čak i veća statistika u beskonačnom broju eksperimenata s istim uvjetima, s obzirom da je nulta hipoteza tačna, pokaže mala, eksperimentator napušta nultu hipotezu u korist alternativne.

Vizuelno opisana logika prikazana je na Sl. 2.1. Ovdje se očito postavljaju dvije alternativne hipoteze. Jedan od njih je specifičan i pretpostavlja da je matematičko očekivanje jednako nuli. Ova hipoteza je označena H 0. Kriva koja joj odgovara opisuje distribuciju slučajne varijable Z predviđenu ovom hipotezom. Druga hipoteza, označena kao H 1 je manje specifičan. Samo kaže da vrijednost matematičkog očekivanja mora biti veća od nule. U principu, postoji beskonačan broj krivulja koje opisuju distribucije koje odgovaraju ovoj hipotezi. Prikazana kriva je jedna od mogućih. Vrijednost Ζ exp karakterizira vrijednost statistike koja procjenjuje teorijski parametar μ u eksperimentu. To je ono što eksperimentator ima na raspolaganju, ono što je mogao dobiti prikupljanjem empirijskih podataka. Na primjer, to može biti vrijednost aritmetičke sredine za uzorak. Tada bi se provjera iznesenih statističkih hipoteza trebala sastojati u pokušaju procjene kolika je vjerovatnoća da će se u drugom sličnom eksperimentu dobiti ista vrijednost Zexp ili čak više ako je nulta hipoteza tačna. Očigledno, ova vjerovatnoća je jednaka površini ispod krive raspodjele koju pretpostavlja ova hipoteza. Ovo područje s lijeve strane ograničeno je izračunatom statistikom, s desne strane nije ograničeno. Takvo područje, kao što se sjećamo (vidi paragraf 1.2), naziva se kvantil distribucije. Može se definirati ovako:

Rice. 2.1.

Količina kvantila potrebna za prihvaćanje ili odbacivanje hipoteze R u ovoj jednačini je tzv nivo značajnosti izračunata statistika Zexp. Što je ova vrijednost veća, to je vjerojatnije da će podaci dobiveni u eksperimentu biti opisani distribucijom f ho( Z ), tj. distribucija predviđena hipotezom H 0. Naprotiv, što je manja vrijednost R, manja je vjerovatnoća da empirijski podaci zaista odgovaraju distribuciji f H0(Z), a što je vjerovatnije da su opisani distribucijom koja pretpostavlja veću vrijednost μ. Dakle, evaluacija vrijednosti R, može se donijeti odluka u korist jedne od dvije postavljene hipoteze.

Hipoteza H 0 se može prihvatiti ako je vrijednost kvantila koja određuje statističku značajnost empirijske vrijednosti x, čini se da je dovoljno velika. Alternativna hipoteza H 1 se prihvata ako se vrijednost kvantila, koja određuje statističku značajnost rezultata dobivenog u eksperimentu, pokaže zanemarljivo malom. Problem je, međutim, koju vrijednost kvantila, koji određuje statističku značajnost, treba smatrati dovoljno velikom, a koju zanemarljivo malom. Da bismo riješili ovaj problem, pogledajmo pobliže koje mogućnosti eksperimentator ima pri procjeni statističkih hipoteza (Tabela 2.2).

Jasno je da iznesene statističke hipoteze mogu biti ili tačne ili netačne. Od hipoteza H 0 i H 1 su alternativni, tj. isključuju jedan drugog, postoje samo dva hipotetička slučaja koji karakteriziraju istinitost ili netačnost hipoteza koje se razmatraju: ili H 0 će biti tačno, i H 1 odnosno netačan, ili obrnuto. Budući da eksperimentator koji procjenjuje hipoteze nikada ne zna koja je od hipoteza tačna, sto odluka da prihvati ili odbije hipotezu H 0 nema nikakve veze s njegovom istinom ili neistinom - uostalom, upravo to on pokušava utvrditi. Dakle, u toku testiranja statističkih hipoteza postoje četiri moguća ishoda, od kojih se samo dva mogu smatrati povoljnima za eksperimentatora, bez obzira koju hipotezu istraživač zapravo želi da dokaže.

Tabela 2.2

Matrica ishoda u evaluaciji statističkih hipoteza

Ako hipoteza H 0 je tačan i prihvaćen kao rezultat statističke analize, eksperimentator ne pravi grešku. A to je povoljan ishod za istraživača, čak i ako želi da prihvati alternativnu hipotezu. Također, eksperimentator ne griješi kada odbaci hipotezu. H 0, što je zapravo netačno. Međutim, može se dogoditi da je nulta hipoteza zapravo tačna, ali je eksperimentator ipak odbacuje. U ovom slučaju pravi grešku, što se obično naziva otkucajte jednu grešku ili α( alfa )- greška. Greška tipa II ili β( beta )- greška Ishodom se naziva ishod u kojem eksperimentator prihvata nultu hipotezu, koja se u stvari ispostavi da je lažna.

Jasno je da što je veća vjerovatnoća koja određuje statističku značajnost rezultata dobijenog u eksperimentu, pri kojem je eksperimentator spreman da napusti nultu hipotezu u korist alternativne, to je veća vjerovatnoća greške tipa I i smanjiti vjerovatnoću greške tipa II (slika 2.2). Naprotiv, smanjenjem vrijednosti vjerovatnoće pri kojoj eksperimentator odbacuje nultu hipotezu, on time rizikuje da napravi grešku tipa II s većom vjerovatnoćom, ali se time u većoj mjeri štiti od greške tipa I. Dakle, postavlja se pitanje na kom nivou je ta hipoteza značajna H 0 se može odbaciti ili prihvatiti, zapravo se odnosi na to koja je od dvije moguće greške manje važna za eksperimentatora. Primjenom konzervativnije strategije za testiranje statističke hipoteze, eksperimentator zanemaruje opasnost od greške tipa II. Primjenjujući radikalniju verziju radnje, eksperimentator, takoreći, zaboravlja na pogrešku prve vrste.

Rice. 2.2.

Ako prihvatanje statističke hipoteze implicira neke važne društvene posljedice, može se primijeniti konzervativnija strategija za njenu evaluaciju. Ako bi zbog neprihvatanja statističke hipoteze mogle proizaći ozbiljne posljedice, može se postupiti manje konzervativno.

Na primjer, neka se razmotri pitanje utvrđivanja mentalne retardacije određenog djeteta. Psihološkim pregledom utvrđeno je da je njegov IQ ispod prosjeka za ovu populaciju ispitanika. Tako se javila pretpostavka o nedovoljnom intelektualnom razvoju ovog djeteta i s tim u vezi potrebe upućivanja u specijalni internat za mentalno retardirane osobe. Za provjeru ove hipoteze formulirane su dvije alternativne statističke hipoteze, od kojih jedna pretpostavlja da podaci dobijeni tokom istraživanja karakteriziraju uobičajenu distribuciju stanovništva sa matematičkim očekivanjem jednakim granici koja određuje mentalnu retardaciju, recimo, 75 bodova (hipoteza H 0), a drugi pretpostavlja nižu vrijednost matematičkog očekivanja, tj. matematičko očekivanje je manje od date granice (hipoteza H jedan). Dalje pretpostavimo da se u toku procjene statističke značajnosti nekog empirijskog indikatora intelektualnog razvoja djeteta pokazalo da je vjerovatnoća da se dobije isti ili čak niži rezultat u drugom slučajnom testu ne više od jedne šanse u 20. Postavlja se pitanje: da li je na osnovu ovog rezultata moguće suditi o nedovoljnoj empirijskoj valjanosti nulte hipoteze i stoga je napustiti u korist alternativne hipoteze H jedan? Jasno je da će odgovor na ovo pitanje u velikoj mjeri zavisiti od toga koje se pogrešne radnje mogu smatrati prihvatljivijim. Ako smo uvjereni da je ostanak normalnog djeteta, doduše sa niskim mentalnih sposobnosti u internatu za mentalno retardirane je bolje nego školovati mentalno retardiranu osobu u normalnoj školi, možemo donijeti jednu odluku u vezi postavljanja granica na nivou značaja, ako razmišljamo drugačije, moramo donijeti drugu odluku.

Srećom, istraživač je obično pošteđen problema rješavanja ove vrste problema. Činjenica je da je statistički nemoguće potkrepiti optimalni nivo značajnosti, koji bi se mogao uzeti kao referenca pri izboru statističkih hipoteza. Međutim, postoje neke kvazi-statističke konvencije koje su standardno prihvaćene (Tabela 2.3). Razmatra se empirijski rezultat statistički značajno odbaciti nultu hipotezu, ako je vjerovatnoća da se dobije isti ili veći (manji) rezultat u drugom nasumičnom testu manja od jedne šanse u 20, tj. kada je vrijednost R ispada da je manji od 0,05. Ako vrijednost R manji je od 0,01, onda se rezultat uzima u obzir veoma značajno da odbaci nultu hipotezu. U slučaju da je vrijednost R prelazi 0,10, smatra se da eksperiment nije utvrdio statistički značajne razlike od teorijskog parametra pretpostavljenog nultom hipotezom. Ako je primljena vrijednost R je između 0,10 i 0,05, rezultat se smatra neodređenim. Kaže se da je na granici nivoa značaja. Na drugi način se ovaj rezultat naziva marginalno značajno.

Tabela 2.3

Standardne kvantilne vrijednosti koje određuju statističko donošenje odluka

Opisana strategija testiranja i prihvatanja hipoteza je univerzalna i najčešća. Konzervativnija strategija može biti da se vrijednosti vjerovatnoće od 0,01 i 0,001 uzmu kao pouzdani i visoko pouzdani nivoi, respektivno, i da se vrijednost vjerovatnoće postavi na 0,05 za nepouzdan nivo (O. Yu. Ermolaev, ). Tada će marginalno značajan rezultat biti onaj koji je u rasponu od 0,01 do 0,05. Međutim, takva strategija psihološko istraživanje se ipak rijetko koristi.

U svakom slučaju, treba imati na umu da se rezultati analize statističkih hipoteza ne mogu smatrati dovoljnim za procjenu eksperimentalnih hipoteza ako se uzimaju samostalno, bez veze sa cjelokupnom eksperimentalnom situacijom.

Statističke hipoteze ne treba miješati s eksperimentalnim i teorijskim hipotezama. Teorijske hipoteze odražavaju prirodu povezanosti i pravilnosti fenomena koji se proučavaju. Eksperimentalne hipoteze postavljaju se na osnovu proučavanja takvih teorijskih znanja u datoj oblasti i na taj način konkretizuju same teorijske hipoteze. Poput statističkih hipoteza, one uključuju simultanu formulaciju konkurentskih hipoteza kao poricanja postojanja navodne uzročne veze. Zbog ove činjenice, empirijska pravilnost koja se proučava može omogućiti različita kauzalna tumačenja, koja se nazivaju konkurentske hipoteze.

Za razliku od eksperimentalnih, statističke hipoteze su samo alat za procjenu podataka prikupljenih tokom eksperimenta i u početku ne impliciraju nikakvu empirijsku pravilnost. Rezultat njihove provjere je samo statističke prirode i stoga ne podrazumijeva automatsko prihvatanje ili odbacivanje eksperimentalnih i, još više, teoretskih hipoteza.

STATISTIČKE HIPOTEZE

Podaci uzorka dobiveni u eksperimentima uvijek su ograničeni i uglavnom su nasumični. Zbog toga se za analizu ovakvih podataka koristi matematička statistika, koja omogućava generalizaciju uzoraka dobijenih u uzorku i njihovo proširenje na cjelokupnu opštu populaciju.

Podaci dobiveni kao rezultat eksperimenta na bilo kojem uzorku služe kao osnova za prosuđivanje opće populacije. Međutim, zbog djelovanja slučajnih vjerovatnost razloga, procjena parametara opće populacije, napravljena na osnovu eksperimentalnih (uzoračkih) podataka, uvijek će biti praćena greškom, te stoga takve procjene treba smatrati nagađačkim, a ne kao završne izjave. Slične pretpostavke o svojstvima i parametrima opće populacije nazivaju se statističke hipoteze . Kako kaže G.V. Sukhodolsky: "Statistička hipoteza se obično shvata kao formalna pretpostavka da je sličnost (ili razlika) nekih parametarskih ili funkcionalnih karakteristika slučajna ili, obrnuto, nije slučajna."

Suština testiranja statističke hipoteze je da se utvrdi da li se eksperimentalni podaci i predložena hipoteza slažu, da li je dozvoljeno neslaganje između hipoteze i rezultata statističke analize eksperimentalnih podataka pripisati slučajnim uzrocima. Dakle, statistička hipoteza je naučna hipoteza koja se može statistički testirati i matematička statistika je naučna disciplina čiji je zadatak da naučno potkrijepi provjeru statističkih hipoteza.

Statističke hipoteze se dijele na nulte i alternativne, usmjerene i neusmjerene.

Nulta hipoteza(H0) je hipoteza bez razlike. Ako želimo dokazati značaj razlika, onda je potrebna nulta hipoteza opovrgnuti, inače je potrebno potvrditi.

Alternativna hipoteza (H 1) je hipoteza o značaju razlika. To je ono što želimo dokazati, zbog čega je ponekad zovu eksperimentalni hipoteza.

Postoje zadaci kada želimo tačno da dokažemo beznačajnost razlike, odnosno potvrditi nultu hipotezu. Na primjer, ako trebamo osigurati da različiti subjekti dobiju zadatke, iako različite, ali uravnotežene po težini, ili da se eksperimentalni i kontrolni uzorci ne razlikuju jedan od drugog u nekim značajnim karakteristikama. Međutim, češće nego ne, još uvijek moramo dokazati značaj razlika jer su nam informativnije u potrazi za novim.

Nulte i alternativne hipoteze mogu biti usmjerene ili neusmjerene.

Usmjerene hipoteze - ako se pretpostavi da su u jednoj grupi karakteristične vrijednosti veće, a u drugoj niže:

H 0: X 1 manje od X 2,

H 1: X 1 premašuje X 2.

Neusmjerene hipoteze - ako se pretpostavi da se oblici distribucije osobine u grupama razlikuju:

H 0: X 1 ne razlikuje se od X 2,

H 1: X 1 je drugačije X 2.

Ako primijetimo da su u jednoj od grupa individualne vrijednosti subjekata za neki atribut, na primjer, u društvenoj aktivnosti, veće, au drugoj niže, onda da bismo testirali značaj ovih razlika , moramo formulirati usmjerene hipoteze.

Ako to želimo dokazati u grupi ALI pod uticajem nekih eksperimentalnih uticaja došlo je do izraženijih promena nego u grupi B, tada također trebamo formulirati usmjerene hipoteze.

Ako želimo dokazati da se oblici distribucije osobine u grupama razlikuju ALI i B, zatim se formuliraju neusmjerene hipoteze.

Provjera hipoteza se vrši korištenjem kriterija statistička evaluacija razlike.

Rezultirajući zaključak naziva se statistička odluka. Naglašavamo da je takvo rješenje uvijek vjerovatno. Prilikom testiranja hipoteze, eksperimentalni podaci mogu biti u suprotnosti s hipotezom H 0 , onda se ova hipoteza odbacuje. Inače, tj. ako su eksperimentalni podaci u skladu sa hipotezom H 0 Ona ne odstupa. Često se u takvim slučajevima kaže da je hipoteza H 0 prihvaćeno. Ovo pokazuje da je statističko testiranje hipoteza na osnovu podataka eksperimentalnog uzorka neizbježno povezano sa rizikom (vjerovatnošću) donošenja pogrešne odluke. U ovom slučaju moguće su greške dvije vrste. Greška tipa I će se pojaviti kada se donese odluka da se hipoteza odbaci. H 0 , iako se u stvarnosti ispostavi da je istina. Greška tipa II će se desiti kada se donese odluka da se hipoteza ne odbaci. H 0, iako će u stvarnosti biti netačno. Očigledno, ispravni zaključci mogu se izvući iu dva slučaja. Tabela 7.1 rezimira gore navedeno.

Tabela 7.1

Moguće je da psiholog pogreši u svojoj statističkoj odluci; kao što vidimo iz tabele 7.1, ove greške mogu biti samo dve vrste. Kako je nemoguće isključiti greške u usvajanju statističkih hipoteza, potrebno je minimizirati moguće posljedice, tj. prihvatanje netačne statističke hipoteze. U većini slučajeva jedini način smanjenje greške je povećanje veličine uzorka.

STATISTIČKI KRITERIJI

Statistički test- ovo je pravilo odluke, koji obezbeđuje pouzdano ponašanje, odnosno prihvatanje istinite i odbacivanje lažne hipoteze sa velikom verovatnoćom .

Statistički kriterijumi ukazuju i na način izračunavanja određenog broja i samog ovog broja.

Kada kažemo da je značajnost razlika određena kriterijumom j *(kriterijum je Fisherova kutna transformacija), onda mislimo da smo koristili metodu j * za izračunavanje određenog broja.

Po omjeru empirijske i kritične vrijednosti kriterija možemo ocijeniti da li je nulta hipoteza potvrđena ili opovrgnuta.

U većini slučajeva, da bismo prepoznali razlike kao značajne, potrebno je da empirijska vrijednost kriterija bude veća od kritične vrijednosti, iako postoje kriteriji (npr. Mann-Whitney test ili test znakova) u kojima se moraju se pridržavati suprotnog pravila.

U nekim slučajevima, formula za izračunavanje kriterija uključuje broj zapažanja u uzorku studije, označen kao n. U ovom slučaju, empirijska vrijednost kriterija je istovremeno i test za testiranje statističkih hipoteza. Pomoću posebne tabele utvrđujemo koji nivo statističke značajnosti razlika odgovara datoj empirijskoj vrednosti. Primjer takvog kriterija je kriterij j *, izračunato na osnovu Fisherove kutne transformacije.

U većini slučajeva, međutim, ista empirijska vrijednost kriterija može se pokazati značajnom ili beznačajnom ovisno o broju zapažanja u uzorku studije ( n) ili na tzv. broj stepena slobode, koji se označava kao v ili kako df.

Broj stepeni slobode v jednak broju časova varijantne serije minus broj uslova pod kojima je nastao. Ovi uslovi uključuju veličinu uzorka ( n), srednja vrijednost i varijansa.

Pretpostavimo da je grupa od 50 ljudi podijeljena u tri klase prema principu:

Mogućnost rada na računaru;

Sposobnost obavljanja samo određenih operacija;

Ne mogu raditi na računaru.

U prvoj i drugoj grupi bilo je po 20 ljudi, a u trećoj 10 ljudi.

Ograničeni smo jednim uslovom - veličinom uzorka. Dakle, čak i ako smo izgubili podatke o tome koliko ljudi ne zna da koristi računar, to možemo utvrditi, znajući da je u prvom i drugom razredu po 20 ispitanika. Nismo slobodni odrediti broj subjekata u trećoj kategoriji, „sloboda“ se proteže samo na prve dvije ćelije klasifikacije: