Formulisanje hipoteza sistematizuje pretpostavke istraživača i predstavlja ih na jasan, koncizan način. Odluka koju istraživač treba da donese odnosi se na istinitost ili netačnost statističke hipoteze. Postoje dvije vrste hipoteza: naučne i statističke. Scientific Hipoteza je predloženo rješenje problema (izkazano kao teorema). Statistički hipoteza je jednostavno izjava o nepoznatom parametru opće populacije (svojstvu slučajne varijable ili događaja), koji je formuliran da testira pouzdanost odnosa i koji se može provjeriti u odnosu na poznatu statistiku uzorka (rezultati istraživanja, dostupni empirijski podaci ).

Statističke hipoteze dijele se na nulte i alternativne, usmjerene i neusmjerene. Nul hipoteza (H 0) ovo je hipoteza o odsustvu razlika, odsustvu uticaja faktora, odsustvu efekta itd.. To je ono što bi trebalo opovrgnuti ako se nađemo pred zadatkom da dokažemo značaj razlika. Alternativna hipoteza (H 1) to je hipoteza o značaju razlika. To je ono što bi trebalo da se dokaže, zbog čega se ponekad naziva eksperimentalnom ili radnom hipotezom.

sama postupak obrade dobijenih kvantitativnih podataka, koji se sastoji u izračunavanju nekih statističkih karakteristika i procjena koje omogućavaju testiranje nulte hipoteze, naziva se statistička analiza.

Nulte i alternativne hipoteze mogu biti usmjerene ili neusmjerene. Hipoteza se zove usmjereno ako sadrži naznaku smjera razlika. Takve hipoteze treba formulirati, na primjer, u slučaju da su u jednoj od grupa pojedinačne vrijednosti ispitanika za bilo koju karakteristiku veće, a u drugoj niže, ili je potrebno dokazati da je u jednoj od grupa pod uticajem bilo kakvih eksperimentalnih uticaja izraženije promene nego u drugoj grupi. Hipoteza se zove neusmjeren, ako njegova formulacija pretpostavlja samo definiciju razlika ili nerazličitosti (bez navođenja smjera razlika). Na primjer, ako je potrebno dokazati, u dva različite grupe oblici distribucije osobine se razlikuju.

Primjeri formuliranja hipoteza.

Metoda koja se koristi za odlučivanje o validnosti statističke hipoteze naziva se testiranje hipoteza. Osnovni princip testiranja hipoteze je da se postavlja nulta hipoteza. H 0, kako bi ga pokušali opovrgnuti i time potvrditi alternativnu hipotezu H 1 .

Prilikom testiranja bilo koje statističke hipoteze, odluka istraživača se nikada ne donosi sa sigurnošću, jer uvijek postoji rizik od donošenja pogrešne odluke.

Obično su korišteni uzorci mali i u tim slučajevima vjerovatnoća greške može biti značajna. Postoji tzv nivo pouzdanosti (nivo značajnosti) razlike. Ovo je vjerovatnoća da se razlike smatraju značajnim, ali su zapravo slučajne. Odnosno, to je vjerovatnoća odstupanja Nulta hipoteza, dok je istina.

Kada se navodi da su razlike značajne na nivou značajnosti od 5%, ili na p£0,05, ono što se misli je da je vjerovatnoća da ipak nisu značajne 0,05 (najniži nivo). statistički značaj). Ako se za razliku navodi da je značajna na nivou značajnosti od 1%, ili na p£0,01, onda to znači da je vjerovatnoća da ipak nije značajna 0,01 (dovoljan nivo statističke značajnosti). Ako se navodi da su razlike značajne na nivou značajnosti od 0,1% ili na p£0,001, onda to znači da je vjerovatnoća da još uvijek nisu značajne 0,001 ( najviši nivo statistički značaj).

Pravilo odbijanja H 0 i prihvatanja H 1:

Ako je empirijska vrijednost kriterija jednaka ili veća od kritične vrijednosti koja odgovara p £ 0,05, tada H 0 odbijeno, ali još nije definitivno prihvaćeno H 1.

Ako je empirijska vrijednost kriterija jednaka ili veća od kritične vrijednosti koja odgovara p £ 0,01, tada H 0 odbijeno prihvaćeno H 1.

Da biste vizualizirali pravilo odlučivanja, možete koristiti takozvanu "os značaja".

Ako nivo povjerenja nije prekoračen, onda se može smatrati vjerovatnim da otkrivena razlika zaista odražava stanje u populaciji. Za svaku statističku metodu, ovaj nivo se može naći u tablicama distribucije kritičnih vrijednosti odgovarajućih kriterija.

T - Studentov kriterijum

Ovo je parametarska metoda koja se koristi za testiranje hipoteza o valjanosti razlike u srednjim vrijednostima pri analizi kvantitativnih podataka u populacijama s normalnom distribucijom i istom varijansom. Dobro je primjenjiv u slučaju poređenja prosječnih slučajnih vrijednosti izmjerenog svojstva u kontrolnoj i eksperimentalnoj grupi, u različitim polnim i starosnim grupama, grupama sa drugim različitim karakteristikama.

Preduslov za primenljivost parametarskih metoda, uključujući Studentov t-test, za dokazivanje statističkih hipoteza je podređenost empirijska distribucija karakteristike koja se proučava na zakon normalne distribucije.

Studentova metoda je drugačija za nezavisne i zavisne uzorke.

Nezavisna uzorci se dobijaju proučavanjem dve različite grupe ispitanika (na primer, kontrolne i eksperimentalne grupe). To zavisan uzorci uključuju, na primjer, rezultate iste grupe ispitanika prije i poslije izlaganja nezavisnoj varijabli.

Testirana hipoteza H 0 je da je razlika između srednjih vrijednosti dva uzorka jednaka nuli ( = 0), drugim riječima, ovo je hipoteza o jednakosti srednjih vrijednosti (). Alternativna hipoteza H 1 je da je ta razlika različita od nule (№ 0) ili da postoji razlika u srednjim vrijednostima uzorka ().

Kada nezavisni uzorci za analizu razlike u srednjim vrijednostima koristi se formula: za n 1 , n 2 > 30

i formula za n 1 , n 2< 30, где

Aritmetička sredina prvog uzorka;

Aritmetička sredina drugog uzorka;

s 1 - standardna devijacija za prvi uzorak;

s 2 - standardna devijacija za drugi uzorak;

n 1 i n 2 su broj elemenata u prvom i drugom uzorku.

Da bismo pronašli kritičnu vrijednost t, određujemo broj stupnjeva slobode:

n \u003d n 1 - 1 + n 2 - 1 = (n 1 + n 2) - 2 = n - 2.

Ako |t emp | > t cr, onda odbacujemo nultu hipotezu i prihvatamo alternativnu, odnosno smatramo da je razlika u prosecima pouzdana. Ako |t emp |< t кр, то разница средних недостоверна.

Kada zavisni uzorci sljedeća formula se koristi za određivanje pouzdanosti razlike u srednjim vrijednostima: , gdje

d– razlika između rezultata u svakom paru (h i – y i);

å d je zbir ovih parcijalnih razlika;

å d2 je zbir kvadrata parcijalnih razlika;

n je broj parova podataka.

Broj stupnjeva slobode u slučaju zavisnih uzoraka za određivanje t kriterija bit će jednak n = n - 1.

Postoje i drugi statistički kriterijumi za testiranje hipoteza, i parametarskih i neparametarskih. Na primjer, matematičko-statistički kriterijum koji omogućava da se prosuđuju sličnosti i razlike u disperzijama slučajnih varijabli naziva se Fisherov kriterijum.

Korelaciona analiza

U svom najopštijem obliku, značenje "korelacije" odnosi se na međusobni odnos. Iako se, kada smo već kod korelacije, koriste i pojmovi „korelacija“ i „korelacija zavisnost“, koji se često koriste kao sinonimi.

Ispod korelacija razumjeti koordinirane promjene dvije ili više karakteristika, tj. varijabilnost jedne osobine je u nekoj korespondenciji sa varijabilnošću druge.

Korelaciona zavisnost su promjene koje vrijednosti jedne karakteristike čine u vjerovatnoći pojavljivanja različitih vrijednosti druge karakteristike.

Dakle, koordinirane promjene osobina i korelacija između njih koja to odražava mogu ukazivati ​​ne na ovisnost ovih osobina među sobom, već na ovisnost obje ove osobine o nekoj trećoj osobini ili kombinaciji osobina koje nisu razmatrane u studiji.

Hajde da se upoznamo sa terminologijom koja se koristi u testiranju hipoteza.

Ali - nulta hipoteza (hipoteza skeptika) je hipoteza nema razlike između upoređenih uzoraka. Skeptik smatra da su razlike između procjena uzoraka dobijenih iz rezultata istraživanja slučajne.

· N 1 – alternativna hipoteza (hipoteza optimizma) je hipoteza o postojanju razlika između upoređenih uzoraka. Optimista smatra da su razlike između procjena uzoraka rezultat objektivnih razloga i da odgovaraju razlikama populacije

Testiranje statističkih hipoteza je izvodljivo samo kada se elementi upoređenih uzoraka mogu koristiti za sastavljanje nekih vrijednost(kriterijum), čiji je zakon raspodjele poznat u slučaju valjanosti H 0 . Zatim se za ovu količinu može odrediti interval povjerenja, u kojem data verovatnoća R d dostiže svoju vrijednost. Ovaj interval se zove kritično područje. Ako je vrijednost kriterija unutar kritičnog područja, hipoteza H 0 je prihvaćena. U suprotnom, hipoteza H 1 je prihvaćena.

U medicinskim istraživanjima koristi se P d = 0,95 ili P d = 0,99. Ove vrijednosti odgovaraju nivoa značaja a = 0,05 ili a = 0,01.

Prilikom testiranja statističkih hipoteza nivo značajnosti(a) je vjerovatnoća odbacivanja nulte hipoteze kada je tačna.

Imajte na umu da je, u svojoj srži, postupak testiranja hipoteza usmjereno na pronalaženje razlika umjesto da potvrdi njihovo odsustvo. Kada vrijednost kriterija pređe kritično područje, možemo reći "skeptik" čista srca - pa, šta još hoćete?! Ako ne bi bilo razlika, onda bi sa vjerovatnoćom od 95% (ili 99%) izračunata vrijednost bila unutar navedenih granica. Pa ne!...

Pa, ako vrijednost kriterija pada u kritično područje, onda nema razloga vjerovati da je hipoteza H 0 tačna. Ovo najvjerovatnije ukazuje na jedan od dva moguća uzroka.



a) Veličine uzoraka nisu dovoljno velike da otkriju razlike. Vjerovatno će nastavak eksperimentiranja donijeti uspjeh.

b) Postoje razlike. Ali oni su toliko mali da nemaju praktičnu važnost. U ovom slučaju, nastavak eksperimenata nema smisla.

Hajdemo dalje da razmotrimo neke od statističkih hipoteza koje se koriste u medicinskim istraživanjima.

§ 3.6. Testiranje hipoteza o jednakosti varijansi,
F - Fišerov kriterijum

U nekim kliničkim studijama, pozitivan učinak nije dokazan toliko magnitude parametar koji se proučava, koliko stabilizacija, smanjujući njegove fluktuacije. U ovom slučaju postavlja se pitanje poređenja dvije opšte varijanse na osnovu rezultata ankete uzorka. Ovaj zadatak se može riješiti pomoću Fišerov kriterijum.

Formulacija problema

normalan zakon distribucija. Veličine uzoraka n 1 i n 2 , i varijanse uzorka su jednake respektivno. Treba uporediti opšte varijanse.

Provjerene hipoteze:

H 0– opšte disperzije su isti;

H 1 - opšte varijanse drugačije.

Prikazuje se ako su uzorci uzeti iz populacija sa normalan zakon distribucije, onda ako je hipoteza H 0 tačna, omjer varijansi uzorka odgovara Fisherovoj raspodjeli. Dakle, kao kriterij za provjeru valjanosti H 0, vrijednost F, izračunato po formuli

gdje su varijanse uzorka.

Ovaj omjer odgovara Fisherovoj raspodjeli sa brojem stupnjeva slobode brojnika n 1 = n 1 -1, i broj stupnjeva slobode nazivnika n 2 = n 2-1. Granice kritične regije nalaze se korištenjem Fisherovih distribucijskih tablica ili korištenjem računalne funkcije FDISP.

Za primjer prikazan u tabeli. 3.4, dobijamo: n 1 = n 2 = 20 - 1 = 19; F = 2,16/4,05 = 0,53. Kod a = 0,05, granice kritičnog područja su jednake, respektivno: F lijevo = 0,40, F desno = 2,53.

Vrijednost kriterija je pala u kritično područje, pa je prihvaćena hipoteza H 0: opšte varijanse uzoraka su isti.

§ 3.7. Testiranje hipoteza o jednakosti sredstava,
t-Studentov test

Problem poređenja srednje dvije opće populacije nastaju kada je magnitude osobina koja se proučava. Na primjer, kada se uporedi trajanje liječenja s dvije različite metode, ili broj komplikacija koje se javljaju prilikom njihove primjene. U ovom slučaju se može koristiti Studentov t-test.

Formulacija problema.

Dva uzorka (X 1 ) i (X 2 ) su dobijena iz populacija sa normalan zakon distribucija i jednake varijanse. Veličine uzoraka n 1 i n 2 , uzorak sredstva su jednaki, i varijanse uzorka- , odnosno. Treba uporediti opšti proseci.

Provjerene hipoteze:

H 0– opšti prosjek su isti;

H 1 - opšti proseci drugačije.

Pokazuje se da je u slučaju valjanosti hipoteze H 0, vrijednost t, izračunato po formuli

, (3.10)

raspoređeni prema Studentovom zakonu sa brojem stepeni slobode n= n 1 + n 2 - 2.

Ovdje je n 1 = n 1 - 1 - broj stepeni slobode za prvi uzorak; n 2 = n 2 – 1 je broj stupnjeva slobode za drugi uzorak.

Granice kritične regije nalaze se iz tabela t-distribucijom ili uz pomoć kompjuterske funkcije STUDRASP. Studentova raspodela je simetrična oko nule, tako da su leva i desna granica kritičnog regiona iste po apsolutnoj vrednosti i suprotne po predznaku: - t gr and t gr.

Za primjer prikazan u tabeli. 3.4, dobijamo: n 1 = n 2 = 20 - 1 = 19; t= –2,51, n= 38. Kod a = 0,05 tgr = 2,02.

Vrijednost kriterija ide dalje od lijeve granice kritične regije, pa prihvatamo hipotezu H 1: opći prosjek drugačije. Istovremeno, prosjek opšte populacije prvi uzorak manje.

STATISTIČKA PROVJERA STATISTIČ

Koncept statističke hipoteze.

Vrste hipoteza. Greške prve i druge vrste

Hipoteza- ovo je pretpostavka o nekim svojstvima proučavanih pojava. Ispod statistička hipoteza razumjeti svaku izjavu o opštoj populaciji koja se može provjeriti statistički, odnosno na osnovu rezultata opservacija u slučajnom uzorku. Razmatraju se dvije vrste statističkih hipoteza: hipoteze o zakonima distribucije opća populacija i hipoteze o parametrima poznate distribucije.

Dakle, hipoteza da se vrijeme utrošeno na sklapanje strojnog sklopa u grupi mašinskih radionica koje proizvode istoimene proizvode i imaju približno iste tehničke i ekonomske uslove proizvodnje raspodjeljuje se prema normalnom zakonu hipoteza o zakonu distribucija. A hipoteza da se produktivnost radnika u dva tima koji obavljaju isti posao pod istim uvjetima ne razlikuje (dok produktivnost radnika u svakom timu ima normalan zakon raspodjele) je hipoteza o parametrima distribucije.

Hipoteza koja se testira se zove null, ili osnovni, i označeno H 0 . Nul hipoteza je suprotstavljena nadmetanje ili alternativa hipoteza, koja je H jedan . Po pravilu, konkurentska hipoteza H 1 je logična negacija glavne hipoteze H 0.

Primjer nulte hipoteze bi bio da su srednje vrijednosti dvije normalno raspoređene populacije jednake, a onda bi se konkurentska hipoteza mogla sastojati od pretpostavke da srednje vrijednosti nisu jednake. Simbolično je napisano ovako:

H 0: M(X) = M(Y); H 1: M(X) M(Y) .

Ako se nulta (predložena) hipoteza odbije, onda postoji konkurentska hipoteza.

Postoje jednostavne i složene hipoteze. Ako hipoteza sadrži samo jednu pretpostavku, onda je to - jednostavno hipoteza. Kompleks hipoteza se sastoji od konačnog ili beskonačnog broja jednostavnih hipoteza.

Na primjer, hipoteza H 0: str = str 0 (nepoznata vjerovatnoća str jednaka hipotetičkoj vjerovatnoći str 0 ) je jednostavan, a hipoteza H 0: str < str 0 - složena, sastoji se od bezbroj jednostavnih hipoteza forme H 0: str = str i, gdje str i- bilo koji broj manji od str 0 .

Predložena statistička hipoteza može biti tačna ili netačna, pa je to neophodno verify na osnovu rezultata posmatranja u slučajnom uzorku; vrši se verifikacija statistički metode, pa se zove statistička.

Prilikom testiranja statističke hipoteze koristi se posebno sastavljena slučajna varijabla tzv statistički kriterijum(ili statistika). Prihvaćeni zaključak o ispravnosti (ili netačnosti) hipoteze zasniva se na proučavanju distribucije ove slučajne varijable prema podacima uzorka. Stoga je statističko testiranje hipoteza po prirodi vjerovatnoće: uvijek postoji rizik od greške pri prihvatanju (odbacivanju) hipoteze. U ovom slučaju moguće su greške dvije vrste.

Greška tipa I je da će nulta hipoteza biti odbačena iako je u stvari tačna.

Greška tipa II je da će nulta hipoteza biti prihvaćena, iako je konkurentska u stvari tačna.

U većini slučajeva, posljedice ovih grešaka su nejednake. Što je bolje ili lošije ovisi o specifičnoj formulaciji problema i sadržaju nulte hipoteze. Razmotrite primjere. Pretpostavimo da se u preduzeću kvalitet proizvoda ocenjuje na osnovu rezultata selektivne kontrole. Ako frakcija uzorka braka ne prelazi unaprijed određenu vrijednost str 0 , tada je serija prihvaćena. Drugim riječima, postavlja se nulta hipoteza: H 0: str str 0 . Ako se napravi greška tipa I u testiranju ove hipoteze, odbacićemo dobar proizvod. Ako se napravi greška druge vrste, onda će odbijenica biti poslana potrošaču. Očigledno, posljedice greške tipa II mogu biti mnogo ozbiljnije.

Drugi primjer se može dati iz oblasti jurisprudencije. Rad sudija ćemo smatrati radnjama za provjeru pretpostavke nevinosti okrivljenog. Glavna hipoteza koju treba testirati je hipoteza H 0 : okrivljeni je nevin. Zatim alternativna hipoteza H 1 je hipoteza: optuženi je kriv za zločin. Očigledno je da sud može napraviti greške prve ili druge vrste prilikom odmjeravanja kazne okrivljenom. Ako je učinjena greška prve vrste, onda to znači da je sud kaznio nevinog: optuženi je osuđen iako u stvari nije počinio krivično delo. Ako su sudije napravile grešku druge vrste, onda to znači da je sud doneo presudu da nije kriv, a zapravo je optuženi kriv za krivično delo. Očigledno je da će posljedice greške prve vrste za optuženog biti mnogo teže, dok su za društvo najopasnije posljedice greške druge vrste.

Vjerovatnoća počiniti greška prva vrsta pozvao nivo značajnosti kriterijuma i označiti .

U većini slučajeva, nivo značajnosti kriterijuma se uzima jednak 0,01 ili 0,05. Ako se, na primjer, nivo značajnosti uzme jednak 0,01, to znači da u jednom od stotinu slučajeva postoji rizik od greške tipa I (odnosno, odbacivanja ispravne nulte hipoteze).

Vjerovatnoća počiniti greška tipa II označiti . Vjerovatnoća
ne napraviti grešku tipa II, odnosno odbaciti nultu hipotezu kada je netačna, naziva se moć kriterijuma.

Statistički kriterijum.

Kritična područja

Statistička hipoteza se testira pomoću posebno odabrane slučajne varijable čija je točna ili približna distribucija poznata (označavamo je To). Ova slučajna varijabla se zove statistički kriterijum(ili jednostavno kriterijum).

U praksi se koriste različiti statistički kriterijumi: U- i Z-kriterijumi (ove slučajne varijable imaju normalnu distribuciju); F-kriterijum ( slučajna vrijednost distribuira u skladu sa zakonom Fisher-Snedekor); t-kriterijum (prema Studentovom zakonu); -kriterijum (prema zakonu "hi-kvadrat") itd.

Skup svih mogućih vrijednosti kriterija može se podijeliti na dva podskupa koja se ne preklapaju: jedan od njih sadrži vrijednosti kriterija pod kojim se nulta hipoteza prihvaća, a drugi - pod kojim se odbacuje.

Poziva se skup vrijednosti testa pod kojim se nulta hipoteza odbacuje kritično područje. Kritično područje ćemo označiti sa W.

Poziva se skup vrijednosti kriterija pod kojim se prihvata nulta hipoteza područje prihvatanja hipoteze(ili raspon prihvatljivih vrijednosti kriterija). Ovu oblast ćemo pozvati kao .

Da bismo provjerili valjanost nulte hipoteze, prema podacima uzorka, izračunavamo uočena vrijednost kriterija. Mi ćemo ga označiti To obs.

Osnovni princip testiranja statističkih hipoteza može se formulisati na sledeći način: ako je posmatrana vrednost kriterijuma pala u kritično područje (tj.
), tada se nulta hipoteza odbacuje; ako je uočena vrijednost kriterija pala u područje prihvatanja hipoteze (tj.
), onda nema razloga za odbacivanje nulte hipoteze.

Koje principe treba slijediti prilikom izgradnje kritične regije W ?

Pretpostavimo da je hipoteza H 0 je zapravo istina. Zatim ispunjavanje kriterijuma
u kritično područje, na osnovu osnovnog principa testiranja statističkih hipoteza, podrazumijeva odbacivanje ispravne hipoteze H 0 , što znači napraviti grešku tipa I. Dakle, vjerovatnoća udarca
regionu W ako je hipoteza tačna H 0 treba da bude jednak nivou značajnosti kriterijuma, tj.

.

Imajte na umu da je vjerovatnoća pravljenja greške tipa I odabrana da bude dovoljno mala (po pravilu,
). Zatim ispunjavanje kriterijuma
do kritičnog područja W ako je hipoteza tačna H 0 može se smatrati gotovo nemogućim događajem. Ako je, prema podacima uzorkovanja, događaj
ipak se dogodilo, onda se može smatrati nekompatibilnim s hipotezom H 0 (koji se kao rezultat odbija), ali kompatibilan sa hipotezom H 1 (što je na kraju prihvaćeno).

Pretpostavimo sada da je hipoteza tačna H 1 . Zatim ispunjavanje kriterijuma
u područje prihvatanja hipoteze dovodi do usvajanja pogrešne hipoteze H 0 što znači činjenje greške tipa II. Zbog toga
.

Od događaja
i
su međusobno suprotne, onda je vjerovatnoća dostizanja kriterija
do kritičnog područja Wće biti jednaka snazi ​​kriterija ako je hipoteza H 1 istina, tj

.

Očigledno, kritično područje treba izabrati tako da, na datom nivou značaja, moć kriterija
bila maksimalna. Maksimiziranje snage testa će osigurati minimalnu vjerovatnoću pravljenja greške tipa II.

Treba napomenuti da koliko god bila mala vrednost nivoa značajnosti, kriterijum koji spada u kritičnu oblast je samo malo verovatan, ali ne i apsolutno nemoguć događaj. Stoga je moguće da će s istinitom nultom hipotezom vrijednost kriterija izračunata iz podataka uzorka i dalje biti u kritičnom području. Odbijanje hipoteze u ovom slučaju H 0 , pravimo grešku tipa I sa vjerovatnoćom . Što je manji, manja je vjerovatnoća da ćete napraviti grešku tipa I. Međutim, sa smanjenjem, kritično područje se smanjuje, što znači da postaje manje moguće da posmatrana vrijednost padne u njega. To obs, čak i kada je hipoteza H 0 je pogrešno. Kod =0 hipoteza H 0 uvijek će biti prihvaćeno bez obzira na rezultate uzorka. Dakle, smanjenje podrazumeva povećanje verovatnoće prihvatanja netačne nulte hipoteze, odnosno pravljenja greške tipa II. U tom smislu se nadmeću greške prve i druge vrste.

Kako je nemoguće isključiti greške prve i druge vrste, potrebno je barem u svakom konkretnom slučaju nastojati da se gubici od ovih grešaka minimiziraju. Naravno, poželjno je smanjiti obje greške istovremeno, ali pošto se one takmiče, smanjenje vjerovatnoće da se napravi jedna od njih dovodi do povećanja vjerovatnoće da se napravi druga. Jedini način simultano smanjiti rizik od greške leži u povećanje veličine uzorka.

Ovisno o vrsti konkurentske hipoteze H 1 grade jednostrano (desno i lijevo) i dvostrano kritične regije. Tačke koje razdvajaju kritičnu regiju
iz oblasti prihvatanja hipoteze , zvao kritične tačke i označiti k Crete. Za pronalaženje kritične regije morate znati kritične tačke.

desna ruka kritično područje se može opisati nejednakošću
To>k Crete. pr, pri čemu se pretpostavlja da je desna kritična tačka k Crete. pr >0. Takav region se sastoji od tačaka koje se nalaze na desnoj strani kritične tačke k Crete. pr, odnosno sadrži skup pozitivnih i dovoljno velikih vrijednosti kriterija TO. Za pronalaženje k Crete. pr postavi prvo nivo značajnosti kriterijuma. Dalje, prava kritična tačka k Crete. pr se nalazi iz uslova . Zašto baš ovaj zahtjev definira kritičnu regiju desnog dijela? Budući da je vjerovatnoća događaja (TO>k Crete. itd ) je mala, onda, zbog principa praktične nemogućnosti malo verovatnih događaja, ovaj događaj ne bi trebalo da se dogodi ako je nulta hipoteza tačna u jednom testu. Ako je ipak došlo, odnosno do uočene vrijednosti kriterija izračunate iz podataka uzoraka
pokazalo se više k Crete. pr, ovo se može objasniti činjenicom da nulta hipoteza nije u skladu sa podacima opservacije i stoga je treba odbaciti. Dakle, zahtjev
određuje takve vrijednosti kriterija pod kojima se nulta hipoteza odbacuje, a one čine desnu kritičnu regiju.

Ako
pao u raspon prihvatljivih vrijednosti kriterija , to je
< k Crete. pr, onda se glavna hipoteza ne odbacuje, jer je kompatibilna sa podacima opservacije. Imajte na umu da je vjerovatnoća dostizanja kriterija
u rasponu prihvatljivih vrijednosti ako je nulta hipoteza tačna, jednaka je (1-) i blizu 1.

Mora se imati na umu da je pogodak kriterija vrijednosti
u rasponu prihvatljivih vrijednosti nije rigorozan dokaz valjanosti nulte hipoteze. To samo ukazuje da ne postoji značajna neslaganja između predložene hipoteze i rezultata uzorka. Stoga u takvim slučajevima kažemo da su podaci opservacije u skladu sa nultom hipotezom i da nema razloga da je odbacimo.

Slično su konstruisana i druga kritična područja.

dakle, llijevo kritično područje je opisano nejednakošću
To<k Crete. l, gde k crit.l<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k crit.l, odnosno skup negativnih, ali dovoljno velikih modulo vrijednosti kriterija. kritična tačka k crit.l se nalazi iz uslova
(To<k Crete. l)
, odnosno vjerovatnoća da kriterij ima vrijednost manju od k crit.l, jednak je prihvaćenom nivou značajnosti ako je nulta hipoteza tačna.

bilateralni kritično područje
je opisan sljedećim nejednačinama: ( To< k crit.l ili To>k Crete. pr), gdje se pretpostavlja da k crit.l<0 и k Crete. pr >0. Takvo područje je skup dovoljno velikih modulo vrijednosti kriterija. Kritične tačke se nalaze iz zahteva: suma verovatnoća da će kriterijum poprimiti vrednost manju od k Crete. l ili više k Crete. pr, treba da bude jednak prihvaćenom nivou značajnosti ako je nulta hipoteza tačna, tj.

(TO< k Crete. l )+
(TO>k Crete. itd )= .

Ako je distribucija kriterija To simetrično oko ishodišta, tada će kritične tačke biti locirane simetrično oko nule, dakle k Crete. l = - k Crete. itd. Tada dvostrano kritično područje postaje simetrično i može se opisati sljedećom nejednakošću: > k Crete. dw, gdje k Crete. dw = k Crete. pr Kritična tačka k Crete. dw se može naći iz uslova

P(K< -k Crete. dv )=P(K>k Crete. dv )= .

Napomena 1. Za svaki kriterijum To kritične tačke na datom nivou značaja
može se naći iz stanja
samo brojčano. Rezultati numeričkih proračuna k crit su dati u odgovarajućim tabelama (vidi, na primjer, dodatak 4 - 6 u datoteci "Prilozi").

Napomena 2. Gore opisani princip testiranja statističke hipoteze još ne dokazuje njenu istinitost ili neistinu. Prihvatanje hipoteze H 0 uporedio sa alternativnom hipotezom H 1 ne znači da smo sigurni u apsolutnu ispravnost hipoteze H 0 - samo hipoteza H 0 slaže se sa opservacijskim podacima koje imamo, to jest, to je prilično uvjerljiva izjava koja nije u suprotnosti sa iskustvom. Moguće je da s povećanjem veličine uzorka n hipoteza H 0 će biti odbijen.

5. Glavni problemi primijenjene statistike - opis podataka, procjena i testiranje hipoteza

Ključni koncepti koji se koriste u testiranju hipoteza

Statistička hipoteza - svaka pretpostavka koja se tiče nepoznate distribucije slučajnih varijabli (elemenata). Evo formulacija nekoliko statističkih hipoteza:

1. Rezultati zapažanja imaju normalna distribucija sa nulom matematičko očekivanje.
2. Rezultati promatranja imaju funkciju distribucije N(0,1).
3. Rezultati posmatranja imaju normalnu distribuciju.
4. Rezultati posmatranja u dva nezavisna uzorka imaju istu normalnu distribuciju.
5. Rezultati opservacija u dva nezavisna uzorka imaju istu distribuciju.

Postoje nulte i alternativne hipoteze. Nul hipoteza je hipoteza koja se testira. Alternativna hipoteza je svaka važeća hipoteza osim nulte hipoteze. Nul hipoteza je H 0 , alternativa - H 1(od Hipoteza - “hipoteza” (engleski)).

Izbor jedne ili druge nulte ili alternativne hipoteze determinisan je primenjenim zadacima koji stoje pred menadžerom, ekonomistom, inženjerom, istraživačem. Razmotrite primjere.

Primjer 11. Neka je nulta hipoteza hipoteza 2 sa gornje liste, a alternativna hipoteza 1. To znači da je stvarna situacija opisana probabilističkim modelom, prema kojem se rezultati posmatranja smatraju realizacijom nezavisnih identično raspoređenih slučajnih varijabli sa funkcijom distribucije N(0,σ), pri čemu je parametar σ statističaru nepoznat. U ovom modelu, nulta hipoteza se piše na sljedeći način:

H 0: σ = 1,

i ovakva alternativa:

H 1: σ ≠ 1.

Primjer 12. Neka je nulta hipoteza i dalje hipoteza 2 sa gornje liste, a alternativna hipoteza hipoteza 3 sa iste liste. Zatim, u probabilističkom modelu menadžerske, ekonomske ili proizvodne situacije, pretpostavlja se da rezultati promatranja čine uzorak iz normalne distribucije N(m, σ) za neke vrijednosti m i σ. Hipoteze se pišu ovako:

H 0: m= 0, σ = 1

(oba parametra imaju fiksne vrijednosti);

H 1: m≠ 0 i/ili σ ≠ 1

(tj. bilo m≠ 0, ili σ ≠ 1, ili oboje m≠ 0 i σ ≠ 1).

Primjer 13 Neka H 0 je hipoteza 1 sa gornje liste, i H 1 - hipoteza 3 sa iste liste. Tada je probabilistički model isti kao u primjeru 12,

H 0: m= 0, σ je proizvoljan;

H 1: m≠ 0, σ je proizvoljan.

Primjer 14 Neka H 0 je hipoteza 2 sa gornje liste, a prema H 1 rezultati opservacije imaju funkciju distribucije F(x), ne odgovara standardnoj funkciji normalne distribucije F(x). Onda

H 0: F(x) = F(x) za sve X(napisano kao F(x) ≡ F(x));

H 1: F(x 0) ≠ F (x 0) kod nekih x 0(tj. nije tačno da F(x) ≡ F(x)).

Bilješka. Ovdje ≡ je znak identične podudarnosti funkcija (tj. podudarnosti za sve moguće vrijednosti argumenta X).

Primjer 15 Neka H 0 je hipoteza 3 sa gornje liste, a prema H 1 rezultati opservacije imaju funkciju distribucije F(x), ne biti normalan. Onda

Za neke m, σ;

H 1: za bilo koje m, σ postoji x 0 = x 0(m, σ) takav da .

Primjer 16 Neka H 0 - hipoteza 4 sa gornje liste, prema probabilističkom modelu, dva uzorka su izvučena iz populacija sa funkcijama distribucije F(x) i G(x), koji su normalni sa parametrima m 1 , σ 1 i m 2 , σ 2 respektivno, i H 1 - negacija H 0 . Onda

H 0: m 1 = m 2 , σ 1 = σ 2 , i m 1 i σ 1 su proizvoljni;

H 1: m 1 ≠ m 2 i/ili σ 1 ≠ σ 2 .

Primjer 17. Neka je, pod uslovima iz primjera 16, dodatno poznato da je σ 1 = σ 2 . Onda

H 0: m 1 = m 2 , σ > 0, i m 1 i σ su proizvoljni;

H 1: m 1 ≠ m 2 , σ > 0.

Primjer 18. Neka H 0 - hipoteza 5 sa gornje liste, prema probabilističkom modelu, dva uzorka su izvučena iz populacija sa funkcijama distribucije F(x) i G(x) odnosno, i H 1 - negacija H 0 . Onda

H 0: F(x) G(x) , gdje F(x)

H 1: F(x) i G(x) su proizvoljne funkcije raspodjele, i

F(x) G(x) sa nekima X.

Primjer 19. Neka se u uslovima primjera 17 dodatno pretpostavlja da distribucijske funkcije F(x) i G(x) razlikuju se samo u pomaku, tj. G(x) = F(x- a) kod nekih a. Onda

H 0: F(x) G(x) ,

gdje F(x) je proizvoljna funkcija distribucije;

H 1: G(x) = F(x- a), a ≠ 0,

gdje F(x) je proizvoljna funkcija distribucije.

Primjer 20. Neka se u uslovima primera 14 dodatno zna da je prema verovatnom modelu situacije F(x) je normalna funkcija raspodjele s jediničnom varijansom, tj. ima oblik N(m, jedan). Onda

H 0: m = 0 (oni. F(x) = F(x)

za sve X); (napisano kao F(x) ≡ F(x));

H 1: m 0

(tj. nije tačno da F(x) ≡ F(x)).

Primjer 21. U statističkoj regulaciji tehnoloških, ekonomskih, menadžerskih ili drugih procesa, uzeti u obzir uzorak izvučen iz populacije s normalnom distribucijom i poznatom varijansom i hipotezama

H 0: m = m 0 ,

H 1: m= m 1 ,

gdje je vrijednost parametra m = m 0 odgovara utvrđenom toku procesa, a prelazak na m= m 1 ukazuje na kvar.

Primjer 22. Sa statističkom kontrolom prihvatljivosti, broj neispravnih jedinica proizvoda u uzorku podliježe hipergeometrijskoj distribuciji, nepoznati parametar je str = D/ N je nivo defekta, gdje N- zapreminu serije proizvoda, Dukupan broj neispravne stavke u seriji. Koristeći se u regulatornoj, tehničkoj i komercijalnoj dokumentaciji (standardi, ugovori o nabavci, itd.), planovi kontrole često imaju za cilj testiranje hipoteze

H 0: str < AQL

H 1: str > LQ,

gdje AQL – nivo prihvatanja kvara, LQ je nivo neispravnosti defekata (očigledno, AQL < LQ).

Primjer 23. Kao indikatori stabilnosti tehnološkog, ekonomskog, menadžerskog ili drugog procesa koriste se brojne karakteristike distribucija kontrolisanih indikatora, a posebno koeficijent varijacije v = σ/ M(X). Treba testirati nultu hipotezu

H 0: v < v 0

pod alternativnom hipotezom

H 1: v > v 0 ,

gdje v 0 je neka unaprijed određena granična vrijednost.

Primjer 24. Neka je probabilistički model dva uzorka isti kao u primjeru 18, označimo matematička očekivanja rezultata posmatranja u prvom i drugom uzorku M(X) i M(At) odnosno. U nekim situacijama se testira nulta hipoteza

H 0: M(X) = M(Y)

protiv alternativne hipoteze

H 1: M(X) ≠ M(Y).

Primjer 25. Gore je navedeno veliki značaj in matematičke statistike funkcije raspodjele koje su simetrične u odnosu na 0. Prilikom provjere simetrije

H 0: F(- x) = 1 – F(x) za sve x, inače F proizvoljno;

H 1: F(- x 0 ) ≠ 1 – F(x 0 ) kod nekih x 0 , inače F proizvoljno.

U probabilističko-statističkim metodama odlučivanja koriste se i mnoge druge formulacije problema za testiranje statističkih hipoteza. Neki od njih su razmatrani u nastavku.

Specifičan zadatak testiranja statističke hipoteze je u potpunosti opisan ako se daju nulta i alternativna hipoteza. Izbor metode za testiranje statističke hipoteze, svojstva i karakteristike metoda određuju se i nultom i alternativnom hipotezom. Za testiranje iste nulte hipoteze pod različitim alternativnim hipotezama, općenito govoreći, treba koristiti različite metode. Dakle, u primjerima 14 i 20 nulta hipoteza je ista, dok su alternativne različite. Stoga u uslovima primera 14 treba koristiti metode zasnovane na kriterijumima uklapanja sa parametarskom familijom (tip Kolmogorov ili tip omega kvadrata), a u uslovima primera 20 metode zasnovane na Studentovom testu ili Cramer-Welch testu. Ako se u uslovima iz primjera 14 koristi Studentov kriterij, onda on neće riješiti postavljene zadatke. Ako u uslovima primjera 20. koristimo kriterij dobrote uklapanja Kolmogorovljevog tipa, onda će, naprotiv, riješiti postavljene zadatke, iako, možda, lošije od Studentovog kriterija posebno prilagođenog za ovaj slučaj.

Prilikom obrade stvarnih podataka od velike je važnosti ispravan izbor hipoteza. H 0 i H jedan . Iznesene pretpostavke, kao što je normalnost distribucije, moraju biti pažljivo opravdane, posebno, statističke metode. Imajte na umu da se u velikoj većini specifičnih primijenjenih postavki distribucija rezultata posmatranja razlikuje od normalne.

Često se javlja situacija kada oblik nulte hipoteze proizilazi iz formulacije primijenjenog problema, ali oblik alternativne hipoteze nije jasan. U takvim slučajevima treba razmotriti alternativnu hipotezu. opšti pogled i koristiti metode koje rješavaju problem za sve moguće H jedan . Konkretno, kada se hipoteza 2 (sa gornje liste) testira kao null, treba koristiti kao alternativnu hipotezu H 1 iz primjera 14, a ne iz primjera 20, ako ne postoje posebna opravdanja za normalnost distribucije rezultata opservacija pod alternativnom hipotezom.

Prethodno

Na osnovu prikupljenog statističke studije podataka nakon njihove obrade izvode se zaključci o proučavanim pojavama. Ovi zaključci se donose iznošenjem i testiranjem statističkih hipoteza.

Statistička hipoteza naziva se svaka izjava o obliku ili svojstvima distribucije slučajnih varijabli uočene u eksperimentu. Statističke hipoteze se provjeravaju statističkim metodama.

Hipoteza koja se testira se zove glavni (nula) i označeno H 0 . Osim nule, postoji i alternativna (konkurentska) hipoteza H 1, negirajući glavnu . Dakle, kao rezultat testa, jedna i samo jedna od hipoteza će biti prihvaćena , a drugi će biti odbijen.

Vrste grešaka. Iznesena hipoteza se testira na osnovu proučavanja uzorka dobijenog iz opšte populacije. Zbog slučajnosti uzorka, test ne donosi uvijek tačan zaključak. U ovom slučaju mogu se pojaviti sljedeće situacije:
1. Glavna hipoteza je tačna i prihvaćena je.
2. Glavna hipoteza je tačna, ali se odbacuje.
3. Glavna hipoteza nije tačna i odbacuje se.
4. Glavna hipoteza nije tačna, ali je prihvaćena.
U slučaju 2 se govori o greška prve vrste, u potonjem slučaju jeste greška druge vrste.
Tako se za neke uzorke donosi ispravna odluka, a za druge pogrešna. Odluka se donosi prema vrijednosti neke funkcije uzorkovanja, tzv statistička karakteristika , statistički kriterijum ili jednostavno statistika. Skup vrijednosti ove statistike može se podijeliti u dva podskupa koja se ne preklapaju:

  • H 0 je prihvaćeno (ne odbijeno), pozvano područje prihvatanja hipoteze (dozvoljeno područje);
  • podskup statističkih vrijednosti za koje je hipoteza H 0 se odbacuje (odbacuje) i hipoteza je prihvaćena H 1 se zove kritično područje.

Zaključci:

  1. kriterijum naziva se slučajna varijabla K, koja vam omogućava da prihvatite ili odbacite nultu hipotezu H0.
  2. Prilikom testiranja hipoteza mogu se napraviti greške 2 vrste.
    Greška tipa I je odbaciti hipotezu H 0 ako je istina ("preskoči cilj"). Vjerovatnoća pravljenja greške tipa I označava se sa α i naziva se nivo značajnosti. Najčešće se u praksi pretpostavlja da je α = 0,05 ili α = 0,01.
    Greška tipa II je da je hipoteza H0 prihvaćena ako je netačna ("lažno pozitivna"). Vjerovatnoća ove vrste greške je označena sa β.

Klasifikacija hipoteza

Glavna hipoteza H 0 o vrijednosti nepoznatog parametra q distribucije obično izgleda ovako:
H 0: q \u003d q 0.
Konkurentna hipoteza H 1 može izgledati ovako:
H 1: q < q 0 , H 1:q> q 0 ili H 1: qq 0 .
Shodno tome, ispada lijeva strana, desna strana ili bilateralni kritična područja. Granične tačke kritičnih regiona ( kritične tačke) utvrđuje se iz tabela distribucije relevantne statistike.

Prilikom testiranja hipoteze, razumno je smanjiti vjerovatnoću donošenja pogrešnih odluka. Dozvoljena vjerovatnoća greške tipa I obično označavaju a i pozvao nivo značajnosti. Njegova vrijednost je obično mala ( 0,1, 0,05, 0,01, 0,001 ...). Ali smanjenje vjerovatnoće greške tipa 1 dovodi do povećanja vjerovatnoće greške tipa 2 ( b), tj. želja da se prihvate samo istinite hipoteze uzrokuje povećanje broja odbačenih tačnih hipoteza. Stoga je izbor nivoa značaja određen značajem postavljenog problema i težinom posledica pogrešne odluke.
Testiranje statističke hipoteze sastoji se od sljedećih koraka:
1) definicija hipoteza H 0 i H 1 ;
2) izbor statistike i dodeljivanje nivoa značajnosti;
3) definicija kritične tačke K cr i kritično područje;
4) izračunavanje vrednosti statistike iz uzorka K ex;
5) poređenje statističke vrednosti sa kritičnim regionom ( K cr i K ex);
6) odlučivanje: ako vrijednost statistike nije uključena u kritičnu regiju, hipoteza se prihvata H 0 i odbaciti hipotezu H 1, a ako uđe u kritično područje, hipoteza se odbacuje H 0 i hipoteza je prihvaćena H jedan . Istovremeno, rezultate testiranja statističke hipoteze treba tumačiti na sljedeći način: ako se hipoteza prihvati H 1 , onda to možemo smatrati dokazanim i ako prihvatimo hipotezu H 0 , tada je priznato da to nije u suprotnosti sa rezultatima opservacija.Međutim, ovo svojstvo, zajedno sa H 0 može imati druge hipoteze.

Klasifikacija testova hipoteza

Razmotrimo dalje nekoliko različitih statističkih hipoteza i mehanizama za njihovo testiranje.
ja) Hipoteza opšte sredine normalne distribucije sa nepoznatom varijansom. Pretpostavljamo da opća populacija ima normalnu distribuciju, njena srednja vrijednost i varijansa su nepoznati, ali postoji razlog za vjerovanje da je opći prosjek jednak a . Na nivou značajnosti α, potrebno je testirati hipotezu H 0: x=a. Kao alternativa, može se koristiti jedna od tri hipoteze o kojima smo gore govorili. U ovom slučaju, statistika je slučajna varijabla , koja ima Studentovu distribuciju sa n– 1 stepen slobode. Određuje se odgovarajuća eksperimentalna (opažena) vrijednost t ex t cr H 1: x >a nalazi se nivoom značajnosti α i brojem stepeni slobode n– 1. Ako t ex < t cr H 1: x ≠a kritična vrijednost se nalazi iz nivoa značajnosti α / 2 i istog broja stupnjeva slobode. Nul hipoteza je prihvaćena ako | t ex | II) Hipoteza o jednakosti dvaju srednjih vrijednosti proizvoljno raspoređenih općih populacija (veliki nezavisni uzorci). Na nivou značajnosti α, potrebno je testirati hipotezu H 0:x≠y. Ako je volumen oba uzorka velik, onda možemo pretpostaviti da srednje vrijednosti uzorka imaju normalnu distribuciju, a njihove varijanse su poznate. U ovom slučaju, slučajna varijabla se može koristiti kao statistika
,
imaju normalnu distribuciju, i M(Z) = 0, D(Z) = 1. Određuje se odgovarajuća eksperimentalna vrijednost z ex. Iz tabele Laplaceove funkcije nalazi se kritična vrijednost z cr. Pod alternativnom hipotezom H 1: x >y nalazi se iz uslova F(z cr) = 0,5 – a. Ako a z ex< z кр , tada se nulta hipoteza prihvata, u suprotnom se odbacuje. Pod alternativnom hipotezom H 1: x ≠ y kritična vrijednost se nalazi iz uslova F(z cr) = 0,5×(1 – a). Nul hipoteza je prihvaćena ako | z ex |< z кр .

III) Hipoteza o jednakosti dvaju srednjih normalno raspoređenih opštih populacija čije su varijanse nepoznate i iste (mali nezavisni uzorci). Na nivou značajnosti α, potrebno je testirati glavnu hipotezu H 0: x=y . Kao statistiku koristimo slučajnu varijablu
,
koji ima Studentovu distribuciju sa ( n x + n– 2) stepeni slobode. Određuje se odgovarajuća eksperimentalna vrijednost t ex. Iz tabele kritičnih tačaka Studentove distribucije nalazi se kritična vrednost t cr. Sve se rješava slično kao hipoteza (I).

IV) Hipoteza o jednakosti dvije varijanse normalno raspoređenih populacija. U ovom slučaju, na nivou značaja a treba testirati hipotezu H 0: D(X) = D(Y). Statistika je slučajna varijabla, koja ima Fisher-Snedecor distribuciju sa f 1 = n b– 1 i f 2 = n m- 1 stepen slobode (S 2 b - velika varijansa, zapremina njegovog uzorka n b). Određuje se odgovarajuća eksperimentalna (opažena) vrijednost F ex. kritična vrijednost F cr pod alternativnom hipotezom H 1: D(X) > D(Y) nalazi se iz tabele kritičnih tačaka Fisher-Snedecorove distribucije prema nivou značajnosti a i broj stepeni slobode f 1 i f 2. Nul hipoteza je prihvaćena ako F ex < F cr.

Uputstvo. Za proračun morate navesti dimenziju izvornih podataka.

V) Hipoteza o jednakosti nekoliko varijansi normalno raspoređenih populacija nad uzorcima iste veličine. U ovom slučaju, na nivou značaja a treba testirati hipotezu H 0: D(X 1) = D(X 2) = …= D(Xl). Statistika je slučajna varijabla , koji ima Cochranovu distribuciju sa stupnjevima slobode f = n– 1 i l (n- veličina svakog uzorka, l je broj uzoraka). Ova hipoteza se testira na isti način kao i prethodna. Koristi se tabela kritičnih tačaka Cochranove distribucije.

vi) Hipoteza o značaju korelacije. U ovom slučaju, na nivou značaja a treba testirati hipotezu H 0: r= 0. (Ako je koeficijent korelacije jednak nuli, tada odgovarajuće veličine nisu međusobno povezane). U ovom slučaju, statistika je slučajna varijabla
,
ima Studentsku distribuciju sa f = n– 2 stepena slobode. Provjera ove hipoteze vrši se slično kao i provjera hipoteze (I).

Uputstvo. Odredite količinu izvornih podataka.

VII) Hipoteza o vrijednosti vjerovatnoće nastanka događaja. Dovoljno veliki broj n nezavisna ispitivanja u kojima je događaj ALI dogodilo m jednom. Postoji razlog za vjerovanje da je vjerovatnoća da se ovaj događaj dogodi u jednom ispitivanju jednaka p 0. Obavezno na nivou značaja a testirati hipotezu da je vjerovatnoća događaja ALI jednaka hipotetičkoj vjerovatnoći p 0. (Budući da je vjerovatnoća procijenjena relativnom frekvencijom, testirana hipoteza se može formulirati na drugi način: posmatrana relativna učestalost i hipotetička vjerovatnoća se značajno razlikuju ili ne).
Broj suđenja je prilično velik, pa je i relativna učestalost događaja ALI distribuiraju prema uobičajenom zakonu. Ako je nulta hipoteza tačna, tada je njena očekivana vrijednost p 0, i varijansu . U skladu s tim, kao statistiku, biramo slučajnu varijablu
,
koji je raspoređen približno prema normalnom zakonu sa nultim matematičkim očekivanjem i jediničnom varijansom. Ova hipoteza se testira na potpuno isti način kao u slučaju (I).

Uputstvo. Za izračun morate popuniti početne podatke.