Hajde da se upoznamo sa terminologijom koja se koristi u testiranju hipoteza.

Ali - nulta hipoteza (hipoteza skeptika) je hipoteza nema razlike između upoređenih uzoraka. Skeptik smatra da su razlike između procjena uzoraka dobijenih iz rezultata istraživanja slučajne.

· N 1 – alternativna hipoteza (hipoteza optimizma) je hipoteza o postojanju razlika između upoređenih uzoraka. Optimista smatra da su razlike između procjena uzoraka uzrokovane objektivnim razlozima i odgovaraju razlikama u općim populacijama.

Testiranje statističkih hipoteza je izvodljivo samo kada se elementi upoređenih uzoraka mogu koristiti za sastavljanje nekih vrijednost(kriterijum), čiji je zakon raspodjele poznat u slučaju valjanosti H 0 . Zatim se za ovu količinu može odrediti interval povjerenja, u kojem data verovatnoća R d dostiže svoju vrijednost. Ovaj interval se zove kritično područje. Ako je vrijednost kriterija unutar kritičnog područja, hipoteza H 0 je prihvaćena. U suprotnom, hipoteza H 1 je prihvaćena.

U medicinskim istraživanjima koristi se P d = 0,95 ili P d = 0,99. Ove vrijednosti odgovaraju nivoa značaja a = 0,05 ili a = 0,01.

Prilikom testiranja statističkih hipoteza nivo značajnosti(a) naziva se vjerovatnoća odbijanja Nulta hipoteza kada je u pravu.

Imajte na umu da je, u svojoj srži, postupak testiranja hipoteza usmjereno na pronalaženje razlika umjesto da potvrdi njihovo odsustvo. Kada vrijednost kriterija pređe kritično područje, možemo reći "skeptik" čista srca - pa, šta još hoćete?! Ako ne bi bilo razlika, onda bi sa vjerovatnoćom od 95% (ili 99%) izračunata vrijednost bila unutar navedenih granica. Pa ne!...

Pa, ako vrijednost kriterija pada u kritično područje, onda nema razloga vjerovati da je hipoteza H 0 tačna. Ovo najvjerovatnije ukazuje na jedan od dva moguća uzroka.



a) Veličine uzoraka nisu dovoljno velike da otkriju razlike. Vjerovatno će nastavak eksperimentiranja donijeti uspjeh.

b) Postoje razlike. Ali oni su toliko mali da nemaju praktičnu važnost. U ovom slučaju, nastavak eksperimenata nema smisla.

Hajdemo dalje da razmotrimo neke od statističkih hipoteza koje se koriste u medicinskim istraživanjima.

§ 3.6. Testiranje hipoteza o jednakosti varijansi,
F - Fišerov kriterijum

U nekim kliničkim studijama, pozitivan učinak nije dokazan toliko magnitude parametar koji se proučava, koliko stabilizacija, smanjujući njegove fluktuacije. U ovom slučaju postavlja se pitanje poređenja dvije opšte varijanse na osnovu rezultata ankete uzorka. Ovaj zadatak se može riješiti pomoću Fišerov kriterijum.

Formulacija problema

normalan zakon distribucija. Veličine uzoraka n 1 i n 2 , i varijanse uzorka su jednake respektivno. Treba uporediti opšte varijanse.

Provjerene hipoteze:

H 0– opšte disperzije su isti;

H 1 - opšte varijanse drugačije.

Prikazuje se ako su uzorci uzeti iz populacija sa normalan zakon distribucije, onda ako je hipoteza H 0 tačna, omjer varijansi uzorka odgovara Fisherovoj raspodjeli. Dakle, kao kriterij za provjeru valjanosti H 0, vrijednost F, izračunato po formuli

gdje su varijanse uzorka.

Ovaj omjer odgovara Fisherovoj raspodjeli sa brojem stupnjeva slobode brojnika n 1 = n 1 -1, i broj stupnjeva slobode nazivnika n 2 = n 2-1. Granice kritične regije nalaze se korištenjem Fisherovih distribucijskih tablica ili korištenjem računalne funkcije FDISP.

Za primjer prikazan u tabeli. 3.4, dobijamo: n 1 = n 2 = 20 - 1 = 19; F = 2,16/4,05 = 0,53. Kod a = 0,05, granice kritičnog područja su jednake, respektivno: F lijevo = 0,40, F desno = 2,53.

Vrijednost kriterija je pala u kritično područje, pa je prihvaćena hipoteza H 0: opšte varijanse uzoraka su isti.

§ 3.7. Testiranje hipoteza o jednakosti sredstava,
t-Studentov test

Problem poređenja srednje dvije opće populacije nastaju kada je magnitude osobina koja se proučava. Na primjer, kada se uporedi trajanje liječenja s dvije različite metode, ili broj komplikacija koje se javljaju prilikom njihove primjene. U ovom slučaju se može koristiti Studentov t-test.

Formulacija problema.

Dva uzorka (X 1 ) i (X 2 ) su dobijena iz populacija sa normalan zakon distribucija i jednake varijanse. Veličine uzoraka n 1 i n 2 , uzorak sredstva su jednaki, i varijanse uzorka- , odnosno. Treba uporediti opšti proseci.

Provjerene hipoteze:

H 0– opšti prosjek su isti;

H 1 - opšti proseci drugačije.

Pokazuje se da je u slučaju valjanosti hipoteze H 0, vrijednost t, izračunato po formuli

, (3.10)

raspoređeni prema Studentovom zakonu sa brojem stepeni slobode n= n 1 + n 2 - 2.

Ovdje je n 1 = n 1 - 1 - broj stepeni slobode za prvi uzorak; n 2 = n 2 – 1 je broj stupnjeva slobode za drugi uzorak.

Granice kritične regije nalaze se iz tabela t-distribucijom ili uz pomoć kompjuterske funkcije STUDRASP. Studentova raspodela je simetrična oko nule, tako da su leva i desna granica kritičnog regiona iste po apsolutnoj vrednosti i suprotne po predznaku: - t gr and t gr.

Za primjer prikazan u tabeli. 3.4, dobijamo: n 1 = n 2 = 20 - 1 = 19; t= –2,51, n= 38. Kod a = 0,05 tgr = 2,02.

Vrijednost kriterija ide dalje od lijeve granice kritične regije, pa prihvatamo hipotezu H 1: opći prosjek drugačije. Istovremeno, prosjek stanovništva prvi uzorak manji.

Kao rezultat proučavanja ovog poglavlja, student treba da:

znam

  • šta je statistička hipoteza;
  • omjer teorijskih, eksperimentalnih i statističkih hipoteza;
  • razlike između nulte i alternativnih hipoteza;
  • logika vrednovanja, prihvatanja i odbacivanja statističkih hipoteza;
  • pojmovi grešaka prve i druge vrste, statistički značaj(pouzdanost);
  • razlike između parametarske i neparametarske statistike, mogućnosti i ograničenja ova dva tipa statističkih testova;

biti u mogućnosti

  • testirati najjednostavnije hipoteze o korištenju srednje vrijednosti t - Studentov test za uparene (povezane) i nesparene (nezavisne) uzorke;
  • procijeniti homogenost dva uzorka koristeći t - Učenički test i F - Fišerov test;
  • izgraditi intervale pouzdanosti za procijenjene parametre;

vlastiti

  • metodološka aparatura i osnovne vještine za predlaganje i testiranje statističkih hipoteza;
  • vještine procjene statističkih hipoteza i konstruiranja intervala povjerenja.

Opća strategija

Već znate da je u statističkoj analizi uobičajeno praviti razliku između pojmova "parametar" i "statistika". Ove razlike su detaljno razmotrene u Pogl. 1; u tabeli. 2.1 rezimira diskusiju koja je održana.

Podsjetimo da se svaka distribucija može okarakterizirati određenim teorijskim parametrima. Matematičko očekivanje, varijansa, asimetrija, kurtozis su primjeri takvih parametara distribucije. slučajna varijabla u opštoj populaciji. Sve su one, još jednom napominjemo ovu važnu činjenicu, teorijske veličine koje se u praksi gotovo nikada ne poznaju. U praktičnoj aktivnosti istraživača, one se mogu samo procijeniti s različitim stupnjevima tačnosti računanjem različitih statistika, koji nisu uvijek jednaki teorijskim vrijednostima parametara, kao i jedni drugima, kao što smo već vidjeli u paragrafu 1.4, s obzirom na praktične primjere procjene različitih parametara distribucije takve osobine ličnosti kao što je ženstvenost - muškosti.

Tabela 2.1

Odnos između parametara i statistike

I to nije iznenađujuće: na kraju krajeva, statistika odražava ponašanje slučajnih varijabli samo u uzorku koji je formirao eksperimentator, a ne u samoj populaciji. Stoga se eksperimentator može zapitati kako izračunata statistika korelira sa teorijskim parametrima distribucije. Drugim riječima, eksperimentatora može zanimati da li su podaci uzorka koji su mu na raspolaganju zapravo izvučeni iz opće populacije koju karakteriziraju parametri distribucije pretpostavljeni u teoriji. Da bi odgovorio na ovo pitanje, eksperimentator postavlja i testira statističke hipoteze.

Statističke hipoteze nazivaju se pretpostavkama o mogućim vrijednostima parametara distribucije slučajne varijable u općoj populaciji. Testiranje i analiza statističkih hipoteza vrši se kao rezultat prikupljanja i konstruisanja statistike. Alati za ovaj rad su statistički testovi, ili kriterijuma od kojih je svaki skup standardiziranih pravila. Na osnovu ovih pravila donosi se odluka o istinitosti ili netačnosti statističke hipoteze.

Razmotrite ponovo primjer bacanja novčića. Može se pretpostaviti da je vjerovatnoća pada "glava" prilikom bacanja normalnog, nelažnog i neoštećenog novčića 50%. To znači da očekivanu vrijednost takav događaj sa 100-strukim bacanjem novčića će biti jednak 50. Test ove hipoteze će se sastojati od sprovođenja sličnog testa, procene parametra od interesa za nas kao rezultat izračunavanjem odgovarajuće statistike i korišćenja ove statistike za testirati pouzdanost postavljene hipoteze. Na primjer, izvođenjem 100 pokušaja na novčiću, možemo potvrditi da se svaka strana zapravo pojavila 50 puta. Međutim, vjerovatno je da će rezultat takvog testa ipak biti nešto drugačiji od teorijski očekivanog. Drugim riječima, čak i ako se glave pojave nešto manje ili nešto više od 50 puta, malo je vjerovatno da ćemo imati razloga vjerovati da je novčić krivotvoren. Situacija će biti sumnjiva kada takvo odstupanje od teoretski očekivanih vrijednosti dostigne veće vrijednosti, na primjer, kada "orao" ne ispadne ni jednom u 100 pokušaja novčića. Takav aranžman se čini malo vjerojatnim, s obzirom da je s novčićem sve u redu.

Dakle, jasno je da ako je u toku 100-strukog bacanja novčića "orao" ispao tačno 50 puta, sve je u redu sa novčićem. Ako "orao" nikada nije ispao, postoji razlog za vjerovanje da nešto nije u redu s novčićem. Ali gdje je granica koja razdvaja pozitivne i negativne zaključke? Ovo pitanje se odnosi na izabrani kriterijum odluke. Upravo su ovi kriterijumi razvijeni u matematičkoj statistici za testiranje statističkih hipoteza, statističkih testova, koji se stoga često nazivaju statističkim kriterijumima.

Stoga se testiranje statističkih hipoteza vrši kao rezultat procjene vjerovatnoće slučajni događaj, što se smatra vrijednošću statistike. Ako se ova vjerovatnoća pokaže kao vrlo mala pod uslovom da je predložena hipoteza tačna, statistička hipoteza koja se testira se odbacuje, u suprotnom hipoteza se prihvata.

Teškoća ovog postupka, međutim, može biti u činjenici da možda ne znamo unaprijed specifičnu vrijednost parametra distribucije analizirane slučajne varijable. Na primjer, u slučaju novčića, može se pretpostaviti da je novčić krivotvoren, pa se vjerovatnoća pada glava manje-više razlikuje od 50%. U ovom slučaju, nakon sprovođenja serije testova, nećemo moći da procenimo stepen razlike između dobijene statistike, koja karakteriše vrednost matematičkog očekivanja analiziranog događaja, i njegove stvarne vrednosti. A onda testiranje statističke hipoteze može izgledati nemoguće. Izlaz iz ove situacije, međutim, može biti procjena vjerovatnoće hipoteze suprotne od one koja je iznesena. Drugim riječima, u ovom slučaju moguće je, na primjer, postaviti hipotezu o jednakosti teorijske vjerovatnoće od 50%. Ako se ispostavi da je ova hipoteza netačna, prihvata se alternativna hipoteza.

Zaista, prilikom testiranja statističkih hipoteza, istraživač se uvijek bavi ne jednom, već dvije hipoteze, koje se označavaju kao H 0 i H 1. Jedna od ovih hipoteza se naziva nultom, a druga alternativna, tj. opovrgavanje nule.

Nulta hipoteza H 0 je uvijek specifično. Uvijek potvrđuje neku specifičnu vrijednost parametra distribucije. Na primjer, hipoteza očekivanja može se formulirati na sljedeći način: μ = I, gdje I je neka specifična vrijednost μ, a hipoteza o jednakosti dvije veličine varijanse je σ1 = σ2.

Alternativna hipoteza H 1 je uvijek manje konkretno formulisan, na primjer: μ > I ; * σ2 itd. Ali, po pravilu, ispada da eksperimentatora ne zanima određena nulta hipoteza H 0, ali samo manje specifična alternativna hipoteza H 1, budući da je to ono što je više u skladu sa naučnom hipotezom koju je testirao u eksperimentu.

Provodeći empirijsku procjenu teorijskog parametra, eksperimentator utvrđuje statističku značajnost dobivenog rezultata, uzimajući kao osnovu pretpostavku istinitosti H 0. Statistička značajnost je vjerovatnoća da ćemo u beskonačnom broju eksperimenata koji u potpunosti reproduciraju uslove eksperimenta dobiti istu ili čak veću vrijednost konstruisane statistike. Ako se pokaže da je vjerovatnoća da se dobije ovakva i još veća statistika u beskonačnom broju eksperimenata sa istim uslovima, s obzirom da je nulta hipoteza tačna, eksperimentator napušta nultu hipotezu u korist alternativne.

Vizuelno opisana logika prikazana je na Sl. 2.1. Ovdje se očito postavljaju dvije alternativne hipoteze. Jedan od njih je specifičan i pretpostavlja da je matematičko očekivanje jednako nuli. Ova hipoteza je označena H 0. Kriva koja joj odgovara opisuje distribuciju slučajne varijable Z predviđenu ovom hipotezom. Druga hipoteza, označena kao H 1 je manje specifičan. Samo kaže da vrijednost matematičkog očekivanja mora biti veća od nule. U principu, postoji beskonačan broj krivulja koje opisuju distribucije koje odgovaraju ovoj hipotezi. Prikazana kriva je jedna od mogućih. Vrijednost Ζ exp karakterizira vrijednost statistike koja procjenjuje teorijski parametar μ u eksperimentu. To je ono što eksperimentator ima na raspolaganju, ono što je mogao dobiti prikupljanjem empirijskih podataka. Na primjer, to može biti vrijednost aritmetičke sredine za uzorak. Zatim bi se provjera iznesenih statističkih hipoteza trebala sastojati u pokušaju procjene kolika je vjerovatnoća da će se u drugom sličnom eksperimentu dobiti ista vrijednost Zexp ili čak više ako je nulta hipoteza tačna. Očigledno, ova vjerovatnoća je jednaka površini ispod krive raspodjele koju pretpostavlja ova hipoteza. Ovo područje s lijeve strane ograničeno je izračunatom statistikom, s desne strane nije ograničeno. Takvo područje, kao što se sjećamo (vidi paragraf 1.2), naziva se kvantil distribucije. Može se definirati ovako:

Rice. 2.1.

Količina kvantila potrebna za prihvaćanje ili odbacivanje hipoteze R u ovoj jednačini je tzv nivo značajnosti izračunata statistika Zexp. Što je ova vrijednost veća, to je vjerojatnije da će podaci dobiveni u eksperimentu biti opisani distribucijom f ho( Z ), tj. distribucija predviđena hipotezom H 0. Naprotiv, što je manja vrijednost R, manja je vjerovatnoća da empirijski podaci zaista odgovaraju distribuciji f H0(Z), a što je vjerovatnije da su opisani distribucijom koja pretpostavlja veću vrijednost μ. Dakle, evaluacija vrijednosti R, može se donijeti odluka u korist jedne od dvije postavljene hipoteze.

Hipoteza H 0 se može prihvatiti ako je vrijednost kvantila koja određuje statističku značajnost empirijske vrijednosti x, čini se da je dovoljno velika. Alternativna hipoteza H 1 se prihvata ako se vrijednost kvantila, koja određuje statističku značajnost rezultata dobivenog u eksperimentu, pokaže zanemarljivo malom. Problem je, međutim, koju vrijednost kvantila, koji određuje statističku značajnost, treba smatrati dovoljno velikom, a koju zanemarljivo malom. Da bismo riješili ovaj problem, pogledajmo pobliže koje mogućnosti eksperimentator ima pri procjeni statističkih hipoteza (Tabela 2.2).

Jasno je da iznesene statističke hipoteze mogu biti ili tačne ili netačne. Od hipoteza H 0 i H 1 su alternativni, tj. isključuju jedan drugog, postoje samo dva hipotetička slučaja koji karakteriziraju istinitost ili netačnost hipoteza koje se razmatraju: ili H 0 će biti tačno, i H 1 odnosno netačan, ili obrnuto. Budući da eksperimentator koji procjenjuje hipoteze nikada ne zna koja je od hipoteza tačna, sto odluka da prihvati ili odbije hipotezu H 0 nema nikakve veze s njegovom istinom ili neistinom - uostalom, upravo to on pokušava utvrditi. Dakle, u toku testiranja statističkih hipoteza postoje četiri moguća ishoda, od kojih se samo dva mogu smatrati povoljnima za eksperimentatora, bez obzira koju hipotezu istraživač zapravo želi da dokaže.

Tabela 2.2

Matrica ishoda u evaluaciji statističkih hipoteza

Ako hipoteza H 0 je ispravno i kao rezultat prihvaćeno Statistička analiza, eksperimentator ne pravi greške. A to je povoljan ishod za istraživača, čak i ako želi da prihvati alternativnu hipotezu. Također, eksperimentator ne griješi kada odbaci hipotezu. H 0, što je zapravo netačno. Međutim, može se dogoditi da je nulta hipoteza zapravo tačna, ali je eksperimentator ipak odbacuje. U ovom slučaju pravi grešku, što se obično naziva otkucajte jednu grešku ili α( alfa )- greška. Greška tipa II ili β( beta )- greška Ishodom se naziva ishod u kojem eksperimentator prihvata nultu hipotezu, koja se u stvari ispostavi da je lažna.

Jasno je da što je veća verovatnoća koja određuje statističku značajnost rezultata dobijenog u eksperimentu, pri kojem je eksperimentator spreman da napusti nultu hipotezu u korist alternativne, to je veća verovatnoća greške tipa I i smanjiti vjerovatnoću greške tipa II (slika 2.2). Naprotiv, smanjenjem vrijednosti vjerovatnoće pri kojoj eksperimentator odbacuje nultu hipotezu, on time rizikuje da napravi grešku tipa II s većom vjerovatnoćom, ali se time u većoj mjeri štiti od greške tipa I. Dakle, postavlja se pitanje na kom nivou je ta hipoteza značajna H 0 se može odbaciti ili prihvatiti, zapravo se odnosi na to koja je od dvije moguće greške manje važna za eksperimentatora. Primjenom konzervativnije strategije za testiranje statističke hipoteze, eksperimentator zanemaruje opasnost od greške tipa II. Primjenjujući radikalniju verziju radnje, eksperimentator, takoreći, zaboravlja na pogrešku prve vrste.

Rice. 2.2.

Ako prihvatanje statističke hipoteze implicira neke važne društvene posljedice, može se primijeniti konzervativnija strategija za njenu evaluaciju. Ako bi zbog neprihvatanja statističke hipoteze mogle proizaći ozbiljne posljedice, može se postupiti manje konzervativno.

Na primjer, neka se razmotri pitanje utvrđivanja mentalne retardacije određenog djeteta. Psihološkim pregledom utvrđeno je da je njegov IQ ispod prosjeka za ovu populaciju ispitanika. Tako se javila pretpostavka o nedovoljnom intelektualnom razvoju ovog djeteta i s tim u vezi potrebe upućivanja u specijalni internat za mentalno retardirane osobe. Za provjeru ove hipoteze formulirane su dvije alternativne statističke hipoteze, od kojih jedna pretpostavlja da podaci dobijeni tokom istraživanja karakteriziraju uobičajenu distribuciju stanovništva sa matematičkim očekivanjem jednakim granici koja određuje mentalnu retardaciju, recimo, 75 bodova (hipoteza H 0), a drugi pretpostavlja nižu vrijednost matematičkog očekivanja, tj. matematičko očekivanje je manje od date granice (hipoteza H 1). Pretpostavimo dalje da se tokom procene statističke značajnosti nekog empirijskog indikatora intelektualnog razvoja deteta pokazalo da verovatnoća dobijanja istog rezultata, ili čak nižeg, u drugom slučajnom testu nije veća od jedan. šansa u 20. Postavlja se pitanje: da li je na osnovu ovog rezultata moguće suditi o nedovoljnoj empirijskoj validnosti nulte hipoteze i stoga je napustiti u korist alternativne hipoteze H 1? Jasno je da će odgovor na ovo pitanje u velikoj mjeri zavisiti od toga koje se pogrešne radnje mogu smatrati prihvatljivijim. Ako smo uvjereni da je ostanak normalnog djeteta, doduše sa niskim mentalnih sposobnosti u internatu za mentalno retardirane je bolje nego školovati mentalno retardiranu osobu u normalnoj školi, možemo donijeti jednu odluku u vezi postavljanja granica u nivou značaja, ako drugačije razmišljamo, moramo donijeti drugu odluku.

Srećom, istraživač je obično pošteđen problema rješavanja ove vrste problema. Činjenica je da je statistički nemoguće potkrepiti optimalni nivo značajnosti, koji bi se mogao uzeti kao referenca pri izboru statističkih hipoteza. Međutim, postoje neke kvazi-statističke konvencije koje su standardno prihvaćene (Tabela 2.3). Razmatra se empirijski rezultat statistički značajno odbaciti nultu hipotezu, ako je vjerovatnoća da se dobije isti ili veći (manji) rezultat u drugom nasumičnom testu manja od jedne šanse u 20, tj. kada je vrijednost R ispada da je manji od 0,05. Ako vrijednost R manji je od 0,01, onda se rezultat uzima u obzir veoma značajno da odbaci nultu hipotezu. U slučaju da je vrijednost R prelazi 0,10, smatra se da eksperiment nije utvrdio statistički značajne razlike u odnosu na teorijski parametar pretpostavljen nultom hipotezom. Ako je primljena vrijednost R je između 0,10 i 0,05, rezultat se smatra neodređenim. Kaže se da je na granici nivoa značaja. Na drugi način se ovaj rezultat naziva marginalno značajno.

Tabela 2.3

Standardne kvantilne vrijednosti koje određuju statističko donošenje odluka

Opisana strategija testiranja i prihvatanja hipoteza je univerzalna i najčešća. Konzervativnija strategija može biti da se vrednosti verovatnoće od 0,01 i 0,001 uzmu kao pouzdani i visoko pouzdani nivoi, respektivno, i da se vrednost verovatnoće postavi na 0,05 za nepouzdan nivo (O. Yu. Ermolaev, ). Tada će marginalno značajan rezultat biti onaj koji je u rasponu od 0,01 do 0,05. Međutim, takva strategija psihološko istraživanje se ipak rijetko koristi.

U svakom slučaju, treba imati na umu da se rezultati analize statističkih hipoteza ne mogu smatrati dovoljnim za procjenu eksperimentalnih hipoteza ako se uzimaju samostalno, bez veze sa cjelokupnom eksperimentalnom situacijom.

Statističke hipoteze ne treba ih miješati s eksperimentalnim i teorijskim hipotezama. Teorijske hipoteze odražavaju prirodu povezanosti i pravilnosti proučavanih pojava. Eksperimentalne hipoteze postavljaju se na osnovu proučavanja takvih teorijskih znanja u datoj oblasti i na taj način konkretizuju same teorijske hipoteze. Poput statističkih hipoteza, one uključuju simultanu formulaciju konkurentskih hipoteza kao poricanja postojanja navodne uzročne veze. Zbog ove činjenice, empirijska pravilnost koja se proučava može omogućiti različita kauzalna tumačenja, koja se nazivaju konkurentske hipoteze.

Za razliku od eksperimentalnih, statističke hipoteze su samo alat za procjenu podataka prikupljenih tokom eksperimenta i u početku ne impliciraju nikakvu empirijsku pravilnost. Rezultat njihove provjere je samo statističke prirode i stoga ne podrazumijeva automatsko prihvatanje ili odbacivanje eksperimentalnih i, još više, teoretskih hipoteza.

Statistika je složena nauka o mjerenju i analizi različitih podataka. Kao iu mnogim drugim disciplinama, u ovoj industriji postoji koncept hipoteze. Dakle, hipoteza u statistici je svaki stav koji treba prihvatiti ili odbaciti. Štaviše, u ovoj industriji postoji nekoliko vrsta takvih pretpostavki, koje su slične po definiciji, ali se razlikuju u praksi. Nulta hipoteza je predmet današnjeg proučavanja.

Od opšteg ka posebnom: hipoteze u statistici

Druga, ne manje važna, odstupa od glavne definicije pretpostavki - statistička hipoteza je proučavanje opšteg skupa objekata važnih za nauku, o kojima naučnici donose zaključke. Može se testirati pomoću uzorka (dio populacije). Evo nekoliko primjera statističkih hipoteza:

1. Učinak cijelog razreda može zavisiti od nivoa obrazovanja svakog učenika.

2. Osnovni predmet matematike podjednako usvajaju i djeca koja su došla u školu sa 6 godina i djeca koja su došla u školu sa 7 godina.

Jednostavna hipoteza u statistici je pretpostavka koja na jedinstven način karakteriše određeni parametar veličine koju naučnik uzima.

Složeni se sastoji od nekoliko ili beskonačnog broja jednostavnih. Neka oblast je naznačena ili nema tačnog odgovora.

Korisno je razumjeti nekoliko definicija hipoteza u statistici kako ih ne bi zbunili u praksi.

Koncept nulte hipoteze

Nul hipoteza je teorija da postoje dvije populacije koje se ne mogu razlikovati. Međutim, na naučni nivo ne postoji koncept „ne razlikuju se“, ali postoji „njihova sličnost je jednaka nuli“. Iz ove definicije nastao je koncept. U statistici, nulta hipoteza se naziva H0. Štaviše, smatra se da je ekstremna vrijednost nemogućeg (malo vjerovatno) od 0,01 do 0,05 ili manje.

Bolje je razumjeti što je nulta hipoteza, primjer iz života će pomoći. Nastavnik na univerzitetu je to predložio različit nivo priprema učenika dve grupe za testni rad uslovljena je beznačajnim parametrima, slučajnim razlozima koji ne utiču na opšti nivo obrazovanja (razlika u pripremi dve grupe učenika je nula).

Međutim, vrijedno je dati primjer alternativne hipoteze – pretpostavke koja pobija tvrdnju nulte teorije (H1). Na primjer: direktor univerziteta je sugerirao da su različiti nivoi pripreme za ispitni rad među studentima dvije grupe uzrokovani upotrebom različitih nastavnih metoda od strane nastavnika (razlika u pripremi dvije grupe je značajna i postoji objašnjenje za ovo).

Sada možete odmah uočiti razliku između pojmova "nulte hipoteze" i "alternativne hipoteze". Primjeri ilustruju ove koncepte.

Test nulte hipoteze

Izrada pretpostavke je pola problema. Pravi izazov za početnike je testiranje nulte hipoteze. Tu čekaju mnoge poteškoće.

Koristeći metodu alternativne hipoteze, koja navodi nešto suprotno od nulte teorije, možete uporediti obje opcije i odabrati ispravnu. Tako funkcionira statistika.

Neka je nulta hipoteza H0, a alternativa H1, tada:

H0: c = c0;
H1: c ≠ c0.

Ovdje je c neka srednja vrijednost populacije koju treba pronaći, a c0 je početno data vrijednost prema kojoj se hipoteza testira. Postoji i određeni broj X - prosječna vrijednost uzorka, kojim se određuje c0.

Dakle, test je da se uporede X i c0, ako je X=c0, onda je nulta hipoteza prihvaćena. Ako je H≠c0, onda se pod uslovom alternativa smatra ispravnom.

Metoda verifikacije "povjerenja".

Postoji najmoćniji način na koji se nulta hipoteza lako testira u praksi. Sastoji se od konstruisanja raspona vrijednosti do 95% tačnosti.

Prvo morate znati formulu za izračunavanje intervala povjerenja:
X - t*Sx ≤ c ≤ X + t*Sx,

gdje je X inicijalno dati broj zasnovan na alternativnoj hipotezi;
t - tabelarne vrijednosti (Studentov koeficijent);
Sx je standardna greška, koja se izračunava kao Sx = σ/√n, gdje je brojnik standardna devijacija, a nazivnik veličina uzorka.

Pa pretpostavimo situaciju. Prije remonta transporter je proizvodio 32,1 kg gotovih proizvoda dnevno, a nakon remonta, prema riječima poduzetnika, koeficijent korisna akcija rastao, a transporter je, prema sedmičnoj provjeri, počeo proizvoditi u prosjeku 39,6 kg.

Nul hipoteza bi govorila da popravka nije imala uticaja na efikasnost transportera. Alternativna hipoteza bi govorila da je popravka radikalno promijenila efikasnost transportera, pa se povećala i njegova produktivnost.

Prema tabeli nalazimo n=7, t = 2,447, odakle će formula dobiti sljedeći oblik:

39,6 - 2,447*4,2 ≤ s ≤ 39,6 + 2,447*4,2;

29,3 ≤ c ≤ 49,9.

Ispostavilo se da je vrijednost 32,1 u rasponu, pa stoga vrijednost koju predlaže alternativa - 39,6 - nije automatski prihvaćena. Zapamtite da se prvo testira nulta hipoteza, a zatim suprotna.

Vrste poricanja

Prije toga je razmatrana takva varijanta izgradnje hipoteze, gdje H0 nešto tvrdi, a H1 to opovrgava. Odakle bi mogao doći takav sistem?

H0: c = c0;
H1: c ≠ c0.

Ali postoje još dvije povezane metode pobijanja. Na primjer, nulta hipoteza kaže da je prosječna ocjena za razred veća od 4,54, dok bi alternativa tada rekla da je prosječna ocjena za istu ocjenu manja od 4,54. A to će izgledati ovako u obliku sistema:

H0: s ⩾ 4,54;
H1: sa< 4.54.

Imajte na umu da nulta hipoteza kaže da je vrijednost veća ili jednaka, dok statistička hipoteza kaže da je striktno manja. Ozbiljnost znaka nejednakosti je jako bitna!

Statistička verifikacija

Statističko testiranje nultih hipoteza se sastoji u korištenju statističkog testa. Takvi kriteriji podliježu različitim zakonima o distribuciji.

Na primjer, postoji F-test, koji se izračunava korištenjem Fisherove distribucije. Postoji T-test, koji se najčešće koristi u praksi, u zavisnosti od Studentove distribucije. Pearsonova dobrota prilagodbe na kvadrat, itd.

Područje prihvatanja nulte hipoteze

U algebri postoji koncept "domena dozvoljenih vrijednosti". Ovo je takav segment ili tačka na X-osi, na kojoj se nalazi skup statističkih vrijednosti za koje je tačna nulta hipoteza. Ekstremne tačke segmenta su kritične vrednosti. Zrake na desnoj i lijevoj strani segmenta su kritične regije. Ako je pronađena vrijednost uključena u njih, tada se nulta teorija pobija i prihvaća alternativna.

Pobijanje nulte hipoteze

Nul hipoteza u statistici je ponekad vrlo čudan koncept. Tokom verifikacije mogu se napraviti dvije vrste grešaka:

1. Odbijanje ispravne nulte hipoteze. Označimo prvi tip kao a=1.
2. Prihvatanje lažne nulte hipoteze. Drugi tip će biti označen kao a=2.

Treba shvatiti da ovo nisu isti parametri, ishodi grešaka se mogu značajno razlikovati jedni od drugih i imati različite uzorke.

Primjer dvije vrste grešaka

Složene koncepte je lakše razumjeti na primjeru.

Prilikom proizvodnje određenog lijeka od naučnika je potreban izuzetan oprez, jer prekoračenje doze jedne od komponenti izaziva visoki nivo toksičnost gotovog lijeka, od koje pacijenti koji ga uzimaju mogu umrijeti. Međutim, na hemijskom nivou nemoguće je otkriti predoziranje.
Zbog toga, prije puštanja lijeka u prodaju, mala doza se testira na štakorima ili zečevima ubrizgavanjem lijeka. Ako većina ispitanika umre, onda se lijek ne smije prodavati; ako su ispitanici živi, ​​onda se lijek može prodavati u ljekarnama.

Prvi slučaj: zapravo, lijek nije bio toksičan, ali je tokom eksperimenta napravljen previd i lijek je klasifikovan kao otrovan i nije ga bilo dozvoljeno prodavati. A=1.

Drugi slučaj: u toku drugog eksperimenta, prilikom testiranja druge serije lijeka, odlučeno je da lijek nije toksičan, te je dozvoljeno da se prodaje, iako je zapravo lijek bio otrovan. A=2.

Prva opcija će za dobavljača-poduzetnika dovesti do velikih finansijskih troškova, jer će morati uništiti cijelu seriju lijekova i krenuti od nule.

Druga situacija će izazvati smrt pacijenata koji su kupili i koristili ovaj lijek.

Teorija vjerovatnoće

Ne samo nula, nego su sve hipoteze u statistici i ekonomiji podijeljene prema nivou značaja.

Nivo značajnosti - procenat pojavljivanja grešaka prve vrste (odbacivanje ispravne nulte hipoteze).

Prvi nivo je 5% ili 0,05, odnosno vjerovatnoća greške je 5 do 100 ili 1 do 20.
drugi nivo je 1% ili 0,01, tj. vjerovatnoća je 1 prema 100.
treći nivo je 0,1% ili 0,001, vjerovatnoća je 1 prema 1000.

Kriterijumi za testiranje hipoteza

Ako su naučnici već zaključili da je nulta hipoteza tačna, onda se mora testirati. Ovo je neophodno kako bi se isključila greška. Postoji glavni kriterij za testiranje nulte hipoteze, koji se sastoji od nekoliko faza:

1. Uzima se dozvoljena vjerovatnoća greške P=0,05.
2. Statistika je odabrana za kriterij 1.
3. Koristeći poznatu metodu, nalazi se područje ​​dozvoljenih vrijednosti.
4. Vrijednost T statistike je sada izračunata.
5. Ako T (statistika) pripada području prihvatanja nulte hipoteze (kao u metodi "pouzdanja"), tada se pretpostavke smatraju istinitim, što znači da sama nulta hipoteza ostaje istinita.

Tako funkcionira statistika. Nul hipoteza, kada se pravilno testira, biće prihvaćena ili odbačena.

Vrijedi napomenuti da za obične poduzetnike i korisnike prve tri faze mogu biti vrlo teške za precizno izvođenje, pa im vjeruju profesionalni matematičari. Ali faze 4 i 5 može izvesti svako ko zna dovoljno statističke metode provjere.

STATISTIČKE HIPOTEZE

Podaci uzorka dobiveni u eksperimentima uvijek su ograničeni i uglavnom su nasumični. Zbog toga se za analizu ovakvih podataka koristi matematička statistika, koja omogućava generalizaciju uzoraka dobijenih u uzorku i njihovo proširenje na cjelokupnu opštu populaciju.

Podaci dobiveni kao rezultat eksperimenta na bilo kojem uzorku služe kao osnova za prosuđivanje opće populacije. Međutim, zbog djelovanja slučajnih vjerovatnost razloga, procjena parametara opće populacije napravljena na osnovu eksperimentalnih (uzoračkih) podataka uvijek će biti praćena greškom, te stoga takve procjene treba smatrati nagađačkim, a ne kao konačne izjave. Slične pretpostavke o svojstvima i parametrima opće populacije nazivaju se statističke hipoteze . Kako kaže G.V. Sukhodolsky: "Statistička hipoteza se obično shvata kao formalna pretpostavka da je sličnost (ili razlika) nekih parametarskih ili funkcionalnih karakteristika slučajna ili, obrnuto, nije slučajna."

Suština testiranja statističke hipoteze je da se utvrdi da li su eksperimentalni podaci i postavljena hipoteza konzistentni, da li je dopušteno neslaganje između hipoteze i rezultata statističke analize eksperimentalnih podataka pripisati slučajnim uzrocima. Dakle, statistička hipoteza je naučna hipoteza koja omogućava statističko testiranje, a matematička statistika je naučna disciplina čiji je zadatak da naučno potkrijepi testiranje statističkih hipoteza.

Statističke hipoteze se dijele na nulte i alternativne, usmjerene i neusmjerene.

Nulta hipoteza(H0) je hipoteza bez razlike. Ako želimo dokazati značaj razlika, onda je potrebna nulta hipoteza opovrgnuti, inače je potrebno potvrditi.

Alternativna hipoteza (H 1) je hipoteza o značaju razlika. To je ono što želimo dokazati, zbog čega je ponekad zovu eksperimentalni hipoteza.

Postoje zadaci kada želimo tačno da dokažemo beznačajnost razlike, odnosno potvrditi nultu hipotezu. Na primjer, ako trebamo osigurati da različiti subjekti dobiju zadatke, iako različite, ali uravnotežene po težini, ili da se eksperimentalni i kontrolni uzorci ne razlikuju jedan od drugog u nekim značajnim karakteristikama. Međutim, češće nego ne, još uvijek moramo dokazati značaj razlika jer su nam informativnije u potrazi za novim.

Nulte i alternativne hipoteze mogu biti usmjerene ili neusmjerene.

Usmjerene hipoteze - ako se pretpostavi da su u jednoj grupi karakteristične vrijednosti veće, a u drugoj niže:

H 0: X 1 ne prelazi X 2,

H 1: X 1 premašuje X 2.

Neusmjerene hipoteze - ako se pretpostavi da se oblici distribucije osobine u grupama razlikuju:

H 0: X 1 ne razlikuje se od X 2,

H 1: X 1 je drugačije X 2.

Ako primijetimo da su u jednoj od grupa individualne vrijednosti subjekata za neki atribut, na primjer, u društvenoj aktivnosti, veće, a u drugoj niže, onda da bismo testirali značaj ovih razlika, moramo formulirati usmjerene hipoteze.

Ako to želimo dokazati u grupi I pod uticajem nekih eksperimentalnih uticaja došlo je do izraženijih promena nego u grupi B, tada također trebamo formulirati usmjerene hipoteze.

Ako želimo dokazati da se oblici distribucije osobine u grupama razlikuju I i B, zatim se formuliraju neusmjerene hipoteze.

Provjera hipoteza se vrši korištenjem kriterija za statističku procjenu razlika.

Rezultirajući zaključak naziva se statistička odluka. Naglašavamo da je takvo rješenje uvijek vjerovatno. Prilikom testiranja hipoteze, eksperimentalni podaci mogu biti u suprotnosti s hipotezom H 0 , onda se ova hipoteza odbacuje. Inače, tj. ako su eksperimentalni podaci u skladu sa hipotezom H 0 Ona ne odstupa. Često se u takvim slučajevima kaže da je hipoteza H 0 prihvaćeno. Ovo pokazuje da je statističko testiranje hipoteza na osnovu podataka eksperimentalnog uzorka neizbježno povezano s rizikom (vjerovatnošću) donošenja pogrešne odluke. U ovom slučaju moguće su greške dvije vrste. Greška tipa I će se pojaviti kada se donese odluka da se hipoteza odbaci. H 0 , iako se u stvarnosti ispostavi da je istina. Greška tipa II će se desiti kada se donese odluka da se hipoteza ne odbaci. H 0, iako će u stvarnosti biti netačno. Očigledno, ispravni zaključci mogu se izvući iu dva slučaja. Tabela 7.1 rezimira gore navedeno.

Tabela 7.1

Moguće je da psiholog pogreši u svom statističko rješenje; kao što vidimo iz tabele 7.1, ove greške mogu biti samo dve vrste. Kako je nemoguće isključiti greške u usvajanju statističkih hipoteza, potrebno je minimizirati moguće posljedice, tj. prihvatanje netačne statističke hipoteze. U većini slučajeva jedini način smanjenje greške je povećanje veličine uzorka.

STATISTIČKI KRITERIJI

Statistički test- ovo je pravilo odluke, koji obezbeđuje pouzdano ponašanje, odnosno prihvatanje istinite i odbacivanje lažne hipoteze sa velikom verovatnoćom .

Statistički kriterijumi ukazuju i na način izračunavanja određenog broja i samog ovog broja.

Kada kažemo da je značajnost razlika određena kriterijumom j *(kriterijum je Fisherova kutna transformacija), onda mislimo da smo koristili metodu j * za izračunavanje određenog broja.

Po omjeru empirijske i kritične vrijednosti kriterija možemo ocijeniti da li je nulta hipoteza potvrđena ili opovrgnuta.

U većini slučajeva, da bismo prepoznali razlike kao značajne, potrebno je da empirijska vrijednost kriterija bude veća od kritične, iako postoje kriteriji (npr. Mann-Whitney test ili test znakova) u kojima se moraju se pridržavati suprotnog pravila.

U nekim slučajevima, formula za izračunavanje kriterija uključuje broj opservacija u uzorku studije, označen kao n. U ovom slučaju, empirijska vrijednost kriterija je istovremeno i test za testiranje statističkih hipoteza. Pomoću posebne tabele utvrđujemo koji nivo statističke značajnosti razlika odgovara datoj empirijskoj vrednosti. Primjer takvog kriterija je kriterij j *, izračunato na osnovu Fisherove kutne transformacije.

U većini slučajeva, međutim, ista empirijska vrijednost kriterija može se pokazati kao značajna ili beznačajna ovisno o broju zapažanja u uzorku studije ( n) ili na tzv. broj stepeni slobode, koji se označava kao v ili kako df.

Broj stepeni slobode v jednak broju časova varijantne serije minus broj uslova pod kojima je formirana. Ovi uslovi uključuju veličinu uzorka ( n), srednja vrijednost i varijansa.

Pretpostavimo da je grupa od 50 ljudi podijeljena u tri klase prema principu:

Mogućnost rada na računaru;

Sposobnost obavljanja samo određenih operacija;

Ne mogu raditi na računaru.

U prvoj i drugoj grupi bilo je po 20 ljudi, a u trećoj 10 ljudi.

Ograničeni smo jednim uslovom - veličinom uzorka. Dakle, čak i ako smo izgubili podatke o tome koliko ljudi ne zna da koristi računar, to možemo utvrditi, znajući da je u prvom i drugom razredu po 20 ispitanika. Nismo slobodni odrediti broj subjekata u trećoj kategoriji, „sloboda“ se proteže samo na prve dvije ćelije klasifikacije:

Budući da se statistika kao istraživačka metoda bavi podacima u kojima su obrasci od interesa za istraživača iskrivljeni različitim slučajnim faktorima, većina statističkih proračuna je praćena testiranjem nekih pretpostavki ili hipoteza o izvoru ovih podataka.

Pedagoška hipoteza (naučna hipoteza izjava o prednostima jedne ili druge metode) prevodi se na jezik statističke nauke u procesu statističke analize i preformuliše u najmanje dve statističke hipoteze.

Postoje dvije vrste hipoteza: prva vrsta - deskriptivan hipoteze koje opisuju uzroke i moguće posljedice. Druga vrsta - objašnjavajuće : daju objašnjenje mogućih posledica iz određenih uzroka, a takođe karakterišu uslove pod kojima će te posledice nužno uslediti, odnosno objašnjava se na osnovu kojih faktora i uslova će ta posledica biti. Deskriptivne hipoteze nemaju predviđanje, dok eksplanatorne hipoteze imaju. Eksplanatorne hipoteze navode istraživače da pretpostave postojanje određenih pravilnih odnosa između pojava, faktora i stanja.

Hipoteze u pedagoškom istraživanju mogu sugerisati da će jedno od sredstava (ili grupa njih) biti efikasnije od drugih sredstava. Ovdje se postavlja hipotetička pretpostavka o komparativnoj djelotvornosti sredstava, metoda, metoda, oblika obrazovanja.

Viši nivo hipotetičkog predviđanja je da autor studije pretpostavlja da će neki sistem mjera biti ne samo bolji od drugog, već se među nizom mogućih sistema čini optimalnim u smislu određenih kriterija. Za takvu pretpostavku je potreban rigorozniji i stoga detaljniji dokaz.

Kulaichev A.P. Metode i alati za analizu podataka u Windows okruženju. Ed. 3., revidirano. i dodatne - M: InKo, 1999, str. 129-131

Psihološko-pedagoški rečnik za nastavnike i rukovodioce obrazovnih ustanova. - Rostov-n / D: Phoenix, 1998, str