Să ne familiarizăm cu terminologia folosită în testarea ipotezelor.

Dar - ipoteza nulă (ipoteza scepticului) este o ipoteză despre nici o diferențăîntre probele comparate. Scepticul consideră că diferențele dintre estimările eșantionului obținute din rezultatele cercetării sunt aleatorii.

· Н 1 – o ipoteză alternativă (ipoteza optimistului) este o ipoteză despre prezența diferențelor între eșantioanele comparate. Optimistul consideră că diferențele dintre estimările eșantionului sunt cauzate de motive obiective și corespund diferențelor din populațiile generale.

Testarea ipotezelor statistice este fezabilă numai atunci când elementele eșantioanelor comparate pot fi utilizate pentru a compune unele valoare(criteriu), a cărui lege de distribuție este cunoscută în cazul validității H 0 . Apoi, pentru această cantitate, se poate specifica interval de încredere, in care probabilitate dată R d își atinge valoarea. Acest interval se numește zona critica. Dacă valoarea criteriului se încadrează în regiunea critică, atunci ipoteza H 0 este acceptată. În caz contrar, se acceptă ipoteza H 1.

În cercetarea medicală, se utilizează P d = 0,95 sau P d = 0,99. Aceste valori corespund niveluri de semnificație a = 0,05 sau a = 0,01.

La testarea ipotezelor statistice nivelul de semnificație(a) se numește probabilitatea de respingere ipoteza nulă când are dreptate.

Rețineți că, în esență, procedura de testare a ipotezelor menite să găsească diferențe mai degrabă decât să confirme absenţa lor. Când valoarea criteriului depășește zona critică, putem spune „sceptici” cu inima curată - ei bine, ce mai doriți?! Dacă nu ar exista diferențe, atunci cu o probabilitate de 95% (sau 99%) valoarea calculată ar fi în limitele specificate. Deci nu!...

Ei bine, dacă valoarea criteriului se încadrează în regiunea critică, atunci nu există niciun motiv să credem că ipoteza H 0 este adevărată. Acest lucru indică cel mai probabil una dintre cele două cauze posibile.



a) Dimensiunile eșantionului nu sunt suficient de mari pentru a detecta diferențele. Este probabil ca experimentarea continuă să aducă succes.

b) Există diferențe. Dar sunt atât de mici încât nu au nicio importanță practică. În acest caz, continuarea experimentelor nu are sens.

Să trecem la considerarea unora dintre ipotezele statistice folosite în cercetarea medicală.

§ 3.6. Testarea ipotezelor despre egalitatea varianțelor,
F - Criteriul Fisher

În unele studii clinice, un efect pozitiv este evidențiat nu atât de magnitudinea parametru studiat, cât stabilizare, reducându-și fluctuațiile. În acest caz, se pune întrebarea de a compara două variații generale pe baza rezultatelor unui sondaj prin sondaj. Această sarcină poate fi rezolvată folosind criteriul lui Fisher.

Formularea problemei

legea normală distributie. Dimensiunile eșantionului n 1 și n 2 și variațiile de eșantion sunt, respectiv, egali. Trebuie comparat variaţii generale.

Ipoteze testate:

H 0– dispersii generale sunt la fel;

H 1 - variaţii generale diferit.

Se arată dacă probele sunt prelevate din populații cu legea normală distribuție, atunci dacă ipoteza H 0 este adevărată, raportul dintre variațiile eșantionului se supune distribuției Fisher. Prin urmare, ca criteriu de verificare a validității lui H 0, valoarea F, calculat prin formula

unde sunt variațiile eșantionului.

Acest raport se supune distribuției Fisher cu numărul de grade de libertate al numărătorului n 1 = n 1 -1, iar numărul de grade de libertate al numitorului n 2 = n 2-1. Limitele regiunii critice sunt găsite folosind tabelele de distribuție Fisher sau folosind funcția de calculator FDISP.

Pentru exemplul prezentat în tabel. 3.4, obținem: n 1 \u003d n 2 \u003d 20 - 1 \u003d 19; F = 2,16/4,05 = 0,53. La a = 0,05, limitele regiunii critice sunt egale, respectiv: F stânga = 0,40, F dreapta = 2,53.

Valoarea criteriului a căzut în regiunea critică, deci se acceptă ipoteza H 0: varianțele generale ale eșantioanelor sunt la fel.

§ 3.7. Testarea ipotezelor privind egalitatea mijloacelor,
t-testul elevului

Problema de comparatie mediu două populații generale apare atunci când este magnitudinea trăsătura studiată. De exemplu, atunci când se compară durata tratamentului cu două metode diferite sau numărul de complicații care apar la utilizarea lor. În acest caz, poate fi folosit testul t al lui Student.

Formularea problemei.

Două probe (X 1 ) și (X 2 ) sunt obținute din populații cu legea normală distribuţie şi varianțe egale. Dimensiunile eșantionului n 1 și n 2 , eșantion înseamnă sunt egali și variațiile de eșantion- , respectiv. Trebuie comparat medii generale.

Ipoteze testate:

H 0– medii generale sunt la fel;

H 1 - medii generale diferit.

Se arată că în cazul validităţii ipotezei H 0, valoarea t, calculat prin formula

, (3.10)

distribuite conform legii Student cu numărul de grade de libertate n= n 1 + n 2 - 2.

Aici unde n 1 = n 1 - 1 - numărul de grade de libertate pentru prima probă; n 2 = n 2 – 1 este numărul de grade de libertate pentru al doilea eșantion.

Limitele regiunii critice sunt găsite din tabele t-distributie sau cu ajutorul functiei de calculator STUDRASP. Distribuția lui Student este simetrică față de zero, astfel încât limitele stânga și dreapta ale regiunii critice sunt aceleași în valoare absolută și opuse în semn: - t gr și t gr.

Pentru exemplul prezentat în tabel. 3.4, obținem: n 1 \u003d n 2 \u003d 20 - 1 \u003d 19; t= –2,51, n= 38. La a = 0,05 tgr = 2,02.

Valoarea criteriului depășește granița din stânga a regiunii critice, deci acceptăm ipoteza H 1: medii generale diferit. În același timp, media populatia prima mostră Mai puțin.

Ca urmare a studierii acestui capitol, studentul ar trebui:

stiu

  • ce este o ipoteză statistică;
  • raportul dintre ipotezele teoretice, experimentale și statistice;
  • diferențe între ipotezele nule și alternative;
  • logica evaluării, acceptării și respingerii ipotezelor statistice;
  • noțiuni de erori de primul și al doilea fel, semnificație statistică(fiabilitate);
  • diferențele dintre statisticile parametrice și neparametrice, posibilitățile și limitările acestor două tipuri de teste statistice;

a fi capabil să

  • testați cele mai simple ipoteze despre medie folosind t - Testul elevului pentru mostre pereche (conectate) și nepereche (independente);
  • evaluați două mostre pentru omogenitate folosind t - Testul elevului și F - testul lui Fisher;
  • construiți intervale de încredere pentru parametrii estimați;

proprii

  • aparat metodologic și abilități de bază pentru propunerea și testarea ipotezelor statistice;
  • abilități în evaluarea ipotezelor statistice și construirea intervalelor de încredere.

Strategia generală

Știți deja că în analiza statistică se obișnuiește să se facă distincția între conceptele de „parametru” și „statistică”. Aceste diferențe sunt discutate în detaliu în cap. unu; în tabel. 2.1 rezumă discuția care a avut loc.

Reamintim că orice distribuție poate fi caracterizată prin anumiți parametri teoretici. Așteptările matematice, varianța, asimetria, kurtoza sunt exemple de astfel de parametri de distribuție. variabilă aleatorie in populatia generala. Toate, remarcăm încă o dată acest fapt important, sunt mărimi teoretice care nu sunt aproape niciodată cunoscute în practică. În activitatea practică a unui cercetător, acestea nu pot fi estimate decât cu diferite grade de acuratețe prin calcularea diferitelor statistici, care nu sunt întotdeauna egale cu valorile teoretice ale parametrilor, precum și între ele, așa cum am văzut deja în paragraful 1.4, luând în considerare exemple practice de evaluare a diferiților parametri ai distribuției unei astfel de trăsături de personalitate precum feminitatea - masculinitate.

Tabelul 2.1

Relația dintre parametri și statistici

Și acest lucru nu este surprinzător: la urma urmei, statisticile reflectă comportamentul variabilelor aleatoare numai în eșantionul format de experimentator, și nu în populația generală în sine. Prin urmare, experimentatorul se poate întreba cum se corelează statisticile calculate cu parametrii teoretici de distribuție. Cu alte cuvinte, experimentatorul poate fi interesat dacă datele eșantionului de care dispune sunt de fapt extrase dintr-o populație generală caracterizată de parametrii de distribuție presupuși în teorie. Pentru a răspunde la această întrebare, experimentatorul propune și testează ipoteze statistice.

Ipoteze statistice se numesc ipoteze despre valorile posibile ale parametrilor de distribuție a unei variabile aleatorii în populația generală. Testarea și analiza ipotezelor statistice sunt efectuate ca urmare a colectării și construirii statisticilor. Instrumentele pentru această muncă sunt teste statistice, sau criterii fiecare dintre acestea este un set de reguli standardizate. Pe baza acestor reguli, se ia o decizie cu privire la adevărul sau falsitatea ipotezei statistice.

Luați în considerare din nou exemplul de aruncare a monedelor. Se poate presupune că probabilitatea de a cădea „capete” atunci când aruncați o monedă normală, nefalsă și nedeteriorată este de 50%. Înseamnă că valorea estimata un astfel de eveniment cu o aruncare a monedei de 100 de ori va fi egal cu 50. Testul acestei ipoteze va consta în efectuarea unui test similar, estimarea parametrului care ne interesează ca rezultat prin calcularea statisticilor corespunzătoare și utilizarea acestor statistici pentru testați fiabilitatea ipotezei prezentate. De exemplu, executând 100 de încercări pe o monedă, putem verifica că fiecare parte a apărut de fapt de 50 de ori. Cu toate acestea, este probabil ca rezultatul unui astfel de test să fie totuși oarecum diferit de cel așteptat teoretic. Cu alte cuvinte, chiar dacă capetele apar de puțin sau mai mult de 50 de ori, este puțin probabil să avem motive să credem că moneda este falsă. Situația va fi suspectă atunci când o astfel de abatere de la valorile așteptate teoretic atinge valori mai mari, de exemplu, când „vulturul” nu cade nici măcar o dată la 100 de încercări ale monedei. Un astfel de aranjament pare puțin probabil, având în vedere că totul este în regulă cu moneda.

Deci, este clar că, dacă în cursul unei aruncări de 100 de ori a unei monede, „vulturul” a căzut de exact 50 de ori, totul este în ordine cu moneda. Dacă „vulturul” nu a căzut niciodată, există motive să credem că ceva nu este în regulă cu moneda. Dar unde este linia care separă concluziile pozitive de cele negative? Această întrebare este legată de criteriul de decizie ales. Aceste criterii sunt dezvoltate în statistica matematică pentru a testa ipotezele statistice, teste statistice, care sunt, prin urmare, adesea numite criterii statistice.

Astfel, testarea ipotezelor statistice este efectuată ca urmare a estimării probabilității eveniment aleatoriu, care este considerată valoarea statisticilor. Dacă această probabilitate se dovedește a fi foarte mică cu condiția ca ipoteza propusă să fie adevărată, ipoteza statistică testată este respinsă, în caz contrar ipoteza este acceptată.

Dificultatea acestei proceduri poate consta însă în faptul că este posibil să nu cunoaștem dinainte valoarea specifică a parametrului de distribuție al variabilei aleatoare analizate. De exemplu, în cazul unei monede, se poate presupune că moneda este contrafăcută și, prin urmare, probabilitatea de a cădea capete este mai mult sau mai puțin diferită de 50%. În acest caz, după efectuarea unei serii de teste, nu vom putea aprecia gradul de diferență dintre statisticile obținute, care caracterizează valoarea așteptării matematice a evenimentului analizat, și valoarea reală a acestuia. Și apoi testarea ipotezei statistice poate părea imposibilă. Calea de ieșire din această situație, însă, poate fi estimarea probabilității unei ipoteze opuse celei prezentate. Cu alte cuvinte, în acest caz este posibil, de exemplu, să se înainteze o ipoteză despre egalitatea probabilității teoretice de 50%. Dacă această ipoteză se dovedește a fi falsă, ipoteza alternativă este acceptată.

Într-adevăr, atunci când testează ipoteze statistice, cercetătorul se ocupă întotdeauna nu de una, ci de două ipoteze, care sunt notate ca H 0 și H 1. Una dintre aceste ipoteze se numește nulă, cealaltă se numește alternativă, i.e. infirmând zero.

Ipoteza nulă H 0 este întotdeauna specific. Afirmă întotdeauna o anumită valoare specifică a parametrului de distribuție. De exemplu, ipoteza așteptării ar putea fi formulată după cum urmează: μ = ȘI, Unde ȘI este o valoare specifică a lui μ, iar ipoteza privind egalitatea celor două mărimi ale varianței este σ1 = σ2.

Ipoteza alternativă H 1 este întotdeauna formulat mai puțin specific, de exemplu: μ > ȘI ; * σ2 etc. Dar, de regulă, se dovedește că experimentatorul nu este interesat de o anumită ipoteză nulă H 0, ci doar o ipoteză alternativă mai puțin specifică H 1, deoarece aceasta este mai în concordanță cu ipoteza științifică testată de el în experiment.

Efectuând o evaluare empirică a unui parametru teoretic, experimentatorul determină semnificația statistică a rezultatului obținut, luând ca bază ipoteza de adevăr. H 0. Semnificația statistică este probabilitatea ca într-un număr infinit de experimente care reproduc complet condițiile experimentului, să obținem aceeași valoare sau chiar mai mare a statisticilor construite. Dacă probabilitatea de a obține o astfel de statistică și chiar mai mare într-un număr infinit de experimente cu aceleași condiții, în condițiile în care ipoteza nulă este adevărată, se dovedește a fi mică, experimentatorul abandonează ipoteza nulă în favoarea celei alternative.

Logica descrisă vizual este prezentată în Fig. 2.1. Evident, aici sunt prezentate două ipoteze alternative. Una dintre ele este specifică și presupune că așteptarea matematică este egală cu zero. Această ipoteză este etichetată H 0. Curba corespunzătoare acesteia descrie distribuția variabilei aleatoare Z prezisă de această ipoteză. A doua ipoteză, notată ca H 1 este mai puțin specific. Se afirmă doar că valoarea așteptărilor matematice trebuie să depășească zero. În principiu, există un număr infinit de curbe care descriu distribuțiile corespunzătoare acestei ipoteze. Curba prezentată este una dintre cele posibile. Valoare Ζ exp caracterizează valoarea statisticilor estimând parametrul teoretic μ în experiment. Aceasta este ceea ce experimentatorul are la dispoziție, ceea ce a putut obține prin colectarea datelor empirice. De exemplu, poate fi valoarea mediei aritmetice pentru eșantion. Apoi, verificarea ipotezelor statistice propuse ar trebui să constea în încercarea de a estima cât de probabil este într-un alt experiment similar să se obțină aceeași valoare a lui Zexp sau chiar mai mult dacă ipoteza nulă este adevărată. Evident, această probabilitate este egală cu aria de sub curba de distribuție presupusă de această ipoteză. Această zonă din stânga este limitată de statisticile calculate, în dreapta nu este limitată. O astfel de zonă, după cum ne amintim (vezi paragraful 1.2), se numește cuantila de distribuție. Poate fi definit astfel:

Orez. 2.1.

Cantitatea de cuantilă necesară pentru a accepta sau a respinge o ipoteză R în această ecuație este așa-numitul nivelul de semnificație statistici calculate Zexp. Cu cât această valoare este mai mare, cu atât este mai probabil ca datele obținute în experiment să fie descrise de distribuție f Ho( Z ), adică distribuția prezisă de ipoteză H 0. Dimpotrivă, cu cât valoarea este mai mică R, cu atât este mai puțin probabil ca datele empirice să se potrivească efectiv cu distribuția f H0(Z), și cu atât este mai probabil ca acestea să fie descrise printr-o distribuție care presupune o valoare mai mare a μ. Astfel, evaluarea valorii R, se poate lua o decizie în favoarea uneia dintre cele două ipoteze prezentate.

Ipoteză H 0 poate fi acceptat dacă valoarea cuantilei care determină semnificația statistică a valorii empirice X, pare a fi suficient de mare. Ipoteză alternativă H 1 este acceptată dacă valoarea cuantilei, care determină semnificația statistică a rezultatului obținut în experiment, se dovedește a fi neglijabil de mică. Problema este însă care valoare a cuantilei, care specifică semnificația statistică, ar trebui considerată suficient de mare, care ar trebui considerată neglijabil de mică. Pentru a rezolva această problemă, să aruncăm o privire mai atentă la ce opțiuni are un experimentator atunci când evaluează ipotezele statistice (Tabelul 2.2).

Este clar că ipotezele statistice prezentate pot fi fie adevărate, fie false. Din moment ce ipotezele H 0 și H 1 sunt alternative, adică se exclud reciproc, există doar două cazuri ipotetice care caracterizează adevărul sau falsitatea ipotezelor luate în considerare: fie H 0 va fi corect și H 1 respectiv incorect, sau invers. Deoarece experimentatorul care evaluează ipotezele nu știe niciodată care dintre ipoteze este corectă, o sută de decizii de a accepta sau respinge ipoteza H 0 nu are nimic de-a face cu adevărul sau falsitatea lui - la urma urmei, tocmai acestea încearcă să le stabilească. Astfel, în cursul testării ipotezelor statistice, există patru rezultate posibile, dintre care doar două pot fi considerate favorabile pentru experimentator, indiferent de ipoteza pe care cercetătorul dorește de fapt să demonstreze.

Tabelul 2.2

Matricea rezultatelor în evaluarea ipotezelor statistice

Dacă ipoteza H 0 este corect și acceptat ca rezultat analize statistice, experimentatorul nu greșește. Și acesta este un rezultat favorabil pentru cercetător, chiar dacă ar dori să accepte o ipoteză alternativă. De asemenea, experimentatorul nu greșește atunci când respinge ipoteza. H 0, ceea ce este de fapt incorect. Cu toate acestea, se poate întâmpla ca ipoteza nulă să fie de fapt adevărată, dar experimentatorul o respinge totuși. În acest caz, el face o greșeală, care se numește în mod obișnuit tastați o eroare sau α( alfa )- o greseala. Eroare de tip II sau β( beta )- o greseala Un rezultat se numește un rezultat în care experimentatorul acceptă ipoteza nulă, care de fapt se dovedește a fi falsă.

Este clar că cu cât este mai mare probabilitatea care determină semnificația statistică a rezultatului obținut în experiment, la care experimentatorul este gata să abandoneze ipoteza nulă în favoarea uneia alternative, cu atât este mai mare probabilitatea unei erori de tip I și scade probabilitatea unei erori de tip II (Fig. 2.2). Dimpotrivă, prin scăderea valorii probabilității la care experimentatorul respinge ipoteza nulă, el riscă astfel să facă o eroare de tip II cu o probabilitate mai mare, dar se protejează astfel într-o măsură mai mare de o eroare de tip I. Astfel, întrebarea este la ce nivel de semnificație ipoteza H 0 poate fi respins sau acceptat, este de fapt legat de care dintre cele două posibile erori este mai puțin importantă pentru experimentator. Aplicând o strategie mai conservatoare pentru testarea unei ipoteze statistice, experimentatorul neglijează pericolul unei erori de tip II. Aplicând o versiune mai radicală a acțiunii, experimentatorul, parcă, uită de eroarea de primul fel.

Orez. 2.2.

Dacă acceptarea unei ipoteze statistice implică orice consecințe sociale importante, se poate aplica o strategie mai conservatoare de evaluare a acesteia. Dacă din neacceptarea ipotezei statistice ar putea rezulta consecințe grave, se poate proceda mai puțin conservator.

De exemplu, să fie luată în considerare problema determinării retardului mintal al unui anumit copil. În cursul unei examinări psihologice, s-a constatat că IQ-ul său este sub media pentru această populație de subiecți. Astfel, a apărut o presupunere despre dezvoltarea intelectuală insuficientă a acestui copil și necesitatea în legătură cu aceasta de a-l trimite la un internat special pentru deficienți mintal. Pentru a testa această ipoteză au fost formulate două ipoteze statistice alternative, dintre care una presupune că datele obținute în cadrul anchetei caracterizează distribuția obișnuită a populației cu o așteptare matematică egală cu granița care determină retardul mintal, să zicem, 75 de puncte (ipoteză). H 0), iar al doilea presupune o valoare mai mică a așteptării matematice, i.e. așteptările matematice sunt mai mici decât o limită dată (ipoteză H unu). Să presupunem, în continuare, că în cursul evaluării semnificației statistice a unui indicator empiric al dezvoltării intelectuale a unui copil, s-a dovedit că probabilitatea de a obține același rezultat, sau chiar mai mic, într-un alt test aleatoriu, nu este mai mare de una. șansă în 20. Se pune întrebarea: este posibil să se judece pe baza acestui rezultat despre valabilitatea empirică insuficientă a ipotezei nule și, prin urmare, să o abandonăm în favoarea unei ipoteze alternative? H unu? Este clar că răspunsul la această întrebare va depinde în mare măsură de ce fel de acțiuni eronate pot fi considerate mai acceptabile. Dacă suntem convinși că rămânerea unui copil normal, deși cu scăzut facultăți mentaleîntr-un internat pentru deficienți mintal este mai bine decât educarea unui retardat mintal într-o școală normală, putem lua o singură decizie în ceea ce privește stabilirea limitelor nivelului de semnificație, dacă gândim diferit, trebuie să luăm o altă decizie.

Din fericire, cercetătorul este de obicei scutit de problemele de a rezolva acest tip de problemă. Cert este că este imposibil din punct de vedere statistic să se fundamenteze nivelul optim de semnificație, care ar putea fi luat drept referință la alegerea ipotezelor statistice. Cu toate acestea, există unele convenții cvasi-statistice acceptate implicit (Tabelul 2.3). Se ia în considerare rezultatul empiric semnificativ din punct de vedere statistic pentru a respinge ipoteza nulă, dacă probabilitatea de a obține același rezultat sau mai mare (mai mic) într-un alt test aleator este mai mică de o șansă din 20, i.e. când valoarea R se dovedește a fi mai mic de 0,05. Dacă valoarea R este mai mic de 0,01, atunci rezultatul este luat în considerare extrem de semnificative a respinge ipoteza nulă. În cazul în care valoarea R depăşeşte 0,10, se consideră că experimentul nu a stabilit diferenţe semnificative statistic faţă de parametrul teoretic presupus de ipoteza nulă. Dacă valoarea primită R este între 0,10 și 0,05, rezultatul este considerat nedeterminat. Se spune că se află la limita nivelurilor de semnificație. Într-un alt fel, acest rezultat se numește marginal semnificativ.

Tabelul 2.3

Valori cuantile standard care determină luarea deciziilor statistice

Strategia descrisă pentru testarea și acceptarea ipotezelor este universală și cea mai comună. O strategie mai conservatoare poate fi să luați valorile probabilității de 0,01 și 0,001 ca niveluri de încredere și, respectiv, foarte fiabile și să setați valoarea probabilității la 0,05 pentru nivelul nesigur (O. Yu. Ermolaev, ). Atunci rezultatul semnificativ semnificativ va fi cel care se află în intervalul de la 0,01 la 0,05. Cu toate acestea, o astfel de strategie cercetare psihologică este rar folosit însă.

În orice caz, trebuie avut în vedere că rezultatele analizei ipotezelor statistice nu pot fi considerate suficiente pentru evaluarea ipotezelor experimentale dacă sunt luate de la sine, fără legătură cu întreaga situație experimentală.

Ipoteze statistice nu trebuie confundat cu ipotezele experimentale și teoretice. Ipotezele teoretice reflectă natura legăturilor și regularităților fenomenelor studiate. Ipotezele experimentale sunt formulate pe baza studiului unor astfel de cunoștințe teoretice într-un anumit domeniu și astfel concretizează ipotezele teoretice în sine. Ca și ipotezele statistice, ele implică formularea simultană a ipotezelor concurente ca negând existența presupusei relații cauzale. Datorită acestui fapt, regularitatea empirică studiată poate permite diferite interpretări cauzale, numite ipoteze concurente.

Spre deosebire de cele experimentale, ipotezele statistice sunt doar un instrument de evaluare a datelor colectate în timpul experimentului și nu implică inițial nicio regularitate empirică. Rezultatul verificării lor este doar de natură statistică și, prin urmare, nu implică acceptarea sau respingerea automată atât a ipotezelor experimentale, cât și, cu atât mai mult, a ipotezelor teoretice.

Statistica este o știință complexă de măsurare și analiză a diferitelor date. Ca și în multe alte discipline, în această industrie există conceptul de ipoteză. Deci, o ipoteză în statistică este orice poziție care trebuie acceptată sau respinsă. Mai mult, în această industrie există mai multe tipuri de astfel de ipoteze, care sunt similare ca definiție, dar diferă în practică. Ipoteza nulă este subiectul de studiu de astăzi.

De la general la particular: ipoteze în statistică

Un alt, nu mai puțin important, se îndepărtează de la definiția principală a ipotezelor - o ipoteză statistică este studiul setului general de obiecte importante pentru știință, cu privire la care oamenii de știință trag concluzii. Poate fi testat folosind un eșantion (parte a populației). Iată câteva exemple de ipoteze statistice:

1. Performanța întregii clase poate depinde de nivelul de studii al fiecărui elev.

2. Cursul elementar de matematică este în mod egal asimilat atât de copiii care au venit la școală la 6 ani, cât și de copiii care au venit la 7 ani.

O ipoteză simplă în statistică este o presupunere care caracterizează în mod unic un anumit parametru al unei cantități luate de un om de știință.

Un complex este format din mai multe sau un număr infinit de simple. Este indicată o anumită zonă sau nu există un răspuns exact.

Este util să înțelegem mai multe definiții ale ipotezelor în statistică pentru a nu le confunda în practică.

Conceptul de ipoteză nulă

Ipoteza nulă este teoria conform căreia există două populații care nu se pot distinge. Cu toate acestea, pe nivel științific nu există conceptul de „nu diferă”, dar există „asemănarea lor este egală cu zero”. Din această definiție s-a format conceptul. În statistică, ipoteza nulă este denumită H0. Mai mult, valoarea extremă a imposibilului (putin probabil) este considerată a fi de la 0,01 la 0,05 sau mai puțin.

Este mai bine să înțelegeți ce este o ipoteză nulă, un exemplu din viață vă va ajuta. Profesorul de la universitate a sugerat că nivel diferit pregătirea elevilor din două grupe pentru munca de testare este cauzată de parametrii nesemnificativi, motive aleatorii care nu afectează nivelul general de educație (diferența de pregătire a două grupe de elevi este zero).

Cu toate acestea, merită să oferim un exemplu de ipoteză alternativă - o presupunere care respinge afirmația teoriei nule (H1). De exemplu: directorul universității a sugerat că diferitele niveluri de pregătire pentru munca de testare în rândul studenților din cele două grupe sunt cauzate de utilizarea de către profesori a unor metode de predare diferite (diferența de pregătire a celor două grupe este semnificativă și există o explicație pentru aceasta).

Acum puteți vedea imediat diferența dintre conceptele de „ipoteză nulă” și „ipoteză alternativă”. Exemplele ilustrează aceste concepte.

Testarea ipotezei nule

A face o presupunere este jumătate din necaz. Adevărata provocare pentru începători este testarea ipotezei nule. Aici așteaptă multe dintre dificultăți.

Folosind metoda ipotezei alternative, care afirmă ceva opus teoriei nule, puteți compara ambele opțiuni și o puteți alege pe cea corectă. Așa funcționează statisticile.

Fie ipoteza nulă H0 și alternativa H1, atunci:

H0: c = c0;
H1: c ≠ c0.

Aici c este o valoare medie a populației care trebuie găsită și c0 este valoarea dată inițial față de care este testată ipoteza. Există și un anumit număr X - valoarea medie a probei, prin care se determină c0.

Deci, testul este de a compara X și c0, dacă X=c0, atunci ipoteza nulă este acceptată. Dacă Х≠c0, atunci prin condiție alternativa este considerată corectă.

Metoda de verificare „încredere”.

Există cel mai puternic mod prin care ipoteza nulă este ușor de testat în practică. Constă în construirea unui interval de valori cu o precizie de până la 95%.

Mai întâi trebuie să cunoașteți formula pentru calcularea intervalului de încredere:
X - t*Sx ≤ c ≤ X + t*Sx,

unde X este numărul dat inițial pe baza ipotezei alternative;
t - valori tabulare (coeficientul studentului);
Sx este eroarea standard, care este calculată ca Sx = σ/√n, unde numărătorul este abaterea standard și numitorul este dimensiunea eșantionului.

Deci, să presupunem o situație. Înainte de reparație, transportorul producea 32,1 kg de produse finite pe zi, iar după reparație, potrivit antreprenorului, coeficientul acțiune utilă a crescut, iar transportorul, conform unui control săptămânal, a început să producă în medie 39,6 kg.

Ipoteza nulă ar afirma că reparația nu a avut niciun efect asupra eficienței transportorului. O ipoteză alternativă ar spune că reparația a schimbat radical eficiența transportorului, astfel încât productivitatea acestuia a crescut.

Conform tabelului găsim n=7, t = 2,447, de unde formula va lua următoarea formă:

39,6 - 2,447*4,2 ≤ s ≤ 39,6 + 2,447*4,2;

29,3 ≤ c ≤ 49,9.

Se dovedește că valoarea 32,1 se află în interval și, prin urmare, valoarea propusă de alternativa - 39,6 - nu este acceptată automat. Amintiți-vă că mai întâi se testează ipoteza nulă și apoi cea opusă.

Varietăți de negare

Înainte de aceasta, a fost luată în considerare o astfel de variantă de construire a unei ipoteze, unde H0 afirmă ceva, iar H1 îl respinge. De unde ar putea veni un astfel de sistem?

H0: c = c0;
H1: c ≠ c0.

Dar există încă două metode legate de respingere. De exemplu, ipoteza nulă afirmă că nota medie pentru o clasă este mai mare de 4,54, în timp ce alternativa ar spune atunci că nota medie pentru aceeași notă este mai mică de 4,54. Și va arăta astfel sub forma unui sistem:

H0: s ⩾ 4,54;
H1: cu< 4.54.

Rețineți că ipoteza nulă afirmă că valoarea este mai mare sau egală cu, în timp ce cea statistică afirmă că este strict mai mică. Gravitatea semnului inegalității contează foarte mult!

Verificare statistică

Testarea statistică a ipotezelor nule constă în utilizarea unui test statistic. Astfel de criterii sunt supuse diferitelor legi de distribuție.

De exemplu, există un test F, care este calculat folosind distribuția Fisher. Există un test T, cel mai des folosit în practică, în funcție de distribuția Studentului. Bunătatea de potrivire a lui Pearson, etc.

Zona de acceptare a ipotezei nule

În algebră există un concept de „domeniu al valorilor admisibile”. Acesta este un astfel de segment sau punct de pe axa X, pe care există un set de valori statistice pentru care ipoteza nulă este adevărată. Punctele extreme ale segmentului sunt valori critice. Razele din partea dreaptă și stângă a segmentului sunt regiuni critice. Dacă valoarea găsită este inclusă în ele, atunci teoria nulă este infirmată și cea alternativă este acceptată.

Infirmarea ipotezei nule

Ipoteza nulă în statistică este uneori un concept foarte ciudat. În timpul verificării, pot fi făcute două tipuri de erori:

1. Respingerea ipotezei nule corecte. Să notăm primul tip ca a=1.
2. Acceptarea unei false ipoteze nule. Al doilea tip va fi notat cu a=2.

Trebuie înțeles că aceștia nu sunt aceiași parametri, rezultatele erorilor pot diferi semnificativ unele de altele și pot avea mostre diferite.

Un exemplu de două tipuri de erori

Conceptele complexe sunt mai ușor de înțeles cu un exemplu.

În timpul producerii unui anumit medicament, oamenii de știință necesită o precauție extremă, deoarece depășirea dozei unuia dintre componente provoacă nivel inalt toxicitatea medicamentului finit, din care pacientii care îl iau pot muri. Cu toate acestea, la nivel chimic, este imposibil de detectat o supradoză.
Din acest motiv, înainte de a elibera medicamentul spre vânzare, o doză mică din acesta este testată pe șobolani sau iepuri prin injectarea acestora cu medicamentul. Dacă cei mai mulți dintre subiecți mor, atunci medicamentul nu poate fi vândut; dacă subiecții de testat sunt în viață, atunci medicamentul poate fi vândut în farmacii.

Primul caz: de fapt, medicamentul nu a fost toxic, dar s-a făcut o neglijență în timpul experimentului și medicamentul a fost clasificat ca toxic și nu a fost permis să fie vândut. A=1.

Al doilea caz: în cursul unui alt experiment, la testarea unui alt lot de medicament, s-a decis că medicamentul nu este toxic și a fost permis să fie vândut, deși de fapt drogul era otrăvitor. A=2.

Prima opțiune va implica costuri financiare mari pentru furnizorul-antreprenor, deoarece va trebui să distrugă întregul lot de medicamente și să înceapă de la zero.

A doua situație va provoca moartea pacienților care au cumpărat și au folosit acest medicament.

Teoria probabilității

Nu numai zero, ci toate ipotezele din statistică și economie sunt împărțite în funcție de nivelul de semnificație.

Nivel de semnificație - procentul de apariție a erorilor de primul fel (respingerea ipotezei nule corecte).

Primul nivel este de 5% sau 0,05, adică probabilitatea de a face o greșeală este de la 5 la 100 sau de la 1 la 20.
al doilea nivel este 1% sau 0,01, adică probabilitatea este de 1 la 100.
al treilea nivel este 0,1% sau 0,001, probabilitatea este de 1 la 1000.

Criterii de testare a ipotezelor

Dacă oamenii de știință au ajuns deja la concluzia că ipoteza nulă este corectă, atunci trebuie testată. Acest lucru este necesar pentru a exclude o eroare. Există un criteriu principal pentru testarea ipotezei nule, care constă din mai multe etape:

1. Se ia probabilitatea de eroare admisibilă P=0,05.
2. Statisticile sunt selectate pentru criteriul 1.
3. Folosind o metodă cunoscută, se găsește aria valorilor admisibile.
4. Valoarea statisticii T este acum calculată.
5. Dacă T (statistica) aparține zonei de acceptare a ipotezei nule (ca și în metoda „încrederii”), atunci ipotezele sunt considerate adevărate, ceea ce înseamnă că ipoteza nulă în sine rămâne adevărată.

Așa funcționează statisticile. Ipoteza nulă, atunci când este testată corespunzător, va fi acceptată sau respinsă.

Este de remarcat faptul că pentru antreprenorii și utilizatorii obișnuiți, primele trei etape pot fi foarte dificil de realizat cu acuratețe, astfel încât matematicienii profesioniști au încredere în ele. Dar etapele 4 și 5 pot fi efectuate de oricine știe suficient metode statistice verificări.

IPOTEZE STATISTICE

Datele eșantionului obținute în experimente sunt întotdeauna limitate și sunt în mare parte aleatorii. De aceea, pentru analizarea unor astfel de date se utilizează statistica matematică, ceea ce face posibilă generalizarea tiparelor obținute în eșantion și extinderea acestora la întreaga populație generală.

Datele obținute în urma experimentului pe orice eșantion servesc drept bază pentru judecarea populației generale. Cu toate acestea, datorită acțiunii unor motive probabilistice aleatorii, o estimare a parametrilor populației generale făcută pe baza datelor experimentale (eșantion) va fi întotdeauna însoțită de o eroare și, prin urmare, astfel de estimări ar trebui considerate ca fiind conjecturale și nu ca declarații finale. Sunt numite ipoteze similare despre proprietățile și parametrii populației generale ipotezele statistice . După cum G.V. Sukhodolsky: „O ipoteză statistică este de obicei înțeleasă ca o presupunere formală că asemănarea (sau diferența) unor caracteristici parametrice sau funcționale este aleatorie sau, dimpotrivă, nu întâmplătoare”.

Esența testării unei ipoteze statistice este de a stabili dacă datele experimentale și ipoteza propusă sunt consecvente, dacă este permisă atribuirea discrepanței dintre ipoteză și rezultatul analizei statistice a datelor experimentale unor cauze aleatorii. Astfel, o ipoteză statistică este o ipoteză științifică care permite testarea statistică, iar statistica matematică este o disciplină științifică a cărei sarcină este de a fundamenta științific testarea ipotezelor statistice.

Ipotezele statistice sunt împărțite în nule și alternative, direcționale și nedirecționale.

Ipoteza nulă(H0) este ipoteza fără diferență. Dacă vrem să demonstrăm semnificația diferențelor, atunci este necesară ipoteza nulă respinge, altfel este necesar a confirma.

Ipoteză alternativă (H 1) este o ipoteză despre semnificația diferențelor. Asta vrem să dovedim, motiv pentru care uneori este numită experimental ipoteză.

Sunt sarcini când vrem să dovedim exact insignifiante diferențe, adică să confirme ipoteza nulă. De exemplu, dacă trebuie să ne asigurăm că subiecții diferiți primesc sarcini, deși diferite, dar echilibrate în dificultate, sau că probele experimentale și de control nu diferă unele de altele în unele caracteristici semnificative. Cu toate acestea, de cele mai multe ori, mai trebuie să dovedim semnificația diferențelor pentru că sunt mai informative pentru noi în căutarea noului.

Ipotezele nule și alternative pot fi direcționale sau nedirecționale.

Ipoteze direcționate - dacă se presupune că într-un grup valorile caracteristice sunt mai mari, iar în celălalt mai mici:

H 0: X 1 mai puțin decât X 2,

H 1: X 1 depaseste X 2.

Ipoteze nedirijate - dacă se presupune că formele de distribuție a unei trăsături în grupuri diferă:

H 0: X 1 cu nimic diferit de X 2,

H 1: X 1 e diferit X 2.

Dacă observăm că într-unul dintre grupuri valorile individuale ale subiecților pentru un anumit atribut, de exemplu, în activitatea socială, sunt mai mari, iar în celălalt sunt mai mici, atunci pentru a testa semnificația acestor diferențe, trebuie să formulăm ipoteze direcţionate.

Dacă vrem să dovedim asta în grup ȘI sub influența unor influențe experimentale s-au produs modificări mai pronunțate decât în ​​grup B, atunci trebuie să formulăm și ipoteze direcționate.

Dacă vrem să demonstrăm că formele de distribuţie a unei trăsături în grupuri diferă ȘIși B, apoi se formulează ipoteze nedirecţionate.

Testarea ipotezelor se realizează folosind criteriile de evaluare statistică a diferențelor.

Concluzia rezultată se numește o decizie statistică. Subliniem că o astfel de soluție este întotdeauna probabilistică. La testarea unei ipoteze, datele experimentale pot contrazice ipoteza H 0 , atunci această ipoteză este respinsă. Altfel, i.e. dacă datele experimentale sunt în concordanță cu ipoteza H 0 Ea nu se abate. Se spune adesea în astfel de cazuri că ipoteza H 0 admis. Acest lucru arată că testarea statistică a ipotezelor pe baza datelor experimentale din eșantion este inevitabil asociată cu riscul (probabilitatea) de a lua o decizie falsă. În acest caz, sunt posibile erori de două feluri. O eroare de tip I va apărea atunci când se ia o decizie de respingere a ipotezei. H 0 , deși în realitate se dovedește a fi adevărat. O eroare de tip II va apărea atunci când se ia decizia de a nu respinge ipoteza. H 0, deși în realitate va fi incorect. Evident, concluziile corecte pot fi trase și în două cazuri. Tabelul 7.1 rezumă cele de mai sus.

Tabelul 7.1

Este posibil ca un psiholog să se înșele în a lui solutie statistica; după cum vedem din tabelul 7.1, aceste erori pot fi doar de două feluri. Întrucât este imposibil să se excludă erori în adoptarea ipotezelor statistice, este necesar să se minimizeze consecințele posibile, i.e. acceptând o ipoteză statistică incorectă. În cele mai multe cazuri singura cale minimizarea erorilor este de a mări dimensiunea eșantionului.

CRITERII STATISTICE

Test statistic- aceasta regula de decizie, care oferă un comportament de încredere, adică acceptând adevăratul și respingând ipoteza falsă cu mare probabilitate.

Criteriile statistice indică și metoda de calcul a unui anumit număr și acest număr în sine.

Când spunem că semnificația diferențelor a fost determinată de criteriu j*(criteriul este transformarea unghiulară Fisher), atunci ne referim că am folosit metoda j* pentru a calcula un anumit număr.

Prin raportul dintre valorile empirice și critice ale criteriului, putem judeca dacă ipoteza nulă este confirmată sau infirmată.

În cele mai multe cazuri, pentru a recunoaște diferențele ca fiind semnificative, este necesar ca valoarea empirică a criteriului să o depășească pe cea critică, deși există criterii (de exemplu, testul Mann-Whitney sau testul semnului) în care avem trebuie să respecte regula opusă.

În unele cazuri, formula de calcul a criteriului include numărul de observații din eșantionul de studiu, notat ca n. În acest caz, valoarea empirică a criteriului este simultan un test pentru testarea ipotezelor statistice. Folosind un tabel special, determinăm ce nivel de semnificație statistică a diferențelor corespunde unei valori empirice date. Un exemplu de astfel de criteriu este criteriul j*, calculat pe baza transformării unghiulare Fisher.

În majoritatea cazurilor, totuși, aceeași valoare empirică a criteriului se poate dovedi a fi semnificativă sau nesemnificativă, în funcție de numărul de observații din eșantionul de studiu ( n) sau asupra așa-numitului număr de grade de libertate, care se notează ca v sau cum df.

Numărul de grade de libertate v egal cu numărul de clase serie de variații minus numărul de condiții în care s-a format. Aceste condiții includ dimensiunea eșantionului ( n), medie și varianță.

Să presupunem că un grup de 50 de persoane a fost împărțit în trei clase conform principiului:

Capabil să lucreze pe computer;

Capabil să efectueze doar anumite operații;

Nu pot lucra pe computer.

Au fost 20 de persoane în primul și al doilea grup și 10 în al treilea.

Suntem limitați de o singură condiție - dimensiunea eșantionului. Prin urmare, chiar dacă am pierdut date despre câte persoane nu știu să folosească un computer, putem determina acest lucru, știind că sunt 20 de subiecți de testare la clasa I și a II-a. Nu suntem liberi să stabilim numărul de subiecți din a treia categorie, „libertatea” se extinde doar la primele două celule ale clasificării:

Deoarece statistica ca metodă de cercetare se ocupă de date în care tiparele de interes pentru cercetător sunt distorsionate de diverși factori aleatori, majoritatea calculelor statistice sunt însoțite de testarea unor ipoteze sau ipoteze despre sursa acestor date.

Ipoteza pedagogică (ipoteza științifică o afirmație despre avantajul unei metode sau alteia) este tradusă în limbajul științei statistice în procesul de analiză statistică și reformulată în cel puțin două ipoteze statistice.

Există două tipuri de ipoteze: primul tip - descriptiv ipoteze care descriu cauzele și posibilele consecințe. Al doilea tip - explicativ : ele dau o explicație a consecințelor posibile din anumite cauze și, de asemenea, caracterizează condițiile în care aceste consecințe vor urma în mod necesar, adică se explică în virtutea factorilor și condițiilor care vor fi această consecință. Ipotezele descriptive nu au previziune, în timp ce ipotezele explicative au. Ipotezele explicative îi conduc pe cercetători să presupună existența unor relații regulate între fenomene, factori și condiții.

Ipotezele din cercetarea pedagogică pot sugera că unul dintre mijloace (sau un grup dintre ele) va fi mai eficient decât alte mijloace. Aici se face o presupunere ipotetică despre eficiența comparativă a mijloacelor, metodelor, metodelor, formelor de educație.

Un nivel mai ridicat de predicție ipotetică este acela că autorul studiului emite ipoteza că un anumit sistem de măsuri nu numai că va fi mai bun decât altul, dar între o serie de sisteme posibile pare optim în ceea ce privește anumite criterii. O astfel de presupunere are nevoie de o dovadă mai riguroasă și deci mai detaliată.

Kulaichev A.P. Metode și instrumente pentru analiza datelor în mediul Windows. Ed. al 3-lea, revizuit. si suplimentare - M: InKo, 1999, p. 129-131

Dicționar psihologic-pedagogic pentru profesori și șefi de instituții de învățământ. - Rostov-n / D: Phoenix, 1998, p. 92