În cel precedent am dat o serie de formule care ne permit să aflăm caracteristicile numerice ale funcțiilor atunci când sunt cunoscute legile de distribuție a argumentelor. Totuși, în multe cazuri, pentru a găsi caracteristicile numerice ale funcțiilor, nici nu este nevoie să cunoaștem legile de distribuție a argumentelor, ci este suficient să cunoaștem doar câteva dintre caracteristicile lor numerice; în acest caz, ne lipsim deloc de nicio lege de distribuție. Determinarea caracteristicilor numerice ale funcțiilor prin caracteristicile numerice date ale argumentelor este utilizată pe scară largă în teoria probabilității și face posibilă simplificarea semnificativă a soluționării unui număr de probleme. În cea mai mare parte, astfel de metode simplificate se referă la funcții liniare; cu toate acestea, unele elementare funcții neliniare acceptă, de asemenea, o abordare similară.

În prezent vă prezentăm o serie de teoreme asupra caracteristici numerice functii, care in totalitatea lor reprezinta un aparat foarte simplu de calcul al acestor caracteristici, aplicabil intr-o gama larga de conditii.

1. Aşteptarea matematică a unei variabile non-aleatoare

Proprietatea declarată este destul de evidentă; se poate dovedi considerând o variabilă non-aleatoare ca un tip particular al uneia aleatoare, cu o valoare posibilă cu o probabilitate de unu; apoi conform formulei generale pentru așteptarea matematică:

.

2. Dispersia unei variabile non-aleatoare

Dacă nu valoare aleatorie, apoi

3. Îndepărtarea unei variabile non-aleatoare dincolo de semnul așteptării matematice

, (10.2.1)

adică, o valoare non-aleatorie poate fi scoasă din semnul așteptării.

Dovada.

a) Pentru cantităţi discontinue

b) Pentru cantităţi continue

.

4. Îndepărtarea unei valori non-aleatoare pentru semnul varianței și abaterii standard

Dacă este o variabilă non-aleatoare și este aleatorie, atunci

, (10.2.2)

adică, o valoare non-aleatorie poate fi scoasă din semnul de dispersie prin pătratul acestuia.

Dovada. Prin definiția varianței

Consecinţă

,

adică, o valoare non-aleatorie poate fi scoasă din semnul abaterii standard prin valoarea sa absolută. Obținem demonstrația extragând rădăcina pătrată din formula (10.2.2) și ținând cont că r.s.c. este o valoare esential pozitiva.

5. Aşteptarea matematică a sumei variabilelor aleatoare

Să demonstrăm că pentru oricare două variabile aleatoare și

adică așteptarea matematică a sumei a două variabile aleatoare este egală cu suma așteptărilor lor matematice.

Această proprietate este cunoscută sub numele de teorema adăugării așteptărilor.

Dovada.

a) Fie un sistem de variabile aleatoare discontinue. Aplicabil la suma variabilelor aleatoare formula generala(10.1.6) pentru așteptarea unei funcții a două argumente:

.

Ho nu este altceva decât probabilitatea totală ca valoarea să ia valoarea:

;

Prin urmare,

.

În mod similar, vom demonstra asta

,

iar teorema este demonstrată.

b) Fie un sistem de variabile aleatoare continue. Conform formulei (10.1.7)

. (10.2.4)

Transformăm prima dintre integrale (10.2.4):

;

de asemenea

,

iar teorema este demonstrată.

Trebuie remarcat în mod special că teorema de adunare a așteptărilor matematice este valabilă pentru orice variabile aleatoare - atât dependente, cât și independente.

Teorema adunării așteptărilor poate fi generalizată la un număr arbitrar de termeni:

, (10.2.5)

adică așteptarea matematică a sumei mai multor variabile aleatoare este egală cu suma așteptărilor lor matematice.

Pentru a dovedi, este suficient să aplicați metoda inducției complete.

6. Aşteptări matematice funcție liniară

Luați în considerare o funcție liniară a mai multor argumente aleatoare:

unde sunt coeficienți non-aleatori. Să demonstrăm asta

, (10.2.6)

adică media unei funcții liniare este egală cu aceeași funcție liniară a mediei argumentelor.

Dovada. Folosind teorema de adunare m.o. iar regula de a scoate o variabilă non-aleatoare din semnul lui m. o., obținem:

.

7. Dispepaceastă sumă de variabile aleatoare

Varianța sumei a două variabile aleatoare este egală cu suma varianțelor lor plus de două ori momentul de corelație:

Dovada. Denota

Conform teoremei de adunare a așteptărilor matematice

Să trecem de la variabile aleatoare la variabilele centrate corespunzătoare. Scăzând termen cu termen din egalitatea (10.2.8) egalitatea (10.2.9), avem:

Prin definiția varianței

Q.E.D.

Formula (10.2.7) pentru varianța sumei poate fi generalizată la orice număr de termeni:

, (10.2.10)

unde este momentul de corelare al valorilor, semnul de sub sumă înseamnă că însumarea se aplică tuturor combinațiilor posibile în perechi de variabile aleatoare .

Demonstrarea este similară cu cea anterioară și decurge din formula pentru pătratul unui polinom.

Formula (10.2.10) poate fi scrisă sub altă formă:

, (10.2.11)

unde suma dublă se extinde la toate elementele matricei de corelație a sistemului de mărimi , conținând atât momentele de corelație, cât și variațiile.

Dacă toate variabilele aleatoare , incluse în sistem, sunt necorelate (adică la ), formula (10.2.10) ia forma:

, (10.2.12)

adică, varianța sumei variabilelor aleatoare necorelate este egală cu suma varianțelor termenilor.

Această propoziție este cunoscută sub numele de teorema de adunare a varianței.

8. Dispersia unei funcţii liniare

Se consideră o funcție liniară a mai multor variabile aleatoare.

unde sunt variabile non-aleatoare.

Să demonstrăm că dispersia acestei funcții liniare este exprimată prin formula

, (10.2.13)

unde este momentul de corelare al mărimilor , .

Dovada. Să introducem notația:

. (10.2.14)

Aplicând formula (10.2.10) pentru varianța sumei în partea dreaptă a expresiei (10.2.14) și ținând cont de faptul că , obținem:

unde este momentul de corelare al mărimilor:

.

Să calculăm acest moment. Avem:

;

de asemenea

Înlocuind această expresie în (10.2.15), ajungem la formula (10.2.13).

În cazul particular când toate cantitățile necorelat, formula (10.2.13) ia forma:

, (10.2.16)

adică, varianța unei funcții liniare a variabilelor aleatoare necorelate este egală cu suma produselor pătratelor coeficienților și a varianțelor argumentelor corespunzătoare.

9. Aşteptarea matematică a produsului variabilelor aleatoare

Așteptările matematice ale produsului a două variabile aleatoare este egală cu produsul așteptărilor lor matematice plus momentul de corelație:

Dovada. Vom pleca de la definirea momentului de corelare:

Transformăm această expresie folosind proprietățile așteptării matematice:

care este evident echivalent cu formula (10.2.17).

Dacă variabilele aleatoare sunt necorelate, atunci formula (10.2.17) ia forma:

adică, media produsului a două variabile aleatoare necorelate este egală cu produsul mediei lor.

Această afirmație este cunoscută ca teorema înmulțirii așteptărilor.

Formula (10.2.17) nu este altceva decât o expresie a celui de-al doilea moment central mixt al sistemului în ceea ce privește al doilea moment inițial mixt și așteptările matematice:

. (10.2.19)

Această expresie este adesea folosită în practică atunci când se calculează momentul de corelație în același mod în care pentru o variabilă aleatoare varianța este adesea calculată prin al doilea moment inițial și așteptarea matematică.

Teorema înmulțirii așteptărilor poate fi generalizată și la un număr arbitrar de factori, numai că în acest caz pentru aplicarea sa nu este suficient ca mărimile să fie necorelate, ci se cere ca și unele momente mixte superioare să dispară, al căror număr depinde de numărul de termeni din produs. Aceste condiții sunt cu siguranță îndeplinite dacă variabilele aleatoare incluse în produs sunt independente. În acest caz

, (10.2.20)

adică așteptarea matematică a produsului variabilelor aleatoare independente este egală cu produsul așteptărilor lor matematice.

Această propoziție poate fi demonstrată cu ușurință prin inducție completă.

10. Dispersia produsului variabilelor aleatoare independente

Să demonstrăm că pentru mărimi independente

Dovada. Să notăm. Prin definiția varianței

Întrucât cantitățile sunt independente și

La variabile independente de asemenea independent; Prin urmare,

,

Dar nu există nimic altceva decât al doilea moment inițial al mărimii și, prin urmare, este exprimat în termeni de varianță:

;

de asemenea

.

Înlocuind aceste expresii în formula (10.2.22) și aducând termeni similari, ajungem la formula (10.2.21).

În cazul în care variabilele aleatoare centrate sunt înmulțite (valori cu așteptări matematice egale cu zero), formula (10.2.21) ia forma:

, (10.2.23)

adică, varianța produsului variabilelor aleatoare centrate independente este egală cu produsul varianțelor acestora.

11. Momente mai mari ale sumei variabilelor aleatoare

În unele cazuri este necesar să se calculeze momentele mai mari ale sumei variabilelor aleatoare independente. Să demonstrăm câteva relații înrudite.

1) Dacă mărimile sunt independente, atunci

Dovada.

de unde prin teorema înmulțirii așteptărilor

Dar primul moment central pentru orice mărime este zero; doi termeni de mijloc dispar și se demonstrează formula (10.2.24).

Relația (10.2.24) poate fi generalizată cu ușurință prin inducție la un număr arbitrar de termeni independenți:

. (10.2.25)

2) Al patrulea moment central al sumei a două variabile aleatoare independente este exprimat prin formula

unde sunt dispersiile de si .

Dovada este exact aceeași cu cea anterioară.

Folosind metoda inducției complete, este ușor de demonstrat generalizarea formulei (10.2.26) la un număr arbitrar de termeni independenți.

În plus față de caracteristicile de poziție - medie, valori tipice ale unei variabile aleatoare - sunt utilizate o serie de caracteristici, fiecare dintre acestea descriind una sau alta proprietate a distribuției. Așa-numitele momente sunt cel mai adesea folosite ca astfel de caracteristici.

Conceptul de moment este utilizat pe scară largă în mecanică pentru a descrie distribuția maselor (momente statice, momente de inerție etc.). Exact aceleași metode sunt folosite în teoria probabilității pentru a descrie proprietățile de bază ale distribuției unei variabile aleatoare. Cel mai adesea, în practică se folosesc două tipuri de momente: inițial și central.

Momentul inițial de ordinul al șlea al unei variabile aleatoare discontinue este suma formei:

. (5.7.1)

Evident, această definiție coincide cu definiția momentului inițial de ordin s în mecanică, dacă masele sunt concentrate în punctele de pe axa x.

Pentru o variabilă aleatoare continuă X, momentul inițial de ordinul al șlea este integrala

. (5.7.2)

Este ușor de observat că principala caracteristică a poziției introduse în n° anterior - așteptarea matematică - nu este altceva decât primul moment inițial al variabilei aleatoare.

Folosind semnul așteptării, putem combina două formule (5.7.1) și (5.7.2) într-una singură. Într-adevăr, formulele (5.7.1) și (5.7.2) sunt complet similare ca structură cu formulele (5.6.1) și (5.6.2), cu diferența că în loc de și există, respectiv, și . Prin urmare, putem scrie o definiție generală a momentului inițial al ordinului --lea, care este valabilă atât pentru mărimile discontinue, cât și pentru cele continue:

, (5.7.3)

acestea. momentul inițial de ordinul al treilea al unei variabile aleatoare este așteptarea matematică a gradului al treilea al acestei variabile aleatoare.

Înainte de a da definiția momentului central, introducem un nou concept de „variabilă aleatoare centrată”.

Să existe o variabilă aleatoare cu așteptări matematice. Variabila aleatoare centrată corespunzătoare valorii este abaterea variabilei aleatoare de la așteptarea sa matematică:

În cele ce urmează, vom fi de acord peste tot să desemnăm variabila aleatoare centrată corespunzătoare variabilei aleatoare date prin aceeași literă cu pictograma în partea de sus.

Este ușor de verificat că așteptarea matematică a unei variabile aleatoare centrate este egală cu zero. Într-adevăr, pentru o cantitate discontinuă

în mod similar pentru o cantitate continuă.

Centrarea unei variabile aleatoare, evident, echivalează cu mutarea originii în punctul de mijloc, „central”, a cărui abscisă este egală cu așteptarea matematică.

Momentele unei variabile aleatoare centrate se numesc momente centrale. Ele sunt analoge cu momentele legate de centrul de greutate din mecanică.

Astfel, momentul central de ordinul s al unei variabile aleatoare este așteptarea matematică a puterii a-lea a variabilei aleatoare centrate corespunzătoare:

, (5.7.6)

iar pentru continuu - integral

. (5.7.8)

În cele ce urmează, în cazurile în care nu există nicio îndoială asupra cărei variabile aleatoare îi aparține un moment dat, pentru concizie vom scrie simplu și în loc de și .

Evident, pentru orice variabilă aleatorie, momentul central de ordinul întâi este egal cu zero:

, (5.7.9)

întrucât așteptarea matematică a unei variabile aleatoare centrate este întotdeauna zero.

Să derivăm relații care leagă momentele centrale și inițiale ale diferitelor ordine. Vom efectua derivarea numai pentru marimi discontinue; este ușor de verificat că exact aceleași relații sunt valabile pentru mărimi continue, dacă înlocuim sumele finite cu integrale, iar probabilitățile cu elemente de probabilitate.

Luați în considerare al doilea punct central:

În mod similar, pentru al treilea moment central obținem:

Expresii pentru etc. poate fi obținut într-un mod similar.

Astfel, pentru momentele centrale ale oricărei variabile aleatoare, formulele sunt valabile:

(5.7.10)

În general, momentele pot fi considerate nu numai în raport cu originea (momentele inițiale) sau așteptările matematice (momentele centrale), ci și în raport cu un punct arbitrar:

. (5.7.11)

Totuși, momentele centrale au un avantaj față de toate celelalte: primul moment central, după cum am văzut, este întotdeauna egal cu zero, iar al doilea moment central care îl urmează, pentru acest cadru de referință, are o valoare minimă. Să demonstrăm. Pentru o variabilă aleatoare discontinuă la , formula (5.7.11) are forma:

. (5.7.12)

Să transformăm această expresie:

Evident, această valoare atinge minimul atunci când , i.e. când se ia momentul în raport cu punctul .

Dintre toate momentele, primul moment inițial (așteptarea) și al doilea moment central sunt cel mai adesea folosite ca caracteristici ale unei variabile aleatorii.

Al doilea moment central se numește varianța variabilei aleatoare. Având în vedere importanța extremă a acestei caracteristici, printre alte puncte, introducem o denumire specială pentru aceasta:

Conform definiţiei momentului central

, (5.7.13)

acestea. varianța unei variabile aleatoare X este așteptarea matematică a pătratului variabilei centrate corespunzătoare.

Înlocuind în expresia (5.7.13) valoarea expresiei sale, avem și:

. (5.7.14)

Pentru a calcula direct varianța, se folosesc următoarele formule:

, (5.7.15)

(5.7.16)

Respectiv pentru cantități discontinue și continue.

Dispersia unei variabile aleatoare este o caracteristică a dispersiei, dispersia valorilor unei variabile aleatoare în jurul așteptării sale matematice. Cuvântul „dispersie” în sine înseamnă „împrăștiere”.

Dacă ne întoarcem la interpretarea mecanică a distribuției, atunci dispersia nu este altceva decât momentul de inerție al unei distribuții de masă date relativ la centrul de greutate (așteptare matematică).

Varianta unei variabile aleatoare are dimensiunea pătratului variabilei aleatoare; Pentru o caracterizare vizuală a împrăștierii, este mai convenabil să se utilizeze o mărime a cărei dimensiune coincide cu cea a unei variabile aleatorii. Pentru a face acest lucru, luați rădăcina pătrată a dispersiei. Valoarea rezultată se numește abaterea standard (altfel - „standardul”) a unei variabile aleatoare. Abaterea pătratică medie va fi notată cu:

, (5.7.17)

Pentru a simplifica înregistrările, vom folosi adesea notația prescurtată pentru abaterea standard și varianța: și . În cazul în care nu există nicio îndoială la ce variabilă aleatoare se referă aceste caracteristici, uneori vom omite semnul x y și și vom scrie simplu și . Cuvintele „abatere standard” vor fi uneori prescurtate cu literele s.c.o.

În practică, este adesea folosită o formulă care exprimă varianța unei variabile aleatoare în termenii celui de-al doilea moment inițial al acesteia (al doilea dintre formulele (5.7.10)). În noua notație, va arăta astfel:

Așteptările matematice și varianța (sau abaterea standard) sunt caracteristicile cele mai frecvent utilizate ale unei variabile aleatorii. Ele caracterizează cele mai importante trăsături ale distribuției: poziția și gradul de dispersie a acesteia. Pentru o descriere mai detaliată a distribuției, se folosesc momente de ordin superior.

Cel de-al treilea moment central servește la caracterizarea asimetriei (sau „asimetriei”) distribuției. Dacă distribuția este simetrică față de așteptarea matematică (sau, în interpretarea mecanică, masa este distribuită simetric față de centrul de greutate), atunci toate momentele de ordin impar (dacă există) sunt egale cu zero. Într-adevăr, în total

cu o distribuție care este simetrică față de legea distribuției și impară, fiecărui termen pozitiv îi corespunde un termen negativ egal cu acesta în valoare absolută, astfel încât întreaga sumă este egală cu zero. Același lucru este, evident, valabil și pentru integrală

,

care este egal cu zero ca integrală în limitele simetrice ale unei funcții impare.

Prin urmare, este firesc să alegeți oricare dintre momentele impare ca o caracteristică a asimetriei distribuției. Cel mai simplu dintre acestea este al treilea moment central. Are dimensiunea unui cub al unei variabile aleatoare: pentru a obține o caracteristică adimensională, al treilea moment este împărțit la cubul abaterii standard. Valoarea rezultată se numește „coeficient de asimetrie” sau pur și simplu „asimetrie”; o vom nota:

Pe fig. 5.7.1 prezintă două distribuții deformate; una dintre ele (curba I) are o asimetrie pozitivă (); celălalt (curba II) este negativ ().

Al patrulea moment central servește la caracterizarea așa-numitei „răcire”, adică. distribuție cu vârf sau cu vârf plat. Aceste proprietăți de distribuție sunt descrise folosind așa-numita curtoză. Curtoza unei variabile aleatoare este cantitatea

Numărul 3 se scade din raport deoarece pentru o lege de distribuție normală foarte importantă și răspândită în natură (pe care o vom cunoaște în detaliu mai târziu). Astfel, pentru o distribuție normală, curtoza este zero; curbele care sunt mai ascuțite decât curbele normale au o curtoză pozitivă; curbele sunt mai mult plat - prin curtoză negativă.

Pe fig. 5.7.2 prezintă: distributie normala(curba I), distribuția cu curtoză pozitivă (curba II) și distribuția cu curtoză negativă (curba III).

Pe lângă momentele inițiale și centrale discutate mai sus, în practică se folosesc uneori așa-numitele momente absolute (inițiale și centrale), definite prin formule

Evident, momentele absolute ale ordinelor par coincid cu momentele obișnuite.

Dintre momentele absolute, primul moment central absolut este cel mai des folosit.

, (5.7.21)

numită abaterea medie aritmetică. Împreună cu dispersia și abaterea standard, abaterea medie aritmetică este uneori utilizată ca caracteristică de dispersie.

Așteptările matematice, modul, mediana, momentele inițiale și centrale și, în special, varianța, abaterea standard, asimetria și curtosis sunt caracteristicile numerice cele mai frecvent utilizate ale variabilelor aleatoare. În multe probleme practice, o caracterizare completă a unei variabile aleatoare - legea distribuției - fie nu este necesară, fie nu poate fi obținută. În aceste cazuri, ele sunt limitate la o descriere aproximativă a unei variabile aleatoare cu ajutor. Caracteristici numerice, fiecare dintre acestea exprimând o proprietate caracteristică a distribuției.

Foarte des, caracteristicile numerice sunt folosite pentru a aproxima înlocuirea unei distribuții cu alta și, de obicei, încearcă să facă această înlocuire astfel încât mai multe puncte importante să rămână neschimbate.

Exemplul 1. Se efectuează un experiment, în urma căruia poate apărea sau nu un eveniment, a cărui probabilitate este egală cu . Se consideră o variabilă aleatoare - numărul de apariții ale unui eveniment (variabilă aleatoare caracteristică a unui eveniment). Determinați-i caracteristicile: așteptare matematică, varianță, abatere standard.

Soluţie. Seria de distribuție a cantităților are forma:

unde este probabilitatea ca evenimentul să nu se producă.

Conform formulei (5.6.1) găsim așteptarea matematică a valorii:

Dispersia valorii este determinată de formula (5.7.15):

(Invităm cititorul să obțină același rezultat exprimând varianța în termenii celui de-al doilea moment inițial).

Exemplul 2. Trei focuri independente sunt trase în țintă; probabilitatea de a lovi fiecare lovitură este de 0,4. variabila aleatoare este numărul de accesări. Determinați caracteristicile mărimii - așteptare matematică, dispersie, s.c.o., asimetrie.

Soluţie. Seria de distribuție a cantităților are forma:

Calculăm caracteristicile numerice ale cantității:

Rețineți că aceleași caracteristici ar putea fi calculate mult mai simplu folosind teoreme privind caracteristicile numerice ale funcțiilor (vezi Capitolul 10).

Dispersia unei variabile aleatoare este o măsură a răspândirii valorilor acestei variabile. Varianta mică înseamnă că valorile sunt grupate aproape una de alta. O variație mare indică o împrăștiere puternică a valorilor. Conceptul de dispersie a unei variabile aleatoare este folosit în statistică. De exemplu, dacă comparați varianța valorilor a două cantități (cum ar fi rezultatele observațiilor pacienților de sex masculin și feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată atunci când construiești modele statistice, deoarece variația mică poate fi un semn că depășești valorile.

Pași

Calcularea variației eșantionului

    Înregistrați valorile eșantionului.În cele mai multe cazuri, doar eșantioane din anumite populații sunt disponibile pentru statisticieni. De exemplu, de regulă, statisticienii nu analizează costul menținerii populației tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu pe mașină, dar cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea în 6 zile, luate în ordine aleatorie. Eșantionul are următoarea formă: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, deoarece nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație și nu un eșantion de valori, treceți la secțiunea următoare.
  1. Notați formula pentru calcularea varianței eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cu cât valoarea dispersiei este mai aproape de zero, cu atât valorile sunt grupate mai aproape. Când lucrați cu un eșantion de valori, utilizați următoarea formulă pentru a calcula varianța:

    Calculați media mostre. Este notat cu x̅. Media eșantionului este calculată ca o medie aritmetică normală: se adună toate valorile din eșantion și apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este importanță centrală, în jurul căruia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, dispersia este mare.
  2. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))- fiecare valoare din eșantion. Fiecare rezultat obținut indică măsura în care o anumită valoare se abate de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Aceasta înseamnă că varianța medie este întotdeauna zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- X. Acest lucru va duce la obținerea de numere pozitive care, atunci când sunt adunate, nu vor aduna niciodată până la 0.

    Calculați suma diferențelor pătrate. Adică, găsiți partea formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))-X) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))-X) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  3. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice probă este doar o mică parte. populatie valorile. Dacă luați un eșantion diferit și faceți aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai bună a varianței populației, care este ceea ce căutați. Împărțirea la n - 1 a devenit obișnuită, deci este inclusă în formula de calcul a varianței eșantionului.

    Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, deci varianța este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de valoare este destul de dificil de utilizat; în astfel de cazuri, utilizați abaterea standard, care este egală cu rădăcină pătrată din dispersie. De aceea, varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), iar abaterea standard a eșantionului ca s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calculul variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiați vârsta rezidenților din regiunea Leningrad, atunci populația include vârsta tuturor locuitorilor acestei regiuni. În cazul lucrului cu un agregat, se recomandă să creați un tabel și să introduceți valorile agregatului în acesta. Luați în considerare următorul exemplu:

      Notați formula de calcul a varianței populației. Deoarece populația include toate valorile unei anumite cantități, următoarea formulă vă permite să obțineți valoarea exactă a varianței populației. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      Calculați media populației. Când se lucrează cu populația generală, valoarea medie a acesteia este notată ca μ (mu). Media populației este calculată ca medie aritmetică obișnuită: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      Scădeți media populației din fiecare valoare din populație. Cu cât valoarea diferenței este mai aproape de zero, cu atât valoarea particulară este mai aproape de media populației. Găsiți diferența dintre fiecare valoare din populație și media acesteia și veți avea o primă privire asupra distribuției valorilor.

      Pătrați fiecare rezultat pe care îl obțineți. Valorile diferențelor vor fi atât pozitive, cât și negative; dacă puneți aceste valori pe o linie numerică, atunci ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este bun pentru calcularea varianței, deoarece numerele pozitive și negative se anulează reciproc. Prin urmare, pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      Aflați media rezultatelor obținute. Ați găsit cât de departe este fiecare valoare din populație de media ei. Aflați media sumei diferențelor pătrate împărțind-o la numărul de valori din populație.

    2. Potriviți această soluție cu formula. Dacă nu înțelegeți cum se leagă soluția de mai sus cu formula, mai jos este o explicație a soluției:

      • Găsim diferența dintre fiecare valoare și media populației și apoi pătratăm fiecare diferență, adică obținem ( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)), (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2))și așa mai departe până la ( x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n)) este ultima valoare din populație.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.

Definiție.Dispersare (împrăștiere) Variabila aleatoare discretă se numește așteptarea matematică a abaterii pătrate a variabilei aleatoare de la așteptarea sa matematică:

Exemplu. Pentru exemplul de mai sus, găsim

Așteptările matematice ale unei variabile aleatoare sunt:

Valori posibile ale abaterii pătrate:

; ;

Dispersia este:

Cu toate acestea, în practică, această metodă de calcul a varianței este incomod, deoarece duce la calcule greoaie pentru un număr mare de valori ale unei variabile aleatorii. Prin urmare, se folosește o altă metodă.

Calculul variației

Teorema. Varianta este egală cu diferența dintre așteptările matematice ale pătratului variabilei aleatoare X și pătratul așteptărilor sale matematice:

Dovada.Ținând cont de faptul că așteptarea matematică și pătratul așteptării matematice sunt valori constante, putem scrie:

Să aplicăm această formulă la exemplul de mai sus:

X
x2
p 0,0778 0,2592 0,3456 0,2304 0,0768 0,0102

Proprietăți de dispersie

1) Dispersie valoare constantă este egal cu zero:

2) Factorul constant poate fi scos din semnul de dispersie prin pătratul:

.

3) Varianța sumei a două variabile aleatoare independente este egală cu suma varianțelor acestor variabile:

4) Varianta diferenței a două variabile aleatoare independente este egală cu suma varianțelor acestor variabile:

Valabilitatea acestei egalități rezultă din proprietatea 2.

Teorema. Varianța numărului de apariții ale evenimentului A în n încercări independente, în fiecare dintre ele probabilitatea de apariție a evenimentului este constantă, este egală cu produsul dintre numărul de încercări cu probabilitatea de apariție și probabilitatea evenimentului. neapărând în fiecare proces:

Exemplu. Fabrica produce 96% din produsele de clasa întâi și 4% din produsele de clasa a doua. 1000 de articole sunt alese la întâmplare. Lăsa X- numarul de produse de clasa I din acest esantion. Găsiți legea distribuției, așteptările matematice și varianța unei variabile aleatoare.

Astfel, legea distribuției poate fi considerată binomială.

Exemplu. Aflați varianța unei variabile aleatoare discrete X– numărul de apariții ale evenimentului DARîn două încercări independente, dacă probabilitățile de apariție a acestui eveniment în fiecare proces sunt egale și se știe că

pentru că valoare aleatorie X distribuite conform legii binomiale, atunci

Exemplu. Testele independente sunt efectuate cu aceeași probabilitate de apariție a evenimentului DAR la fiecare test. Găsiți probabilitatea ca un eveniment să se producă DAR dacă varianța numărului de apariții ale evenimentului în trei încercări independente este de 0,63.

Conform formulei de dispersie a legii binomiale, obținem:

;

Exemplu. Este testat un dispozitiv format din patru dispozitive care funcționează independent. Probabilitățile de defecțiune ale fiecăruia dintre dispozitive sunt, respectiv, egale ; ; . Găsiți așteptările și variația matematică a numărului de dispozitive defectate.

Luând numărul de dispozitive eșuate ca variabilă aleatorie, vedem că această variabilă aleatoare poate lua valorile 0, 1, 2, 3 sau 4.

Pentru a elabora o lege de distribuție pentru această variabilă aleatoare, este necesar să se determine probabilitățile corespunzătoare. Să acceptăm.

1) Niciun dispozitiv nu a eșuat:

2) Unul dintre dispozitive a eșuat.

dispersie (difuzarea) unei variabile aleatoare este așteptarea matematică a abaterii pătrate a unei variabile aleatoare de la așteptarea ei matematică:

Pentru a calcula varianța, puteți utiliza o formulă ușor modificată

deoarece M(X), 2 și
sunt valori constante. În acest fel,

4.2.2. Proprietăți de dispersie

Proprietatea 1. Dispersia unei valori constante este zero. Într-adevăr, prin definiție

Proprietatea 2. Factorul constant poate fi scos din semnul de dispersie prin pătratul acestuia.

Dovada

Centrat o variabilă aleatoare este abaterea unei variabile aleatoare de la așteptările ei matematice:

Valoarea centrată are două proprietăți care sunt convenabile pentru transformare:

Proprietatea 3. Dacă variabilele aleatoare X și Y independent, atunci

Dovada. Denota
. Apoi.

În al doilea termen, datorită independenței variabilelor aleatoare și proprietăților variabilelor aleatoare centrate

Exemplul 4.5.În cazul în care un Ași b sunt constante, atunci D (AX+b)= D(AX)+D(b)=
.

4.2.3. Deviație standard

Dispersia, ca caracteristică a răspândirii unei variabile aleatoare, are un dezavantaj. Dacă, de exemplu, X– eroarea de măsurare are dimensiunea MM, atunci varianța are dimensiunea
. Prin urmare, adesea se preferă să se folosească o altă caracteristică de împrăștiere - deviație standard , care este egală cu rădăcina pătrată a varianței

Abaterea standard are aceeași dimensiune ca și variabila aleatoare în sine.

Exemplul 4.6. Variația numărului de apariție a unui eveniment în schema de studii independente

Produs nîncercări independente și probabilitatea ca un eveniment să apară în fiecare proces este R. Exprimăm, ca și până acum, numărul de apariție a evenimentului X prin numărul de apariții a evenimentului în experimente individuale:

Deoarece experimentele sunt independente, variabilele aleatoare asociate cu experimentele independent. Și în virtutea independenței avem

Dar fiecare dintre variabilele aleatoare are o lege de distribuție (exemplul 3.2)

și
(exemplul 4.4). Prin urmare, prin definiția varianței:

Unde q=1- p.

Ca urmare, avem
,

Abaterea standard a numărului de apariții ale unui eveniment în n experimente independente
.

4.3. Momente de variabile aleatorii

Pe lângă cele deja luate în considerare, variabilele aleatoare au multe alte caracteristici numerice.

Moment de pornire k X (
) se numește așteptarea matematică k puterea acestei variabile aleatoare.

Punctul central k- variabilă aleatoare de ordinul al-lea X se numește așteptare k a-a putere a mărimii centrate corespunzătoare.

Este ușor de observat că momentul central de ordinul întâi este întotdeauna egal cu zero, momentul central de ordinul doi este egal cu dispersia, deoarece .

Momentul central de ordinul al treilea oferă o idee despre asimetria distribuției unei variabile aleatoare. Momentele de ordine mai mari decât secunda sunt folosite relativ rar, așa că ne vom limita doar la conceptele lor.

4.4. Exemple de găsire a legilor de distribuție

Luați în considerare exemple de găsire a legilor de distribuție a variabilelor aleatoare și a caracteristicilor lor numerice.

Exemplul 4.7.

Compilați legea de distribuție pentru numărul de lovituri pe țintă cu trei lovituri la țintă, dacă probabilitatea de a lovi cu fiecare lovitură este 0,4. Găsiți funcția integrală F(X) pentru distribuția rezultată a unei variabile aleatoare discrete Xși desenați graficul acestuia. Găsiți așteptările matematice M(X) , dispersie D(X) și abaterea standard
(X) variabilă aleatorie X.

Soluţie

1) Variabilă aleatorie discretă X- numărul de lovituri pe țintă cu trei lovituri - poate lua patru valori: 0, 1, 2, 3 . Probabilitatea ca ea să accepte fiecare dintre ele o găsim prin formula Bernoulli pentru: n=3,p=0,4,q=1- p=0,6 și m=0, 1, 2, 3:

Obțineți probabilitățile valorilor posibile X:;

Să compunem legea de distribuție dorită a unei variabile aleatoare X:

Control: 0,216+0,432+0,288+0,064=1.

Să construim un poligon de distribuție al variabilei aleatoare obținute X. Pentru a face acest lucru, într-un sistem de coordonate dreptunghiular, marcați punctele (0; 0,216), (1; 0,432), (2; 0,288), (3; 0,064). Să conectăm aceste puncte cu segmente de linie, linia întreruptă rezultată este poligonul de distribuție dorit (Fig. 4.1).

2) Dacă x 0, atunci F(X)=0. Într-adevăr, pentru valori mai mici decât zero, valoarea X nu acceptă. Prin urmare, pentru toți X0 , folosind definiția F(X), primim F(X)=P(X< X) =0 (ca probabilitate a unui eveniment imposibil).

Daca 0 , apoi F(X) =0,216. Într-adevăr, în acest caz F(X)=P(X< X) = =P(- < X 0)+ P(0< X< X) =0,216+0=0,216.

Dacă luăm, de exemplu, X=0,2, atunci F(0,2)=P(X<0,2) . Dar probabilitatea unui eveniment X<0,2 равна 0,216, так как случайная величинаX doar într-un caz ia o valoare mai mică de 0,2 și anume 0 cu o probabilitate de 0,216.

Daca 1 , apoi

Într-adevăr, X poate lua valoarea 0 cu o probabilitate de 0,216 și valoarea 1 cu o probabilitate de 0,432; prin urmare, una dintre aceste valori, indiferent care, X poate accepta (conform teoremei de adunare a probabilităților de evenimente incompatibile) cu o probabilitate de 0,648.

Daca 2 , apoi, argumentând în mod similar, obținem F(X)=0,216+0,432 + + 0,288=0,936. Într-adevăr, să lăsăm, de exemplu, X=3. Apoi F(3)=P(X<3) exprimă probabilitatea unui eveniment X<3 – стрелок сделает меньше трех попаданий, т.е. ноль, один или два. Применяя теорему сложения вероятностей, получим указанное значение функцииF(X).

În cazul în care un X>3, atunci F(X)=0,216+0,432+0,288+0,064=1. Într-adevăr, evenimentul X
este de încredere și probabilitatea sa este egală cu unu și X>3 - imposibil. Dat fiind

F(X)=P(X< X) =P(X 3) + P(3< X< X) , obținem rezultatul indicat.

Deci, se obține funcția de distribuție integrală dorită a variabilei aleatoare X:

F(X) =

al cărui grafic este prezentat în fig. 4.2.

3) Așteptările matematice ale unei variabile aleatoare discrete sunt egale cu suma produselor tuturor valorilor posibile X pe probabilitățile lor:

M(X)=0=1,2.

Adică, în medie, există o lovitură la țintă cu trei lovituri.

Varianta poate fi calculată din definiția varianței D(X)= M(X- M(X)) sau folosiți formula D(X)= M(X
, ceea ce duce mai repede la obiectiv.

Să scriem legea distribuției unei variabile aleatoare X :

Găsiți așteptările matematice pentru X:

M(X ) = 04
= 2,16.

Să calculăm varianța dorită:

D(X) = M(X ) – (M(X)) = 2,16 – (1,2)= 0,72.

Abaterea pătratică medie este găsită prin formulă

(X) =
= 0,848.

Interval ( M- ; M+ ) = (1,2-0,85; 1,2+0,85) = (0,35; 2,05) - intervalul celor mai probabile valori ale variabilei aleatoare X, valorile 1 și 2 se încadrează în el.

Exemplul 4.8.

Este dată funcția de distribuție diferențială (funcția de densitate) a unei variabile aleatoare continue X:

f(X) =

1) Definiți un parametru constant A.

2) Găsiți funcția integrală F(X) .

3) Trasează grafice de funcții f(X) și F(X) .

4) Găsiți două moduri de probabilități P(0,5< X 1,5) și P(1,5< X<3,5) .

5). Găsiți așteptările matematice M(X), dispersie D(X)și abaterea standard
variabilă aleatorie X.

Soluţie

1) Funcție diferențială după proprietate f(X) trebuie să îndeplinească condiția
.

Să calculăm această integrală improprie pentru funcția dată f(X) :

Înlocuind acest rezultat în partea stângă a egalității, obținem asta A=1. In conditia pentru f(X) modifica parametrul A pe 1:

2) A găsi F(X) utilizați formula

.

Dacă x
, apoi
, Prin urmare,

Daca 1
apoi

Dacă x>2 atunci

Deci, funcția integrală dorită F(X) se pare ca:

3) Să construim grafice ale funcțiilor f(X) și F(X) (fig. 4.3 și 4.4).

4) Probabilitatea de a atinge o variabilă aleatoare într-un interval dat (A,b) calculate prin formula
, dacă funcția este cunoscută f(X), iar conform formulei P(A < X < b) = F(b) – F(A), dacă funcția este cunoscută F(X).

Sa gasim
folosind două formule și comparați rezultatele. După condiție a=0,5;b=1,5; funcţie f(X) specificate la paragraful 1). Prin urmare, probabilitatea dorită conform formulei este:

Aceeași probabilitate poate fi calculată prin formula b) prin creșterea obținută la punctul 2). funcţie integrală F(X) pe acest interval:

pentru că F(0,5)=0.

În mod similar, găsim

deoarece F(3,5)=1.

5) Pentru a afla așteptările matematice M(X) utilizați formula
Funcţie f(X) dat în decizia de la paragraful 1), este egal cu zero în afara intervalului (1,2]:

Dispersia unei variabile aleatoare continue D(X) este definit de egalitate

, sau egalitatea echivalentă


.

Pentru găsirea D(X) folosim ultima formulă și luăm în considerare că toate valorile posibile f(X) aparțin intervalului (1,2]:

Deviație standard
=
=0,276.

Intervalul celor mai probabile valori ale unei variabile aleatorii X egală

(M-
,M+
) = (1,58-0,28; 1,58+0,28) = (1,3; 1,86).