După cum se știe, variabilă aleatorie se numește o variabilă care poate lua anumite valori în funcție de caz. Variabilele aleatoare sunt notate cu majuscule ale alfabetului latin (X, Y, Z), iar valorile lor - cu literele mici corespunzătoare (x, y, z). Variabilele aleatoare sunt împărțite în discontinue (discrete) și continue.

Variabilă aleatorie discretă se numește o variabilă aleatorie care ia doar un set finit sau infinit (numărabil) de valori cu anumite probabilități diferite de zero.

Legea distribuției unei variabile aleatoare discrete este o funcție care conectează valorile unei variabile aleatoare cu probabilitățile corespunzătoare. Legea distribuției poate fi specificată în una din următoarele moduri.

1 . Legea distribuției poate fi dată de tabelul:

unde λ>0, k = 0, 1, 2, … .

în) prin utilizarea funcția de distribuție F(x) , care determină pentru fiecare valoare x probabilitatea ca variabila aleatoare X să ia o valoare mai mică decât x, adică. F(x) = P(X< x).

Proprietățile funcției F(x)

3 . Legea distribuției poate fi stabilită grafic – poligon de distribuție (poligon) (vezi problema 3).

Rețineți că pentru a rezolva unele probleme nu este necesar să cunoașteți legea distribuției. În unele cazuri, este suficient să cunoașteți unul sau mai multe numere care reflectă cele mai importante caracteristici ale legii distribuției. Poate fi un număr care are semnificația „valorii medii” a unei variabile aleatoare sau un număr care arată dimensiunea medie a abaterii unei variabile aleatoare de la valoarea sa medie. Numerele de acest fel sunt numite caracteristici numerice ale unei variabile aleatorii.

Caracteristicile numerice de bază ale unei variabile aleatoare discrete :

  • Așteptări matematice (valoarea medie) a unei variabile aleatoare discrete M(X)=Σ x i p i.
    Pentru distribuția binomială M(X)=np, pentru distribuția Poisson M(X)=λ
  • Dispersia variabilă aleatoare discretă D(X)=M2 sau D(X) = M(X 2) − 2. Diferența X–M(X) se numește abaterea unei variabile aleatoare de la așteptările ei matematice.
    Pentru distribuția binomială D(X)=npq, pentru distribuția Poisson D(X)=λ
  • Deviație standard (deviație standard) σ(X)=√D(X).

Exemple de rezolvare a problemelor pe tema „Legea distribuției unei variabile aleatoare discrete”

Sarcina 1.

Au fost emise 1.000 de bilete de loterie: 5 dintre ele vor câștiga 500 de ruble, 10 vor câștiga 100 de ruble, 20 vor câștiga 50 de ruble și 50 vor câștiga 10 ruble. Determinați legea distribuției de probabilitate a variabilei aleatoare X - câștiguri pe bilet.

Soluţie. În funcție de starea problemei, sunt posibile următoarele valori ale variabilei aleatoare X: 0, 10, 50, 100 și 500.

Numărul de bilete fără câștig este 1000 - (5+10+20+50) = 915, apoi P(X=0) = 915/1000 = 0,915.

În mod similar, găsim toate celelalte probabilități: P(X=0) = 50/1000=0,05, P(X=50) = 20/1000=0,02, P(X=100) = 10/1000=0,01, P(X=0,01). =500) = 5/1000=0,005. Prezentăm legea rezultată sub forma unui tabel:

Sa gasim valorea estimata valorile X: M(X) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1+2 +3 +4+5+6)/6 = 21/6 = 3,5

Sarcina 3.

Dispozitivul este format din trei elemente de operare independentă. Probabilitatea de eșec a fiecărui element dintr-un experiment este de 0,1. Întocmește o lege de distribuție pentru numărul de elemente eșuate într-un experiment, construiește un poligon de distribuție. Găsiți funcția de distribuție F(x) și trasați-o. Aflați așteptările matematice, varianța și abaterea standard a unei variabile aleatoare discrete.

Soluţie. 1. Variabila aleatorie discretă X=(numărul de elemente eșuate într-un experiment) are următoarele valori posibile: x 1 =0 (niciunul dintre elementele dispozitivului nu a eșuat), x 2 =1 (un element a eșuat), x 3 =2 ( două elemente au eșuat ) și x 4 \u003d 3 (trei elemente au eșuat).

Eșecurile elementelor sunt independente unele de altele, probabilitățile de eșec ale fiecărui element sunt egale între ele, prin urmare, este aplicabil formula lui Bernoulli . Având în vedere că, prin condiție, n=3, p=0,1, q=1-p=0,9, determinăm probabilitățile valorilor:
P 3 (0) \u003d C 3 0 p 0 q 3-0 \u003d q 3 \u003d 0,9 3 \u003d 0,729;
P 3 (1) \u003d C 3 1 p 1 q 3-1 \u003d 3 * 0,1 * 0,9 2 \u003d 0,243;
P 3 (2) \u003d C 3 2 p 2 q 3-2 \u003d 3 * 0,1 2 * 0,9 \u003d 0,027;
P 3 (3) \u003d C 3 3 p 3 q 3-3 \u003d p 3 \u003d 0,1 3 \u003d 0,001;
Verificați: ∑p i = 0,729+0,243+0,027+0,001=1.

Astfel, legea de distribuție binomială dorită X are forma:

Pe axa absciselor, graficăm valorile posibile x i, iar pe axa ordonatelor, probabilitățile corespunzătoare р i . Să construim punctele M 1 (0; 0,729), M 2 (1; 0,243), M 3 (2; 0,027), M 4 (3; 0,001). Conectând aceste puncte cu segmente de linie, obținem poligonul de distribuție dorit.

3. Aflați funcția de distribuție F(x) = P(X

Pentru x ≤ 0 avem F(x) = P(X<0) = 0;
pentru 0< x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
pentru 1< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
pentru 2< x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
pentru x > 3 va fi F(x) = 1, deoarece evenimentul este sigur.

Graficul funcției F(x)

4. Pentru distribuția binomială X:
- așteptarea matematică М(X) = np = 3*0,1 = 0,3;
- dispersia D(X) = npq = 3*0,1*0,9 = 0,27;
- abaterea standard σ(X) = √D(X) = √0,27 ≈ 0,52.

Variabilă aleatorie se numește o variabilă care, în urma fiecărui test, ia o valoare necunoscută anterior, în funcție de cauze aleatorii. Variabilele aleatoare sunt notate cu majuscule latine: $X,\ Y,\ Z,\ \dots $ După tipul lor, variabilele aleatoare pot fi discretși continuu.

Variabilă aleatorie discretă- aceasta este o astfel de variabilă aleatoare, ale cărei valori nu pot fi mai mult decât numărabile, adică fie finite, fie numărabile. Numărabilitatea înseamnă că pot fi enumerate valorile unei variabile aleatorii.

Exemplul 1 . Să dăm exemple de discrete variabile aleatoare:

a) numărul de lovituri pe țintă cu $n$ lovituri, aici valorile posibile sunt $0,\ 1,\ \dots ,\ n$.

b) numărul de steme care au căzut la aruncarea unei monede, aici valorile posibile sunt $0,\ 1,\ \dots ,\ n$.

c) numărul de nave care au ajuns la bord (un set numărabil de valori).

d) numărul de apeluri care sosesc la centrală (un set numărabil de valori).

1. Legea distribuției de probabilitate a unei variabile aleatoare discrete.

O variabilă aleatoare discretă $X$ poate lua valorile $x_1,\dots ,\ x_n$ cu probabilități $p\left(x_1\right),\ \dots ,\ p\left(x_n\right)$. Corespondența dintre aceste valori și probabilitățile lor se numește legea de distribuție a unei variabile aleatoare discrete. De regulă, această corespondență este specificată folosind un tabel, în primul rând al căruia sunt indicate valorile $x_1,\dots ,\ x_n$, iar în a doua linie probabilitățile corespunzătoare acestor valori sunt $ p_1,\dots ,\ p_n$.

$\begin(matrice)(|c|c|)
\hline
X_i & x_1 & x_2 & \dots & x_n \\
\hline
p_i & p_1 & p_2 & \dots & p_n \\
\hline
\end(matrice)$

Exemplul 2 . Fie variabila aleatoare $X$ numărul de puncte aruncate atunci când un zar este aruncat. O astfel de variabilă aleatorie $X$ poate lua următoarele valori $1,\ 2,\ 3,\ 4,\ 5,\ 6$. Probabilitățile tuturor acestor valori sunt egale cu $1/6$. Apoi legea distribuției probabilității pentru variabila aleatoare $X$:

$\begin(matrice)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline

\hline
\end(matrice)$

cometariu. Deoarece evenimentele $1,\ 2,\ \dots ,\ 6$ formează un grup complet de evenimente în legea distribuției variabilei aleatoare discrete $X$, suma probabilităților trebuie să fie egală cu unu, adică $\sum( p_i)=1$.

2. Așteptarea matematică a unei variabile aleatoare discrete.

Așteptarea matematică a unei variabile aleatoare specifică valoarea sa „centrală”. Pentru o variabilă aleatorie discretă, așteptarea matematică este calculată ca suma produselor valorilor $x_1,\dots ,\ x_n$ și a probabilităților $p_1,\dots ,\p_n$ corespunzătoare acestor valori, adică: $M\left(X\right)=\sum ^n_(i=1)(p_ix_i)$. În literatura engleză, se folosește o altă notație $E\left(X\right)$.

Proprietăți de așteptare$M\stânga(X\dreapta)$:

  1. $M\left(X\right)$ este între cele mai mici și cele mai mari valori ale variabilei aleatoare $X$.
  2. Așteptarea matematică a unei constante este egală cu constanta în sine, adică. $M\left(C\right)=C$.
  3. Factorul constant poate fi scos din semnul așteptării: $M\left(CX\right)=CM\left(X\right)$.
  4. Așteptările matematice ale sumei variabilelor aleatoare este egală cu suma așteptărilor lor matematice: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$.
  5. Așteptările matematice ale produsului variabilelor aleatoare independente este egală cu produsul așteptărilor lor matematice: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$.

Exemplul 3 . Să găsim așteptările matematice ale variabilei aleatoare $X$ din exemplul $2$.

$$M\left(X\right)=\sum^n_(i=1)(p_ix_i)=1\cdot ((1)\peste (6))+2\cdot ((1)\peste (6) )+3\cdot ((1)\peste (6))+4\cdot ((1)\peste (6))+5\cdot ((1)\peste (6))+6\cdot ((1 )\peste (6))=3.5.$$

Putem observa că $M\left(X\right)$ se află între cea mai mică ($1$) și cea mai mare ($6$) valori ale variabilei aleatoare $X$.

Exemplul 4 . Se știe că așteptarea matematică a variabilei aleatoare $X$ este egală cu $M\left(X\right)=2$. Găsiți așteptările matematice ale variabilei aleatoare $3X+5$.

Folosind proprietățile de mai sus, obținem $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\ cdot 2 +5=11$.

Exemplul 5 . Se știe că așteptarea matematică a variabilei aleatoare $X$ este egală cu $M\left(X\right)=4$. Găsiți așteptările matematice ale variabilei aleatoare $2X-9$.

Folosind proprietățile de mai sus, obținem $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\ cdot 4 -9=-1$.

3. Dispersia unei variabile aleatoare discrete.

Valorile posibile ale variabilelor aleatoare cu așteptări matematice egale se pot împrăștia diferit în jurul valorilor lor medii. De exemplu, în două grupe de studenți, scorul mediu la examen în teoria probabilității s-a dovedit a fi 4, dar într-un grup toată lumea s-a dovedit a fi studenți buni, iar în celălalt grup - doar studenți C și studenți excelenți. Prin urmare, este nevoie de o astfel de caracteristică numerică a unei variabile aleatoare, care să arate răspândirea valorilor unei variabile aleatoare în jurul așteptărilor sale matematice. Această caracteristică este dispersia.

Dispersia unei variabile aleatoare discrete$X$ este:

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\dreapta)\right))^2).\ $$

În literatura engleză, se folosește notația $V\left(X\right),\ Var\left(X\right)$. Foarte des, varianța $D\left(X\right)$ este calculată prin formula $D\left(X\right)=\sum^n_(i=1)(p_ix^2_i)-(\left(M\) stânga(X \dreapta)\dreapta))^2$.

Proprietăți de dispersie$D\stânga(X\dreapta)$:

  1. Dispersia este întotdeauna mai mare sau egală cu zero, adică. $D\stanga(X\dreapta)\ge 0$.
  2. Dispersia dintr-o constantă este egală cu zero, adică. $D\stanga(C\dreapta)=0$.
  3. Factorul constant poate fi scos din semnul de dispersie, cu condiția ca acesta să fie pătrat, i.e. $D\left(CX\right)=C^2D\left(X\dreapta)$.
  4. Varianța sumei variabilelor aleatoare independente este egală cu suma varianțelor acestora, i.e. $D\left(X+Y\right)=D\stanga(X\dreapta)+D\stanga(Y\dreapta)$.
  5. Varianta diferenței variabilelor aleatoare independente este egală cu suma varianțelor acestora, adică. $D\left(X-Y\right)=D\stanga(X\dreapta)+D\stanga(Y\dreapta)$.

Exemplul 6 . Să calculăm varianța variabilei aleatoare $X$ din exemplul $2$.

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\dreapta)\right))^2)=((1)\peste (6))\cdot (\left(1-3,5\right))^2+((1)\peste (6))\cdot (\left(2-3,5\right))^2+ \dots +((1)\peste (6))\cdot (\left(6-3,5\right))^2=((35)\peste (12))\aproximativ 2,92.$$

Exemplul 7 . Se știe că varianța variabilei aleatoare $X$ este egală cu $D\left(X\right)=2$. Găsiți varianța variabilei aleatoare $4X+1$.

Folosind proprietățile de mai sus, găsim $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0= 16D\ stânga(X\dreapta)=16\cdot 2=32$.

Exemplul 8 . Se știe că varianța lui $X$ este egală cu $D\left(X\right)=3$. Găsiți varianța variabilei aleatoare $3-2X$.

Folosind proprietățile de mai sus, găsim $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)= 4D\ stânga(X\dreapta)=4\cdot 3=12$.

4. Funcția de distribuție a unei variabile aleatoare discrete.

Metoda de reprezentare a unei variabile aleatoare discrete sub forma unei serii de distribuție nu este singura și, cel mai important, nu este universală, deoarece o variabilă aleatoare continuă nu poate fi specificată folosind o serie de distribuție. Există o altă modalitate de a reprezenta o variabilă aleatoare - funcția de distribuție.

functie de distributie variabila aleatoare $X$ este o funcție $F\left(x\right)$, care determină probabilitatea ca variabila aleatoare $X$ să ia o valoare mai mică decât o valoare fixă ​​$x$, adică $F\left(x\ dreapta)$ )=P\stanga(X< x\right)$

Proprietățile funcției de distribuție:

  1. $0\le F\left(x\right)\le 1$.
  2. Probabilitatea ca variabila aleatoare $X$ să ia valori din intervalul $\left(\alpha ;\\beta \right)$ este egală cu diferența dintre valorile funcției de distribuție la sfârșitul acestui interval : $P\left(\alpha< X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
  3. $F\left(x\right)$ - nedescrescătoare.
  4. $(\mathop(lim)_(x\to -\infty ) F\left(x\right)=0\ ),\ (\mathop(lim)_(x\to +\infty ) F\left(x \dreapta)=1\ )$.

Exemplul 9 . Să găsim funcția de distribuție $F\left(x\right)$ pentru legea de distribuție a variabilei aleatoare discrete $X$ din exemplul $2$.

$\begin(matrice)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hline
\end(matrice)$

Dacă $x\le 1$, atunci evident $F\left(x\right)=0$ (inclusiv $x=1$ $F\left(1\right)=P\left(X< 1\right)=0$).

Dacă 1 USD< x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

Dacă 2 dolari< x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

Dacă 3 dolari< x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

Dacă 4 dolari< x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

Dacă 5 dolari< x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

Dacă $x > 6$, atunci $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right) + P\stanga(X=4\dreapta)+P\stanga(X=5\dreapta)+P\stanga(X=6\dreapta)=1/6+1/6+1/6+1/6+ 1 /6+1/6=1$.

Deci $F(x)=\left\(\begin(matrix)
0,\ la\ x\le 1,\\
1/6, la \ 1< x\le 2,\\
1/3,\ la\ 2< x\le 3,\\
1/2, la \ 3< x\le 4,\\
2/3,\ la\ 4< x\le 5,\\
5/6, \ la \ 4< x\le 5,\\
1,\ pentru \ x > 6.
\end(matrice)\dreapta.$

1.2.4. Variabile aleatoare și distribuțiile lor

Distribuții ale variabilelor aleatoare și funcții de distribuție. Distribuția unei variabile aleatoare numerice este o funcție care determină în mod unic probabilitatea ca o variabilă aleatoare să ia o valoare dată sau să aparțină unui interval dat.

Prima este dacă variabila aleatoare ia un număr finit de valori. Atunci distribuția este dată de funcție P(X = x), dând fiecare valoare posibilă X variabilă aleatorie X probabilitatea ca X = x.

Al doilea este dacă variabila aleatoare ia infinit de valori. Acest lucru este posibil numai atunci când spațiul de probabilitate pe care este definită variabila aleatoare constă dintr-un număr infinit de evenimente elementare. Atunci distribuția este dată de mulțimea probabilităților P(a < X pentru toate perechile de numere a, b astfel încât A . Distribuția poate fi specificată folosind așa-numitul. funcția de distribuție F(x) = P(X definitoriu pentru toate reale X probabilitatea ca variabila aleatoare X ia valori mai mici decât X. Este clar că

P(a < X

Această relație arată că, așa cum distribuția poate fi calculată din funcția de distribuție, la fel, invers, funcția de distribuție poate fi calculată din distribuție.

Folosit în probabilism metode statistice luarea deciziilor și alte cercetări aplicate, funcțiile de distribuție sunt fie discrete, fie continue, sau combinații ale acestora.

Funcțiile de distribuție discretă corespund variabilelor aleatoare discrete care iau un număr finit de valori sau valori dintr-o mulțime ale cărei elemente pot fi renumerotate prin numere naturale (astfel de mulțimi sunt numite numărabile în matematică). Graficul lor arată ca o scară (Fig. 1).

Exemplul 1 Număr X de articole defecte din lot ia valoarea 0 cu o probabilitate de 0,3, valoarea 1 cu o probabilitate de 0,4, valoarea 2 cu o probabilitate de 0,2 și valoarea 3 cu o probabilitate de 0,1. Graficul funcției de distribuție a unei variabile aleatoare X prezentat în Fig.1.

Fig.1. Graficul funcției de distribuție a numărului de produse defecte.

Funcțiile de distribuție continuă nu au salturi. Ele cresc monoton pe măsură ce argumentul crește, de la 0 pentru la 1 pentru . Variabilele aleatoare cu funcții de distribuție continuă se numesc continue.

Funcții de distribuție continuă utilizate în metodele probabilistic-statistice luarea deciziilor, au derivate. Prima derivată f(x) functii de distributie F(x) se numește densitate de probabilitate,

Funcția de distribuție poate fi determinată din densitatea de probabilitate:

Pentru orice funcție de distribuție

Proprietățile enumerate ale funcțiilor de distribuție sunt utilizate constant în metodele decizionale probabilistic-statistice. În special, ultima egalitate implică o formă specifică a constantelor din formulele pentru densitățile de probabilitate considerate mai jos.

Exemplul 2 Următoarea funcție de distribuție este adesea folosită:

(1)

Unde Ași b- unele numere A . Să găsim densitatea de probabilitate a acestei funcții de distribuție:

(la puncte x = ași x = b derivată de funcție F(x) nu exista).

O variabilă aleatoare cu funcție de distribuție (1) se numește „distribuită uniform pe intervalul [ A; b]».

Funcțiile de distribuție mixte apar, în special, atunci când observațiile se opresc la un moment dat. De exemplu, atunci când se analizează datele statistice obținute folosind planuri de testare de fiabilitate care prevăd terminarea testelor după o anumită perioadă de timp. Sau la analiza datelor despre produse tehnice care necesitau reparații în garanție.

Exemplul 3 Să fie, de exemplu, durata de viață a unui bec electric o variabilă aleatorie cu funcție de distribuție F(t), iar testul se efectuează până la defectarea becului, dacă aceasta are loc la mai puțin de 100 de ore de la începerea testului, sau până în momentul t0= 100 de ore. Lăsa G(t)- funcția de distribuție a timpului de funcționare a lămpii în stare bună la acest test. Apoi

Funcţie G(t) are un salt la un punct t0, deoarece variabila aleatoare corespunzătoare ia valoarea t0 cu probabilitate 1- F(t0)> 0.

Caracteristicile variabilelor aleatoare.În metodele decizionale probabilistic-statistice se folosesc o serie de caracteristici ale variabilelor aleatoare, exprimate prin funcții de distribuție și densitate de probabilitate.

Când se descrie diferențierea veniturilor, când se găsesc limite de încredere pentru parametrii distribuțiilor variabilelor aleatoare și în multe alte cazuri, se folosește un astfel de concept precum „quantila de ordine”. R", unde 0< p < 1 (обозначается x p). Comandă cuantilă R este valoarea unei variabile aleatoare pentru care funcția de distribuție ia valoarea R sau există un „salt” de la o valoare mai mică decât R până la o valoare mai mare R(Fig. 2). Se poate întâmpla ca această condiție să fie îndeplinită pentru toate valorile lui x aparținând acestui interval (adică, funcția de distribuție este constantă pe acest interval și este egală cu R). Apoi fiecare astfel de valoare este numită „cuantilă a ordinului R". Pentru funcțiile de distribuție continuă, de regulă, există o singură cuantilă x p Ordin R(Fig. 2) și

F(x p) = p. (2)

Fig.2. Definiţia unui quantile x p Ordin R.

Exemplul 4 Să găsim cuantila x p Ordin R pentru funcția de distribuție F(x) din (1).

La 0< p < 1 квантиль x p se găsește din ecuație

acestea. x p = a + p(b – a) = a( 1- p)+bp. La p= 0 oricare X < A este cuantila ordinului p= 0. Cuantila de ordin p= 1 este orice număr X > b.

Pentru distribuțiile discrete, de regulă, nu există x p ecuația satisfăcătoare (2). Mai precis, dacă distribuția unei variabile aleatoare este dată în Tabelul 1, unde x 1< x 2 < … < x k , apoi egalitatea (2), considerată ca o ecuație în raport cu x p, are solutii doar pt k valorile p, și anume,

p \u003d p 1,

p \u003d p 1 + p 2,

p \u003d p 1 + p 2 + p 3,

p \u003d p 1 + p 2 + ...+ p.m, 3 < m < k,

p = p 1 + p 2 + … + p k.

Tabelul 1.

Distribuția unei variabile aleatoare discrete

Pentru cele enumerate k valori de probabilitate p soluţie x p ecuația (2) nu este unică, și anume,

F(x) = p 1 + p 2 + ... + p m

pentru toți X astfel încât x m< x < xm+1. Acestea. x p - orice număr din interval (xm; xm+1). Pentru toți ceilalți R din intervalul (0;1) neinclus în lista (3), apare un „salt” de la o valoare mai mică decât R până la o valoare mai mare R. Și anume dacă

p 1 + p 2 + … + p m

apoi x p \u003d x m + 1.

Proprietatea considerată a distribuțiilor discrete creează dificultăți semnificative în tabelarea și utilizarea unor astfel de distribuții, deoarece este imposibil să se mențină cu exactitate valorile numerice tipice ale caracteristicilor distribuției. În special, acest lucru este valabil pentru valorile critice și nivelurile de semnificație ale testelor statistice neparametrice (a se vedea mai jos), deoarece distribuțiile statisticilor acestor teste sunt discrete.

Cuantila de ordine este de mare importanță în statistică. R= ½. Se numește mediană (variabilă aleatoare X sau funcția sa de distribuție F(x))și notat Eu (X).În geometrie, există conceptul de „mediană” - o linie dreaptă care trece prin vârful unui triunghi și își împarte latura opusă în jumătate. În statistica matematică, mediana nu bisectează latura triunghiului, ci distribuția unei variabile aleatoare: egalitatea F(x0,5)= 0,5 înseamnă că probabilitatea de a ajunge la stânga x0,5și probabilitatea de a obține dreptate x0,5(sau direct la x0,5) sunt egale între ele și egale cu ½, adică

P(X < X 0,5) = P(X > X 0,5) = ½.

Mediana indică „centrul” distribuției. Din punctul de vedere al unuia dintre conceptele moderne - teoria procedurilor statistice stabile - mediana este o caracteristică mai bună a unei variabile aleatoare decât așteptarea matematică. Atunci când prelucrarea rezultatelor măsurătorilor într-o scară ordinală (vezi capitolul despre teoria măsurării), mediana poate fi utilizată, dar așteptările matematice nu.

O astfel de caracteristică a unei variabile aleatoare ca mod are o semnificație clară - valoarea (sau valorile) unei variabile aleatoare corespunzătoare unui maxim local al densității de probabilitate pentru o variabilă aleatoare continuă sau un maxim local al probabilității pentru o variabilă aleatoare discretă. variabil.

În cazul în care un x0 este modul unei variabile aleatoare cu densitate f(x), apoi, după cum se știe din calculul diferențial, .

O variabilă aleatoare poate avea mai multe moduri. Deci, pentru distribuția uniformă (1) fiecare punct X astfel încât A< x < b , este moda. Cu toate acestea, aceasta este o excepție. Majoritatea variabilelor aleatoare utilizate în metodele de luare a deciziilor probabilistic-statistice și alte cercetări aplicate au un singur mod. Variabilele aleatoare, densitățile, distribuțiile care au un singur mod sunt numite unimodale.

Așteptările matematice pentru variabile aleatoare discrete cu un număr finit de valori sunt luate în considerare în capitolul „Evenimente și probabilități”. Pentru o variabilă aleatoare continuă X valorea estimata M(X) satisface egalitatea

care este un analog al formulei (5) din afirmația 2 din capitolul „Evenimente și probabilități”.

Exemplul 5 Așteptări matematice pentru o variabilă aleatoare distribuită uniform X egală

Pentru variabilele aleatoare luate în considerare în acest capitol, sunt adevărate toate acele proprietăți ale așteptărilor și varianțelor matematice care au fost luate în considerare mai devreme pentru variabile aleatoare discrete cu un număr finit de valori. Cu toate acestea, nu oferim dovezi ale acestor proprietăți, deoarece ele necesită aprofundarea subtilităților matematice, ceea ce nu este necesar pentru înțelegerea și aplicarea calificată a metodelor probabilistic-statistice de luare a deciziilor.

Cometariu.În acest manual, subtilitățile matematice sunt evitate în mod deliberat, legate, în special, de conceptele de mulțimi măsurabile și de funcții măsurabile, de -algebra evenimentelor și așa mai departe. Cei care doresc să stăpânească aceste concepte ar trebui să se refere la literatura de specialitate, în special la enciclopedie.

Fiecare dintre cele trei caracteristici - așteptare matematică, mediană, mod - descrie „centrul” distribuției probabilităților. Conceptul de „centru” poate fi definit în moduri diferite – de unde cele trei caracteristici diferite. Cu toate acestea, pentru o clasă importantă de distribuții - unimodal simetric - toate cele trei caracteristici coincid.

Densitatea de distribuție f(x) este densitatea distribuției simetrice, dacă există un număr x 0 astfel încât

. (3)

Egalitatea (3) înseamnă că graficul funcției y = f(x) simetric față de o linie verticală care trece prin centrul de simetrie X = X 0 . Din (3) rezultă că funcția de distribuție simetrică satisface relația

(4)

Pentru o distribuție simetrică cu un singur mod, media, mediana și modul sunt aceleași și egale x 0.

Cel mai important caz este simetria față de 0, adică. x 0= 0. Atunci (3) și (4) devin egalități

(6)

respectiv. Relațiile de mai sus arată că nu este nevoie să se tabulare distribuțiile simetrice pentru toate X, este suficient să aveți tabele pentru X > x0.

Observăm încă o proprietate a distribuțiilor simetrice, care este utilizată constant în metodele probabilistic-statistice de luare a deciziilor și alte cercetări aplicate. Pentru o funcție de distribuție continuă

P(|X| < a) = P(-a < X < a) = F(a) – F(-a),

Unde F este funcția de distribuție a variabilei aleatoare X. Dacă funcţia de distribuţie F este simetric fata de 0, i.e. formula (6) este valabilă pentru aceasta, atunci

P(|X| < a) = 2F(a) – 1.

Deseori se foloseşte o altă formulare a enunţului luat în considerare: dacă

.

Dacă și sunt cuantile de ordinul și, respectiv (vezi (2)) ale unei funcții de distribuție simetrice față de 0, atunci din (6) rezultă că

Din caracteristicile poziției - așteptarea matematică, mediană, mod - să trecem la caracteristicile răspândirii unei variabile aleatoare X: varianță, abatere standard și coeficient de variație v. Definiția și proprietățile varianței pentru variabile aleatoare discrete au fost luate în considerare în capitolul anterior. Pentru variabile aleatoare continue

Abaterea standard este valoarea nenegativă a rădăcinii pătrate a varianței:

Coeficientul de variație este raportul dintre abaterea standard și așteptările matematice:

Coeficientul de variație se aplică atunci când M(X)> 0. Măsoară răspândirea în unități relative, în timp ce abaterea standard este în unități absolute.

Exemplul 6 Pentru o variabilă aleatoare distribuită uniform X găsiți varianța, abaterea standard și coeficientul de variație. Dispersia este:

Substituția variabilă face posibilă scrierea:

Unde c = (bA)/ 2. Prin urmare, abaterea standard este egală cu și coeficientul de variație este:

Pentru fiecare variabilă aleatoare X determina inca trei marimi - centrate Y, normalizat Vși dat U. Variabilă aleatoare centrată Y este diferența dintre variabila aleatoare dată Xși așteptările sale matematice M(X), acestea. Y = X - M(X). Așteptările matematice ale unei variabile aleatoare centrate Y este egal cu 0, iar varianța este varianța variabilei aleatoare date: M(Y) = 0, D(Y) = D(X). functie de distributie F Y(X) variabilă aleatoare centrată Y legate de funcţia de distribuţie F(X) variabilă aleatoare inițială X raport:

F Y(X) = F(X + M(X)).

Pentru densitățile acestor variabile aleatoare, egalitatea

f Y(X) = f(X + M(X)).

Variabilă aleatorie normalizată V este raportul acestei variabile aleatoare X la abaterea sa standard, adică . Așteptările matematice și varianța unei variabile aleatoare normalizate V exprimate prin caracteristici X Asa de:

,

Unde v este coeficientul de variație al variabilei aleatoare originale X. Pentru funcția de distribuție F V(X) si densitate f V(X) variabilă aleatoare normalizată V avem:

Unde F(X) este funcția de distribuție a variabilei aleatoare originale X, A f(X) este densitatea sa de probabilitate.

Variabilă aleatoare redusă U este o variabilă aleatoare centrată și normalizată:

.

Pentru o variabilă aleatoare redusă

Variabile aleatoare normalizate, centrate și reduse sunt utilizate în mod constant atât în ​​cercetarea teoretică, cât și în algoritmi, produse software, documentație de reglementare și tehnică și instructivă și metodologică. În special, pentru că egalitățile fac posibilă simplificarea fundamentarii metodelor, formulărilor de teoreme și formulelor de calcul.

Se folosesc transformări ale variabilelor aleatoare și un plan mai general. Astfel, dacă Y = topor + b, Unde Ași b sunt niște numere, atunci

Exemplul 7 Daca atunci Y este variabila aleatoare redusă, iar formulele (8) sunt transformate în formule (7).

Cu fiecare variabilă aleatoare X puteți conecta o mulțime de variabile aleatoare Y dat de formula Y = topor + b la diverse A> 0 și b. Acest set se numește familie cu schimbare la scară, generat de o variabilă aleatoare X. Funcții de distribuție F Y(X) constituie o familie de distribuții cu schimbare la scară generată de funcția de distribuție F(X). În loc de Y = topor + b notație folosită frecvent

Număr Cu se numește parametrul de schimbare și numărul d- parametrul de scară. Formula (9) arată că X- rezultatul măsurării unei anumite cantități - intră în La- rezultatul măsurării aceleiași valori, dacă începutul măsurării este mutat în punct Cu, apoi utilizați noua unitate de măsură, în d ori mai mare decât cea veche.

Pentru familia scale-shift (9), distribuția X se numește standard. În metodele de luare a deciziilor probabilistic-statistice și alte cercetări aplicate se utilizează distribuția normală standard, distribuția standard Weibull-Gnedenko, distribuția standard gamma etc. (vezi mai jos).

Sunt folosite și alte transformări ale variabilelor aleatoare. De exemplu, pentru o variabilă aleatoare pozitivă X considera Y= jurnal X, unde lg X este logaritmul zecimal al numărului X. Lanț de egalități

F Y (x) = P( lg X< x) = P(X < 10x) = F( 10X)

raportează funcțiile de distribuție Xși Y.

La procesarea datelor, sunt utilizate astfel de caracteristici ale unei variabile aleatorii X ca momentele de ordine q, adică așteptările matematice ale unei variabile aleatorii X q, q= 1, 2, … Astfel, așteptarea matematică în sine este un moment de ordin 1. Pentru o variabilă aleatoare discretă, momentul de ordin q poate fi calculat ca

Pentru o variabilă aleatoare continuă

Momente de ordine q numite şi momentele iniţiale ale ordinului q, spre deosebire de caracteristicile conexe – momentele centrale ale ordinului q, dat de formula

Astfel, dispersia este un moment central de ordinul 2.

Distribuția normală și teorema limitei centrale.În metodele probabilistic-statistice de luare a deciziilor, vorbim adesea despre o distribuție normală. Uneori încearcă să-l folosească pentru a modela distribuția datelor inițiale (aceste încercări nu sunt întotdeauna justificate - vezi mai jos). Mai important, multe metode de procesare a datelor se bazează pe faptul că valorile calculate au distribuții care sunt aproape de normal.

Lăsa X 1 , X 2 ,…, X n M(X i) = m si dispersii D(X i) = , i = 1, 2,…, n,… După cum rezultă din rezultatele capitolului anterior,

Luați în considerare variabila aleatoare redusă U n pentru suma , și anume,

După cum rezultă din formulele (7), M(U n) = 0, D(U n) = 1.

(pentru termeni distribuiti identic). Lăsa X 1 , X 2 ,…, X n, … sunt variabile aleatoare independente distribuite identic cu așteptări matematice M(X i) = m si dispersii D(X i) = , i = 1, 2,…, n,… Atunci pentru orice x există o limită

Unde F(x) este funcția de distribuție normală standard.

Mai multe despre funcție F(x) - mai jos (se citește „fi din x”, pentru că F- Literă majusculă grecească „phi”).

Teorema limită centrală (CLT) își ia numele de la faptul că este rezultatul matematic central, cel mai frecvent utilizat al teoriei probabilităților și statistici matematice. Istoria CLT durează aproximativ 200 de ani - din 1730, când matematicianul englez A. De Moivre (1667-1754) a publicat primul rezultat legat de CLT (vezi mai jos despre teorema Moivre-Laplace), până în anii douăzeci - treizeci. al secolului al XX-lea, când Finn J.W. Lindeberg, francezul Paul Levy (1886-1971), iugoslav V. Feller (1906-1970), rusul A.Ya. Khinchin (1894-1959) și alți oameni de știință au obținut condițiile necesare și suficiente pentru valabilitatea centralei clasice. teorema limitei.

Dezvoltarea subiectului luat în considerare nu s-a oprit deloc aici - au studiat variabile aleatoare care nu au dispersie, adică. cei pentru care

(academician B.V. Gnedenko și alții), situația în care se însumează variabile aleatoare (mai precis, elemente aleatoare) de natură mai complexă decât numerele (academicienii Yu.V. Prokhorov, A.A. Borovkov și asociații lor), etc. .d.

functie de distributie F(x) este dat de egalitate

,

unde este densitatea distribuției normale standard, care are destul expresie compusă:

.

Aici \u003d 3,1415925 ... este un număr cunoscut în geometrie, egal cu raportul dintre circumferință și diametru, e \u003d 2,718281828 ... - baza logaritmilor naturali (pentru a ne aminti acest număr, rețineți că 1828 este anul nașterii scriitorului Lev Tolstoi). După cum se știe din analiza matematică,

La procesarea rezultatelor observațiilor, funcția de distribuție normală nu este calculată conform formulelor de mai sus, ci se găsește folosind tabele speciale sau programe de calculator. Cele mai bune „Tabele de statistici matematice” în limba rusă au fost întocmite de membrii corespondenți ai Academiei de Științe a URSS L.N. Bolşev şi N.V. Smirnov.

Forma densității distribuției normale standard decurge din teoria matematică, pe care nu o putem considera aici, precum și demonstrația CLT.

Pentru ilustrare, prezentăm mici tabele ale funcției de distribuție F(x)(Tabelul 2) și cuantilele sale (Tabelul 3). Funcţie F(x) este simetrică față de 0, ceea ce este reflectat în tabelele 2-3.

Masa 2.

Funcția distribuției normale standard.

Dacă variabila aleatoare X are o funcție de distribuție F(x), apoi M(X) = 0, D(X) = 1. Această afirmație este dovedită în teoria probabilității pe baza formei densității probabilității . Este de acord cu o afirmație similară pentru caracteristicile variabilei aleatoare reduse U n, ceea ce este destul de firesc, deoarece CLT afirmă că, cu o creștere infinită a numărului de termeni, funcția de distribuție U n tinde spre funcția de distribuție normală standard F(x), si pentru orice X.

Tabelul 3

Cuantile ale distribuției normale standard.

Comandă cuantilă R

Comandă cuantilă R

Să introducem conceptul de familie de distribuții normale. Prin definiție, o distribuție normală este distribuția unei variabile aleatoare X, pentru care distribuția variabilei aleatoare reduse este F(x). După cum rezultă din proprietăți comune familii de distribuții cu schimbare la scară (vezi mai sus), distribuția normală este distribuția unei variabile aleatoare

Unde X este o variabilă aleatoare cu distribuție F(X),și m = M(Y), = D(Y). Distribuție normală cu parametrii de deplasare m iar scara este de obicei indicată N(m, ) (uneori notația N(m, ) ).

După cum rezultă din (8), densitatea de probabilitate a distribuției normale N(m, ) există

Distribuțiile normale formează o familie cu schimbare la scară. În acest caz, parametrul scară este d= 1/ și parametrul de deplasare c = - m/ .

Pentru momentele centrale de ordinul trei și al patrulea ale distribuției normale, egalitățile sunt adevărate

Aceste egalități stau la baza metodelor clasice de verificare a faptului că rezultatele observațiilor urmează o distribuție normală. În prezent, normalitatea este de obicei recomandată a fi verificată prin criteriu W Shapiro - Wilka. Problema verificării normalității este discutată mai jos.

Dacă variabile aleatorii X 1și X 2 au funcții de distribuție N(m 1 , 1) și N(m 2 , 2) respectiv, atunci X 1+ X 2 are o distributie Prin urmare, dacă variabilele aleatoare X 1 , X 2 ,…, X n N(m, ) , apoi media lor aritmetică

are o distributie N(m, ) . Aceste proprietăți ale distribuției normale sunt utilizate în mod constant în diferite metode probabilistic-statistice de luare a deciziilor, în special, în controlul statistic al proceselor tehnologice și în controlul acceptării statistice printr-un atribut cantitativ.

Distribuția normală definește trei distribuții care sunt acum utilizate în mod obișnuit în prelucrarea datelor statistice.

Distribuție (chi - pătrat) - distribuția unei variabile aleatoare

unde variabile aleatorii X 1 , X 2 ,…, X n sunt independente și au aceeași distribuție N(0,1). În acest caz, numărul de termeni, adică n, se numește „numărul de grade de libertate” al distribuției chi-pătrat.

Distributie t Student este distribuția unei variabile aleatoare

unde variabile aleatorii Uși X independent, U are o distribuție normală standard N(0,1) și X– distribuție chi – pătrat cu n grade de libertate. în care n se numește „numărul de grade de libertate” al distribuției Studentului. Această distribuție a fost introdusă în 1908 de statisticianul englez W. Gosset, care lucra la o fabrică de bere. Pentru a lua decizii economice și tehnice la această fabrică s-au folosit metode probabilistic-statistice, așa că conducerea acesteia i-a interzis lui V. Gosset să publice articole științifice sub nume propriu. În acest fel a fost protejat un secret comercial, „know-how” sub forma metodelor probabilistic-statistice dezvoltate de W. Gosset. Cu toate acestea, a putut publica sub pseudonimul „Student”. Istoria lui Gosset - Student arată că încă o sută de ani marea eficiență economică a metodelor probabilistic-statistice de luare a deciziilor a fost evidentă pentru managerii britanici.

Distribuția Fisher este distribuția unei variabile aleatoare

unde variabile aleatorii X 1și X 2 sunt independente și au distribuții chi - pătratul cu numărul de grade de libertate k 1 și k 2 respectiv. În același timp, un cuplu (k 1 , k 2 ) - o pereche de „numere de grade de libertate” Distribuții Fisher, și anume, k 1 este numărul de grade de libertate ale numărătorului și k 2 este numărul de grade de libertate ale numitorului. Distribuția variabilei aleatoare F este numită după marele statistician englez R. Fisher (1890-1962), care a folosit-o activ în lucrarea sa.

Expresiile pentru funcțiile de distribuție ale chi - pătrat, Student și Fisher, densitățile și caracteristicile acestora, precum și tabele pot fi găsite în literatura specială (vezi, de exemplu,).

După cum sa menționat deja, distribuțiile normale sunt adesea utilizate în modelele probabilistice în diferite domenii aplicate. De ce este această familie de distribuții cu doi parametri atât de răspândită? Se clarifică prin următoarea teoremă.

Teorema limitei centrale(pentru termeni distribuiti diferit). Lăsa X 1 , X 2 ,…, X n,… sunt variabile aleatoare independente cu așteptări matematice M(X 1 ), M(X 2 ),…, M(X n), … și dispersii D(X 1 ), D(X 2 ),…, D(X n), … respectiv. Lăsa

Apoi, în valabilitatea anumitor condiții care asigură micimea contribuției oricăruia dintre termenii la U n,

pentru oricine X.

Condițiile în cauză nu vor fi formulate aici. Ele pot fi găsite în literatura de specialitate (vezi, de exemplu,). „Clarificarea condițiilor în care funcționează CPT este meritul remarcabililor oameni de știință ruși A.A. Markov (1857-1922) și, în special, A.M. Lyapunov (1857-1918)” .

Teorema limită centrală arată că în cazul în care rezultatul măsurării (observării) se formează sub influența mai multor motive, fiecare dintre ele având doar o mică contribuție, iar rezultatul cumulat este determinat de aditiv, adică prin adăugare, atunci distribuția rezultatului măsurării (observării) este aproape de normal.

Uneori se crede că pentru ca distribuția să fie normală este suficient ca rezultatul măsurării (observării) X format sub influența mai multor cauze, fiecare având un efect mic. Nu este adevarat. Ceea ce contează este cum funcționează aceste cauze. Dacă este aditiv, atunci X are o distribuție aproximativ normală. În cazul în care un în mod multiplicativ(adică acțiunile cauzelor individuale se înmulțesc, nu se adună), apoi distribuția X nu aproape de normal, ci de așa-zis. normal din punct de vedere logaritmic, adică nu X, iar lg X are o distribuție aproximativ normală. Dacă nu există motive să credem că unul dintre aceste două mecanisme pentru formarea rezultatului final (sau un alt mecanism bine definit) funcționează, atunci despre distribuție. X nimic cert nu se poate spune.

Din cele spuse, rezultă că într-o problemă aplicată specifică, normalitatea rezultatelor măsurătorilor (observațiilor), de regulă, nu poate fi stabilită din considerente generale, ea trebuie verificată cu ajutorul unor criterii statistice. Sau folosiți metode statistice neparametrice care nu se bazează pe ipoteze despre funcțiile de distribuție a rezultatelor măsurătorilor (observațiilor) aparținând uneia sau alteia familii parametrice.

Distribuții continue utilizate în metodele decizionale probabilistic-statistice.În plus față de familia de distribuții normale cu schimbare de scară, o serie de alte familii de distribuții sunt utilizate pe scară largă - distribuții normale din punct de vedere logaritmic, exponențial, Weibull-Gnedenko, gamma. Să aruncăm o privire asupra acestor familii.

Valoare aleatoare X are o distribuție log-normală dacă variabila aleatoare Y= jurnal X are o distribuție normală. Apoi Z=ln X = 2,3026…Y are de asemenea o distribuție normală N(A 1 ,σ 1), unde ln X - logaritmul natural X. Densitatea distribuției log-normale este:

Din teorema limită centrală rezultă că produsul X = X 1 X 2 X n variabile aleatoare pozitive independente X i, i = 1, 2,…, n, în mare n poate fi aproximată printr-o distribuție log-normală. În special, modelul multiplicativ al formării salariilor sau veniturilor conduce la recomandarea de a aproxima distribuțiile salariilor și veniturilor prin legi normale logaritmic. Pentru Rusia, această recomandare s-a dovedit a fi justificată - statisticile o confirmă.

Există și alte modele probabilistice care conduc la legea log-normală. Un exemplu clasic de astfel de model este dat de A.N. morile cu bile au o distribuție log-normală.

Să trecem la o altă familie de distribuții, utilizată pe scară largă în diverse metode probabilistic-statistice de luare a deciziilor și alte cercetări aplicate, familia distribuțiilor exponențiale. Să începem cu un model probabilistic care duce la astfel de distribuții. Pentru a face acest lucru, luați în considerare „fluxul de evenimente”, adică. o succesiune de evenimente care au loc unul după altul la un moment dat în timp. Exemple sunt: ​​fluxul de apeluri la centrala telefonică; fluxul defecțiunilor echipamentelor din lanțul tehnologic; fluxul de defecțiuni ale produsului în timpul testării produsului; fluxul de cereri ale clienților către sucursala băncii; fluxul de cumpărători care solicită bunuri și servicii etc. În teoria fluxurilor de evenimente este valabilă o teoremă care este similară cu teorema limită centrală, dar în ea vorbim nu despre însumarea variabilelor aleatoare, ci despre însumarea fluxurilor de evenimente. Considerăm fluxul total compus din un numar mare fluxuri independente, dintre care niciunul nu are un efect predominant asupra debitului total. De exemplu, fluxul de apeluri care sosesc la centrala telefonică este alcătuit dintr-un număr mare de fluxuri de apel independente care provin de la abonați individuali. Se dovedește că în cazul în care caracteristicile fluxurilor nu depind de timp, debitul total este complet descris printr-un număr - intensitatea fluxului. Pentru debitul total, luați în considerare o variabilă aleatorie X- lungimea intervalului de timp dintre evenimente succesive. Funcția sa de distribuție are forma

(10)

Această distribuție se numește distribuție exponențială deoarece formula (10) implică funcția exponențială eX. Valoarea 1/λ este un parametru de scară. Uneori este introdus și un parametru de schimbare Cu, exponențial este distribuția unei variabile aleatoare X + c, unde distribuția X este dat de formula (10).

Distribuții exponențiale - caz special așa-zisul. Distribuții Weibull - Gnedenko. Ele sunt numite după inginerul W. Weibull, care a introdus aceste distribuții în practica analizei rezultatelor testelor de oboseală, și matematicianul B.V. Gnedenko (1912-1995), care a primit astfel de distribuții ca fiind limitative la studierea maximului testului. rezultate. Lăsa X- o variabilă aleatoare care caracterizează durata de funcționare a produsului, sistem complex, element (adică resursă, timp de funcționare până la starea limită etc.), durata de funcționare a unei întreprinderi sau viața unei ființe vii etc. Rata de eșec joacă un rol important

(11)

Unde F(X) și f(X) - funcţia de distribuţie şi densitatea unei variabile aleatoare X.

Să descriem comportamentul tipic al ratei de eșec. Întregul interval de timp poate fi împărțit în trei perioade. Pe primul dintre ele, funcția λ(x) are valori ridicate și o tendință clară de scădere (cel mai adesea scade monoton). Acest lucru poate fi explicat prin prezența în lotul luat în considerare a unităților de produs cu defecte evidente și latente, care duc la o defecțiune relativ rapidă a acestor unități de produs. Prima perioadă se numește perioada de „rodare” (sau „de evaziune”). Acest lucru este de obicei acoperit de perioada de garanție.

Apoi urmează perioada de funcționare normală, caracterizată printr-o rată de eșec aproximativ constantă și relativ scăzută. Natura defecțiunilor în această perioadă este de natură bruscă (accidente, erori ale personalului de exploatare etc.) și nu depinde de durata de funcționare a unei unități de produs.

În sfârșit, ultima perioadă de funcționare este perioada de îmbătrânire și uzură. Natura defecțiunilor în această perioadă este în modificări fizice, mecanice și chimice ireversibile ale materialelor, ducând la o deteriorare progresivă a calității unei unități de producție și la defecțiunea finală a acesteia.

Fiecare perioadă are propriul său tip de funcție λ(x). Luați în considerare clasa dependențelor de putere

λ(х) = λ0bxb -1 , (12)

Unde λ 0 > 0 și b> 0 - unii parametri numerici. Valori b < 1, b= 0 și b> 1 corespund tipului de defecțiune în perioadele de rodare, de funcționare normală și, respectiv, de îmbătrânire.

Relația (11) pentru o rată de eșec dată λ(x)- ecuație diferențială în raport cu funcția F(X). Din teorie ecuatii diferentiale urmează că

(13)

Înlocuind (12) în (13), obținem asta

(14)

Distribuția dată de formula (14) se numește distribuție Weibull - Gnedenko. Pentru că

atunci din formula (14) rezultă că cantitatea A, dat de formula (15), este un parametru de scalare. Uneori este introdus și un parametru de schimbare, de ex. Sunt numite funcții de distribuție Weibull - Gnedenko F(X - c), Unde F(X) este dat de formula (14) pentru unele λ 0 și b.

Densitatea distribuției Weibull - Gnedenko are forma

(16)

Unde A> 0 - parametrul de scară, b> 0 - parametru de formă, Cu- parametrul de schimbare. În acest caz, parametrul A din formula (16) este legată de parametru λ 0 din formula (14) cu raportul indicat în formula (15).

Distribuția exponențială este un caz foarte special al distribuției Weibull - Gnedenko, corespunzătoare valorii parametrului de formă b = 1.

Distribuția Weibull - Gnedenko este folosită și în construcția modelelor probabilistice ale situațiilor în care comportamentul unui obiect este determinat de „cea mai slabă verigă”. Este implicată o analogie cu un lanț, a cărui siguranță este determinată de acea verigă care are cea mai mică rezistență. Cu alte cuvinte, lasă X 1 , X 2 ,…, X n sunt variabile aleatoare independente distribuite identic,

X(1)=min( X 1 , X 2 ,…, X n), X(n)=max( X 1 , X 2 ,…, X n).

Într-o serie de probleme aplicate, un rol important îl joacă X(1) și X(n) , în special, atunci când se studiază valorile maxime posibile („înregistrări”) ale anumitor valori, de exemplu, plăți de asigurare sau pierderi datorate riscurilor comerciale, atunci când se studiază limitele elasticității și rezistenței oțelului, o serie de caracteristici de fiabilitate, etc. Se arată că pentru n mari distribuţiile X(1) și X(n) , de regulă, sunt bine descrise de distribuțiile Weibull - Gnedenko. Contribuții fundamentale la studiul distribuțiilor X(1) și X(n) a fost introdus de matematicianul sovietic B.V. Gnedenko. Lucrările lui V. Weibull, E. Gumbel, V.B. Nevzorova, E.M. Kudlaev și mulți alți specialiști.

Să trecem la familia distribuțiilor gamma. Ele sunt utilizate pe scară largă în economie și management, teoria și practica fiabilității și testării, în diverse zone tehnologie, meteorologie etc. În special, în multe situații, distribuția gamma este supusă unor cantități cum ar fi durata de viață totală a produsului, lungimea lanțului de particule conductoare de praf, timpul necesar produsului pentru a atinge starea limită în timpul coroziunii, durata de funcționare. timp până la k refuzul, k= 1, 2, … etc. Speranța de viață a pacienților cu boli cronice, timpul pentru a obține un anumit efect în tratament au în unele cazuri o distribuție gamma. Această distribuție este cea mai adecvată pentru descrierea cererii în modelele economice și matematice de gestionare a stocurilor (logistică).

Densitatea distribuției gamma are forma

(17)

Densitatea de probabilitate din formula (17) este determinată de trei parametri A, b, c, Unde A>0, b>0. în care A este un parametru de formă, b- parametrul de scară și Cu- parametru de schimbare. Factor 1/Γ(a) este o normalizare, se introduce pentru a

Aici Γ(a)- una dintre funcțiile speciale utilizate în matematică, așa-numita „funcție gamma”, prin care este denumită și distribuția dată de formula (17),

La un fix A formula (17) definește o familie de distribuții scale-shift generate de o distribuție cu densitate

(18)

Distribuția formei (18) se numește distribuție gamma standard. Se obtine din formula (17) cu b= 1 și Cu= 0.

Un caz special de distribuții gamma la A= 1 sunt distribuții exponențiale (cu λ = 1/b). Cu naturale Ași Cu=0 distribuțiile gamma se numesc distribuții Erlang. Din lucrările omului de știință danez K.A. Erlang (1878-1929), angajat al companiei de telefonie din Copenhaga, care a studiat în 1908-1922. funcţionarea reţelelor de telefonie, a început dezvoltarea teoriei cozilor de aşteptare. Această teorie este angajată în modelarea probabilistic-statistică a sistemelor în care fluxul de cereri este deservit pentru a lua decizii optime. Distribuțiile Erlang sunt utilizate în aceleași domenii de aplicare ca și distribuțiile exponențiale. Aceasta se bazează pe următorul fapt matematic: suma k variabile aleatoare independente distribuite exponențial cu aceiași parametri λ și Cu, are o distribuție gamma cu parametru de formă a =k, parametrul de scară b= 1/λ și parametrul deplasării kc. La Cu= 0 obținem distribuția Erlang.

Dacă variabila aleatoare X are o distribuție gamma cu parametru de formă A astfel încât d = 2 A- un număr întreg, b= 1 și Cu= 0, apoi 2 X are o distribuție chi-pătrat cu d grade de libertate.

Valoare aleatoare X cu distribuția gvmma are următoarele caracteristici:

Valorea estimata M(X) =ab + c,

dispersie D(X) = σ 2 = ab 2 ,

Coeficientul de variație

asimetrie

Exces

Distribuția normală este un caz extrem al distribuției gamma. Mai precis, să fie Z o variabilă aleatoare cu o distribuție gamma standard dată de formula (18). Apoi

pentru oricine numar real X, Unde F(x)- functie de distributie normala standard N(0,1).

În cercetarea aplicată se folosesc și alte familii parametrice de distribuții, dintre care sistemul de curbe Pearson, seriile Edgeworth și Charlier sunt cele mai cunoscute. Ele nu sunt considerate aici.

Discret distribuţii utilizate în metodele decizionale probabilistic-statistice. Cel mai adesea, sunt utilizate trei familii de distribuții discrete - binomială, hipergeometrică și Poisson, precum și alte familii - geometrice, binom negative, multinomiale, hipergeometrice negative etc.

După cum sa menționat deja, distribuția binomială are loc în încercări independente, în fiecare dintre ele cu o probabilitate R apare evenimentul DAR. În cazul în care un numărul total teste n dat, apoi numărul de încercări Y, în care a apărut evenimentul DAR, are o distribuție binomială. Pentru o distribuție binomială, probabilitatea de a fi acceptată ca variabilă aleatoare Y valorile y este determinat de formula

Numărul de combinații de la n elemente prin y cunoscut din combinatorică. Pentru toți y, cu excepția 0, 1, 2, …, n, avem P(Y= y)= 0. Distribuție binomială cu o dimensiune fixă ​​a eșantionului n este setat de parametru p, adică distribuțiile binomiale formează o familie cu un singur parametru. Ele sunt utilizate în analiza datelor din cercetarea eșantionului, în special, în studiul preferințelor consumatorilor, controlul selectiv al calității produselor conform planurilor de control într-o singură etapă, la testarea populațiilor de indivizi în demografie, sociologie, medicină, biologie etc.

În cazul în care un Y 1 și Y 2 - variabile aleatoare binomiale independente cu același parametru p 0 determinate de probe cu volume n 1 și n 2 respectiv, atunci Y 1 + Y 2 - variabilă aleatoare binomială cu distribuţie (19) cu R = p 0 și n = n 1 + n 2 . Această remarcă extinde aplicabilitatea distribuției binomiale, permițându-vă să combinați rezultatele mai multor grupuri de teste, atunci când există motive să credeți că același parametru corespunde tuturor acestor grupuri.

Caracteristicile distribuției binomiale au fost calculate mai devreme:

M(Y) = np, D(Y) = np( 1- p).

În secțiunea „Evenimente și probabilități” pentru o variabilă aleatoare binomială, se demonstrează legea numerelor mari:

pentru oricine . Cu ajutorul teoremei limitei centrale, legea numerelor mari poate fi rafinată indicând cum Y/ n difera de R.

Teorema lui De Moivre-Laplace. Pentru orice numere a și b, A< b, avem

Unde F(X) este o funcție de distribuție normală standard cu medie 0 și varianță 1.

Pentru a dovedi, este suficient să folosim reprezentarea Y ca sumă de variabile aleatoare independente corespunzătoare rezultatelor studiilor individuale, formule pentru M(Y) și D(Y) și teorema limitei centrale.

Această teoremă este pentru caz R= ½ a fost dovedit de matematicianul englez A. Moivre (1667-1754) în 1730. În formularea de mai sus, a fost dovedit în 1810 de matematicianul francez Pierre Simon Laplace (1749-1827).

Distribuția hipergeometrică are loc în timpul controlului selectiv al unui set finit de obiecte de volum N conform unei caracteristici alternative. Fiecare obiect controlat este clasificat fie ca având atributul DAR, sau ca nu posedă această caracteristică. Distribuția hipergeometrică are o variabilă aleatorie Y, egal cu numărul de obiecte care au atributul DARîntr-o probă aleatorie de volum n, Unde n< N. De exemplu, numărul Y unități defecte de produse dintr-un eșantion aleatoriu de volum n din volumul lotului N are o distribuţie hipergeometrică dacă n< N. Un alt exemplu este loteria. Lasă semnul DAR un bilet este un semn de „a fi câștigător”. Lasă toate biletele N, iar cineva a dobândit n dintre ei. Atunci numărul de bilete câștigătoare pentru această persoană are o distribuție hipergeometrică.

Pentru o distribuție hipergeometrică, probabilitatea ca o variabilă aleatoare Y să ia valoarea y are forma

(20)

Unde D este numărul de obiecte care au atributul DAR, în setul considerat de volum N. în care y ia valori de la max(0, n - (N - D)) la min( n, D), cu alte y probabilitatea din formula (20) este egală cu 0. Astfel, distribuția hipergeometrică este determinată de trei parametri - volumul populatie N, numărul de obiecte Dîn ea, posedând trăsătura considerată DAR, și dimensiunea eșantionului n.

Eșantionare aleatorie simplă n din volumul total N se numește eșantion obținut ca urmare a selecției aleatoare, în care oricare dintre mulțimi din n obiectele au aceeași probabilitate de a fi selectate. Metodele de selecție aleatorie a eșantioanelor de respondenți (intervievați) sau a unităților de produse pe bucată sunt luate în considerare în documentele instructiv-metodice și normativ-tehnice. Una dintre metodele de selecție este următoarea: obiectele sunt selectate unul din celălalt, iar la fiecare pas fiecare dintre obiectele rămase din set are aceeași șansă de a fi selectat. În literatura de specialitate, pentru tipul de eșantioane luate în considerare, se folosesc și termenii „eșantion aleatoriu”, „probă aleatoare fără înlocuire”.

Deoarece volumele populației generale (loturi) Nși mostre n sunt cunoscute în mod obișnuit, atunci parametrul de distribuție hipergeometrică care trebuie estimat este D. În metodele statistice de management al calității produselor D- de obicei numărul de unități defecte din lot. Interesantă este și caracteristica distribuției D/ N- nivelul defectelor.

Pentru distribuția hipergeometrică

Ultimul factor din expresia varianței este aproape de 1 dacă N>10 n. Dacă, în același timp, facem și înlocuirea p = D/ N, atunci expresiile pentru așteptarea și varianța matematică a distribuției hipergeometrice se vor transforma în expresii pentru așteptarea și varianța matematică a distribuției binomiale. Aceasta nu este o coincidență. Se poate arăta că

la N>10 n, Unde p = D/ N. Raportul limitativ este valabil

iar această relaţie limitativă poate fi folosită pentru N>10 n.

A treia distribuție discretă utilizată pe scară largă este distribuția Poisson. O variabilă aleatoare Y are o distribuție Poisson dacă

,

unde λ este parametrul distribuției Poisson și P(Y= y)= 0 pentru toate celelalte y(pentru y=0, se notează 0!=1). Pentru distribuția Poisson

M(Y) = λ, D(Y) = λ.

Această distribuție este numită după matematicianul francez C.D.Poisson (1781-1840), care a derivat-o pentru prima dată în 1837. Distribuția Poisson este un caz extrem al distribuției binomiale, unde probabilitatea R implementarea evenimentului este mică, dar numărul de încercări n grozav, și np= λ. Mai exact, relația limită

Prin urmare, distribuția Poisson (în vechea terminologie „legea distribuției”) este adesea numită și „legea evenimentelor rare”.

Distribuția Poisson apare în teoria fluxurilor de evenimente (vezi mai sus). Se dovedește că pentru cel mai simplu flux cu intensitate constantă Λ, numărul de evenimente (apeluri) care au avut loc în timpul t, are o distribuție Poisson cu parametrul λ = Λ t. Prin urmare, probabilitatea ca în timp t nu va avea loc nici un eveniment e - Λ t, adică funcţia de distribuţie a lungimii intervalului dintre evenimente este exponenţială.

Distribuția Poisson este utilizată în analiza rezultatelor anchetelor de marketing selective ale consumatorilor, în calculul caracteristicilor operaționale ale planurilor de control statistic de acceptare în cazul valorilor mici ale nivelului de acceptare a defectivității, pentru a descrie numărul de defecțiuni. a unui proces tehnologic controlat statistic pe unitatea de timp, numărul de „cerințe de serviciu” care sosesc pe unitatea de timp în sistemul de așteptare, modelele statistice ale accidentelor și bolilor rare etc.

Descrierea altor familii parametrice de distribuții discrete și posibilitatea utilizării lor practice sunt luate în considerare în literatură.


În unele cazuri, de exemplu, când se studiază prețurile, volumele de producție sau timpul total dintre eșecurile problemelor de fiabilitate, funcțiile de distribuție sunt constante pe anumite intervale în care valorile variabilelor aleatoare studiate nu pot scădea.

Anterior

Funcția de distribuție a unei variabile aleatoare X este funcția F(x), exprimând pentru fiecare x probabilitatea ca variabila aleatoare X să ia valoarea, x mai mic

Exemplul 2.5. Având în vedere o serie de distribuție a unei variabile aleatoare

Găsiți și descrieți grafic funcția sa de distribuție. Soluţie. Conform definiţiei

F(jc) = 0 pentru X X

F(x) = 0,4 + 0,1 = 0,5 la 4 F(x) = 0,5 + 0,5 = 1 la X > 5.

Deci (vezi Fig. 2.1):


Proprietățile funcției de distribuție:

1. Funcția de distribuție a unei variabile aleatoare este o funcție nenegativă cuprinsă între zero și unu:

2. Funcția de distribuție a unei variabile aleatoare este o funcție nedescrescătoare pe toată axa numerelor, adică. la X 2 >x

3. La minus infinit, funcția de distribuție este egală cu zero, la plus infinit, este egală cu unu, adică.

4. Probabilitatea de a atinge o variabilă aleatoare Xîn interval este egală cu integrala definită a densității sale de probabilitate variind de la A inainte de b(vezi Fig. 2.2), i.e.


Orez. 2.2

3. Funcția de distribuție a unei variabile aleatoare continue (vezi Fig. 2.3) poate fi exprimată în termeni de densitate de probabilitate folosind formula:

F(x)= Jp(*)*. (2,10)

4. Integrala improprie în limite infinite ale densității de probabilitate a unei variabile aleatoare continue este egală cu unu:

Proprietăţi geometrice / şi 4 densitățile de probabilitate înseamnă că graficul său este curba de distributie - nu se află sub axa x, și suprafata totala cifre, curba de distribuție limitată și axa x, este egal cu unu.

Pentru o variabilă aleatoare continuă X valorea estimata M(X) si varianta D(X) sunt determinate de formulele:

(dacă integrala converge absolut); sau

(dacă integralele reduse converg).

Alături de caracteristicile numerice menționate mai sus, conceptul de cuantile și puncte procentuale este folosit pentru a descrie o variabilă aleatorie.

cuantila de nivel q(sau q-quantila) este o astfel de valoarex qvariabilă aleatorie, la care funcţia sa de distribuţie ia valoarea, egal cu q, adică

  • 100Punctul q%-ou este cuantila X~ q .
  • ? Exemplul 2.8.

Conform exemplului 2.6 găsiți cuantila xqj și 30% punct variabil aleatoriu X.

Soluţie. Prin definiție (2.16) F(xo t3)= 0.3, adică.

~Y~ = 0,3, de unde cuantila x 0 3 = 0,6. 30% punct variabil aleatoriu X, sau cuantila Х)_о,з = xoj» se găsește în mod similar din ecuația ^ = 0,7. de unde *,= 1,4. ?

Printre caracteristici numerice alocare variabilă aleatorie iniţială v* și central R* momente de ordinul k, determinat pentru variabile aleatoare discrete și continue prin formulele:


Dintre legile de distribuție pentru variabile aleatoare discrete, cea mai comună este legea distribuției binomiale. Distribuția binomială are loc în următoarele condiții. Fie o variabilă aleatorie numărul de apariții ale unui eveniment în studii independente, probabilitatea de apariție într-un studiu separat este . Această variabilă aleatoare este o variabilă aleatoare discretă, valorile sale posibile sunt . Probabilitatea ca o variabilă aleatoare să ia o valoare se calculează prin formula Bernoulli: .

Definiția 15. Legea distribuției unei variabile aleatoare discrete se numește legea distribuției binomiale dacă probabilitățile valorilor variabilei aleatoare sunt calculate folosind formula Bernoulli. Seria de distribuție va arăta astfel:

Să ne asigurăm că suma probabilităților diferitelor valori ale variabilei aleatoare este egală cu 1. Într-adevăr,

Deoarece aceste calcule au dus la formula binomială a lui Newton, legea distribuției se numește binom. Dacă o variabilă aleatorie are o distribuție binomială, atunci caracteristicile sale numerice se găsesc prin formulele:

(42) (43)

Exemplul 15 Există un lot de 50 de piese. Probabilitatea căsătoriei pentru o parte. Fie o variabilă aleatorie numărul de piese defecte dintr-un anumit lot. Găsiți așteptările matematice, varianța și abaterea standard a unei variabile aleatoare date. Soluţie. O variabilă aleatoare are o distribuție binomială, deoarece probabilitatea ca aceasta să ia o valoare este calculată folosind formula Bernoulli. Atunci așteptarea sa matematică se găsește prin formula (41), și anume, ; varianţa se găseşte prin formula (42): . Atunci abaterea standard va fi egală cu . Întrebare. 200 de bilete de loterie achiziționate, probabilitatea de a câștiga un bilet este de 0,01. Atunci numărul mediu de bilete de loterie care vor câștiga este: a) 10; b) 2; în 20; d) 1.

Legea distribuției Poisson

Când se rezolvă multe probleme practice, trebuie să se ocupe de variabile aleatoare discrete care se supun legii distribuției Poisson. Exemple tipice de variabilă aleatorie cu o distribuție Poisson sunt: ​​numărul de apeluri la centrala telefonică de ceva timp; numărul de defecțiuni ale echipamentelor complexe în timp, dacă se știe că defecțiunile sunt independente unele de altele și în medie există defecțiuni pe unitatea de timp.Seria de distribuție va arăta astfel:

Adică, probabilitatea ca o variabilă aleatoare să ia o valoare este calculată prin formula Poisson: prin urmare, această lege se numește legea distribuției Poisson. O variabilă aleatoare distribuită conform legii Poisson are următoarele caracteristici numerice:

Distribuția Poisson depinde de un parametru, care este media variabilei aleatoare. Figura 14 arată forma generala poligonul distribuției Poisson pentru diferite valori ale parametrului.

Distribuția Poisson poate fi folosită ca o aproximare în cazurile în care distribuția exactă a unei variabile aleatoare este o distribuție binomială, în timp ce numărul de încercări este mare, iar probabilitatea ca un eveniment să apară într-o încercare separată este mică, prin urmare distribuția Poisson legea se numește legea evenimentelor rare. Și, de asemenea, dacă așteptarea matematică diferă puțin de varianță, adică atunci când . În acest sens, distribuția Poisson are un număr mare de aplicații diferite. Exemplul 16 Fabrica trimite 500 de produse de înaltă calitate la bază. Probabilitatea ca produsul să fie deteriorat în timpul transportului este de 0,002. Găsiți așteptările matematice ale numărului de piese deteriorate în timpul transportului. Soluţie. Variabila aleatoare are o distribuție Poisson, deci . Întrebare. Probabilitatea de denaturare a caracterelor în timpul transmiterii mesajului este de 0,004. Pentru ca numărul mediu de simboluri deformate să fie de 4, trebuie transmise 100 de simboluri.