kao što je poznato, slučajna varijabla naziva se varijabla koja može poprimiti određene vrijednosti ovisno o slučaju. Slučajne varijable su označene velikim slovima latinične abecede (X, Y, Z), a njihove vrijednosti - odgovarajućim malim slovima (x, y, z). Slučajne varijable se dijele na diskontinualne (diskretne) i kontinuirane.

Diskretna slučajna varijabla naziva se slučajna varijabla koja uzima samo konačan ili beskonačan (prebrojiv) skup vrijednosti sa određenim nenultim vjerovatnoćama.

Zakon distribucije diskretne slučajne varijable je funkcija koja povezuje vrijednosti slučajne varijable sa njihovim odgovarajućim vjerovatnoćama. Zakon o raspodjeli može se specificirati na jedan od sljedećih načina.

1 . Zakon distribucije se može dati u tabeli:

gdje je λ>0, k = 0, 1, 2, … .

u) korišćenjem funkcija distribucije F(x) , koji za svaku vrijednost x određuje vjerovatnoću da slučajna varijabla X poprimi vrijednost manju od x, tj. F(x) = P(X< x).

Svojstva funkcije F(x)

3 . Zakon raspodjele može se postaviti grafički – distributivni poligon (poligon) (vidi problem 3).

Imajte na umu da za rješavanje nekih problema nije potrebno poznavati zakon raspodjele. U nekim slučajevima dovoljno je znati jedan ili više brojeva koji odražavaju najvažnije karakteristike zakona o raspodjeli. To može biti broj koji ima značenje "prosječne vrijednosti" slučajne varijable ili broj koji pokazuje prosječnu veličinu odstupanja slučajne varijable od njene prosječne vrijednosti. Brojevi ove vrste nazivaju se numeričkim karakteristikama slučajne varijable.

Osnovne numeričke karakteristike diskretne slučajne varijable :

  • Matematičko očekivanje (srednja vrijednost) diskretne slučajne varijable M(X)=Σ x i p i.
    Za binomnu distribuciju M(X)=np, za Poissonovu distribuciju M(X)=λ
  • Disperzija diskretna slučajna varijabla D(X)=M2 ili D(X) = M(X 2) − 2. Razlika X–M(X) naziva se odstupanjem slučajne varijable od njenog matematičkog očekivanja.
    Za binomnu distribuciju D(X)=npq, za Poissonovu distribuciju D(X)=λ
  • Standardna devijacija (standardna devijacija) σ(X)=√D(X).

Primjeri rješavanja zadataka na temu "Zakon distribucije diskretne slučajne varijable"

Zadatak 1.

Izdato je 1.000 lutrijskih listića: njih 5 će osvojiti 500 rubalja, 10 će osvojiti 100 rubalja, 20 će osvojiti 50 rubalja, a 50 će osvojiti 10 rubalja. Odrediti zakon distribucije vjerovatnoće slučajne varijable X - dobitak po listiću.

Rješenje. Prema uslovu zadatka, moguće su sljedeće vrijednosti slučajne varijable X: 0, 10, 50, 100 i 500.

Broj tiketa bez dobitka je 1000 - (5+10+20+50) = 915, zatim P(X=0) = 915/1000 = 0,915.

Slično, nalazimo sve ostale vjerovatnoće: P(X=0) = 50/1000=0,05, P(X=50) = 20/1000=0,02, P(X=100) = 10/1000=0,01 , P(X =500) = 5/1000=0,005. Rezultirajući zakon predstavljamo u obliku tabele:

Hajde da nađemo očekivanu vrijednost vrijednosti X: M(X) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1+2 +3 +4+5+6)/6 = 21/6 = 3,5

Zadatak 3.

Uređaj se sastoji od tri nezavisna radna elementa. Vjerovatnoća kvara svakog elementa u jednom eksperimentu je 0,1. Napraviti zakon raspodjele za broj neuspjelih elemenata u jednom eksperimentu, izgraditi poligon distribucije. Pronađite funkciju distribucije F(x) i nacrtajte je. Pronađite matematičko očekivanje, varijansu i standardnu ​​devijaciju diskretne slučajne varijable.

Rješenje. 1. Diskretna slučajna varijabla X=(broj neuspješnih elemenata u jednom eksperimentu) ima sljedeće moguće vrijednosti: x 1 =0 (nijedan od elemenata uređaja nije uspio), x 2 =1 (jedan element nije uspio), x 3 =2 ( dva elementa nisu uspjela) i x 4 \u003d 3 (tri elementa nisu uspjela).

Kvarovi elemenata su nezavisni jedan od drugog, vjerovatnoće kvara svakog elementa su međusobno jednake, stoga je primjenjiv Bernulijeva formula . S obzirom da pod uslovom, n=3, p=0,1, q=1-p=0,9, određujemo verovatnoće vrednosti:
P 3 (0) = C 3 0 p 0 q 3-0 \u003d q 3 = 0,9 3 = 0,729;
P 3 (1) = C 3 1 p 1 q 3-1 \u003d 3 * 0,1 * 0,9 2 = 0,243;
P 3 (2) = C 3 2 p 2 q 3-2 \u003d 3 * 0,1 2 * 0,9 = 0,027;
P 3 (3) \u003d C 3 3 p 3 q 3-3 \u003d p 3 \u003d 0,1 3 = 0,001;
Provjerite: ∑p i = 0,729+0,243+0,027+0,001=1.

Dakle, željeni zakon binomne distribucije X ima oblik:

Na osi apscise iscrtavamo moguće vrijednosti x i, a na osi ordinata odgovarajuće vjerovatnoće r i. Konstruirajmo tačke M 1 (0; 0,729), M 2 (1; 0,243), M 3 (2; 0,027), M 4 (3; 0,001). Povezujući ove tačke sa segmentima, dobijamo željeni poligon distribucije.

3. Pronađite funkciju raspodjele F(x) = P(X

Za x ≤ 0 imamo F(x) = P(X<0) = 0;
za 0< x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
za 1< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
za 2< x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
za x > 3 biće F(x) = 1, jer događaj je siguran.

Grafikon funkcije F(x)

4. Za binomnu distribuciju X:
- matematičko očekivanje M(X) = np = 3*0,1 = 0,3;
- disperzija D(X) = npq = 3*0,1*0,9 = 0,27;
- standardna devijacija σ(X) = √D(X) = √0,27 ≈ 0,52.

Slučajna varijabla naziva se varijabla koja, kao rezultat svakog testa, poprima jednu prethodno nepoznatu vrijednost, ovisno o slučajnim uzrocima. Slučajne varijable su označene velikim latiničnim slovima: $X,\ Y,\ Z,\ \dots $ Po svom tipu, slučajne varijable mogu biti diskretno i kontinuirano.

Diskretna slučajna varijabla- ovo je takva slučajna varijabla, čije vrijednosti mogu biti samo prebrojive, odnosno konačne ili prebrojive. Prebrojivost znači da se vrijednosti slučajne varijable mogu nabrojati.

Primjer 1 . Navedimo primjere diskretnih slučajne varijable:

a) broj pogodaka u metu sa $n$ hitaca, ovdje su moguće vrijednosti $0,\ 1,\ \dots ,\ n$.

b) broj grbova koji su ispali pri bacanju novčića, ovdje su moguće vrijednosti $0,\ 1,\ \dots ,\ n$.

c) broj brodova koji su stigli na brod (prebrojiv skup vrijednosti).

d) broj poziva koji pristižu na centralu (prebrojiv skup vrijednosti).

1. Zakon distribucije vjerovatnoće diskretne slučajne varijable.

Diskretna slučajna varijabla $X$ može uzeti vrijednosti $x_1,\dots ,\ x_n$ sa vjerovatnoćama $p\left(x_1\right),\ \dots ,\p\left(x_n\right)$. Korespondencija između ovih vrijednosti i njihovih vjerovatnoća naziva se zakon distribucije diskretne slučajne varijable. Po pravilu, ova korespondencija se navodi pomoću tabele, u čijem su prvom redu navedene vrijednosti $x_1,\dots,\ x_n$, a u drugom redu vjerovatnoće koje odgovaraju ovim vrijednostima su $ p_1,\dots ,\ p_n$.

$\begin(niz)(|c|c|)
\hline
X_i & x_1 & x_2 & \dots & x_n \\
\hline
p_i & p_1 & p_2 & \dots & p_n \\
\hline
\end(niz)$

Primjer 2 . Neka slučajna varijabla $X$ bude broj bačenih poena kada se baci kocka. Takva slučajna varijabla $X$ može imati sljedeće vrijednosti $1,\ 2,\ 3,\ 4,\ 5,\ 6$. Vjerovatnoće svih ovih vrijednosti su jednake $1/6$. Zatim zakon raspodjele vjerovatnoće za slučajnu varijablu $X$:

$\begin(niz)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline

\hline
\end(niz)$

Komentar. Pošto događaji $1,\ 2,\ \dots ,\ 6$ čine kompletnu grupu događaja u zakonu distribucije diskretne slučajne varijable $X$, zbir vjerovatnoća mora biti jednak jedan, tj. $\sum( p_i)=1$.

2. Matematičko očekivanje diskretne slučajne varijable.

Matematičko očekivanje slučajne varijable specificira njegovu "centralnu" vrijednost. Za diskretnu slučajnu varijablu, matematičko očekivanje se izračunava kao zbir proizvoda vrijednosti $x_1,\dots,\ x_n$ i vjerovatnoća $p_1,\dots,\ p_n$ koje odgovaraju ovim vrijednostima, tj.: $M\left(X\right)=\suma ^n_(i=1)(p_ix_i)$. U engleskoj literaturi se koristi druga oznaka $E\left(X\right)$.

Expectation Properties$M\lijevo(X\desno)$:

  1. $M\left(X\right)$ je između najmanje i najveće vrijednosti slučajne varijable $X$.
  2. Matematičko očekivanje konstante jednako je samoj konstanti, tj. $M\lijevo(C\desno)=C$.
  3. Konstantni faktor se može izvaditi iz predznaka očekivanja: $M\left(CX\right)=CM\left(X\right)$.
  4. Matematičko očekivanje zbira slučajnih varijabli jednako je zbiru njihovih matematičkih očekivanja: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$.
  5. Matematičko očekivanje proizvoda nezavisnih slučajnih varijabli jednako je proizvodu njihovih matematičkih očekivanja: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$.

Primjer 3 . Nađimo matematičko očekivanje slučajne varijable $X$ iz primjera $2$.

$$M\left(X\right)=\sum^n_(i=1)(p_ix_i)=1\cdot ((1)\preko (6))+2\cdot ((1)\over (6) )+3\cdot ((1)\preko (6))+4\cdot ((1)\cdot (6))+5\cdot ((1)\preko (6))+6\cdot ((1 )\preko (6))=3.5.$$

Možemo primijetiti da se $M\left(X\right)$ nalazi između najmanje ($1$) i najveće ($6$) vrijednosti slučajne varijable $X$.

Primjer 4 . Poznato je da je matematičko očekivanje slučajne varijable $X$ jednako $M\left(X\right)=2$. Pronađite matematičko očekivanje slučajne varijable $3X+5$.

Koristeći gornja svojstva, dobijamo $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\ cdot 2 +5=11$.

Primjer 5 . Poznato je da je matematičko očekivanje slučajne varijable $X$ jednako $M\left(X\right)=4$. Pronađite matematičko očekivanje slučajne varijable $2X-9$.

Koristeći gornja svojstva, dobijamo $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\ cdot 4 -9=-1$.

3. Disperzija diskretne slučajne varijable.

Moguće vrijednosti slučajnih varijabli s jednakim matematičkim očekivanjima mogu se različito raspršiti oko svojih prosječnih vrijednosti. Na primjer, u dvije grupe studenata prosječna ocjena na ispitu iz teorije vjerovatnoće je bila 4, ali u jednoj grupi su se svi pokazali kao dobri učenici, au drugoj samo studenti C i odlični učenici. Stoga postoji potreba za takvom numeričkom karakteristikom slučajne varijable koja bi pokazala širenje vrijednosti slučajne varijable oko njenog matematičkog očekivanja. Ova karakteristika je disperzija.

Disperzija diskretne slučajne varijable$X$ je:

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2).\ $$

U engleskoj literaturi koristi se oznaka $V\left(X\right),\ Var\left(X\right)$. Vrlo često se varijansa $D\left(X\right)$ izračunava po formuli $D\left(X\right)=\sum^n_(i=1)(p_ix^2_i)-(\left(M\) lijevo(X \desno)\desno))^2$.

Svojstva disperzije$D\lijevo(X\desno)$:

  1. Disperzija je uvijek veća ili jednaka nuli, tj. $D\levo(X\desno)\ge 0$.
  2. Disperzija iz konstante je jednaka nuli, tj. $D\lijevo(C\desno)=0$.
  3. Konstantni faktor se može izvaditi iz znaka disperzije, pod uslovom da je kvadriran, tj. $D\left(CX\desno)=C^2D\left(X\right)$.
  4. Varijanca zbira nezavisnih slučajnih varijabli jednaka je zbiru njihovih varijansi, tj. $D\lijevo(X+Y\desno)=D\lijevo(X\desno)+D\lijevo(Y\desno)$.
  5. Varijanca razlike nezavisnih slučajnih varijabli jednaka je zbiru njihovih varijansi, tj. $D\lijevo(X-Y\desno)=D\lijevo(X\desno)+D\lijevo(Y\desno)$.

Primjer 6 . Izračunajmo varijansu slučajne varijable $X$ iz primjera $2$.

$$D\left(X\desno)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2)=((1)\preko (6))\cdot (\left(1-3,5\desno))^2+((1)\preko (6))\cdot (\left(2-3,5\right))^2+ \dots +((1)\preko (6))\cdot (\left(6-3,5\right))^2=((35)\preko (12))\cca 2.92.$$

Primjer 7 . Poznato je da je varijansa slučajne varijable $X$ jednaka $D\left(X\right)=2$. Pronađite varijansu slučajne varijable $4X+1$.

Koristeći gornja svojstva, nalazimo $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0= 16D\ lijevo(X\desno)=16\cdot 2=32$.

Primjer 8 . Poznato je da je varijansa $X$ jednaka $D\left(X\right)=3$. Pronađite varijansu slučajne varijable $3-2X$.

Koristeći gornja svojstva, nalazimo $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)= 4D\ lijevo(X\desno)=4\cdot 3=12$.

4. Funkcija distribucije diskretne slučajne varijable.

Metoda predstavljanja diskretne slučajne varijable u obliku distributivnog niza nije jedina, i što je najvažnije, nije univerzalna, jer se kontinuirana slučajna varijabla ne može specificirati pomoću distributivnog niza. Postoji još jedan način predstavljanja slučajne varijable - funkcija distribucije.

funkcija distribucije slučajna varijabla $X$ je funkcija $F\left(x\right)$, koja određuje vjerovatnoću da slučajna varijabla $X$ poprimi vrijednost manju od neke fiksne vrijednosti $x$, tj. $F\left(x\ desno)$ )=P\lijevo(X< x\right)$

Svojstva funkcije distribucije:

  1. $0\le F\levo(x\desno)\le 1$.
  2. Vjerovatnoća da slučajna varijabla $X$ uzima vrijednosti iz intervala $\left(\alpha ;\ \beta \right)$ jednaka je razlici između vrijednosti funkcije distribucije na krajevima ovog intervala : $P\lijevo(\alfa< X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
  3. $F\left(x\right)$ - neopadajuće.
  4. $(\mathop(lim)_(x\to -\infty ) F\left(x\right)=0\ ),\ (\mathop(lim)_(x\to +\infty ) F\left(x \desno)=1\ )$.

Primjer 9 . Nađimo funkciju raspodjele $F\left(x\right)$ za zakon raspodjele diskretne slučajne varijable $X$ iz primjera $2$.

$\begin(niz)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hline
\end(niz)$

Ako je $x\le 1$, onda je očigledno $F\left(x\right)=0$ (uključujući $x=1$ $F\left(1\right)=P\left(X< 1\right)=0$).

Ako $1< x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

Ako $2< x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

Ako $3< x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

Ako $4< x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

Ako $5< x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

Ako je $x > 6$ onda $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right) + P\levo(X=4\desno)+P\levo(X=5\desno)+P\levo(X=6\desno)=1/6+1/6+1/6+1/6+ 1 /6+1/6=1$.

Dakle, $F(x)=\left\(\begin(matrica)
0,\ na\ x\le 1,\\
1/6, na \ 1< x\le 2,\\
1/3,\ at\ 2< x\le 3,\\
1/2, na \ 3< x\le 4,\\
2/3,\ at\ 4< x\le 5,\\
5/6, \ na \ 4< x\le 5,\\
1,\ za \ x > 6.
\end(matrix)\right.$

1.2.4. Slučajne varijable i njihove distribucije

Distribucije slučajnih varijabli i funkcije distribucije. Distribucija numeričke slučajne varijable je funkcija koja na jedinstven način određuje vjerovatnoću da slučajna varijabla zauzme datu vrijednost ili da pripada nekom datom intervalu.

Prvi je ako slučajna varijabla poprimi konačan broj vrijednosti. Tada je distribucija data funkcijom P(X = x), dajući svaku moguću vrijednost X slučajna varijabla X vjerovatnoća da X = x.

Drugi je ako slučajna varijabla poprimi beskonačno mnogo vrijednosti. Ovo je moguće samo kada se prostor vjerovatnoće na kojem je definirana slučajna varijabla sastoji od beskonačnog broja elementarnih događaja. Tada je distribucija data skupom vjerovatnoća P(a < X za sve parove brojeva a, b takav da a . Distribucija se može specificirati korištenjem tzv. funkcija raspodjele F(x) = P(X definisanje za sve realno X vjerovatnoća da je slučajna varijabla X uzima vrijednosti manje od X. To je jasno

P(a < X

Ovaj odnos pokazuje da kao što se distribucija može izračunati iz funkcije distribucije, tako se, obrnuto, funkcija distribucije može izračunati iz distribucije.

Koristi se u probabilističkim statističke metode donošenja odluka i drugih primijenjenih istraživanja, funkcije distribucije su ili diskretne ili kontinuirane, ili njihove kombinacije.

Diskretne funkcije distribucije odgovaraju diskretnim slučajnim varijablama koje preuzimaju konačan broj vrijednosti ili vrijednosti iz skupa čiji se elementi mogu prenumerisati prirodnim brojevima (takvi skupovi se u matematici nazivaju prebrojivi). Njihov graf izgleda kao stepenice (sl. 1).

Primjer 1 Broj X neispravnih artikala u seriji uzima vrijednost 0 sa vjerovatnoćom 0,3, vrijednost 1 s vjerovatnoćom 0,4, vrijednost 2 sa vjerovatnoćom 0,2 i vrijednost 3 sa vjerovatnoćom 0,1. Grafikon funkcije distribucije slučajne varijable X prikazano na sl.1.

Fig.1. Grafikon funkcije distribucije broja neispravnih proizvoda.

Funkcije kontinuirane distribucije nemaju skokove. One se monotono povećavaju kako se argument povećava, od 0 za do 1 za . Slučajne varijable s kontinuiranim funkcijama raspodjele nazivaju se kontinuiranim.

Funkcije kontinuirane distribucije koje se koriste u probabilističko-statističkim metodama odlučivanje, imaju derivate. Prvi derivat f(x) funkcije distribucije F(x) naziva se gustina vjerovatnoće,

Funkcija distribucije se može odrediti iz gustine vjerovatnoće:

Za bilo koju funkciju distribucije

Navedena svojstva funkcija distribucije stalno se koriste u vjerovatno-statističkim metodama odlučivanja. Konkretno, posljednja jednakost podrazumijeva specifičan oblik konstanti u formulama za gustoće vjerovatnoće koje se razmatraju u nastavku.

Primjer 2Često se koristi sljedeća funkcija distribucije:

(1)

gdje a i b- neki brojevi a . Nađimo gustinu vjerovatnoće ove funkcije distribucije:

(u tačkama x = a i x = b derivat funkcije F(x) ne postoji).

Slučajna varijabla s funkcijom distribucije (1) naziva se "jednako raspoređena na intervalu [ a; b]».

Funkcije mješovite distribucije javljaju se, posebno, kada se promatranja u nekom trenutku zaustave. Na primjer, kada se analiziraju statistički podaci dobijeni korištenjem planova testiranja pouzdanosti koji predviđaju prekid testova nakon određenog vremenskog perioda. Ili prilikom analize podataka o tehničkim proizvodima koji su zahtijevali popravke u jamstvenom roku.

Primjer 3 Neka, na primjer, vijek trajanja električne sijalice bude slučajna varijabla s funkcijom raspodjele F(t), a ispitivanje se provodi sve dok sijalica ne pokvari, ako se to dogodi manje od 100 sati od početka ispitivanja, odnosno do trenutka t0= 100 sati. Neka G(t)- funkcija distribucije vremena rada lampe u dobrom stanju u ovom testu. Onda

Funkcija G(t) ima skok u jednom trenutku t0, budući da odgovarajuća slučajna varijabla uzima vrijednost t0 sa vjerovatnoćom 1- F(t0)> 0.

Karakteristike slučajnih varijabli. U probabilističko-statističkim metodama odlučivanja koristi se niz karakteristika slučajnih varijabli, izraženih kroz funkcije raspodjele i gustinu vjerovatnoće.

Prilikom opisivanja diferencijacije dohotka, prilikom pronalaženja granica povjerenja za parametre distribucije slučajnih varijabli, iu mnogim drugim slučajevima, koristi se koncept kao što je „kvantil reda“. R“, gdje je 0< str < 1 (обозначается x str). Kvantil narudžbe R je vrijednost slučajne varijable za koju funkcija distribucije uzima vrijednost R ili postoji "skok" sa vrijednosti manje od R do veće vrijednosti R(Sl. 2). Može se dogoditi da je ovaj uvjet zadovoljen za sve vrijednosti x koje pripadaju ovom intervalu (tj. funkcija distribucije je konstantna na ovom intervalu i jednaka je R). Tada se svaka takva vrijednost naziva "kvantil reda R". Za kontinuirane funkcije distribucije, po pravilu, postoji jedan kvantil x str red R(Sl. 2), i

F(x p) = p. (2)

Fig.2. Definicija kvantila x str red R.

Primjer 4 Nađimo kvantil x str red R za funkciju distribucije F(x) iz (1).

U 0< str < 1 квантиль x str nalazi se iz jednačine

one. x str = a + p(b – a) = a( 1- p)+bp. At str= 0 bilo koji x < a je kvantil narudžbe str= 0. Kvantil narudžbe str= 1 je bilo koji broj x > b.

Za diskretne distribucije, po pravilu, ne postoji x str zadovoljava jednadžbu (2). Tačnije, ako je distribucija slučajne varijable data u tabeli 1, gde je x 1< x 2 < … < x k , zatim jednakost (2), koja se razmatra kao jednačina u odnosu na x str, ima rješenja samo za k vrijednosti str, naime,

p \u003d p 1,

p \u003d p 1 + p 2,

p \u003d p 1 + p 2 + p 3,

p \u003d p 1 + p 2 + ...+ pm, 3 < m < k,

str = str 1 + str 2 + … + p k.

Tabela 1.

Distribucija diskretne slučajne varijable

Za navedene k vrijednosti vjerovatnoće str rješenje x str jednačina (2) nije jedinstvena, tj.

F(x) = p 1 + p 2 + ... + p m

za sve X takav da x m< x < xm+1 . One. x p - bilo koji broj iz raspona (x m ; x m+1 ]. Za sve ostale R iz intervala (0;1) koji nije uključen u listu (3), dolazi do “skoka” sa vrijednosti manje od R do veće vrijednosti R. Naime, ako

p 1 + p 2 + … + p m

onda x p \u003d x m + 1.

Razmatrana osobina diskretnih distribucija stvara značajne poteškoće u tabeliranju i korištenju takvih distribucija, jer je nemoguće precizno održavati tipične numeričke vrijednosti karakteristika distribucije. To posebno vrijedi za kritične vrijednosti i nivoe značajnosti neparametarskih statističkih testova (vidi dolje), budući da su distribucije statistike ovih testova diskretne.

Kvantil narudžbi je od velike važnosti u statistici. R= ½. Zove se medijan (slučajna varijabla X ili njegovu funkciju distribucije F(x)) i označeno Ja(X). U geometriji postoji koncept "medijana" - ravna linija koja prolazi kroz vrh trougla i dijeli njegovu suprotnu stranu na pola. U matematičkoj statistici, medijana ne deli stranicu trokuta na pola, već distribuciju slučajne varijable: jednakost F(x0,5)= 0,5 znači da je vjerovatnoća skretanja lijevo x0.5 i vjerovatnoća da se popravi x0.5(ili direktno na x0.5) jednaki su jedan drugom i jednaki ½, tj.

P(X < x 0,5) = P(X > x 0,5) = ½.

Medijan označava "centar" distribucije. Sa stanovišta jednog od modernih koncepata - teorije stabilnih statističkih procedura - medijana je bolja karakteristika slučajne varijable od matematičkog očekivanja. Prilikom obrade rezultata mjerenja u ordinalnoj skali (pogledajte poglavlje o teoriji mjerenja), medijana se može koristiti, ali matematičko očekivanje ne može.

Takva karakteristika slučajne varijable kao mod ima jasno značenje - vrijednost (ili vrijednosti) slučajne varijable koja odgovara lokalnom maksimumu gustoće vjerovatnoće za kontinuiranu slučajnu varijablu ili lokalnom maksimumu vjerovatnoće za diskretnu slučajnu varijablu varijabla.

Ako a x0 je mod slučajne varijable sa gustinom f(x), tada, kao što je poznato iz diferencijalnog računa, .

Slučajna varijabla može imati mnogo načina. Dakle, za ujednačenu distribuciju (1) svaka tačka X takav da a< x < b , je moda. Međutim, ovo je izuzetak. Većina slučajnih varijabli koje se koriste u probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima imaju jedan mod. Slučajne varijable, gustine, distribucije koje imaju jedan mod nazivaju se unimodalnim.

Matematičko očekivanje za diskretne slučajne varijable sa konačnim brojem vrijednosti razmatrano je u poglavlju "Događaji i vjerovatnoće". Za kontinuiranu slučajnu varijablu X očekivanu vrijednost M(X) zadovoljava jednakost

što je analog formule (5) iz tvrdnje 2 poglavlja "Događaji i vjerovatnoće".

Primjer 5 Matematičko očekivanje za ravnomjerno raspoređenu slučajnu varijablu X jednaki

Za slučajne varijable koje se razmatraju u ovom poglavlju, tačna su sva ona svojstva matematičkih očekivanja i varijansi koja su ranije razmatrana za diskretne slučajne varijable sa konačnim brojem vrijednosti. Međutim, ne dajemo dokaze ovih svojstava, jer zahtijevaju produbljivanje u matematičke suptilnosti, što nije neophodno za razumijevanje i kvalifikovanu primjenu vjerovatno-statističkih metoda odlučivanja.

Komentar. U ovom udžbeniku namjerno se izbjegavaju matematičke suptilnosti, posebno se povezuju s konceptima mjerljivih skupova i mjerljivih funkcija, -algebra događaja itd. Oni koji žele da savladaju ove koncepte treba da se obrate specijalizovanoj literaturi, posebno enciklopediji.

Svaka od tri karakteristike - matematičko očekivanje, medijan, mod - opisuje "centar" distribucije vjerovatnoće. Koncept "centra" može se definirati na različite načine - otuda tri različite karakteristike. Međutim, za važnu klasu distribucija - simetrične unimodalne - sve tri karakteristike se poklapaju.

Gustina distribucije f(x) je gustina simetrične distribucije, ako postoji broj x 0 takav da

. (3)

Jednakost (3) znači da je graf funkcije y = f(x) simetrično oko vertikalne linije koja prolazi kroz centar simetrije X = X 0 . Iz (3) slijedi da funkcija simetrične distribucije zadovoljava relaciju

(4)

Za simetričnu distribuciju s jednim modom, srednja vrijednost, medijan i mod su isti i jednaki x 0.

Najvažniji slučaj je simetrija u odnosu na 0, tj. x 0= 0. Tada (3) i (4) postaju jednakosti

(6)

respektivno. Gore navedene relacije pokazuju da nema potrebe za tabelariziranjem simetričnih distribucija za sve X, dovoljno je imati tablice za x > x0.

Napominjemo još jedno svojstvo simetričnih distribucija koje se stalno koristi u probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima. Za kontinuiranu funkciju distribucije

P(|X| < a) = P(-a < X < a) = F(a) – F(-a),

gdje F je funkcija distribucije slučajne varijable X. Ako je funkcija distribucije F je simetrična u odnosu na 0, tj. za to vrijedi formula (6).

P(|X| < a) = 2F(a) – 1.

Često se koristi druga formulacija iskaza koji se razmatra: ako

.

Ako su i kvantili reda i, respektivno (vidi (2)) funkcije distribucije simetrične u odnosu na 0, onda iz (6) slijedi da

Od karakteristika pozicije - matematičko očekivanje, medijan, modus - prijeđimo na karakteristike širenja slučajne varijable X: varijansa, standardna devijacija i koeficijent varijacije v. Definicija i svojstva varijanse za diskretne slučajne varijable razmatrani su u prethodnom poglavlju. Za kontinuirane slučajne varijable

Standardna devijacija je nenegativna vrijednost kvadratnog korijena varijanse:

Koeficijent varijacije je omjer standardne devijacije i matematičkog očekivanja:

Koeficijent varijacije se primjenjuje kada M(X)> 0. Mjeri širenje u relativnim jedinicama, dok je standardna devijacija u apsolutnim jedinicama.

Primjer 6 Za jednoliko raspoređenu slučajnu varijablu X pronaći varijansu, standardnu ​​devijaciju i koeficijent varijacije. Disperzija je:

Zamjena varijable omogućava zapisivanje:

gdje c = (ba)/ 2. Dakle, standardna devijacija je jednaka i koeficijent varijacije je:

Za svaku slučajnu varijablu X odrediti još tri veličine - centriran Y, normalizovano V i dato U. Centrirana slučajna varijabla Y je razlika između date slučajne varijable X i njegovo matematičko očekivanje M(X), one. Y = X - M(X). Matematičko očekivanje centrirane slučajne varijable Y jednaka je 0, a varijansa je varijanca date slučajne varijable: M(Y) = 0, D(Y) = D(X). funkcija distribucije FY(x) centrirana slučajna varijabla Y vezano za funkciju distribucije F(x) početna slučajna varijabla X omjer:

FY(x) = F(x + M(X)).

Za gustine ovih slučajnih varijabli, jednakost

fY(x) = f(x + M(X)).

Normalizovana slučajna varijabla V je omjer ove slučajne varijable X na njegovu standardnu ​​devijaciju, tj. . Matematičko očekivanje i varijansa normalizirane slučajne varijable V izraženo kroz karakteristike X dakle:

,

gdje v je koeficijent varijacije originalne slučajne varijable X. Za funkciju distribucije F V(x) i gustina f V(x) normalizovana slučajna varijabla V imamo:

gdje F(x) je funkcija distribucije originalne slučajne varijable X, a f(x) je njegova gustina vjerovatnoće.

Redukovana slučajna varijabla U je centrirana i normalizirana slučajna varijabla:

.

Za smanjenu slučajnu varijablu

Normalizovane, centrirane i redukovane slučajne varijable se konstantno koriste kako u teorijskim istraživanjima tako i u algoritmima, softverskim proizvodima, regulatornoj i tehničkoj i instruktivno-metodološkoj dokumentaciji. Posebno zbog jednakosti omogućavaju pojednostavljenje potvrđivanja metoda, formulacija teorema i proračunskih formula.

Koriste se transformacije slučajnih varijabli i opštiji plan. Sta ako Y = sjekira + b, gdje a i b su onda neki brojevi

Primjer 7 Ako onda Y je redukovana slučajna varijabla, a formule (8) se pretvaraju u formule (7).

Sa svakom slučajnom varijablom X možete povezati mnogo slučajnih varijabli Y dato formulom Y = sjekira + b na raznim a> 0 i b. Ovaj skup se zove scale-shift porodica, generiran slučajnom varijablom X. Funkcije distribucije FY(x) čine porodicu distribucija sa pomakom skale koju generiše funkcija distribucije F(x). Umjesto Y = sjekira + bčesto korištena notacija

Broj With naziva se parametar pomaka, a broj d- parametar skale. Formula (9) to pokazuje X- rezultat mjerenja određene količine - ulazi u At- rezultat mjerenja iste vrijednosti, ako se početak mjerenja pomjeri u tačku With, a zatim koristite novu jedinicu mjere, in d puta veći od starog.

Za familiju pomaka skale (9), distribucija X se naziva standardnom. U probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima koriste se standardna normalna distribucija, standardna Weibull-Gnedenkova distribucija, standardna gama raspodjela itd. (vidi dolje).

Koriste se i druge transformacije slučajnih varijabli. Na primjer, za pozitivnu slučajnu varijablu X razmotriti Y= log X, gdje je lg X je decimalni logaritam broja X. Lanac jednakosti

F Y (x) = P( lg X< x) = P(X < 10x) = F( 10x)

odnose funkcije distribucije X i Y.

Prilikom obrade podataka koriste se takve karakteristike slučajne varijable X kao trenuci reda q, tj. matematička očekivanja slučajne varijable X q, q= 1, 2, … Dakle, samo matematičko očekivanje je trenutak reda 1. Za diskretnu slučajnu varijablu, trenutak reda q može se izračunati kao

Za kontinuiranu slučajnu varijablu

Trenuci reda q nazivaju se i početnim momentima poretka q, za razliku od srodnih karakteristika – centralnih momenata poretka q, dato formulom

Dakle, disperzija je centralni momenat reda 2.

Normalna raspodjela i središnja granična teorema. U probabilističko-statističkim metodama odlučivanja često govorimo o normalnoj raspodjeli. Ponekad pokušavaju da ga koriste za modeliranje distribucije početnih podataka (ovi pokušaji nisu uvijek opravdani - vidi dolje). Što je još važnije, mnoge metode obrade podataka temelje se na činjenici da izračunate vrijednosti imaju distribucije koje su bliske normalnim.

Neka X 1 , X 2 ,…, X n M(X i) = m i disperzije D(X i) = , i = 1, 2,…, n,… Kao što proizlazi iz rezultata prethodnog poglavlja,

Razmotrimo redukovanu slučajnu varijablu U n za sumu , naime,

Kao što slijedi iz formula (7), M(U n) = 0, D(U n) = 1.

(za identično raspoređene termine). Neka X 1 , X 2 ,…, X n, … su nezavisne identično raspoređene slučajne varijable s matematičkim očekivanjima M(X i) = m i disperzije D(X i) = , i = 1, 2,…, n,… Tada za bilo koji x postoji granica

gdje F(x) je standardna funkcija normalne distribucije.

Više o funkciji F(x) - ispod (čita se “fi od x”, jer F- grčko veliko slovo "phi").

Centralna granična teorema (CLT) dobila je ime po činjenici da je središnji, najčešće korišteni matematički rezultat teorije vjerovatnoće i matematičke statistike. Istorija CLT traje oko 200 godina - od 1730. godine, kada je engleski matematičar A. De Moivre (1667-1754) objavio prvi rezultat vezan za CLT (vidi dole o Moivre-Laplaceovom teoremu), do dvadesetih - tridesetih godina dvadesetog veka, kada je Fin J.W. Lindeberg, Francuz Paul Levy (1886-1971), Jugoslaven V. Feller (1906-1970), Rus A.Ya. Khinčin (1894-1959) i drugi naučnici dobili su potrebne i dovoljne uslove za valjanost klasičnog centralnog granična teorema.

Razvoj subjekta koji se razmatra nije tu uopće stao - proučavali su slučajne varijable koje nemaju disperziju, tj. oni za koje

(akademik B.V. Gnedenko i drugi), situacija kada se sabiraju slučajne varijable (tačnije, slučajni elementi) složenije prirode od brojeva (akademici Yu.V. Prokhorov, A.A. Borovkov i njihovi saradnici), itd. .d.

funkcija distribucije F(x) je dato jednakošću

,

gdje je gustina standardne normalne distribucije, koja ima prilično složen izraz:

.

Ovdje \u003d 3,1415925 ... je broj poznat u geometriji, jednak omjeru obima i prečnika, e \u003d 2,718281828 ... - baza prirodnih logaritama (da zapamtite ovaj broj, imajte na umu da je 1828. godina rođenja pisca Lava Tolstoja). Kao što je poznato iz matematičke analize,

Prilikom obrade rezultata posmatranja, funkcija normalne distribucije se ne izračunava prema gornjim formulama, već se nalazi pomoću posebnih tabela ili kompjuterski programi. Najbolje „Tabele matematičke statistike“ na ruskom jeziku sastavili su dopisni članovi Akademije nauka SSSR-a L.N. Bolshev i N.V. Smirnov.

Oblik gustine standardne normalne distribucije proizilazi iz matematičke teorije, koju ovdje ne možemo razmatrati, kao i dokaz CLT-a.

Za ilustraciju predstavljamo male tablice funkcije distribucije F(x)(Tablica 2) i njeni kvantili (Tablica 3). Funkcija F(x) je simetričan u odnosu na 0, što je prikazano u tabelama 2-3.

Tabela 2.

Funkcija standardne normalne distribucije.

Ako je slučajna varijabla X ima funkciju distribucije F(x), onda M(X) = 0, D(X) = 1. Ova tvrdnja je dokazana u teoriji vjerovatnoće na osnovu oblika gustine vjerovatnoće . Slaže se sa sličnom tvrdnjom za karakteristike redukovane slučajne varijable U n, što je sasvim prirodno, budući da CLT navodi da s beskonačnim povećanjem broja članova, funkcija distribucije U n teži standardnoj funkciji normalne distribucije F(x), i za bilo koje X.

Tabela 3

Kvantili standardne normalne distribucije.

Kvantil narudžbe R

Kvantil narudžbe R

Hajde da uvedemo koncept porodice normalnih distribucija. Po definiciji, normalna distribucija je distribucija slučajne varijable X, za koji je distribucija redukovane slučajne varijable F(x). Kako slijedi iz zajednička svojstva Familije distribucija sa pomakom skale (vidi gore), normalna distribucija je distribucija slučajne varijable

gdje X je slučajna varijabla sa distribucijom F(X), i m = M(Y), = D(Y). Normalna distribucija sa parametrima pomaka m a razmjer se obično označava N(m, ) (ponekad notacija N(m, ) ).

Kao što slijedi iz (8), gustina vjerovatnoće normalne distribucije N(m, ) tu je

Normalne distribucije čine familiju pomaka skale. U ovom slučaju, parametar skale je d= 1/ i parametar pomaka c = - m/ .

Za centralne momente trećeg i četvrtog reda normalne distribucije, jednakosti su tačne

Ove jednakosti su u osnovi klasičnih metoda provjere da li rezultati opservacija slijede normalnu distribuciju. Trenutno se obično preporučuje provjera normalnosti pomoću kriterija W Shapiro - Wilka. Problem provjere normalnosti razmatra se u nastavku.

Ako su slučajne varijable X 1 i X 2 imaju funkcije distribucije N(m 1 , 1) i N(m 2 , 2) odnosno, onda X 1+ X 2 ima distribuciju Stoga, ako su slučajne varijable X 1 , X 2 ,…, X n N(m, ) , zatim njihova aritmetička sredina

ima distribuciju N(m, ) . Ova svojstva normalne distribucije se konstantno koriste u različitim vjerovatno-statističkim metodama odlučivanja, posebno u statističkoj kontroli tehnoloških procesa i u statističkoj kontroli prihvatljivosti po kvantitativnom atributu.

Normalna distribucija definira tri distribucije koje se danas najčešće koriste u statističkoj obradi podataka.

Distribucija (hi - kvadrat) - distribucija slučajne varijable

gdje su slučajne varijable X 1 , X 2 ,…, X n nezavisni su i imaju istu distribuciju N(0,1). U ovom slučaju, broj pojmova, tj. n, se naziva "broj stepeni slobode" hi-kvadrat distribucije.

Distribucija t Student je distribucija slučajne varijable

gdje su slučajne varijable U i X nezavisni, U ima standardnu ​​normalnu distribuciju N(0,1) i X– distribucija chi – kvadrat sa n stepena slobode. Gde n se naziva "broj stepena slobode" Studentove distribucije. Ovu distribuciju uveo je 1908. godine engleski statističar W. Gosset, koji je radio u fabrici piva. Za donošenje ekonomskih i tehničkih odluka u ovoj fabrici korišćene su verovatno-statističke metode, pa je njeno rukovodstvo zabranilo V. Gosetu da objavljuje naučne članke pod svojim imenom. Na taj način je zaštićena poslovna tajna, "know-how" u vidu vjerovatno-statističkih metoda koje je razvio W. Gosset. Međutim, mogao je da objavljuje pod pseudonimom "Student". Istorija Gosset-Studenta pokazuje da je još sto godina velika ekonomska efikasnost verovatno-statističkih metoda odlučivanja bila očigledna britanskim menadžerima.

Fisherova distribucija je distribucija slučajne varijable

gdje su slučajne varijable X 1 i X 2 su nezavisni i imaju hi distribucije - kvadrat sa brojem stepeni slobode k 1 i k 2 respektivno. Istovremeno, par (k 1 , k 2 ) - par "brojeva stepena slobode" Fisher distribucije, naime, k 1 je broj stupnjeva slobode brojioca, i k 2 je broj stepeni slobode imenioca. Distribucija slučajne varijable F je dobila ime po velikom engleskom statističaru R. Fisheru (1890-1962), koji ju je aktivno koristio u svom radu.

Izrazi za funkcije distribucije hi-kvadrata, Studenta i Fišera, njihove gustine i karakteristike, kao i tabele mogu se naći u specijalnoj literaturi (vidi npr.).

Kao što je već napomenuto, normalne distribucije se trenutno često koriste u probabilističkim modelima u različitim primijenjenim poljima. Zašto je ova dvoparametarska porodica distribucija tako raširena? To je pojašnjeno sljedećom teoremom.

Centralna granična teorema(za različito raspoređene termine). Neka X 1 , X 2 ,…, X n,… su nezavisne slučajne varijable sa matematičkim očekivanjima M(X 1 ), M(X 2 ),…, M(X n), … i disperzije D(X 1 ), D(X 2 ),…, D(X n), … odnosno. Neka

Zatim, pod važenjem određenih uslova koji osiguravaju malenkost doprinosa bilo kojeg od pojmova U n,

za bilo koga X.

Ovdje se neće formulisati dotični uslovi. Mogu se naći u stručnoj literaturi (vidi, na primjer,). "Rasjašnjavanje uslova pod kojima CPT deluje je zasluga istaknutih ruskih naučnika A. A. Markova (1857-1922) i, posebno, A. M. Ljapunova (1857-1918)".

Centralna granična teorema pokazuje da u slučaju kada se rezultat mjerenja (posmatranja) formira pod utjecajem više razloga, svaki od njih daje samo mali doprinos, a kumulativni rezultat određuje aditivno, tj. dodavanjem, tada je distribucija rezultata mjerenja (posmatranja) bliska normalnoj.

Ponekad se veruje da je za normalnu raspodelu dovoljno da rezultat merenja (posmatranja) X nastala pod uticajem mnogih uzroka, od kojih svaki ima mali efekat. Ovo nije istina. Važno je kako ovi uzroci djeluju. Ako je aditiv, onda X ima približno normalnu distribuciju. Ako a multiplikativno(odnosno, dejstva pojedinačnih uzroka se množe, a ne sabiraju), zatim distribucija X ne blizu normalnom, već tzv. logaritamski normalan, tj. ne X, a lg X ima približno normalnu distribuciju. Ako nema osnova vjerovati da radi jedan od ova dva mehanizma za formiranje konačnog rezultata (ili neki drugi dobro definiran mehanizam), onda o raspodjeli X ne može se reći ništa određeno.

Iz rečenog proizilazi da se u konkretnom primijenjenom problemu normalnost rezultata mjerenja (zapažanja), po pravilu, ne može utvrditi iz opštih razmatranja, već je treba provjeriti statističkim kriterijumima. Ili koristite neparametarske statističke metode koje se ne zasnivaju na pretpostavkama o funkcijama distribucije rezultata mjerenja (zapažanja) koji pripadaju jednoj ili drugoj parametarskoj porodici.

Kontinuirane distribucije koje se koriste u probabilističko-statističkim metodama odlučivanja. Pored porodice normalnih distribucija sa pomakom skale, u širokoj su upotrebi i brojne druge porodice distribucija - logaritamski normalne, eksponencijalne, Weibull-Gnedenko, gama distribucije. Hajde da pogledamo ove porodice.

Slučajna vrijednost X ima log-normalnu distribuciju ako je slučajna varijabla Y= log X ima normalnu distribuciju. Onda Z=ln X = 2,3026…Y takođe ima normalnu distribuciju N(a 1 ,σ 1), gdje je ln X - prirodni logaritam X. Gustina log-normalne distribucije je:

Iz središnjeg graničnog teorema slijedi da je proizvod X = X 1 X 2 X n nezavisne pozitivne slučajne varijable X i, i = 1, 2,…, n, na slobodi n može se aproksimirati log-normalnom distribucijom. Konkretno, multiplikativni model formiranja plata ili dohotka dovodi do preporuke da se distribucije plata i primanja aproksimiraju logaritamski normalnim zakonima. Za Rusiju se ova preporuka pokazala opravdanom - statistika to potvrđuje.

Postoje i drugi probabilistički modeli koji vode do log-normalnog zakona. Klasičan primjer takvog modela daje A.N. kuglični mlinovi imaju log-normalnu distribuciju.

Pređimo na drugu familiju distribucija, koja se široko koristi u različitim vjerovatno-statističkim metodama donošenja odluka i drugim primijenjenim istraživanjima, porodici eksponencijalnih distribucija. Počnimo sa probabilističkim modelom koji vodi do takvih distribucija. Da biste to učinili, razmotrite "tok događaja", tj. niz događaja koji se dešavaju jedan za drugim u nekom trenutku. Primjeri su: protok poziva na telefonskoj centrali; tok kvarova opreme u tehnološkom lancu; tok kvarova proizvoda tokom testiranja proizvoda; protok zahtjeva klijenata u filijalu banke; protok kupaca koji se prijavljuju za robu i usluge itd. U teoriji tokova događaja vrijedi teorema koja je slična središnjoj graničnoj teoremi, ali u njoj mi pričamo ne o zbiru slučajnih varijabli, već o zbiru tokova događaja. Smatramo da se ukupni protok sastoji od veliki broj nezavisnih tokova, od kojih nijedan nema dominantan uticaj na ukupan protok. Na primjer, tok poziva koji pristižu na telefonsku centralu sastoji se od velikog broja nezavisnih tokova poziva koji potiču od pojedinačnih pretplatnika. Dokazano je da se u slučaju kada karakteristike strujanja ne zavise od vremena, ukupan protok u potpunosti opisuje jednim brojem - intenzitetom strujanja. Za ukupan protok, razmotrite slučajnu varijablu X- dužina vremenskog intervala između uzastopnih događaja. Njegova funkcija distribucije ima oblik

(10)

Ova raspodjela se naziva eksponencijalna distribucija jer formula (10) uključuje eksponencijalnu funkciju ex. Vrijednost 1/λ je parametar skale. Ponekad se uvodi i parametar pomaka With, eksponencijalna je distribucija slučajne varijable X + c, gdje je distribucija X je data formulom (10).

Eksponencijalne distribucije - poseban slučaj takozvani. Weibull - Gnedenko distribucije. Nazvane su po inženjeru W. Weibullu, koji je ove distribucije uveo u praksu analize rezultata ispitivanja zamora, i matematičaru B.V. Gnedenku (1912-1995), koji je takve distribucije primio kao ograničavajuće pri proučavanju maksimuma testa. rezultate. Neka X- slučajna varijabla koja karakterizira trajanje rada proizvoda, složen sistem, element (tj. resurs, vrijeme rada do graničnog stanja, itd.), trajanje rada poduzeća ili život živog bića, itd. Stopa neuspjeha igra važnu ulogu

(11)

gdje F(x) i f(x) - funkcija raspodjele i gustoća slučajne varijable X.

Hajde da opišemo tipično ponašanje stope otkaza. Cijeli vremenski interval se može podijeliti u tri perioda. Na prvom od njih, funkcija λ(x) ima visoke vrijednosti i jasnu tendenciju pada (najčešće se monotono smanjuje). Ovo se može objasniti prisustvom u seriji koja se razmatra jedinica proizvoda sa očiglednim i latentnim nedostacima, koji dovode do relativno brzog kvara ovih jedinica proizvoda. Prvi period se naziva period "provale" (ili "provale"). Ovo je obično pokriveno garantnim rokom.

Zatim dolazi period normalnog rada, karakteriziran približno konstantnom i relativno niskom stopom kvarova. Priroda kvarova tokom ovog perioda je iznenadne prirode (nezgode, greške operativnog osoblja, itd.) i ne zavisi od trajanja rada jedinice proizvoda.

Konačno, posljednji period rada je period starenja i habanja. Priroda kvarova tokom ovog perioda je u nepovratnim fizičkim, mehaničkim i hemijskim promenama materijala, koje dovode do progresivnog pogoršanja kvaliteta jedinice proizvodnje i njenog konačnog kvara.

Svaki period ima svoj tip funkcije λ(x). Razmotrite klasu ovisnosti o moći

λ(h) = λ0bxb -1 , (12)

gdje λ 0 > 0 i b> 0 - neki numerički parametri. Vrijednosti b < 1, b= 0 i b> 1 odgovara tipu stope kvarova tokom perioda uhodavanja, normalnog rada i starenja, respektivno.

Relacija (11) za datu stopu neuspjeha λ(x)- diferencijalna jednadžba s obzirom na funkciju F(x). Iz teorije diferencijalne jednadžbe sledi to

(13)

Zamjenom (12) u (13) dobivamo to

(14)

Raspodjela data formulom (14) naziva se Weibullova - Gnedenkova raspodjela. Zbog

onda iz formule (14) proizilazi da je veličina a, dat formulom (15), je skalirajući parametar. Ponekad se uvodi i parametar pomaka, tj. Pozivaju se funkcije distribucije Weibull - Gnedenko F(x - c), gdje F(x) je dat formulom (14) za neki λ 0 i b.

Gustina Weibul-Gnedenkove raspodjele ima oblik

(16)

gdje a> 0 - parametar skale, b> 0 - parametar forme, With- parametar pomaka. U ovom slučaju, parametar a iz formule (16) se odnosi na parametar λ 0 iz formule (14) omjerom navedenim u formuli (15).

Eksponencijalna raspodjela je vrlo poseban slučaj Weibull-Gnedenkove raspodjele, koja odgovara vrijednosti parametra oblika b = 1.

Weibull - Gnedenkova raspodjela se također koristi u konstrukciji vjerojatnosnih modela situacija u kojima je ponašanje objekta određeno "najslaijom karikom". Podrazumijeva se analogija s lancem, čiju sigurnost određuje ona karika koja ima najmanju čvrstoću. Drugim riječima, neka X 1 , X 2 ,…, X n su nezavisne identično raspoređene slučajne varijable,

X(1)=min( X 1 , X 2 ,…, X n), X(n)=max( X 1 , X 2 ,…, X n).

U nizu primijenjenih problema važnu ulogu imaju X(1) i X(n) , posebno pri proučavanju maksimalnih mogućih vrijednosti ("zapisa") određenih vrijednosti, na primjer, plaćanja osiguranja ili gubitaka zbog komercijalnih rizika, kada se proučavaju granice elastičnosti i izdržljivosti čelika, niz karakteristika pouzdanosti, itd. Pokazano je da za velike n distribucije X(1) i X(n) , po pravilu, dobro opisuju Weibul-Gnedenkove distribucije. Temeljni doprinosi proučavanju distribucija X(1) i X(n) uveo je sovjetski matematičar B.V. Gnedenko. Radovi V. Weibulla, E. Gumbela, V.B. Nevzorova, E.M. Kudlaev i mnogi drugi specijalisti.

Pređimo na porodicu gama distribucija. Oni se široko koriste u ekonomiji i menadžmentu, teoriji i praksi pouzdanosti i testiranja, u raznim poljima tehnologije, meteorologije itd. Konkretno, u mnogim situacijama, gama distribucija je podložna takvim veličinama kao što su ukupni vijek trajanja proizvoda, dužina lanca provodljivih čestica prašine, vrijeme koje je potrebno proizvodu da dostigne granično stanje tokom korozije, radni vrijeme do k odbijanje, k= 1, 2, … itd. Očekivano trajanje života pacijenata sa kroničnim bolestima, vrijeme za postizanje određenog efekta u liječenju u nekim slučajevima imaju gama distribuciju. Ova distribucija je najadekvatnija za opisivanje potražnje u ekonomsko-matematičkim modelima upravljanja zalihama (logistike).

Gustina gama distribucije ima oblik

(17)

Gustoća vjerovatnoće u formuli (17) određena je sa tri parametra a, b, c, gdje a>0, b>0. Gde a je parametar forme, b- parametar skale i With- parametar pomaka. Faktor 1/Γ(a) je normalizacija, uvodi se da bi

Evo Γ(a)- jedna od specijalnih funkcija koje se koriste u matematici, takozvana "gama funkcija", po kojoj se i distribucija data formulom (17) naziva,

Na fiksni a formula (17) definira porodicu distribucija sa pomakom skale koju generiše distribucija sa gustinom

(18)

Distribucija oblika (18) naziva se standardna gama distribucija. Dobiva se iz formule (17) sa b= 1 i With= 0.

Poseban slučaj gama distribucije na a= 1 su eksponencijalne distribucije (sa λ = 1/b). Sa prirodnim a i With=0 gama distribucije se zovu Erlangove distribucije. Iz radova danskog naučnika K.A. Erlanga (1878-1929), zaposlenika telefonske kompanije u Kopenhagenu, koji je studirao 1908-1922. funkcionisanja telefonskih mreža, započeo je razvoj teorije čekanja. Ova teorija se bavi probabilističko-statističkim modeliranjem sistema u kojima se servisira tok zahtjeva u cilju donošenja optimalnih odluka. Erlangove distribucije koriste se u istim područjima primjene kao i eksponencijalne distribucije. Ovo se zasniva na sljedećoj matematičkoj činjenici: zbir k nezavisnih slučajnih varijabli eksponencijalno raspoređenih sa istim parametrima λ i With, ima gama distribuciju s parametrom oblika a =k, parametar skale b= 1/λ i parametar pomaka kc. At With= 0 dobijamo Erlangovu distribuciju.

Ako je slučajna varijabla X ima gama distribuciju sa parametrom oblika a takav da d = 2 a- cijeli broj, b= 1 i With= 0, zatim 2 X ima hi-kvadrat distribuciju sa d stepena slobode.

Slučajna vrijednost X sa gvmma-distribucijom ima sljedeće karakteristike:

Očekivana vrijednost M(X) =ab + c,

disperzija D(X) = σ 2 = ab 2 ,

Koeficijent varijacije

asimetrija

Višak

Normalna distribucija je ekstremni slučaj gama distribucije. Preciznije, neka je Z slučajna varijabla sa standardnom gama distribucijom datom formulom (18). Onda

za bilo koga pravi broj X, gdje F(x)- standardna funkcija normalne distribucije N(0,1).

U primijenjenim istraživanjima koriste se i druge parametarske porodice distribucija, od kojih su najpoznatiji Pirsonov sistem krivulja, Edgeworth i Charlierove serije. Oni se ovdje ne razmatraju.

Diskretno distribucije koje se koriste u probabilističko-statističkim metodama odlučivanja. Najčešće se koriste tri porodice diskretnih distribucija - binomna, hipergeometrijska i Poissonova, kao i neke druge porodice - geometrijske, negativne binomne, multinomske, negativne hipergeometrijske itd.

Kao što je već pomenuto, binomna distribucija se odvija u nezavisnim pokusima, u svakom od kojih sa verovatnoćom R pojavljuje se događaj ALI. Ako a ukupan broj testovi n dato, zatim broj pokušaja Y, u kojem se događaj pojavio ALI, ima binomnu distribuciju. Za binomnu distribuciju, vjerovatnoća da će biti prihvaćena kao slučajna varijabla Y vrijednosti y određuje se formulom

Broj kombinacija od n elementi po y poznato iz kombinatorike. Za sve y, osim 0, 1, 2, …, n, imamo P(Y= y)= 0. Binomna distribucija sa fiksnom veličinom uzorka n je postavljen parametrom str, tj. binomne distribucije čine familiju jednog parametra. Koriste se u analizi podataka uzorka istraživanja, posebno u proučavanju preferencija potrošača, selektivnoj kontroli kvaliteta proizvoda prema jednostepenim planovima kontrole, pri testiranju populacija pojedinaca u demografiji, sociologiji, medicini, biologiji itd.

Ako a Y 1 i Y 2 - nezavisne binomne slučajne varijable sa istim parametrom str 0 određena uzorcima sa zapreminama n 1 i n 2 odnosno, onda Y 1 + Y 2 - binomna slučajna varijabla sa distribucijom (19) sa R = str 0 i n = n 1 + n 2 . Ova napomena proširuje primenljivost binomne distribucije, omogućavajući vam da kombinujete rezultate nekoliko grupa testova, kada postoji razlog da se veruje da isti parametar odgovara svim ovim grupama.

Karakteristike binomne distribucije izračunate su ranije:

M(Y) = np, D(Y) = np( 1- str).

U odjeljku "Događaji i vjerovatnoće" za binomsku slučajnu varijablu dokazan je zakon velikih brojeva:

za bilo koga. Uz pomoć središnje granične teoreme, zakon velikih brojeva može se precizirati navođenjem kako Y/ n razlikuje se od R.

De Moivre-Laplaceova teorema. Za bilo koje brojeve a i b, a< b, imamo

gdje F(X) je standardna normalna funkcija raspodjele sa srednjom 0 i varijansom 1.

Da bi se to dokazalo, dovoljno je koristiti reprezentaciju Y kao zbir nezavisnih slučajnih varijabli koje odgovaraju ishodima pojedinačnih ispitivanja, formule za M(Y) i D(Y) i centralna granična teorema.

Ova teorema je za slučaj R= ½ dokazao je engleski matematičar A. Moivre (1667-1754) 1730. godine. U gornjoj formulaciji, to je 1810. dokazao francuski matematičar Pierre Simon Laplace (1749-1827).

Hipergeometrijska distribucija se odvija tokom selektivne kontrole konačnog skupa objekata zapremine N prema alternativnom atributu. Svaki kontrolirani objekt je klasifikovan ili kao da ima atribut ALI, ili kao da ne posjeduje ovu funkciju. Hipergeometrijska distribucija ima slučajnu varijablu Y, jednako broju objekata koji imaju atribut ALI u slučajnom uzorku zapremine n, gdje n< N. Na primjer, broj Y neispravne jedinice proizvoda u slučajnom uzorku zapremine n od količine serije N ima hipergeometrijsku distribuciju ako n< N. Drugi primjer je lutrija. Pusti znak ALI tiket je znak "pobeđivanja". Neka sve karte N, i neka osoba je stekla n Od njih. Tada broj dobitnih listića za ovu osobu ima hipergeometrijsku distribuciju.

Za hipergeometrijsku distribuciju, vjerovatnoća da slučajna varijabla Y poprimi vrijednost y ima oblik

(20)

gdje D je broj objekata koji imaju atribut ALI, u razmatranom skupu volumena N. Gde y uzima vrijednosti od max(0, n - (N - D)) do min( n, D), sa drugim y vjerovatnoća u formuli (20) je jednaka 0. Dakle, hipergeometrijsku raspodjelu određuju tri parametra - zapremina stanovništva N, broj objekata D u njemu, posedujući razmatranu osobinu ALI i veličinu uzorka n.

Jednostavno nasumično uzorkovanje n od ukupne zapremine N naziva se uzorak dobiven kao rezultat slučajnog odabira, u kojem je bilo koji od skupova iz n objekti imaju istu vjerovatnoću da budu odabrani. Metode slučajnog odabira uzoraka ispitanika (intervjuisanih) ili jedinica komadnih proizvoda razmatraju se u instruktivno-metodičkim i normativno-tehničkim dokumentima. Jedna od metoda selekcije je sljedeća: objekti se biraju jedan od drugog, a u svakom koraku svaki od preostalih objekata u skupu ima istu šansu da bude odabran. U literaturi se za tip uzoraka koji se razmatra koriste i termini „slučajni uzorak“, „slučajni uzorak bez zamjene“.

Budući da je obim opšte populacije (lotovi) N i uzorci n su opšte poznate, onda je parametar hipergeometrijske distribucije koji treba procijeniti D. U statističkim metodama upravljanja kvalitetom proizvoda D- obično broj neispravnih jedinica u seriji. Zanimljiva je i karakteristika distribucije D/ N- nivo defekta.

Za hipergeometrijsku distribuciju

Posljednji faktor u izrazu varijanse je blizu 1 ako N>10 n. Ako u isto vrijeme izvršimo zamjenu str = D/ N, tada će se izrazi za matematičko očekivanje i varijansu hipergeometrijske distribucije pretvoriti u izraze za matematičko očekivanje i varijansu binomske distribucije. Ovo nije slučajnost. To se može pokazati

at N>10 n, gdje str = D/ N. Ograničavajući omjer je važeći

i ova granična relacija se može koristiti za N>10 n.

Treća široko korištena diskretna distribucija je Poissonova distribucija. Slučajna varijabla Y ima Poissonovu distribuciju ako

,

gdje je λ parametar Poissonove distribucije, i P(Y= y)= 0 za sve ostale y(za y=0, 0!=1 je označeno). Za Poissonovu distribuciju

M(Y) = λ, D(Y) = λ.

Ova distribucija je dobila ime po francuskom matematičaru C.D. Poissonu (1781-1840), koji ju je prvi izveo 1837. Poissonova raspodjela je ekstremni slučaj binomne distribucije, gdje je vjerovatnoća R realizacija događaja je mala, ali broj suđenja n odlično, i np= λ. Tačnije, granični odnos

Stoga se Poissonova raspodjela (u staroj terminologiji "zakon distribucije") često naziva i "zakon rijetkih događaja".

Poissonova raspodjela nastaje u teoriji tokova događaja (vidi gore). Dokazano je da je za najjednostavniji tok konstantnog intenziteta Λ, broj događaja (poziva) koji su se desili tokom vremena t, ima Poissonovu distribuciju sa parametrom λ = Λ t. Dakle, vjerovatnoća da u vremenu t neće se dogoditi nikakav događaj e - Λ t, tj. funkcija distribucije dužine intervala između događaja je eksponencijalna.

Poissonova distribucija se koristi u analizi rezultata selektivnih marketinških anketa potrošača, izračunavanju operativnih karakteristika statističkih planova kontrole prihvatljivosti u slučaju malih vrijednosti prihvatljivosti nivoa neispravnosti, za opisivanje broja kvarova. statistički kontrolisanog tehnološkog procesa u jedinici vremena, broj "zahtjeva za uslugom" koji pristižu po jedinici vremena u sistemu čekanja, statistički obrasci nezgoda i rijetkih bolesti itd.

U literaturi se razmatra opis drugih parametarskih familija diskretnih distribucija i mogućnosti njihove praktične upotrebe.


U nekim slučajevima, na primjer, kada se proučavaju cijene, obim proizvodnje ili ukupno vrijeme između kvarova u problemima pouzdanosti, funkcije distribucije su konstantne u određenim intervalima u kojima vrijednosti slučajnih varijabli koje se proučavaju ne mogu pasti.

Prethodno

Funkcija distribucije slučajne varijable X je funkcija F(x), koja izražava za svaki x vjerovatnoću da slučajna varijabla X poprimi vrijednost, manji x

Primjer 2.5. Dat je niz distribucije slučajne varijable

Pronađite i grafički opišite njegovu funkciju distribucije. Rješenje. Prema definiciji

F(jc) = 0 for X X

F(x) = 0,4 + 0,1 = 0,5 na 4 F(x) = 0,5 + 0,5 = 1 pri X > 5.

Dakle (vidi sliku 2.1):


Svojstva funkcije distribucije:

1. Funkcija distribucije slučajne varijable je nenegativna funkcija zatvorena između nule i jedan:

2. Funkcija distribucije slučajne varijable je neopadajuća funkcija na cijeloj brojevnoj osi, tj. at X 2 >x

3. Na minus beskonačno, funkcija raspodjele je jednaka nuli, na plus beskonačno, jednaka je jedan, tj.

4. Vjerovatnoća pogađanja slučajne varijable X u intervalu jednak je definitivnom integralu njegove gustine vjerovatnoće u rasponu od a prije b(vidi sliku 2.2), tj.


Rice. 2.2

3. Funkcija distribucije kontinuirane slučajne varijable (vidi sliku 2.3) može se izraziti u smislu gustine vjerovatnoće koristeći formulu:

F(x)= Jp(*)*. (2.10)

4. Nepravilan integral u beskonačnim granicama gustine vjerovatnoće kontinuirane slučajne varijable jednak je jedan:

Geometrijska svojstva / i 4 gustoće vjerovatnoće znače da je njegov dijagram kriva distribucije - ne leži ispod x-ose, i ukupne površine figure, ograničena kriva distribucije i x-osa, je jednako jedan.

Za kontinuiranu slučajnu varijablu X očekivanu vrijednost M(X) i varijansu D(X) određuju se formulama:

(ako integral konvergira apsolutno); ili

(ako se redukovani integrali konvergiraju).

Zajedno sa gore navedenim numeričkim karakteristikama, koncept kvantila i procentnih poena koristi se za opisivanje slučajne varijable.

q kvantil nivoa(ili q-kvantil) je takva vrijednostx qslučajna varijabla, na kojoj njena funkcija distribucije poprima vrijednost, jednako q, tj.

  • 100Tačka q%-ou je kvantil X~ q.
  • ? Primjer 2.8.

Prema primjeru 2.6 pronađite kvantil xqj i 30% slučajne varijabilne tačke x.

Rješenje. Po definiciji (2.16) F(xo t3)= 0,3, tj.

~Y~ = 0,3, odakle je kvantil x 0 3 = 0,6. 30% slučajne varijabilne tačke X, ili kvantil H)_o,z = xoj» nalazi se na sličan način iz jednačine ^ = 0,7. odakle *,= 1.4. ?

Među numeričke karakteristike dodijeliti slučajnu varijablu početni v* i centralno R* momenti k-tog reda, određena za diskretne i kontinuirane slučajne varijable po formulama:


Među zakonima raspodjele za diskretne slučajne varijable, najčešći je binomni zakon raspodjele. Binomna distribucija se odvija pod sljedećim uvjetima. Neka je slučajna varijabla broj pojavljivanja nekog događaja u nezavisnim ispitivanjima, vjerovatnoća pojave u zasebnom ispitivanju je . Ova slučajna varijabla je diskretna slučajna varijabla, njene moguće vrijednosti su . Vjerovatnoća da će slučajna varijabla poprimiti vrijednost izračunava se po Bernoullijevoj formuli: .

Definicija 15. Zakon distribucije diskretne slučajne varijable naziva se binomni zakon distribucije ako se vjerovatnoće vrijednosti slučajne varijable izračunaju pomoću Bernoullijeve formule. Serija distribucije će izgledati ovako:

Uvjerimo se da je zbir vjerovatnoća različitih vrijednosti slučajne varijable jednak 1. Zaista,

Budući da su ovi proračuni rezultirali Newtonovom binomnom formulom, stoga se zakon raspodjele naziva binomnim. Ako slučajna varijabla ima binomnu distribuciju, tada se njene numeričke karakteristike nalaze po formulama:

(42) (43)

Primjer 15 Postoji serija od 50 delova. Vjerovatnoća braka za jedan dio. Neka je slučajna varijabla broj neispravnih dijelova u datoj seriji. Pronađite matematičko očekivanje, varijansu i standardnu ​​devijaciju date slučajne varijable. Rješenje. Slučajna varijabla ima binomnu distribuciju, jer se vjerovatnoća da će poprimiti vrijednost izračunava pomoću Bernoullijeve formule. Tada se njegovo matematičko očekivanje nalazi po formuli (41), naime, ; varijansa se nalazi po formuli (42): . Tada će standardna devijacija biti jednaka . Pitanje. Kupljeno 200 srećki, vjerovatnoća dobitka jednog listića je 0,01. Tada je prosječan broj srećki koje će dobiti: a) 10; b) 2; u 20; d) 1.

Poissonov zakon distribucije

Prilikom rješavanja mnogih praktičnih problema, mora se pozabaviti diskretnim slučajnim varijablama koje poštuju Poissonov zakon distribucije. Tipični primjeri slučajne varijable sa Poissonovom distribucijom su: broj poziva na telefonskoj centrali za neko vrijeme; broj kvarova složene opreme tokom vremena, ako se zna da su kvarovi nezavisni jedan od drugog i u prosjeku ima kvarova po jedinici vremena.Serija distribucije će izgledati ovako:

Odnosno, vjerovatnoća da će slučajna varijabla poprimiti vrijednost izračunava se po Poissonovoj formuli: stoga se ovaj zakon naziva Poissonov zakon distribucije. Slučajna varijabla distribuirana prema Poissonovom zakonu ima sljedeće numeričke karakteristike:

Poissonova raspodjela ovisi o jednom parametru, a to je srednja vrijednost slučajne varijable. Slika 14 pokazuje opšti oblik poligon Poissonove distribucije za različite vrijednosti parametra.

Poissonova distribucija se može koristiti kao aproksimacija u slučajevima kada je tačna distribucija slučajne varijable binomna distribucija, dok je broj pokušaja velik, a vjerovatnoća da će se događaj desiti u posebnom pokušaju mala, stoga je Poissonova distribucija zakon se zove zakon retkih događaja. I također, ako se matematičko očekivanje malo razlikuje od varijanse, odnosno kada . U tom smislu, Poissonova distribucija ima veliki broj različitih primjena. Primjer 16 Fabrika šalje 500 visokokvalitetnih proizvoda u bazu. Vjerovatnoća da će se proizvod oštetiti u transportu je 0,002. Pronađite matematičko očekivanje broja dijelova oštećenih tokom transporta. Rješenje. Slučajna varijabla ima Poissonovu distribuciju, tako da . Pitanje. Verovatnoća izobličenja karaktera tokom prenosa poruke je 0,004. Da bi prosječan broj iskrivljenih simbola bio 4, mora se prenijeti 100 simbola.