Uslovni zakoni distribucije. Regresija.

Definicija. Uslovni zakon distribucije jedne od jednodimenzionalnih komponenti dvodimenzionalne slučajne varijable (X, Y) je njen zakon raspodjele, izračunat pod uslovom da je druga komponenta zauzela određenu vrijednost (ili upala u neki interval). U prethodnom predavanju razmatrano je pronalaženje uslovnih distribucija za diskretne slučajne varijable. Postoje i formule za uslovne vjerovatnoće:

U slučaju kontinuiranih slučajnih varijabli, potrebno je odrediti gustine vjerovatnoće uslovnih distribucija j y (x) i j X (y). U tom cilju, u gornjim formulama ćemo vjerovatnoće događaja zamijeniti njihovim "elementima vjerovatnoće",!

nakon smanjenja za dx i dy dobijamo:

one. uslovna gustina verovatnoće jedne od jednodimenzionalnih komponenti dvodimenzionalne slučajne varijable jednaka je odnosu njene zajedničke gustine i gustine verovatnoće druge komponente. Ovi omjeri su zapisani u obliku

nazivaju se teoremom (pravilom) množenja gustina raspodjele.

Uslovne gustine j y (x) i j X (y). imaju sva svojstva "bezuslovne" gustine.

Kada proučavamo dvodimenzionalne slučajne varijable, uzimamo u obzir numeričke karakteristike jednodimenzionalne komponente X i Y - matematička očekivanja i varijanse. Za kontinuiranu slučajnu varijablu (X, Y), one se određuju formulama:

Uz njih se razmatraju i numeričke karakteristike uslovnih distribucija: uslovna matematička očekivanja M x (Y) i M y (X) i uslovne varijanse D x (Y) i D Y (X). Ove karakteristike se nalaze uobičajenim formulama matematičkog očekivanja i varijanse, u kojima se koriste uslovne verovatnoće ili gustine uslovne verovatnoće umesto verovatnoće događaja ili gustine verovatnoće.

Uslovno očekivanu vrijednost slučajna varijabla Y na X = x, tj. M x (Y), postoji funkcija od x, nazvana regresijska funkcija ili jednostavno regresija Y na X. Slično, M Y (X) se naziva regresijska funkcija ili jednostavno regresija X na Y. Grafovi ovih funkcija nazivaju se respektivno regresijske linije (ili regresijske krive) Y prema X ili X prema Y.

Zavisne i nezavisne slučajne varijable.

Definicija. Slučajne varijable X i Y nazivaju se nezavisnim ako je njihova zajednička funkcija raspodjele F(x,y) predstavljena kao proizvod funkcija raspodjele F 1 (x) i F 2 (y) ovih slučajnih varijabli, tj.

Inače, slučajne varijable X i Y se nazivaju zavisne.

Dvaput diferencirajući jednakost u odnosu na argumente x i y, dobijamo

one. za nezavisne kontinuirane slučajne varijable X i Y, njihova zajednička gustina j(x, y) jednaka je proizvodu gustina vjerovatnoće j 1 (x) i j 2 (y) ovih slučajnih varijabli.

Do sada smo se susreli sa konceptom funkcionalnog odnosa između varijabli X i Y, kada je svaka vrijednost x u jednoj varijabli odgovarala striktno definiranoj vrijednosti u drugoj. Na primjer, odnos između dvije slučajne varijable - broj neispravnih dijelova opreme za određenom periodu vrijeme i njihova cijena - funkcionalna.

Općenito, nailazi se na drugačiji tip zavisnosti, manje krut od funkcionalne zavisnosti.

Definicija. Odnos između dvije slučajne varijable naziva se probabilistički (stohastički ili statistički) ako svaka vrijednost jedne od njih odgovara određenoj (uslovnoj) raspodjeli druge.

U slučaju probabilističke (stohastičke) zavisnosti, nemoguće je, znajući vrijednost jedne od njih, precizno odrediti vrijednost druge, već možete samo naznačiti distribuciju druge vrijednosti. Na primjer, odnos između broja kvarova opreme i troškova njenog preventivnog održavanja, težine i visine osobe, vremena koje učenik provede na gledanju televizijskih programa i čitanju knjiga itd. su probabilistički (stohastički).

Na sl. 5.10 prikazuje primjere zavisnih i nezavisnih slučajnih varijabli X i Y.

  Zavisne i nezavisne slučajne varijable

  Prilikom proučavanja sistema slučajnih varijabli uvijek treba obratiti pažnju na stepen i prirodu njihove zavisnosti. Ova zavisnost može biti manje ili više izražena, manje ili više bliska. U nekim slučajevima, odnos između slučajnih varijabli može biti toliko blizak da, znajući vrijednost jedne slučajne varijable, možete precizno naznačiti vrijednost druge. U drugom ekstremnom slučaju, zavisnost između slučajnih varijabli je toliko slaba i udaljena da se one praktično mogu smatrati nezavisnim.
  Koncept nezavisnih slučajnih varijabli jedan je od važnih koncepata teorije vjerovatnoće.
  Za slučajnu varijablu \(Y\) se kaže da je nezavisna od slučajne varijable \(X\) ako zakon raspodjele vrijednosti \(Y\) ne zavisi od vrijednosti vrijednosti \(X\).
  Za kontinuirane slučajne varijable, uvjet da je \(Y\) nezavisan od \(X\) može se napisati kao: $$f(y\mid x)=f_(2)(y)$$ za bilo koje \(y) \).
  Naprotiv, ako \(Y\) zavisi od \(X\), onda $$f(y\mid x) \neq f_(2)(y)$$  Dokazujemo da zavisnost ili nezavisnost slučajnih varijabli je uvijek obostrana: ako vrijednost \(Y\) ne zavisi od \(X\), tada vrijednost \(X\) ne zavisi od \(Y\).
  Zaista, neka je \(Y\) nezavisan od \(X\): $$f(y\mid x)=f_(2)(y)$$ imamo: $$f_(1)(x)f( y \mid x)=f_(2)(y)f(x\mid y)$$ odakle dobijamo: $$f_(1)(x)=f(x\mid y)$$ što je trebalo biti dokazano.
  Budući da su ovisnost i nezavisnost slučajnih varijabli uvijek obostrane, možemo dati novu definiciju nezavisnih slučajnih varijabli.
 Slučajne varijable \(X\) i \(Y\) nazivaju se nezavisnim ako zakon raspodjele svake od njih ne ovisi o vrijednosti druge. Inače, veličine \(X\) i \(Y\) se nazivaju zavisan.
  Za nezavisne kontinuirane slučajne varijable, teorema množenja zakona distribucije ima oblik distribucije pojedinačnih veličina uključenih u sistem.
Često se po samom obliku funkcije \(f(x, y)\) može zaključiti da su slučajne varijable \(X, Y\) nezavisne, naime, ako je gustina distribucije \(f(x, y) \) razlaže u proizvod dvije funkcije, od kojih jedna ovisi samo o \(x\), a druga samo o \(y\), tada su slučajne varijable nezavisne.
Primjer 1 Gustina distribucije sistema \((X, Y)\) ima oblik: $$f(x, y)=\frac(1)(\pi ^(2)(x^(2)+y^( 2)+x ^(2)y^(2)+1))$$ Odredite da li su slučajne varijable \(X\) i \(Y\) zavisne ili nezavisne.
Rješenje. Faktorizirajući imenilac, imamo: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\frac(1)(\pi (y^(2)+1 ))$$ Iz činjenice da se funkcija \(f(x, y)\) podijelila u proizvod dvije funkcije, od kojih jedna zavisi samo od \(x\), a druga samo od \(y\ ), zaključujemo da veličine \(X\) i \(Y\) moraju biti nezavisne. Zaista, primjenom formule, imamo: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\int_(-\infty)^(\infty)(\ frac( dy)(\pi (y^(2)+1)))=\frac(1)(\pi (x^(2)+1))$$ slično $$f(x, y)= (\frac (1)(\pi (y^(2)+1)))$$ odakle smo sigurni da je $$f(x, y)=f_(1)(x)f_(2)(y) $$ i stoga su veličine \(X\) i \(Y\) nezavisne.

Prilikom proučavanja sistema slučajnih varijabli uvijek treba obratiti pažnju na stepen i prirodu njihove zavisnosti. Ova zavisnost može biti manje ili više bliska.

Koncept nezavisnih slučajnih varijabli je jedan od važnih koncepata teorije vjerovatnoće.

Definicija 1. Slučajna vrijednost Y naziva se nezavisno od slučajne varijable x, ako je zakon raspodjele veličine Y ne zavisi od vrednosti koju uzima vrednost x.

Za kontinuirane slučajne varijable, uslov nezavisnosti Y od X može se napisati kao:

Naprotiv, ako Y zavisi od x, onda

Dokažimo to zavisnost ili nezavisnost slučajnih varijabli je uvijek obostrana: ako je vrijednost Y ne zavisi od x, zatim vrijednost X ne zavisi od Y.

Zaista, neka Y ne zavisi od X, onda

Gustina distribucije spojeva prema (5.4.5) i (5.4.6) može se napisati

odakle dobijamo:

Q.E.D.

Kako su zavisnost i nezavisnost slučajnih varijabli uvijek uzajamne, moguće je dati novu definiciju nezavisnih slučajnih varijabli.

Definicija 2. slučajne varijable X i Y nazivaju se nezavisnim ako zakon raspodjele svakog od njih ne zavisi od toga koju vrijednost drugi uzima. Inače, vrijednosti X i Y pozvao zavisan.

Za nezavisne kontinuirane slučajne varijable, teorema množenja zakona distribucije ima oblik:

one. gustina distribucije sistema nezavisnih slučajnih varijabli jednaka je proizvodu gustine distribucije pojedinačnih varijabli uključenih u sistem.

Zaustavimo se detaljnije na važnim konceptima "zavisnosti" i "nezavisnosti" slučajnih varijabli.

Koncept "zavisnosti" slučajnih varijabli, koji koristimo u teoriji vjerovatnoće, donekle se razlikuje od uobičajenog koncepta "zavisnosti" varijabli, kojim operišemo u matematici. Zaista, obično pod "ovisnošću" veličina podrazumijevaju samo jednu vrstu zavisnosti - potpunu, krutu, tzv. funkcionalan ovisnost. Dvije količine X i Y nazivaju se funkcionalno zavisnim ako se, znajući vrijednost jednog od njih, može točno naznačiti vrijednost drugog.

U teoriji vjerovatnoće susrećemo se sa još jednom, opštijom vrstom zavisnosti - sa vjerovatnoća ili "stohastička" zavisnost. Ako vrijednost Y vezano za vrijednost X vjerovatnoća ovisnosti, dakle, znajući vrijednost x, ne može odrediti tačnu vrijednost Y, i možete samo specificirati njegov zakon distribucije, ovisno o tome koju vrijednost je vrijednost zauzela x.

Vjerovatna ovisnost između slučajnih varijabli je vrlo česta u praksi. Ako su slučajne varijable X i Y su u verovatnoj zavisnosti, to ne znači da sa promenom vrednosti X magnitude Y promjene na vrlo određen način; to samo znači da sa promjenom vrijednosti X magnitude Y također ima tendenciju da se mijenja (na primjer, povećava se ili smanjuje s povećanjem x).

Razmotrite, na primjer, dvije takve slučajne varijable: X- rast nasumično uzete osobe, Y-- njegova težina. Očigledno, količine X i Y su u određenoj verovatnoj zavisnosti; izražava se u opšti ljudi sa većom visinom imaju veću težinu.

Razlikujte zavisne i nezavisne događaje. Kaže se da su dva događaja nezavisna ako pojava jednog od njih ne mijenja vjerovatnoću pojave drugog. Na primjer, ako u radionici rade dvije automatske linije koje nisu međusobno povezane prema uvjetima proizvodnje, tada su zaustavljanja ovih linija nezavisni događaji.

Poziva se nekoliko događaja kolektivno nezavisni, ako bilo koji od njih ne ovisi o bilo kojem drugom događaju i bilo kojoj kombinaciji ostalih.

Događaji se zovu zavisan, ako jedno od njih utiče na vjerovatnoću pojave drugog. Na primjer, dva proizvodna pogona povezana su jednim tehnološkim ciklusom. Tada vjerovatnoća kvara jednog od njih zavisi od stanja drugog. Vjerovatnoća jednog događaja B, izračunata pod pretpostavkom da se dogodi drugi događaj A, naziva se uslovna verovatnoća događaj B i označava se sa P(A|B).

Uslov za nezavisnost događaja B od događaja A zapisuje se kao P(B|A)=P(B), a uslov za njegovu zavisnost kao P(B|A)≠P(B).

Vjerovatnoća događaja u Bernoullijevim suđenjima. Poissonova formula.

Ponovljeni nezavisni testovi, Bernulijeva suđenja ili Bernulijeva šema takva ispitivanja se nazivaju ako za svako ispitivanje postoje samo dva ishoda - pojava događaja A ili i vjerovatnoća ovih događaja ostaje nepromijenjena za sva ispitivanja. Ova jednostavna shema slučajnog testiranja ima veliki značaj u teoriji vjerovatnoće.

Većina poznati primjer Bernoullijeva suđenja je eksperiment sa uzastopnim bacanjem pravilnog (simetričnog i homogenog) novčića, gdje je događaj A gubitak, na primjer, "grba" ("repova").

Neka je u nekom iskustvu vjerovatnoća događaja A jednaka P(A)=p, zatim , gdje je r+q=1. Pokrenimo eksperiment n puta, uz pretpostavku da su pojedinačna ispitivanja neovisna, što znači da ishod bilo kojeg od njih nije povezan s ishodima prethodnih (ili kasnijih) ispitivanja. Nađimo vjerovatnoću pojave događaja A tačno k puta, recimo samo u prvih k pokušaja. Neka je događaj koji će se u n pokušaja dogoditi tačno k puta u prvim pokušajima. Događaj se može predstaviti kao

Pošto smo pretpostavili da su eksperimenti nezavisni, onda

41)[stranica2] Ako postavimo pitanje pojave događaja A k-puta u n pokušaja proizvoljnim redoslijedom, onda se događaj može predstaviti kao

Broj različitih članova na desnoj strani ove jednakosti jednak je broju pokušaja od n do k, pa je vjerovatnoća događaja, koju ćemo označiti, jednaka

Slijed događaja čini potpunu grupu nezavisnih događaja . Zaista, iz nezavisnosti događaja dobijamo

Dvije slučajne varijable $X$ i $Y$ nazivaju se nezavisnim ako se zakon raspodjele jedne slučajne varijable ne mijenja ovisno o mogućim vrijednostima koje druga slučajna varijabla uzima. To jest, za bilo koje $x$ i $y$ događaji $X=x$ i $Y=y$ su nezavisni. Pošto su događaji $X=x$ i $Y=y$ nezavisni, onda prema teoremi o proizvodu vjerovatnoća nezavisnih događaja $P\left(\left(X=x\right)\left(Y=y\ desno)\desno)=P \lijevo(X=x\desno)P\lijevo(Y=y\desno)$.

Primjer 1 . Neka slučajna varijabla $X$ izražava novčane dobitke od listića jedne lutrije "Ruski loto", a slučajna varijabla $Y$ novčane dobitke od listića druge lutrije "Zlatni ključ". Očigledno je da će slučajne varijable $X,\ Y$ biti nezavisne, budući da dobici od listića jedne lutrije ne zavise od zakona raspodjele dobitaka od listića druge lutrije. U slučaju kada bi slučajne varijable $X,\ Y$ izražavale dobitke u istoj lutriji, tada bi, očigledno, ove slučajne varijable bile zavisne.

Primjer 2 . Dva radnika rade u različitim radionicama i proizvode različite proizvode koji nisu međusobno povezani tehnologijama proizvodnje i korištenim sirovinama. Zakon raspodjele broja neispravnih proizvoda koje proizvede prvi radnik po smjeni ima sljedeći oblik:

$\begin(niz)(|c|c|)
\hline
Broj \ neispravnih \ proizvoda \ x & 0 & 1 \\
\hline
Vjerovatnoća & 0,8 & 0,2 \\
\hline
\end(niz)$

Broj neispravnih proizvoda koje proizvede drugi radnik po smjeni podliježe sljedećem zakonu o distribuciji.

$\begin(niz)(|c|c|)
\hline
Broj \ neispravnih \ proizvoda \ y & 0 & 1 \\
\hline
Vjerovatnoća & 0,7 & 0,3 \\
\hline
\end(niz)$

Nađimo zakon raspodjele broja neispravnih proizvoda koje su napravila dva radnika po smjeni.

Neka je slučajna varijabla $X$ broj neispravnih artikala koje je proizveo prvi radnik po smjeni, a $Y$ broj neispravnih artikala koje je proizveo drugi radnik po smjeni. Prema pretpostavci, slučajne varijable $X,\ Y$ su nezavisne.

Broj neispravnih artikala koje proizvode dva radnika po smjeni je slučajna varijabla $X+Y$. Njegove moguće vrijednosti su $0,\ 1$ i $2$. Nađimo vjerovatnoće sa kojima slučajna varijabla $X+Y$ uzima svoje vrijednosti.

$P\levo(X+Y=0\desno)=P\levo(X=0,\ Y=0\desno)=P\levo(X=0\desno)P\levo(Y=0\desno) =0.8\cdot 0.7=0.56.$

$P\levo(X+Y=1\desno)=P\levo(X=0,\ Y=1\ ili\ X=1,\ Y=0\desno)=P\levo(X=0\desno )P\levo(Y=1\desno)+P\levo(X=1\desno)P\levo(Y=0\desno)=0.8\cdot 0.3+0.2\cdot 0.7 =0.38.$

$P\levo(X+Y=2\desno)=P\levo(X=1,\ Y=1\desno)=P\levo(X=1\desno)P\levo(Y=1\desno) =0.2\cdot 0.3=0.06.$

Zatim zakon raspodjele broja neispravnih proizvoda koje proizvedu dva radnika po smjeni:

$\begin(niz)(|c|c|)
\hline
Broj \ neispravnih \ stavki & 0 & 1 & 2 \\
\hline
Vjerojatnost & 0,56 & 0,38 & 0,06 \\
\hline
\end(niz)$

U prethodnom primjeru izveli smo operaciju nad slučajnim varijablama $X,\ Y$, odnosno pronašli smo njihov zbir $X+Y$. Hajde sada da damo rigorozniju definiciju operacija (sabiranja, razlike, množenja) nad slučajnim varijablama i dajemo primjere rješenja.

Definicija 1. Proizvod $kX$ slučajne varijable $X$ po konstantna vrijednost$k$ je slučajna varijabla koja uzima vrijednosti $kx_i$ sa istim vjerovatnoćama $p_i$ $\left(i=1,\ 2,\ \dots ,\ n\right)$.

Definicija 2. Zbir (razlika ili proizvod) slučajnih varijabli $X$ i $Y$ je slučajna varijabla koja uzima sve moguće vrijednosti oblika $x_i+y_j$ ($x_i-y_i$ ili $x_i\cdot y_i$) , gdje je $i=1 ,\ 2,\dots ,\ n$, sa vjerovatnoćama $p_(ij)$ da slučajna varijabla $X$ uzme vrijednost $x_i$, a $Y$ vrijednost $y_j$:

$$p_(ij)=P\lijevo[\lijevo(X=x_i\desno)\lijevo(Y=y_j\desno)\desno].$$

Pošto su slučajne varijable $X,\ Y$ nezavisne, onda prema teoremi množenja vjerovatnoće za nezavisne događaje: $p_(ij)=P\left(X=x_i\right)\cdot P\left(Y=y_j\right )= p_i\cdot p_j$.

Primjer 3 . Nezavisne slučajne varijable $X,\ Y$ date su vlastitim zakonima raspodjele vjerovatnoće.

$\begin(niz)(|c|c|)
\hline
x_i & -8 & 2 & 3 \\
\hline
p_i & 0,4 & 0,1 & 0,5 \\
\hline
\end(niz)$

$\begin(niz)(|c|c|)
\hline
y_i & 2 & 8 \\
\hline
p_i & 0,3 & 0,7 \\
\hline
\end(niz)$

Sastavimo zakon raspodjele slučajne varijable $Z=2X+Y$. Zbir slučajnih varijabli $X$ i $Y$, tj. $X+Y$, je slučajna varijabla koja uzima sve moguće vrijednosti oblika $x_i+y_j$, gdje je $i=1,\ 2,\ tačke ,\ n$ , sa vjerovatnoćom $p_(ij)$ da slučajna varijabla $X$ uzme vrijednost $x_i$, a $Y$ vrijednost $y_j$: $p_(ij)=P\left[\left( X=x_i\right )\left(Y=y_j\right)\right]$. Pošto su slučajne varijable $X,\ Y$ nezavisne, onda prema teoremi množenja vjerovatnoće za nezavisne događaje: $p_(ij)=P\left(X=x_i\right)\cdot P\left(Y=y_j\right )= p_i\cdot p_j$.

Dakle, ima zakone distribucije za slučajne varijable $2X$ i $Y$, respektivno.

$\begin(niz)(|c|c|)
\hline
x_i & -16 & 4 & 6 \\
\hline
p_i & 0,4 & 0,1 & 0,5 \\
\hline
\end(niz)$

$\begin(niz)(|c|c|)
\hline
y_i & 2 & 8 \\
\hline
p_i & 0,3 & 0,7 \\
\hline
\end(niz)$

Radi lakšeg pronalaženja svih vrijednosti zbroja $Z=2X+Y$ i njihovih vjerovatnoća, sastavit ćemo pomoćnu tabelu, u čiju ćemo ćeliju staviti u lijevi kut vrijednosti sume $ Z=2X+Y$, au desnom uglu - vjerovatnoće ovih vrijednosti koje se dobiju kao rezultat množenja vjerovatnoća odgovarajućih vrijednosti slučajnih varijabli $2X$ i $Y$.

Kao rezultat, dobijamo distribuciju $Z=2X+Y$:

$\begin(niz)(|c|c|)
\hline
z_i & -14 & -8 & 6 & 12 & 10 & 16 \\
\hline
p_i & 0,12 & 0,28 & 0,03 & 0,07 & 0,15 & 0,35 \\
\hline
\end(niz)$