Zavisne i nezavisne slučajne varijable

  Prilikom proučavanja sistema slučajnih varijabli uvijek treba obratiti pažnju na stepen i prirodu njihove zavisnosti. Ova zavisnost može biti manje ili više izražena, manje ili više bliska. U nekim slučajevima, odnos između slučajnih varijabli može biti toliko blizak da, znajući vrijednost jedne slučajne varijable, možete precizno naznačiti vrijednost druge. U drugom ekstremnom slučaju, zavisnost između slučajnih varijabli je toliko slaba i udaljena da se one praktično mogu smatrati nezavisnim.
  Koncept nezavisnih slučajnih varijabli jedan je od važnih koncepata teorije vjerovatnoće.
  Za slučajnu varijablu \(Y\) se kaže da je nezavisna od slučajne varijable \(X\) ako zakon raspodjele vrijednosti \(Y\) ne zavisi od vrijednosti vrijednosti \(X\).
  Za kontinuirane slučajne varijable, uvjet da je \(Y\) nezavisan od \(X\) može se napisati kao: $$f(y\mid x)=f_(2)(y)$$ za bilo koje \(y) \).
  Naprotiv, ako \(Y\) zavisi od \(X\), onda $$f(y\mid x) \neq f_(2)(y)$$  Dokazujemo da zavisnost ili nezavisnost slučajnih varijabli je uvijek obostrana: ako vrijednost \(Y\) ne zavisi od \(X\), tada vrijednost \(X\) ne zavisi od \(Y\).
  Zaista, neka je \(Y\) nezavisan od \(X\): $$f(y\mid x)=f_(2)(y)$$ imamo: $$f_(1)(x)f( y \mid x)=f_(2)(y)f(x\mid y)$$ odakle dobijamo: $$f_(1)(x)=f(x\mid y)$$ što je trebalo biti dokazano.
  Budući da su ovisnost i nezavisnost slučajnih varijabli uvijek obostrane, možemo dati novu definiciju nezavisnih slučajnih varijabli.
 Slučajne varijable \(X\) i \(Y\) nazivaju se nezavisnim ako zakon raspodjele svake od njih ne ovisi o vrijednosti druge. Inače, veličine \(X\) i \(Y\) se nazivaju zavisan.
  Za nezavisne kontinuirane slučajne varijable, teorema množenja zakona distribucije ima oblik: $$f(x, y)=f_(1)(x)f_(2)(y)$$, tj. gustina distribucije sistema nezavisnih slučajnih varijable jednak je proizvodu distribucije gustina pojedinačnih veličina uključenih u sistem.
Često se po samom obliku funkcije \(f(x, y)\) može zaključiti da su slučajne varijable \(X, Y\) nezavisne, naime, ako je gustina distribucije \(f(x, y) \) razlaže u proizvod dvije funkcije, od kojih jedna ovisi samo o \(x\), a druga samo o \(y\), tada su slučajne varijable nezavisne.
Primjer 1 Gustina distribucije sistema \((X, Y)\) ima oblik: $$f(x, y)=\frac(1)(\pi ^(2)(x^(2)+y^( 2)+x ^(2)y^(2)+1))$$ Odredite da li su slučajne varijable \(X\) i \(Y\) zavisne ili nezavisne.
Rješenje. Faktorizirajući imenilac, imamo: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\frac(1)(\pi (y^(2)+1 ))$$ Iz činjenice da se funkcija \(f(x, y)\) razložila u proizvod dvije funkcije, od kojih jedna zavisi samo od \(x\), a druga samo od \(y\ ), zaključujemo da veličine \(X\) i \(Y\) moraju biti nezavisne. Zaista, primjenom formule, imamo: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\int_(-\infty)^(\infty)(\ frac( dy)(\pi (y^(2)+1)))=\frac(1)(\pi (x^(2)+1))$$ slično $$f(x, y)= (\frac (1)(\pi (y^(2)+1)))$$ odakle smo sigurni da je $$f(x, y)=f_(1)(x)f_(2)(y) $$ i stoga su veličine \(X\) i \(Y\) nezavisne.

slučajni događaji nazivaju se nezavisnim ako pojava jednog od njih ne utiče na vjerovatnoću nastanka drugih događaja.

Primjer 1 . Ako postoje dvije ili više urni sa obojenim kuglicama, tada izvlačenje bilo koje lopte iz jedne urne ne utiče na vjerovatnoću izvlačenja drugih kuglica iz preostalih urni.

Za nezavisnih događaja fer teorem množenja vjerovatnoće: spoj vjerovatnoće(simultano)pojava nekoliko nezavisnih slučajnih događaja jednaka je proizvodu njihovih vjerovatnoća:

P (A 1 i A 2 i A 3 ... i A k) \u003d P (A 1) ∙ P (A 2) ∙ ... ∙ P (A k). (7)

Zajednička (istovremena) pojava događaja znači da se događaji događaju i A 1 , i A 2 i A 3… i I k.

Primjer 2 . Postoje dvije urne. Jedna sadrži 2 crne i 8 bijelih kuglica, druga 6 crnih i 4 bijele. Neka događaj ALI- slučajni odabir bijele kuglice iz prve urne, AT- od drugog. Kolika je vjerovatnoća da iz ovih urni slučajno izaberemo bijelu kuglu, tj. šta je jednako R (ALI i AT)?

Rješenje: vjerovatnoća izvlačenja bijele lopte iz prve urne
R(ALI) = = 0,8 od drugog – R(AT) = = 0,4. Verovatnoća dobijanja bele lopte iz obe urne u isto vreme je
R(ALI i AT) = R(ALIR(AT) = 0,8∙ 0,4 = 0,32 = 32%.

Primjer 3 Ishrana sa smanjenim unosom joda uzrokuje povećanje štitne žlijezde kod 60% životinja u velikoj populaciji. Za eksperiment su potrebne 4 uvećane žlijezde. Pronađite vjerovatnoću da će 4 nasumično odabrane životinje imati povećanu štitnu žlijezdu.

Rješenje:Slučajni događaj ALI- slučajni odabir životinje sa povećanom štitnom žlijezdom. Prema stanju problema, vjerovatnoća ovog događaja R(ALI) = 0,6 = 60%. Tada će vjerovatnoća zajedničke pojave četiri nezavisna događaja - nasumični izbor 4 životinje s povećanom štitnom žlijezdom - biti jednaka:

R(ALI 1 i ALI 2 i ALI 3 i ALI 4) = 0,6 ∙ 0,6 ∙0,6 ∙ 0,6=(0,6) 4 ≈ 0,13 = 13%.

zavisni događaji. Teorema množenja vjerovatnoće za zavisne događaje

Slučajni događaji A i B nazivaju se zavisnim ako pojava jednog od njih, na primjer, A mijenja vjerovatnoću pojave drugog događaja - B. Stoga se za zavisne događaje koriste dvije vrijednosti vjerovatnoće: bezuslovne i uslovne vjerovatnoće .

Ako a ALI i AT zavisne događaje, zatim vjerovatnoću da će se događaj dogoditi AT prvo (tj. prije događaja ALI) se zove bezuslovna verovatnoća ovog događaja i određen je R(AT).Vjerovatnoća događaja AT pod uslovom da je događaj ALI već se dogodilo, zove se uslovna verovatnoća razvoj događaja AT i označeno R(AT/ALI) ili R A(AT).

Bezuslovno - R(ALI) i uslovno - R(A/B) vjerovatnoće za događaj ALI.

Teorema množenja vjerovatnoće za dva zavisna događaja: vjerovatnoća istovremene pojave dva zavisna događaja A i B jednaka je proizvodu bezuslovne vjerovatnoće prvog događaja na uslovnu vjerovatnoću drugog:

R(A i B)= P(ALI)∙P(B/A) , (8)

ALI, ili

R(A i B)= P(AT)∙P(A/B), (9)

ako se događaj prvi dogodi AT.

Primjer 1. U urni se nalaze 3 crne i 7 bijelih kuglica. Odrediti vjerovatnoću da će 2 bijele kugle biti izvađene iz ove urne jedna po jedna (a prva lopta neće biti vraćena u urnu).

Rješenje: vjerovatnoća izvlačenja prve bijele lopte (događaj ALI) je jednako 7/10. Nakon što se izvadi, u urni ostaje 9 loptica, od kojih je 6 bijele. Zatim je vjerovatnoća pojave druge bijele lopte (događaj AT) je jednako R(AT/ALI) = 6/9, a vjerovatnoća dobijanja dvije bijele lopte u nizu je

R(ALI i AT) = R(ALI)∙R(AT/ALI) = = 0,47 = 47%.

Dati teorem množenja vjerovatnoće za zavisne događaje može se generalizirati na bilo koji broj događaja. Konkretno, za tri događaja, vezani prijatelj sa prijateljem:

R(ALI i AT i OD)= P(ALI)∙ R(B/A)∙ R(TAKSI). (10)

Primjer 2. U dva vrtića, svaki po 100 djece, došlo je do izbijanja zarazne bolesti. Udio slučajeva je 1/5 odnosno 1/4, i to u prvoj ustanovi 70%, au drugoj - 60% slučajeva su djeca do 3 godine. Jedno dijete se bira nasumično. Odredite vjerovatnoću da:

1) odabrano dijete pripada prvom vrtiću (događaj ALI) i bolesni (događaj AT).

2) dijete se bira iz drugog vrtić(događaj OD), bolestan (događaj D) i stariji od 3 godine (događaj E).

Rješenje. 1) željena vjerovatnoća -

R(ALI i AT) = R(ALI) ∙ R(AT/ALI) = = 0,1 = 10%.

2) željena vjerovatnoća:

R(OD i D i E) = R(OD) ∙ R(D/C) ∙ R(E/CD) = = 5%.

Bayesova formula

= (12)

Primjer1. Prilikom inicijalnog pregleda pacijenta pretpostavljaju se 3 dijagnoze H 1 , H 2 , H 3. Njihove vjerovatnoće su, prema ljekaru, raspoređene na sljedeći način: R(H 1) = 0,5; R(H 2) = 0,17; R(H 3) = 0,33. Stoga se prva dijagnoza čini provizorno najvjerojatnijom. Da bi se to razjasnilo, na primjer, propisan je krvni test u kojem se očekuje povećanje ESR (događaj ALI). Unaprijed je poznato (na osnovu rezultata istraživanja) da su vjerovatnoće povećanja ESR kod sumnjivih bolesti jednake:

R(ALI/H 1) = 0,1; R(ALI/H 2) = 0,2; R(ALI/H 3) = 0,9.

U dobijenoj analizi zabilježeno je povećanje ESR (događaj ALI dogodilo). Tada izračun prema Bayesovoj formuli (12) daje vrijednosti vjerovatnoće navodnih bolesti s povećanom vrijednošću ESR: R(H 1 /ALI) = 0,13; R(H 2 /ALI) = 0,09;
R(H 3 /ALI) = 0,78. Ove brojke pokazuju da je, uzimajući u obzir laboratorijske podatke, najrealnija ne prva, već treća dijagnoza, čija se vjerojatnost sada pokazala prilično visokom.

Primjer 2. Odrediti vjerovatnoću kojom se procjenjuje stepen rizika od perinatalne* smrti djeteta kod žena sa anatomski uskom karlicom.

Rješenje: neka događaj H 1 - sigurna dostava. Prema kliničkim izvještajima, R(H 1) = 0,975 = 97,5%, onda ako H 2- činjenica perinatalnog mortaliteta, dakle R(H 2) = 1 – 0,975 = 0,025 = 2,5 %.

Označite ALI- činjenica prisustva uske karlice kod porodilje. Iz sprovedenih studija poznato je: a) R(ALI/H 1) - vjerovatnoća uske karlice s povoljnim porodom, R(ALI/H 1) = 0,029, b) R(ALI/H 2) - vjerovatnoća uske karlice u perinatalnom mortalitetu,
R(ALI/H 2) = 0,051. Tada se željena vjerovatnoća perinatalnog mortaliteta u uskoj zdjelici kod porođajne žene izračunava po Bays-ovoj formuli (12) i jednaka je:

Dakle, rizik perinatalnog mortaliteta u anatomski uskoj karlici značajno je veći (skoro dva puta) od prosječnog rizika (4,4% naspram 2,5%).

Nijedna od njih ne ovisi o tome koje su vrijednosti uzele (ili će uzeti) druge slučajne varijable.

Na primjer, sistem dvije kockice - sasvim je jasno da rezultat bacanja jedne kockice ni na koji način ne utječe na vjerovatnoću ispadanja lica druge kockice. Ili iste automate koji rade samostalno. I, vjerovatno, neki imaju utisak da je bilo koji SV generalno nezavisan. Međutim, to nije uvijek slučaj.

Razmislite simultano odbacujući dvije magnetne kockice čiji su sjeverni polovi na strani lica sa 1 tačkom, a južni na suprotnoj strani sa 6 tačaka. Hoće li slične slučajne varijable biti nezavisne? Da, hoće. Vjerovatnoće ispadanja "1" i "6" jednostavno će se smanjiti, a šanse drugih lica će se povećati, jer kao rezultat testa, kocke mogu biti privučene suprotnim polovima.

Sada razmotrite sistem u kojem se kockice odbacuju sukcesivno:

- broj bodova bačenih na prvom kocku;

- broj bodova bačenih na drugu kockicu, pod uslovom da se uvijek odbacuje na desnu (na primjer) stranu od 1. kockice.

U ovom slučaju, zakon raspodjele slučajne varijable zavisi o tome kako se nalazi 1. kocka. Druga kost se može ili privući, ili obrnuto - odbiti (ako se "sreću" polovi istog imena), ili djelomično ili potpuno zanemariti 1. kocku.

Drugi primjer: pretpostavimo da su iste slot mašine ujedinjene u jednu mrežu, i - postoji sistem slučajnih varijabli - dobici na odgovarajućim mašinama. Ne znam da li je ova šema legalna, ali vlasnik hale za igre može lako da postavi mrežu na sledeći način: kada dođe do velikog dobitka na bilo kojoj mašini, zakoni distribucije dobitaka generalno na svim mašinama automatski se primenjuju promijeniti. Posebno je preporučljivo resetirati vjerovatnoće velikih dobitaka na neko vrijeme kako se institucija ne bi suočila s nedostatkom sredstava (u slučaju da neko iznenada ponovo dobije veliki dobitak). Dakle, razmatrani sistem će biti zavisan.

Kao demonstracijski primjer, uzmite špil od 8 karata, neka to budu kraljevi i dame, i jednostavnu igru ​​u kojoj dva igrača uzastopno (bez obzira kojim redoslijedom) izvlače jednu kartu iz špila. Uzmite u obzir slučajnu varijablu, koja simbolizira jednog igrača i uzima sljedeće vrijednosti: 1 , ako je izvukao kartu srca, i 0 - ako je karta druge boje.

Slično, neka slučajna varijabla simbolizira drugog igrača i također uzima vrijednosti 0 ili 1 ako nije nacrtao srce, odnosno srce.

je vjerovatnoća da će oba igrača izvući crva,

je vjerovatnoća suprotnog događaja, i:

- vjerovatnoća da će jedan izvući crva, a drugi - ne; ili obrnuto:

Dakle, zakon raspodjele vjerovatnoće zavisnog sistema je:

Kontrola: , što je trebalo provjeriti. ...Možda imate pitanje zašto razmišljam upravo o 8, a ne o 36 karata? Da, samo da razlomci ne budu tako glomazni.

Hajde da sada malo analiziramo rezultate. Ako zbrojimo vjerovatnoće red po red: , tada dobijamo tačno zakon raspodjele slučajne varijable :

Lako je shvatiti da ova raspodjela odgovara situaciji kada "X" igrač izvlači kartu sam, bez "G" druga, a njegov očekivanu vrijednost:
- jednaka je vjerovatnoći izvlačenja srca iz našeg špila.

Slično, ako zbrojimo vjerovatnoće po kolonama, tada dobijamo zakon raspodjele jedne igre drugog igrača:

sa istim ocekivanjem

Zbog "simetričnosti" pravila igre, ispostavilo se da su distribucije iste, ali su, u opštem slučaju, naravno različite.

Osim toga, korisno je razmotriti uslovni zakoni distribucije verovatnoće . Ovo je situacija u kojoj je jedna od slučajnih varijabli već poprimila određenu vrijednost, ili to pretpostavljamo hipotetički.

Neka igrač "igrač" prvo izvuče kartu i izvuče ne-srce. Vjerovatnoća ovog događaja je (zbroj vjerovatnoće u odnosu na prvi kolona stolovi - vidi gore). Zatim, iz istog teoreme množenja za vjerovatnoće zavisnih događaja dobijamo sledeće uslovne verovatnoće:
- vjerovatnoća da igrač "X" ne izvuče srce, pod uslovom da "igrač" ne izvuče srce;
- vjerovatnoća da igrač "X" nacrta srce, pod uslovom da igrač "igrač" nije nacrtao srce.

... svi se sećaju kako da se otarase četverokatne frakcije? I da, formalno, ali vrlo udobno tehničko pravilo za izračunavanje ovih vjerovatnoća: prva suma sve vjerovatnoće po kolona, a zatim podijelite svaku vjerovatnoću sa rezultujućim zbirom.

Dakle, na , uslovni zakon distribucije slučajne varijable biće napisan na sledeći način:

, UREDU. Izračunajmo uslovno matematičko očekivanje:

Sada nacrtajmo zakon raspodjele slučajne varijable pod uslovom da je slučajna varijabla uzela vrijednost , tj. Igrač "igrač" je izvukao kartu u obliku srca. Da bismo to učinili, sumiramo vjerovatnoće 2 kolona stolovi ( vidi gore): i izračunaj uslovne vjerovatnoće:
- činjenica da "X" igrač neće nacrtati crva,
- i crva.
Dakle, željeni zakon uslovne distribucije:

Kontrola: , i uslovno očekivanje:
- naravno, pokazalo se da je manje nego u prethodnom slučaju, pošto je igrač "igrač" smanjio broj srca u špilu.

"Ogledalo" način (rad sa redovima tabele) može se kompajlirati - zakon distribucije slučajne varijable, pod uslovom da je slučajna varijabla uzela vrijednost, i uslovna distribucija kada je "x" igrač uklonio crva. Lako je shvatiti da će se zbog "simetrije" igre dobiti iste distribucije i iste vrijednosti.

Za kontinuirane slučajne varijable uvesti iste koncepte. uslovne distribucije i matematička očekivanja, ali ako za njima nema vruće potrebe, onda je bolje nastaviti s učenjem ove lekcije.

U praksi, u većini slučajeva, biće vam ponuđen gotov zakon distribucije za sistem slučajnih varijabli:

Primjer 4

Dvodimenzionalna slučajna varijabla je data sopstvenim zakonom raspodjele vjerovatnoće:

... Hteo sam da razmotrim veći sto, ali sam odlučio da ne budem maničan, jer je najvažnije razumeti sam princip rešenja.

Obavezno:

1) Nacrtajte zakone raspodjele i izračunajte odgovarajuća matematička očekivanja. Donesite razuman zaključak o zavisnosti ili nezavisnosti slučajnih varijabli .

Ovo je zadatak koji morate riješiti sami! Podsjećam da u slučaju nezavisnosti SI, zakoni mora ispasti isto i poklapati se sa zakonom raspodjele slučajne varijable , a zakoni se moraju poklapati sa . Decimale, ko ne zna ili je zaboravio, zgodno je podijeliti ovako: .
Uzorak možete pogledati na dnu stranice.

2) Izračunajte koeficijent kovarijanse.

Prvo, pogledajmo sam pojam i odakle je uopće došao: kada slučajna varijabla poprimi različite vrijednosti, onda kažu da je varira, i kvantitativno mjerenje ovoga varijacije, kao što znate, je izraženo disperzija. Koristeći formulu za izračunavanje varijanse, kao i svojstva očekivanja i varijanse, lako je ustanoviti da:

odnosno, kada se dodaju dvije slučajne varijable, njihove varijanse se sumiraju i dodaje se dodatni pojam koji karakterizira varijacija zglobova ili uskoro - kovarijansa slučajne varijable.

kovarijansa ili korelacioni momenat - ovo je mjera varijacije zglobova slučajne varijable.

Oznaka: ili

Kovarijansa diskretnih slučajnih varijabli je definirana, sada ću "izraziti" :), kao matematičko očekivanje proizvoda linearna odstupanja ovih slučajnih varijabli iz odgovarajućih matematičkih očekivanja:

Ako je , onda slučajne varijable zavisan. Slikovito rečeno, vrijednost različita od nule nam govori o tome prirodno"odgovori" jednog SW na promjenu u drugom SW.

Kovarijansa se može izračunati na dva načina, ja ću pokriti oba.

Prvi metod. By definicija matematičkog očekivanja:

"Užasna" formula i nimalo strašne kalkulacije. Prvo, sastavljamo zakone distribucije slučajnih varijabli i - za to sumiramo vjerovatnoće po redovima ("X" vrijednost) i po kolonama (vrijednost "igre"):

Pogledajte originalnu gornju tabelu - da li svi razumiju kako su ispale distribucije? Compute očekivanja:
i odstupanja vrijednosti slučajnih varijabli iz odgovarajućih matematičkih očekivanja:

Pogodno je rezultujuća odstupanja smestiti u dvodimenzionalnu tabelu, unutar koje zatim prepisati verovatnoće iz originalne tabele:


Sada morate izračunati sve moguće proizvode, kao primjer, istaknuo sam: (crvena boja) i (plava boja). Pogodno je izvršiti proračune u Excelu i sve detaljno napisati na čistoj kopiji. Navikao sam da radim "red po red" s lijeva na desno, pa ću najprije navesti sve moguće proizvode sa "X" odstupanjem od -1,6, zatim sa odstupanjem od 0,4:

Metod dva, jednostavnije i češće. prema formuli:

Očekivanje proizvoda SW definira se kao a tehnički je sve vrlo jednostavno: uzimamo originalnu tabelu problema i pronalazimo sve moguće proizvode po odgovarajućim vjerovatnoćama; na donjoj slici, rad sam označio crvenom bojom i plavi proizvod:


Prvo ću navesti sve proizvode sa vrijednošću , zatim sa vrijednošću , ali vi, naravno, možete koristiti drugačiji redosljed nabrajanja - kako želite:

Vrijednosti su već izračunate (vidi metodu 1), a ostaje primijeniti formulu:

Kao što je gore navedeno, vrijednost kovarijanse različita od nule govori nam o ovisnosti slučajnih varijabli, a što je više modulo, više je ova zavisnost bliže na funkcionalan linearno zavisnosti. Jer se određuje putem linearnih devijacija.

Dakle, definicija se može preciznije formulisati:

kovarijansa je mjera linearno zavisnosti slučajnih varijabli.

Sa vrijednošću nula, sve je zanimljivije. Ako se ustanovi da , onda se slučajne varijable mogu pokazati kao i nezavisni i zavisni(jer zavisnost ne može biti samo linearna). Na ovaj način, ova činjenica se generalno ne može koristiti za potvrđivanje nezavisnosti SV!

Međutim, ako se zna da su nezavisni, onda . Ovo se može lako provjeriti analitički: budući da je za nezavisne slučajne varijable svojstvo ( pogledajte prethodnu lekciju), zatim prema formuli za izračunavanje kovarijanse:

Koje vrijednosti ovaj koeficijent može poprimiti? Koeficijent kovarijacije uzima vrijednosti koje ne prelaze modulo- i što je više, to je izraženije linearna zavisnost. I čini se da je sve u redu, ali postoji značajna neugodnost takve mjere:

Pretpostavimo da istražujemo dvodimenzionalna kontinuirana slučajna varijabla(priprema mentalno :)), čije se komponente mjere u centimetrima i dobijaju vrijednost . Usput, koja je dimenzija kovarijanse? Pošto, - centimetri, i - također centimetri, onda njihov proizvod i očekivanje ovog proizvoda – izraženo u kvadratnim centimetrima, tj. kovarijansa, kao i varijansa, jeste kvadratni vrijednost.

Sada pretpostavimo da je neko naučio isti sistem, ali nije koristio centimetre, već milimetre. Pošto je 1 cm = 10 mm, kovarijansa će se povećati 100 puta i biće jednaka !

Stoga je zgodno razmotriti normalizovano koeficijent kovarijanse koji bi nam dao istu vrijednost bez dimenzija. Ovaj koeficijent se zove, nastavljamo naš zadatak:

3) Koeficijent korelacije . Ili, preciznije, koeficijent linearne korelacije:

, gdje - standardne devijacije slučajne varijable.

Koeficijent korelacije bezdimenzionalni i uzima vrijednosti iz raspona:

(ako imate nešto drugo u praksi - potražite grešku).

Više modulo na jedinicu, što je bliži linearni odnos između vrijednosti, i što je bliži nuli, to je ta zavisnost manje izražena. Veza se smatra značajnom počevši od oko . Ekstremne vrijednosti odgovaraju strogoj funkcionalnoj ovisnosti, ali u praksi, naravno, ne postoje "idealni" slučajevi.

Zaista želim da navedem mnogo zanimljivih primjera, ali korelacija je relevantnija u kursu matematičke statistike i tako ću ih sačuvati za budućnost. Pa, hajde sada da pronađemo koeficijent korelacije u našem problemu. Dakle. Zakoni distribucije su već poznati, prepisaću odozgo:

Pronađene su očekivane vrijednosti: , i ostaje izračunati standardne devijacije. sign Neću to crtati, brže je izračunati linijom:

Kovarijansa pronađena u prethodnom paragrafu , i ostaje izračunati koeficijent korelacije:
, dakle, između vrijednosti postoji linearna ovisnost prosječne nepropusnosti.

Četvrti zadatak je opet tipičniji za zadatke matematičke statistike, ali za svaki slučaj razmotrite to ovdje:

4) Napišite jednadžbu linearne regresije za .

Jednačina linearna regresija je funkcija , koji najbolji način aproksimira vrijednosti slučajne varijable. Za najbolju aproksimaciju, obično se koristi metoda najmanjeg kvadrata, a zatim se koeficijenti regresije mogu izračunati po formulama:
, to su čuda, a 2. koeficijent:

Uslovni zakoni distribucije. Regresija.

Definicija. Uslovni zakon distribucije jedne od jednodimenzionalnih komponenti dvodimenzionalne slučajne varijable (X, Y) je njen zakon raspodjele, izračunat pod uslovom da je druga komponenta zauzela određenu vrijednost (ili upala u neki interval). U prethodnom predavanju razmatrano je pronalaženje uslovnih distribucija za diskretne slučajne varijable. Postoje i formule za uslovne vjerovatnoće:

U slučaju kontinuiranih slučajnih varijabli, potrebno je odrediti gustine vjerovatnoće uslovnih distribucija j y (x) i j X (y). U tom cilju, u gornjim formulama ćemo vjerovatnoće događaja zamijeniti njihovim "elementima vjerovatnoće",!

nakon smanjenja za dx i dy dobijamo:

one. uslovna gustina verovatnoće jedne od jednodimenzionalnih komponenti dvodimenzionalne slučajne varijable jednaka je odnosu njene zajedničke gustine i gustine verovatnoće druge komponente. Ovi omjeri su zapisani u obliku

nazivaju se teoremom (pravilom) množenja gustina raspodjele.

Uslovne gustine j y (x) i j X (y). imaju sva svojstva "bezuslovne" gustine.

Kada proučavamo dvodimenzionalne slučajne varijable, uzimamo u obzir numeričke karakteristike jednodimenzionalne komponente X i Y - matematička očekivanja i varijanse. Za kontinuiranu slučajnu varijablu (X, Y), one se određuju formulama:

Uz njih se razmatraju i numeričke karakteristike uslovnih distribucija: uslovna matematička očekivanja M x (Y) i M y (X) i uslovne varijanse D x (Y) i D Y (X). Ove karakteristike se nalaze uobičajenim formulama matematičkog očekivanja i disperzije, u kojima se koriste uslovne vjerovatnoće ili gustine uslovne vjerovatnoće umjesto vjerovatnoća događaja ili gustine vjerovatnoće.

Uslovno matematičko očekivanje slučajne varijable Y za X = x, tj. M x (Y), postoji funkcija od x, koja se naziva regresijska funkcija ili jednostavno regresija Y na X. Slično, M Y (X) se naziva regresijska funkcija ili jednostavno regresija X na Y. Grafovi ovih funkcija nazivaju se respektivno regresijske linije (ili regresijske krive) Y prema X ili X prema Y.

Zavisne i nezavisne slučajne varijable.

Definicija. Slučajne varijable X i Y nazivaju se nezavisnim ako je njihova zajednička funkcija raspodjele F(x,y) predstavljena kao proizvod funkcija raspodjele F 1 (x) i F 2 (y) ovih slučajnih varijabli, tj.

Inače, slučajne varijable X i Y se nazivaju zavisne.

Dvaput diferencirajući jednakost u odnosu na argumente x i y, dobijamo

one. za nezavisne kontinuirane slučajne varijable X i Y, njihova zajednička gustina j(x, y) jednaka je proizvodu gustina vjerovatnoće j 1 (x) i j 2 (y) ovih slučajnih varijabli.

Do sada smo se susreli sa konceptom funkcionalnog odnosa između varijabli X i Y, kada je svaka vrijednost x u jednoj varijabli odgovarala striktno definiranoj vrijednosti u drugoj. Na primjer, odnos između dvije slučajne varijable - broj neispravnih dijelova opreme za određenom periodu vrijeme i njihova cijena - funkcionalna.

Općenito, nailazi se na drugačiji tip zavisnosti, manje krut od funkcionalne zavisnosti.

Definicija. Odnos između dvije slučajne varijable naziva se probabilistički (stohastički ili statistički) ako svaka vrijednost jedne od njih odgovara određenoj (uslovnoj) raspodjeli druge.

U slučaju probabilističke (stohastičke) zavisnosti, nemoguće je, znajući vrijednost jedne od njih, precizno odrediti vrijednost druge, već možete samo naznačiti distribuciju druge vrijednosti. Na primjer, odnos između broja kvarova opreme i troškova njenog preventivnog održavanja, težine i visine osobe, vremena koje učenik provede na gledanju televizijskih programa i čitanju knjiga itd. su probabilistički (stohastički).

Na sl. 5.10 prikazuje primjere zavisnih i nezavisnih slučajnih varijabli X i Y.

Prilikom proučavanja sistema slučajnih varijabli uvijek treba obratiti pažnju na stepen i prirodu njihove zavisnosti. Ova zavisnost može biti manje ili više izražena, manje ili više bliska. U nekim slučajevima, odnos između slučajnih varijabli može biti toliko blizak da, znajući vrijednost jedne slučajne varijable, možete precizno naznačiti vrijednost druge. U drugom ekstremnom slučaju, zavisnost između slučajnih varijabli je toliko slaba i udaljena da se one praktično mogu smatrati nezavisnim.

Koncept nezavisnih slučajnih varijabli je jedan od važnih koncepata teorije vjerovatnoće.

Slučajna varijabla se naziva nezavisnom od slučajne varijable ako zakon raspodjele vrijednosti ne ovisi o tome koju je vrijednost zauzela.

Za kontinuirane slučajne varijable, uslov nezavisnosti od može se zapisati kao:

za bilo koji.

Naprotiv, ako zavisi od , onda

.

Dokažimo da je zavisnost ili nezavisnost slučajnih varijabli uvijek uzajamna: ako vrijednost ne zavisi od .

Zaista, neka ne zavisi od:

. (8.5.1)

Iz formula (8.4.4) i (8.4.5) imamo:

odakle, uzimajući u obzir (8.5.1), dobijamo:

Q.E.D.

Kako su zavisnost i nezavisnost slučajnih varijabli uvijek uzajamne, moguće je dati novu definiciju nezavisnih slučajnih varijabli.

Slučajne varijable i nazivaju se nezavisnim ako zakon raspodjele svake od njih ne ovisi o tome koju vrijednost je drugi uzeo. Inače, količine i nazivaju se zavisne.

Za nezavisne kontinuirane slučajne varijable, teorema množenja zakona distribucije ima oblik:

, (8.5.2)

tj. gustina distribucije sistema nezavisnih slučajnih varijabli jednaka je proizvodu gustine distribucije pojedinačnih varijabli uključenih u sistem.

Uslov (8.5.2) se može smatrati neophodnim i dovoljnim uslovom za nezavisnost slučajnih varijabli.

Često se po samom obliku funkcije može zaključiti da su slučajne varijable nezavisne, naime, ako se gustina distribucije podijeli na proizvod dvije funkcije, od kojih jedna ovisi samo o , druga samo o , tada je slučajna varijable su nezavisne.

Primjer. Gustina distribucije sistema ima oblik:

.

Odredite da li su slučajne varijable i zavisne ili nezavisne.

Rješenje. Rastavljajući imenilac na faktore, imamo:

.

Iz činjenice da se funkcija podijelila u proizvod dvije funkcije, od kojih jedna ovisi samo o, a druga samo o , zaključujemo da količine i moraju biti neovisne. Zaista, primjenom formula (8.4.2) i (8.4.3), imamo:

;

isto tako

,

kako da se u to uverimo

i stoga su količine i nezavisne.

Navedeni kriterijum za procenu zavisnosti ili nezavisnosti slučajnih varijabli zasniva se na pretpostavci da poznajemo zakon raspodele sistema. U praksi se često dešava obrnuto: zakon distribucije sistema nije poznat; poznati su samo zakoni distribucije pojedinačnih veličina uključenih u sistem, a postoji osnova vjerovati da su veličine i nezavisne. Tada je moguće zapisati gustinu distribucije sistema kao proizvod gustine distribucije pojedinačnih veličina uključenih u sistem.

Zaustavimo se detaljnije na važnim konceptima "zavisnosti" i "nezavisnosti" slučajnih varijabli.

Koncept "nezavisnosti" slučajnih varijabli, koji koristimo u teoriji vjerovatnoće, donekle se razlikuje od uobičajenog koncepta "zavisnosti" varijabli, kojim operišemo u matematici. Zaista, obično pod "ovisnošću" veličina podrazumijevaju samo jednu vrstu ovisnosti - potpunu, krutu, tzv. - funkcionalnu ovisnost. Dvije veličine i nazivaju se funkcionalno zavisne ako, znajući vrijednost jedne od njih, jedna može točno naznačiti vrijednost druge.

U teoriji vjerovatnoće susrećemo se sa još jednom, opštijom, vrstom zavisnosti – sa verovatnoćom ili „stohastičkom“ zavisnošću. Ako je vrijednost povezana sa vrijednošću vjerovatnoćom ovisnošću, tada je, znajući vrijednost, nemoguće odrediti tačnu vrijednost , već možete samo naznačiti njen zakon raspodjele, ovisno o tome koju vrijednost je vrijednost zauzela.

Vjerovatna zavisnost može biti manje ili više bliska; kako se stegnutost vjerovatnoće zavisnosti povećava, ona se sve više približava funkcionalnoj. Stoga se funkcionalna ovisnost može smatrati ekstremnim, graničnim slučajem najbliže vjerovatnoće zavisnosti. Drugi ekstremni slučaj je potpuna nezavisnost slučajnih varijabli. Između ova dva ekstremna slučaja leže sve gradacije vjerovatnoće zavisnosti - od najjače do najslabije. One fizičke veličine, koje u praksi smatramo funkcionalno zavisnim, zapravo su povezani vrlo bliskom vjerovatnoćom zavisnošću: za datu vrijednost jedne od ovih veličina, druga varira u tako uskim granicama da se praktično može smatrati sasvim određenom. S druge strane, one veličine koje smatramo nezavisnim u praksi i stvarnosti često su u nekoj međusobnoj zavisnosti, ali je ta zavisnost toliko slaba da se može zanemariti u praktične svrhe.

Vjerovatna ovisnost između slučajnih varijabli je vrlo česta u praksi. Ako su slučajne varijable i u probabilističkoj zavisnosti, to ne znači da se sa promjenom veličine veličina mijenja na potpuno određen način; to samo znači da kako se vrijednost mijenja, vrijednost također ima tendenciju promjene (na primjer, povećanje ili smanjenje s povećanjem). Ovaj trend se uočava samo "u prosjeku", u uopšteno govoreći, a u svakom pojedinačnom slučaju moguća su odstupanja od njega.

Razmotrimo, na primjer, dvije takve slučajne varijable: - visinu nasumično uzete osobe, - njegovu težinu. Očigledno je da su količine i u određenoj vjerovatnoj zavisnosti; izražava se u činjenici da, generalno, osobe veće visine imaju veću težinu. Čak je moguće napraviti empirijsku formulu koja ovu vjerovatnoću ovisnost približno zamjenjuje funkcionalnom. Takva je, na primjer, dobro poznata formula koja približno izražava odnos između visine i težine.