Variabla të rastësishme të varura dhe të pavarura

 Kur studiohen sistemet e variablave të rastësishëm, gjithmonë duhet t'i kushtohet vëmendje shkallës dhe natyrës së varësisë së tyre. Kjo varësi mund të jetë pak a shumë e theksuar, pak a shumë e afërt. Në disa raste, marrëdhënia midis ndryshoreve të rastësishme mund të jetë aq e ngushtë sa, duke ditur vlerën e një ndryshoreje të rastësishme, mund të tregoni me saktësi vlerën e një tjetri. Në rastin tjetër ekstrem, varësia ndërmjet variablave të rastësishëm është aq e dobët dhe e largët, saqë ato praktikisht mund të konsiderohen të pavarura.
 Koncepti i variablave të rastësishëm të pavarur është një nga konceptet e rëndësishme të teorisë së probabilitetit.
 Një ndryshore e rastësishme \(Y\) thuhet se është e pavarur nga ndryshorja e rastësishme \(X\) nëse ligji i shpërndarjes së vlerës \(Y\) nuk varet nga vlera e vlerës \(X\).
 Për variabla të rastësishme të vazhdueshme, kushti që \(Y\) është i pavarur nga \(X\) mund të shkruhet si: $$f(y\mid x)=f_(2)(y)$$ për çdo \(y \).
 Në të kundërtën, nëse \(Y\) varet nga \(X\), atëherë $$f(y\mid x) \neq f_(2)(y)$$  Ne vërtetojmë se varësia ose pavarësia e ndryshoreve të rastit është gjithmonë e ndërsjellë: nëse vlera \(Y\) nuk varet nga \(X\), atëherë vlera \(X\) nuk varet nga \(Y\).
 Në të vërtetë, le të jetë \(Y\) e pavarur nga \(X\): $$f(y\mid x)=f_(2)(y)$$ kemi: $$f_(1)(x)f( y \mid x)=f_(2)(y)f(x\mid y)$$ prej nga, marrim: $$f_(1)(x)=f(x\mid y)$$ që do të ishte vërtetuar.
 Meqenëse varësia dhe pavarësia e variablave të rastit janë gjithmonë të ndërsjella, mund të japim një përkufizim të ri të variablave të rastësishëm të pavarur.
  Ndryshoret e rastësishme \(X\) dhe \(Y\) quhen të pavarura nëse ligji i shpërndarjes së secilës prej tyre nuk varet nga vlera e tjetrit. Përndryshe, thirren madhësitë \(X\) dhe \(Y\). i varur.
 Për variabla të rastësishme të vazhdueshme të pavarura, teorema e shumëzimit të ligjit të shpërndarjes merr formën: $$f(x, y)=f_(1)(x)f_(2)(y)$$ d.m.th. dendësia e shpërndarjes së një sistemi të rastësishëm të pavarur variabla është e barabartë me produktin e shpërndarjes së densitetit të sasive individuale të përfshira në sistem.
Shpesh, nga vetë forma e funksionit \(f(x, y)\) mund të konkludohet se variablat e rastësishëm \(X, Y\) janë të pavarura, domethënë nëse densiteti i shpërndarjes \(f(x, y) \) zbërthen në produkt dy funksione, njëri prej të cilëve varet vetëm nga \(x\), tjetri vetëm nga \(y\), atëherë ndryshoret e rastësishme janë të pavarura.
Shembulli 1 Dendësia e shpërndarjes së sistemit \((X, Y)\) ka formën: $$f(x, y)=\frac(1)(\pi ^(2)(x^(2)+y^( 2)+x ^(2)y^(2)+1))$$ Përcaktoni nëse variablat e rastësishëm \(X\) dhe \(Y\) janë të varura apo të pavarura.
Zgjidhje. Duke faktorizuar emëruesin, kemi: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\frac(1)(\pi (y^(2)+1 ))$$ Nga fakti që funksioni \(f(x, y)\) është ndarë në një produkt të dy funksioneve, njëri prej të cilëve varet vetëm nga \(x\), dhe tjetri vetëm nga \(y\ ), konkludojmë se sasitë \(X\) dhe \(Y\) duhet të jenë të pavarura. Në të vërtetë, duke zbatuar formulat, kemi: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\int_(-\infty)^(\infty)(\ frac(dy)(\pi (y^(2)+1)))=\frac(1)(\pi (x^(2)+1))$$ e ngjashme me $$f(x, y)= (\frac (1)(\pi (y^(2)+1)))$$ nga ku sigurohemi që $$f(x, y)=f_(1)(x)f_(2)(y) $$ dhe, pra, sasitë \(X\) dhe \(Y\) janë të pavarura.

ngjarje të rastësishme quhen të pavarura nëse ndodhja e njërës prej tyre nuk ndikon në probabilitetin e ndodhjes së ngjarjeve të tjera.

Shembulli 1 . Nëse ka dy ose më shumë urna me topa me ngjyra, atëherë tërheqja e ndonjë topi nga një urnë nuk ndikon në probabilitetin e tërheqjes së topave të tjerë nga urnat e mbetura.

Për ngjarje të pavarura i drejtë teorema e shumëzimit të probabilitetit: bashkimi i probabilitetit(të njëkohshme)shfaqja e disa ngjarjeve të pavarura të rastësishme është e barabartë me produktin e probabiliteteve të tyre:

P (A 1 dhe A 2 dhe A 3 ... dhe A k) \u003d P (A 1) ∙ P (A 2) ∙ ... ∙ P (A k). (7)

Ndodhja e përbashkët (e njëkohshme) e ngjarjeve do të thotë se ndodhin ngjarje dhe A 1, dhe A 2, dhe A 3… dhe Dhe k.

Shembulli 2 . Ka dy urna. Njëra përmban 2 topa të zinj dhe 8 të bardhë, tjetri përmban 6 të zinj dhe 4 të bardhë. Lëreni ngjarjen POR- përzgjedhje e rastësishme e një topi të bardhë nga urna e parë, AT- nga e dyta. Sa është probabiliteti për të zgjedhur në mënyrë të rastësishme nga këto urna një top të bardhë, d.m.th. çfarë është e barabartë me R (POR dhe AT)?

Zgjidhja: probabiliteti për të nxjerrë një top të bardhë nga urna e parë
R(POR) = = 0,8 nga e dyta - R(AT) = = 0,4. Probabiliteti për të marrë një top të bardhë nga të dy urnat në të njëjtën kohë është
R(POR dhe AT) = R(PORR(AT) = 0,8∙ 0,4 = 0,32 = 32%.

Shembulli 3 Një dietë e reduktuar me jod shkakton zmadhimin e tiroides në 60% të kafshëve në një popullatë të madhe. Për eksperimentin nevojiten 4 gjëndra të zmadhuara. Gjeni probabilitetin që 4 kafshë të zgjedhura rastësisht të kenë një gjëndër tiroide të zmadhuar.

Zgjidhje:Ngjarje e rastësishme POR- një përzgjedhje e rastësishme e një kafshe me një gjëndër tiroide të zgjeruar. Sipas gjendjes së problemit, probabiliteti i kësaj ngjarjeje R(POR) = 0,6 = 60%. Atëherë probabiliteti i shfaqjes së përbashkët të katër ngjarjeve të pavarura - zgjedhja e rastësishme e 4 kafshëve me një gjëndër tiroide të zgjeruar - do të jetë e barabartë me:

R(POR 1 dhe POR 2 dhe POR 3 dhe POR 4) = 0,6 ∙ 0,6 ∙0,6 ∙ 0,6=(0,6) 4 ≈ 0,13 = 13%.

ngjarje të varura. Teorema e shumëzimit të probabilitetit për ngjarjet e varura

Ngjarjet e rastësishme A dhe B quhen të varura nëse ndodhja e njërës prej tyre, për shembull, A ndryshon probabilitetin e shfaqjes së ngjarjes tjetër - B. Prandaj, dy vlera probabiliteti përdoren për ngjarjet e varura: probabilitetet e pakushtëzuara dhe të kushtëzuara .

Nese nje POR dhe AT ngjarjet e varura, pastaj probabiliteti i ndodhjes së ngjarjes AT së pari (d.m.th. përpara ngjarjes POR) quhet probabiliteti i pakushtëzuar të kësaj ngjarjeje dhe është caktuar R(AT).Probabiliteti i ngjarjes AT me kusht që ngjarja POR tashmë ka ndodhur, quhet probabiliteti i kushtëzuar zhvillimet AT dhe shënohet R(AT/POR) ose R A(AT).

E pakushtëzuar - R(POR) dhe me kusht - R(A/B) probabilitetet për ngjarjen POR.

Teorema e shumëzimit të probabiliteteve për dy ngjarje të varura: probabiliteti i ndodhjes së njëkohshme të dy ngjarjeve të varura A dhe B është i barabartë me produktin e probabilitetit të pakushtëzuar të ngjarjes së parë nga probabiliteti i kushtëzuar i së dytës:

R(A dhe B)= P(POR)∙P(B/A) , (8)

POR, ose

R(A dhe B)= P(AT)∙P(A/B), (9)

nëse ngjarja ndodh e para AT.

Shembulli 1. Në një urnë ka 3 topa të zinj dhe 7 topa të bardhë. Gjeni probabilitetin që nga kjo urnë të nxirren një nga një 2 topa të bardhë (dhe topi i parë të mos kthehet në urnë).

Zgjidhje: probabiliteti i tërheqjes së topit të parë të bardhë (ngjarje POR) është e barabartë me 7/10. Pasi nxirret, në urnë mbeten 9 topa, 6 prej të cilëve janë të bardhë. Pastaj probabiliteti i shfaqjes së topit të dytë të bardhë (ngjarja AT) është e barabartë me R(AT/POR) = 6/9, dhe probabiliteti për të marrë dy topa të bardhë me radhë është

R(POR dhe AT) = R(POR)∙R(AT/POR) = = 0,47 = 47%.

Teorema e dhënë e shumëzimit të probabilitetit për ngjarjet e varura mund të përgjithësohet në çdo numër ngjarjesh. Në veçanti, për tre ngjarje, mik i lidhur me një shok:

R(POR dhe AT dhe NGA)= P(POR)∙ P(B/A)∙ P(C/AB). (10)

Shembulli 2. Në dy kopshte, ku secili frekuentohej nga 100 fëmijë, pati një shpërthim të një sëmundjeje infektive. Përqindja e rasteve është përkatësisht 1/5 dhe 1/4, dhe në institucionin e parë 70%, dhe në të dytin - 60% e rasteve janë fëmijë nën 3 vjeç. Një fëmijë zgjidhet rastësisht. Përcaktoni probabilitetin që:

1) fëmija i përzgjedhur i përket kopshtit të parë (ngjarje POR) dhe të sëmurë (ngjarje AT).

2) një fëmijë zgjidhet nga i dyti kopshti i fëmijëve(ngjarje NGA), i sëmurë (ngjarje D) dhe më të vjetër se 3 vjet (ngjarje E).

Zgjidhje. 1) probabiliteti i dëshiruar -

R(POR dhe AT) = R(POR) ∙ R(AT/POR) = = 0,1 = 10%.

2) probabiliteti i dëshiruar:

R(NGA dhe D dhe E) = R(NGA) ∙ R(D/C) ∙ R(E/CD) = = 5%.

Formula e Bayes

= (12)

Shembull 1. Gjatë ekzaminimit fillestar të pacientit supozohen 3 diagnoza H 1 , H 2 , H 3 . Probabilitetet e tyre, sipas mjekut, janë të shpërndara si më poshtë: R(H 1) = 0,5; R(H 2) = 0,17; R(H 3) = 0,33. Prandaj, diagnoza e parë duket paraprakisht më e mundshme. Për ta sqaruar atë, për shembull, përshkruhet një test gjaku, në të cilin pritet një rritje e ESR (ngjarja POR). Dihet paraprakisht (bazuar në rezultatet e hulumtimit) se probabilitetet e një rritje të ESR në sëmundjet e dyshuara janë të barabarta me:

R(POR/H 1) = 0,1; R(POR/H 2) = 0,2; R(POR/H 3) = 0,9.

Në analizën e marrë, u regjistrua një rritje në ESR (ngjarje POR ka ndodhur). Pastaj llogaritja sipas formulës Bayes (12) jep vlerat e probabiliteteve të sëmundjeve të supozuara me një vlerë të rritur ESR: R(H 1 /POR) = 0,13; R(H 2 /POR) = 0,09;
R(H 3 /POR) = 0,78. Këto shifra tregojnë se, duke marrë parasysh të dhënat laboratorike, jo diagnoza e parë, por e tretë, probabiliteti i së cilës tashmë ka rezultuar mjaft i lartë, është më realisti.

Shembulli 2. Përcaktoni probabilitetin që vlerëson shkallën e rrezikut të vdekjes perinatale* të një fëmije te gratë me legen anatomikisht të ngushtë.

Zgjidhje: le ngjarje H 1 - dorëzimi i sigurt. Sipas raporteve klinike, R(H 1) = 0,975 = 97,5%, atëherë nëse H 2- fakti i vdekshmërisë perinatale, pra R(H 2) = 1 – 0,975 = 0,025 = 2,5 %.

Shënoni POR- fakti i pranisë së një legeni të ngushtë në një grua në lindje. Nga studimet e kryera bëhet e ditur: a) R(POR/H 1) - probabiliteti i një legeni të ngushtë me lindje të favorshme, R(POR/H 1) = 0,029, b) R(POR/H 2) - probabiliteti i një legeni të ngushtë në vdekshmërinë perinatale,
R(POR/H 2) = 0,051. Pastaj probabiliteti i dëshiruar i vdekshmërisë perinatale në një legen të ngushtë në një grua në lindje llogaritet me formulën Bays (12) dhe është e barabartë me:

Kështu, rreziku i vdekshmërisë perinatale në legenin e ngushtë anatomik është dukshëm më i lartë (pothuajse dy herë) se rreziku mesatar (4.4% kundrejt 2.5%).

Asnjëri prej tyre nuk varet nga vlerat që kanë marrë (ose do të marrin variablat e tjerë të rastësishëm).

Për shembull, sistemi i lojës së dy zareve - është mjaft e qartë se rezultati i hedhjes së një zarare nuk ndikon në gjasat që fytyrat e një zarri tjetër të bien në asnjë mënyrë. Ose të njëjtat automat që funksionojnë në mënyrë të pavarur. Dhe, me siguri, disa kanë përshtypjen se çdo SV është e pavarur në përgjithësi. Megjithatë, kjo nuk është gjithmonë rasti.

Konsideroni të njëkohshme duke hedhur dy zare magnetike, polet e veriut të të cilëve janë në anën e faqes me 1 pikë dhe polet e jugut janë në faqen e kundërt me 6 pikë. A do të jenë të pavarur variablat e ngjashëm të rastësishëm? Po, do ta bëjnë. Mundësitë për të lënë "1" dhe "6" thjesht do të ulen dhe shanset e fytyrave të tjera do të rriten, sepse si rezultat i provës, kubet mund të tërhiqen nga pole të kundërta.

Tani merrni parasysh një sistem në të cilin zaret hidhen në mënyrë të njëpasnjëshme:

- numri i pikëve të mbështjellë në pullën e parë;

- numri i pikave të mbështjellë në kapelën e dytë, me kusht që ajo të hidhet gjithmonë në anën e djathtë (për shembull) të pullës së parë.

Në këtë rast, ligji i shpërndarjes së ndryshores së rastësishme varet se si ndodhet kubi i parë. Kocka e dytë ose mund të tërhiqet, ose anasjelltas - të rikthehet (nëse polet me të njëjtin emër "takohen"), ose pjesërisht ose plotësisht të injorojnë kubin e parë.

Shembulli i dytë: supozojmë se të njëjtat slot machines janë bashkuar në një rrjet të vetëm, dhe - ekziston një sistem variablash të rastësishëm - fitime në makinat përkatëse. Nuk e di nëse kjo skemë është e ligjshme, por pronari i sallës së lojërave mund ta konfigurojë lehtësisht rrjetin në mënyrën e mëposhtme: kur ndodh një fitore e madhe në çdo makinë, ligjet e shpërndarjes së fitimeve në të gjitha makinat ndryshojnë automatikisht. Në veçanti, këshillohet të rivendosni probabilitetet e fitimeve të mëdha për një kohë, në mënyrë që institucioni të mos përballet me mungesë fondesh (në rast se papritmas dikush fiton përsëri të mëdha). Kështu, sistemi i konsideruar do të jetë i varur.

Si shembull demonstrues, merrni parasysh një kuvertë me 8 letra, le të jenë mbretër dhe mbretëresha, dhe një lojë e thjeshtë në të cilën dy lojtarë radhazi (pa marrë parasysh se në çfarë radhe) nxjerrin një letër nga kuverta. Konsideroni një ndryshore të rastësishme, e cila simbolizon një lojtar dhe merr vlerat e mëposhtme: 1 , nëse ai tërhoqi një kartë zemre, dhe 0 - nëse karta është e një kostum tjetër.

Në mënyrë të ngjashme, lëreni variablin e rastësishëm të simbolizojë një lojtar tjetër dhe gjithashtu të marrë vlerat 0 ose 1 nëse ai nuk ka vizatuar respektivisht një zemër dhe një zemër.

është probabiliteti që të dy lojtarët të nxjerrin krimbin,

është probabiliteti i ngjarjes së kundërt dhe:

- probabiliteti që njëri do të nxjerrë krimbin, dhe tjetri - jo; ose anasjelltas:

Kështu, ligji i shpërndarjes së probabilitetit të sistemit të varur është:

Kontrolli: , e cila duhej të verifikohej. ...Ndoshta keni një pyetje, pse po konsideroj saktësisht 8, dhe jo 36 letra? Po, vetëm në mënyrë që fraksionet të mos jenë aq të rënda.

Tani le të analizojmë pak rezultatet. Nëse i mbledhim probabilitetet rresht pas rreshti: , atëherë marrim saktësisht ligjin e shpërndarjes së ndryshores së rastësishme:

Është e lehtë të kuptohet se kjo shpërndarje korrespondon me situatën kur lojtari "X" tërheq një kartë i vetëm, pa një shok "G" dhe vlera e pritur:
- është e barabartë me probabilitetin e nxjerrjes së zemrave nga kuverta jonë.

Në mënyrë të ngjashme, nëse përmbledhim probabilitetet sipas kolonave, atëherë marrim ligjin e shpërndarjes së një loje të vetme të lojtarit të dytë:

me të njëjtën pritshmëri

Për shkak të "simetrisë" së rregullave të lojës, shpërndarjet rezultuan të njëjta, por, në rastin e përgjithshëm, ato, natyrisht, janë të ndryshme.

Përveç kësaj, është e dobishme të merret parasysh ligjet e kushtëzuara të shpërndarjes së probabilitetit . Kjo është një situatë ku një nga variablat e rastësishëm ka marrë tashmë një vlerë specifike, ose ne e supozojmë këtë në mënyrë hipotetike.

Lëreni lojtarin "lojtar" të tërheqë fillimisht një kartë dhe jo një zemër. Probabiliteti i kësaj ngjarje është (shumoni probabilitetet mbi të parën kolonë tavolina - Shiko lart). Pastaj, nga e njëjta teoremat e shumëzimit për probabilitetet e ngjarjeve të varura marrim probabilitetet e kushtëzuara të mëposhtme:
- probabiliteti që lojtari "X" të mos vizatojë një zemër, me kusht që lojtari "duke luajtur" të mos tërheqë një zemër;
- probabiliteti që lojtari "X" të vizatojë një zemër, me kusht që lojtari "lojtar" të mos vizatojë një zemër.

... të gjithë kujtojnë se si të shpëtojnë thyesat katërkatëshe? Dhe po, formale por shumë komode rregull teknik për llogaritjen e këtyre probabiliteteve: shuma e parë të gjitha probabilitetet nga kolonë, dhe pastaj pjesëtoni çdo probabilitet me shumën që rezulton.

Kështu, në , ligji i kushtëzuar i shpërndarjes së një ndryshoreje të rastësishme do të shkruhet si më poshtë:

, NE RREGULL. Le të llogarisim pritshmërinë matematikore të kushtëzuar:

Tani le të hartojmë ligjin e shpërndarjes së një ndryshoreje të rastësishme me kushtin që ndryshorja e rastësishme të ketë marrë vlerën, d.m.th. Lojtari i “lojtarit” tërhoqi një karton të përshtatshëm për zemrën. Për ta bërë këtë, ne përmbledhim probabilitetet e 2-të kolonë tavolina ( Shiko lart): dhe llogaritni probabilitetet e kushtëzuara:
- fakti që lojtari "X" nuk do të tërheqë një krimb,
- dhe një krimb.
Kështu, ligji i dëshiruar i shpërndarjes së kushtëzuar:

Kontrolli: , dhe pritshmëria e kushtëzuar:
- sigurisht, doli të ishte më pak se në rastin e mëparshëm, pasi lojtari "lojtar" zvogëloi numrin e zemrave në kuvertë.

Mënyra "pasqyrë". (duke punuar me rreshtat e tabelës) mund të përpilohet - ligji i shpërndarjes së një ndryshoreje të rastësishme, me kusht që ndryshorja e rastësishme të ketë marrë vlerën, dhe shpërndarja e kushtëzuar kur lojtari "x" hoqi krimbin. Është e lehtë të kuptohet se për shkak të "simetrisë" së lojës, do të merren të njëjtat shpërndarje dhe të njëjtat vlera.

Për variabla të rastësishme të vazhdueshme prezantoni të njëjtat koncepte. shpërndarjet e kushtëzuara dhe pritjet matematikore, por nëse nuk ka nevojë të nxehtë për to, atëherë është më mirë të vazhdoni të studioni këtë mësim.

Në praktikë, në shumicën e rasteve, do t'ju ofrohet një ligj i gatshëm i shpërndarjes për një sistem variablash të rastësishëm:

Shembulli 4

Një ndryshore e rastësishme dydimensionale jepet nga ligji i vet i shpërndarjes së probabilitetit:

... Doja të konsideroja një tryezë më të madhe, por vendosa të mos isha maniak, sepse gjëja kryesore është të kuptoj vetë parimin e zgjidhjes.

Kërkohet:

1) Hartoni ligjet e shpërndarjes dhe llogaritni pritshmëritë përkatëse matematikore. Bëni një përfundim të arsyeshëm për varësinë ose pavarësinë e variablave të rastësishëm .

Kjo është një detyrë që duhet zgjidhur vetë! Ju kujtoj se në rastin e pavarësisë së NE, ligjet duhet të rezultojë të jetë i njëjtë dhe të përkojë me ligjin e shpërndarjes së një ndryshoreje të rastësishme, dhe ligjet duhet të përkojnë me . Dhjetoret, kush nuk di a harron, i leverdis te ndahet keshtu: .
Ju mund të shikoni mostrën në fund të faqes.

2) Llogaritni koeficientin e kovariancës.

Së pari, le të shohim vetë termin dhe nga ka ardhur fare: kur një ndryshore e rastësishme merr vlera të ndryshme, atëherë ata thonë se ajo ndryshon, dhe matjen sasiore të kësaj variacionet, siç e dini, është shprehur dispersion. Duke përdorur formulën për llogaritjen e variancës, si dhe vetitë e pritshmërisë dhe variancës, është e lehtë të përcaktohet se:

d.m.th., kur mblidhen dy ndryshore të rastësishme, variancat e tyre përmblidhen dhe shtohet një term shtesë që karakterizon variacion i përbashkët ose së shpejti - kovarianca variablat e rastësishëm.

kovarianca ose momenti i korrelacionit - kjo është masë e variacionit të përbashkët variablat e rastësishëm.

Emërtimi: ose

Kovarianca e variablave të rastësishme diskrete është përcaktuar, tani do të "shprehem" :), si pritshmëri matematikore e produktit devijimet lineare nga këto variabla të rastësishme nga pritshmëritë përkatëse matematikore:

Nëse , atëherë ndryshore të rastësishme i varur. Në mënyrë figurative, na tregon një vlerë jozero natyrore"përgjigjet" e një SW ndaj një ndryshimi në një tjetër SW.

Kovarianca mund të llogaritet në dy mënyra, unë do t'i mbuloj të dyja.

Metoda e parë. Nga përkufizimi i pritjes matematikore:

Një formulë “e tmerrshme” dhe llogaritje aspak të tmerrshme. Së pari, ne përpilojmë ligjet e shpërndarjes së variablave të rastësishëm dhe - për këtë ne përmbledhim probabilitetet mbi rreshtat (vlera "X") dhe sipas kolonave (vlera e "lojës"):

Hidhini një sy tabelës origjinale të sipërme - a e kuptojnë të gjithë se si dolën shpërndarjet? Llogaritni pritjet:
dhe devijimet vlerat e ndryshoreve të rastësishme nga pritshmëritë përkatëse matematikore:

Është e përshtatshme të vendosni devijimet që rezultojnë në një tabelë dy-dimensionale, brenda së cilës më pas rishkruani probabilitetet nga tabela origjinale:


Tani ju duhet të llogaritni të gjitha produktet e mundshme, si shembull, unë theksova: (Ngjyra e kuqe) dhe (Ngjyrë blu). Është i përshtatshëm për të kryer llogaritjet në Excel dhe për të shkruar gjithçka në detaje në një kopje të pastër. Jam mësuar të punoj "rresht pas rreshti" nga e majta në të djathtë, dhe për këtë arsye së pari do të rendis të gjitha produktet e mundshme me një devijim "X" prej -1.6, pastaj me një devijim prej 0.4:

Metoda dy, më e thjeshtë dhe më e zakonshme. Sipas formulës:

Pritshmëria e produktit SW është përcaktuar si dhe teknikisht gjithçka është shumë e thjeshtë: marrim tabelën origjinale të problemit dhe gjejmë të gjitha produktet e mundshme sipas probabiliteteve përkatëse; ne figuren e meposhtme vura ne dukje punen me te kuqe dhe produkti blu:


Së pari, unë do t'i rendis të gjitha produktet me vlerën , pastaj me vlerën , por ju, natyrisht, mund të përdorni një renditje të ndryshme të numërimit - siç preferoni:

Vlerat tashmë janë llogaritur (shih Metoda 1) dhe mbetet të zbatohet formula:

Siç u përmend më lart, vlera jozero e kovariancës na tregon për varësinë e variablave të rastësishëm dhe aq më shumë është modul, aq më shumë kjo varësi më afër te funksionale lineare varësitë. Sepse përcaktohet nëpërmjet devijimeve lineare.

Kështu, përkufizimi mund të formulohet më saktë:

kovariancaështë një masë lineare varësitë e ndryshoreve të rastit.

Me një vlerë zero, gjithçka është më interesante. Nëse vërtetohet se , atëherë variablat e rastësishëm mund të rezultojnë të jenë si të pavarur ashtu edhe të varur(sepse varësia mund të jetë jo vetëm lineare). Në këtë mënyrë, ky fakt në përgjithësi nuk mund të përdoret për të vërtetuar pavarësinë e SV-së!

Megjithatë, nëse dihet se ata janë të pavarur, atëherë . Kjo mund të verifikohet lehtësisht në mënyrë analitike: meqenëse për ndryshoret e pavarura të rastësishme vetia ( shih mësimin e mëparshëm), atëherë sipas formulës për llogaritjen e kovariancës:

Çfarë vlerash mund të marrë ky koeficient? Koeficienti i kovariancës merr vlera që nuk i kalojnë modul- dhe sa më shumë, aq më e theksuar varësia lineare. Dhe gjithçka duket të jetë në rregull, por ka një shqetësim të rëndësishëm të një mase të tillë:

Supozoni se ne eksplorojmë ndryshore e rastësishme e vazhdueshme dydimensionale(duke përgatitur mendërisht :)), përbërësit e të cilave maten në centimetra dhe morën vlerën . Meqë ra fjala, cili është dimensioni i kovariancës? Meqenëse, - centimetra, dhe - gjithashtu centimetra, atëherë produkti i tyre dhe pritshmëria e këtij produkti – shprehur në centimetra katrorë, d.m.th. kovarianca, si varianca, është kuadratike vlerë.

Tani supozoni se dikush mësoi të njëjtin sistem, por përdori jo centimetra, por milimetra. Meqenëse 1 cm = 10 mm, kovarianca do të rritet me 100 herë dhe do të jetë e barabartë me !

Prandaj, është e përshtatshme të merret parasysh normalizuar një koeficient kovariance që do të na jepte të njëjtën vlerë dhe pa dimension. Ky koeficient quhet, ne vazhdojmë detyrën tonë:

3) Koeficienti korrelacionet . Ose, më saktë, koeficienti linear i korrelacionit:

, ku - devijimet standarde variablat e rastësishëm.

Koeficienti i korrelacionit pa dimensione dhe merr vlera nga diapazoni:

(nëse keni diçka tjetër në praktikë - kërkoni një gabim).

Më shumë modul me unitetin, sa më afër të jetë marrëdhënia lineare midis vlerave dhe sa më afër zeros, aq më pak e theksuar është kjo varësi. Marrëdhënia konsiderohet e rëndësishme duke filluar nga rreth . Vlerat ekstreme korrespondojnë me një varësi të rreptë funksionale, por në praktikë, natyrisht, nuk ka raste "ideale".

Unë me të vërtetë dua të jap shumë shembuj interesantë, por korrelacioni është më i rëndësishëm në kurs statistika matematikore dhe kështu do t'i ruaj për të ardhmen. Epo, tani le të gjejmë koeficientin e korrelacionit në problemin tonë. Kështu që. Ligjet e shpërndarjes tashmë janë të njohura, unë do të kopjoj nga lart:

Pritjet janë gjetur: , dhe mbetet për të llogaritur devijimet standarde. shenjë Unë nuk do ta përpiloj, është më e shpejtë për të llogaritur me vijën:

Kovarianca e gjetur në paragrafin e mëparshëm , dhe mbetet për të llogaritur koeficientin e korrelacionit:
, pra, midis vlerave ekziston një varësi lineare e ngushtësisë mesatare.

Detyra e katërt është përsëri më tipike për detyrat statistika matematikore, por për çdo rast, merrni parasysh këtu:

4) Shkruani një ekuacion të regresionit linear për .

Ekuacioni regresionit linear është një funksion , e cila menyra me e mire përafron vlerat e ndryshores së rastësishme. Për përafrimin më të mirë, zakonisht përdoret metoda më e vogël e katrorit, dhe më pas koeficientët e regresionit mund të llogariten me formula:
, këto janë mrekulli, dhe koeficienti i dytë:

Ligjet e kushtëzuara të shpërndarjes. Regresioni.

Përkufizimi. Ligji i shpërndarjes së kushtëzuar të njërit prej përbërësve njëdimensionale të një ndryshoreje të rastësishme dydimensionale (X, Y) është ligji i shpërndarjes së tij, i llogaritur me kushtin që komponenti tjetër të marrë një vlerë të caktuar (ose të bjerë në një interval). Në leksionin e mëparshëm, u mor në konsideratë gjetja e shpërndarjeve të kushtëzuara për variabla diskrete të rastësishme. Ekzistojnë gjithashtu formula për probabilitetet e kushtëzuara:

Në rastin e ndryshoreve të rastësishme të vazhdueshme, është e nevojshme të përcaktohen densitetet e probabilitetit të shpërndarjeve të kushtëzuara j y (x) dhe j X (y). Për këtë qëllim, në formulat e mësipërme, ne do të zëvendësojmë probabilitetet e ngjarjeve me "elementet e probabilitetit" të tyre!

pas reduktimit me dx dhe dy marrim:

ato. dendësia e probabilitetit të kushtëzuar të njërit prej përbërësve njëdimensionale të një ndryshoreje të rastësishme dydimensionale është e barabartë me raportin e densitetit të bashkimit të tij me densitetin e probabilitetit të komponentit tjetër. Këto raporte shkruhen në formë

quhen teorema (rregulla) e shumëzimit të densiteteve të shpërndarjes.

Dendësitë e kushtëzuara j y (x) dhe j X (y). kanë të gjitha vetitë e densitetit "të pakushtëzuar".

Kur studiojmë variablat e rastësishëm dydimensionale, marrim parasysh karakteristikat numerike komponentët njëdimensionale X dhe Y - pritjet dhe variancat matematikore. Për një ndryshore të rastësishme të vazhdueshme (X, Y), ato përcaktohen nga formula:

Krahas tyre merren parasysh edhe karakteristikat numerike të shpërndarjeve të kushtëzuara: pritjet matematikore të kushtëzuara M x (Y) dhe M y (X) dhe variancat e kushtëzuara D x (Y) dhe D Y (X). Këto karakteristika gjenden nga formulat e zakonshme të pritjes dhe variancës matematikore, në të cilat probabilitetet e kushtëzuara ose densitetet e probabilitetit të kushtëzuar përdoren në vend të probabiliteteve të ngjarjeve ose densiteteve të probabilitetit.

Pritshmëria matematikore e kushtëzuar e një ndryshoreje të rastësishme Y për X = x, d.m.th. M x (Y), ekziston një funksion i x, i quajtur funksioni i regresionit ose thjesht regresioni Y në X. Në mënyrë të ngjashme, M Y (X) quhet funksion i regresionit ose thjesht regresion X në Y. Grafikët e këtyre funksioneve quhen përkatësisht vijat e regresionit (ose kurbat e regresionit) Y nga X ose X nga Y.

Variabla të rastësishme të varura dhe të pavarura.

Përkufizimi. Variablat e rastësishëm X dhe Y quhen të pavarur nëse funksioni i tyre i përbashkët i shpërndarjes F(x,y) paraqitet si produkt i funksioneve të shpërndarjes F 1 (x) dhe F 2 (y) të këtyre ndryshoreve të rastit, d.m.th.

Përndryshe, ndryshoret e rastësishme X dhe Y quhen të varura.

Duke e diferencuar barazinë dy herë në lidhje me argumentet x dhe y, marrim

ato. për ndryshoret e rastësishme të pavarura të vazhdueshme X dhe Y, dendësia e tyre e përbashkët j(x, y) është e barabartë me produktin e densitetit të probabilitetit j 1 (x) dhe j 2 (y) të këtyre ndryshoreve të rastit.

Deri më tani, ne kemi hasur në konceptin e një marrëdhënie funksionale midis ndryshoreve X dhe Y, kur secila vlerë e x në një variabël korrespondonte me një vlerë të përcaktuar rreptësisht në tjetrën. Për shembull, marrëdhënia midis dy ndryshoreve të rastësishme - numri i pjesëve të dështuara të pajisjeve për periudhë të caktuar koha dhe kostoja e tyre - funksionale.

Në përgjithësi, ndeshet një lloj tjetër varësie, më pak e ngurtë se varësia funksionale.

Përkufizimi. Marrëdhënia midis dy ndryshoreve të rastësishme quhet probabiliste (stokastike ose statistikore) nëse secila vlerë e njërës prej tyre korrespondon me një shpërndarje të caktuar (të kushtëzuar) të tjetrës.

Në rastin e një varësie probabiliste (stokastike), është e pamundur, duke ditur vlerën e njërës prej tyre, të përcaktohet me saktësi vlera e tjetrës, por ju mund të tregoni vetëm shpërndarjen e vlerës tjetër. Për shembull, marrëdhënia midis numrit të dështimeve të pajisjeve dhe kostos së mirëmbajtjes së saj parandaluese, peshës dhe gjatësisë së një personi, kohës së kaluar nga një nxënës i shkollës për të parë programe televizive dhe për të lexuar libra, etj. janë probabiliste (stokastike).

Në fig. 5.10 tregon shembuj të ndryshoreve të rastësishme të varura dhe të pavarura X dhe Y.

Kur studiohen sistemet e variablave të rastësishëm, gjithmonë duhet t'i kushtohet vëmendje shkallës dhe natyrës së varësisë së tyre. Kjo varësi mund të jetë pak a shumë e theksuar, pak a shumë e afërt. Në disa raste, marrëdhënia midis ndryshoreve të rastësishme mund të jetë aq e ngushtë sa, duke ditur vlerën e një ndryshoreje të rastësishme, mund të tregoni me saktësi vlerën e një tjetri. Në rastin tjetër ekstrem, varësia ndërmjet variablave të rastësishëm është aq e dobët dhe e largët, saqë ato praktikisht mund të konsiderohen të pavarura.

Koncepti i variablave të pavarur të rastësishëm është një nga konceptet e rëndësishme të teorisë së probabilitetit.

Një ndryshore e rastësishme quhet e pavarur nga një ndryshore e rastësishme nëse ligji i shpërndarjes së vlerës nuk varet nga ajo vlerë që ka marrë vlera.

Për variablat e rastësishme të vazhdueshme, kushti i pavarësisë nga mund të shkruhet si:

për çdo.

Përkundrazi, nëse varet nga , atëherë

.

Le të vërtetojmë se varësia ose pavarësia e ndryshoreve të rastit është gjithmonë e ndërsjellë: nëse vlera nuk varet nga .

Në të vërtetë, le të mos varet nga:

. (8.5.1)

Nga formulat (8.4.4) dhe (8.4.5) kemi:

prej nga, duke marrë parasysh (8.5.1), marrim:

Q.E.D.

Meqenëse varësia dhe pavarësia e variablave të rastit janë gjithmonë të ndërsjella, është e mundur të jepet një përkufizim i ri i variablave të rastësishëm të pavarur.

Ndryshoret e rastësishme dhe quhen të pavarura nëse ligji i shpërndarjes së secilës prej tyre nuk varet nga ajo vlerë që ka marrë tjetri. Përndryshe, sasitë dhe quhen të varura.

Për variabla të rastësishme të vazhdueshme të pavarura, teorema e shumëzimit të ligjit të shpërndarjes merr formën:

, (8.5.2)

d.m.th., dendësia e shpërndarjes së një sistemi variablash të rastësishëm të pavarur është e barabartë me produktin e densitetit të shpërndarjes së variablave individualë të përfshirë në sistem.

Kushti (8.5.2) mund të konsiderohet si një kusht i domosdoshëm dhe i mjaftueshëm për pavarësinë e variablave të rastit.

Shpesh, nga vetë forma e funksionit, mund të konkludohet se variablat e rastësishëm janë të pavarura, domethënë, nëse dendësia e shpërndarjes ndahet në produktin e dy funksioneve, njëri prej të cilëve varet vetëm nga , tjetri vetëm nga , atëherë i rastësishëm variablat janë të pavarur.

Shembull. Dendësia e shpërndarjes së sistemit ka formën:

.

Përcaktoni nëse variablat e rastësishëm dhe janë të varur apo të pavarur.

Zgjidhje. Duke faktorizuar emëruesin, kemi:

.

Nga fakti që funksioni zbërthehet në produkt të dy funksioneve, njëri prej të cilëve varet vetëm nga dhe tjetri vetëm nga , arrijmë në përfundimin se sasitë dhe duhet të jenë të pavarura. Në të vërtetë, duke aplikuar formulat (8.4.2) dhe (8.4.3), kemi:

;

po ashtu

,

si të sigurohemi që

dhe prandaj sasitë dhe janë të pavarura.

Kriteri i mësipërm për të gjykuar varësinë ose pavarësinë e variablave të rastësishëm bazohet në supozimin se ne e dimë ligjin e shpërndarjes së sistemit. Në praktikë, shpesh ndodh e kundërta: ligji i shpërndarjes së sistemit nuk dihet; janë të njohura vetëm ligjet e shpërndarjes së sasive individuale të përfshira në sistem, dhe ka arsye për të besuar se sasitë dhe janë të pavarura. Pastaj është e mundur të shkruhet dendësia e shpërndarjes së sistemit si produkt i densitetit të shpërndarjes së sasive individuale të përfshira në sistem.

Le të ndalemi më në detaje në konceptet e rëndësishme të "varësisë" dhe "pavarësisë" së variablave të rastit.

Koncepti i "pavarësisë" së variablave të rastësishëm, të cilin e përdorim në teorinë e probabilitetit, është disi i ndryshëm nga koncepti i zakonshëm i "varësisë" së variablave, të cilin e operojmë në matematikë. Në të vërtetë, zakonisht nën "varësinë" e sasive nënkuptojnë vetëm një lloj varësie - një varësi të plotë, të ngurtë, të ashtuquajtur - funksionale. Dy sasi dhe quhen të varura funksionalisht nëse, duke ditur vlerën e njërës prej tyre, njëra mund të tregojë me saktësi vlerën e tjetrës.

Në teorinë e probabilitetit, hasim një lloj tjetër varësie, më të përgjithshme - me një varësi probabiliste ose "stokastike". Nëse vlera lidhet me vlerën nga një varësi probabilistike, atëherë, duke ditur vlerën, është e pamundur të specifikoni vlerën e saktë të , por ju mund të tregoni vetëm ligjin e shpërndarjes së saj, në varësi të asaj vlere që ka marrë vlera.

Varësia probabiliste mund të jetë pak a shumë e afërt; me rritjen e ngushtësisë së varësisë probabilistike, ajo i afrohet gjithnjë e më shumë asaj funksionale. Kështu, varësia funksionale mund të konsiderohet si një rast ekstrem, kufizues i varësisë më të afërt probabilistike. Një rast tjetër ekstrem është pavarësia e plotë e variablave të rastësishëm. Midis këtyre dy rasteve ekstreme qëndrojnë të gjitha shkallëzimet e varësisë probabiliste - nga më e forta tek më e dobëta. Ato sasive fizike, të cilat në praktikë i konsiderojmë të varura funksionalisht, në fakt lidhen nga një varësi probabilistike shumë e ngushtë: për një vlerë të caktuar të njërës prej këtyre sasive, tjetra ndryshon brenda kufijve aq të ngushtë sa që praktikisht mund të konsiderohet mjaft e përcaktuar. Nga ana tjetër, ato sasi që ne i konsiderojmë të pavarura në praktikë dhe realitet janë shpesh në njëfarë varësie reciproke, por kjo varësi është aq e dobët sa mund të neglizhohet për qëllime praktike.

Varësia probabilistike ndërmjet variablave të rastit është shumë e zakonshme në praktikë. Nëse variablat e rastësishëm dhe janë në një varësi probabilistike, kjo nuk do të thotë se me një ndryshim në madhësi, madhësia ndryshon në një mënyrë plotësisht të përcaktuar; do të thotë vetëm se me ndryshimin e vlerës, edhe vlera tenton të ndryshojë (për shembull, rritet ose ulet me rritjen ). Ky trend vërehet vetëm "mesatarisht", në në terma të përgjithshëm, dhe në secilin rast individual, devijimet prej tij janë të mundshme.

Konsideroni, për shembull, dy variabla të tillë të rastësishëm: - gjatësinë e një personi të marrë rastësisht, - peshën e tij. Natyrisht, sasitë dhe janë në një varësi të caktuar probabiliste; shprehet në faktin se në përgjithësi personat me gjatësi më të madhe kanë më shumë peshë. Madje është e mundur të bëhet një formulë empirike që përafërsisht zëvendëson këtë varësi probabilistike me një funksionale. E tillë, për shembull, është formula e njohur që përafërsisht shpreh marrëdhënien ndërmjet gjatësisë dhe peshës.