Vlera e sasisë së varur. Variabla të rastësishme të pavarura. Veprimet në ndryshore të rastësishme. Ligjet e kushtëzuara të shpërndarjes. Regresioni

Variabla të rastësishme të varura dhe të pavarura

Kur studiohen sistemet e variablave të rastësishëm, gjithmonë duhet t'i kushtohet vëmendje shkallës dhe natyrës së varësisë së tyre. Kjo varësi mund të jetë pak a shumë e theksuar, pak a shumë e afërt. Në disa raste, marrëdhënia ndërmjet variablat e rastësishëm mund të jetë aq afër sa, duke ditur vlerën e një ndryshoreje të rastësishme, mund të tregoni me saktësi vlerën e një tjetri. Në rastin tjetër ekstrem, varësia ndërmjet variablave të rastësishëm është aq e dobët dhe e largët, saqë ato praktikisht mund të konsiderohen të pavarura.
Koncepti i variablave të rastësishëm të pavarur është një nga konceptet e rëndësishme të teorisë së probabilitetit.
Një ndryshore e rastësishme $Y$ thuhet se është e pavarur nga ndryshorja e rastësishme $X$ nëse ligji i shpërndarjes së vlerës $Y$ nuk varet nga vlera e vlerës $X$.
Për variabla të rastësishme të vazhdueshme, kushti që $Y$ është i pavarur nga $X$ mund të shkruhet si: $$f(y\mid x)=f_(2)(y)$$ për çdo $y $.
Në të kundërtën, nëse $Y$ varet nga $X$, atëherë $$f(y\mid x) \neq f_(2)(y)$$ Ne vërtetojmë se varësia ose pavarësia e ndryshoreve të rastit është gjithmonë e ndërsjellë: nëse vlera $Y$ nuk varet nga $X$, atëherë vlera $X$ nuk varet nga $Y$.
Në të vërtetë, le të jetë $Y$ e pavarur nga $X$: $$f(y\mid x)=f_(2)(y)$$ kemi: $$f_(1)(x)f( y \mid x)=f_(2)(y)f(x\mid y)$$ prej nga, marrim: $$f_(1)(x)=f(x\mid y)$$ që do të ishte vërtetuar.
Meqenëse varësia dhe pavarësia e variablave të rastit janë gjithmonë të ndërsjella, mund të japim një përkufizim të ri të variablave të rastësishëm të pavarur.
Ndryshoret e rastësishme $X$ dhe $Y$ quhen të pavarura nëse ligji i shpërndarjes së secilës prej tyre nuk varet nga vlera e tjetrit. Përndryshe, thirren madhësitë $X$ dhe $Y$. i varur.
Për variabla të rastësishme të vazhdueshme të pavarura, teorema e shumëzimit të ligjit të shpërndarjes merr formën: $$f(x, y)=f_(1)(x)f_(2)(y)$$ d.m.th. dendësia e shpërndarjes së një sistemi të rastësishëm të pavarur variabla është e barabartë me produktin e shpërndarjes së densitetit të sasive individuale të përfshira në sistem.
Shpesh, nga vetë forma e funksionit $f(x, y)$ mund të konkludohet se variablat e rastësishëm $X, Y$ janë të pavarura, domethënë nëse densiteti i shpërndarjes $f(x, y) $ zbërthen në produkt dy funksione, njëri prej të cilëve varet vetëm nga $x$, tjetri vetëm nga $y$, atëherë ndryshoret e rastësishme janë të pavarura.
Shembulli 1 Dendësia e shpërndarjes së sistemit $(X, Y)$ ka formën: $$f(x, y)=\frac(1)(\pi ^(2)(x^(2)+y^( 2)+x ^(2)y^(2)+1))$$ Përcaktoni nëse variablat e rastësishëm $X$ dhe $Y$ janë të varura apo të pavarura.
Zgjidhje. Duke faktorizuar emëruesin, kemi: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\frac(1)(\pi (y^(2)+1 ))$$ Nga fakti që funksioni $f(x, y)$ është ndarë në një produkt të dy funksioneve, njëri prej të cilëve varet vetëm nga $x$, dhe tjetri vetëm nga $y\ ), konkludojmë se sasitë \(X$ dhe $Y$ duhet të jenë të pavarura. Në të vërtetë, duke zbatuar formulat, kemi: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\int_(-\infty)^(\infty)(\ frac(dy)(\pi (y^(2)+1)))=\frac(1)(\pi (x^(2)+1))$$ e ngjashme me $$f(x, y)= (\frac (1)(\pi (y^(2)+1)))$$ nga ku sigurohemi që $$f(x, y)=f_(1)(x)f_(2)(y) $$ dhe, pra, sasitë $X$ dhe $Y$ janë të pavarura.

Dy ndryshore të rastësishme $X$ dhe $Y$ quhen të pavarura nëse ligji i shpërndarjes së një ndryshoreje të rastësishme nuk ndryshon në varësi të vlerave të mundshme që merr ndryshorja tjetër e rastësishme. Kjo do të thotë, për çdo $x$ dhe $y$, ngjarjet $X=x$ dhe $Y=y$ janë të pavarura. Meqenëse ngjarjet $X=x$ dhe $Y=y$ janë të pavarura, nga produkti i teoremës së probabiliteteve ngjarje të pavarura$P\left(\majtas(X=x\djathtas)\majtas(Y=y\djathtas)\djathtas)=P\majtas(X=x\djathtas)P\majtas(Y=y\djathtas)$.

Shembulli 1 . Lëreni variablin e rastësishëm $X$ të shprehë fitimet e parave nga biletat e një llotarie "Lotto Ruse", dhe ndryshorja e rastësishme $Y$ të shprehë fitimet e parave nga biletat e një llotarie tjetër "Çelësi i Artë". Është e qartë se variablat e rastësishëm $X,\Y$ do të jenë të pavarura, pasi fitimet nga biletat e një llotarie nuk varen nga ligji i shpërndarjes së fitimeve nga biletat e një llotarie tjetër. Në rastin kur variablat e rastësishëm $X,\ Y$ do të shprehnin fitimet në të njëjtën llotari, atëherë, padyshim, këto variabla të rastit do të vareshin.

Shembulli 2 . Dy punëtorë punojnë në punishte të ndryshme dhe prodhojnë produkte të ndryshme që nuk kanë lidhje me njëra-tjetrën nga teknologjitë e prodhimit dhe lëndët e para të përdorura. Ligji i shpërndarjes së numrit të produkteve me defekt të prodhuara nga punëtori i parë për ndërrim ka formën e mëposhtme:

$\begin(array)(|c|c|)
\hline
Numri i \ produkteve me defekt \ x & 0 & 1 \\
\hline
Probabiliteti & 0,8 & 0,2 \\
\hline
\fund (arresë)$

Numri i produkteve me defekt të prodhuara nga punëtori i dytë për ndërrim i nënshtrohet ligjit të mëposhtëm të shpërndarjes.

$\begin(array)(|c|c|)
\hline
Numri i \ produkteve me defekt \ y & 0 & 1 \\
\hline
Probabiliteti & 0,7 & 0,3 \\
\hline
\fund (arresë)$

Le të gjejmë ligjin e shpërndarjes së numrit të produkteve me defekt të bëra nga dy punëtorë për ndërrim.

Le të jetë ndryshorja e rastësishme $X$ numri i artikujve me defekt të prodhuar nga punëtori i parë për ndërrim dhe $Y$ numri i artikujve me defekt të prodhuar nga punëtori i dytë për ndërrim. Sipas supozimit, variablat e rastësishëm $X,\ Y$ janë të pavarura.

Numri i artikujve me defekt të prodhuar nga dy punëtorë për ndërrim është një ndryshore e rastësishme $X+Y$. Vlerat e tij të mundshme janë 0, 1$ dhe 2$. Le të gjejmë probabilitetet me të cilat ndryshorja e rastësishme $X+Y$ merr vlerat e saj.

$P\majtas(X+Y=0\djathtas)=P\majtas(X=0,\ Y=0\djathtas)=P\majtas(X=0\djathtas)P\majtas(Y=0\djathtas) =0.8\cdot 0.7=0.56.$

$P\majtas(X+Y=1\djathtas)=P\majtas(X=0,\ Y=1\ ose\ X=1,\ Y=0\djathtas)=P\majtas(X=0\djathtas )P\majtas(Y=1\djathtas)+P\majtas(X=1\djathtas)P\majtas(Y=0\djathtas)=0,8\cdot 0,3+0,2\cdot 0,7 =0,38.$

$P\majtas(X+Y=2\djathtas)=P\majtas(X=1,\ Y=1\djathtas)=P\majtas(X=1\djathtas)P\majtas(Y=1\djathtas) =0.2\cdot 0.3=0.06.$

Pastaj ligji i shpërndarjes së numrit të produkteve me defekt të prodhuara nga dy punëtorë për ndërrim:

$\begin(array)(|c|c|)
\hline
Numri i \ artikujve me defekt & 0 & 1 & 2 \\
\hline
Probabiliteti & 0,56 & 0,38 & 0,06 \\
\hline
\fund (arresë)$

Në shembullin e mëparshëm, ne kryem një operacion mbi variablat e rastësishëm $X,\ Y$, domethënë, gjetëm shumën e tyre $X+Y$. Le të japim tani një përkufizim më rigoroz të veprimeve (mbledhje, diferencë, shumëzim) në ndryshore të rastësishme dhe të japim shembuj zgjidhjesh.

Përkufizimi 1. Produkti $kX$ i ndryshores së rastësishme $X$ nga vlerë konstante$k$ është një ndryshore e rastësishme që merr vlerat $kx_i$ me të njëjtat probabilitete $p_i$ $\left(i=1,\ 2,\ \dots,\ n\djathtas)$.

Përkufizimi 2. Shuma (ndryshimi ose produkti) i variablave të rastësishëm $X$ dhe $Y$ është një ndryshore e rastësishme që merr të gjitha vlerat e mundshme të formës $x_i+y_j$ ($x_i-y_i$ ose $x_i\cdot y_i$) , ku $i=1 ,\ 2,\dots ,\ n$, me probabilitete $p_(ij)$ që ndryshorja e rastësishme $X$ të marrë vlerën $x_i$ dhe $Y$ vlerën $y_j$:

$$p_(ij)=P\majtas[\majtas(X=x_i\djathtas)\majtas(Y=y_j\djathtas)\djathtas].$$

Meqenëse variablat e rastësishëm $X,\ Y$ janë të pavarura, atëherë nga teorema e shumëzimit të probabilitetit për ngjarje të pavarura: $p_(ij)=P\left(X=x_i\right)\cdot P\left(Y=y_j\right )= p_i\cdot p_j$.

Shembulli 3 . Variablat e pavarur të rastësishëm $X,\ Y$ jepen nga ligjet e tyre të shpërndarjes së probabilitetit.

$\begin(array)(|c|c|)
\hline
x_i & -8 & 2 & 3 \\
\hline
p_i & 0.4 & 0.1 & 0.5 \\
\hline
\fund (arresë)$

$\begin(array)(|c|c|)
\hline
y_i & 2 & 8 \\
\hline
p_i & 0.3 & 0.7 \\
\hline
\fund (arresë)$

Le të hartojmë ligjin e shpërndarjes së ndryshores së rastësishme $Z=2X+Y$. Shuma e ndryshoreve të rastësishme $X$ dhe $Y$, d.m.th. $X+Y$, është një variabël e rastësishme që merr të gjitha vlerat e mundshme të formës $x_i+y_j$, ku $i=1,\ 2,\ pika ,\ n$ , me probabilitete $p_(ij)$ që ndryshorja e rastësishme $X$ të marrë vlerën $x_i$ dhe $Y$ vlerën $y_j$: $p_(ij)=P\left[\left( X=x_i\djathtas )\majtas(Y=y_j\djathtas)\djathtas]$. Meqenëse variablat e rastësishëm $X,\ Y$ janë të pavarura, atëherë nga teorema e shumëzimit të probabilitetit për ngjarje të pavarura: $p_(ij)=P\left(X=x_i\right)\cdot P\left(Y=y_j\right )= p_i\cdot p_j$.

Pra, ka ligjet e shpërndarjes për variablat e rastësishëm $2X$ dhe $Y$, respektivisht.

$\begin(array)(|c|c|)
\hline
x_i & -16 & 4 & 6 \\
\hline
p_i & 0.4 & 0.1 & 0.5 \\
\hline
\fund (arresë)$

$\begin(array)(|c|c|)
\hline
y_i & 2 & 8 \\
\hline
p_i & 0.3 & 0.7 \\
\hline
\fund (arresë)$

Për lehtësinë e gjetjes së të gjitha vlerave të shumës $Z=2X+Y$ dhe probabiliteteve të tyre, ne do të përpilojmë një tabelë ndihmëse, në secilën qelizë të së cilës do të vendosim në këndin e majtë vlerat e shumës $. Z=2X+Y$, dhe në këndin e djathtë - probabilitetet e këtyre vlerave janë marrë si rezultat i shumëzimit të probabiliteteve të vlerave përkatëse të variablave të rastësishëm $2X$ dhe $Y$.

Si rezultat, marrim shpërndarjen $Z=2X+Y$:

$\begin(array)(|c|c|)
\hline
z_i & -14 & -8 & 6 & 12 & 10 & 16 \\
\hline
p_i & 0,12 & 0,28 & 0,03 & 0,07 & 0,15 & 0,35 \\
\hline
\fund (arresë)$

Asnjëri prej tyre nuk varet nga vlerat që kanë marrë (ose do të marrin variablat e tjerë të rastësishëm).

Për shembull, sistemi i lojës së dy zareve - është mjaft e qartë se rezultati i hedhjes së një zarare nuk ndikon në gjasat që fytyrat e një zarri tjetër të bien në asnjë mënyrë. Ose të njëjtat automat që funksionojnë në mënyrë të pavarur. Dhe, me siguri, disa kanë përshtypjen se çdo SV është e pavarur në përgjithësi. Megjithatë, kjo nuk është gjithmonë rasti.

Konsideroni të njëkohshme duke hedhur dy zare magnetike, polet e veriut të të cilëve janë në anën e faqes me 1 pikë dhe polet e jugut janë në faqen e kundërt me 6 pikë. A do të jenë të pavarur variablat e ngjashëm të rastësishëm? Po, do ta bëjnë. Mundësitë për të lënë "1" dhe "6" thjesht do të ulen dhe shanset e fytyrave të tjera do të rriten, sepse si rezultat i provës, kubet mund të tërhiqen nga pole të kundërta.

Tani merrni parasysh një sistem në të cilin zaret hidhen në mënyrë të njëpasnjëshme:

- numri i pikëve të mbështjellë në pullën e parë;

- numri i pikave të mbështjellë në kapelën e dytë, me kusht që ajo të hidhet gjithmonë në anën e djathtë (për shembull) të pullës së parë.

Në këtë rast, ligji i shpërndarjes së ndryshores së rastësishme varet se si ndodhet kubi i parë. Kocka e dytë ose mund të tërhiqet, ose anasjelltas - të rikthehet (nëse polet me të njëjtin emër "takohen"), ose pjesërisht ose plotësisht të injorojnë kubin e parë.

Shembulli i dytë: supozojmë se të njëjtat slot machines janë bashkuar në një rrjet të vetëm, dhe - ekziston një sistem variablash të rastësishëm - fitime në makinat përkatëse. Nuk e di nëse kjo skemë është e ligjshme, por pronari i sallës së lojërave mund ta konfigurojë lehtësisht rrjetin në mënyrën e mëposhtme: kur ndodh një fitore e madhe në çdo makinë, ligjet e shpërndarjes së fitimeve në të gjitha makinat ndryshojnë automatikisht. Në veçanti, këshillohet të rivendosni probabilitetet e fitimeve të mëdha për një kohë, në mënyrë që institucioni të mos përballet me mungesë fondesh (në rast se papritmas dikush fiton përsëri të mëdha). Kështu, sistemi i konsideruar do të jetë i varur.

Si shembull demonstrues, merrni parasysh një kuvertë me 8 letra, le të jenë mbretër dhe mbretëresha, dhe një lojë e thjeshtë në të cilën dy lojtarë radhazi (pa marrë parasysh se në çfarë radhe) nxjerrin një letër nga kuverta. Konsideroni një ndryshore të rastësishme, e cila simbolizon një lojtar dhe merr vlerat e mëposhtme: 1 , nëse ai tërhoqi një kartë zemre, dhe 0 - nëse karta është e një kostum tjetër.

Në mënyrë të ngjashme, lëreni variablin e rastësishëm të simbolizojë një lojtar tjetër dhe gjithashtu të marrë vlerat 0 ose 1 nëse ai nuk ka vizatuar respektivisht një zemër dhe një zemër.

është probabiliteti që të dy lojtarët të nxjerrin krimbin,

është probabiliteti i ngjarjes së kundërt dhe:

- probabiliteti që njëri do të nxjerrë krimbin, dhe tjetri - jo; ose anasjelltas:

Kështu, ligji i shpërndarjes së probabilitetit të sistemit të varur është:

Kontrolli: , e cila duhej të verifikohej. ...Ndoshta keni një pyetje, pse po konsideroj saktësisht 8, dhe jo 36 letra? Po, vetëm në mënyrë që fraksionet të mos jenë aq të rënda.

Tani le të analizojmë pak rezultatet. Nëse i mbledhim probabilitetet rresht pas rreshti: , atëherë marrim saktësisht ligjin e shpërndarjes së ndryshores së rastësishme:

Është e lehtë të kuptohet se kjo shpërndarje korrespondon me situatën kur lojtari "X" tërheq një kartë i vetëm, pa një shok "G" dhe vlera e pritur:
- është e barabartë me probabilitetin e nxjerrjes së zemrave nga kuverta jonë.

Në mënyrë të ngjashme, nëse përmbledhim probabilitetet sipas kolonave, atëherë marrim ligjin e shpërndarjes së një loje të vetme të lojtarit të dytë:

me të njëjtën pritshmëri

Për shkak të "simetrisë" së rregullave të lojës, shpërndarjet rezultuan të njëjta, por, në rastin e përgjithshëm, ato, natyrisht, janë të ndryshme.

Përveç kësaj, është e dobishme të merret parasysh ligjet e kushtëzuara të shpërndarjes së probabilitetit . Kjo është një situatë ku një nga variablat e rastësishëm ka marrë tashmë një vlerë specifike, ose ne e supozojmë këtë në mënyrë hipotetike.

Lëreni lojtarin "lojtar" të tërheqë fillimisht një kartë dhe jo një zemër. Probabiliteti i kësaj ngjarje është (shumoni probabilitetet mbi të parën kolonë tavolina - Shiko lart). Pastaj, nga e njëjta teoremat e shumëzimit për probabilitetet e ngjarjeve të varura marrim probabilitetet e kushtëzuara të mëposhtme:
- probabiliteti që lojtari "X" të mos vizatojë një zemër, me kusht që lojtari "duke luajtur" të mos tërheqë një zemër;
- probabiliteti që lojtari "X" të vizatojë një zemër, me kusht që lojtari "lojtar" të mos vizatojë një zemër.

... të gjithë kujtojnë se si të shpëtojnë thyesat katërkatëshe? Dhe po, formale por shumë komode rregull teknik për llogaritjen e këtyre probabiliteteve: shuma e parë të gjitha probabilitetet nga kolonë, dhe pastaj pjesëtoni çdo probabilitet me shumën që rezulton.

Kështu, në , ligji i kushtëzuar i shpërndarjes së një ndryshoreje të rastësishme do të shkruhet si më poshtë:

, NE RREGULL. Le të llogarisim pritshmërinë matematikore të kushtëzuar:

Tani le të hartojmë ligjin e shpërndarjes së një ndryshoreje të rastësishme me kushtin që ndryshorja e rastësishme të ketë marrë vlerën, d.m.th. Lojtari i "lojtarit" tërhoqi një kartë të përshtatshme për zemrën. Për ta bërë këtë, ne përmbledhim probabilitetet e 2-të kolonë tavolina ( Shiko lart): dhe llogaritni probabilitetet e kushtëzuara:
- fakti që lojtari "X" nuk do të tërheqë një krimb,
- dhe një krimb.
Kështu, ligji i dëshiruar i shpërndarjes së kushtëzuar:

Kontrolli: , dhe pritshmëria e kushtëzuar:
- sigurisht, doli të ishte më pak se në rastin e mëparshëm, pasi lojtari "lojtar" zvogëloi numrin e zemrave në kuvertë.

Mënyra "Pasqyrë". (duke punuar me rreshtat e tabelës) mund të përbëhet - ligji i shpërndarjes së një ndryshoreje të rastësishme, me kusht që ndryshorja e rastësishme të ketë marrë vlerën , dhe shpërndarja e kushtëzuar, kur lojtari "X" ka marrë krimbin. Është e lehtë të kuptohet se për shkak të "simetrisë" së lojës, do të merren të njëjtat shpërndarje dhe të njëjtat vlera.

Për variabla të rastësishme të vazhdueshme prezantoni të njëjtat koncepte. shpërndarjet e kushtëzuara dhe pritjet matematikore, por nëse nuk ka nevojë të nxehtë për to, atëherë është më mirë të vazhdoni të studioni këtë mësim.

Në praktikë, në shumicën e rasteve, do t'ju ofrohet një ligj i gatshëm i shpërndarjes për një sistem variablash të rastësishëm:

Shembulli 4

Një ndryshore e rastësishme dydimensionale jepet nga ligji i vet i shpërndarjes së probabilitetit:

... Doja të konsideroja një tryezë më të madhe, por vendosa të mos isha maniak, sepse gjëja kryesore është të kuptoj vetë parimin e zgjidhjes.

Kërkohet:

1) Hartoni ligjet e shpërndarjes dhe llogaritni pritshmëritë përkatëse matematikore. Bëni një përfundim të arsyeshëm për varësinë ose pavarësinë e variablave të rastësishëm .

Kjo është një detyrë që duhet zgjidhur vetë! Ju kujtoj se në rastin e pavarësisë së NE, ligjet duhet të rezultojë të jetë i njëjtë dhe të përkojë me ligjin e shpërndarjes së një ndryshoreje të rastësishme, dhe ligjet duhet të përkojnë me . Dhjetoret, kush nuk di a harron, i leverdis te ndahet keshtu: .
Ju mund të shikoni mostrën në fund të faqes.

2) Llogaritni koeficientin e kovariancës.

Së pari, le të shohim vetë termin dhe nga ka ardhur fare: kur një ndryshore e rastësishme merr vlera të ndryshme, atëherë ata thonë se ajo ndryshon, dhe matjen sasiore të kësaj variacionet, siç e dini, është shprehur dispersion. Duke përdorur formulën për llogaritjen e variancës, si dhe vetitë e pritshmërisë dhe variancës, është e lehtë të përcaktohet se:

d.m.th., kur mblidhen dy ndryshore të rastësishme, variancat e tyre përmblidhen dhe shtohet një term shtesë që karakterizon variacion i përbashkët ose së shpejti - kovarianca variablat e rastësishëm.

kovarianca ose momenti i korrelacionit - kjo është masë e variacionit të përbashkët variablat e rastësishëm.

Emërtimi: ose

Kovarianca e variablave të rastësishme diskrete është përcaktuar, tani do të "shprehem" :), si pritshmëri matematikore e produktit devijimet lineare nga këto variabla të rastësishme nga pritshmëritë përkatëse matematikore:

Nëse , atëherë ndryshore të rastësishme i varur. Në mënyrë figurative, na tregon një vlerë jozero natyrore"përgjigjet" e një SW ndaj një ndryshimi në një tjetër SW.

Kovarianca mund të llogaritet në dy mënyra, unë do t'i mbuloj të dyja.

Metoda e parë. Nga përkufizimi i pritjes matematikore:

Një formulë “e tmerrshme” dhe llogaritje aspak të tmerrshme. Së pari, ne përpilojmë ligjet e shpërndarjes së variablave të rastësishëm dhe - për këtë ne përmbledhim probabilitetet mbi rreshtat (vlera "X") dhe sipas kolonave (vlera e "lojës"):

Hidhini një sy tabelës origjinale të sipërme - a e kuptojnë të gjithë se si dolën shpërndarjet? Llogaritni pritjet:
dhe devijimet vlerat e ndryshoreve të rastësishme nga pritshmëritë përkatëse matematikore:

Është e përshtatshme të vendosni devijimet që rezultojnë në një tabelë dy-dimensionale, brenda së cilës më pas rishkruani probabilitetet nga tabela origjinale:

Tani ju duhet të llogaritni të gjitha produktet e mundshme, si shembull, unë theksova: (Ngjyra e kuqe) dhe (Ngjyrë blu). Është i përshtatshëm për të kryer llogaritjet në Excel dhe për të shkruar gjithçka në detaje në një kopje të pastër. Unë jam mësuar të punoj "rresht pas rreshti" nga e majta në të djathtë, dhe për këtë arsye së pari do të rendis të gjitha produktet e mundshme me një devijim "X" prej -1.6, pastaj me një devijim prej 0.4:

Metoda dy, më e thjeshtë dhe më e zakonshme. Sipas formulës:

Pritshmëria e produktit SW është përcaktuar si dhe teknikisht gjithçka është shumë e thjeshtë: marrim tabelën origjinale të problemit dhe gjejmë të gjitha produktet e mundshme sipas probabiliteteve përkatëse; ne figuren e meposhtme vura ne dukje punen me te kuqe dhe produkti blu:

Së pari, unë do t'i rendis të gjitha produktet me vlerën , pastaj me vlerën , por ju, natyrisht, mund të përdorni një renditje të ndryshme të numërimit - siç preferoni:

Vlerat tashmë janë llogaritur (shiko metodën e parë), dhe mbetet të zbatohet formula:

Siç u përmend më lart, vlera jozero e kovariancës na tregon për varësinë e variablave të rastësishëm dhe aq më shumë është modul, aq më shumë kjo varësi më afër te funksionale lineare varësitë. Sepse përcaktohet nëpërmjet devijimeve lineare.

Kështu, përkufizimi mund të formulohet më saktë:

kovariancaështë një masë lineare varësitë e ndryshoreve të rastit.

Me një vlerë zero, gjithçka është më interesante. Nëse vërtetohet se , atëherë variablat e rastësishëm mund të rezultojnë të jenë si të pavarur ashtu edhe të varur(sepse varësia mund të jetë jo vetëm lineare). Në këtë mënyrë, ky fakt në përgjithësi nuk mund të përdoret për të justifikuar pavarësinë e BQ-së!

Megjithatë, nëse dihet se ata janë të pavarur, atëherë . Kjo mund të verifikohet lehtësisht në mënyrë analitike: meqenëse për ndryshoret e pavarura të rastësishme vetia ( shih mësimin e mëparshëm), atëherë sipas formulës për llogaritjen e kovariancës:

Çfarë vlerash mund të marrë ky koeficient? Koeficienti i kovariancës merr vlera që nuk i kalojnë modul- dhe sa më shumë, aq më e theksuar varësia lineare. Dhe gjithçka duket të jetë në rregull, por ka një shqetësim të rëndësishëm të një mase të tillë:

Supozoni se ne eksplorojmë ndryshore e rastësishme e vazhdueshme dydimensionale(duke përgatitur mendërisht :)), përbërësit e të cilave maten në centimetra dhe morën vlerën . Meqë ra fjala, cili është dimensioni i kovariancës? Meqenëse, - centimetra, dhe - gjithashtu centimetra, atëherë produkti i tyre dhe pritshmëria e këtij produkti – shprehur në centimetra katrorë, d.m.th. kovarianca, si varianca, është kuadratike vlerë.

Tani supozoni se dikush mësoi të njëjtin sistem, por përdori jo centimetra, por milimetra. Meqenëse 1 cm = 10 mm, kovarianca do të rritet me 100 herë dhe do të jetë e barabartë me !

Prandaj, është e përshtatshme të merret parasysh normalizuar një koeficient kovariance që do të na jepte të njëjtën vlerë dhe pa dimension. Ky koeficient quhet, ne vazhdojmë detyrën tonë:

3) Koeficienti korrelacionet . Ose, më saktë, koeficienti linear i korrelacionit:

, ku - devijimet standarde variablat e rastësishëm.

Koeficienti i korrelacionit pa dimensione dhe merr vlera nga diapazoni:

(nëse keni diçka tjetër në praktikë - kërkoni një gabim).

Më shumë modul me unitetin, sa më afër të jetë marrëdhënia lineare midis vlerave dhe sa më afër zeros, aq më pak e theksuar është kjo varësi. Marrëdhënia konsiderohet e rëndësishme duke filluar nga rreth . Vlerat ekstreme korrespondojnë me një varësi të rreptë funksionale, por në praktikë, natyrisht, nuk ka raste "ideale".

Unë me të vërtetë dua të jap shumë shembuj interesantë, por korrelacioni është më i rëndësishëm në kurs statistika matematikore dhe kështu do t'i ruaj për të ardhmen. Epo, tani le të gjejmë koeficientin e korrelacionit në problemin tonë. Kështu që. Ligjet e shpërndarjes tashmë janë të njohura, unë do të kopjoj nga lart:

Pritjet janë gjetur: , dhe mbetet për të llogaritur devijimet standarde. shenjë Unë nuk do ta përpiloj, është më e shpejtë për të llogaritur me vijën:

Kovarianca e gjetur në paragrafin e mëparshëm , dhe mbetet për të llogaritur koeficientin e korrelacionit:
, pra, midis vlerave ekziston një varësi lineare e ngushtësisë mesatare.

Detyra e katërt është përsëri më tipike për detyrat statistika matematikore, por për çdo rast, merrni parasysh këtu:

4) Shkruani një ekuacion të regresionit linear për .

Ekuacioni regresionit linear është një funksion , e cila menyra me e mire përafron vlerat e ndryshores së rastësishme. Për përafrimin më të mirë, zakonisht përdoret metoda më e vogël e katrorit, dhe më pas koeficientët e regresionit mund të llogariten me formula:
, këto janë mrekulli, dhe koeficienti i dytë:

Koncepti i variablave të pavarur të rastësishëm është një nga konceptet e rëndësishme të teorisë së probabilitetit.

Një ndryshore e rastësishme quhet e pavarur nga një ndryshore e rastësishme nëse ligji i shpërndarjes së vlerës nuk varet nga ajo vlerë që ka marrë vlera.

Për variablat e rastësishme të vazhdueshme, kushti i pavarësisë nga mund të shkruhet si:

për çdo.

Përkundrazi, nëse varet nga , atëherë

Le të vërtetojmë se varësia ose pavarësia e ndryshoreve të rastit është gjithmonë e ndërsjellë: nëse vlera nuk varet nga .

Në të vërtetë, le të mos varet nga:

. (8.5.1)

Nga formulat (8.4.4) dhe (8.4.5) kemi:

prej nga, duke marrë parasysh (8.5.1), marrim:

Q.E.D.

Meqenëse varësia dhe pavarësia e variablave të rastit janë gjithmonë të ndërsjella, është e mundur të jepet një përkufizim i ri i variablave të rastësishëm të pavarur.

Ndryshoret e rastësishme dhe quhen të pavarura nëse ligji i shpërndarjes së secilës prej tyre nuk varet nga ajo vlerë që ka marrë tjetri. Përndryshe, sasitë dhe quhen të varura.

Për variabla të rastësishme të vazhdueshme të pavarura, teorema e shumëzimit të ligjit të shpërndarjes merr formën:

, (8.5.2)

d.m.th., dendësia e shpërndarjes së një sistemi variablash të rastësishëm të pavarur është e barabartë me produktin e densitetit të shpërndarjes së variablave individualë të përfshirë në sistem.

Kushti (8.5.2) mund të konsiderohet si një kusht i nevojshëm dhe i mjaftueshëm për pavarësinë e variablave të rastit.

Shpesh, nga vetë forma e funksionit, mund të konkludohet se variablat e rastësishëm janë të pavarura, domethënë, nëse dendësia e shpërndarjes ndahet në produktin e dy funksioneve, njëri prej të cilëve varet vetëm nga , tjetri vetëm nga , atëherë i rastësishëm variablat janë të pavarur.

Shembull. Dendësia e shpërndarjes së sistemit ka formën:

Përcaktoni nëse variablat e rastësishëm dhe janë të varur apo të pavarur.

Zgjidhje. Duke faktorizuar emëruesin, kemi:

Nga fakti që funksioni zbërthehet në produkt të dy funksioneve, njëri prej të cilëve varet vetëm nga dhe tjetri vetëm nga , arrijmë në përfundimin se sasitë dhe duhet të jenë të pavarura. Në të vërtetë, duke aplikuar formulat (8.4.2) dhe (8.4.3), kemi:

;

po ashtu

si të sigurohemi që

dhe prandaj sasitë dhe janë të pavarura.

Kriteri i mësipërm për të gjykuar varësinë ose pavarësinë e variablave të rastësishëm bazohet në supozimin se ne e dimë ligjin e shpërndarjes së sistemit. Në praktikë, shpesh ndodh e kundërta: ligji i shpërndarjes së sistemit nuk dihet; Dihen vetëm ligjet e shpërndarjes së sasive individuale të përfshira në sistem, dhe ka arsye për të besuar se sasitë dhe janë të pavarura. Pastaj është e mundur të shkruhet dendësia e shpërndarjes së sistemit si produkt i densitetit të shpërndarjes së sasive individuale të përfshira në sistem.

Le të ndalemi më në detaje në konceptet e rëndësishme të "varësisë" dhe "pavarësisë" së variablave të rastit.

Koncepti i "pavarësisë" së variablave të rastësishëm, të cilin ne përdorim në teorinë e probabilitetit, është disi i ndryshëm nga koncepti i zakonshëm i "varësisë" së variablave, të cilin e operojmë në matematikë. Në të vërtetë, zakonisht nën "varësinë" e sasive nënkuptojnë vetëm një lloj varësie - një varësi të plotë, të ngurtë, të ashtuquajtur - funksionale. Dy sasi dhe quhen të varura funksionalisht nëse, duke ditur vlerën e njërës prej tyre, njëra mund të tregojë me saktësi vlerën e tjetrës.

Në teorinë e probabilitetit, hasim një lloj tjetër varësie, më të përgjithshme - me një varësi probabiliste ose "stokastike". Nëse vlera lidhet me vlerën nga një varësi probabilistike, atëherë, duke ditur vlerën, është e pamundur të specifikoni vlerën e saktë të , por ju mund të tregoni vetëm ligjin e shpërndarjes së saj, në varësi të asaj vlere që ka marrë vlera.

Varësia probabiliste mund të jetë pak a shumë e afërt; me rritjen e ngushtësisë së varësisë probabilistike, ajo i afrohet gjithnjë e më shumë asaj funksionale. Kështu, varësia funksionale mund të konsiderohet si një rast ekstrem, kufizues i varësisë më të afërt probabilistike. Një rast tjetër ekstrem është pavarësia e plotë e variablave të rastësishëm. Midis këtyre dy rasteve ekstreme qëndrojnë të gjitha shkallëzimet e varësisë probabiliste - nga më e forta tek më e dobëta. Ato sasive fizike, të cilat në praktikë i konsiderojmë të varura funksionalisht, në fakt lidhen nga një varësi probabilistike shumë e ngushtë: për një vlerë të caktuar të njërës prej këtyre sasive, tjetra ndryshon brenda kufijve aq të ngushtë sa që praktikisht mund të konsiderohet mjaft e përcaktuar. Nga ana tjetër, ato sasi që ne i konsiderojmë të pavarura në praktikë dhe realitet janë shpesh në njëfarë varësie reciproke, por kjo varësi është aq e dobët sa mund të neglizhohet për qëllime praktike.

Varësia probabilistike ndërmjet variablave të rastit është shumë e zakonshme në praktikë. Nëse variablat e rastësishëm dhe janë në një varësi probabilistike, kjo nuk do të thotë se me një ndryshim në madhësi, madhësia ndryshon në një mënyrë plotësisht të përcaktuar; do të thotë vetëm se me ndryshimin e vlerës, edhe vlera tenton të ndryshojë (për shembull, rritet ose ulet me rritjen ). Ky trend vërehet vetëm "mesatarisht", në në terma të përgjithshëm, dhe në secilin rast individual, devijimet prej tij janë të mundshme.

Konsideroni, për shembull, dy variabla të tillë të rastësishëm: - gjatësinë e një personi të marrë rastësisht, - peshën e tij. Natyrisht, sasitë dhe janë në një varësi të caktuar probabiliste; shprehet në faktin se në përgjithësi personat me gjatësi më të madhe kanë më shumë peshë. Madje është e mundur të bëhet një formulë empirike që përafërsisht zëvendëson këtë varësi probabilistike me një funksionale. E tillë, për shembull, është formula e njohur që përafërsisht shpreh marrëdhënien ndërmjet gjatësisë dhe peshës.

Ligjet e kushtëzuara shpërndarja. Regresioni.

Përkufizimi. Ligji i shpërndarjes së kushtëzuar të njërit prej përbërësve njëdimensionale të një ndryshoreje të rastësishme dydimensionale (X, Y) është ligji i shpërndarjes së tij, i llogaritur me kushtin që komponenti tjetër të marrë një vlerë të caktuar (ose të bjerë në një interval). Në leksionin e mëparshëm, u mor në konsideratë gjetja e shpërndarjeve të kushtëzuara për variabla diskrete të rastësishme. Ekzistojnë gjithashtu formula për probabilitetet e kushtëzuara:

Në rastin e ndryshoreve të rastësishme të vazhdueshme, është e nevojshme të përcaktohen densitetet e probabilitetit të shpërndarjeve të kushtëzuara j y (x) dhe j X (y). Për këtë qëllim, në formulat e mësipërme, ne do të zëvendësojmë probabilitetet e ngjarjeve me "elementet e probabilitetit" të tyre!

pas reduktimit me dx dhe dy marrim:

ato. dendësia e probabilitetit të kushtëzuar të njërit prej përbërësve njëdimensionale të një ndryshoreje të rastësishme dydimensionale është e barabartë me raportin e densitetit të përbashkët të tij me densitetin e probabilitetit të komponentit tjetër. Këto raporte shkruhen në formë

quhen teorema (rregulla) e shumëzimit të densiteteve të shpërndarjes.

Dendësitë e kushtëzuara j y (x) dhe j X (y). kanë të gjitha vetitë e densitetit "të pakushtëzuar".

Kur studiojmë variablat e rastësishëm dydimensionale, marrim parasysh karakteristikat numerike komponentët njëdimensionale X dhe Y - pritjet dhe variancat matematikore. Për një ndryshore të rastësishme të vazhdueshme (X, Y), ato përcaktohen nga formula:

Krahas tyre merren parasysh edhe karakteristikat numerike të shpërndarjeve të kushtëzuara: pritjet matematikore të kushtëzuara M x (Y) dhe M y (X) dhe variancat e kushtëzuara D x (Y) dhe D Y (X). Këto karakteristika gjenden nga formulat e zakonshme të pritjes dhe variancës matematikore, në të cilat probabilitetet e kushtëzuara ose densitetet e probabilitetit të kushtëzuar përdoren në vend të probabiliteteve të ngjarjeve ose densiteteve të probabilitetit.

Pritshmëria matematikore e kushtëzuar e një ndryshoreje të rastësishme Y për X = x, d.m.th. M x (Y), ekziston një funksion i x, i quajtur funksioni i regresionit ose thjesht regresioni Y në X. Në mënyrë të ngjashme, M Y (X) quhet funksion i regresionit ose thjesht regresion X në Y. Grafikët e këtyre funksioneve quhen përkatësisht vijat e regresionit (ose kurbat e regresionit) Y nga X ose X nga Y.

Variabla të rastësishme të varura dhe të pavarura.

Përkufizimi. Variablat e rastësishëm X dhe Y quhen të pavarur nëse funksioni i tyre i përbashkët i shpërndarjes F(x,y) paraqitet si produkt i funksioneve të shpërndarjes F 1 (x) dhe F 2 (y) të këtyre ndryshoreve të rastit, d.m.th.

Përndryshe, ndryshoret e rastësishme X dhe Y quhen të varura.

Duke e diferencuar barazinë dy herë në lidhje me argumentet x dhe y, marrim

ato. për ndryshoret e rastësishme të pavarura të vazhdueshme X dhe Y, dendësia e tyre e përbashkët j(x, y) është e barabartë me produktin e densitetit të probabilitetit j 1 (x) dhe j 2 (y) të këtyre ndryshoreve të rastit.

Deri më tani, ne kemi hasur në konceptin e një marrëdhënie funksionale midis ndryshoreve X dhe Y, kur secila vlerë e x në një variabël korrespondonte me një vlerë të përcaktuar rreptësisht në tjetrën. Për shembull, marrëdhënia midis dy ndryshoreve të rastësishme - numri i pjesëve të dështuara të pajisjeve për periudhë të caktuar koha dhe kostoja e tyre - funksionale.

Në përgjithësi, ndeshet një lloj tjetër varësie, më pak e ngurtë se varësia funksionale.

Përkufizimi. Marrëdhënia midis dy ndryshoreve të rastësishme quhet probabiliste (stokastike ose statistikore) nëse secila vlerë e njërës prej tyre korrespondon me një shpërndarje të caktuar (të kushtëzuar) të tjetrës.

Në rastin e një varësie probabiliste (stokastike), është e pamundur, duke ditur vlerën e njërës prej tyre, të përcaktohet me saktësi vlera e tjetrës, por ju mund të tregoni vetëm shpërndarjen e vlerës tjetër. Për shembull, marrëdhënia midis numrit të dështimeve të pajisjeve dhe kostos së mirëmbajtjes së saj parandaluese, peshës dhe gjatësisë së një personi, kohës së kaluar nga një nxënës i shkollës për të parë programe televizive dhe për të lexuar libra, etj. janë probabiliste (stokastike).

Në fig. 5.10 tregon shembuj të ndryshoreve të rastësishme të varura dhe të pavarura X dhe Y.

Vlera e sasisë së varur. Variabla të rastësishme të pavarura. Veprimet në ndryshore të rastësishme. Ligjet e kushtëzuara të shpërndarjes. Regresioni

Artikuj të ngjashëm