Bağımlı ve bağımsız rastgele değişkenler

 Rastgele değişken sistemlerini incelerken, her zaman bağımlılıklarının derecesine ve doğasına dikkat edilmelidir. Bu bağımlılık az ya da çok belirgin, az ya da çok yakın olabilir. Bazı durumlarda, rastgele değişkenler arasındaki ilişki o kadar yakın olabilir ki, bir rastgele değişkenin değerini bilerek diğerinin değerini doğru bir şekilde belirtebilirsiniz. Diğer uç durumda, rastgele değişkenler arasındaki bağımlılık o kadar zayıf ve uzaktır ki, pratikte bağımsız olarak kabul edilebilirler.
 Bağımsız rastgele değişkenler kavramı, olasılık teorisinin önemli kavramlarından biridir.
 Bir rastgele değişkenin \(Y\), \(Y\) değerinin dağılım yasası \(X\) değerinin değerine bağlı değilse, \(X\) rastgele değişkeninden bağımsız olduğu söylenir.
 Sürekli rastgele değişkenler için, \(Y\)'nin \(X\)'den bağımsız olması koşulu şu şekilde yazılabilir: $$f(y\mid x)=f_(2)(y)$$ herhangi bir \(y) için \).
 Aksine, \(Y\) \(X\'e bağlıysa), o zaman $$f(y\mid x) \neq f_(2)(y)$$  Biz bunu kanıtlıyoruz rastgele değişkenlerin bağımlılığı veya bağımsızlığı her zaman karşılıklıdır: eğer \(Y\) değeri \(X\'e bağlı değilse), o zaman \(X\) değeri \(Y\)'ye bağlı değildir.
 Gerçekten, \(Y\), \(X\)'den bağımsız olsun: $$f(y\mid x)=f_(2)(y)$$ elimizde: $$f_(1)(x)f( y \mid x)=f_(2)(y)f(x\mid y)$$ nereden geliyorsa, şunu elde ederiz: $$f_(1)(x)=f(x\mid y)$$ olması gereken kanıtlanmış.
 Rastgele değişkenlerin bağımlılığı ve bağımsızlığı her zaman karşılıklı olduğundan, bağımsız rastgele değişkenlerin yeni bir tanımını verebiliriz.
 Rastgele değişkenler \(X\) ve \(Y\) bağımsız olarak adlandırılır, eğer her birinin dağılım yasası diğerinin değerine bağlı değilse. Aksi takdirde, \(X\) ve \(Y\) niceliklerine denir. bağımlı.
 Bağımsız sürekli rasgele değişkenler için, dağıtım yasası çarpma teoremi, sisteme dahil edilen bireysel niceliklerin dağılımını alır.
Genellikle, \(f(x, y)\) fonksiyonunun biçimiyle, \(X, Y\) rasgele değişkenlerinin bağımsız olduğu sonucuna varılabilir, yani, eğer dağıtım yoğunluğu \(f(x, y) ise). \) ürüne, biri yalnızca \(x\'e, diğeri yalnızca \(y\)'ye bağlı olan) iki işlevi ayrıştırır, o zaman rastgele değişkenler bağımsızdır.
örnek 1\((X, Y)\) sisteminin dağıtım yoğunluğu şu şekildedir: $$f(x, y)=\frac(1)(\pi ^(2)(x^(2)+y^() 2)+x ^(2)y^(2)+1))$$ \(X\) ve \(Y\) rasgele değişkenlerinin bağımlı mı yoksa bağımsız mı olduğunu belirleyin.
Çözüm. Paydayı çarpanlara ayırarak, elimizde: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\frac(1)(\pi (y^(2)+1) ))$$ \(f(x, y)\) işlevinin, biri yalnızca \(x\)'e ve diğeri yalnızca \(y\'ye bağlı olan) iki işlevin bir ürününe bölünmesi gerçeğinden ), \(X\) ve \(Y\) niceliklerinin bağımsız olması gerektiği sonucuna varıyoruz. Gerçekten de, formülleri uygulayarak şunları elde ederiz: $$f(x, y)=\frac(1)(\pi (x^(2)+1))\int_(-\infty)^(\infty)(\ frac( dy)(\pi (y^(2)+1)))=\frac(1)(\pi (x^(2)+1))$$ benzer $$f(x, y)= (\frac (1)(\pi (y^(2)+1)))$$ buradan $$f(x, y)=f_(1)(x)f_(2)(y) olduğundan emin oluruz $$ ve dolayısıyla \(X\) ve \(Y\) miktarları bağımsızdır.

rastgele olaylar Bunlardan birinin meydana gelmesi, diğer olayların meydana gelme olasılığını etkilemiyorsa bağımsız olarak adlandırılır.

örnek 1 . Renkli topları olan iki veya daha fazla urn varsa, o zaman bir urndan herhangi bir top çekmek, kalan urnlardan diğer topların çekilme olasılığını etkilemez.

İçin bağımsız olaylar adil olasılık çarpma teoremi: olasılık eklemi(eşzamanlı)birkaç bağımsız rastgele olayın meydana gelmesi, olasılıklarının ürününe eşittir:

P (A 1 ve A 2 ve A 3 ... ve A k) \u003d P (A 1) ∙ P (A 2) ∙ ... ∙ P (A k). (7)

Olayların ortak (eşzamanlı) meydana gelmesi, olayların meydana gelmesi ve 1 , ve 2 , ve 3… ve Ve k.

Örnek 2 . İki urn var. Birinde 2 siyah ve 8 beyaz top, diğerinde 6 siyah ve 4 beyaz top vardır. olay olsun ANCAK- ilk kavanozdan rastgele beyaz top seçimi, AT- ikinciden. Bu kavanozlardan rastgele beyaz bir top seçme olasılığı nedir? neye eşittir R (ANCAK ve AT)?

Çözüm: ilk vazodan beyaz bir top çekme olasılığı
R(ANCAK) = = 0.8 saniyeden itibaren – R(AT) = = 0.4. Her iki kutudan aynı anda beyaz top gelme olasılığı
R(ANCAK ve AT) = R(ANCAKR(AT) = 0,8∙ 0,4 = 0,32 = 32%.

Örnek 3 Azaltılmış bir iyot diyeti, büyük bir popülasyondaki hayvanların %60'ında tiroid büyümesine neden olur. Deney için 4 adet büyütülmüş bez gereklidir. Rastgele seçilen 4 hayvanın genişlemiş bir tiroid bezine sahip olma olasılığını bulun.

Çözüm:Rastgele olay ANCAK- genişlemiş bir tiroid bezi olan bir hayvanın rastgele seçimi. Problemin durumuna göre bu olayın olma olasılığı R(ANCAK) = 0,6 = %60. O zaman dört bağımsız olayın ortak meydana gelme olasılığı - genişlemiş bir tiroid bezi olan 4 hayvanın rastgele seçimi - şuna eşit olacaktır:

R(ANCAK 1 ve ANCAK 2 ve ANCAK 3 ve ANCAK 4) = 0,6 ∙ 0,6 ∙0,6 ∙ 0,6=(0,6) 4 ≈ 0,13 = 13%.

bağımlı olaylar Bağımlı olaylar için olasılık çarpma teoremi

Rastgele A ve B olayları, bunlardan birinin meydana gelmesi, örneğin A, diğer olayın - B'nin meydana gelme olasılığını değiştirirse bağımlı olarak adlandırılır. Bu nedenle, bağımlı olaylar için iki olasılık değeri kullanılır: koşulsuz ve koşullu olasılıklar .

Eğer bir ANCAK ve AT bağımlı olaylar, daha sonra olayın meydana gelme olasılığı AT ilk (yani olaydan önce) ANCAK) denir koşulsuz olasılık Bu olayın ve belirlenen R(AT).Olayın olasılığı AT olay olması şartıyla ANCAK zaten oldu, denir şartlı olasılık gelişmeler AT ve belirtilen R(AT/ANCAK) veya RA(AT).

koşulsuz - R(ANCAK) ve koşullu - R(A/B) olay için olasılıklar ANCAK.

İki bağımlı olay için olasılık çarpma teoremi: A ve B iki bağımlı olayın aynı anda meydana gelme olasılığı, birinci olayın koşulsuz olasılığının ikincisinin koşullu olasılığı ile ürününe eşittir:

R(A ve B)= P(ANCAK)∙P(B/A) , (8)

ANCAK, veya

R(A ve B)= P(AT)∙P(A/B), (9)

olay önce gerçekleşirse AT.

Örnek 1. Bir kavanozda 3 siyah ve 7 beyaz top var. Bu kavanozdan 2 beyaz topun birer birer çıkarılması (ve ilk topun kavanoza geri gönderilmemesi) olasılığını bulun.

Çözüm: ilk beyaz topu çekme olasılığı (olay ANCAK) 7/10'a eşittir. Çıkarıldıktan sonra kavanozda 6 tanesi beyaz olmak üzere 9 top kalır. Sonra ikinci beyaz topun ortaya çıkma olasılığı (olay AT) eşittir R(AT/ANCAK) = 6/9 ve arka arkaya iki beyaz top gelme olasılığı

R(ANCAK ve AT) = R(ANCAK)∙R(AT/ANCAK) = = 0,47 = 47%.

Bağımlı olaylar için verilen olasılık çarpma teoremi, herhangi bir sayıda olaya genelleştirilebilir. Özellikle üç etkinlik için, bağlı arkadaş Bir arkadaşıyla:

R(ANCAK ve AT ve İTİBAREN)= P(ANCAK)∙ R(B/A)∙ R(TAKSİ). (10)

Örnek 2. Her birine 100 çocuğun katıldığı iki anaokulunda bulaşıcı bir hastalık salgını yaşandı. Vakaların oranı sırasıyla 1/5 ve 1/4'tür ve birinci kurumda %70, ikinci kurumda - %60'ı 3 yaşın altındaki çocuklardır. Rastgele bir çocuk seçilir. Şu olasılığı belirleyin:

1) seçilen çocuk ilk anaokuluna aittir (etkinlik ANCAK) ve hasta (olay AT).

2) ikinciden bir çocuk seçilir çocuk Yuvası(Etkinlik İTİBAREN), hasta (olay D) ve 3 yaşından büyük (olay E).

Çözüm. 1) istenen olasılık -

R(ANCAK ve AT) = R(ANCAK) ∙ R(AT/ANCAK) = = 0,1 = 10%.

2) istenen olasılık:

R(İTİBAREN ve D ve E) = R(İTİBAREN) ∙ R(D/C) ∙ R(E/CD) = = 5%.

Bayes formülü

= (12)

Örnek 1. Hastanın ilk muayenesinde 3 tanı varsayılır H 1 , H 2 , H 3. Doktora göre olasılıkları şu şekilde dağıtılır: R(H 1) = 0,5; R(H 2) = 0,17; R(H 3) = 0.33. Bu nedenle, ilk tanı geçici olarak en olası görünüyor. Açıklığa kavuşturmak için, örneğin, ESR'de bir artışın beklendiği bir kan testi reçete edilir (olay ANCAK). Şüpheli hastalıklarda ESR'de bir artış olasılığının aşağıdakilere eşit olduğu önceden bilinmektedir (araştırma sonuçlarına dayanarak):

R(ANCAK/H 1) = 0,1; R(ANCAK/H 2) = 0,2; R(ANCAK/H 3) = 0,9.

Elde edilen analizde ESR'de bir artış kaydedildi (olay ANCAK olmuş). Daha sonra Bayes formülüne (12) göre hesaplama, ESR değeri yüksek olduğu iddia edilen hastalıkların olasılıklarının değerlerini verir: R(H 1 /ANCAK) = 0,13; R(H 2 /ANCAK) = 0,09;
R(H 3 /ANCAK) = 0.78. Bu rakamlar, laboratuvar verilerini dikkate alarak, ilk değil, olasılığı oldukça yüksek olan üçüncü tanının en gerçekçi olduğunu göstermektedir.

Örnek 2. Anatomik olarak dar pelvisli kadınlarda bir çocuğun perinatal* ölüm riskinin derecesini değerlendiren olasılığı belirleyin.

Çözüm: olaya izin ver H 1 - güvenli teslimat. Klinik raporlara göre, R(H 1) = 0,975 = %97,5, öyleyse H2- perinatal ölüm gerçeği, o zaman R(H 2) = 1 – 0,975 = 0,025 = 2,5 %.

belirtmek ANCAK- doğum yapan bir kadında dar bir pelvisin varlığı gerçeği. Yapılan çalışmalardan bilinmektedir: a) R(ANCAK/H 1) - uygun doğum ile dar bir pelvis olasılığı, R(ANCAK/H 1) = 0.029, b) R(ANCAK/H 2) - perinatal mortalitede dar bir pelvis olasılığı,
R(ANCAK/H 2) = 0.051. Daha sonra, doğum yapan bir kadında dar pelviste istenen perinatal mortalite olasılığı Bays formülü (12) ile hesaplanır ve şuna eşittir:

Bu nedenle, anatomik olarak dar pelviste perinatal mortalite riski, ortalama riskten (%4,4'e karşı %2,5) önemli ölçüde yüksektir (neredeyse iki katı).

Bunların hiçbiri, diğer rastgele değişkenlerin hangi değerleri aldığına (veya alacağına) bağlı değildir.

Örneğin, iki zar atma sistemi - bir kalıbın atılmasının sonucunun, başka bir kalıbın yüzlerinin düşme olasılıklarını hiçbir şekilde etkilemediği oldukça açıktır. Veya aynı bağımsız çalışan slot makineleri. Ve muhtemelen bazıları, herhangi bir SV'nin genel olarak bağımsız olduğu izlenimine sahiptir. Ancak, bu her zaman böyle değildir.

Düşünmek eşzamanlı kuzey kutupları 1 noktalı yüzün yanında ve güney kutupları zıt 6 noktalı yüzün yanında olan iki mıknatıs zarının atılması. Benzer rastgele değişkenler bağımsız olacak mı? Evet onlar yapacak. "1" ve "6" yı bırakma olasılıkları basitçe düşecek ve diğer yüzlerin şansı artacaktır, çünkü test sonucunda küpler zıt kutuplar tarafından çekilebilir.

Şimdi zarların atıldığı bir sistem düşünelim. art arda:

- ilk kalıpta atılan puanların sayısı;

- her zaman 1. kalıbın sağ tarafına (örneğin) atılması şartıyla ikinci kalıpta atılan puanların sayısı.

Bu durumda, rastgele değişkenin dağılım yasası bağlı olmak 1. küpün nasıl yerleştirildiği hakkında. İkinci kemik çekilebilir veya tam tersi - geri tepme (aynı adı taşıyan kutuplar “bir araya gelirse”) veya 1. küpü kısmen veya tamamen görmezden gelebilir.

İkinci örnek: aynı slot makinelerinin tek bir ağda birleştiğini varsayalım ve - rastgele değişkenler sistemi var - ilgili makinelerde kazançlar. Bu planın yasal olup olmadığını bilmiyorum, ancak oyun salonunun sahibi ağı aşağıdaki şekilde kolayca kurabilir: herhangi bir makinede büyük bir kazanç gerçekleştiğinde, genel olarak tüm makinelerde kazançların dağıtım yasaları otomatik olarak değiştirmek. Özellikle, kurumun fon sıkıntısı yaşamaması için (aniden birinin tekrar büyük kazanması durumunda) büyük kazanç olasılıklarının bir süreliğine sıfırlanması tavsiye edilir. Böylece, dikkate alınan sistem bağımlı olacaktır.

Gösteri örneği olarak, 8 kartlık bir desteyi, krallar ve kraliçeler olsun ve iki oyuncunun arka arkaya (hangi sırayla olursa olsun) desteden bir kart çektiği basit bir oyun düşünün. Bir oyuncuyu simgeleyen ve aşağıdaki değerleri alan rastgele bir değişken düşünün: 1 , eğer bir kalp kartı çizerse ve 0 - kart farklı bir takımdan ise.

Benzer şekilde, rastgele değişkenin başka bir oyuncuyu sembolize etmesine izin verin ve ayrıca bir kalp ve bir kalp çizmemişse sırasıyla 0 veya 1 değerlerini alın.

her iki oyuncunun da solucanı çıkarma olasılığı,

zıt olayın olasılığı ve:

- birinin solucanı çıkarma olasılığı ve diğeri - hayır; ya da tam tersi:

Böylece, bağımlı sistemin olasılık dağılım yasası şöyledir:

Kontrol: , hangi doğrulanacaktı. ...Belki bir sorunuz var, neden 36 kart değil de tam olarak 8 kart düşünüyorum? Evet, sadece kesirler çok hantal olmasın diye.

Şimdi sonuçları biraz analiz edelim. olasılıkları toplarsak satır satır: , o zaman tam olarak rastgele değişkenin dağılım yasasını elde ederiz:

Bu dağılımın, "X" oyuncusunun "G" yoldaşı olmadan tek başına bir kart çekmesi durumuna tekabül ettiğini anlamak kolaydır. beklenen değer:
- destemizden kalp çıkarma olasılığına eşittir.

Benzer şekilde, olasılıkları toplarsak sütunlara göre, o zaman ikinci oyuncunun tek bir oyununun dağılım yasasını elde ederiz:

aynı beklentiyle

Oyunun kurallarının "simetrisi" nedeniyle, dağıtımların aynı olduğu ortaya çıktı, ancak genel durumda, elbette farklıdırlar.

Ayrıca, dikkate almakta fayda var olasılık dağılımının koşullu yasaları . Bu, rastgele değişkenlerden birinin zaten belirli bir değer aldığı veya bunu varsayımsal olarak varsaydığımız bir durumdur.

"Oyuncu" oyuncunun önce bir kart çekmesine ve kalp çekmemesine izin verin. Bu olayın olasılığı (birincisi üzerindeki olasılıkların toplamı kolon tablolar - yukarıyı görmek). Daha sonra aynı yerden bağımlı olayların olasılıkları için çarpma teoremleri aşağıdaki koşullu olasılıkları elde ederiz:
- "Oynayan" oyuncunun bir kalp çizmemesi koşuluyla, "X" oyuncusunun kalp çekmeme olasılığı;
- "Oyuncu" oyuncusunun bir kalp çizmemesi koşuluyla, "X" oyuncusunun bir kalp çekme olasılığı.

... herkes nasıl kurtulacağını hatırlıyor dört katlı kesirler? Ve evet, resmi ama çok rahat bu olasılıkları hesaplamak için teknik kural: ilk toplam tüm tarafından olasılıklar kolon ve ardından her olasılığı elde edilen toplama bölün.

Böylece, 'de rastgele bir değişkenin koşullu dağılım yasası aşağıdaki gibi yazılacaktır:

, TAMAM. Koşullu matematiksel beklentiyi hesaplayalım:

Şimdi rasgele değişkenin değerini alması koşuluyla bir rasgele değişkenin dağılım yasasını çizelim, yani. “Oyuncu” oyuncu kalbe uygun bir kart çekti. Bunu yapmak için, 2. olasılıkları özetliyoruz. kolon tablolar ( yukarıyı görmek): ve koşullu olasılıkları hesaplayın:
- "X" oyuncusunun solucan çizmeyecek olması,
- ve bir solucan.
Böylece, istenen koşullu dağıtım yasası:

Kontrol: , ve koşullu beklenti:
- elbette, "oyuncu" oyuncusu destedeki kalp sayısını azalttığı için önceki durumdan daha az olduğu ortaya çıktı.

"Ayna" yolu (tablo satırlarıyla çalışma) derlenebilir - rastgele değişkenin değeri alması koşuluyla rastgele bir değişkenin dağılım yasası ve koşullu dağıtım"x" oyuncusu solucanı kaldırdığında. Oyunun “simetrisi” nedeniyle aynı dağılımların ve aynı değerlerin elde edileceğini anlamak kolaydır.

İçin sürekli rastgele değişkenler Aynı kavramları tanıtın. koşullu dağılımlar ve matematiksel beklentiler, ancak onlara sıcak bir ihtiyaç yoksa, bu dersi çalışmaya devam etmek daha iyidir.

Uygulamada, çoğu durumda, size bir rastgele değişkenler sistemi için hazır bir dağıtım yasası sunulacaktır:

Örnek 4

İki boyutlu bir rastgele değişken, kendi olasılık dağılım yasasıyla verilir:

... Daha büyük bir masa düşünmek istedim, ama manik olmamaya karar verdim, çünkü asıl mesele çözümün prensibini anlamak.

Gerekli:

1) Dağılım yasalarını hazırlayın ve karşılık gelen matematiksel beklentileri hesaplayın. Rastgele değişkenlerin bağımlılığı veya bağımsızlığı hakkında makul bir sonuca varın .

Bu, kendi başınıza çözmeniz gereken bir görevdir! Size hatırlatırım, NE'nin bağımsızlığı durumunda, yasaların aynı olduğu ortaya çıkmalı ve rastgele bir değişkenin dağılım yasasıyla örtüşmeli ve yasalarla örtüşmelidir. ondalık sayılar, bilmeyen veya unutan, şöyle bölmek uygundur: .
Örneği sayfanın alt kısmından inceleyebilirsiniz.

2) Kovaryans katsayısını hesaplayın.

İlk olarak, terimin kendisine ve nereden geldiğine bakalım: rastgele bir değişken farklı değerler aldığında, o zaman şöyle derler: değişir ve bunun nicel ölçümü varyasyonlar, bildiğiniz gibi, ifade edilir dağılım. Varyansı hesaplamak için formülün yanı sıra beklenti ve varyansın özelliklerini kullanarak şunları belirlemek kolaydır:

yani, iki rastgele değişken eklendiğinde, varyansları toplanır ve karakterize eden ek bir terim eklenir. ortak varyasyon veya kısaca - kovaryans rastgele değişkenler.

kovaryans veya korelasyon momenti - bu ortak değişkenlik ölçüsü rastgele değişkenler.

atama: veya

Kesikli rastgele değişkenlerin kovaryansı tanımlandı, şimdi ürünün matematiksel beklentisi olarak “ifade edeceğim” :) doğrusal sapmalar karşılık gelen matematiksel beklentilerden bu rastgele değişkenlerin:

Eğer , o zaman rastgele değişkenler bağımlı. Mecazi olarak konuşursak, sıfır olmayan bir değer bize şunu söyler: doğal bir SW'nin diğer bir SW'deki değişikliğe "yanıtları".

Kovaryans iki şekilde hesaplanabilir, ikisini de ele alacağım.

Birinci yöntem. İle matematiksel beklentinin tanımı:

"Korkunç" bir formül ve hiç de korkunç hesaplamalar değil. İlk olarak, rastgele değişkenlerin dağılım yasalarını oluşturuyoruz ve bunun için satırlar üzerindeki olasılıkları özetliyoruz. ("X" değeri) ve sütunlara göre ("oyun" değeri):

Orijinal üst tabloya bir göz atın - herkes dağıtımların nasıl sonuçlandığını anlıyor mu? hesaplama beklentiler:
ve sapmalar karşılık gelen matematiksel beklentilerden rastgele değişkenlerin değerleri:

Ortaya çıkan sapmaları, daha sonra orijinal tablodan olasılıkları yeniden yazmak için iki boyutlu bir tabloya yerleştirmek uygundur:


Şimdi tüm olası ürünleri hesaplamanız gerekiyor, örnek olarak vurguladım: (Kırmızı renk) ve (Mavi renk). Excel'de hesaplamalar yapmak ve her şeyi ayrıntılı olarak temiz bir kopyaya yazmak uygundur. Soldan sağa “satır satır” çalışmaya alışkınım ve bu nedenle önce “X” sapması -1.6, ardından 0.4 sapma ile tüm olası ürünleri listeleyeceğim:

İkinci yöntem, daha basit ve daha yaygın. Formüle göre:

Ürün SW'sinin beklentisi şu şekilde tanımlanır: ve teknik olarak her şey çok basit: problemin orijinal tablosunu alıyoruz ve ilgili olasılıklara göre tüm olası ürünleri buluyoruz; aşağıdaki resimde işi kırmızı ile vurguladım ve mavi ürün:


İlk önce tüm ürünleri value , ardından value ile listeleyeceğim, ancak elbette farklı bir numaralandırma sırası kullanabilirsiniz - tercih ettiğiniz gibi:

Değerler zaten hesaplanmıştır (bkz. Yöntem 1) ve formülü uygulamak için kalır:

Yukarıda belirtildiği gibi, kovaryansın sıfır olmayan değeri bize rastgele değişkenlerin bağımlılığı hakkında bilgi verir ve modül, bu bağımlılık ne kadar fazla daha yakın işlevsel doğrusal bağımlılıklar. Çünkü lineer sapmalarla belirlenir.

Böylece, tanım daha kesin olarak formüle edilebilir:

kovaryans bir ölçüdür doğrusal rastgele değişkenlerin bağımlılıkları.

Sıfır değeriyle her şey daha ilginç. olduğu belirlenirse, rastgele değişkenler şu şekilde ortaya çıkabilir: hem bağımsız hem bağımlı(çünkü bağımlılık sadece doğrusal olmayabilir). Böylece, bu gerçek genellikle SV'nin bağımsızlığını doğrulamak için kullanılamaz.!

Ancak bağımsız oldukları biliniyorsa, o zaman . Bu analitik olarak kolayca doğrulanabilir: çünkü bağımsız rastgele değişkenler için özellik ( önceki derse bakın), ardından kovaryansı hesaplama formülüne göre:

Bu katsayı hangi değerleri alabilir? Kovaryans katsayısı aşmayan değerler alır modül- ve daha fazla, daha belirgin doğrusal bağımlılık. Ve her şey yolunda görünüyor, ancak böyle bir önlemin önemli bir sakıncası var:

Diyelim ki araştırıyoruz iki boyutlu sürekli rastgele değişken(zihinsel olarak hazırlanıyor :)), bileşenleri santimetre cinsinden ölçülen ve değeri alan . Bu arada, kovaryansın boyutu nedir? - santimetre ve - ayrıca santimetre olduğundan, ürünleri ve bu ürünün beklentisi – santimetre kare olarak ifade edilir, yani. kovaryans, varyans gibi ikinci dereceden değer.

Şimdi birisinin aynı sistemi öğrendiğini, ancak santimetre değil, milimetre kullandığını varsayalım. 1 cm = 10 mm olduğundan kovaryans 100 kat artacak ve şuna eşit olacaktır. !

Bu nedenle, dikkate alınması uygun normalleştirilmiş bize aynı ve boyutsuz değeri verecek bir kovaryans katsayısı. Bu katsayı denir, görevimize devam ediyoruz:

3) katsayı korelasyonlar . Veya daha doğrusu doğrusal korelasyon katsayısı:

, nerede - Standart sapma rastgele değişkenler.

Korelasyon katsayısı boyutsuz ve aralıktan değerler alır:

(pratikte başka bir şeyiniz varsa - bir hata arayın).

Daha fazla modül birliğe, değerler arasındaki doğrusal ilişki ne kadar yakınsa ve sıfıra ne kadar yakınsa, bu bağımlılık o kadar az belirgindir. İlişki yaklaşık olarak başlayarak önemli olarak kabul edilir. Aşırı değerler katı bir işlevsel bağımlılığa karşılık gelir, ancak pratikte elbette “ideal” durumlar yoktur.

Gerçekten birçok ilginç örnek vermek istiyorum, ancak korelasyon kursta daha alakalı. matematiksel istatistik ve onları gelecek için saklayacağım. Şimdi problemimizin korelasyon katsayısını bulalım. Yani. Dağıtım yasaları zaten biliniyor, yukarıdan kopyalayacağım:

Beklentiler bulunur: , ve standart sapmaları hesaplamak için kalır. işaret Ben çizmeyeceğim, satırla hesaplamak daha hızlı:

Önceki paragrafta bulunan kovaryans , ve korelasyon katsayısını hesaplamak için kalır:
, bu nedenle, değerler arasında ortalama sıkılığın doğrusal bir bağımlılığı vardır.

Dördüncü görev, görevler için yine daha tipiktir. matematiksel istatistik, ancak her ihtimale karşı, burada düşünün:

4) için doğrusal bir regresyon denklemi yazın.

denklem doğrusal regresyon bir fonksiyondur , Hangi en iyi yol rastgele değişkenin değerlerine yaklaşır. En iyi yaklaşım için, genellikle en küçük kareler yöntemi, ve ardından regresyon katsayıları aşağıdaki formüllerle hesaplanabilir:
, bunlar mucizeler ve 2. katsayı:

Koşullu dağıtım yasaları. gerileme.

Tanım. İki boyutlu bir rastgele değişkenin (X, Y) tek boyutlu bileşenlerinden birinin koşullu dağılım yasası, diğer bileşenin belirli bir değer alması (veya bir aralığa düşmesi) koşuluyla hesaplanan dağılım yasasıdır. Bir önceki derste, kesikli rastgele değişkenler için koşullu dağılımların bulunması ele alınmıştı. Koşullu olasılıklar için formüller de vardır:

Sürekli rastgele değişkenler söz konusu olduğunda, j y (x) ve j X (y) koşullu dağılımlarının olasılık yoğunluklarının belirlenmesi gerekir. Bu amaçla, yukarıdaki formüllerde, olayların olasılıklarını onların "olasılık öğeleri" ile değiştireceğiz!

dx ve dy ile azaltmadan sonra şunu elde ederiz:

şunlar. iki boyutlu bir rastgele değişkenin tek boyutlu bileşenlerinden birinin koşullu olasılık yoğunluğu, eklem yoğunluğunun diğer bileşenin olasılık yoğunluğuna oranına eşittir. Bu oranlar formda yazılır.

dağılım yoğunluklarının çarpımı teoremi (kural) olarak adlandırılır.

Koşullu yoğunluklar j y (x) ve j X (y). "koşulsuz" yoğunluğun tüm özelliklerine sahiptir.

İki boyutlu rastgele değişkenleri incelerken, sayısal özellikler tek boyutlu bileşenler X ve Y - matematiksel beklentiler ve varyanslar. Sürekli bir rastgele değişken (X, Y) için, aşağıdaki formüllerle belirlenirler:

Bunlarla birlikte, koşullu dağılımların sayısal özellikleri de dikkate alınır: koşullu matematiksel beklentiler M x (Y) ve M y (X) ve koşullu varyanslar D x (Y) ve D Y (X). Bu özellikler, olay olasılıkları veya olasılık yoğunlukları yerine koşullu olasılıkların veya koşullu olasılık yoğunluklarının kullanıldığı olağan matematiksel beklenti ve varyans formülleriyle bulunur.

X = x için bir rasgele değişken Y'nin koşullu matematiksel beklentisi, yani. M x (Y), x'in bir fonksiyonu vardır, regresyon fonksiyonu veya X üzerinde basitçe regresyon Y. Benzer şekilde, M Y (X) regresyon fonksiyonu veya Y üzerinde sadece regresyon X olarak adlandırılır. Bu fonksiyonların grafikleri sırasıyla çağrılır. regresyon çizgileri (veya regresyon eğrileri) Y ile X veya X ile Y.

Bağımlı ve bağımsız rastgele değişkenler.

Tanım. X ve Y rastgele değişkenleri, ortak dağılım fonksiyonları F(x,y), bu rastgele değişkenlerin F 1 (x) ve F 2 (y) dağılım fonksiyonlarının bir ürünü olarak temsil ediliyorsa bağımsız olarak adlandırılır, yani.

Aksi takdirde, X ve Y rasgele değişkenlerine bağımlı denir.

Eşitliği x ve y argümanlarına göre iki kez farklılaştırarak, şunu elde ederiz:

şunlar. bağımsız sürekli rastgele değişkenler X ve Y için, bunların ortak yoğunluğu j(x, y), bu rastgele değişkenlerin j 1 (x) ve j 2 (y) olasılık yoğunluklarının çarpımına eşittir.

Şimdiye kadar, bir değişkendeki her bir x değeri diğerinde kesin olarak tanımlanmış bir değere karşılık geldiğinde, X ve Y değişkenleri arasında işlevsel bir ilişki kavramıyla karşılaştık. Örneğin, iki rastgele değişken arasındaki ilişki - arızalı ekipman parçalarının sayısı. belirli bir süre zaman ve maliyet - işlevsel.

Genel olarak, işlevsel bağımlılıktan daha az katı olan farklı bir bağımlılık türüyle karşılaşılır.

Tanım.İki rastgele değişken arasındaki ilişki, birinin her değeri diğerinin belirli (koşullu) bir dağılımına karşılık geliyorsa, olasılıksal (stokastik veya istatistiksel) olarak adlandırılır.

Olasılıksal (stokastik) bir bağımlılık durumunda, birinin değerini bilmek, diğerinin değerini doğru bir şekilde belirlemek imkansızdır, ancak yalnızca diğer miktarın dağılımı gösterilebilir. Örneğin, ekipman arızalarının sayısı ile önleyici bakım maliyeti, bir kişinin ağırlığı ve boyu, bir okul çocuğunun televizyon programlarını izlemek ve kitap okumak için harcadığı zaman vb. olasılıksaldır (stokastik).

Şek. 5.10, X ve Y'nin bağımlı ve bağımsız rastgele değişkenlerinin örneklerini gösterir.

Rastgele değişken sistemlerini incelerken, bağımlılıklarının derecesine ve doğasına her zaman dikkat edilmelidir. Bu bağımlılık az ya da çok belirgin, az ya da çok yakın olabilir. Bazı durumlarda, rastgele değişkenler arasındaki ilişki o kadar yakın olabilir ki, bir rastgele değişkenin değerini bilerek diğerinin değerini doğru bir şekilde belirtebilirsiniz. Diğer uç durumda, rastgele değişkenler arasındaki bağımlılık o kadar zayıf ve uzaktır ki, pratikte bağımsız olarak kabul edilebilirler.

Bağımsız rastgele değişkenler kavramı, olasılık teorisinin önemli kavramlarından biridir.

Değerin dağılım yasası, değerin aldığı değere bağlı değilse, rastgele bir değişken, bir rastgele değişkenden bağımsız olarak adlandırılır.

Sürekli rasgele değişkenler için bağımsızlık koşulu şu şekilde yazılabilir:

herhangi .

Aksine, eğer bağlıysa, o zaman

.

Rastgele değişkenlerin bağımlılığının veya bağımsızlığının her zaman karşılıklı olduğunu kanıtlayalım: değer bağlı değilse.

Gerçekten, şunlara bağlı kalmasın:

. (8.5.1)

(8.4.4) ve (8.4.5) formüllerinden şunları elde ederiz:

buradan, (8.5.1) dikkate alındığında şunları elde ederiz:

Q.E.D.

Rastgele değişkenlerin bağımlılığı ve bağımsızlığı her zaman karşılıklı olduğundan, bağımsız rastgele değişkenlerin yeni bir tanımını vermek mümkündür.

Rastgele değişkenler ve her birinin dağılım yasası diğerinin aldığı değere bağlı değilse bağımsız olarak adlandırılır. Aksi takdirde, miktarlar ve bağımlı denir.

Bağımsız sürekli rasgele değişkenler için dağılım yasası çarpma teoremi şu şekli alır:

, (8.5.2)

yani, bağımsız rastgele değişkenlerden oluşan bir sistemin dağılım yoğunluğu, sisteme dahil edilen bireysel değişkenlerin dağılım yoğunluklarının çarpımına eşittir.

(8.5.2) koşulu, rastgele değişkenlerin bağımsızlığı için gerekli ve yeterli bir koşul olarak kabul edilebilir.

Genellikle, işlevin biçimiyle, rasgele değişkenlerin bağımsız olduğu sonucuna varılabilir, yani dağılım yoğunluğu, biri yalnızca 'ye bağlı olan, diğeri yalnızca 'ye bağlı olan iki işlevin ürününe bölünürse, o zaman rastgele değişkenler bağımsızdır. değişkenler bağımsızdır.

Örnek. Sistemin dağıtım yoğunluğu şu şekildedir:

.

Rastgele değişkenlerin bağımlı mı bağımsız mı olduğunu belirleyin.

Çözüm. Paydayı çarpanlara ayırdığımızda:

.

Fonksiyonun, biri yalnızca 'ye bağlı ve diğeri yalnızca 'ye bağlı olan iki fonksiyonun bir ürününe bölünmesi gerçeğinden, niceliklerin ve bağımsız olması gerektiği sonucuna varırız. Gerçekten de, (8.4.2) ve (8.4.3) formüllerini uygulayarak şunları elde ederiz:

;

aynı şekilde

,

bundan nasıl emin olabiliriz

ve dolayısıyla miktarlar ve bağımsızdır.

Rastgele değişkenlerin bağımlılığını veya bağımsızlığını değerlendirmek için yukarıdaki kriter, sistemin dağıtım yasasını bildiğimiz varsayımına dayanmaktadır. Pratikte, genellikle tam tersi olur: sistemin dağıtım yasası bilinmemektedir; sadece sisteme dahil edilen bireysel niceliklerin dağılım yasaları bilinir ve niceliklerin bağımsız olduğuna inanmak için gerekçeler vardır. Daha sonra sistemin dağılım yoğunluğunu, sisteme dahil edilen bireysel niceliklerin dağılım yoğunluklarının bir ürünü olarak yazmak mümkündür.

Rastgele değişkenlerin önemli "bağımlılığı" ve "bağımsızlığı" kavramları üzerinde daha ayrıntılı duralım.

Olasılık teorisinde kullandığımız rastgele değişkenlerin "bağımsızlığı" kavramı, matematikte kullandığımız değişkenlerin olağan "bağımlılığı" kavramından biraz farklıdır. Aslında, genellikle niceliklerin "bağımlılığı" altında, yalnızca bir tür bağımlılık - tam, katı, sözde - işlevsel bağımlılık anlamına gelirler. İki nicelik ve bunlardan birinin değerini bilerek, birinin diğerinin değerini doğru bir şekilde gösterebilmesi durumunda işlevsel olarak bağımlı olarak adlandırılır.

Olasılık teorisinde, daha genel başka bir bağımlılık türüyle karşılaşırız - olasılıksal veya "rastlantısal" bir bağımlılıkla. Değer, değerle olasılıksal bir bağımlılıkla ilişkiliyse, değeri bilmek, tam değerini belirtmek imkansızdır, ancak değerin aldığı değere bağlı olarak yalnızca dağıtım yasasını belirtebilirsiniz.

Olasılıksal bağımlılık aşağı yukarı yakın olabilir; olasılık bağımlılığının sıkılığı arttıkça işlevsel olana daha fazla yaklaşmaktadır. Bu nedenle, işlevsel bağımlılık, en yakın olasılıksal bağımlılığın aşırı, sınırlayıcı bir durumu olarak düşünülebilir. Diğer bir uç durum ise rastgele değişkenlerin tam bağımsızlığıdır. Bu iki uç durum arasında, en güçlüden en zayıfa tüm olasılıksal bağımlılık dereceleri bulunur. Şunlar fiziksel özellikler Pratikte işlevsel olarak bağımlı olduğunu düşündüğümüz, gerçekte çok yakın bir olasılık bağımlılığı ile bağlantılıdır: bu niceliklerden birinin belirli bir değeri için, diğeri o kadar dar sınırlar içinde değişir ki, pratikte oldukça kesin olarak kabul edilebilir. Öte yandan, pratikte ve gerçeklikte bağımsız olduğunu düşündüğümüz nicelikler genellikle karşılıklı bir bağımlılık içindedir, ancak bu bağımlılık o kadar zayıftır ki pratik amaçlar için ihmal edilebilir.

Rastgele değişkenler arasında olasılıksal bağımlılık pratikte çok yaygındır. Rastgele değişkenler ve olasılıksal bir bağımlılık içindeyse, bu, büyüklükteki bir değişiklikle, büyüklüğün tamamen kesin bir şekilde değiştiği anlamına gelmez; sadece değer değiştikçe değerin de değişme eğiliminde olduğu anlamına gelir (örneğin, artan ile artar veya azalır). Bu eğilim, yalnızca "ortalama olarak" gözlemlenir. genel anlamda, ve her bir durumda bundan sapmalar mümkündür.

Örneğin, böyle iki rastgele değişkeni ele alalım: - rastgele alınan bir kişinin boyu, - kilosu. Açıkçası, miktarlar ve belirli bir olasılıksal bağımlılık içindedir; genel olarak boyu fazla olan kişilerin kilolarının daha fazla olmasıyla ifade edilir. Bu olasılıksal bağımlılığı yaklaşık olarak işlevsel olanla değiştiren ampirik bir formül yapmak bile mümkündür. Örneğin, boy ve kilo arasındaki ilişkiyi yaklaşık olarak ifade eden iyi bilinen formül budur.