U prethodnom smo dali niz formula koje nam omogućavaju da pronađemo numeričke karakteristike funkcija kada su poznati zakoni raspodjele argumenata. Međutim, u mnogim slučajevima, za pronalaženje numeričkih karakteristika funkcija, nije potrebno čak ni poznavati zakone raspodjele argumenata, već je dovoljno poznavati samo neke od njihovih numeričkih karakteristika; u ovom slučaju uopšte nemamo zakona o distribuciji. Određivanje numeričkih karakteristika funkcija datim numeričkim karakteristikama argumenata ima široku primenu u teoriji verovatnoće i omogućava značajno pojednostavljenje rešavanja niza problema. Uglavnom, takve pojednostavljene metode se odnose na linearne funkcije; međutim, nešto elementarno nelinearne funkcije također prihvatiti sličan pristup.

U sadašnjosti predstavljamo niz teorema o numeričke karakteristike funkcije, koje u svojoj ukupnosti predstavljaju vrlo jednostavan aparat za izračunavanje ovih karakteristika, primenljiv u širokom spektru uslova.

1. Matematičko očekivanje neslučajne varijable

Navedeno svojstvo je prilično očigledno; može se dokazati razmatranjem neslučajne varijable kao posebne vrste slučajne, sa jednom mogućom vrijednošću s vjerovatnoćom od jedan; onda prema općoj formuli za matematičko očekivanje:

.

2. Disperzija neslučajne varijable

Ako ne slučajna vrijednost, onda

3. Uklanjanje neslučajne varijable izvan znaka matematičkog očekivanja

, (10.2.1)

tj. neslučajna vrijednost se može izvući iz predznaka očekivanja.

Dokaz.

a) Za diskontinuirane količine

b) Za kontinuirane količine

.

4. Uklanjanje neslučajne vrijednosti za predznak varijanse i standardne devijacije

Ako je neslučajna varijabla, i slučajna je, onda

, (10.2.2)

tj. neslučajna vrijednost se može izvući iz predznaka disperzije tako što se kvadrira.

Dokaz. Po definiciji varijanse

Posljedica

,

tj. neslučajna vrijednost se može izvaditi iz predznaka standardne devijacije svojom apsolutnom vrijednošću. Dokaz dobijamo izvlačenjem kvadratnog korijena iz formule (10.2.2) i uzimajući u obzir da je r.s.c. je suštinski pozitivna vrijednost.

5. Matematičko očekivanje sume slučajnih varijabli

Dokažimo da za bilo koje dvije slučajne varijable i

tj. matematičko očekivanje zbira dvije slučajne varijable jednako je zbiru njihovih matematičkih očekivanja.

Ovo svojstvo je poznato kao teorema sabiranja očekivanja.

Dokaz.

a) Neka je sistem diskontinuiranih slučajnih varijabli. Primjenjivo na zbir slučajnih varijabli opšta formula(10.1.6) za očekivanje funkcije od dva argumenta:

.

Ho nije ništa više od ukupne vjerovatnoće da će vrijednost poprimiti vrijednost:

;

shodno tome,

.

Na sličan način ćemo to i dokazati

,

i teorema je dokazana.

b) Neka je sistem kontinuiranih slučajnih varijabli. Prema formuli (10.1.7)

. (10.2.4)

Transformišemo prvi od integrala (10.2.4):

;

isto tako

,

i teorema je dokazana.

Posebno treba napomenuti da teorema o sabiranju matematičkih očekivanja vrijedi za sve slučajne varijable - i zavisne i nezavisne.

Teorema sabiranja očekivanja može se generalizirati na proizvoljan broj pojmova:

, (10.2.5)

tj. matematičko očekivanje sume nekoliko slučajnih varijabli jednako je zbiru njihovih matematičkih očekivanja.

Da bi se to dokazalo, dovoljno je primijeniti metodu potpune indukcije.

6. Matematičko očekivanje linearna funkcija

Razmotrimo linearnu funkciju nekoliko slučajnih argumenata:

gdje su neslučajni koeficijenti. Dokažimo to

, (10.2.6)

tj. srednja vrijednost linearne funkcije jednaka je istoj linearnoj funkciji srednje vrijednosti argumenata.

Dokaz. Koristeći teorem sabiranja m.o. i pravilo uzimanja neslučajne varijable iz predznaka m. o., dobijamo:

.

7. Dispepovaj zbir slučajnih varijabli

Varijanca zbira dvije slučajne varijable jednaka je zbroju njihovih varijansi plus dvostruki korelacijski moment:

Dokaz. Označite

Prema teoremi sabiranja matematičkih očekivanja

Prijeđimo sa slučajnih varijabli na odgovarajuće centrirane varijable. Oduzimajući član po član od jednakosti (10.2.8) jednakosti (10.2.9), imamo:

Po definiciji varijanse

Q.E.D.

Formula (10.2.7) za varijansu sume može se generalizirati na bilo koji broj pojmova:

, (10.2.10)

gdje je korelacijski moment vrijednosti, znak ispod zbroja znači da se zbrajanje odnosi na sve moguće kombinacije slučajnih varijabli u paru .

Dokaz je sličan prethodnom i slijedi iz formule za kvadrat polinoma.

Formula (10.2.10) se može napisati u drugom obliku:

, (10.2.11)

gdje se dvostruki zbir proteže na sve elemente korelacijske matrice sistema veličina , koji sadrži i korelacijske momente i varijanse.

Ako su sve slučajne varijable , uključeni u sistem, nisu u korelaciji (tj. na ), formula (10.2.10) ima oblik:

, (10.2.12)

tj. varijansa zbira nekoreliranih slučajnih varijabli jednaka je zbiru varijansi termina.

Ova tvrdnja je poznata kao teorema o dodavanju varijanse.

8. Disperzija linearne funkcije

Razmotrimo linearnu funkciju nekoliko slučajnih varijabli.

gdje su neslučajne varijable.

Dokažimo da je disperzija ove linearne funkcije izražena formulom

, (10.2.13)

gdje je korelacijski moment veličina , .

Dokaz. Hajde da uvedemo notaciju:

. (10.2.14)

Primjenjujući formulu (10.2.10) za varijansu sume na desnu stranu izraza (10.2.14) i uzimajući u obzir to, dobijamo:

gdje je korelacijski moment veličina:

.

Izračunajmo ovaj trenutak. Imamo:

;

isto tako

Zamjenom ovog izraza u (10.2.15) dolazimo do formule (10.2.13).

U konkretnom slučaju kada su sve količine nekorelirano, formula (10.2.13) ima oblik:

, (10.2.16)

tj. varijansa linearne funkcije nekoreliranih slučajnih varijabli jednaka je zbroju proizvoda kvadrata koeficijenata i varijansi odgovarajućih argumenata.

9. Matematičko očekivanje proizvoda slučajnih varijabli

Matematičko očekivanje proizvoda dvije slučajne varijable jednako je proizvodu njihovih matematičkih očekivanja plus korelacijski moment:

Dokaz. Poći ćemo od definicije korelacionog momenta:

Ovaj izraz transformiramo koristeći svojstva matematičkog očekivanja:

što je očigledno ekvivalentno formuli (10.2.17).

Ako slučajne varijable nisu u korelaciji, onda formula (10.2.17) poprima oblik:

tj. srednja vrijednost proizvoda dvije nekorelirane slučajne varijable jednaka je proizvodu njihove srednje vrijednosti.

Ova izjava je poznata kao teorema množenja očekivanja.

Formula (10.2.17) nije ništa drugo nego izraz drugog mešovitog centralnog momenta sistema u smislu drugog mešovitog početnog momenta i matematičkih očekivanja:

. (10.2.19)

Ovaj izraz se često koristi u praksi kada se izračunava korelacijski moment na isti način na koji se za jednu slučajnu varijablu varijansa često izračunava kroz drugi početni trenutak i matematičko očekivanje.

Teorema množenja očekivanja također se može generalizirati na proizvoljan broj faktora, samo u ovom slučaju za njenu primjenu nije dovoljno da su veličine nekorelirane, već je potrebno da nestanu i neki viši mješoviti momenti čiji broj zavisi od broj termina u proizvodu. Ovi uslovi su svakako zadovoljeni ako su slučajne varijable uključene u proizvod nezavisne. U ovom slučaju

, (10.2.20)

tj. matematičko očekivanje proizvoda nezavisnih slučajnih varijabli jednako je proizvodu njihovih matematičkih očekivanja.

Ovaj prijedlog se lako može dokazati potpunom indukcijom.

10. Disperzija proizvoda nezavisnih slučajnih varijabli

Dokažimo to za nezavisne varijable

Dokaz. Označimo . Po definiciji varijanse

Pošto su količine nezavisne, i

At nezavisne varijable takođe nezavisni; shodno tome,

,

Ali ne postoji ništa drugo do drugi početni trenutak količine , i, prema tome, izražen je u terminima varijanse:

;

isto tako

.

Zamjenom ovih izraza u formulu (10.2.22) i dovođenjem sličnih pojmova dolazimo do formule (10.2.21).

U slučaju kada se centrirane slučajne varijable pomnože (vrijednosti sa matematičkim očekivanjima jednakim nuli), formula (10.2.21) ima oblik:

, (10.2.23)

tj. varijansa proizvoda nezavisnih centriranih slučajnih varijabli jednaka je proizvodu njihovih varijansi.

11. Viši momenti zbira slučajnih varijabli

U nekim slučajevima potrebno je izračunati veće momente zbira nezavisnih slučajnih varijabli. Dokažimo neke povezane relacije.

1) Ako su veličine nezavisne, onda

Dokaz.

odakle teoremom množenja očekivanja

Ali prvi centralni moment za bilo koju količinu je nula; dva srednja člana nestaju i formula (10.2.24) je dokazana.

Relacija (10.2.24) se može lako generalizirati indukcijom na proizvoljan broj nezavisnih članova:

. (10.2.25)

2) Četvrti centralni moment zbira dvije nezavisne slučajne varijable izražava se formulom

gdje su disperzije i .

Dokaz je potpuno isti kao i prethodni.

Koristeći metodu potpune indukcije, lako je dokazati generalizaciju formule (10.2.26) na proizvoljan broj nezavisnih članova.

Uz karakteristike položaja - prosječne, tipične vrijednosti slučajne varijable - koriste se brojne karakteristike, od kojih svaka opisuje jedno ili drugo svojstvo distribucije. Kao takve karakteristike najčešće se koriste tzv. momenti.

Koncept momenta se široko koristi u mehanici za opisivanje raspodjele masa (statički momenti, momenti inercije, itd.). Potpuno iste metode se koriste u teoriji vjerovatnoće za opisivanje osnovnih svojstava distribucije slučajne varijable. U praksi se najčešće koriste dvije vrste momenata: početni i centralni.

Početni trenutak s-tog reda diskontinuirane slučajne varijable je zbir oblika:

. (5.7.1)

Očigledno, ova definicija se poklapa sa definicijom početnog momenta reda s u mehanici, ako su mase koncentrisane u tačkama na x-osi.

Za kontinuiranu slučajnu varijablu X, početni moment s-tog reda je integral

. (5.7.2)

Lako je uočiti da glavna karakteristika pozicije uvedene u prethodnom n° - matematičko očekivanje - nije ništa drugo do prvi početni trenutak slučajne varijable.

Koristeći znak očekivanja, možemo kombinirati dvije formule (5.7.1) i (5.7.2) u jednu. Zaista, formule (5.7.1) i (5.7.2) su po strukturi potpuno slične formulama (5.6.1) i (5.6.2), s tom razlikom što umjesto i postoje, respektivno, i . Stoga možemo napisati opštu definiciju početnog momenta -tog reda, koja vrijedi i za diskontinuirane i za kontinuirane veličine:

, (5.7.3)

one. početni trenutak th reda slučajne varijable je matematičko očekivanje th stepena ove slučajne varijable.

Prije nego što damo definiciju centralnog momenta, uvodimo novi koncept "centrirane slučajne varijable".

Neka postoji slučajna varijabla s matematičkim očekivanjem. Centrirana slučajna varijabla koja odgovara vrijednosti je odstupanje slučajne varijable od njenog matematičkog očekivanja:

U nastavku ćemo se svugdje složiti da centriranu slučajnu varijablu koja odgovara datoj slučajnoj varijabli označimo istim slovom sa ikonicom na vrhu.

Lako je provjeriti da je matematičko očekivanje centrirane slučajne varijable jednako nuli. Zaista, za diskontinuiranu količinu

slično za kontinuiranu količinu.

Centriranje slučajne varijable je, očigledno, jednako pomeranju ishodišta u srednju, "centralnu" tačku, čija je apscisa jednaka matematičkom očekivanju.

Momenti centrirane slučajne varijable nazivaju se centralni momenti. Oni su analogni trenucima o centru gravitacije u mehanici.

Dakle, središnji moment reda s slučajne varijable je matematičko očekivanje th stepena odgovarajuće centrirane slučajne varijable:

, (5.7.6)

a za kontinuirano - integralno

. (5.7.8)

U nastavku, u slučajevima kada nema sumnje o tome kojoj slučajnoj varijabli pripada dati trenutak, radi kratkoće ćemo pisati jednostavno i umjesto i .

Očigledno, za bilo koju slučajnu varijablu, centralni moment prvog reda jednak je nuli:

, (5.7.9)

budući da je matematičko očekivanje centrirane slučajne varijable uvijek nula.

Izvedemo relacije koje povezuju centralne i početne momente različitih redova. Izvođenje ćemo izvršiti samo za diskontinuirane količine; lako je provjeriti da potpuno iste relacije vrijede za kontinuirane veličine, ako konačne sume zamijenimo integralima, a vjerovatnoće elementima vjerovatnoće.

Uzmite u obzir drugu centralnu tačku:

Slično, za treći centralni trenutak dobijamo:

Izrazi za itd. može se dobiti na sličan način.

Dakle, za centralne momente bilo koje slučajne varijable vrijede formule:

(5.7.10)

Uopšteno govoreći, momenti se mogu razmatrati ne samo u odnosu na ishodište (početni momenti) ili matematičko očekivanje (centralni momenti), već iu odnosu na proizvoljnu tačku:

. (5.7.11)

Međutim, centralni momenti imaju prednost u odnosu na sve ostale: prvi centralni moment, kao što smo videli, uvek je jednak nuli, a drugi centralni moment koji sledi, za ovaj referentni okvir, ima minimalnu vrednost. Dokažimo to. Za diskontinuiranu slučajnu varijablu na , formula (5.7.11) ima oblik:

. (5.7.12)

Hajde da transformišemo ovaj izraz:

Očigledno, ova vrijednost dostiže svoj minimum kada , tj. kada se uzme trenutak u odnosu na tačku .

Od svih momenata, kao karakteristike slučajne varijable najčešće se koriste prvi početni moment (očekivanje) i drugi centralni moment.

Drugi centralni moment naziva se varijansa slučajne varijable. S obzirom na izuzetnu važnost ove karakteristike, između ostalog, za nju uvodimo posebnu oznaku:

Prema definiciji centralnog momenta

, (5.7.13)

one. varijansa slučajne varijable X je matematičko očekivanje kvadrata odgovarajuće centrirane varijable.

Zamjenjujući u izrazu (5.7.13) vrijednost njegovog izraza, također imamo:

. (5.7.14)

Za direktno izračunavanje varijanse koriste se sljedeće formule:

, (5.7.15)

(5.7.16)

Odnosno za diskontinuirane i kontinuirane količine.

Disperzija slučajne varijable je karakteristika disperzije, disperzija vrijednosti slučajne varijable oko njenog matematičkog očekivanja. Sama riječ "disperzija" znači "raspršivanje".

Ako se okrenemo mehaničkom tumačenju raspodjele, onda disperzija nije ništa drugo do moment inercije date raspodjele mase u odnosu na centar gravitacije (matematičko očekivanje).

Varijanca slučajne varijable ima dimenziju kvadrata slučajne varijable; Za vizuelnu karakterizaciju raspršenja, pogodnije je koristiti veličinu čija se dimenzija poklapa s onom slučajne varijable. Da biste to učinili, uzmite kvadratni korijen disperzije. Rezultirajuća vrijednost naziva se standardna devijacija (inače - "standard") slučajne varijable. Srednja kvadratna devijacija će biti označena sa:

, (5.7.17)

Da bismo pojednostavili zapise, često ćemo koristiti skraćenu notaciju za standardnu ​​devijaciju i varijansu: i . U slučaju kada nema sumnje na koju se slučajnu varijablu odnose ove karakteristike, ponekad ćemo izostaviti znak x y i i pisati jednostavno i . Riječi "standardna devijacija" ponekad će biti skraćene slovima s.c.o.

U praksi se često koristi formula koja izražava varijansu slučajne varijable u smislu njenog drugog početnog momenta (druga od formula (5.7.10)). U novoj notaciji to će izgledati ovako:

Matematičko očekivanje i varijansa (ili standardna devijacija) su najčešće korištene karakteristike slučajne varijable. Oni karakterišu najvažnije karakteristike distribucije: njen položaj i stepen disperzije. Za detaljniji opis distribucije koriste se momenti višeg reda.

Treći središnji momenat služi za karakterizaciju asimetrije (ili "iskrivljenosti") distribucije. Ako je raspodjela simetrična u odnosu na matematičko očekivanje (ili, u mehaničkom tumačenju, masa je raspoređena simetrično u odnosu na centar gravitacije), tada su svi momenti neparnog reda (ako postoje) jednaki nuli. Zaista, ukupno

sa distribucijom koja je simetrična u odnosu na zakon raspodjele i neparna, svakom pozitivnom članu odgovara negativan član koji mu je jednak u apsolutnoj vrijednosti, tako da je cijeli zbir jednak nuli. Isto je očigledno i za integral

,

koja je jednaka nuli kao integral u simetričnim granicama neparne funkcije.

Stoga je prirodno odabrati bilo koji od neparnih momenata kao karakteristiku asimetrije raspodjele. Najjednostavniji od njih je treći centralni momenat. Ima dimenziju kocke slučajne varijable: da bi se dobila bezdimenzionalna karakteristika, treći momenat se dijeli sa kockom standardne devijacije. Rezultirajuća vrijednost se naziva "koeficijent asimetrije" ili jednostavno "asimetrija"; označit ćemo ga:

Na sl. 5.7.1 prikazuje dvije iskrivljene distribucije; jedna od njih (kriva I) ima pozitivnu asimetriju (); druga (kriva II) je negativna ().

Četvrti centralni momenat služi za karakterizaciju takozvane "hladnoće", tj. vršna ili ravna distribucija. Ova svojstva distribucije su opisana korišćenjem takozvanog kurtosisa. Kurtozis slučajne varijable je količina

Od omjera se oduzima broj 3 jer je za vrlo važan i u prirodi rasprostranjen zakon normalne raspodjele (koji ćemo kasnije detaljnije upoznati). Dakle, za normalnu distribuciju, eksces je nula; krive koje su šiljatije od normalnih krivih imaju pozitivan eksces; krive su više ravnih vrhova - negativnim ekscesom.

Na sl. 5.7.2 predstavlja: normalna distribucija(kriva I), distribucija sa pozitivnim kurtozom (kriva II), i distribucija sa negativnim ekscesom (kriva III).

Pored početnih i centralnih momenata o kojima je gore bilo reči, u praksi se ponekad koriste i takozvani apsolutni momenti (početni i centralni), definisani formulama

Očigledno, apsolutni momenti parnih redova poklapaju se sa običnim momentima.

Od apsolutnih momenata najčešće se koristi prvi apsolutni centralni moment.

, (5.7.21)

zove se aritmetička srednja devijacija. Uz disperziju i standardnu ​​devijaciju, aritmetička srednja devijacija se ponekad koristi kao karakteristika disperzije.

Matematičko očekivanje, mod, medijan, početni i centralni momenti i, posebno, varijansa, standardna devijacija, nagib i eksces su najčešće korištene numeričke karakteristike slučajnih varijabli. U mnogim praktičnim problemima, potpuna karakterizacija slučajne varijable - zakon raspodjele - ili nije potrebna ili se ne može dobiti. U ovim slučajevima, oni su ograničeni na približan opis slučajne varijable uz pomoć. Numeričke karakteristike, od kojih svaka izražava neko karakteristično svojstvo distribucije.

Vrlo često se numeričke karakteristike koriste za aproksimaciju zamjene jedne distribucije drugom, a obično pokušavaju izvršiti tu zamjenu tako da nekoliko važnih tačaka ostane nepromijenjeno.

Primjer 1. Izvodi se jedan eksperiment, kao rezultat kojeg se može pojaviti ili ne mora pojaviti događaj čija je vjerovatnoća jednaka . Razmatra se slučajna varijabla - broj pojavljivanja događaja (karakteristična slučajna varijabla događaja). Odrediti njegove karakteristike: matematičko očekivanje, varijansu, standardnu ​​devijaciju.

Rješenje. Serija raspodjele količine ima oblik:

gdje je vjerovatnoća da se događaj neće dogoditi.

Prema formuli (5.6.1) nalazimo matematičko očekivanje vrijednosti:

Disperzija vrijednosti određena je formulom (5.7.15):

(Pozivamo čitaoca da dobije isti rezultat izražavanjem varijanse u terminima drugog početnog momenta).

Primjer 2. Tri nezavisna hica se ispaljuju u metu; vjerovatnoća da ćete pogoditi svaki metak je 0,4. slučajna varijabla je broj pogodaka. Odrediti karakteristike veličine - matematičko očekivanje, disperzija, s.c.o., asimetrija.

Rješenje. Serija raspodjele količine ima oblik:

Izračunavamo numeričke karakteristike količine:

Imajte na umu da se iste karakteristike mogu mnogo jednostavnije izračunati korištenjem teorema o numeričkim karakteristikama funkcija (vidi Poglavlje 10).

Disperzija slučajne varijable je mjera širenja vrijednosti ove varijable. Mala varijansa znači da su vrijednosti grupisane blizu jedna drugoj. Velika varijansa ukazuje na snažno raspršivanje vrijednosti. U statistici se koristi koncept disperzije slučajne varijable. Na primjer, ako uporedite varijansu vrijednosti dvije veličine (kao što su rezultati opservacija pacijenata muškog i ženskog pola), možete testirati značaj neke varijable. Varijanca se takođe koristi pri izgradnji statističkih modela, jer mala varijansa može biti znak da preterujete vrednosti.

Koraci

Izračun varijance uzorka

    Zabilježite vrijednosti uzorka. U većini slučajeva statističarima su dostupni samo uzorci određenih populacija. Na primjer, statističari po pravilu ne analiziraju troškove održavanja populacije svih automobila u Rusiji - oni analiziraju slučajni uzorak od nekoliko hiljada automobila. Takav uzorak pomoći će u određivanju prosječne cijene po automobilu, ali najvjerovatnije će rezultirajuća vrijednost biti daleko od stvarne.

    • Na primjer, analizirajmo broj peciva prodanih u kafiću za 6 dana, uzetih nasumično. Uzorak ima sljedeći oblik: 17, 15, 23, 7, 9, 13. Ovo je uzorak, a ne populacija, jer nemamo podatke o prodatim pecivama za svaki dan rada kafića.
    • Ako vam je data populacija, a ne uzorak vrijednosti, pređite na sljedeći odjeljak.
  1. Zapišite formulu za izračunavanje varijanse uzorka. Disperzija je mjera širenja vrijednosti neke veličine. Što je vrijednost disperzije bliža nuli, to su vrijednosti bliže grupisane. Kada radite s uzorkom vrijednosti, koristite sljedeću formulu za izračunavanje varijanse:

    Calculate Average uzorci. Označava se kao x̅. Srednja vrijednost uzorka se izračunava kao normalna aritmetička sredina: zbrojite sve vrijednosti u uzorku, a zatim podijelite rezultat s brojem vrijednosti u uzorku.

    • U našem primjeru dodajte vrijednosti u uzorku: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Sada podijelite rezultat s brojem vrijednosti u uzorku (u našem primjeru ima 6): 84 ÷ 6 = 14.
      Srednja vrijednost uzorka x̅ = 14.
    • Srednja vrijednost uzorka je centralni značaj, oko koje su vrijednosti u uzorku raspoređene. Ako se vrijednosti u uzorku grupišu oko srednje vrijednosti uzorka, tada je varijansa mala; inače, disperzija je velika.
  2. Oduzmite srednju vrijednost uzorka od svake vrijednosti u uzorku. Sada izračunajte razliku x i (\displaystyle x_(i))- x̅, gdje x i (\displaystyle x_(i))- svaku vrijednost u uzorku. Svaki rezultat pokazuje stepen odstupanja određene vrijednosti od srednje vrijednosti uzorka, odnosno koliko je ta vrijednost udaljena od srednje vrijednosti uzorka.

    Kao što je gore navedeno, zbir razlika x i (\displaystyle x_(i))- x̅ mora biti jednako nuli. To znači da je srednja varijansa uvijek nula, što ne daje nikakvu predstavu o širenju vrijednosti neke veličine. Da biste riješili ovaj problem, kvadrirajte svaku razliku x i (\displaystyle x_(i))- x̅. Ovo će rezultirati time da dobijete samo pozitivne brojeve koji, kada se zbroje, nikada neće dati 0.

    Izračunajte zbir kvadrata razlika. Odnosno, pronađite dio formule koji je napisan ovako: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Ovdje znak Σ označava zbir kvadrata razlika za svaku vrijednost x i (\displaystyle x_(i)) u uzorku. Već ste pronašli kvadratne razlike (x i (\displaystyle (x_(i))-x̅) 2 (\displaystyle ^(2)) za svaku vrijednost x i (\displaystyle x_(i)) u uzorku; sada samo dodajte ove kvadrate.

    • U našem primjeru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  3. Podijelite rezultat sa n - 1, gdje je n broj vrijednosti u uzorku. Prije nekog vremena, da bi izračunali varijansu uzorka, statističari su jednostavno podijelili rezultat sa n; u ovom slučaju, dobićete srednju vrednost kvadratne varijanse, koja je idealna za opisivanje varijanse datog uzorka. Ali zapamtite da je svaki uzorak samo mali dio. stanovništva vrijednosti. Ako uzmete drugačiji uzorak i izvršite iste proračune, dobit ćete drugačiji rezultat. Kako se ispostavilo, dijeljenje sa n - 1 (a ne samo s n) daje bolju procjenu varijanse populacije, što je ono što tražite. Dijeljenje sa n - 1 postalo je uobičajeno, pa je uključeno u formulu za izračunavanje varijanse uzorka.

    Razlika između varijanse i standardne devijacije. Imajte na umu da formula sadrži eksponent, pa se varijansa mjeri u kvadratnim jedinicama analizirane vrijednosti. Ponekad je takvom vrijednošću prilično teško upravljati; u takvim slučajevima koristite standardnu ​​devijaciju, koja je jednaka kvadratni korijen od disperzije. Zbog toga se varijansa uzorka označava kao s 2 (\displaystyle s^(2)), i standardna devijacija uzorka kao s (\displaystyle s).

    • U našem primjeru, standardna devijacija uzorka je: s = √33,2 = 5,76.

    Proračun varijanse stanovništva

    1. Analizirajte neki skup vrijednosti. Skup uključuje sve vrijednosti količine koja se razmatra. Na primjer, ako proučavate starost stanovnika Lenjingradske regije, tada populacija uključuje starost svih stanovnika ove regije. U slučaju rada sa agregatom, preporučuje se kreiranje tabele i unos vrednosti agregata u nju. Razmotrite sljedeći primjer:

      Zapišite formulu za izračunavanje varijanse populacije. Budući da populacija uključuje sve vrijednosti određene količine, sljedeća formula vam omogućava da dobijete točnu vrijednost varijanse populacije. Da bi razlikovali varijansu populacije od varijance uzorka (koja je samo procjena), statističari koriste različite varijable:

      Izračunajte srednju vrijednost stanovništva. Kada se radi sa opštom populacijom, njena prosečna vrednost se označava kao μ (mu). Srednja populacija se izračunava kao uobičajena aritmetička sredina: zbrojite sve vrijednosti u populaciji, a zatim podijelite rezultat s brojem vrijednosti u populaciji.

      Oduzmite srednju vrijednost populacije od svake vrijednosti u populaciji.Što je vrijednost razlike bliža nuli, to je određena vrijednost bliža srednjoj vrijednosti stanovništva. Pronađite razliku između svake vrijednosti u populaciji i njene srednje vrijednosti, i dobićete prvi pogled na distribuciju vrijednosti.

      Kvadrirajte svaki rezultat koji dobijete. Vrijednosti razlike bit će i pozitivne i negativne; ako ove vrijednosti stavite na brojevnu pravu, onda će ležati desno i lijevo od srednje vrijednosti populacije. Ovo nije dobro za izračunavanje varijanse, jer se pozitivni i negativni brojevi međusobno poništavaju. Stoga kvadrirajte svaku razliku da dobijete isključivo pozitivne brojeve.

      Pronađite prosjek dobijenih rezultata. Otkrili ste koliko je svaka vrijednost u populaciji udaljena od svoje srednje vrijednosti. Pronađite srednju vrijednost zbira kvadrata razlika tako što ćete je podijeliti s brojem vrijednosti u populaciji.

    2. Spoji ovo rješenje sa formulom. Ako ne razumijete kako se gornje rješenje odnosi na formulu, u nastavku je objašnjenje rješenja:

      • Pronađemo razliku između svake vrijednosti i srednje vrijednosti populacije, a zatim svaku razliku kvadriramo, odnosno dobijemo ( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)), (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) i tako sve dok ( x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)), gdje x n (\displaystyle x_(n)) je posljednja vrijednost u populaciji.
      • Da biste izračunali prosječnu vrijednost dobijenih rezultata, morate pronaći njihov zbir i podijeliti ga sa n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Sada napišimo gornje objašnjenje koristeći varijable: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n i dobijemo formulu za izračunavanje varijanse populacije.

Definicija.disperzija (raspršenje) Diskretna slučajna varijabla naziva se matematičko očekivanje kvadratnog odstupanja slučajne varijable od njenog matematičkog očekivanja:

Primjer. Za gornji primjer nalazimo

Matematičko očekivanje slučajne varijable je:

Moguće vrijednosti kvadratne devijacije:

; ;

Disperzija je:

Međutim, u praksi je ova metoda izračunavanja varijanse nezgodna, jer dovodi do glomaznih proračuna za veliki broj vrijednosti slučajne varijable. Stoga se koristi druga metoda.

Izračun varijance

Teorema. Varijanca je jednaka razlici između matematičkog očekivanja kvadrata slučajne varijable X i kvadrata njenog matematičkog očekivanja:

Dokaz. Uzimajući u obzir činjenicu da su matematičko očekivanje i kvadrat matematičkog očekivanja konstantne vrijednosti, možemo napisati:

Primijenimo ovu formulu na gornji primjer:

X
x2
str 0,0778 0,2592 0,3456 0,2304 0,0768 0,0102

Svojstva disperzije

1) Disperzija konstantna vrijednost jednako nuli:

2) Konstantni faktor se može izvući iz znaka disperzije kvadriranjem:

.

3) Varijanca zbira dvije nezavisne slučajne varijable jednaka je zbroju varijansi ovih varijabli:

4) Varijanca razlike dvije nezavisne slučajne varijable jednaka je zbiru varijansi ovih varijabli:

Valjanost ove jednakosti proizlazi iz svojstva 2.

Teorema. Varijanca broja pojavljivanja događaja A u n nezavisnih pokušaja, u svakom od kojih je vjerovatnoća nastanka događaja konstantna, jednaka je umnošku broja pokušaja sa vjerovatnoćom nastanka i vjerovatnoćom događaja ne pojavljuje u svakom ispitivanju:

Primjer. Fabrika proizvodi 96% proizvoda prvog razreda i 4% proizvoda drugog razreda. 1000 stavki se bira nasumično. Neka X- broj proizvoda prvog razreda u ovom uzorku. Naći zakon raspodjele, matematičko očekivanje i varijansu slučajne varijable.

Dakle, zakon raspodjele se može smatrati binomnim.

Primjer. Pronađite varijansu diskretne slučajne varijable X– broj pojavljivanja događaja ALI u dva nezavisna pokusa, ako su vjerovatnoće pojave ovog događaja u svakom ogledu jednake i poznato je da

Jer slučajna vrijednost X raspoređeno prema binomskom zakonu, dakle

Primjer. Nezavisni testovi se izvode sa istom vjerovatnoćom nastanka događaja ALI u svakom testu. Pronađite vjerovatnoću da se neki događaj dogodi ALI ako je varijansa broja pojavljivanja događaja u tri nezavisna ispitivanja 0,63.

Prema formuli disperzije binomnog zakona dobijamo:

;

Primjer. Testira se uređaj koji se sastoji od četiri uređaja koji nezavisno rade. Vjerojatnosti kvara svakog od uređaja su jednake ; ; . Pronađite matematičko očekivanje i varijansu broja neispravnih uređaja.

Uzimajući broj neispravnih uređaja kao slučajnu varijablu, vidimo da ova slučajna varijabla može poprimiti vrijednosti 0, 1, 2, 3 ili 4.

Da bi se napravio zakon raspodjele za ovu slučajnu varijablu, potrebno je odrediti odgovarajuće vjerovatnoće. Hajde da prihvatimo.

1) Nijedan uređaj nije pokvario:

2) Jedan od uređaja nije uspio.

disperzija (rasipanje) slučajne varijable je matematičko očekivanje kvadratnog odstupanja slučajne varijable od njenog matematičkog očekivanja:

Da biste izračunali varijansu, možete koristiti malo izmijenjenu formulu

jer M(X), 2 i
su konstantne vrijednosti. Na ovaj način,

4.2.2. Svojstva disperzije

Nekretnina 1. Disperzija konstantne vrijednosti je nula. Zaista, po definiciji

Nekretnina 2. Konstantni faktor se može izvući iz znaka disperzije kvadraturom.

Dokaz

Centrirano slučajna varijabla je odstupanje slučajne varijable od njenog matematičkog očekivanja:

Centrirana vrijednost ima dva svojstva koja su pogodna za transformaciju:

Nekretnina 3. Ako su slučajne varijable X i Y nezavisni, dakle

Dokaz. Označite
. Onda.

U drugom terminu, zbog nezavisnosti slučajnih varijabli i svojstava centriranih slučajnih varijabli

Primjer 4.5. Ako a a i b su konstantne, onda D (aX+b)= D(aX)+D(b)=
.

4.2.3. Standardna devijacija

Disperzija, kao karakteristika širenja slučajne varijable, ima jedan nedostatak. ako npr. X– greška mjerenja ima dimenziju MM, tada varijansa ima dimenziju
. Stoga se često preferira korištenje druge karakteristike raspršivanja - standardna devijacija , što je jednako kvadratnom korijenu varijanse

Standardna devijacija ima istu dimenziju kao i sama slučajna varijabla.

Primjer 4.6. Varijanca broja pojavljivanja događaja u šemi nezavisnih ispitivanja

Proizvedeno n nezavisnih ispitivanja i vjerovatnoća da će se događaj dogoditi u svakom ispitivanju je R. Izražavamo, kao i ranije, broj pojavljivanja događaja X kroz broj pojavljivanja događaja u pojedinačnim eksperimentima:

Budući da su eksperimenti nezavisni, slučajne varijable su povezane s eksperimentima nezavisni. I to na osnovu nezavisnosti imamo

Ali svaka od slučajnih varijabli ima zakon distribucije (primjer 3.2)

i
(primjer 4.4). Dakle, po definiciji varijanse:

gdje q=1- str.

Kao rezultat, imamo
,

Standardna devijacija broja pojavljivanja događaja u n nezavisni eksperimenti
.

4.3. Trenuci slučajnih varijabli

Pored već razmatranih, slučajne varijable imaju mnoge druge numeričke karakteristike.

Početni trenutak k X (
) naziva se matematičko očekivanje k th stepen ove slučajne varijable.

Central point k slučajna varijabla -tog reda X se zove očekivanje k th stepen odgovarajuće centrirane veličine.

Lako je vidjeti da je centralni moment prvog reda uvijek jednak nuli, centralni moment drugog reda jednak je disperziji, jer .

Centralni momenat trećeg reda daje ideju o asimetriji distribucije slučajne varijable. Trenuci reda veći od drugog koriste se relativno rijetko, pa ćemo se ograničiti na njihove koncepte.

4.4. Primjeri pronalaženja zakona distribucije

Razmotrimo primjere pronalaženja zakona distribucije slučajnih varijabli i njihovih numeričkih karakteristika.

Primjer 4.7.

Sastaviti zakon raspodjele za broj pogodaka u metu sa tri hica u metu, ako je vjerovatnoća pogađanja sa svakim hicem 0,4. Pronađite integralnu funkciju F(X) za rezultujuću distribuciju diskretne slučajne varijable X i nacrtaj njegov graf. Pronađite matematičko očekivanje M(X) , disperzija D(X) i standardnu ​​devijaciju
(X) slučajna varijabla X.

Rješenje

1) Diskretna slučajna varijabla X- broj pogodaka u metu sa tri hica - može imati četiri vrijednosti: 0, 1, 2, 3 . Vjerovatnoću da će prihvatiti svaku od njih nalazimo po Bernoullijevoj formuli za: n=3,str=0,4,q=1- str=0,6 i m=0, 1, 2, 3:

Dobiti vjerovatnoće mogućih vrijednosti X:;

Sastavimo željeni zakon raspodjele slučajne varijable X:

Kontrola: 0,216+0,432+0,288+0,064=1.

Napravimo poligon distribucije dobijene slučajne varijable X. Da biste to učinili, u pravougaonom koordinatnom sistemu označite tačke (0; 0,216), (1; 0,432), (2; 0,288), (3; 0,064). Povežimo ove tačke sa segmentima linija, a rezultirajuća izlomljena linija je željeni poligon distribucije (slika 4.1).

2) Ako je x 0, onda F(X)=0. Zaista, za vrijednosti manje od nule, vrijednost X ne prihvata. Stoga, za sve X0, koristeći definiciju F(X), dobijamo F(X)=P(X< x) =0 (kao vjerovatnoća nemogućeg događaja).

Ako je 0 , onda F(X) =0,216. Zaista, u ovom slučaju F(X)=P(X< x) = =P(- < X 0)+ P(0< X< x) =0,216+0=0,216.

Ako uzmemo npr. X=0,2, dakle F(0,2)=P(X<0,2) . Ali vjerovatnoća događaja X<0,2 равна 0,216, так как случайная величинаX samo u jednom slučaju uzima vrijednost manju od 0,2, tj 0 sa vjerovatnoćom od 0,216.

Ako 1 , onda

stvarno, X može uzeti vrijednost 0 sa vjerovatnoćom od 0,216 i vrijednost 1 s vjerovatnoćom od 0,432; dakle, jedna od ovih vrijednosti, bez obzira na koju, X može prihvatiti (prema teoremi sabiranja vjerovatnoća nespojivih događaja) sa vjerovatnoćom od 0,648.

Ako 2 , onda, argumentirajući slično, dobijamo F(X)=0,216+0,432 + + 0,288=0,936. Zaista, neka npr. X=3. Onda F(3)=P(X<3) izražava vjerovatnoću događaja X<3 – стрелок сделает меньше трех попаданий, т.е. ноль, один или два. Применяя теорему сложения вероятностей, получим указанное значение функцииF(X).

Ako a x>3, onda F(X)=0,216+0,432+0,288+0,064=1. Zaista, događaj X
je pouzdan i njegova vjerovatnoća jednaka je jedan, i X>3 - nemoguće. S obzirom na to

F(X)=P(X< x) =P(X 3) + P(3< X< x) , dobijamo naznačeni rezultat.

Dakle, dobijena je željena funkcija integralne distribucije slučajne varijable X:

F(x) =

čiji je grafikon prikazan na sl. 4.2.

3) Matematičko očekivanje diskretne slučajne varijable jednako je zbroju proizvoda svih mogućih vrijednosti X o njihovim vjerovatnoćama:

M(X)=0=1,2.

Odnosno, u prosjeku ima jedan pogodak u metu sa tri udarca.

Varijanca se može izračunati iz definicije varijanse D(X)= M(X- M(X)) ili koristite formulu D(X)= M(X
, što brže vodi do cilja.

Napišimo zakon raspodjele slučajne varijable X :

Pronađite matematičko očekivanje za X:

M(X ) = 04
= 2,16.

Izračunajmo željenu varijansu:

D(X) = M(X ) – (M(X)) = 2,16 – (1,2)= 0,72.

Srednja kvadratna devijacija se nalazi po formuli

(X) =
= 0,848.

Interval ( M- ; M+ ) = (1,2-0,85; 1,2+0,85) = (0,35; 2,05) - interval najvjerovatnijih vrijednosti slučajne varijable X, vrijednosti 1 i 2 padaju u njega.

Primjer 4.8.

Zadana je funkcija diferencijalne distribucije (funkcija gustine) kontinuirane slučajne varijable X:

f(x) =

1) Definirajte konstantni parametar a.

2) Naći integralnu funkciju F(x) .

3) Iscrtajte grafove funkcija f(x) i F(x) .

4) Pronađite dva načina vjerovatnoća P(0.5< X 1,5) i P(1,5< X<3,5) .

5). Pronađite matematičko očekivanje M(X), disperzija D(X) i standardnu ​​devijaciju
slučajna varijabla X.

Rješenje

1) Diferencijalna funkcija po svojstvu f(x) mora zadovoljiti uslov
.

Izračunajmo ovaj nepravilni integral za datu funkciju f(x) :

Zamjenom ovog rezultata u lijevu stranu jednakosti, dobijamo to a=1. U stanju za f(x) promijenite parametar a na 1:

2) Pronaći F(x) koristite formulu

.

Ako je x
, onda
, Shodno tome,

Ako 1
onda

Ako je x>2 onda

Dakle, željena integralna funkcija F(x) izgleda kao:

3) Napravimo grafove funkcija f(x) i F(x) (sl. 4.3 i 4.4).

4) Vjerovatnoća pogađanja slučajne varijable u datom intervalu (a,b) izračunato po formuli
, ako je funkcija poznata f(x), i po formuli P(a < X < b) = F(b) – F(a), ako je funkcija poznata F(x).

Hajde da nađemo
koristeći dvije formule i uporedite rezultate. Po uslovu a=0,5;b=1,5; funkcija f(X) navedeno u stavu 1). Dakle, željena vjerovatnoća prema formuli je:

Ista vjerovatnoća se može izračunati po formuli b) kroz prirast dobijen u stavu 2). integralna funkcija F(x) na ovom intervalu:

Jer F(0,5)=0.

Slično, nalazimo

jer F(3,5)=1.

5) Pronaći matematičko očekivanje M(X) koristite formulu
Funkcija f(x) dat u odluci iz stava 1.), van intervala (1,2] jednaka je nuli:

Disperzija kontinuirane slučajne varijable D(X) definisana je jednakošću

, ili ekvivalentna jednakost


.

Za nalaz D(X) koristimo posljednju formulu i uzimamo u obzir da su sve moguće vrijednosti f(x) pripadaju intervalu (1,2]:

Standardna devijacija
=
=0,276.

Interval najvjerovatnijih vrijednosti slučajne varijable X jednaki

(M-
,M+
) = (1,58-0,28; 1,58+0,28) = (1,3; 1,86).