Karakteristike raspršivanja

Mjere disperzije uzorka.

Minimum i maksimum uzorka su, respektivno, najmanja i najveća vrijednost varijable koja se proučava. Razlika između maksimuma i minimuma se naziva u velikim razmjerima uzorci. Svi podaci uzorka nalaze se između minimuma i maksimuma. Ovi indikatori, takoreći, ocrtavaju granice uzorka.

R#1= 15,6-10=5,6

R №2 = 0,85-0,6 = 0,25

Varijanca uzorka(engleski) varijansa) i standardna devijacija uzorci (engleski) standardna devijacija) je mjera varijabilnosti varijable i karakteriše stepen širenja podataka oko centra. Istovremeno, standardna devijacija je pogodniji indikator zbog činjenice da ima istu dimenziju kao i stvarni podaci koji se proučavaju. Stoga se indikator standardne devijacije koristi zajedno sa vrijednošću aritmetičke sredine uzorka kako bi se ukratko opisali rezultati analize podataka.

Prikladnije je izračunati varijansu uzorka po formuli:

Standardna devijacija se izračunava pomoću formule:

Koeficijent varijacije je relativna mjera širenja obilježja.

Koeficijent varijacije se takođe koristi kao indikator homogenosti posmatranja uzorka. Vjeruje se da ako koeficijent varijacije ne prelazi 10%, onda se uzorak može smatrati homogenim, tj. stanovništva.

Pošto je koeficijent varijacije u oba uzorka, oni su homogeni.

Uzorak se može analitički predstaviti u obliku funkcije distribucije, kao i u obliku tablice frekvencija koja se sastoji od dva reda. U gornjem redu - elementi uzorka (opcije), poredani uzlaznim redoslijedom; donja linija bilježi opciju frekvencije.

Učestalost opcija je broj jednak broju ponavljanja ove opcije u uzorku.

Uzorak #1 "Majke"

Vrsta krivulje distribucije

Asimetrija ili koeficijent asimetrije (termin je prvi uveo Pearson, 1895) je mjera asimetrije distribucije. Ako je asimetrija izrazito različita od 0, distribucija je iskrivljena, gustina normalna distribucija simetrično u odnosu na prosjek.

Indeks asimetrije(engleski) iskrivljenost) se koristi za karakterizaciju stepena simetrije u distribuciji podataka oko centra. Asimetrija može imati i negativne i pozitivne vrijednosti. Pozitivna vrijednost ovog parametra označava da su podaci pomaknuti lijevo od centra, negativna vrijednost - udesno. Dakle, predznak indeksa skewnessa ukazuje na smjer pristranosti podataka, dok veličina ukazuje na stepen ove pristranosti. Kosina jednaka nuli ukazuje da su podaci simetrično koncentrisani oko centra.

Jer asimetrija je pozitivna, stoga je vrh krivulje pomjeren ulijevo od centra.

Kurtosis koeficijent(engleski) kurtosis) je mjera za to koliko čvrsto se većina podataka grupira oko centra.

Sa pozitivnim ekscesom, kriva se izoštrava, sa negativnim ekscesom se izglađuje.

Kriva je spljoštena;

Kriva se izoštrava.

Jedan od razloga za održavanje Statistička analiza sastoji se u potrebi da se uzme u obzir uticaj slučajnih faktora (perturbacija) na indikator koji se proučava, koji dovode do rasijanja (razbacanosti) podataka. Rješavanje problema u kojima je prisutna raštrkanost podataka povezano je s rizikom, jer čak i kada se koristi cjelina dostupne informacije zabranjeno je upravo predvidjeti šta će se dogoditi u budućnosti. Za adekvatan rad u takvim situacijama, preporučljivo je razumjeti prirodu rizika i moći odrediti stepen disperzije skupa podataka. Postoje tri numeričke karakteristike koje opisuju meru disperzije: standardna devijacija, opseg i koeficijent varijacije (varijabilnost). Za razliku od tipičnih indikatora (srednja vrijednost, medijan, mod) koji karakteriziraju centar, karakteristike raspršenja pokazuju koliko blizu do ovog centra su pojedinačne vrijednosti skupa podataka
Definicija standardne devijacije Standardna devijacija(standardna devijacija) je mjera nasumičnih odstupanja vrijednosti podataka od srednje vrijednosti. AT pravi zivot većinu podataka karakteriše raspršivanje, tj. pojedinačne vrijednosti su na određenoj udaljenosti od prosjeka.
Nemoguće je koristiti standardnu ​​devijaciju kao generalizirajuću karakteristiku raspršenja jednostavnim usrednjavanjem devijacija podataka, jer će se neka odstupanja pokazati pozitivnima, a drugi negativni, i kao rezultat toga, prosjek rezultat može biti nula. Da biste se riješili negativnog predznaka, koristi se standardni trik: prvo izračunajte disperzija kao zbir kvadrata odstupanja podijeljen sa ( n–1), a zatim se iz rezultirajuće vrijednosti uzima kvadratni korijen. Formula za izračunavanje standardne devijacije je sljedeća: Napomena 1. Varijanca ne nosi nikakvu Dodatne informacije u poređenju sa standardnom devijacijom, ali ju je teže protumačiti, jer se izražava u "jedinicama na kvadrat", dok se standardna devijacija izražava u nama poznatim jedinicama (na primjer, u dolarima). Napomena 2. Gornja formula služi za izračunavanje standardne devijacije uzorka i preciznije se zove uzorak standardne devijacije. Prilikom izračunavanja standardne devijacije stanovništva(označeno simbolom s) podijeli sa n. Vrijednost standardne devijacije uzorka je nešto veća (jer je podijeljena sa n–1), što daje korekciju za slučajnost samog uzorka. U slučaju kada skup podataka ima normalnu distribuciju, standardna devijacija poprima posebno značenje. Na donjoj slici, oznake su postavljene na obje strane srednje vrijednosti na udaljenosti od jedne, dvije i tri standardne devijacije, respektivno. Slika pokazuje da je otprilike 66,7% (dvije trećine) svih vrijednosti unutar jedne standardne devijacije s obje strane srednje vrijednosti, 95% vrijednosti će biti unutar dvije standardne devijacije srednje vrijednosti, a gotovo sve podaci (99,7%) će biti unutar tri standardne devijacije srednje vrijednosti.
66,7%


Ovo svojstvo standardne devijacije za normalno raspoređene podatke naziva se "pravilo dvije trećine".

U nekim situacijama, kao što je analiza kontrole kvaliteta proizvoda, granice se često postavljaju tako da se ona zapažanja (0,3%) koja su više od tri standardna odstupanja od srednje vrijednosti smatraju vrijednima pažnje.

Nažalost, ako podaci nisu normalno distribuirani, gore opisano pravilo se ne može primijeniti.

Trenutno postoji ograničenje koje se zove Čebiševo pravilo koje se može primijeniti na iskrivljene (iskrivljene) distribucije.

Generirajte početne podatke

U tabeli 1 prikazana je dinamika promjena dnevne dobiti na berzi, evidentirane radnim danima za period od 31. jula do 9. oktobra 1987. godine.

Tabela 1. Dinamika promjena dnevne dobiti na berzi

datum Dnevni profit datum Dnevni profit datum Dnevni profit
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Pokrenite Excel
Kreirajte fajl Kliknite na dugme Sačuvaj na standardnoj traci sa alatkama. otvorite fasciklu Statistics u dijaloškom okviru koji se pojavi i imenujte datoteku Scattering Characteristics.xls.
Set Label 6. Na Sheet1 u ćeliju A1 upisati oznaku Dnevni profit, 7. a u raspon A2:A49 upisati podatke iz Tabele 1.
Postavite funkciju AVERAGE 8. U ćeliju D1 unesite oznaku Prosjek. U ćeliji D2 izračunajte prosjek koristeći statističku funkciju PROSJEK.
Postavite STDEV funkciju U ćeliju D4 unesite oznaku Standardna devijacija. U ćeliji D5 izračunajte standardnu ​​devijaciju koristeći statističku funkciju STDEV
Smanjite dužinu riječi rezultata na četvrtu decimalu.
Interpretacija rezultata odbiti dnevni profit je u prosjeku iznosio 0,04% (vrijednost prosječne dnevne dobiti je bila -0,0004). To znači da je prosječna dnevna dobit za razmatrani vremenski period bila približno jednaka nuli, tj. tržište je bilo prosječno. Ispostavilo se da je standardna devijacija 0,0118. To znači da se jedan dolar (1$) uložen na berzi dnevno mijenjao u prosjeku za 0,0118$, tj. njegova investicija bi mogla rezultirati dobitkom ili gubitkom od 0,0118 USD.
Provjerimo da li vrijednosti dnevne dobiti date u tabeli 1 odgovaraju pravilima normalne distribucije 1. Izračunajte interval koji odgovara jednoj standardnoj devijaciji na obje strane srednje vrijednosti. 2. U ćelijama D7, D8 i F8 postavite oznake respektivno: Jedna standardna devijacija, Donja granica, Gornja granica. 3. U ćeliju D9 unesite formulu = -0,0004 - 0,0118, au ćeliju F9 unesite formulu = -0,0004 + 0,0118. 4. Dobijte rezultat do četiri decimale.

5. Odredite broj dnevnih profita koji su unutar jedne standardne devijacije. Prvo filtrirajte podatke, ostavljajući dnevne vrijednosti profita u intervalu [-0,0121, 0,0114]. Da biste to učinili, odaberite bilo koju ćeliju u koloni A sa dnevnim vrijednostima profita i pokrenite naredbu:

Data®Filter®AutoFilter

Otvorite meni klikom na strelicu u zaglavlju Dnevni profit i izaberite (Stanje...). U dijaloškom okviru Prilagođeni automatski filtar postavite opcije kao što je prikazano u nastavku. Kliknite na dugme OK.

Da biste izbrojali broj filtriranih podataka, odaberite raspon vrijednosti dnevnog profita, kliknite desnim gumbom miša na prazan prostor u statusnoj traci i odaberite naredbu Broj vrijednosti iz kontekstnog izbornika. Pročitajte rezultat. Sada prikažite sve originalne podatke pokretanjem naredbe: Data®Filter®Show All i isključite autofilter koristeći naredbu: Data®Filter®AutoFilter.

6. Izračunajte procenat dnevnih profita koji su unutar jedne standardne devijacije prosjeka. Da biste to učinili, unesite oznaku u ćeliju H8 Procenat, a u ćeliji H9 programirajte formulu za izračunavanje procenta i dobijete rezultat s tačnošću od jedne decimale.

7. Izračunajte raspon dnevne dobiti unutar dvije standardne devijacije od srednje vrijednosti. U ćelijama D11, D12 i F12 postavite oznake u skladu s tim: Dvije standardne devijacije, Zaključak, Gornja granica. U ćelije D13 i F13 unesite formule za izračunavanje i dobijte rezultat s tačnim do četvrtog decimalnog mjesta.

8. Odredite broj dnevnih profita koji su unutar dvije standardne devijacije tako što ćete prvo filtrirati podatke.

9. Izračunajte postotak dnevne dobiti koji je dvije standardne devijacije udaljen od prosjeka. Da biste to učinili, unesite oznaku u ćeliju H12 Procenat, a u ćeliji H13 programirajte formulu za izračunavanje procenta i dobijete rezultat s tačnošću od jedne decimale.

10. Izračunajte raspon dnevnih profita unutar tri standardne devijacije od srednje vrijednosti. U ćelijama D15, D16 i F16 postavite oznake u skladu s tim: Tri standardne devijacije, Zaključak, Gornja granica. U ćelije D17 i F17 unesite formule za izračunavanje i dobijte rezultat s tačnim do četvrtog decimalnog mjesta.

11. Odredite broj dnevnih profita koji su unutar tri standardne devijacije tako što ćete prvo filtrirati podatke. Izračunajte postotak vrijednosti dnevnog profita. Da biste to učinili, unesite oznaku u ćeliju H16 Procenat, a u ćeliji H17 programirajte formulu za izračunavanje procenta i dobijete rezultat s tačnošću od jedne decimale.

13. Nacrtajte histogram dnevne zarade dionice na berzi i smjestite ga zajedno sa tabelom raspodjele frekvencija u područje J1:S20. Prikažite na histogramu približnu srednju vrijednost i intervale koji odgovaraju jednoj, dvije i tri standardne devijacije od srednje vrijednosti, respektivno.

Varijacijska serija

U općoj populaciji, neke kvantitativno svojstvo. Iz njega se nasumično izdvaja uzorak zapremine n, odnosno broj elemenata u uzorku je n. U prvoj fazi statističke obrade, rasponu uzorci, tj. redosled brojeva x1, x2, …, xn Uzlazno. Svaka posmatrana vrednost xi pozvao opcija. Frekvencija mi je broj zapažanja vrijednosti xi u uzorku. Relativna frekvencija (frekvencija) wi je omjer frekvencija mi na veličinu uzorka n: wi=mi/n.

Prilikom studiranja varijantne serije također koriste koncepte kumulativne frekvencije i kumulativne frekvencije. Neka x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se kumulativna frekvencija: minak=mi za xi naziva se kumulativna frekvencija: winak=miak/n.

Atribut se naziva diskretno varijabilnim ako se njegove pojedinačne vrijednosti (varijante) razlikuju jedna od druge za neki konačni iznos (obično cijeli broj). Varijacijski niz takve karakteristike naziva se diskretni varijacioni niz.

Numeričke karakteristike varijacione serije

Numeričke karakteristike varijacionih serija izračunavaju se iz podataka dobijenih kao rezultat posmatranja (statistički podaci), pa se nazivaju i statističke karakteristike ili procjene. U praksi je često dovoljno znati zbirne karakteristike varijacionih serija: prosjek ili karakteristike pozicije (centralna tendencija); karakteristike raspršenja ili varijacije (varijabilnost); karakteristike oblika (asimetrija i strmina distribucije).

Aritmetička sredina karakterizira vrijednosti obilježja oko kojih su koncentrisana opažanja, tj. trend centralne distribucije.

Dostojanstvo medijane kao mjera središnje tendencije leži u činjenici da na nju ne utječe promjena ekstremnih članova varijacionog niza, ako bilo koji od njih, manji od medijane, ostane manji od njega, a bilo koji veći od medijane , nastavlja biti veći od njega. Medijan je poželjniji od aritmetičke sredine za niz u kojem su se ekstremne varijante u odnosu na ostale pokazale pretjerano velike ili male. Posebnost moda kao mjera centralne tendencije leži u činjenici da se i ona ne mijenja kada se mijenjaju ekstremni članovi serije, tj. ima određenu

Polo karakteristike

aritmetička sredina (sredina uzorka)

xv=i=1nmixin

Moda

Mo = xj, ako mj=mmax

Me = xk+1, ako n = 2k+1;

Me = (xk + xk+1)/2, ako n = 2k

Karakteristike raspršivanja

Varijanca uzorka

Dv=i=1nmixixv2n

Standardna devijacija uzorka

σv=Dv

Ispravljena varijansa

S2=nn1Dv

Ispravljena standardna devijacija

Koeficijent varijacije

V=σinxin∙100%

znači apsolutno

odstupanje

θ= i=1nmixixvn

Raspon varijacije

R = xmaxxmin

Kvartilni raspon

Rkv \u003d Qv - Qn

Karakteristike forme

Koeficijent asimetrije

As= i=1nmixixin3nσin3

Kurtosis koeficijent

Ek=i=1nmixixin4nσin43

otpornost na varijacije osobina. Ali od najvećeg interesa su mjere varijacije (rasipanja) opservacija oko srednjih vrijednosti, posebno oko aritmetičke sredine. Ove procjene uključuju varijansa uzorka i standardna devijacija. Varijanca uzorka ima jedan značajan nedostatak: ako je aritmetička sredina izražena u istim jedinicama kao i vrijednosti slučajna varijabla, tada je, prema definiciji, disperzija već izražena u kvadratnim jedinicama. Ovaj nedostatak se može izbjeći ako se standardna devijacija koristi kao mjera varijacije neke karakteristike. Za male veličine uzorka, varijansa je pristrasna procjena, dakle za veličine uzorka n30 koristiti korigovana varijansa i korigovana standardna devijacija. Još jedna često korištena karakteristika mjere disperzije karakteristika je koeficijent varijacije. Prednost koeficijenta varijacije je u tome što je on bezdimenzionalna karakteristika koja omogućava da se uporedi varijacija nesamerljivog

varijantne serije. Osim toga, što je manja vrijednost koeficijenta varijacije, to je populacija homogenija prema ispitivanoj osobini i tipičniji prosjek. Populacije sa koeficijentom varijacije V> 3035% se smatra heterogenim.

Uz disperziju se koristi i znači apsolutno odstupanje. Prednost prosječnog linearnog odstupanja je njegova dimenzija, jer izražene u istim jedinicama kao i vrijednosti slučajne varijable. Dodatni i jednostavan indikator disperzije vrijednosti karakteristika je kvartilni raspon. Kvartilni raspon uključuje medijanu i 50% opservacija koje odražavaju centralni trend osobine, isključujući najmanji i najviše vrijednosti.

Karakteristike forme uključuju koeficijent asimetrije i kurtosis. Ako a faktor asimetrije jednaka nuli, tada je raspodjela simetrična. Ako je distribucija asimetrična, jedna od grana poligona frekvencija ima blaži nagib od druge. Ako je asimetrija desnostrana, tada je tačna nejednakost: xv>Ja>Mo,što znači dominantnu pojavu u distribuciji viših vrijednosti osobine . Ako je asimetrija lijevostrana, onda je nejednakost ispunjena:xv , što znači da u distribucije, češće su niže vrijednosti. Što je veća vrijednost koeficijenta asimetrije, to je distribucija asimetričnija (do 0,25, asimetrija je beznačajna; od 0,25 do 0,5, umjerena; preko 0,5, značajna).

Višak je indikator strmine (zašiljenosti) varijacione serije u poređenju sa normalnom distribucijom. Ako je kurtosis pozitivan, tada poligon varijacione serije ima strmiji vrh. Ovo ukazuje na akumulaciju vrijednosti atributa u središnjoj zoni distributivnog niza, tj. o dominantnom pojavljivanju u podacima vrijednosti bliskih prosječnoj vrijednosti. Ako je eksces negativan, tada poligon ima ravniji vrh u odnosu na normalnu krivu. To znači da vrijednosti atributa nisu koncentrisane u središnjem dijelu serije, već su ravnomjerno raspoređene po cijelom rasponu od minimalne do maksimalne vrijednosti. Što je veća apsolutna vrijednost kurtoze, to se distribucija značajnije razlikuje od normalne.

Imamo najveću bazu podataka u RuNetu, tako da uvijek možete pronaći slične upite

Ova tema pripada:

Površinska plastična deformacija (SPD)

Varalice za ispit. Strojni dijelovi, metode površinske plastične deformacije (SPD). Odgovori

Ovaj materijal uključuje odjeljke:

Pojave koje se javljaju u površinskom sloju dijela tokom SPD obrade, mehanizam očvršćavanja

Kvaliteta površine dobivena valjanjem pomoću valjkastog alata. Šema procesa, vrijednost pritiska, višestrukost primjene sile deformiranja, tehnološka oprema u procesima valjanja kugličnim alatom.

Kvalitet površine dobiven valjanjem kugličnim alatom. Šema procesa, vrijednost pritiska, višestrukost primjene sile deformiranja, tehnološka oprema u procesima valjanja kugličnim alatom.

Oblikovanje površinskog mikroprofila prilikom obrade kliznim indenterom, njegova namjena, alati u procesima vibracionog očvršćavanja, obim.

Formiranje površinskog mikroprofila pri obradi rotirajućim indentorom, njegova namjena, tehnološka oprema u procesima vibraciono-očvrsne obrade, obim.

Kakav uticaj ima ugao rešetke abrazivnih zrna šipke na produktivnost procesa i kvalitet obrađene površine tokom superfiniširanja? Kako prilagoditi tehnološku opremu da se dobije određeni ugao mreže zareza?

Kako osigurati dobijanje sistema paralelnih kanala i ispravne mreže kanala prilikom obrade kliznim indentorom u PPD procesima? Uporedne karakteristike ovih kanalskih rešetki i njihov uticaj na radna svojstva površina mašinskih delova.

Koje tehnološke metode osiguravaju kvalitetu površinskog sloja dijela u završnoj fazi obrade? Dajte im uporedni opis. Kriterijumi za izbor određene metode za rešavanje konkretnog tehničkog problema.

Vibroudarna obrada, suština procesa, obim, tehnološka opremljenost.

Superfiniš, suština procesa, obim. Izbor veličina, način fiksiranja šipki i njihovo uređivanje u procesima superfiniširanja.

Klasifikacija metoda površinske plastične deformacije (SPD), uporedne karakteristike i karakteristike njihove primjene. Tehnološka opremljenost PPD procesa.

Objasniti pojmove: referentna dužina profila, referentna kriva površinskog profila, dati primjere mikrogeometrije površina dobijenih različitim tehnološkim metodama i metodologiju za procjenu njihove nosivosti.

Kruti i elastični kontakt u PPD procesima i njegova tehnološka podrška. Utjecaj vrste kontakta na kvalitet površinskog sloja.

Zašto se vibracijska plastična deformacija koristi za poboljšanje radnih parametara dijelova? Uporedite to sa tradicionalnim valjanjem i glačanjem bez vibracija. Karakteristike tehnološke opremljenosti ovih upoređenih metoda

Pojave koje se javljaju u površinskom sloju dijela prilikom SPD obrade, mehanizam nastanka zaostalog naprezanja.

Površinsko i zapreminsko brušenje rupa, suština procesa, obim, tehnološka podrška brušenja.

Uporedne karakteristike metoda mljevenja: velika brzina; snaga; kombinovano; integral; jačanje.

Koncept eksperimenta. Greške u mjerenju: promašaji, sistematski, slučajni. Povezani sadržaj:

Osobine izučavanja teme "Algoritmi" u osnovnoj školi uz korištenje kompjuterskih programa za obuku

Smjer nastave Pedagoško obrazovanje. Svrha ovog rada je da identifikuje i dokaže potrebu i efikasnost izučavanja algoritamizacije u osnovnoj školi korišćenjem programa za obuku na računaru.

Topografske karte univerzalnog priznanja

Abstract. Topografske fotografije kopna i vodenih površina. Strane topografske karte

Estetika (Aristotel i Platon)

Aristotel, teorije mimezisa, princip proporcionalnosti između čovjeka i ljepote. Muzička estetika, Pitagorina estetika, Muzička i matematička harmonija. Platonova idealistička estetika

Sistem primjene đubriva u plodoredu

Predmetni projekat Agronomskog fakulteta. Katedra za agrohemiju i tlo

Energetska efikasnost u građevinarstvu. Toplotno sušenje

Dio projekta kursa. Toplotna efikasnost instalacija za sušenje. Vazdušne zavese.

Glavna karakteristika disperzije varijacionog niza naziva se disperzija

Glavna karakteristika disperzije varijacionog niza se zove disperzija. Varijanca uzorkaD in izračunava se pomoću sljedeće formule:

gdje je x i – i -ta vrijednost iz uzorka koji se pojavljuje m i puta; n - veličina uzorka; je srednja vrijednost uzorka; k je broj različitih vrijednosti u uzorku. u ovom primjeru: x 1 =72, m 1 =50; x 2 =85, m 2 =44; x 3 =69, m 3 =61; n=155; k=3; . onda:

Imajte na umu da što je veća vrijednost disperzije, to je veća razlika između vrijednosti mjerene veličine jedna od druge. Ako su u uzorku sve vrijednosti izmjerene vrijednosti jednake jedna drugoj, tada je varijansa takvog uzorka jednaka nuli.

Disperzija ima posebna svojstva.

Nekretnina 1.Vrijednost varijanse bilo kojeg uzorka je nenegativna, tj. .

Nekretnina 2.Ako je izmjerena vrijednost konstantna X=c, tada je varijansa za takvu vrijednost nula: D[c ]= 0.

Nekretnina 3.Ako su sve vrijednosti mjerene veličine x u uzorku povećanje u c puta, tada će se varijansa ovog uzorka povećati za c 2 puta: D[cx ]= c 2 D [ x ], gdje je c = konst.

Ponekad se umjesto varijanse koristi standardna devijacija uzorka, koja je jednaka aritmetičkom kvadratnom korijenu varijanse uzorka: .

Za razmatrani primjer, standardna devijacija uzorka je jednaka .

Disperzija vam omogućava da procenite ne samo stepen razlike u izmerenim pokazateljima unutar jedne grupe, već se može koristiti i za određivanje odstupanja podataka između različitih grupa. Za to se koristi nekoliko vrsta disperzije.

Ako se neka grupa uzme kao uzorak, tada se naziva varijansa ove grupe grupna varijansa. Da bi se numerički izrazile razlike između varijansi nekoliko grupa, postoji koncept međugrupna varijansa. Međugrupna varijansa je varijansa grupnih srednjih vrijednosti u odnosu na ukupnu srednju vrijednost:

gdje je k je broj grupa u ukupnom uzorku, je srednja vrijednost uzorka za i -ta grupa, n i - veličina uzorka i th grupa, - srednja vrijednost uzorka za sve grupe.

Razmotrimo primjer.

Prosječna ocjena za kontrolni rad iz matematike u 10 "A" razredu bila je 3,64, a u 10 "B" razredu 3,52. U 10 "A" su 22 učenika, a u 10 "B" - 21. Nađimo međugrupnu disperziju.

U ovom zadatku uzorak je podijeljen u dvije grupe (dvije klase). Srednja vrijednost uzorka za sve grupe je:

.

U ovom slučaju, varijansa među grupama je:

S obzirom da je međugrupna varijansa blizu nule, možemo zaključiti da se rezultati jedne grupe (10 "A" klase) neznatno razlikuju od rezultata druge grupe (10 "B" klase). Drugim riječima, sa stanovišta međugrupne varijanse, razmatrane grupe se neznatno razlikuju u pogledu datog atributa.

Ako se ukupni uzorak (na primjer, razred učenika) podijeli u nekoliko grupa, tada se pored međugrupne varijanse može izračunati iunutargrupna varijansa. Ova varijansa je prosjek svih grupnih varijansi.

Unutargrupna varijansaD mađarska izračunato po formuli:

gdje je k je broj grupa u ukupnom uzorku, D i – varijansa i th volume group n i .

Postoji odnos između ukupnog (D in ), unutargrupni ( D ngr ) i međugrupni ( D intergr) disperzije:

D u \u003d D ingr + D intergr.

Karakteristike položaja opisuju distributivni centar. Istovremeno, vrijednosti varijante mogu se grupirati oko nje u širokom i uskom pojasu. Stoga je za opisivanje distribucije potrebno okarakterizirati raspon promjene vrijednosti atributa. Karakteristike raspršivanja se koriste za opisivanje raspona varijacija karakteristika. Najšire korišteni su raspon varijacije, varijansa, standardna devijacija i koeficijent varijacije.

Varijacija raspona definira se kao razlika između maksimalne i minimalne vrijednosti osobine u proučavanoj populaciji:

R=x max- x min.

Očigledna prednost ovog indikatora je jednostavnost izračunavanja. Međutim, budući da raspon varijacije ovisi o vrijednostima samo ekstremnih vrijednosti atributa, opseg njegove primjene je ograničen na prilično homogene distribucije. U drugim slučajevima, informativni sadržaj ovog indikatora je vrlo mali, jer postoji mnogo distribucija koje se uvelike razlikuju po obliku, ali imaju isti raspon. U praktičnim studijama, raspon varijacija se ponekad koristi za male (ne više od 10) veličina uzoraka. Tako je, na primjer, po rasponu varijacije lako procijeniti koliko se najbolji i najgori rezultati razlikuju u grupi sportista.

u ovom primjeru:

R\u003d 16,36 - 13,04 \u003d 3,32 (m).

Druga karakteristika raspršenja je disperzija. Varijanca je prosječni kvadrat odstupanja vrijednosti slučajne varijable od njene srednje vrijednosti. Disperzija je karakteristika disperzije, disperzija vrijednosti veličine oko njene prosječne vrijednosti. Sama riječ "disperzija" znači "raspršivanje".

Prilikom provođenja uzoraka studija potrebno je utvrditi procjenu varijanse. Varijanca izračunata iz podataka uzorka naziva se varijansa uzorka i označava se S 2 .

Na prvi pogled, najprirodnija procjena varijanse je statistička varijansa izračunata iz definicije koristeći formulu:

U ovoj formuli, zbir kvadrata odstupanja vrijednosti atributa x i iz aritmetičke sredine . Ovaj zbir se dijeli s veličinom uzorka kako bi se dobila srednja kvadratna devijacija. P.

Međutim, ova procjena nije nepristrasna. Može se pokazati da je zbroj kvadrata odstupanja vrijednosti atributa za uzorak aritmetičke sredine manji od zbira kvadrata odstupanja od bilo koje druge vrijednosti, uključujući pravu srednju vrijednost (matematičko očekivanje). Stoga će rezultat dobijen gornjom formulom sadržavati sistematsku grešku, a procijenjena vrijednost varijanse će biti potcijenjena. Da bi se eliminisala pristrasnost, dovoljno je uvesti faktor korekcije. Rezultat je sljedeća relacija za procijenjenu varijansu:

Za velike vrijednosti n, naravno, obje procjene - pristrasna i nepristrasna - će se vrlo malo razlikovati i uvođenje faktora korekcije postaje besmisleno. U pravilu, formulu za procjenu varijanse treba precizirati kada n<30.

U slučaju grupiranih podataka, posljednja formula za pojednostavljenje izračuna može se svesti na sljedeći oblik:

gdje k- broj intervala grupisanja;

n i- frekvencija intervala sa brojem i;

x i- srednja vrijednost intervala sa brojem i.

Kao primjer, izračunajmo varijansu za grupisane podatke primjera koji analiziramo (vidi tabelu 4.):

S 2 =/ 28=0,5473 (m2).

Varijanca slučajne varijable ima dimenziju kvadrata dimenzije slučajne varijable, što otežava interpretaciju i čini je ne baš vizuelnom. Za vizualniji opis raspršivanja, prikladnije je koristiti karakteristiku čija se dimenzija poklapa s dimenzijom karakteristike koja se proučava. U tu svrhu, koncept standardna devijacija(ili standardna devijacija).

standardna devijacija naziva se pozitivnim kvadratnim korijenom varijanse:

U našem primjeru, standardna devijacija je

Standardna devijacija ima iste mjerne jedinice kao i rezultati mjerenja osobine koja se proučava i stoga karakteriše stepen odstupanja osobine od aritmetičke sredine. Drugim riječima, pokazuje kako se glavni dio varijante nalazi u odnosu na aritmetičku sredinu.

Standardna devijacija i varijansa su najčešće korištene mjere varijacije. To je zbog činjenice da su uključeni u značajan dio teorema teorije vjerovatnoće, koja služi kao temelj matematičke statistike. Osim toga, varijansa se može razložiti na sastavne elemente, koji omogućavaju procjenu utjecaja različitih faktora na varijaciju osobine koja se proučava.

Pored apsolutnih pokazatelja varijacije, a to su varijansa i standardna devijacija, u statistiku se uvode i relativni. Koeficijent varijacije koji se najčešće koristi. Koeficijent varijacije jednak je omjeru standardne devijacije i aritmetičke sredine, izražen u postocima:

Iz definicije je jasno da je, u svom značenju, koeficijent varijacije relativna mjera disperzije osobine.

Za dotični primjer:

Koeficijent varijacije se široko koristi u statističkim istraživanjima. Budući da je relativna vrijednost, omogućava vam da uporedite fluktuacije obje osobine s različitim mjernim jedinicama, kao i istu osobinu u nekoliko različitih populacija s različitim vrijednostima aritmetičke sredine.

Koeficijent varijacije se koristi za karakterizaciju homogenosti dobijenih eksperimentalnih podataka. U praksi fizičke kulture i sporta, širenje rezultata mjerenja u zavisnosti od vrijednosti koeficijenta varijacije smatra se malim (V<10%), средним (11-20%) и большим (V> 20%).

Ograničenja upotrebe koeficijenta varijacije povezana su sa njegovom relativnom prirodom – definicija sadrži normalizaciju na aritmetičku sredinu. S tim u vezi, za male apsolutne vrijednosti aritmetičke sredine, koeficijent varijacije može izgubiti svoju informativnost. Što je vrijednost aritmetičke sredine bliža nuli, ovaj indikator postaje manje informativan. U graničnom slučaju, aritmetička sredina ide na nulu (na primjer, temperatura), a koeficijent varijacije ide u beskonačnost, bez obzira na širenje karakteristike. Po analogiji sa slučajem greške, možemo formulirati sljedeće pravilo. Ako je vrijednost aritmetičke sredine u uzorku veća od jedan, onda je upotreba koeficijenta varijacije opravdana; u suprotnom, disperziju i standardnu ​​devijaciju treba koristiti za opisivanje širenja eksperimentalnih podataka.

U zaključku ovog dijela razmatramo procjenu varijacije u vrijednostima procijenjenih karakteristika. Kao što je već napomenuto, vrijednosti karakteristika distribucije izračunate iz eksperimentalnih podataka ne poklapaju se s njihovim pravim vrijednostima za opću populaciju. Ovo posljednje nije moguće precizno utvrditi, jer je po pravilu nemoguće ispitati cjelokupnu populaciju. Ako koristimo rezultate različitih uzoraka iz iste opće populacije za procjenu parametara distribucije, onda se ispostavlja da se ove procjene za različite uzorke razlikuju jedna od druge. Procijenjene vrijednosti fluktuiraju oko svojih pravih vrijednosti.

Odstupanja procjena općih parametara od pravih vrijednosti ovih parametara nazivaju se statističkim greškama. Razlog za njihovu pojavu je ograničena veličina uzorka - nisu svi objekti opće populacije uključeni u njega. Za procjenu veličine statističkih grešaka koristi se standardna devijacija karakteristika uzorka.

Kao primjer, razmotrite najvažniju karakteristiku položaja - aritmetičku sredinu. Može se pokazati da je standardna devijacija aritmetičke sredine data sa:

gdje σ - standardna devijacija za opštu populaciju.

Pošto prava vrijednost standardne devijacije nije poznata, veličina se zove standardna greška aritmetičke sredine i jednako:

Vrijednost karakteriše grešku koja je u prosjeku dozvoljena kada se opći prosjek zamjenjuje njegovom procjenom uzorka. Prema formuli, povećanje veličine uzorka tokom istraživanja dovodi do smanjenja standardne greške proporcionalno kvadratnom korijenu veličine uzorka.

Za primjer koji se razmatra, vrijednost standardne greške aritmetičke sredine je . U našem slučaju se pokazalo da je 5,4 puta manja od vrijednosti standardne devijacije.