Caracteristici de împrăștiere

Măsuri de dispersie a probei.

Minimul și maximul eșantionului sunt, respectiv, cea mai mică și cea mai mare valoare a variabilei studiate. Se numește diferența dintre maxim și minim la scară mare mostre. Toate datele eșantionului sunt situate între minim și maxim. Acești indicatori, așa cum ar fi, conturează limitele eșantionului.

R#1= 15,6-10=5,6

R №2 \u003d 0,85-0,6 \u003d 0,25

Varianta eșantionului(Engleză) varianţă) și deviație standard mostre (engleză) deviație standard) este o măsură a variabilității unei variabile și caracterizează gradul de răspândire a datelor în jurul centrului. În același timp, abaterea standard este un indicator mai convenabil datorită faptului că are aceeași dimensiune cu datele efective studiate. Prin urmare, indicatorul abaterii standard este utilizat împreună cu valoarea mediei aritmetice a eșantionului pentru a descrie pe scurt rezultatele analizei datelor.

Este mai convenabil să se calculeze varianța eșantionului la prin formula:

Abaterea standard se calculează folosind formula:

Coeficientul de variație este o măsură relativă a răspândirii unei caracteristici.

Coeficientul de variație este folosit și ca indicator al omogenității observațiilor din eșantion. Se crede că, dacă coeficientul de variație nu depășește 10%, atunci proba poate fi considerată omogenă, adică obținută dintr-un populatia.

Deoarece coeficientul de variație din ambele probe, acestea sunt omogene.

Eșantionul poate fi reprezentat analitic sub forma unei funcții de distribuție, precum și sub forma unui tabel de frecvență format din două rânduri. În linia de sus - elementele probei (opțiuni), dispuse în ordine crescătoare; linia de jos înregistrează opțiunea de frecvență.

Frecvența opțiunilor este un număr egal cu numărul de repetări ale acestei opțiuni din eșantion.

Exemplul #1 „Mame”

Tipul curbei de distribuție

Asimetrie sau coeficientul de asimetrie (termenul a fost introdus pentru prima dată de Pearson, 1895) este o măsură a asimetriei unei distribuții. Dacă asimetria este distinct diferită de 0, distribuția este asimilă, densitatea distributie normala simetric fata de medie.

Index asimetrii(Engleză) asimetrie) este folosit pentru a caracteriza gradul de simetrie în distribuția datelor în jurul unui centru. Asimetria poate lua atât valori negative, cât și pozitive. O valoare pozitivă a acestui parametru indică faptul că datele sunt deplasate la stânga centrului, o valoare negativă - la dreapta. Astfel, semnul indicelui de asimetrie indică direcția părtinirii datelor, în timp ce mărimea indică gradul acestei părtiniri. O asimetrie egală cu zero indică faptul că datele sunt concentrate simetric în jurul centrului.

pentru că asimetria este pozitivă, prin urmare, vârful curbei este deplasat spre stânga din centru.

Coeficientul de kurtoză(Engleză) curtoză) este o măsură a cât de strâns este cea mai mare parte a grupurilor de date în jurul centrului.

Cu o curtoză pozitivă, curba se ascuți, cu o kurtoză negativă, se netezește.

Curba este aplatizată;

Curba este ascuțită.

Unul dintre motivele deținerii analize statistice constă în necesitatea luării în considerare a influenţei factorilor aleatori (perturbaţii) asupra indicatorului studiat, care duc la împrăştierea (împrăştierea) datelor. Rezolvarea problemelor în care este prezentă împrăștierea datelor este asociată cu risc, deoarece chiar și atunci când se utilizează întregul informatii disponibile este interzis exact prezice ce se va întâmpla în viitor. Pentru a lucra adecvat în astfel de situații, este recomandabil să înțelegeți natura riscului și să puteți determina gradul de dispersie a setului de date. Se află trei caracteristici numerice, descriind măsura împrăștierii: abaterea standard, intervalul și coeficientul de variație (variabilitate). Spre deosebire de indicatorii tipici (medie, mediană, mod) care caracterizează centrul, se arată caracteristicile de împrăștiere cat de aproape la acest centru sunt valorile individuale ale setului de date
Definiția Standard Deviation Deviație standard(abaterea standard) este o măsură a abaterilor aleatorii ale valorilor datelor de la medie. LA viata reala majoritatea datelor sunt caracterizate prin dispersie, adică valorile individuale sunt la o oarecare distanță de medie.
Este imposibil să se utilizeze abaterea standard ca o caracteristică generalizantă a împrăștierii prin simpla medie a abaterilor datelor, deoarece unele dintre abateri se vor dovedi pozitive, iar cealaltă parte va fi negativă și, ca urmare, media. rezultatul se poate dovedi a fi zero. Pentru a scăpa de semnul negativ, se folosește un truc standard: mai întâi calculează dispersie ca suma abaterilor pătrate împărțită la ( n–1), iar apoi rădăcina pătrată este luată din valoarea rezultată. Formula de calcul a abaterii standard este următoarea: Nota 1. Varianța nu prezintă niciuna Informații suplimentare comparativ cu abaterea standard, dar este mai greu de interpretat, deoarece se exprimă în „unități la pătrat”, în timp ce abaterea standard este exprimată în unități care ne sunt familiare (de exemplu, în dolari). Nota 2. Formula de mai sus este pentru calcularea abaterii standard a unui eșantion și este numită mai precis abaterea standard a probei. La calcularea abaterii standard populatia(notat cu simbolul s) împărțire cu n. Valoarea deviației standard a eșantionului este oarecum mai mare (deoarece este împărțită la n–1), care oferă o corecție pentru caracterul aleatoriu al eșantionului în sine. În cazul în care setul de date are o distribuție normală, abaterea standard capătă o semnificație specială. În figura de mai jos, semnele sunt plasate pe ambele părți ale mediei la o distanță de una, două și, respectiv, trei abateri standard. Figura arată că aproximativ 66,7% (două treimi) din toate valorile se află într-o abatere standard de fiecare parte a mediei, 95% dintre valori se vor afla în două abateri standard ale mediei și aproape toate datele (99,7%) se vor încadra în trei deviații standard ale mediei.
66,7%


Această proprietate a abaterii standard pentru datele distribuite normal se numește „regula celor două treimi”.

În unele situații, cum ar fi analiza controlului calității produselor, limitele sunt adesea stabilite astfel încât acele observații (0,3%) care sunt mai mult de trei abateri standard de la medie sunt considerate ca demne de atenție.

Din păcate, dacă datele nu sunt distribuite în mod normal, atunci regula descrisă mai sus nu poate fi aplicată.

În prezent, există o constrângere numită regula lui Chebyshev care poate fi aplicată distribuțiilor deformate (deformate).

Generați date inițiale

În tabelul 1 este prezentată dinamica modificărilor profitului zilnic la bursă, înregistrate în zile lucrătoare pentru perioada 31 iulie - 9 octombrie 1987.

Tabelul 1. Dinamica modificărilor profitului zilnic la bursă

data Profit zilnic data Profit zilnic data Profit zilnic
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Lansați Excel
Creați fișier Faceți clic pe butonul Salvare din bara de instrumente Standard. deschideți folderul Statistics în caseta de dialog care apare și denumiți fișierul Scattering Characteristics.xls.
Setați eticheta 6. Pe Sheet1, în celula A1, introduceți eticheta Daily profit, 7. iar în intervalul A2:A49, introduceți datele din Tabelul 1.
Setați funcția MEDIE 8. În celula D1, introduceți eticheta Media. În celula D2, calculați media folosind funcția statistică MEDIE.
Setați funcția STDEV În celula D4, introduceți eticheta Abatere standard. În celula D5, calculați abaterea standard utilizând funcția statistică STDEV
Reduceți lungimea cuvântului rezultat la a patra zecimală.
Interpretarea rezultatelor declin profitul zilnic a fost în medie de 0,04% (valoarea profitului mediu zilnic sa dovedit a fi -0,0004). Aceasta înseamnă că profitul zilnic mediu pentru perioada de timp considerată a fost aproximativ egal cu zero, adică. piața era la o rată medie. Abaterea standard s-a dovedit a fi 0,0118. Aceasta înseamnă că un dolar (1 USD) investit pe piața de valori pe zi s-a modificat în medie cu 0,0118 USD, adică. investiția sa ar putea avea ca rezultat un profit sau o pierdere de 0,0118 USD.
Să verificăm dacă valorile profitului zilnic prezentate în tabelul 1 corespund regulilor de distribuție normală 1. Calculați intervalul corespunzător unei abateri standard de fiecare parte a mediei. 2. În celulele D7, D8 și F8, setați etichetele respectiv: O abatere standard, Limită inferioară, Limită superioară. 3. În celula D9, introduceți formula = -0,0004 - 0,0118, iar în celula F9, introduceți formula = -0,0004 + 0,0118. 4. Obțineți rezultatul cu până la patru zecimale.

5. Determinați numărul de profituri zilnice care se află într-o abatere standard. Mai întâi, filtrați datele, lăsând valorile profitului zilnic în intervalul [-0,0121, 0,0114]. Pentru a face acest lucru, selectați orice celulă din coloana A cu valorile profitului zilnic și rulați comanda:

Data®Filter®AutoFilter

Deschideți meniul făcând clic pe săgeata din antet Profit zilnicși selectați (Condiție...). În caseta de dialog Custom AutoFilter, setați opțiunile așa cum se arată mai jos. Faceți clic pe butonul OK.

Pentru a număra numărul de date filtrate, selectați intervalul de valori zilnice a profitului, faceți clic dreapta pe un spațiu gol din bara de stare și selectați comanda Număr de valori din meniul contextual. Citiți rezultatul. Acum afișați toate datele originale rulând comanda: Data®Filter®Show All și dezactivați autofiltrul folosind comanda: Data®Filter®AutoFilter.

6. Calculați procentul de profituri zilnice care se află la o abatere standard a mediei. Pentru a face acest lucru, introduceți eticheta în celula H8 La sută, iar în celula H9, programați formula pentru calcularea procentului și obțineți rezultatul cu o precizie de o zecimală.

7. Calculați intervalul profiturilor zilnice cu două abateri standard de la medie. În celulele D11, D12 și F12, setați etichetele în consecință: Două abateri standard, Concluzie, Limită superioară. În celulele D13 și F13, introduceți formulele de calcul și obțineți rezultatul precis până la a patra zecimală.

8. Determinați numărul de profituri zilnice care se află în două abateri standard prin filtrarea mai întâi a datelor.

9. Calculați procentul profiturilor zilnice care se află la două abateri standard de la medie. Pentru a face acest lucru, introduceți eticheta în celula H12 La sută, iar în celula H13, programați formula pentru calcularea procentului și obțineți rezultatul cu o precizie de o zecimală.

10. Calculați intervalul profiturilor zilnice cu trei abateri standard de la medie. În celulele D15, D16 și F16, setați etichetele în consecință: Trei abateri standard, Concluzie, Limită superioară. În celulele D17 și F17, introduceți formulele de calcul și obțineți rezultatul precis până la a patra zecimală.

11. Determinați numărul de profituri zilnice care se află în trei abateri standard prin filtrarea mai întâi a datelor. Calculați procentul valorilor profitului zilnic. Pentru a face acest lucru, introduceți eticheta în celula H16 La sută, iar în celula H17, programați formula pentru calcularea procentului și obțineți rezultatul cu o precizie de o zecimală.

13. Trasați o histogramă a câștigurilor zilnice ale acțiunilor la bursă și plasați-o împreună cu tabelul de distribuție a frecvenței în zona J1:S20. Arată pe histogramă media aproximativă și intervalele corespunzătoare la una, două și, respectiv, trei abateri standard de la medie.

Seria de variații

În populația generală, unii semn cantitativ. Din el se extrage aleatoriu o mostră de volum n, adică numărul de elemente din eșantion este n. În prima etapă a procesării statistice, variind mostre, adică ordonarea numerelor x1, x2, …, xn Ascendent. Fiecare valoare observată xi numit opțiune. Frecvență mi este numărul de observații ale valorii xiîn probă. Frecvența relativă (frecvența) wi este raportul de frecvență mi la dimensiunea eșantionului n: wi=mi/n.

Când se studiază o serie variațională, se folosesc și conceptele de frecvență cumulativă și frecvență cumulativă. Lăsa X oarecare număr. Apoi numărul de opțiuni , ale căror valori sunt mai mici X, se numește frecvență cumulativă: minak=mi pentru xi se numeste frecventa cumulata: winak=miak/n.

Un atribut se numește variabil discret dacă valorile sale individuale (variantele) diferă unele de altele printr-o cantitate finită (de obicei un număr întreg). O serie variațională a unei astfel de caracteristici se numește serie variațională discretă.

Caracteristicile numerice ale seriei de variații

Caracteristicile numerice ale seriilor variaționale sunt calculate din datele obținute în urma observațiilor (date statistice), de aceea sunt numite și caracteristici statistice sau estimări. În practică, este adesea suficient să se cunoască caracteristicile sumare ale seriei de variații: caracteristici medii sau de poziție (tendință centrală); caracteristici de împrăștiere sau variație (variabilitate); caracteristicile formei (asimetria și abruptitatea distribuției).

Media aritmetică caracterizează valorile caracteristicii în jurul căreia sunt concentrate observațiile, adică tendinta de distributie centrala.

Demnitate mediane ca măsură a tendinței centrale constă în faptul că nu este afectată de o modificare a membrilor extremi ai seriei de variații, dacă vreunul dintre ei, mai mic decât mediana, rămâne mai mic decât acesta și oricare, mai mare decât mediana. , continuă să fie mai mare decât aceasta. Mediana este de preferat mediei aritmetice pentru o serie în care variantele extreme în comparație cu restul s-au dovedit a fi excesiv de mari sau mici. Particularitate Modă ca măsură a tendinței centrale constă în faptul că nici nu se schimbă atunci când membrii extremi ai seriei se schimbă, adică. are un anumit

Caracteristicile polo

Media aritmetică (media eșantionului)

xv=i=1nmixină

Modă

Mo = xj, dacă mj=mmax

Eu = xk+1, dacă n = 2k+1;

Eu = (xk + xk+1)/2, dacă n = 2k

Caracteristici de împrăștiere

Varianta eșantionului

Dv=i=1nmixixv2n

Deviația standard a eșantionului

σv=Dv

Varianta corectată

S2=nn1Dv

Abaterea standard corectată

Coeficientul de variație

V=σinxin∙100%

înseamnă absolut

deviere

θ= i=1nmixixвn

Interval de variație

R = xmaxxmin

Gama de quartile

Rkv \u003d Qv - Qn

Caracteristicile formei

Coeficient de asimetrie

As= i=1nmixxin3nσin3

Coeficientul de kurtoză

Ek=i=1nmixixin4nσin43

rezistență la variația trăsăturilor. Dar de cel mai mare interes sunt măsurile de variație (împrăștiere) a observațiilor în jurul valorilor medii, în special, în jurul mediei aritmetice. Aceste estimări includ varianța eșantionuluiși deviație standard. Varianta eșantionului are un dezavantaj semnificativ: dacă media aritmetică este exprimată în aceleași unități ca și valorile variabilă aleatorie, atunci, conform definiției, dispersia este deja exprimată în unități pătrate. Acest neajuns poate fi evitat dacă abaterea standard este utilizată ca măsură a variației unei caracteristici. Pentru dimensiunile eșantioanelor mici, varianța este o estimare părtinitoare, deci pentru dimensiunile eșantionului n30 utilizare varianta corectatași abaterea standard corectată. O altă caracteristică frecvent utilizată a măsurii de dispersie a caracteristicilor este coeficientul de variație. Avantajul coeficientului de variație este că este o caracteristică adimensională care vă permite să comparați variația incomensurabilului.

serie de variații. În plus, cu cât valoarea coeficientului de variație este mai mică, cu atât populația este mai omogenă în funcție de trăsătura studiată și cu atât media este mai tipică. Populații cu coeficient de variație V> 3035% este considerat a fi eterogen.

Alături de dispersie, se mai folosește înseamnă abatere absolută. Avantajul abaterii medii liniare este dimensiunea acesteia, deoarece exprimat în aceleași unități ca și valorile variabilei aleatoare. Un indicator suplimentar și simplu al dispersării valorilor caracteristicilor este interval de quartile. Intervalul de quartile include mediana și 50% din observațiile care reflectă tendința centrală a trăsăturii, excluzând cele mai mici și cele mai mari valori.

Caracteristicile formei includ coeficientul de asimetrie și curtoza. În cazul în care un factor de asimetrie este egal cu zero, atunci distribuția este simetrică. Dacă distribuția este asimetrică, una dintre ramurile poligonului de frecvență are o pantă mai blândă decât cealaltă. Dacă asimetria este pe partea dreaptă, atunci inegalitatea este adevărată: xv>Me>Mo, ceea ce înseamnă apariția predominantă în distribuția valorilor mai mari ale caracteristicii . Dacă asimetria este pe partea stângă, atunci inegalitatea este îndeplinită:xv , însemnând că în distribuție, valorile mai mici sunt mai frecvente. Cu cât valoarea coeficientului de asimetrie este mai mare, cu atât distribuția este mai asimetrică (până la 0,25, asimetria este nesemnificativă; de la 0,25 la 0,5, moderată; peste 0,5, semnificativă).

Exces este un indicator al abruptului (puncturii) seriei variaționale în comparație cu distribuția normală. Dacă curtoza este pozitivă, atunci poligonul seriei variaționale are un vârf mai abrupt. Aceasta indică acumularea valorilor atributelor în zona centrală a seriei de distribuție, adică despre apariția predominantă în date a unor valori apropiate de valoarea medie. Dacă kurtoza este negativă, atunci poligonul are un vârf mai plat în comparație cu curba normală. Aceasta înseamnă că valorile trăsăturilor nu sunt concentrate în partea centrală a seriei, ci mai degrabă împrăștiate uniform pe întregul interval de la valoarea minimă la cea maximă. Cu cât valoarea absolută a curtozei este mai mare, cu atât distribuția diferă mai semnificativ de cea normală.

Avem cea mai mare bază de informații din RuNet, așa că puteți găsi întotdeauna întrebări similare

Acest subiect aparține:

Deformarea plastică la suprafață (SPD)

Cheat sheets pentru examen. Piese de mașini, metode de deformare plastică a suprafeței (SPD). Răspunsuri

Acest material include secțiuni:

Fenomene care apar în stratul de suprafață al unei piese în timpul prelucrării SPD, mecanism de întărire

Calitatea suprafeței obținută prin rulare cu o unealtă cu role. Schema procesului, valoarea presiunii, multiplicitatea aplicării forței de deformare, echipamentul tehnologic în procesele de rulare cu o unealtă cu bile.

Calitatea suprafeței obținută prin rulare cu o unealtă cu bile. Schema procesului, valoarea presiunii, multiplicitatea aplicării forței de deformare, echipamentul tehnologic în procesele de rulare cu o unealtă cu bile.

Modelarea suprafeței microprofilului în timpul tratamentului cu indentor glisant, scopul acestuia, scule în procesele de întărire prin vibrații, domeniul de aplicare.

Modelarea microprofilului de suprafață în timpul prelucrării cu un indentor rotativ, scopul acestuia, echipamentul tehnologic în procesele de procesare de întărire prin vibrații, domeniul de aplicare.

Ce efect are unghiul de grilă al granulelor abrazive ale barei asupra productivității procesului și a calității suprafeței prelucrate în timpul suprafinisării? Cum se reglează echipamentul tehnologic pentru a obține un anumit unghi al grilei de crestături?

Cum se asigură obținerea unui sistem de canale paralele și a grilei corecte de canale atunci când se prelucrează cu un indentor glisant în procesele PPD? Caracteristicile comparative ale acestor grile de canale și influența lor asupra proprietăților operaționale ale suprafețelor pieselor mașinii.

Ce metode tehnologice asigură calitatea stratului de suprafață al piesei în etapa de finisare a prelucrării? Dă-le o descriere comparativă. Criterii de alegere a unei metode specifice de rezolvare a unei probleme tehnice specifice.

Prelucrare Vibro-impact, esența procesului, domeniul de aplicare, echipament tehnologic.

Superfinisare, esența procesului, domeniul de aplicare. Selectarea dimensiunilor, metoda de fixare a barelor și editarea acestora în procesele de suprafinisare.

Clasificarea metodelor de deformare plastică a suprafeței (SPD), caracteristicile comparative și caracteristicile aplicării acestora. Echipamente tehnologice ale proceselor PPD.

Explicați termenii: lungimea de referință a profilului, curba de referință a profilului suprafeței, dați exemple de microgeometrie a suprafețelor obținute prin diverse metode tehnologice și metodologia de evaluare a capacității portante a acestora.

Contact rigid și elastic în procesele PPD și suportul tehnologic al acestuia. Influența tipului de contact asupra calității stratului de suprafață.

De ce se utilizează deformarea plastică prin vibrații pentru a îmbunătăți parametrii operaționali ai pieselor? Comparați-l cu rularea și netezirea tradițională fără vibrații. Caracteristicile echipamentului tehnologic al acestor metode comparate

Fenomene care apar în stratul de suprafață al unei piese în timpul prelucrării SPD, mecanismul formării tensiunii reziduale.

Lustruirea de suprafață și volum a găurilor, esența procesului, domeniul de aplicare, suportul tehnologic al lustruirii.

Caracteristici comparative ale metodelor de măcinare: viteză mare; putere; combinate; integrală; întărirea.

Conceptul de experiment. Erori de măsurare: greșeli, sistematice, aleatorii. Continut Asemanator:

Caracteristici ale studierii temei „Algoritmi” în școala elementară cu utilizarea programelor de instruire pe calculator

Direcţia de pregătire a cursurilor Educaţie pedagogică. Scopul acestei lucrări este de a identifica și dovedi necesitatea și eficacitatea studierii algoritmizării în școala elementară folosind programe de instruire pe calculator.

Hărți topografice de recunoaștere universală

Abstract. Fotografii topografice ale zonelor de uscat și apă. Hărți topografice străine

Estetica (Aristotel și Platon)

Aristotel, teoriile mimesisului, principiul proporționalității dintre om și frumos. Estetica muzicală, Estetica pitagoreică, Armonia muzicală și matematică. Estetica idealistă a lui Platon

Sistem de aplicare a îngrășămintelor în rotația culturilor

Proiect de curs al Facultății de Agronomie. Catedra de Agrochimie și Știința Solului

Eficienta energetica in constructii. Uscare la cald

Parte dintr-un proiect de curs. Eficiența termică a instalațiilor de uscare. Perdele de aer.

Principala caracteristică a dispersiei unei serii variaționale se numește dispersie

Caracteristica principală a dispersiei seriei de variații se numește dispersie. Varianta eșantionuluiDîn se calculează folosind următoarea formulă:

unde x i – i -a valoare din eșantion care apare m i ori; n - marime de mostra; este media eșantionului; k este numărul de valori diferite din eșantion. În acest exemplu: x1 =72, m1 =50; x2 =85, m2 =44; x3 =69, m3 =61; n=155; k=3; . Apoi:

Rețineți că, cu cât valoarea dispersiei este mai mare, cu atât diferența dintre valorile cantității măsurate este mai mare între ele. Dacă în eșantion toate valorile valorii măsurate sunt egale între ele, atunci varianța unui astfel de eșantion este egală cu zero.

Dispersia are proprietăți speciale.

Proprietatea 1.Valoarea varianței oricărui eșantion este nenegativă, adică .

Proprietatea 2.Dacă valoarea măsurată este constantă X=c, atunci varianța pentru o astfel de valoare este zero: DC ]= 0.

Proprietatea 3.Dacă toate valorile mărimii măsurate X în creşterea eşantionului în c ori, atunci varianța acestui eșantion va crește cu c de 2 ori: D[cx ]= c 2 D [ x ], unde c = const .

Uneori, în locul varianței, se folosește o abatere standard a eșantionului, care este egală cu rădăcina pătrată aritmetică a varianței eșantionului: .

Pentru exemplul considerat, deviația standard a eșantionului este egală cu .

Dispersia vă permite să evaluați nu numai gradul de diferență a indicatorilor măsurați în cadrul unui grup, dar poate fi folosit și pentru a determina abaterea datelor între diferite grupuri. Pentru aceasta, se folosesc mai multe tipuri de dispersie.

Dacă orice grup este luat ca eșantion, atunci se numește varianța acestui grup varianță de grup. Pentru a exprima numeric diferențele dintre variațiile mai multor grupuri, există conceptul varianta intergrup. Varianta intergrup este varianța mediilor grupului în raport cu media generală:

unde k este numărul de grupuri din eșantionul total, este media eșantionului pentru i -a grupă, n i - marime de mostra i grupa, - media eșantionului pentru toate grupurile.

Luați în considerare un exemplu.

Scorul mediu la munca de control la matematică la 10 clasa „A” a fost 3,64, iar la 10 clasa „B” 3,52. În 10 „A” sunt 22 de elevi, iar în 10 „B” - 21. Să găsim dispersia intergrup.

În această problemă, eșantionul este împărțit în două grupuri (două clase). Media eșantionului pentru toate grupurile este:

.

În acest caz, varianța intergrup este:

Deoarece varianța intergrup este aproape de zero, putem concluziona că scorurile unui grup (clasa 10 „A”) diferă ușor de scorurile celui de-al doilea grup (clasa 10 „B”). Cu alte cuvinte, din punctul de vedere al varianței intergrupurilor, grupurile considerate diferă ușor în ceea ce privește un atribut dat.

Dacă eșantionul total (de exemplu, o clasă de studenți) este împărțit în mai multe grupuri, atunci pe lângă varianța intergrup, se poate calcula șivarianta intragrup. Această varianță este media tuturor variațiilor de grup.

Varianta intragrupD Ungaria calculat prin formula:

unde k este numărul de grupuri din eșantionul total, D i – varianța i al-lea grup de volum n i .

Există o relație între ansamblu (Dîn ), intragrup ( D ngr ) și intergrup ( D intergr) dispersii:

D în \u003d D ingr + D intergr.

Caracteristicile poziției descriu centrul de distribuție. În același timp, valorile unei variante pot fi grupate în jurul acesteia atât într-o bandă largă, cât și într-o bandă îngustă. Prin urmare, pentru a descrie distribuția, este necesar să se caracterizeze intervalul de modificare a valorilor atributului. Caracteristicile de împrăștiere sunt utilizate pentru a descrie intervalul de variație a caracteristicilor. Cele mai utilizate sunt intervalul de variație, varianța, abaterea standard și coeficientul de variație.

Variație de interval este definită ca diferența dintre valoarea maximă și minimă a trăsăturii în populația studiată:

R=X max- X min.

Avantajul evident al acestui indicator este ușurința de calcul. Cu toate acestea, deoarece intervalul de variație depinde de valorile doar ale valorilor extreme ale atributului, domeniul de aplicare al acestuia este limitat la distribuții destul de omogene. În alte cazuri, conținutul de informații al acestui indicator este foarte mic, deoarece există o mulțime de distribuții care diferă foarte mult ca formă, dar au același interval. În studiile practice, intervalul de variație este uneori utilizat pentru dimensiuni mici (nu mai mult de 10) eșantion. Deci, de exemplu, după intervalul de variație, este ușor de estimat cât de mult diferă cele mai bune și cele mai proaste rezultate într-un grup de sportivi.

În acest exemplu:

R\u003d 16,36 - 13,04 \u003d 3,32 (m).

A doua caracteristică de împrăștiere este dispersie. Varianta este pătratul mediu al abaterii valorii unei variabile aleatoare de la valoarea medie a acesteia. Dispersia este o caracteristică a dispersiei, dispersia valorilor unei cantități în jurul valorii sale medii. Cuvântul „dispersie” în sine înseamnă „împrăștiere”.

Atunci când se efectuează studii prin eșantion, este necesar să se stabilească o estimare a varianței. Varianța calculată din datele eșantionului se numește varianța eșantionului și se notează S 2 .

La prima vedere, cea mai naturală estimare a varianței este varianța statistică calculată din definiție folosind formula:

În această formulă, suma abaterilor pătrate ale valorilor atributelor x i din media aritmetică . Această sumă este împărțită la dimensiunea eșantionului pentru a obține abaterile pătrate medii. P.

Cu toate acestea, această estimare nu este imparțială. Se poate demonstra că suma abaterilor pătrate ale valorilor atributelor pentru media aritmetică a eșantionului este mai mică decât suma abaterilor pătrate de la orice altă valoare, inclusiv media adevărată (așteptările matematice). Prin urmare, rezultatul obținut prin formula de mai sus va conține o eroare sistematică, iar valoarea estimată a varianței va fi subestimată. Pentru a elimina părtinirea, este suficient să introduceți un factor de corecție. Rezultatul este următoarea relație pentru varianța estimată:

Pentru valori mari n, desigur, ambele estimări - părtinitoare și nepărtinitoare - vor diferi foarte puțin și introducerea unui factor de corecție devine lipsită de sens. De regulă, formula de estimare a varianței ar trebui să fie rafinată când n<30.

În cazul datelor grupate, ultima formulă de simplificare a calculelor poate fi redusă la următoarea formă:

Unde k- numărul de intervale de grupare;

n i- frecvența intervalului cu număr i;

x i- valoarea mijlocie a intervalului cu numărul i.

De exemplu, să calculăm varianța pentru datele grupate ale exemplului pe care îl analizăm (a se vedea tabelul 4.):

S 2 =/ 28=0,5473 (m2).

Varianta unei variabile aleatoare are dimensiunea pătratului dimensiunii unei variabile aleatoare, ceea ce o face dificil de interpretat și o face să nu fie foarte vizuală. Pentru o descriere mai vizuală a împrăștierii, este mai convenabil să folosiți o caracteristică a cărei dimensiune coincide cu dimensiunea caracteristicii studiate. În acest scop, conceptul deviație standard(sau deviație standard).

deviație standard se numește rădăcina pătrată pozitivă a varianței:

În exemplul nostru, abaterea standard este

Abaterea standard are aceleași unități de măsură ca și rezultatele măsurătorii trăsăturii studiate și, astfel, caracterizează gradul de abatere a trăsăturii de la media aritmetică. Cu alte cuvinte, arată cum se află partea principală a variantei în raport cu media aritmetică.

Abaterea standard și varianța sunt cele mai utilizate măsuri de variație. Acest lucru se datorează faptului că sunt incluse într-o parte semnificativă a teoremelor teoriei probabilităților, care servește drept fundament al statisticii matematice. În plus, varianța poate fi descompusă în elementele sale constitutive, permițând evaluarea influenței diferiților factori asupra variației trăsăturii studiate.

Pe lângă indicatorii absoluti de variație, care sunt varianța și abaterea standard, în statistică sunt introduși și cei relativi. Cel mai frecvent utilizat coeficient de variație. Coeficientul de variație este egal cu raportul dintre abaterea standard și media aritmetică, exprimat ca procent:

Din definiție reiese clar că, în sensul său, coeficientul de variație este o măsură relativă a dispersiei unei trăsături.

Pentru exemplul în cauză:

Coeficientul de variație este utilizat pe scară largă în cercetarea statistică. Fiind o valoare relativă, vă permite să comparați fluctuațiile ambelor trăsături cu unități de măsură diferite, precum și aceeași trăsătură în mai multe populații diferite cu valori diferite ale mediei aritmetice.

Coeficientul de variație este utilizat pentru a caracteriza omogenitatea datelor experimentale obținute. În practica culturii fizice și sportului, răspândirea rezultatelor măsurătorilor în funcție de valoarea coeficientului de variație este considerată a fi mică (V<10%), средним (11-20%) и большим (V> 20%).

Restricțiile privind utilizarea coeficientului de variație sunt legate de natura relativă a acestuia - definiția conține o normalizare la media aritmetică. În acest sens, pentru valori absolute mici ale mediei aritmetice, coeficientul de variație își poate pierde conținutul informațional. Cu cât valoarea mediei aritmetice este mai aproape de zero, cu atât acest indicator devine mai puțin informativ. În cazul limitativ, media aritmetică merge la zero (de exemplu, temperatura), iar coeficientul de variație merge la infinit, indiferent de răspândirea caracteristicii. Prin analogie cu cazul de eroare, putem formula următoarea regulă. Dacă valoarea mediei aritmetice din eșantion este mai mare de unu, atunci utilizarea coeficientului de variație este justificată; în caz contrar, dispersia și abaterea standard ar trebui folosite pentru a descrie răspândirea datelor experimentale.

În încheierea acestei părți, avem în vedere evaluarea variației valorilor caracteristicilor estimate. După cum sa menționat deja, valorile caracteristicilor de distribuție calculate din datele experimentale nu coincid cu valorile lor adevărate pentru populația generală. Nu este posibil să se stabilească cu exactitate pe acesta din urmă, deoarece, de regulă, este imposibil să se examineze întreaga populație. Dacă folosim rezultatele diferitelor eșantioane din aceeași populație generală pentru a estima parametrii de distribuție, atunci se dovedește că aceste estimări pentru diferite eșantioane diferă unele de altele. Valorile estimate fluctuează în jurul valorii lor adevărate.

Abaterile estimărilor parametrilor generali de la valorile adevărate ale acestor parametri se numesc erori statistice. Motivul apariției lor este dimensiunea limitată a eșantionului - nu toate obiectele populației generale sunt incluse în acesta. Pentru a estima amploarea erorilor statistice, se utilizează abaterea standard a caracteristicilor eșantionului.

Ca exemplu, luați în considerare cea mai importantă caracteristică de poziție - media aritmetică. Se poate demonstra că abaterea standard a mediei aritmetice este dată de:

Unde σ - abaterea standard pentru populatia generala.

Deoarece valoarea adevărată a abaterii standard nu este cunoscută, o cantitate numită eroarea standard a mediei aritmetice si egal:

Valoarea caracterizează eroarea care, în medie, este permisă la înlocuirea mediei generale cu estimarea eșantionului acesteia. Conform formulei, o creștere a dimensiunii eșantionului în timpul studiului duce la o scădere a erorii standard proporțional cu rădăcina pătrată a dimensiunii eșantionului.

Pentru exemplul luat în considerare, valoarea erorii standard a mediei aritmetice este . În cazul nostru, sa dovedit a fi de 5,4 ori mai mică decât valoarea abaterii standard.