După cum știți, legea distribuției variabilă aleatorie poate fi specificat în diverse moduri. O variabilă aleatoare discretă poate fi specificată folosind o serie de distribuție sau o funcție integrală, iar o variabilă aleatoare continuă poate fi specificată folosind fie o funcție integrală, fie o funcție diferențială. Să luăm în considerare analogii selectivi ai acestor două funcții.

Să existe un set de mostre de valori ale unei variabile aleatorii de volum iar fiecărei variante din acest set îi este atribuită frecvența sa. Lasă mai departe - niste numar real, A este numărul de valori ale eșantionului variabilei aleatoare
, mai mici .Apoi numărul este frecvența valorilor observate în eșantion X, mai mici , acestea. frecvența de apariție a evenimentului
. Când se schimbă Xîn cazul general, valoarea se va modifica și ea . Aceasta înseamnă că frecvența relativă este o funcție a argumentului . Și deoarece această funcție se găsește în funcție de datele eșantionului obținute în urma experimentelor, se numește eșantion sau empiric.

Definiția 10.15. Funcția de distribuție empirică(funcția de distribuție a eșantionării) se numește funcție
, definind pentru fiecare valoare X frecvența relativă a evenimentului
.

(10.19)

Spre deosebire de funcția de distribuție empirică a eșantionului, funcția de distribuție F(X) populatia numit funcţia de distribuţie teoretică. Diferența dintre ele este că funcția teoretică F(X) determină probabilitatea unui eveniment
, iar cel empiric este frecvența relativă a aceluiași eveniment. Din teorema Bernoulli rezultă

,
(10.20)

acestea. în mare probabilitate
și frecvența relativă a evenimentelor
, adică
putin diferit unul de altul. Aceasta implică deja oportunitatea utilizării funcției de distribuție empirică a eșantionului pentru o reprezentare aproximativă a funcției de distribuție teoretică (integrală) a populației generale.

Funcţie
și
au aceleasi proprietati. Aceasta provine din definiția funcției.

Proprietăți
:


Exemplul 10.4. Construiți o funcție empirică pentru distribuția eșantionului dată:

Opțiuni

Frecvențele

Soluţie: Găsiți dimensiunea eșantionului n= 12+18+30=60. Cea mai mică opțiune
, Prin urmare,
la
. Sens
, și anume
observat de 12 ori, prin urmare:

=
la
.

Sens X< 10 și anume
și
au fost observate de 12+18=30 de ori, prin urmare,
=
la
. La

.

Funcția de distribuție empirică dorită:

=

Programa
prezentată în fig. 10.2

R
este. 10.2

întrebări de testare

1. Care sunt principalele probleme rezolvate de statistica matematică? 2. Populația generală și eșantion? 3. Definiți dimensiunea eșantionului. 4. Ce mostre se numesc reprezentative? 5. Erori de reprezentativitate. 6. Principalele metode de prelevare a probelor. 7. Concepte de frecvență, frecvență relativă. 8. Conceptul de serie statistică. 9. Notează formula Sturges. 10. Formulați conceptele de interval de eșantionare, mediană și mod. 11. Frecvențe poligonului, histogramă. 12. Conceptul de estimare punctuală a unei populații eșantion. 13. Estimare punctuală părtinitoare și nepărtinitoare. 14. Formulați conceptul de medie eșantionului. 15. Formulați conceptul de varianță eșantionului. 16. Formulați conceptul de abatere standard a eșantionului. 17. Formulați conceptul de coeficient de variație al eșantionului. 18. Formulați conceptul de medie geometrică eșantion.

Cursul 13

Să se știe distributie statistica frecvente trăsătură cantitativă X. Notați prin numărul de observații la care a fost observată o valoare a caracteristicii mai mică decât x și prin n - numărul total observatii. Evident, frecvența relativă a evenimentului X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Funcția de distribuție empirică(funcția de distribuție a eșantionării) este o funcție care determină pentru fiecare valoare x frecvența relativă a evenimentului X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

Spre deosebire de funcția de distribuție empirică a eșantionului, se numește funcția de distribuție a populației funcţia de distribuţie teoretică. Diferența dintre aceste funcții este că funcția teoretică definește probabilitate evenimente X< x, тогда как эмпирическая – frecventa relativa acelasi eveniment.

Pe măsură ce n crește, frecvența relativă a evenimentului X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Proprietățile funcției de distribuție empirică:

1) Valorile funcției empirice aparțin segmentului

2) - funcţie nedescrescătoare

3) Dacă - cea mai mică opțiune, atunci = 0 la , dacă - cea mai mare opțiune, atunci =1 la .

funcţie empirică Distribuția eșantionului servește la estimarea funcției de distribuție teoretică a populației.

Exemplu. Să construim o funcție empirică în funcție de distribuția eșantionului:

Opțiuni
Frecvențele

Să găsim dimensiunea eșantionului: 12+18+30=60. Cea mai mică opțiune este 2, deci =0 pentru x £ 2. Valoarea lui x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Astfel, funcția empirică dorită are forma:

Cele mai importante proprietăți ale estimărilor statistice

Să fie necesar să se studieze un anumit atribut cantitativ al populației generale. Să presupunem că, din considerente teoretice, s-a putut stabili că care distribuţia are un atribut şi este necesar să se evalueze parametrii după care este determinată. De exemplu, dacă trăsătura studiată este distribuită în mod normal în populația generală, atunci este necesar să se estimeze valorea estimatași abaterea standard; dacă atributul are o distribuție Poisson, atunci este necesar să se estimeze parametrul l.

De obicei, sunt disponibile doar date eșantion, cum ar fi valorile trăsăturilor din n observații independente. Considerând ca variabile aleatoare independente, putem spune că a găsi o estimare statistică a unui parametru necunoscut al unei distribuții teoretice înseamnă a găsi o funcție a variabilelor aleatoare observate care oferă o valoare aproximativă a parametrului estimat. De exemplu, pentru a estima așteptările matematice distributie normala rolul funcţiei este îndeplinit de media aritmetică



Pentru ca estimările statistice să ofere aproximări corecte ale parametrilor estimați, acestea trebuie să îndeplinească anumite cerințe, dintre care cele mai importante sunt cerințele imparțialitatea și solvabilitate estimări.

Lăsa - evaluare statistică parametru necunoscut al distribuției teoretice. Fie ca estimarea să fie găsită pe baza unui eșantion de mărimea n. Să repetăm ​​experimentul, adică. extragem din populația generală un alt eșantion de aceeași mărime și, pe baza datelor sale, obținem o estimare diferită de . Repetând experimentul de multe ori, obținem numere diferite. Scorul poate fi considerat ca o variabilă aleatorie, iar numerele ca valori posibile.

Dacă estimarea oferă o aproximare in abundenta, adică fiecare număr este mai mare decât valoarea adevărată, apoi, în consecință, așteptarea matematică (valoarea medie) a variabilei aleatoare este mai mare decât:. La fel, dacă evaluează cu un dezavantaj, apoi .

Astfel, utilizarea unei estimări statistice, a cărei așteptare matematică nu este egală cu parametrul estimat, ar duce la erori sistematice (un singur semn). Dacă, dimpotrivă, , atunci aceasta garantează împotriva erorilor sistematice.

imparțial numită estimare statistică, a cărei așteptare matematică este egală cu parametrul estimat pentru orice dimensiune a eșantionului.

Deplasat se numeste estimare care nu satisface aceasta conditie.

Nepărtinirea estimării nu garantează încă o bună aproximare a parametrului estimat, deoarece valorile posibile pot fi foarte împrăştiate în jurul valorii sale medii, adică varianţa poate fi semnificativă. În acest caz, estimarea găsită din datele unui eșantion, de exemplu, se poate dovedi a fi semnificativ îndepărtată de valoarea medie și, prin urmare, de parametrul estimat în sine.

eficient se numește estimare statistică care, pentru o dimensiune dată de eșantion n, are cea mai mică variație posibilă .

Atunci când se iau în considerare mostre de volum mare, sunt necesare estimări statistice solvabilitate .

Bogat se numește estimare statistică, care, ca n®¥, tinde probabil către parametrul estimat. De exemplu, dacă varianța unui estimator imparțial tinde spre zero ca n®¥, atunci și un astfel de estimator se dovedește a fi consistent.

Determinarea funcţiei de distribuţie empirică

Fie $X$ o variabilă aleatoare. $F(x)$ - funcția de distribuție a variabilei aleatoare date. Vom efectua $n$ experimente pe o variabilă aleatoare dată în aceleași condiții independente. În acest caz, obținem o secvență de valori $x_1,\ x_2\ $, ... ,$\ x_n$, care se numește eșantion.

Definiția 1

Fiecare valoare a lui $x_i$ ($i=1,2\ $, ... ,$ \ n$) se numește variantă.

Una dintre estimările funcției de distribuție teoretică este funcția de distribuție empirică.

Definiția 3

Funcția de distribuție empirică $F_n(x)$ este funcția care determină pentru fiecare valoare $x$ frecvența relativă a evenimentului $X \

unde $n_x$ este numărul de opțiuni mai mic decât $x$, $n$ este dimensiunea eșantionului.

Diferența dintre o funcție empirică și una teoretică este că funcția teoretică determină probabilitatea evenimentului $X

Proprietățile funcției de distribuție empirică

Să luăm acum în considerare câteva proprietăți de bază ale funcției de distribuție.

    Domeniul funcției $F_n\left(x\right)$ este segmentul $$.

    $F_n\left(x\right)$ este o funcție nedescrescătoare.

    $F_n\left(x\right)$ este o funcție continuă stânga.

    $F_n\left(x\right)$ este o funcție constantă pe bucăți și crește numai în punctele de valori ale variabilei aleatoare $X$

    Fie $X_1$ cea mai mică și $X_n$ cea mai mare variantă. Apoi $F_n\left(x\right)=0$ pentru $(x\le X)_1$ și $F_n\left(x\right)=1$ pentru $x\ge X_n$.

Să introducem o teoremă care leagă funcțiile teoretice și empirice.

Teorema 1

Fie $F_n\left(x\right)$ funcția de distribuție empirică și $F\left(x\right)$ funcția de distribuție teoretică a eșantionului general. Atunci egalitatea este valabilă:

\[(\mathop(lim)_(n\la \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Exemple de probleme pentru găsirea funcției de distribuție empirică

Exemplul 1

Fie ca distribuția eșantionului să aibă următoarele date, înregistrate folosind un tabel:

Poza 1.

Găsiți dimensiunea eșantionului, compuneți o funcție de distribuție empirică și reprezentați-o grafic.

Dimensiunea eșantionului: $n=5+10+15+20=50$.

Prin proprietatea 5, avem că pentru $x\le 1$ $F_n\left(x\right)=0$, iar pentru $x>4$ $F_n\left(x\right)=1$.

valoarea x $

valoarea x $

valoarea x $

Astfel, obținem:

Figura 2.

Figura 3

Exemplul 2

Din orașele din partea centrală a Rusiei au fost selectate aleatoriu 20 de orașe, pentru care s-au obținut următoarele date privind tarifele în transportul public: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15 , 14, 15, 13 , 13, 12, 12, 15, 14, 14.

Compuneți o funcție de distribuție empirică a acestui eșantion și construiți graficul acestuia.

Scriem valorile eșantionului în ordine crescătoare și calculăm frecvența fiecărei valori. Obținem următorul tabel:

Figura 4

Dimensiunea eșantionului: $n=20$.

Prin proprietatea 5, avem că pentru $x\le 12$ $F_n\left(x\right)=0$, iar pentru $x>15$ $F_n\left(x\right)=1$.

valoarea x $

valoarea x $

valoarea x $

Astfel, obținem:

Figura 5

Să diagramăm distribuția empirică:

Figura 6

Originalitate: 92,12 USD\%$.

Aflați ce este o formulă empirică.În chimie, un ESP este cel mai simplu mod de a descrie un compus - în esență, este o listă a elementelor care alcătuiesc compusul dat fiind procentul lor. Trebuie remarcat faptul că această formulă simplă nu descrie Ordin atomi dintr-un compus, indică pur și simplu din ce elemente constă. De exemplu:

  • Un compus constând din 40,92% carbon; 4,58% hidrogen și 54,5% oxigen, vor avea formula empirică C 3 H 4 O 3 (un exemplu de găsire a ESP al acestui compus va fi discutat în a doua parte).
  • Învață termenul „compoziție procentuală”."Compoziție procentuală" se referă la procentul fiecărui atom individual din întregul compus luat în considerare. Pentru a găsi formula empirică a unui compus, este necesar să se cunoască compoziția procentuală a compusului. Dacă găsiți o formulă empirică ca teme pentru acasă, atunci este probabil să se acorde dobândă.

    • Pentru a afla procentul component chimic in laborator este supus unor experimente fizice si apoi analizei cantitative. Dacă nu sunteți în laborator, nu trebuie să faceți aceste experimente.
  • Rețineți că va trebui să aveți de-a face cu atomi gram. Un atom gram este o anumită cantitate dintr-o substanță a cărei masă este egală cu masa atomică. Pentru a găsi un atom gram, trebuie să utilizați următoarea ecuație: Procentul unui element dintr-un compus este împărțit la masa atomică a elementului.

    • Să presupunem, de exemplu, că avem un compus care conține 40,92% carbon. Masă atomică carbonul este 12, deci ecuația noastră ar fi 40,92 / 12 = 3,41.
  • Aflați cum să găsiți raportul atomic. Când lucrați cu un compus, veți ajunge cu mai mult de un atom gram. După ce ai găsit toți atomii gram ai compusului tău, uită-te la ei. Pentru a găsi raportul atomic, va trebui să selectați cea mai mică valoare gram-atom pe care ați calculat-o. Apoi va fi necesar să împărțiți toți atomii gram în cel mai mic atom gram. De exemplu:

    • Să presupunem că lucrați cu un compus care conține trei atomi gram: 1,5; 2 și 2.5. Cel mai mic dintre aceste numere este 1,5. Prin urmare, pentru a găsi raportul dintre atomi, trebuie să împărțiți toate numerele la 1,5 și să puneți un semn de raport între ele. : .
    • 1,5 / 1,5 = 1, 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Prin urmare, raportul dintre atomi este 1: 1,33: 1,66 .
  • Aflați cum să convertiți valorile raportului atomic în numere întregi. Când scrieți o formulă empirică, trebuie să utilizați numere întregi. Aceasta înseamnă că nu puteți folosi numere precum 1.33. După ce găsiți raportul dintre atomi, trebuie să convertiți numerele fracționale (cum ar fi 1,33) în numere întregi (cum ar fi 3). Pentru a face acest lucru, trebuie să găsiți un număr întreg, înmulțind fiecare număr al raportului atomic cu care obțineți numere întregi. De exemplu:

    • Încercați 2. Înmulțiți numerele raportului atomic (1, 1,33 și 1,66) cu 2. Obțineți 2, 2,66 și 3,32. Nu sunt numere întregi, deci 2 nu este potrivit.
    • Încercați 3. Dacă înmulțiți 1, 1,33 și 1,66 cu 3, obțineți 3, 4 și, respectiv, 5. Prin urmare, raportul atomic al numerelor întregi are forma 3: 4: 5 .
  • Determinarea funcţiei de distribuţie empirică

    Fie $X$ o variabilă aleatoare. $F(x)$ - funcția de distribuție a variabilei aleatoare date. Vom efectua $n$ experimente pe o variabilă aleatoare dată în aceleași condiții independente. În acest caz, obținem o secvență de valori $x_1,\ x_2\ $, ... ,$\ x_n$, care se numește eșantion.

    Definiția 1

    Fiecare valoare a lui $x_i$ ($i=1,2\ $, ... ,$ \ n$) se numește variantă.

    Una dintre estimările funcției de distribuție teoretică este funcția de distribuție empirică.

    Definiția 3

    Funcția de distribuție empirică $F_n(x)$ este funcția care determină pentru fiecare valoare $x$ frecvența relativă a evenimentului $X \

    unde $n_x$ este numărul de opțiuni mai mic decât $x$, $n$ este dimensiunea eșantionului.

    Diferența dintre o funcție empirică și una teoretică este că funcția teoretică determină probabilitatea evenimentului $X

    Proprietățile funcției de distribuție empirică

    Să luăm acum în considerare câteva proprietăți de bază ale funcției de distribuție.

      Domeniul funcției $F_n\left(x\right)$ este segmentul $$.

      $F_n\left(x\right)$ este o funcție nedescrescătoare.

      $F_n\left(x\right)$ este o funcție continuă stânga.

      $F_n\left(x\right)$ este o funcție constantă pe bucăți și crește numai în punctele de valori ale variabilei aleatoare $X$

      Fie $X_1$ cea mai mică și $X_n$ cea mai mare variantă. Apoi $F_n\left(x\right)=0$ pentru $(x\le X)_1$ și $F_n\left(x\right)=1$ pentru $x\ge X_n$.

    Să introducem o teoremă care leagă funcțiile teoretice și empirice.

    Teorema 1

    Fie $F_n\left(x\right)$ funcția de distribuție empirică și $F\left(x\right)$ funcția de distribuție teoretică a eșantionului general. Atunci egalitatea este valabilă:

    \[(\mathop(lim)_(n\la \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

    Exemple de probleme pentru găsirea funcției de distribuție empirică

    Exemplul 1

    Fie ca distribuția eșantionului să aibă următoarele date, înregistrate folosind un tabel:

    Poza 1.

    Găsiți dimensiunea eșantionului, compuneți o funcție de distribuție empirică și reprezentați-o grafic.

    Dimensiunea eșantionului: $n=5+10+15+20=50$.

    Prin proprietatea 5, avem că pentru $x\le 1$ $F_n\left(x\right)=0$, iar pentru $x>4$ $F_n\left(x\right)=1$.

    valoarea x $

    valoarea x $

    valoarea x $

    Astfel, obținem:

    Figura 2.

    Figura 3

    Exemplul 2

    Din orașele din partea centrală a Rusiei au fost selectate aleatoriu 20 de orașe, pentru care s-au obținut următoarele date privind tarifele în transportul public: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15 , 14, 15, 13 , 13, 12, 12, 15, 14, 14.

    Compuneți o funcție de distribuție empirică a acestui eșantion și construiți graficul acestuia.

    Scriem valorile eșantionului în ordine crescătoare și calculăm frecvența fiecărei valori. Obținem următorul tabel:

    Figura 4

    Dimensiunea eșantionului: $n=20$.

    Prin proprietatea 5, avem că pentru $x\le 12$ $F_n\left(x\right)=0$, iar pentru $x>15$ $F_n\left(x\right)=1$.

    valoarea x $

    valoarea x $

    valoarea x $

    Astfel, obținem:

    Figura 5

    Să diagramăm distribuția empirică:

    Figura 6

    Originalitate: 92,12 USD\%$.