Statistici matematice este o ramură modernă a matematicii care se ocupă de descriere statistică rezultatele experimentelor și observațiilor, precum și clădire modele matematice conţinând concepte probabilități. Baza teoretică a statisticii matematice este teoria probabilității.

În structura statisticii matematice, se disting în mod tradițional două secțiuni principale: Statisticile descriptiveși inferența statistică (Figura 1.1).

Orez. 1.1. Secțiunile principale ale statisticii matematice

Statisticile descriptive este folosit pentru:

o generalizarea indicatorilor unei variabile (statistica unui eșantion aleatoriu);

o identificarea relaţiilor dintre două sau mai multe variabile (analiza corelaţie-regresie).

Statistica descriptivă face posibilă obținerea de informații noi, înțelegerea rapidă și evaluarea cuprinzătoare a acestora, adică îndeplinește funcția științifică de a descrie obiectele de studiu, ceea ce justifică numele. Metodele statisticii descriptive sunt concepute pentru a transforma un set de date empirice individuale într-un sistem de forme și numere care sunt vizuale pentru percepție: distribuții de frecvență; indicatori de tendințe, variabilitate, comunicare. Aceste metode calculează statisticile unui eșantion aleatoriu, care servesc drept bază pentru implementarea inferențelor statistice.

Inferență statistică da ocazia:

o evaluarea acurateței, fiabilitatea și eficacitatea statisticilor eșantionului, găsirea erorilor care apar în procesul de cercetare statistică (evaluare statistică)

o rezumați parametrii populației generale obținuți pe baza statisticilor eșantionului (verificare ipotezele statistice).

obiectivul principal cercetare științifică- aceasta este dobândirea de noi cunoștințe despre o clasă mare de fenomene, persoane sau evenimente, care sunt denumite în mod obișnuit populația generală.

Populația este totalitatea obiectelor de studiu, probă- partea sa, care se formează într-un anumit mod fundamentat științific 2.

Termenul „populație generală” este folosit când vorbim despre un set mare, dar finit de obiecte aflate în studiu. De exemplu, despre totalitatea participanților ucraineni în 2009 sau totalitatea copiilor vârsta preșcolară orașul Rivne. Populațiile generale pot atinge volume semnificative, pot fi finite și infinite. În practică, de regulă, se ocupă de mulțimi finite. Și dacă raportul dintre dimensiunea populației generale și dimensiunea eșantionului este mai mare de 100, atunci, conform lui Glass și Stanley, metodele de estimare pentru populații finite și infinite dau în esență aceleași rezultate. Setul general poate fi numit și setul complet de valori ale unui atribut. Faptul că eșantionul aparține populației generale este baza principală de evaluare a caracteristicilor populației generale în funcție de caracteristicile eșantionului.

Principal idee statistica matematică se bazează pe credința că un studiu complet al tuturor obiectelor populației generale în majoritatea problemelor științifice este fie practic imposibil, fie nepractic din punct de vedere economic, deoarece necesită mult timp și costuri materiale semnificative. Prin urmare, în statistica matematică, este folosit abordare selectivă, al cărui principiu este prezentat în diagrama din fig. 1.2.

De exemplu, conform tehnologiei de formare, eșantioanele sunt randomizate (simple și sistematice), stratificate, grupate (vezi Secțiunea 4).

Orez. 1.2. Schema de aplicare a metodelor statisticii matematice Conform abordare selectivă folosirea matematicii metode statistice poate fi efectuată în următoarea secvență (vezi Fig. 1.2):

o cu populația generală, ale căror proprietăți sunt supuse cercetării, anumite metodele formează un eșantion- un număr tipic, dar limitat de obiecte cărora li se aplică metode de cercetare;

o ca urmare a metodelor de observație, acțiunilor experimentale și măsurătorilor pe obiecte eșantion, se obțin date empirice;

o prelucrarea datelor empirice folosind metode de statistică descriptivă oferă indicatori eșantion, care se numesc statisticieni - ca și numele disciplinei, de altfel;

o aplicarea metodelor de inferență statistică la statistician, primesc parametri care caracterizează proprietăţile populatia generala.

Exemplul 1.1. Pentru a evalua stabilitatea nivelului de cunoștințe (variabilă X) testarea unui eșantion randomizat de 3 elevi cu un volum de n. Testele au cuprins m sarcini, fiecare dintre acestea fiind evaluată conform sistemului de punctaj: „terminat” „- 1”, neîndeplinit „- 0. media realizărilor curente ale elevilor a rămas X

3 eșantion randomizat(din engleză. Random - random) este un eșantion reprezentativ, care se formează după strategia testelor aleatorii.

la nivelul anilor anteriori/h? Secvența soluției:

o aflați o ipoteză semnificativă de tipul: „dacă rezultatele testelor actuale nu diferă de cele din trecut, atunci putem considera că nivelul de cunoștințe al elevilor este neschimbat și procesul de studiu- grajd";

o formula o ipoteză statistică adecvată, cum ar fi ipoteza nulă H 0 că „curentul GPA X nu este diferit statistic de media anilor anteriori/h”, i.e. H 0: X = ⁄ r, față de ipoteza alternativă corespunzătoare X Ф ^ ;

o construi distribuțiile empirice ale variabilei investigate X;

o determina(dacă este necesar) corelații, de exemplu, între o variabilă Xși alți indicatori, construiți linii de regresie;

o verifica conformitatea distribuţie empirică legea normală;

o evaluarea valorii indicatorilor punctual și a intervalului de încredere al parametrilor, de exemplu, media;

o definirea criteriilor de testare statistică ipoteze;

o testarea ipotezelor statistice pe baza criteriilor selectate;

o formula o decizie asupra ipotezei nule statistice asupra unui anumit nivelul de semnificație;

o trecerea de la decizia de a accepta sau respinge ipoteza nulă statistică a interpretării concluziilor privind ipoteza cu sens;

o formula concluzii semnificative.

Deci, dacă rezumăm procedurile de mai sus, aplicarea metodelor statistice constă din trei blocuri principale:

Trecerea de la un obiect al realității la o schemă abstractă matematică și statistică, adică construcția unui model probabilistic al unui fenomen, proces, proprietate;

Efectuarea acțiunilor de calcul prin mijloace matematice adecvate în cadrul unui model probabilistic bazat pe rezultatele măsurătorilor, observațiilor, experimentelor și formularea concluziilor statistice;

Interpretarea concluziilor statistice despre situația reală și luarea unei decizii adecvate.

Metodele statistice de procesare și interpretare a datelor se bazează pe teoria probabilității. Teoria probabilității stă la baza metodelor statisticii matematice. Fără utilizarea conceptelor fundamentale și a legilor teoriei probabilităților, este imposibil să se generalizeze concluziile statisticii matematice și, prin urmare, utilizarea lor rezonabilă în scopuri științifice și practice.

Astfel, sarcina statisticii descriptive este de a transforma un set de date eșantion într-un sistem de indicatori - statistici - distribuții de frecvență, măsuri de tendință și variabilitate centrală, coeficienți de cuplare și altele asemenea. Cu toate acestea, statisticile sunt caracteristici, de fapt, ale unui anumit eșantion. Desigur, este posibil să se calculeze distribuțiile eșantionului, mediile eșantionului, variațiile etc., dar o astfel de „analiza de date” are o valoare științifică și educațională limitată. Transferul „mecanic” al oricăror concluzii trase pe baza unor astfel de indicatori către alte populații nu este corect.

Pentru a putea transfera indicatorii eșantionului sau alții, sau către populații mai obișnuite, este necesar să se fi justificat matematic prevederi despre conformitatea și capacitatea caracteristicilor eșantionului cu caracteristicile acestor populații comune așa-numite generale. Astfel de prevederi se bazează pe abordări teoretice și scheme asociate modelelor probabiliste ale realității, de exemplu, pe abordarea axiomatică, în lege. numere mari etc. Numai cu ajutorul lor este posibilă transferarea proprietăților care sunt stabilite de rezultatele analizei informațiilor empirice limitate, fie către alte, fie către mulțimi comune. Astfel, construcția, legile funcționării, utilizarea modelelor probabilistice, face obiectul unui domeniu matematic numit „teoria probabilității”, devine esența metodelor statistice.

Astfel, în statistica matematică se folosesc două linii paralele de indicatori: prima linie, care este relevantă pentru practică (aceștia sunt indicatori eșantion) și a doua, bazată pe teorie (aceștia sunt indicatori ai unui model probabilistic). De exemplu, frecvențele empirice care sunt determinate pe eșantion corespund conceptelor de probabilitate teoretică; media eșantionului (practică) corespunde valorea estimata(teorie), etc. În plus, în studii, caracteristicile selective, de regulă, sunt primare. Ele sunt calculate pe baza de observații, măsurători, experimente, după care sunt supuse unei evaluări statistice a capacității și eficacității, testării ipotezelor statistice în conformitate cu obiectivele cercetării și, în final, sunt acceptate cu o anumită probabilitate ca indicatori ai proprietăților populațiilor studiate.

Întrebare. O sarcină.

1. Descrieți principalele secțiuni ale statisticii matematice.

2. Care este ideea principală a statisticii matematice?

3. Descrieți raportul dintre populația generală și populația eșantion.

4. Explicaţi schema de aplicare a metodelor statisticii matematice.

5. Precizați lista sarcinilor principale ale statisticii matematice.

6. Care sunt principalele blocuri ale aplicării metodelor statistice? Descrie-i.

7. Extindeți legătura dintre statistica matematică și teoria probabilității.

Introducere

2. Concepte de bază ale statisticii matematice

2.1 Concepte de bază ale eșantionării

2.2 Eșantionarea

2.3 Funcția de distribuție empirică, histogramă

Concluzie

Bibliografie

Introducere

Statistica matematică este știința metode matematice sistematizarea și utilizarea datelor statistice pentru concluzii științifice și practice. În multe dintre ramurile sale, statistica matematică se bazează pe teoria probabilității, ceea ce face posibilă evaluarea fiabilității și acurateței concluziilor extrase din material statistic limitat (de exemplu, pentru a estima dimensiunea necesară a eșantionului pentru a obține rezultate cu precizia cerută). într-un sondaj prin sondaj).

În teoria probabilității, variabile aleatoare cu o distribuție dată sau experimente aleatorii ale căror proprietăți sunt pe deplin cunoscute. Subiectul teoriei probabilităților îl reprezintă proprietățile și relațiile acestor mărimi (distribuții).

Dar adesea experimentul este o cutie neagră, dând doar câteva rezultate, conform cărora este necesar să se tragă o concluzie despre proprietățile experimentului în sine. Observatorul are un set de rezultate numerice (sau pot fi făcute numerice) obținute prin repetarea aceluiași experiment aleatoriu în aceleași condiții.

În acest caz, de exemplu, apar următoarele întrebări: Dacă observăm o variabilă aleatorie, cum putem trage cea mai precisă concluzie despre distribuția ei dintr-un set de valori ale acesteia în mai multe experimente?

Un exemplu de astfel de serie de experimente este o anchetă sociologică, un set de indicatori economici sau, în cele din urmă, o succesiune de steme și cozi în timpul unei aruncări de o mie de monede.

Toți factorii de mai sus conduc la relevanţăși importanța temei de lucru în etapa actuală, care vizează un studiu profund și cuprinzător al conceptelor de bază ale statisticii matematice.

În acest sens, scopul acestei lucrări este sistematizarea, acumularea și consolidarea cunoștințelor despre conceptele de statistică matematică.

1. Subiectul și metodele statisticii matematice

Statistica matematică este știința metodelor matematice de analiză a datelor obținute în timpul observațiilor în masă (măsurători, experimente). În funcție de natura matematică a rezultatelor specifice ale observațiilor, statistica matematică este împărțită în statistici de numere, multidimensionale analize statistice, analiza funcţiilor (proceselor) şi a seriilor temporale, statistica obiectelor de natură nenumerică. O parte semnificativă a statisticii matematice se bazează pe modele probabilistice. Aloca sarcini generale descrieri de date, evaluare și testare a ipotezelor. De asemenea, ei iau în considerare sarcini mai specifice legate de efectuarea de anchete prin sondaj, restaurarea dependențelor, construirea și utilizarea clasificărilor (tipologii) etc.

Pentru a descrie datele, sunt construite tabele, diagrame și alte reprezentări vizuale, de exemplu, câmpuri de corelație. De obicei nu se folosesc modele probabilistice. Unele metode de descriere a datelor se bazează pe teoria avansată și pe capacitățile computerelor moderne. Acestea includ, în special, analiza cluster, care vizează identificarea grupurilor de obiecte care sunt similare între ele și scalarea multidimensională, care face posibilă vizualizarea obiectelor într-un plan, distorsionând distanțele dintre ele în cel mai mic grad.

Metodele de estimare și testare a ipotezelor se bazează pe modele probabilistice de generare a datelor. Aceste modele sunt împărțite în parametrice și neparametrice. În modelele parametrice, se presupune că obiectele studiate sunt descrise prin funcții de distribuție care depind de un număr mic (1-4) de parametri numerici. În modelele neparametrice, se presupune că funcțiile de distribuție sunt continue arbitrare. În statistica matematică, parametrii și caracteristicile distribuției (așteptări matematice, mediană, varianță, cuantile etc.), densitățile și funcțiile de distribuție, dependențele dintre variabile (pe baza coeficienților de corelație liniari și neparametrici, precum și parametrii sau neparametrici). estimări parametrice ale funcțiilor care exprimă dependențe) sunt evaluate etc. Folosiți estimări punctuale și pe intervale (dând limite pentru valorile adevărate).

În statistica matematică există o teorie generală a testării ipotezelor și număr mare metode dedicate testării ipotezelor specifice. Se au în vedere ipoteze despre valorile parametrilor și caracteristicilor, despre verificarea omogenității (adică despre coincidența caracteristicilor sau funcțiilor de distribuție în două eșantioane), despre acordul funcției de distribuție empirică cu o funcție de distribuție dată sau cu o funcție parametrică. familia de astfel de funcții, despre simetria distribuției etc.

De mare importanță este secțiunea de statistică matematică asociată cu realizarea anchetelor prin sondaj, cu proprietățile diferitelor scheme de eșantionare și construirea unor metode adecvate de estimare și testare a ipotezelor.

Problemele de recuperare a dependenței au fost studiate activ de mai bine de 200 de ani, de la dezvoltarea metodei celor mai mici pătrate de către K. Gauss în 1794. În prezent, metodele de căutare a unui subset informativ de variabile și metodele neparametrice sunt cele mai relevante.

Dezvoltarea metodelor de aproximare a datelor și de reducere a dimensiunii descrierii a început cu mai bine de 100 de ani în urmă, când K. Pearson a creat metoda componentelor principale. Ulterior, au fost dezvoltate analiza factorială și numeroase generalizări neliniare.

Diverse metode de construire (analiză cluster), analiză și utilizare (analiza discriminantă) a clasificărilor (tipologii) sunt numite și metode de recunoaștere a modelelor (cu și fără profesor), clasificare automată etc.

Metodele matematice din statistică se bazează fie pe utilizarea sumelor (pe baza Teoremei limitei centrale a teoriei probabilităților), fie a indicatorilor de diferență (distanțe, metrici), ca în statistica obiectelor nenumerice. De obicei, doar rezultatele asimptotice sunt riguros fundamentate. În zilele noastre, computerele joacă un rol important în statistica matematică. Ele sunt utilizate atât pentru calcule, cât și pentru modelarea prin simulare (în special, în metodele de eșantionare și în studierea adecvării rezultatelor asimptotice).

Concepte de bază ale statisticii matematice

2.1 Concepte de bază ale metodei de eșantionare

Fie o variabilă aleatoare observată într-un experiment aleatoriu. Se presupune că spațiul de probabilitate este dat (și nu ne va interesa).

Vom presupune că, după ce am efectuat acest experiment o dată în aceleași condiții, am obținut numerele , , , - valorile acestei variabile aleatorii în prima, a doua etc. experimente. O variabilă aleatoare are o anumită distribuție, care ne este parțial sau complet necunoscută.

Să aruncăm o privire mai atentă asupra unui set numit eșantion.

Într-o serie de experimente deja efectuate, un eșantion este un set de numere. Dar dacă această serie de experimente se repetă din nou, atunci în locul acestui set vom obține un nou set de numere. În loc de un număr, va apărea un alt număr - una dintre valorile unei variabile aleatorii. Adică (și , și , etc.) este o variabilă care poate lua aceleași valori ca și variabila aleatoare și la fel de des (cu aceleași probabilități). Prin urmare, înainte de experiment - o variabilă aleatorie distribuită egal cu , iar după experiment - numărul pe care îl observăm în acest prim experiment, i.e. una dintre valorile posibile ale variabilei aleatoare.

Un eșantion de volum este un set de variabile aleatoare independente și distribuite identic („copii”) care, ca și , au o distribuție.

Ce înseamnă a trage o concluzie despre distribuția dintr-un eșantion? Distribuția se caracterizează printr-o funcție de distribuție, densitate sau tabel, un set de caracteristici numerice - , , etc. Pe baza eșantionului, trebuie să fie capabil să construiască aproximări pentru toate aceste caracteristici.

.2 Prelevarea de probe

Luați în considerare implementarea eșantionului pe un singur rezultat elementar - un set de numere , , . Pe un spațiu de probabilitate adecvat, introducem o variabilă aleatorie luând valorile, , cu probabilități în (dacă unele dintre valori coincid, adunăm probabilitățile de numărul corespunzător de ori). Tabelul de distribuție a probabilității și funcția de distribuție a variabilelor aleatoare arată astfel:

Distribuția unei cantități se numește distribuție empirică sau eșantion. Să calculăm așteptarea și varianța matematică a unei mărimi și să introducem notația pentru aceste mărimi:

În același mod, calculăm momentul comenzii

În cazul general, notăm prin cantitate

Dacă, atunci când construim toate caracteristicile introduse de noi, considerăm eșantionul , , ca un set de variabile aleatoare, atunci aceste caracteristici în sine - , , , , - vor deveni variabile aleatoare. Aceste caracteristici ale distribuției eșantionului sunt utilizate pentru a estima (aproxima) caracteristicile necunoscute corespunzătoare ale distribuției adevărate.

Motivul pentru care se utilizează caracteristicile distribuției pentru a estima caracteristicile distribuției adevărate (sau ) este în apropierea acestor distribuții pentru mari .

Luați în considerare, de exemplu, aruncarea unui zar obișnuit. Lăsa - numărul de puncte care au căzut la a --a aruncare, . Să presupunem că unul din eșantion va apărea o dată, două - o dată și așa mai departe. Apoi variabila aleatoare va lua valorile 1 , , 6 cu probabilități , respectiv. Dar aceste proporții se apropie cu creștere după legea numerelor mari. Adică, distribuția mărimii se apropie într-un anumit sens de distribuția adevărată a numărului de puncte care cad atunci când zarul corect este aruncat.

Nu vom specifica ce se înțelege prin apropierea eșantionului și distribuțiile adevărate. În paragrafele următoare, vom arunca o privire mai atentă asupra fiecăreia dintre caracteristicile introduse mai sus și vom examina proprietățile acesteia, inclusiv comportamentul său cu creșterea dimensiunii eșantionului.

.3 Funcția de distribuție empirică, histogramă

Deoarece distribuția necunoscută poate fi descrisă, de exemplu, prin funcția sa de distribuție , vom construi o „estimare” pentru această funcție din eșantion.

Definiția 1.

Se numește o funcție de distribuție empirică construită pe un eșantion de volum functie aleatorie, pentru fiecare egal

Aducere aminte: functie aleatorie

numit indicator de eveniment. Pentru fiecare, aceasta este o variabilă aleatoare având o distribuție Bernoulli cu parametrul . De ce?

Cu alte cuvinte, pentru orice valoare a lui , egală cu probabilitatea adevărată ca variabila aleatoare să fie mai mică decât , proporția elementelor eșantionului mai mică decât este estimată.

Dacă elementele eșantionului , , sunt sortate în ordine crescătoare (la fiecare rezultat elementar), se va obține un nou set de variabile aleatoare, numită serie de variații:

Elementul , , se numește membrul al treilea al seriei variaționale sau statistica de ordinul al treilea.

Exemplul 1

Probă:

Seria de variante:

Orez. unu. Exemplul 1

Funcția de distribuție empirică are salturi în punctele eșantionului, valoarea saltului în punct este , unde este numărul de elemente eșantion care se potrivesc cu .

Poate fi construit funcţie empirică distribuție în funcție de seria de variații:

O altă caracteristică a distribuției este tabelul (pentru distribuții discrete) sau densitate (pentru absolut continuu). Un analog empiric sau selectiv al unui tabel sau densitate este așa-numita histogramă.

Histograma se bazează pe date grupate. Intervalul de valori estimat al unei variabile aleatoare (sau intervalul de date din eșantion) este împărțit, indiferent de eșantion, într-un anumit număr de intervale (nu neapărat aceleași). Fie , , intervale pe linie, numite intervale de grupare . Să notăm cu numărul de elemente eșantion care se încadrează în intervalul:

(1)

Pe fiecare dintre intervale, este construit un dreptunghi, aria care este proporțională cu. Suprafața totală a tuturor dreptunghiurilor trebuie să fie egală cu unu. Fie lungimea intervalului. Înălțimea dreptunghiului de mai sus este

Figura rezultată se numește histogramă.

Exemplul 2

Disponibil serie de variații(vezi exemplul 1):

Iată logaritmul zecimal, prin urmare, i.e. când eșantionul este dublat, numărul de intervale de grupare crește cu 1. Rețineți că cu cât mai multe intervale de grupare, cu atât mai bine. Dar, dacă luăm numărul de intervale, să zicem, de ordinul , atunci odată cu creșterea histograma nu se va apropia de densitate.

Următoarea afirmație este adevărată:

Dacă densitatea de prelevare este funcție continuă, atunci pentru astfel încât , are loc convergența punctuală în probabilitate a histogramei la densitate.

Deci alegerea logaritmului este rezonabilă, dar nu singura posibilă.

Concluzie

Statistica matematică (sau teoretică) se bazează pe metodele și conceptele teoriei probabilităților, dar într-un fel rezolvă probleme inverse.

Dacă observăm manifestarea simultană a două (sau mai multe) semne, i.e. avem un set de valori ale mai multor variabile aleatoare - ce se poate spune despre dependența lor? Ea este acolo sau nu? Și dacă da, ce este această dependență?

Este adesea posibil să se facă unele presupuneri despre distribuția ascunsă în „cutia neagră” sau despre proprietățile acesteia. În acest caz, conform datelor experimentale, este necesară confirmarea sau infirmarea acestor ipoteze („ipoteze”). În același timp, trebuie să ne amintim că răspunsul „da” sau „nu” poate fi dat doar cu un anumit grad de certitudine, iar cu cât putem continua experimentul mai mult, cu atât concluziile pot fi mai precise. Cea mai favorabilă situație pentru cercetare este atunci când se poate afirma cu încredere despre unele proprietăți ale experimentului observat - de exemplu, despre prezența unei dependențe funcționale între mărimile observate, despre normalitatea distribuției, despre simetria acesteia, despre prezența densitatea în distribuție sau despre natura sa discretă etc.

Deci, are sens să ne amintim despre statisticile (matematice) dacă

există un experiment aleatoriu, ale cărui proprietăți sunt parțial sau complet necunoscute,

Putem reproduce acest experiment în aceleași condiții de câteva (sau mai bine) de ori.

Bibliografie

1. Baumol U. Teoria economicăși cercetare operațională. – M.; Știință, 1999.

2. Bolşev L.N., Smirnov N.V. Tabele de statistici matematice. Moscova: Nauka, 1995.

3. Borovkov A.A. Statistici matematice. Moscova: Nauka, 1994.

4. Korn G., Korn T. Manual de matematică pentru oameni de știință și ingineri. - Sankt Petersburg: Editura Lan, 2003.

5. Korshunov D.A., Chernova N.I. Culegere de sarcini și exerciții de statistică matematică. Novosibirsk: Editura Institutului de Matematică. S.L. Sobolev SB RAS, 2001.

6. Peheletsky I.D. Matematică: manual pentru elevi. - M.: Academia, 2003.

7. Suhodolsky V.G. Prelegeri de matematică superioară pentru științe umaniste. - Editura Sankt Petersburg din Sankt Petersburg universitate de stat. 2003

8. Feller V. Introducere în teoria probabilității și aplicațiile acesteia. - M.: Mir, T.2, 1984.

9. Harman G., Analiza factorială modernă. - M.: Statistică, 1972.


Harman G., Analiza factorială modernă. - M.: Statistică, 1972.

Statistica matematică este una dintre secțiunile principale ale unei astfel de științe precum matematica și este o ramură care studiază metodele și regulile de prelucrare a anumitor date. Cu alte cuvinte, explorează modalități de a descoperi modele care sunt inerente colecțiilor mari de obiecte identice, pe baza sondajului lor.

O sarcină aceasta sectiune constă în construirea unor metode de estimare a probabilităţii sau luarea unei anumite decizii cu privire la natura evenimentelor în curs de desfăşurare, pe baza rezultatelor obţinute. Tabelele, diagramele și câmpurile de corelare sunt folosite pentru a descrie datele. rar aplicat.

Statisticile matematice sunt folosite în diverse domenii ale științei. De exemplu, este important ca economia să prelucreze informații despre seturi omogene de fenomene și obiecte. Pot fi produse fabricate de industrie, personal, date de profit etc. În funcție de natura matematică a rezultatelor observațiilor, se pot evidenția statisticile numerelor, analiza funcțiilor și obiectelor de natură nenumerică și multidimensională. analiză. În plus, ei consideră sarcini generale și particulare (legate de restabilirea dependențelor, utilizarea clasificărilor, studii selective).

Autorii unor manuale cred că teoria statisticii matematice este doar o secțiune a teoriei probabilității, în timp ce alții cred că este o știință independentă, cu propriile sale scopuri, obiective și metode. Cu toate acestea, în orice caz, utilizarea sa este foarte extinsă.

Astfel, statistica matematică este cel mai clar aplicabilă în psihologie. Utilizarea acestuia va permite specialistului să fundamenteze corect, să găsească relația dintre date, să le generalizeze, să evite multe erori logice și multe altele. Trebuie remarcat că deseori este pur și simplu imposibil de măsurat un fenomen psihologic sau o trăsătură de personalitate fără proceduri computaționale. Acest lucru sugerează că bazele acestei științe sunt necesare. Cu alte cuvinte, poate fi numită sursa și baza teoriei probabilităților.

Metoda de cercetare, care se bazează pe luarea în considerare a datelor statistice, este utilizată în alte domenii. Cu toate acestea, trebuie remarcat imediat că caracteristicile sale, atunci când sunt aplicate obiectelor care au o natură diferită de origine, sunt întotdeauna unice. Prin urmare, nu are sens să combine știința fizică într-o singură știință. Aspecte comune aceasta metoda sunt reduse la numărarea unui anumit număr de obiecte care sunt incluse într-un anumit grup, precum și la studierea distribuției trăsături cantitativeși aplicarea teoriei probabilităților pentru a obține anumite concluzii.

Elementele de statistică matematică sunt utilizate în domenii precum fizica, astronomia etc. Aici, valorile caracteristicilor și parametrilor, ipotezele despre coincidența oricăror caracteristici în două eșantioane, despre simetria distribuției și multe altele pot fi considerată.

Statistica matematică joacă un rol important în implementarea lor, scopul lor fiind cel mai adesea acela de a construi metode adecvate de estimare și testare a ipotezelor. În prezent, tehnologiile informatice sunt de mare importanță în această știință. Ele permit nu numai simplificarea semnificativă a procesului de calcul, ci și crearea de eșantioane pentru replicare sau atunci când se studiază caracterul adecvat al rezultatelor obținute în practică.

În cazul general, metodele statisticii matematice ajută la tragerea a două concluzii: fie să se facă judecata dorită cu privire la natura sau proprietățile datelor studiate și relațiile dintre acestea, fie să se demonstreze că rezultatele obținute nu sunt suficiente pentru a trage concluzii.


Conţinut.

1. Introducere:
- Cum sunt utilizate probabilitățile și statisticile matematice? - pagina 2
- Ce este „statistica matematică”? - pagina 3
2) Exemple de aplicare a teoriei probabilității și a statisticii matematice:
- Selectie. - pagina 4
- Sarcini de evaluare. – pagina 6
- Metode probabilistic-statistice şi optimizare. – pagina 7
3) Concluzie.

Introducere.

Cum sunt utilizate probabilitățile și statisticile matematice? Aceste discipline stau la baza metodelor probabilistic-statistice de luare a deciziilor. Pentru a profita de ele aparate matematice, este necesară exprimarea problemelor decizionale în termeni de modele probabilistic-statistice. Aplicarea unei metode decizionale probabilistic-statistice specifice constă în trei etape:
- trecerea de la realitatea economică, managerială, tehnologică la o schemă abstractă matematică și statistică, i.e. construirea unui model probabilistic al unui sistem de control, a unui proces tehnologic, a unei proceduri de luare a deciziilor, în special pe baza rezultatelor controlului statistic etc.
- efectuarea de calcule şi obţinerea de concluzii prin mijloace pur matematice în cadrul unui model probabilistic;
- interpretarea concluziilor matematice și statistice în raport cu o situație reală și luarea unei decizii adecvate (de exemplu, privind conformitatea sau nerespectarea calității produsului cu cerințele stabilite, necesitatea ajustării procesului tehnologic etc.), în special , concluzia (cu privire la proporția de unități defecte de produse într-un lot, asupra formei specifice a legilor de distribuție a parametrilor controlați ai procesului tehnologic etc.).

Statistica matematică folosește conceptele, metodele și rezultatele teoriei probabilităților. Să luăm în considerare principalele probleme ale construirii modelelor probabilistice de luare a deciziilor în situații economice, manageriale, tehnologice și alte situații. Pentru utilizarea activă și corectă a documentelor normativ-tehnice și instructiv-metodice privind metodele probabilistic-statistice de luare a deciziilor sunt necesare cunoștințe prealabile. Așadar, este necesar să se știe în ce condiții ar trebui aplicat unul sau altul document, ce informații inițiale trebuie să aibă pentru selectarea și aplicarea acestuia, ce decizii ar trebui luate pe baza rezultatelor prelucrării datelor etc.

Ce este „statistica matematică”? Statistica matematică este înțeleasă ca „o secțiune a matematicii dedicată metodelor matematice de colectare, sistematizare, prelucrare și interpretare a datelor statistice, precum și folosirea acestora pentru concluzii științifice sau practice. Regulile și procedurile statisticii matematice se bazează pe teoria probabilității, ceea ce face posibilă evaluarea acurateței și fiabilității concluziilor obținute în fiecare problemă pe baza materialului statistic disponibil. În același timp, datele statistice se referă la informații despre numărul de obiecte din orice colecție mai mult sau mai puțin extinsă care au anumite caracteristici.

În funcție de tipul de probleme rezolvate, statistica matematică este de obicei împărțită în trei secțiuni: descrierea datelor, estimarea și testarea ipotezelor.

În funcție de tipul de date statistice prelucrate, statistica matematică este împărțită în patru domenii:

Statistica unidimensională (statistica variabilelor aleatoare), în care rezultatul unei observații este descris printr-un număr real;

Analiza statistică multivariată, în care rezultatul observării unui obiect este descris prin mai multe numere (vector);

Statistica proceselor aleatoare și a seriilor de timp, unde rezultatul observației este o funcție;

Statistica obiectelor de natură nenumerică, în care rezultatul unei observații este de natură nenumerică, de exemplu, este o mulțime (o figură geometrică), o ordonare sau obținută ca urmare a unei măsurători prin un atribut calitativ.

Exemple de aplicare a teoriei probabilităților și a statisticii matematice.
Să luăm în considerare câteva exemple în care modelele probabilistic-statistice sunt un instrument bun pentru rezolvarea problemelor manageriale, industriale, economice și economice naționale. Deci, de exemplu, o monedă care este folosită ca lot trebuie să fie „simetrică”, adică. atunci când este aruncat, în medie, în jumătate din cazuri, stema ar trebui să cadă, iar în jumătate din cazuri - zăbrele (cozi, număr). Dar ce înseamnă „medie”? Dacă petreci multe serii de 10 aruncări în fiecare serie, atunci vor exista adesea serii în care o monedă scade de 4 ori cu o stemă. Pentru o monedă simetrică, acest lucru se va întâmpla în 20,5% din serie. Și dacă există 40.000 de steme pentru 100.000 de aruncări, moneda poate fi considerată simetrică? Procedura de luare a deciziilor se bazează pe teoria probabilității și statistica matematică.

Exemplul luat în considerare poate să nu pară suficient de serios. Cu toate acestea, nu este. Tragerea la sorți este utilizată pe scară largă în organizarea experimentelor de fezabilitate industrială, de exemplu, la prelucrarea rezultatelor măsurării indicelui de calitate (momentul de frecare) al rulmenților în funcție de diverși factori tehnologici (influența unui mediu de conservare, metode de pregătire a rulmenților înainte de măsurare). , efectul sarcinii portante în procesul de măsurare etc.). P.). Să presupunem că este necesar să se compare calitatea rulmenților în funcție de rezultatele depozitării lor în diferite uleiuri de conservare, de exemplu. în uleiurile din compoziția A și B. La planificarea unui astfel de experiment, se pune întrebarea ce rulmenți trebuie plasați în compoziția de ulei A și care - în compoziția de ulei B, dar astfel încât să se evite subiectivitatea și să se asigure obiectivitatea decizie.

Probă
Răspunsul la această întrebare poate fi obținut prin tragere la sorți. Un exemplu similar poate fi dat cu controlul calității oricărui produs. Pentru a decide dacă un lot de produse inspectat îndeplinește sau nu cerințele stabilite, se prelevează o probă din acesta. Pe baza rezultatelor controlului probei, se face o concluzie despre întregul lot. În acest caz, este foarte important să se evite subiectivitatea în formarea probei, adică este necesar ca fiecare unitate de produs din lotul controlat să aibă aceeași probabilitate de a fi selectată în eșantion. În condiții de producție, selecția unităților de producție din eșantion se realizează de obicei nu prin lot, ci prin tabele speciale de numere aleatorii sau cu ajutorul generatoarelor de numere aleatoare computerizate.
Probleme similare de asigurare a obiectivității comparației apar la compararea diferitelor scheme de organizare a producției, remunerare, la desfășurarea de licitații și concursuri, la selectarea candidaților pentru posturile vacante etc. Peste tot ai nevoie de o loterie sau de proceduri similare. Să explicăm folosind exemplul identificării celei mai puternice și a doua cea mai puternică echipă în organizarea unui turneu conform sistemului olimpic (perdantul este eliminat). Lăsați echipa mai puternică să câștige întotdeauna în fața celei mai slabe. Este clar că cea mai puternică echipă va deveni cu siguranță campioană. A doua cea mai puternică echipă va ajunge în finală dacă și numai dacă nu are meciuri cu viitorul campion înainte de finală. Dacă este planificat un astfel de joc, atunci a doua cea mai puternică echipă nu va ajunge în finală. Cel care plănuiește turneul poate fie să „elimine” a doua cea mai puternică echipă din turneu înainte de termen, doborând-o în prima întâlnire cu liderul, fie să-i asigure locul doi, asigurând întâlniri cu echipele mai slabe până în finală. Pentru a evita subiectivitatea, trageți la sorți. Pentru un turneu cu 8 echipe, probabilitatea ca cele mai puternice două echipe să se întâlnească în finală este de 4/7. În consecință, cu o probabilitate de 3/7, a doua cea mai puternică echipă va părăsi turneul înainte de termen.
În orice măsurătoare a unităților de produs (folosind un șubler, micrometru, ampermetru etc.), există erori. Pentru a afla dacă există erori sistematice, este necesar să se efectueze măsurători repetate ale unei unități de produs ale cărei caracteristici sunt cunoscute (de exemplu, o probă standard). Trebuie amintit că, pe lângă eroarea sistematică, există și o eroare aleatorie.

Prin urmare, se pune întrebarea cum să aflați din rezultatele măsurătorilor dacă există o eroare sistematică. Dacă notăm doar dacă eroarea obținută în timpul următoarei măsurători este pozitivă sau negativă, atunci această problemă poate fi redusă la cea anterioară. Într-adevăr, să comparăm măsurarea cu aruncarea unei monede, eroarea pozitivă - cu pierderea stemei, negativul - cu zăbrele (eroarea zero cu un număr suficient de diviziuni ale scalei nu apare aproape niciodată). Apoi verificarea absenței unei erori sistematice este echivalentă cu verificarea simetriei monedei.

Scopul acestor considerații este de a reduce problema verificării absenței unei erori sistematice la problema verificării simetriei unei monede. Raționamentul de mai sus duce la așa-numitul „criteriu al semnelor” în statistica matematică.
„Testul semnelor” - un test statistic care vă permite să testați ipoteza nulă conform căreia eșantionul respectă distribuția binomială cu parametrul p=1/2 . Testul semnului poate fi folosit ca test statistic neparametric pentru a testa ipoteza că mediana este egală cu o valoare dată (în special, zero), precum și absența unei deplasări (fără efect de procesare) în două eșantioane conectate . De asemenea, vă permite să testați ipoteza de simetrie a distribuției, dar există criterii mai puternice pentru aceasta - testul Wilcoxon cu un singur eșantion și modificările acestuia.

În reglementarea statistică a proceselor tehnologice, pe baza metodelor statisticii matematice, se elaborează reguli și planuri pentru controlul statistic al proceselor, care vizează detectarea în timp util a dereglării proceselor tehnologice și luarea de măsuri pentru ajustarea acestora și prevenirea eliberării produselor care nu nu indeplinesc cerintele stabilite. Aceste măsuri vizează reducerea costurilor de producție și a pierderilor din furnizarea de produse de calitate scăzută. Cu controlul statistic de acceptare, bazat pe metodele statisticii matematice, se elaboreaza planuri de control al calitatii prin analiza probelor din loturile de produse. Dificultatea constă în a putea construi corect modele probabilistic-statistice de luare a deciziilor, pe baza cărora este posibil să se răspundă la întrebările puse mai sus. În statistica matematică, modelele probabilistice și metodele de testare a ipotezelor au fost dezvoltate pentru aceasta, în special, ipotezele conform cărora proporția unităților de producție defecte este egală cu un anumit număr p0, de exemplu, p0 = 0,23.

Sarcini de evaluare.
Într-o serie de situații manageriale, industriale, economice, economice naționale apar probleme de alt tip - probleme de estimare a caracteristicilor și parametrilor distribuțiilor de probabilitate.

Luați în considerare un exemplu. Lăsați un lot de N lămpi electrice să vină la control. O probă de n lămpi electrice a fost selectată aleatoriu din acest lot. Apar o serie de întrebări firești. Cum poate fi determinată durata medie de viață a lămpilor electrice din rezultatele testării elementelor eșantionului și cu ce precizie poate fi estimată această caracteristică? Cum se schimbă precizia dacă este luată o probă mai mare? La ce număr de ore T se poate garanta că cel puțin 90% din lămpile electrice vor dura T sau mai multe ore?

Să presupunem că la testarea unui eșantion de n lămpi electrice, X lămpi electrice s-au dovedit a fi defecte. Apoi apar următoarele întrebări. Ce limite pot fi specificate pentru numărul D de lămpi electrice defecte dintr-un lot, pentru nivelul de defecte D/N etc.?

Sau, într-o analiză statistică a acurateței și stabilității proceselor tehnologice, este necesar să se evalueze astfel de indicatori de calitate precum valoarea medie a parametrului controlat și gradul de răspândire a acestuia în procesul luat în considerare. Conform teoriei probabilităților, este recomandabil să se folosească așteptările sale matematice ca valoare medie a unei variabile aleatoare și varianța, abaterea standard sau coeficientul de variație ca caracteristică statistică a spread-ului. Acest lucru ridică întrebarea: cum se estimează aceste caracteristici statistice din datele eșantionului și cu ce precizie se poate face acest lucru? Există multe exemple similare. Aici a fost important să arătăm cum teoria probabilității și statistica matematică pot fi utilizate în managementul producției atunci când se iau decizii în domeniul managementului statistic al calității produselor.

Metode probabilistic-statistice și optimizare. Ideea de optimizare pătrunde în statisticile matematice aplicate moderne și în alte metode statistice. Și anume, metodele de planificare a experimentelor, controlul statistic al acceptării, controlul statistic al proceselor tehnologice etc. Pe de altă parte, formulările de optimizare în teoria deciziei, de exemplu, teoria aplicată a optimizării calității produsului și cerințele standard, prevăd utilizarea pe scară largă a metode probabilistic-statistice, în primul rând statistică matematică aplicată.

În managementul producției, în special, la optimizarea calității produsului și a cerințelor standard, este deosebit de important să se aplice metode statistice în stadiul inițial. ciclu de viață produse, adică la etapa de cercetare pregătirea dezvoltărilor de proiectare experimentală (elaborarea cerințelor promițătoare pentru produse, proiectare preliminară, termeni de referință pentru dezvoltarea designului experimental). Acest lucru se datorează informațiilor limitate disponibile în etapa inițială a ciclului de viață al produsului și necesității de a prezice posibilitățile tehnice și situația economică pentru viitor. Metodele statistice trebuie aplicate în toate etapele rezolvării unei probleme de optimizare - la scalarea variabilelor, dezvoltarea modelelor matematice pentru funcționarea produselor și sistemelor, efectuarea de experimente tehnice și economice etc.

În problemele de optimizare, inclusiv optimizarea calității produsului și a cerințelor standard, sunt utilizate toate domeniile statisticilor. Și anume, statistica variabilelor aleatoare, analiza statistică multivariată, statistica proceselor aleatoare și a seriilor de timp, statistica obiectelor de natură nenumerică. Alegerea unei metode statistice pentru analiza datelor specifice trebuie efectuată în conformitate cu recomandările.

Concluzie.
LA
etc.................

Fiecare investigație în domeniul fenomenelor aleatorii are întotdeauna rădăcini în experiment, în date experimentale. Se numesc datele numerice care sunt colectate la studierea oricărei caracteristici a unui obiect statistic. Datele statistice reprezintă materialul inițial al studiului. Pentru ca acestea să aibă valoare științifică sau practică, ele trebuie prelucrate prin metode de statistică matematică.

Statistici matematice este o disciplină științifică, al cărei subiect este dezvoltarea unor metode de înregistrare, descriere și analiză a datelor experimentale statistice obținute ca urmare a observațiilor unor fenomene aleatorii masive.

Sarcinile principale ale statisticii matematice sunt:

    determinarea legii de distribuție a unei variabile aleatoare sau a unui sistem de variabile aleatoare;

    testarea plauzibilității ipotezelor;

    determinarea parametrilor de distribuţie necunoscuţi.

Toate metodele de statistică matematică se bazează pe teoria probabilității. Cu toate acestea, datorită specificului problemelor care se rezolvă, statistica matematică este separată de teoria probabilității într-un domeniu independent. Dacă în teoria probabilității se consideră că modelul fenomenului este dat și se calculează posibilul curs real al acestui fenomen (Fig. 1), atunci în statistica matematică se selectează un model teoretic și probabilistic adecvat pe baza datelor statistice (Fig. . 2).

Fig.1. Problemă generală a teoriei probabilităților

Fig.2. Problemă generală de statistică matematică

Ca disciplină științifică, statistica matematică s-a dezvoltat împreună cu teoria probabilității. Aparatul matematic al acestei științe a fost construit în a doua jumătate a secolului al XIX-lea.

2. Populația generală și eșantionul.

Pentru studiul metodelor statistice sunt introduse conceptele de populație generală și eșantion. În general, sub populația generală este înțeles ca o variabilă aleatoare X cu funcția de distribuție
. Un set de mostre sau un eșantion de volum n pentru o variabilă aleatoare dată X este o mulțime
observatii independente ale acestei marimi, unde se numește valoarea eșantionului sau implementarea variabilei aleatoare X. În acest fel, pot fi considerate ca numere (dacă experimentul este efectuat și proba a fost prelevată) și ca variabile aleatoare (înainte de experiment), deoarece acestea variază de la probă la probă.

Exemplul 1. Pentru a determina dependența grosimii unui trunchi de copac de înălțimea sa, au fost selectați 200 de copaci. În acest caz, dimensiunea eșantionului este n=200.

Exemplul 2 Ca urmare a tăierii plăcilor de particule pe un ferăstrău circular, s-au obținut 15 valori ale lucrării specifice de tăiere. În acest caz n=15.

D
Pentru a judeca cu încredere caracteristica populației generale care ne interesează în funcție de datele eșantionului, obiectele eșantionului trebuie să o reprezinte corect, adică eșantionul trebuie să fie reprezentant(reprezentant). Reprezentativitatea eșantionului se realizează de obicei prin selecția aleatorie a obiectelor: fiecărui obiect din populația generală i se asigură o probabilitate egală de a fi inclus în eșantion cu toate celelalte.

Fig.3. Demonstrarea reprezentativității eșantionului