Statistikat matematikore kuptohen si “një pjesë e matematikës kushtuar metodave matematikore për mbledhjen, sistemimin, përpunimin dhe interpretimin e të dhënave statistikore, si dhe përdorimin e tyre për përfundime shkencore ose praktike. Rregullat dhe procedurat e statistikave matematikore bazohen në teorinë e probabilitetit, e cila bën të mundur vlerësimin e saktësisë dhe besueshmërisë së përfundimeve të marra në çdo problem mbi bazën e materialit statistikor në dispozicion. Në të njëjtën kohë, të dhënat statistikore i referohen informacionit për numrin e objekteve në çdo koleksion pak a shumë të gjerë që kanë karakteristika të caktuara.

Sipas llojit të problemeve që zgjidhen, statistikat matematikore zakonisht ndahen në tre seksione: përshkrimi i të dhënave, vlerësimi dhe testimi i hipotezave.

Sipas llojit të të dhënave statistikore që përpunohen, statistikat matematikore ndahen në katër fusha:

— statistika njëdimensionale (statistika variablat e rastësishëm), në të cilën përshkruhet rezultati i vëzhgimit numër real;

- shumëdimensionale Analiza statistikore, ku rezultati i vëzhgimit mbi objektin përshkruhet me disa numra (vektor);

- statistika të proceseve të rastësishme dhe serive kohore, ku rezultati i vëzhgimit është funksion;

- statistikat e objekteve të natyrës jo numerike, në të cilat rezultati i vëzhgimit ka një natyrë jo numerike, për shembull, është një grup ( figura gjeometrike), të renditur ose të përftuar si rezultat i matjes në bazë cilësore.

Historikisht, disa fusha të statistikave të objekteve të natyrës jo numerike (në veçanti, problemet e vlerësimit të përqindjes së produkteve me defekt dhe testimit të hipotezave për të) dhe statistikat njëdimensionale ishin të parat që u shfaqën. Aparatet matematikoreështë më e lehtë për ta, kështu që shembulli i tyre zakonisht demonstron idetë themelore të statistikave matematikore.

Vetëm ato metoda të përpunimit të të dhënave, d.m.th. statistikat matematikore janë të bazuara në prova, të cilat bazohen në modele probabiliste të dukurive dhe proceseve reale përkatëse. Bëhet fjalë për për modelet e sjelljes së konsumatorit, shfaqjen e rreziqeve, funksionimin e pajisjeve teknologjike, marrjen e rezultateve të një eksperimenti, rrjedhën e një sëmundjeje etj. Një model probabilistik i një dukurie reale duhet të konsiderohet i ndërtuar nëse sasitë në shqyrtim dhe marrëdhëniet ndërmjet tyre shprehen në terma të teorisë së probabilitetit.

Përputhja me modelin probabilist të realitetit, d.m.th. mjaftueshmëria e tij vërtetohet, veçanërisht, me ndihmën e metodave statistikore për testimin e hipotezave.

Metodat e pabesueshme të përpunimit të të dhënave janë eksploruese, ato mund të përdoren vetëm në analizën paraprake të të dhënave, pasi ato nuk bëjnë të mundur vlerësimin e saktësisë dhe besueshmërisë së përfundimeve të marra në bazë të një materiali të kufizuar statistikor.

Metodat probabiliste dhe statistikore janë të zbatueshme kudo që është e mundur të ndërtohet dhe të vërtetohet një model probabilistik i një dukurie ose procesi. Përdorimi i tyre është i detyrueshëm kur përfundimet e nxjerra nga të dhënat e mostrës transferohen në të gjithë popullatën (për shembull, nga një mostër në një grup të tërë produktesh).

Në fusha specifike të aplikimit përdoren si metoda probabilistiko-statistikore të zbatimit të gjerë ashtu edhe ato specifike. Për shembull, në seksionin e menaxhimit të prodhimit kushtuar metodave statistikore të kontrollit të cilësisë së produktit, përdoren statistikat e aplikuara matematikore (përfshirë hartimin e eksperimenteve). Me ndihmën e metodave të tij, kryhet një analizë statistikore e saktësisë dhe stabilitetit të proceseve teknologjike dhe një vlerësim statistikor i cilësisë. Metodat specifike përfshijnë metodat e kontrollit të pranimit statistikor të cilësisë së produktit, rregullimin statistikor të proceseve teknologjike, vlerësimin dhe kontrollin e besueshmërisë, etj.

Disiplina të tilla të aplikuara probabilistiko-statistikore si teoria e besueshmërisë dhe teoria e radhës përdoren gjerësisht. Përmbajtja e të parit prej tyre është e qartë nga titulli, e dyta merret me studimin e sistemeve të tilla si një central telefonik, i cili merr thirrje në kohë të rastësishme - kërkesat e abonentëve që formojnë numrat në telefonat e tyre. Kohëzgjatja e shërbimit të këtyre kërkesave, d.m.th. kohëzgjatja e bisedave modelohet edhe nga variabla të rastësishëm. Një kontribut i madh në zhvillimin e këtyre disiplinave dha Anëtari Korrespondent i Akademisë së Shkencave të BRSS A.Ya. Khinchin (1894-1959), akademik i Akademisë së Shkencave të SSR të Ukrainës B.V. Gnedenko (1912-1995) dhe shkencëtarë të tjerë vendas.

Çdo hetim në fushën e dukurive të rastësishme është gjithmonë i rrënjosur në eksperiment, në të dhëna eksperimentale. Të dhënat numerike që mblidhen gjatë studimit të ndonjë veçorie të ndonjë objekti quhen statistikore. Të dhënat statistikore janë materiali fillestar i studimit. Që të kenë vlerë shkencore ose praktike, duhet të përpunohen me metoda të statistikave matematikore.

Statistikat e matematikësështë një disiplinë shkencore, lënda e së cilës është zhvillimi i metodave për regjistrimin, përshkrimin dhe analizimin e të dhënave statistikore eksperimentale të marra si rezultat i vëzhgimeve të dukurive masive të rastësishme.

Detyrat kryesore të statistikave matematikore janë:

    përcaktimi i ligjit të shpërndarjes së një ndryshoreje të rastësishme ose një sistemi të ndryshoreve të rastit;

    testimi i besueshmërisë së hipotezave;

    përcaktimi i parametrave të panjohur të shpërndarjes.

Të gjitha metodat e statistikave matematikore bazohen në teorinë e probabilitetit. Megjithatë, për shkak të specifikës së problemeve që zgjidhen, statistikat matematikore ndahen nga teoria e probabilitetit në një fushë të pavarur. Nëse në teorinë e probabilitetit modeli i fenomenit konsiderohet i dhënë dhe llogaritet ecuria e mundshme reale e këtij fenomeni (Fig. 1), atëherë në statistikat matematikore zgjidhet një model i përshtatshëm teorik dhe probabilistik bazuar në të dhënat statistikore (Fig. . 2).

Fig.1. Problemi i përgjithshëm i teorisë së probabilitetit

Fig.2. Problemi i përgjithshëm i statistikave matematikore

Si disiplinë shkencore, statistikat matematikore u zhvilluan së bashku me teorinë e probabilitetit. Aparati matematikor i kësaj shkence u ndërtua në gjysmën e dytë të shekullit të 19-të.

2. Popullata e përgjithshme dhe mostra.

Për të studiuar metodat statistikore, futen konceptet e popullatave të përgjithshme dhe të mostrës. Në përgjithësi, nën popullata e përgjithshme kuptohet si një ndryshore e rastësishme X me funksionin e shpërndarjes
. Një grup mostër ose një mostër e vëllimit n për një ndryshore të rastësishme të dhënë X është një grup
vëzhgime të pavarura të kësaj sasie, ku quhet vlera e mostrës ose zbatimi i ndryshores së rastësishme X. Në këtë mënyrë, mund të konsiderohen si numra (nëse eksperimenti kryhet dhe kampioni është marrë) dhe si variabla të rastësishëm (para eksperimentit), pasi ato ndryshojnë nga kampioni në kampion.

Shembulli 1. Për të përcaktuar varësinë e trashësisë së një trungu peme nga lartësia e tij, u zgjodhën 200 pemë. Në këtë rast, madhësia e kampionit është n=200.

Shembulli 2 Si rezultat i sharrimit të pllakave të grimcave në një sharrë rrethore, u përftuan 15 vlera të punës specifike të prerjes. Në këtë rast, n=15.

D
Për të gjykuar me besim tiparin e popullatës së përgjithshme që na intereson sipas të dhënave të mostrës, objektet e kampionit duhet ta përfaqësojnë saktë atë, domethënë, kampioni duhet të jetë përfaqësuese(përfaqësues). Përfaqësueshmëria e kampionit zakonisht arrihet me përzgjedhje të rastësishme të objekteve: secilit objekt të popullatës së përgjithshme i sigurohet një probabilitet i barabartë për t'u përfshirë në kampion me të gjithë të tjerët.

Fig.3. Demonstrimi i përfaqësimit të kampionit

Statistikat e matematikësështë një nga seksionet kryesore të një shkence të tillë si matematika, dhe është një degë që studion metodat dhe rregullat për përpunimin e të dhënave të caktuara. Me fjalë të tjera, ai eksploron mënyra për të zbuluar modele që janë të natyrshme në koleksione të mëdha objektesh identike, bazuar në studimin e tyre të mostrës.

Një detyrë këtë seksion konsiston në ndërtimin e metodave për vlerësimin e probabilitetit ose marrjen e një vendimi të caktuar për natyrën e ngjarjeve në zhvillim, bazuar në rezultatet e marra. Për të përshkruar të dhënat përdoren tabelat, grafikët dhe fushat e korrelacionit. aplikohet rrallë.

Statistikat matematikore përdoren në fusha të ndryshme të shkencës. Për shembull, është e rëndësishme që ekonomia të përpunojë informacione rreth grupeve homogjene të fenomeneve dhe objekteve. Ato mund të jenë produkte të prodhuara nga industria, personeli, të dhënat e fitimit etj. Në varësi të natyrës matematikore të rezultateve të vëzhgimeve, mund të veçohen statistikat e numrave, analizat e funksioneve dhe objekteve të natyrës jo numerike dhe shumëdimensionale. analiza. Përveç kësaj, ata konsiderojnë detyra të përgjithshme dhe të veçanta (të lidhura me rivendosjen e varësive, përdorimin e klasifikimeve, studimet selektive).

Autorët e disa teksteve mendojnë se teoria e statistikave matematikore është vetëm një pjesë e teorisë së probabilitetit, ndërsa të tjerë besojnë se ajo është një shkencë e pavarur me qëllimet, objektivat dhe metodat e veta. Sidoqoftë, në çdo rast, përdorimi i tij është shumë i gjerë.

Kështu, statistikat matematikore janë më qartë të zbatueshme në psikologji. Përdorimi i tij do t'i lejojë specialistit të vërtetojë saktë, të gjejë marrëdhëniet midis të dhënave, t'i përgjithësojë ato, të shmangë shumë gabime logjike dhe shumë më tepër. Duhet të theksohet se shpesh është thjesht e pamundur të matet ky apo ai fenomen psikologjik ose tipari i personalitetit pa procedura llogaritëse. Kjo sugjeron që bazat e kësaj shkence janë të nevojshme. Me fjalë të tjera, mund të quhet burimi dhe baza e teorisë së probabilitetit.

Metoda e hulumtimit, e cila mbështetet në marrjen në konsideratë të të dhënave statistikore, përdoret në fusha të tjera. Sidoqoftë, duhet të theksohet menjëherë se tiparet e tij, kur zbatohen për objekte të një natyre të ndryshme origjine, janë gjithmonë unike. Prandaj, nuk ka kuptim të kombinosh shkencën fizike në një shkencë. Karakteristikat e përgjithshme të kësaj metode reduktohen në numërimin e një numri të caktuar objektesh që përfshihen në një grup të caktuar, si dhe studimin e shpërndarjes tipare sasiore dhe aplikimi i teorisë së probabilitetit për të marrë përfundime të caktuara.

Elementet e statistikave matematikore përdoren në fusha të tilla si fizika, astronomia, etj. Këtu mund të vlerësohen vlerat e karakteristikave dhe parametrave, hipotezat për koincidencën e ndonjë karakteristike në dy mostra, për simetrinë e shpërndarjes dhe shumë më tepër. konsiderohen.

Statistikat matematikore luajnë një rol të rëndësishëm në sjelljen e tyre, qëllimi i tyre më së shpeshti është ndërtimi i metodave adekuate për vlerësimin dhe testimin e hipotezave. Aktualisht, teknologjitë kompjuterike kanë një rëndësi të madhe në këtë shkencë. Ato lejojnë jo vetëm të thjeshtojnë ndjeshëm procesin e llogaritjes, por edhe të krijojnë mostra për përsëritje ose kur studiojnë përshtatshmërinë e rezultateve të marra në praktikë.

Në rastin e përgjithshëm, metodat e statistikave matematikore ndihmojnë për të nxjerrë dy përfundime: ose për të bërë gjykimin e dëshiruar për natyrën ose vetitë e të dhënave që studiohen dhe marrëdhëniet e tyre, ose për të vërtetuar se rezultatet e marra nuk janë të mjaftueshme për të nxjerrë përfundime.

Statistikat e matematikësështë një degë moderne e matematikës që merret me përshkrim statistikor rezultatet e eksperimenteve dhe vëzhgimeve, si dhe ndërtesë modele matematikore që përmbajnë koncepte probabilitetet. Baza teorike e statistikave matematikore është teoria e probabilitetit.

Në strukturën e statistikave matematikore, tradicionalisht dallohen dy seksione kryesore: Statistika përshkruese dhe konkluzioni statistikor (Figura 1.1).

Oriz. 1.1. Seksionet kryesore të statistikave matematikore

Statistika përshkruese përdoret për:

o përgjithësimi i treguesve të një variabli (statistikat e një kampioni të rastësishëm);

o identifikimi i marrëdhënieve ndërmjet dy ose më shumë variablave (analizë korrelacion-regresion).

Statistikat përshkruese bëjnë të mundur marrjen e informacionit të ri, kuptimin e shpejtë dhe vlerësimin e plotë të tij, domethënë kryen funksionin shkencor të përshkrimit të objekteve të studimit, gjë që justifikon emrin e tij. Metodat e statistikave përshkruese janë krijuar për të kthyer një grup të dhënash empirike individuale në një sistem formash dhe numrash që janë vizualë për perceptim: shpërndarjet e frekuencës; tregues të tendencave, ndryshueshmërisë, komunikimit. Këto metoda llogaritin statistikat e një kampioni të rastësishëm, të cilat shërbejnë si bazë për zbatimin e konkluzioneve statistikore.

Konkluzioni statistikor jepni mundësinë:

o vlerësoni saktësinë, besueshmërinë dhe efektivitetin e statistikave të mostrës, gjeni gabimet që ndodhin në procesin e kërkimit statistikor (vlerësimi statistikor)

o përmbledh parametrat e popullsisë së përgjithshme të marra në bazë të statistikave të mostrës (kontroll hipoteza statistikore).

objektivi kryesor kërkimin shkencor- kjo është përvetësimi i njohurive të reja për një klasë të madhe dukurish, personash ose ngjarjesh, të cilat zakonisht quhen popullata e përgjithshme.

Popullatëështë tërësia e objekteve të studimit, mostër- pjesa e tij, e cila është formuar në një mënyrë të caktuar të argumentuar shkencërisht 2.

Termi "popullsi e përgjithshme" përdoret kur bëhet fjalë për një grup të madh, por të kufizuar objektesh në studim. Për shembull, në lidhje me tërësinë e aplikantëve në Ukrainë në 2009 ose tërësinë e fëmijëve mosha parashkollore qyteti i Rivne. Popullatat e përgjithshme mund të arrijnë vëllime të konsiderueshme, të jenë të fundme dhe të pafundme. Në praktikë, si rregull, merret me grupe të fundme. Dhe nëse raporti i madhësisë së popullsisë së përgjithshme me madhësinë e kampionit është më shumë se 100, atëherë, sipas Glass dhe Stanley, metodat e vlerësimit për popullatat e fundme dhe të pafundme japin në thelb të njëjtat rezultate. Një grup i përgjithshëm mund të quhet gjithashtu një grup i plotë vlerash të disa atributeve. Fakti që kampioni i përket popullatës së përgjithshme është baza kryesore për vlerësimin e karakteristikave të popullatës së përgjithshme sipas karakteristikave të kampionit.

Kryesor ideja Statistikat matematikore bazohen në besimin se një studim i plotë i të gjitha objekteve të popullatës së përgjithshme në shumicën e problemeve shkencore është praktikisht i pamundur ose ekonomikisht jopraktik, pasi kërkon shumë kohë dhe kosto të konsiderueshme materiale. Prandaj, në statistikat matematikore, përdoret qasje selektive, parimi i të cilit është paraqitur në diagramin në Fig. 1.2.

Për shembull, sipas teknologjisë së formimit, mostrat janë të rastësishme (të thjeshta dhe sistematike), të shtresuara, të grumbulluara (shih seksionin 4).

Oriz. 1.2. Skema e aplikimit të metodave të statistikës matematikore Sipas qasje selektive përdorimi i metodave matematikore dhe statistikore mund të kryhet në sekuencën e mëposhtme (shih Fig. 1.2):

o me popullsia e përgjithshme, vetitë e të cilave janë objekt kërkimi, të caktuara metodat formojnë një mostër- një numër tipik, por i kufizuar i objekteve për të cilat zbatohen metodat e kërkimit;

o si rezultat i metodave të vëzhgimit, veprimeve eksperimentale dhe matjeve në objektet e mostrës, merren të dhëna empirike;

o përpunimi i të dhënave empirike duke përdorur metodat e statistikave përshkruese jep tregues të mostrës, të cilët quhen statisticienët - meqë ra fjala, emri i disiplinës;

o aplikimi i metodave të konkluzionit statistikor për statisticien, marrin parametrat që karakterizojnë vetitë popullata e përgjithshme.

Shembulli 1.1. Për të vlerësuar stabilitetin e nivelit të njohurive (ndryshueshme x) testimi i një kampioni të rastësishëm prej 3 nxënësish me një vëllim prej n. Testet përmbanin m detyra, secila prej të cilave vlerësohej sipas sistemit të pikëzimit: "të përfunduara" "- 1", të paplotësuara "- 0. arritjet mesatare aktuale të nxënësve mbetën X

3 mostër e rastësishme(nga anglishtja. Random - random) është një mostër përfaqësuese, e cila formohet sipas strategjisë së testeve të rastësishme.

në nivelin e viteve të mëparshme/h? Sekuenca e zgjidhjes:

o zbuloni një hipotezë kuptimplote të tipit: "nëse rezultatet aktuale të testit nuk ndryshojnë nga e kaluara, atëherë mund ta konsiderojmë nivelin e njohurive të studentëve të pandryshuar, dhe procesi i studimit- e qëndrueshme";

o formuloni një hipotezë statistikore adekuate, siç është hipoteza zero H 0 se "rryma GPA X nuk është statistikisht i ndryshëm nga mesatarja e viteve të mëparshme/h”, d.m.th. H 0: X = ⁄ r, kundrejt hipotezës alternative përkatëse X Ф ^ ;

o ndërtuar shpërndarjet empirike të ndryshores së hetuar X;

o përcaktojnë(nëse është e nevojshme) korrelacione, për shembull, midis një ndryshoreje X dhe tregues të tjerë, të ndërtuar linjat e regresionit;

o kontrolloni pajtueshmërinë shpërndarja empirike ligji normal;

o vlerësoni vlerën e treguesve të pikëve dhe intervalin e besueshmërisë së parametrave, për shembull, mesataren;

o të përcaktojë kriteret për testimin statistikor hipoteza;

o testimi i hipotezave statistikore bazuar në kriteret e përzgjedhura;

o të formulojë një vendim mbi hipotezën zero statistikore për një të caktuar niveli i rëndësisë;

o largimi nga vendimi për të pranuar ose refuzuar hipotezën zero statistikore të interpretimit të përfundimeve në lidhje me hipotezën kuptimplotë;

o formuloni përfundime domethënëse.

Pra, nëse përmbledhim procedurat e mësipërme, aplikimi i metodave statistikore përbëhet nga tre blloqe kryesore:

Kalimi nga një objekt i realitetit në një skemë abstrakte matematikore dhe statistikore, domethënë ndërtimi i një modeli probabilistik të një dukurie, procesi, vetie;

Kryerja e veprimeve llogaritëse me mjetet e duhura matematikore në kuadrin e një modeli probabilistik bazuar në rezultatet e matjeve, vëzhgimeve, eksperimenteve dhe formulimit të përfundimeve statistikore;

Interpretimi i konkluzioneve statistikore për situatën reale dhe marrja e një vendimi të duhur.

Metodat statistikore për përpunimin dhe interpretimin e të dhënave bazohen në teorinë e probabilitetit. Teoria e probabilitetit është baza e metodave të statistikave matematikore. Pa përdorimin e koncepteve themelore dhe ligjeve të teorisë së probabilitetit, është e pamundur të përgjithësohen përfundimet e statistikave matematikore, dhe si rrjedhim përdorimi i tyre i arsyeshëm për qëllime shkencore dhe praktike.

Kështu, detyra e statistikave përshkruese është të transformojë një grup të dhënash të mostrës në një sistem treguesish - statistika - shpërndarjet e frekuencës, masat e tendencës dhe ndryshueshmërisë qendrore, koeficientët e bashkimit dhe të ngjashme. Megjithatë, statistikat janë karakteristika, në fakt, të një kampioni të caktuar. Natyrisht, është e mundur të llogariten shpërndarjet e mostrave, mesataret e mostrave, variancat, etj., por një "analizë e të dhënave" e tillë është me vlerë të kufizuar shkencore dhe edukative. Transferimi "mekanik" i çdo përfundimi të bërë në bazë të treguesve të tillë te popullatat e tjera nuk është i saktë.

Për të qenë në gjendje të transferoni tregues të mostrës ose të tjerë, ose në popullata më të zakonshme, është e nevojshme të keni të justifikuara matematikisht dispozitat mbi përputhshmërinë dhe aftësinë e karakteristikave të mostrës me karakteristikat e këtyre të ashtuquajturave të përbashkëta popullatat. Dispozita të tilla bazohen në qasje dhe skema teorike të lidhura me modele probabiliste të realitetit, për shembull, në qasjen aksiomatike, në ligj. numra të mëdhenj etj. Vetëm me ndihmën e tyre është e mundur të transferohen vetitë që përcaktohen nga rezultatet e analizës së informacionit të kufizuar empirik, qoftë në grupe të tjera ose të zakonshme. Pra, ndërtimi, ligjet e funksionimit, përdorimi i modeleve probabiliste, është subjekt fushë matematikore e quajtur "teoria e probabilitetit", bëhet thelbi i metodave statistikore.

Kështu, në statistikat matematikore, përdoren dy linja paralele treguesish: linja e parë, e cila është e rëndësishme për praktikën (këta janë tregues të mostrës) dhe e dyta, e bazuar në teori (këto janë tregues të një modeli probabilist). Për shembull, frekuencat empirike që përcaktohen në kampion korrespondojnë me konceptet e probabilitetit teorik; mesatarja e mostrës (praktikë) korrespondon vlera e pritur(teori) etj. Për më tepër, në studime, karakteristikat selektive, si rregull, janë parësore. Ato llogariten në bazë të vëzhgimeve, matjeve, eksperimenteve, pas së cilës i nënshtrohen një vlerësimi statistikor të aftësisë dhe efektivitetit, testimit të hipotezave statistikore në përputhje me objektivat e hulumtimit dhe në fund pranohen me një probabilitet të caktuar si. treguesit e vetive të popullatave të studiuara.

Pyetje. Një detyrë.

1. Përshkruani seksionet kryesore të statistikave matematikore.

2. Cila është ideja kryesore e statistikave matematikore?

3. Përshkruani raportin e popullatës së përgjithshme dhe të mostrës.

4. Shpjegoni skemën e zbatimit të metodave të statistikave matematikore.

5. Përcaktoni listën e detyrave kryesore të statistikave matematikore.

6. Cilat janë blloqet kryesore të aplikimit të metodave statistikore? Përshkruani ato.

7. Zgjeroni lidhjen midis statistikave matematikore dhe teorisë së probabilitetit.

Si përdoren statistikat e probabilitetit dhe matematikës? Këto disiplina janë baza e metodave probabilistiko-statistikore vendimmarrje. Për të përdorur aparatin e tyre matematikor, ju duhen detyra vendimmarrje shprehen në terma të modeleve probabilistiko-statistikore. Zbatimi i një probabilistike specifike metodë statistikore vendimmarrje përbëhet nga tre faza:

  • kalimi nga realiteti ekonomik, menaxherial, teknologjik në një skemë abstrakte matematikore dhe statistikore, d.m.th. ndërtimi i një modeli probabilistik të një sistemi kontrolli, një procesi teknologjik, procedurat e vendimmarrjes, në veçanti sipas rezultateve të kontrollit statistikor etj.;
  • kryerja e llogaritjeve dhe nxjerrja e përfundimeve me mjete thjesht matematikore në kuadrin e një modeli probabilistik;
  • interpretimi i konkluzioneve matematikore dhe statistikore në lidhje me një situatë reale dhe marrja e një vendimi të duhur (për shembull, për përputhjen ose mospërputhjen e cilësisë së produktit me kërkesat e vendosura, nevojën për të rregulluar procesin teknologjik, etj.), në veçanti, konkluzione (mbi proporcionin e njësive të dëmtuara të produkteve në një grup, mbi format specifike të ligjeve të shpërndarjes parametrat e kontrolluar procesi teknologjik, etj.).

Statistikat matematikore përdorin konceptet, metodat dhe rezultatet e teorisë së probabilitetit. Konsideroni çështjet kryesore të ndërtimit të modeleve probabiliste vendimmarrje në situata ekonomike, menaxheriale, teknologjike e të tjera. Për përdorimin aktiv dhe korrekt të dokumenteve normativo-teknike dhe udhëzuese-metodike mbi metodat probabilistiko-statistikore. vendimmarrje kërkohet njohuri paraprake. Pra, është e nevojshme të dihet se në cilat kushte duhet të zbatohet një ose një dokument tjetër, çfarë informacioni fillestar është i nevojshëm për zgjedhjen dhe aplikimin e tij, cilat vendime duhet të merren bazuar në rezultatet e përpunimit të të dhënave, etj.

Shembuj të aplikimit të teorisë së probabilitetit dhe statistikave matematikore. Le të shqyrtojmë disa shembuj kur modelet probabilistiko-statistikore janë një mjet i mirë për zgjidhjen e problemeve menaxheriale, industriale, ekonomike dhe ekonomike kombëtare. Kështu, për shembull, në romanin e A.N. "Ecja nëpër mundimet" e Tolstoit (vëll. 1) thotë: "punëtoria jep njëzet e tre për qind të martesës, ju mbajeni këtë shifër", i tha Strukov Ivan Iliçit.

Shtrohet pyetja si të kuptohen këto fjalë në bisedën e drejtuesve të fabrikës, pasi një njësi prodhimi nuk mund të jetë me 23%. Mund të jetë ose i mirë ose i dëmtuar. Ndoshta Strukov donte të thoshte që një grumbull i madh përmban afërsisht 23% të njësive me defekt. Atëherë lind pyetja, çfarë do të thotë "rreth"? Le të rezultojnë 30 nga 100 njësi të testuara të prodhimit të dëmtuara, ose nga 1000-300, ose nga 100000-30000, etj., a duhet të akuzohet Strukov për gënjeshtër?

Ose një shembull tjetër. Monedha që përdoret si shumë duhet të jetë “simetrike”, d.m.th. kur hidhet, mesatarisht, në gjysmën e rasteve, stema duhet të bjerë jashtë, dhe në gjysmën e rasteve - grila (bishti, numri). Por çfarë do të thotë "mesatare"? Nëse shpenzoni shumë seri prej 10 hedhjesh në secilën seri, atëherë shpesh do të ketë seri në të cilat një monedhë bie 4 herë me një stemë. Për një monedhë simetrike, kjo do të ndodhë në 20.5% të serisë. Dhe nëse ka 40,000 stema për 100,000 hedhje, a mund të konsiderohet monedha simetrike? Procedura vendimmarrje bazohet në teorinë e probabilitetit dhe statistikat matematikore.

Shembulli në shqyrtim mund të mos duket mjaft serioz. Megjithatë, nuk është kështu. Tërheqja e shortit përdoret gjerësisht në organizimin e eksperimenteve të fizibilitetit industrial, për shembull, kur përpunohen rezultatet e matjes së indeksit të cilësisë (momenti i fërkimit) të kushinetave në varësi të faktorëve të ndryshëm teknologjikë (ndikimi i një mjedisi të ruajtjes, metodat e përgatitjes së kushinetave para matjes , efekti i ngarkesës mbajtëse në procesin e matjes etj.) P.). Supozoni se është e nevojshme të krahasohet cilësia e kushinetave në varësi të rezultateve të ruajtjes së tyre në vajra të ndryshëm ruajtjeje, d.m.th. në përbërje vajra dhe . Kur planifikoni një eksperiment të tillë, lind pyetja se cilat kushineta duhet të vendosen në vajin e përbërjes, dhe cilat - në vajin e përbërjes, por në mënyrë të tillë që të shmanget subjektiviteti dhe të sigurohet objektiviteti i vendimit.

Përgjigja për këtë pyetje mund të merret me short. Një shembull i ngjashëm mund të jepet me kontrollin e cilësisë së çdo produkti. Marrja e mostrave bëhet për të vendosur nëse një pjesë e produkteve të inspektuara plotëson apo jo kërkesat e specifikuara. Bazuar në rezultatet e kontrollit të mostrës, është bërë një përfundim për të gjithë grupin. Në këtë rast është shumë e rëndësishme shmangia e subjektivitetit në formimin e kampionit, d.m.th. është e nevojshme që çdo njësi produkti në lotin e kontrolluar të ketë të njëjtën probabilitet për t'u përzgjedhur në kampion. Në kushtet e prodhimit, zgjedhja e njësive të prodhimit në mostër zakonisht kryhet jo me short, por me tabela të veçanta të numrave të rastit ose me ndihmën e gjeneratorëve kompjuterikë të numrave të rastit.

Probleme të ngjashme për të siguruar objektivitetin e krahasimit lindin kur krahasohen skema të ndryshme. organizimi i prodhimit, shpërblimi, gjatë tenderave dhe konkurseve, përzgjedhja e kandidatëve për pozitat vakante etj. Kudo keni nevojë për llotari apo procedura të ngjashme. Le të shpjegojmë duke përdorur shembullin e identifikimit të ekipeve më të forta dhe të dyta më të forta kur organizoni një turne sipas sistemit olimpik (humbësi eliminohet). Le të fitojë gjithmonë skuadra më e fortë ndaj më të dobëtit. Është e qartë se skuadra më e fortë do të dalë patjetër kampion. Skuadra e dytë më e fortë do të arrijë në finale nëse dhe vetëm nëse nuk ka ndeshje me kampionin e ardhshëm përpara finales. Nëse planifikohet një lojë e tillë, atëherë skuadra e dytë më e fortë nuk do të arrijë në finale. Ai që planifikon turneun, ose mund të "nokautojë" para kohe skuadrën e dytë më të fortë nga turneu, duke e rrëzuar në takimin e parë me liderin, ose t'i sigurojë vendin e dytë, duke siguruar takime me skuadra më të dobëta deri në finale. Për të shmangur subjektivitetin, hidhni short. Për një turne me 8 ekipe, probabiliteti që dy skuadrat më të forta të takohen në finale është 4/7. Prandaj, me një probabilitet prej 3/7, skuadra e dytë më e fortë do të largohet nga turneu para afatit.

Në çdo matje të njësive të produktit (duke përdorur një kaliper, mikrometër, ampermetër, etj.), Ka gabime. Për të zbuluar nëse ka gabime sistematike, është e nevojshme të bëhen matje të përsëritura të një njësie prodhimi, karakteristikat e së cilës janë të njohura (për shembull, një mostër standarde). Duhet mbajtur mend se përveç gabimit sistematik, ekziston edhe një gabim i rastësishëm.

Prandaj, lind pyetja se si të zbulohet nga rezultatet e matjes nëse ka një gabim sistematik. Nëse vërejmë vetëm nëse gabimi i marrë gjatë matjes së radhës është pozitiv apo negativ, atëherë ky problem mund të reduktohet në atë të mëparshëm. Në të vërtetë, le të krahasojmë matjen me hedhjen e një monedhe, gabimin pozitiv - me humbjen e stemës, negativin - me grilë (gabim zero me një numër të mjaftueshëm ndarjesh të shkallës pothuajse nuk ndodh kurrë). Pastaj kontrollimi i mungesës së një gabimi sistematik është i barabartë me kontrollin e simetrisë së monedhës.

Qëllimi i këtyre konsideratave është të zvogëlojë problemin e kontrollit të mungesës së një gabimi sistematik në problemin e kontrollit të simetrisë së një monedhe. Arsyetimi i mësipërm çon në të ashtuquajturin "kriteri i shenjave" në statistikat matematikore.

Në rregullimin statistikor të proceseve teknologjike, bazuar në metodat e statistikave matematikore, zhvillohen rregulla dhe plane për kontrollin statistikor të proceseve, që synojnë zbulimin në kohë të çrregullimeve të proceseve teknologjike, marrjen e masave për rregullimin e tyre dhe parandalimin e lëshimit të produkteve që bëjnë. nuk plotësojnë kërkesat e përcaktuara. Këto masa kanë për qëllim reduktimin e kostove të prodhimit dhe humbjeve nga furnizimi me produkte me cilësi të ulët. Me kontrollin e pranimit statistikor, bazuar në metodat e statistikave matematikore, hartohen planet e kontrollit të cilësisë duke analizuar mostrat nga grupet e produkteve. Vështirësia qëndron në aftësinë për të ndërtuar saktë modele probabilistiko-statistikore vendimmarrje në bazë të të cilave mund t'u jepet përgjigje pyetjeve të mësipërme. Në statistikat matematikore, për këtë janë zhvilluar modele dhe metoda probabilistike për testimin e hipotezave, në veçanti, hipotezat se proporcioni i njësive të dëmtuara të prodhimit është i barabartë me një numër të caktuar, për shembull, (kujtoni fjalët e Strukov nga romani i A.N. Tolstoi).

Detyrat e vlerësimit. Në një numër situatash menaxheriale, industriale, ekonomike, ekonomike kombëtare, lindin probleme të një lloji tjetër - probleme të vlerësimit të karakteristikave dhe parametrave të shpërndarjeve të probabilitetit.

Konsideroni një shembull. Lëreni në kontroll një grup N llambash elektrike. Një kampion prej n llambash elektrike u zgjodh rastësisht nga kjo grumbull. Ngrihen një sërë pyetjesh të natyrshme. Si mund të përcaktohet jeta mesatare e shërbimit të llambave elektrike nga rezultatet e testimit të elementeve të mostrës dhe me çfarë saktësie mund të vlerësohet kjo karakteristikë? Si do të ndryshojë saktësia nëse merret një mostër më e madhe? Në çfarë numri orësh mund të garantohet që të paktën 90% e llambave elektrike do të zgjasin më shumë se orë?

Supozoni se gjatë testimit të një kampioni me një vëllim llambash elektrike, llambat elektrike rezultuan të dëmtuara. Atëherë lindin pyetjet e mëposhtme. Çfarë kufijsh mund të specifikohen për numrin e llambave elektrike me defekt në një grup, për nivelin e defektit, etj.?

Ose, në një analizë statistikore të saktësisë dhe stabilitetit të proceseve teknologjike, është e nevojshme të vlerësohen të tilla treguesit e cilësisë, si mesatare parametër i kontrolluar dhe shkallën e shpërndarjes së tij në procesin në shqyrtim. Sipas teorisë së probabilitetit, është e këshillueshme që të përdoret pritshmëria e saj matematikore si vlera mesatare e një ndryshoreje të rastësishme dhe varianca, devijimi standard ose koeficienti i variacionit. Kjo ngre pyetjen: si t'i vlerësojmë këto karakteristikat statistikore sipas të dhënave të mostrës dhe me çfarë saktësie mund të bëhet kjo? Ka shumë shembuj të ngjashëm. Këtu ishte e rëndësishme të tregohej se si teoria e probabilitetit dhe statistikat matematikore mund të përdoren në menaxhimin e prodhimit kur merren vendime në fushën e menaxhimit statistikor të cilësisë së produktit.

Çfarë është "statistika matematikore"? Statistikat matematikore kuptohen si "një degë e matematikës që i kushtohet metodave matematikore të mbledhjes, sistemimit, përpunimit dhe interpretimit të të dhënave statistikore, si dhe përdorimit të tyre për përfundime shkencore ose praktike. Rregullat dhe procedurat e statistikave matematikore bazohen në teorinë e probabiliteti, i cili bën të mundur vlerësimin e saktësisë dhe besueshmërisë së përfundimeve të marra në secilën detyrë bazuar në materialin statistikor të disponueshëm" [ [2.2], f. 326]. Në të njëjtën kohë, të dhënat statistikore i referohen informacionit për numrin e objekteve në çdo koleksion pak a shumë të gjerë që kanë karakteristika të caktuara.

Sipas llojit të problemeve që zgjidhen, statistikat matematikore zakonisht ndahen në tre seksione: përshkrimi i të dhënave, vlerësimi dhe testimi i hipotezave.

Sipas llojit të të dhënave statistikore që përpunohen, statistikat matematikore ndahen në katër fusha:

  • statistika njëdimensionale (statistika e variablave të rastit), në të cilat rezultati i një vëzhgimi përshkruhet me një numër real;
  • analiza statistikore shumëdimensionale, ku rezultati i vëzhgimit të një objekti përshkruhet me disa numra (vektor);
  • statistikat e proceseve të rastësishme dhe seritë kohore, ku rezultati i vëzhgimit është një funksion;
  • statistikat e objekteve të një natyre jo numerike, në të cilat rezultati i një vëzhgimi është i një natyre jo numerike, për shembull, është një grup (një figurë gjeometrike), një renditje ose e marrë si rezultat i një matjeje nga një atribut cilësor.

Historikisht, disa fusha të statistikave të objekteve jo-numerike (në veçanti, problemet e vlerësimit të përqindjes së martesës dhe testimit të hipotezave për të) dhe statistikat njëdimensionale ishin të parat që u shfaqën. Aparati matematikor është më i thjeshtë për ta, prandaj, me shembullin e tyre, ata zakonisht demonstrojnë idetë kryesore të statistikave matematikore.

Vetëm ato metoda të përpunimit të të dhënave, d.m.th. statistikat matematikore janë të bazuara në prova, të cilat bazohen në modele probabiliste të dukurive dhe proceseve reale përkatëse. Po flasim për modele të sjelljes së konsumatorit, shfaqjen e rreziqeve, funksionimin e pajisjeve teknologjike, marrjen e rezultateve të një eksperimenti, rrjedhën e një sëmundjeje etj. Një model probabilistik i një dukurie reale duhet të konsiderohet i ndërtuar nëse sasitë në shqyrtim dhe marrëdhëniet ndërmjet tyre shprehen në terma të teorisë së probabilitetit. Përputhja me modelin probabilist të realitetit, d.m.th. mjaftueshmëria e tij vërtetohet, veçanërisht duke përdorur metoda statistikore për testimin e hipotezave.

Metodat e pabesueshme të përpunimit të të dhënave janë eksploruese, ato mund të përdoren vetëm në analizën paraprake të të dhënave, pasi ato nuk bëjnë të mundur vlerësimin e saktësisë dhe besueshmërisë së përfundimeve të marra në bazë të një materiali të kufizuar statistikor.

Probabiliste dhe metodat statistikore janë të zbatueshme kudo që është e mundur të ndërtohet dhe të vërtetohet një model probabilistik i një dukurie ose procesi. Përdorimi i tyre është i detyrueshëm kur përfundimet e nxjerra nga të dhënat e mostrës transferohen në të gjithë popullatën (për shembull, nga një mostër në një grup të tërë produktesh).

Në aplikime specifike, ato përdoren si probabiliste metodat statistikore aplikim të gjerë, si dhe specifik. Për shembull, në seksionin e menaxhimit të prodhimit kushtuar metodave statistikore të kontrollit të cilësisë së produktit, përdoren statistikat e aplikuara matematikore (përfshirë hartimin e eksperimenteve). Me ndihmën e metodave të tij, Analiza statistikore saktësinë dhe qëndrueshmërinë e proceseve teknologjike dhe vlerësimin statistikor të cilësisë. Metodat specifike përfshijnë kontrollin statistikor të pranimit të cilësisë së produktit, rregullimin statistikor të proceseve teknologjike, vlerësimin dhe kontrollin e besueshmërisë, etj.

Disiplina të tilla të aplikuara probabilistiko-statistikore si teoria e besueshmërisë dhe teoria e radhës përdoren gjerësisht. Përmbajtja e të parit prej tyre është e qartë nga titulli, e dyta merret me studimin e sistemeve të tilla si një central telefonik, i cili merr thirrje në kohë të rastësishme - kërkesat e abonentëve që formojnë numrat në telefonat e tyre. Kohëzgjatja e shërbimit të këtyre kërkesave, d.m.th. kohëzgjatja e bisedave modelohet edhe nga variabla të rastësishëm. Një kontribut i madh në zhvillimin e këtyre disiplinave dha Anëtari Korrespondent i Akademisë së Shkencave të BRSS A.Ya. Khinchin (1894-1959), Akademik i Akademisë së Shkencave të SSR të Ukrainës B.V. Gnedenko (1912-1995) dhe shkencëtarë të tjerë vendas.

Shkurtimisht për historinë e statistikave matematikore. Statistikat matematikore si shkencë nisin me veprat e matematikanit të famshëm gjerman Carl Friedrich Gauss (1777-1855), i cili, bazuar në teorinë e probabilitetit, hetoi dhe vërtetoi metoda me katrorin më të vogël, krijuar prej tij në 1795 dhe u përdor për të përpunuar të dhëna astronomike (me qëllim për të rafinuar orbitën e planetit të vogël Ceres). Një nga shpërndarjet më të njohura të probabilitetit, ajo normale, shpesh emërtohet sipas tij, dhe në teorinë e proceseve të rastësishme, objekti kryesor i studimit janë proceset Gaussian.

AT fundi i XIX në. - fillimi i shekullit të njëzetë. një kontribut të madh në statistikat matematikore dhanë studiuesit anglezë, kryesisht K. Pearson (1857-1936) dhe R.A. Fisher (1890-1962). Në veçanti, Pearson zhvilloi kriterin "chi-square" për testimin e hipotezave statistikore, dhe Fisher - analiza e variancës, teoria e planifikimit të eksperimentit, metoda maksimale e gjasave të vlerësimit të parametrave.

Në vitet 30 të shekullit XX. Poli Jerzy Neumann (1894-1977) dhe anglezi E. Pearson zhvilluan një teori të përgjithshme të testimit të hipotezave statistikore dhe matematikanët sovjetikë Akademik A.N. Kolmogorov (1903-1987) dhe anëtar korrespondues i Akademisë së Shkencave të BRSS N.V. Smirnov (1900-1966) hodhi themelet e statistikave joparametrike. Në të dyzetat e shekullit XX. Rumuni A. Wald (1902-1950) ndërtoi teorinë e analizës së qëndrueshme statistikore.

Statistikat matematikore po zhvillohen me shpejtësi në kohën e tanishme. Pra, gjatë 40 viteve të fundit, katër fusha thelbësisht të reja të kërkimit mund të dallohen [ [ 2.16 ] ]:

  • zhvillimin dhe zbatimin metodat matematikore planifikimi i eksperimenteve;
  • zhvillimi i statistikave të objekteve të natyrës jo numerike si drejtim i pavarur në statistikat e aplikuara matematikore;
  • zhvillimi i metodave statistikore rezistente ndaj devijimeve të vogla nga modeli probabilistik i përdorur;
  • shtrirje e gjerë e punës për krijimin e paketave softuerike kompjuterike të dizajnuara për analizën e të dhënave statistikore.

Metodat probabilistiko-statistikore dhe optimizimi. Ideja e optimizimit përshkon statistikat moderne të aplikuara matematikore dhe të tjera metodat statistikore. Domethënë, metodat për planifikimin e eksperimenteve, kontrollin e pranimit statistikor, rregullimin statistikor të proceseve teknologjike, etj. Nga ana tjetër, formulimet e optimizimit në teori vendimmarrje Për shembull, teoria e aplikuar e optimizimit të cilësisë së produktit dhe kërkesat e standardeve, parashikojnë përdorimin e gjerë të metodave probabilistiko-statistikore, kryesisht të statistikave matematikore të aplikuara.

Në menaxhimin e prodhimit, në veçanti, kur optimizoni cilësinë e produktit dhe kërkesat standarde, është veçanërisht e rëndësishme të aplikoni metodat statistikore në fazën fillestare cikli i jetes produkte, d.m.th. në fazën e përgatitjes kërkimore të zhvillimeve të projektimit eksperimental (zhvillimi i kërkesave premtuese për produktet, dizajni paraprak, termat e referencës për zhvillimin e dizajnit eksperimental). Kjo është për shkak të informacionit të kufizuar të disponueshëm në fazën fillestare të ciklit jetësor të produktit dhe nevojës për të parashikuar mundësitë teknike dhe situatën ekonomike për të ardhmen. Metodat Statistikore duhet të zbatohet në të gjitha fazat e zgjidhjes së problemit të optimizimit - gjatë shkallëzimit të variablave, zhvillimit të modeleve matematikore për funksionimin e produkteve dhe sistemeve, kryerjes së eksperimenteve teknike dhe ekonomike, etj.

Në problemet e optimizimit, duke përfshirë optimizimin e cilësisë së produktit dhe kërkesat standarde, përdoren të gjitha fushat e statistikave. Gjegjësisht - statistikat e variablave të rastësishëm, multivariate Analiza statistikore, statistika të proceseve të rastësishme dhe seri kohore, statistika të objekteve të natyrës jo numerike. Zgjedhja e një metode statistikore për analizën e të dhënave specifike duhet të bëhet sipas rekomandimeve [