Statistikat e matematikës është një degë moderne e matematikës që merret me përshkrim statistikor rezultatet e eksperimenteve dhe vëzhgimeve, si dhe ndërtesë modele matematikore që përmbajnë koncepte probabilitetet. Baza teorike e statistikave matematikore është teoria e probabilitetit.

Në strukturën e statistikave matematikore, tradicionalisht dallohen dy seksione kryesore: Statistika përshkruese dhe konkluzioni statistikor (Figura 1.1).

Oriz. 1.1. Seksionet kryesore të statistikave matematikore

Statistika përshkruese përdoret për:

o përgjithësimi i treguesve të një variabli (statistikat e një kampioni të rastësishëm);

o identifikimi i marrëdhënieve ndërmjet dy ose më shumë variablave (analizë korrelacion-regresion).

Statistikat përshkruese bëjnë të mundur marrjen e informacionit të ri, kuptimin e shpejtë dhe vlerësimin e plotë të tij, domethënë kryen funksionin shkencor të përshkrimit të objekteve të studimit, gjë që justifikon emrin e tij. Metodat e statistikave përshkruese janë krijuar për të kthyer një grup të dhënash empirike individuale në një sistem formash dhe numrash që janë vizualë për perceptim: shpërndarjet e frekuencës; tregues të tendencave, ndryshueshmërisë, komunikimit. Këto metoda llogaritin statistikat e një kampioni të rastësishëm, të cilat shërbejnë si bazë për zbatimin e konkluzioneve statistikore.

Konkluzioni Statistikor jepni mundësinë:

o vlerësoni saktësinë, besueshmërinë dhe efektivitetin e statistikave të mostrës, gjeni gabimet që ndodhin në procesin e kërkimit statistikor (vlerësimi statistikor)

o përmbledh parametrat e popullsisë së përgjithshme të marra në bazë të statistikave të mostrës (kontroll hipoteza statistikore).

objektivi kryesor kërkimin shkencor- kjo është përvetësimi i njohurive të reja për një klasë të madhe dukurish, personash ose ngjarjesh, të cilat zakonisht quhen popullata e përgjithshme.

Popullatë është tërësia e objekteve të studimit, mostër- pjesa e tij, e cila është formuar në një mënyrë të caktuar të argumentuar shkencërisht 2.

Termi “popullsi e përgjithshme” përdoret kur po flasim rreth një grupi të madh, por të kufizuar objektesh në studim. Për shembull, në lidhje me tërësinë e aplikantëve në Ukrainë në 2009 ose tërësinë e fëmijëve mosha parashkollore qyteti i Rivne. Popullatat e përgjithshme mund të arrijnë vëllime të konsiderueshme, të jenë të fundme dhe të pafundme. Në praktikë, si rregull, merret me grupe të fundme. Dhe nëse raporti i madhësisë së popullsisë së përgjithshme me madhësinë e kampionit është më shumë se 100, atëherë, sipas Glass dhe Stanley, metodat e vlerësimit për popullatat e fundme dhe të pafundme japin në thelb të njëjtat rezultate. Grupi i përgjithshëm mund të quhet gjithashtu grupi i plotë i vlerave të disa atributeve. Fakti që kampioni i përket popullatës së përgjithshme është baza kryesore për vlerësimin e karakteristikave të popullatës së përgjithshme sipas karakteristikave të kampionit.

Kryesor ideja Statistikat matematikore bazohen në besimin se një studim i plotë i të gjitha objekteve të popullatës së përgjithshme në shumicën e problemeve shkencore është praktikisht i pamundur ose ekonomikisht jopraktik, pasi kërkon shumë kohë dhe kosto të konsiderueshme materiale. Prandaj, në statistikat matematikore, përdoret qasje selektive, parimi i të cilit është paraqitur në diagramin në Fig. 1.2.

Për shembull, sipas teknologjisë së formimit, mostrat janë të rastësishme (të thjeshta dhe sistematike), të shtresuara, të grumbulluara (shih seksionin 4).

Oriz. 1.2. Skema e aplikimit të metodave të statistikës matematikore Sipas qasje selektive përdorimi i matematikës metodat statistikore mund të kryhet në sekuencën e mëposhtme (shih Fig. 1.2):

o me popullsia e përgjithshme, vetitë e të cilave janë objekt kërkimi, të caktuara metodat formojnë një mostër- një numër tipik, por i kufizuar i objekteve për të cilat zbatohen metodat e kërkimit;

o si rezultat i metodave të vëzhgimit, veprimeve eksperimentale dhe matjeve në objektet e mostrës, merren të dhëna empirike;

o përpunimi i të dhënave empirike duke përdorur metodat e statistikave përshkruese jep tregues të mostrës, të cilët quhen statisticienët - meqë ra fjala, emri i disiplinës;

o aplikimi i metodave të konkluzionit statistikor për statisticien, marrin parametrat që karakterizojnë vetitë popullata e përgjithshme.

Shembulli 1.1. Për të vlerësuar stabilitetin e nivelit të njohurive (ndryshueshme x) testimi i një kampioni të rastësishëm prej 3 nxënësish me një vëllim prej n. Testet përmbanin m detyra, secila prej të cilave vlerësohej sipas sistemit të pikëzimit: "të përfunduara" "- 1", të paplotësuara "- 0. arritjet mesatare aktuale të nxënësve mbetën X

3 mostër e rastësishme(nga anglishtja. Random - random) është një mostër përfaqësuese, e cila formohet sipas strategjisë së testeve të rastësishme.

në nivelin e viteve të mëparshme/h? Sekuenca e zgjidhjes:

o zbuloni një hipotezë kuptimplote të tipit: "nëse rezultatet aktuale të testit nuk ndryshojnë nga e kaluara, atëherë mund ta konsiderojmë nivelin e njohurive të studentëve të pandryshuar, dhe procesi i studimit- e qëndrueshme";

o formuloni një hipotezë statistikore adekuate, siç është hipoteza zero H 0 se "rryma GPA X nuk është statistikisht i ndryshëm nga mesatarja e viteve të mëparshme/h”, d.m.th. H 0: X = ⁄ r, kundrejt hipotezës alternative përkatëse X Ф ^ ;

o ndërtuar shpërndarjet empirike të ndryshores së hetuar X;

o përcaktojnë(nëse është e nevojshme) korrelacione, për shembull, midis një ndryshoreje X dhe tregues të tjerë, të ndërtuar linjat e regresionit;

o kontrolloni pajtueshmërinë shpërndarja empirike ligji normal;

o vlerësoni vlerën e treguesve të pikëve dhe intervalin e besueshmërisë së parametrave, për shembull, mesataren;

o të përcaktojë kriteret për testimin statistikor hipoteza;

o testimi i hipotezave statistikore bazuar në kriteret e përzgjedhura;

o të formulojë një vendim mbi hipotezën zero statistikore për një të caktuar niveli i rëndësisë;

o largimi nga vendimi për të pranuar ose refuzuar hipotezën zero statistikore të interpretimit të përfundimeve në lidhje me hipotezën kuptimplotë;

o formuloni përfundime domethënëse.

Pra, nëse përmbledhim procedurat e mësipërme, aplikimi i metodave statistikore përbëhet nga tre blloqe kryesore:

Kalimi nga një objekt i realitetit në një skemë abstrakte matematikore dhe statistikore, domethënë ndërtimi i një modeli probabilistik të një dukurie, procesi, vetie;

Kryerja e veprimeve llogaritëse me mjete të duhura matematikore në kuadrin e një modeli probabilistik bazuar në rezultatet e matjeve, vëzhgimeve, eksperimenteve dhe formulimit të përfundimeve statistikore;

Interpretimi i konkluzioneve statistikore për situatën reale dhe marrja e një vendimi të duhur.

Metodat statistikore për përpunimin dhe interpretimin e të dhënave bazohen në teorinë e probabilitetit. Teoria e probabilitetit është baza e metodave të statistikave matematikore. Pa përdorimin e koncepteve themelore dhe ligjeve të teorisë së probabilitetit, është e pamundur të përgjithësohen përfundimet e statistikave matematikore, dhe si rrjedhim përdorimi i tyre i arsyeshëm për qëllime shkencore dhe praktike.

Kështu, detyra e statistikave përshkruese është të transformojë një grup të dhënash të mostrës në një sistem treguesish - statistika - shpërndarjet e frekuencës, masat e tendencës dhe ndryshueshmërisë qendrore, koeficientët e bashkimit dhe të ngjashme. Megjithatë, statistikat janë karakteristika, në fakt, të një kampioni të caktuar. Natyrisht, është e mundur të llogariten shpërndarjet e mostrave, mesataret e mostrave, variancat, etj., por një "analizë e të dhënave" e tillë është me vlerë të kufizuar shkencore dhe edukative. Transferimi "mekanik" i çdo përfundimi të nxjerrë në bazë të treguesve të tillë te popullatat e tjera nuk është i saktë.

Për të qenë në gjendje të transferoni tregues të mostrës ose të tjerë, ose në popullata më të zakonshme, është e nevojshme të keni të justifikuara matematikisht dispozitat në lidhje me përputhshmërinë dhe aftësinë e karakteristikave të mostrës me karakteristikat e këtyre të ashtuquajturave popullata të përgjithshme të zakonshme. Dispozita të tilla bazohen në qasje dhe skema teorike të lidhura me modele probabiliste të realitetit, për shembull, në qasjen aksiomatike, në ligj. numra të mëdhenj etj. Vetëm me ndihmën e tyre është e mundur të transferohen vetitë që përcaktohen nga rezultatet e analizës së informacionit të kufizuar empirik, qoftë në grupe të tjera ose të zakonshme. Kështu, ndërtimi, ligjet e funksionimit, përdorimi i modeleve probabiliste, është objekt i një fushe matematikore të quajtur "teoria e probabilitetit", bëhet thelbi i metodave statistikore.

Kështu, në statistikat matematikore, përdoren dy linja paralele treguesish: linja e parë, e cila është e rëndësishme për praktikën (këta janë tregues të mostrës) dhe e dyta, e bazuar në teori (këta janë tregues të një modeli probabilistik). Për shembull, frekuencat empirike që përcaktohen në kampion korrespondojnë me konceptet e probabilitetit teorik; mesatarja e mostrës (praktikë) korrespondon vlera e pritur(teori) etj. Për më tepër, në studime, karakteristikat selektive, si rregull, janë parësore. Ato llogariten në bazë të vëzhgimeve, matjeve, eksperimenteve, pas së cilës i nënshtrohen një vlerësimi statistikor të aftësisë dhe efektivitetit, testimit të hipotezave statistikore në përputhje me objektivat e hulumtimit dhe në fund pranohen me një probabilitet të caktuar si. treguesit e vetive të popullatave të studiuara.

Pyetje. Një detyrë.

1. Përshkruani seksionet kryesore të statistikave matematikore.

2. Cila është ideja kryesore e statistikave matematikore?

3. Përshkruani raportin e popullatës së përgjithshme dhe të mostrës.

4. Shpjegoni skemën e zbatimit të metodave të statistikave matematikore.

5. Përcaktoni listën e detyrave kryesore të statistikave matematikore.

6. Cilat janë blloqet kryesore të aplikimit të metodave statistikore? Përshkruani ato.

7. Zgjeroni lidhjen midis statistikave matematikore dhe teorisë së probabilitetit.

Prezantimi

2. Konceptet bazë të statistikës matematikore

2.1 Konceptet bazë të kampionimit

2.2 Marrja e mostrave

2.3 Funksioni empirik i shpërndarjes, histogrami

konkluzioni

Bibliografi

Prezantimi

Statistikat matematikore janë shkenca e metodat matematikore sistemimi dhe përdorimi i të dhënave statistikore për përfundime shkencore dhe praktike. Në shumë prej degëve të saj, statistikat matematikore bazohen në teorinë e probabilitetit, e cila bën të mundur vlerësimin e besueshmërisë dhe saktësisë së përfundimeve të nxjerra nga materiali i kufizuar statistikor (për shembull, për të vlerësuar madhësinë e kërkuar të mostrës për të marrë rezultate të saktësisë së kërkuar në një studim mostër).

Në teorinë e probabilitetit, variablat e rastësishëm me një shpërndarje të caktuar ose eksperimente të rastësishme, vetitë e të cilave janë plotësisht të njohura. Lënda e teorisë së probabilitetit janë vetitë dhe marrëdhëniet e këtyre madhësive (shpërndarjeve).

Por shpesh eksperimenti është një kuti e zezë, duke dhënë vetëm disa rezultate, sipas të cilave kërkohet të nxirret një përfundim për vetitë e vetë eksperimentit. Vëzhguesi ka një grup rezultatesh numerike (ose mund të bëhen numerike) të marra duke përsëritur të njëjtin eksperiment të rastësishëm në të njëjtat kushte.

Në këtë rast, për shembull, lindin pyetjet e mëposhtme: Nëse vëzhgojmë një variabël të rastësishëm, si mund të nxjerrim përfundimin më të saktë për shpërndarjen e tij nga një grup vlerash të tij në disa eksperimente?

Një shembull i një serie të tillë eksperimentesh është një anketë sociologjike, një grup treguesish ekonomikë, ose, së fundi, një sekuencë stemash dhe bishtash gjatë një hedhjeje një mijëfish të monedhës.

Të gjithë faktorët e mësipërm çojnë në rëndësinë dhe rëndësia e temës së punës në fazën aktuale, që synon një studim të thellë dhe të gjithanshëm të koncepteve bazë të statistikave matematikore.

Në këtë drejtim, qëllimi i kësaj pune është sistemimi, grumbullimi dhe konsolidimi i njohurive rreth koncepteve të statistikave matematikore.

1. Lënda dhe metodat e statistikës matematikore

Statistikat matematikore janë shkenca e metodave matematikore për analizimin e të dhënave të marra gjatë vëzhgimeve masive (matjet, eksperimentet). Në varësi të natyrës matematikore të rezultateve specifike të vëzhgimeve, statistikat matematikore ndahen në statistika të numrave, shumëdimensionale. Analiza statistikore, analiza e funksioneve (proceseve) dhe e serive kohore, statistikat e objekteve të natyrës jo numerike. Një pjesë e konsiderueshme e statistikave matematikore bazohet në modele probabiliste. Ndani detyrat e përgjithshme përshkrimet e të dhënave, vlerësimi dhe testimi i hipotezave. Ata gjithashtu marrin në konsideratë detyra më specifike që lidhen me kryerjen e sondazheve të mostrës, rivendosjen e varësive, ndërtimin dhe përdorimin e klasifikimeve (tipologjive), etj.

Për të përshkruar të dhënat, ndërtohen tabela, tabela dhe paraqitje të tjera vizuale, për shembull, fusha korrelacioni. Modelet probabiliste zakonisht nuk përdoren. Disa metoda të përshkrimit të të dhënave mbështeten në teorinë e avancuar dhe në aftësitë e kompjuterëve modernë. Këto përfshijnë, në veçanti, analizën e grupimeve, që synojnë identifikimin e grupeve të objekteve që janë të ngjashme me njëri-tjetrin, dhe shkallëzimin shumëdimensional, i cili bën të mundur vizualizimin e objekteve në një aeroplan, duke shtrembëruar distancat midis tyre në shkallën më të vogël.

Metodat e vlerësimit dhe testimit të hipotezave mbështeten në modelet probabiliste të gjenerimit të të dhënave. Këto modele ndahen në parametrike dhe joparametrike. Në modelet parametrike, supozohet se objektet në studim përshkruhen nga funksionet e shpërndarjes që varen nga një numër i vogël (1-4) parametrash numerikë. Në modelet joparametrike, funksionet e shpërndarjes supozohen të jenë arbitrare të vazhdueshme. Në statistikat matematikore, parametrat dhe karakteristikat e shpërndarjes (pritshmëria matematikore, mediana, varianca, sasitë, etj.), Dendësia dhe funksionet e shpërndarjes, varësitë midis variablave (bazuar në koeficientët e korrelacionit linear dhe joparametrik, si dhe parametra ose jo- Vlerësimet parametrike të funksioneve që shprehin varësi) vlerësohen etj. Përdorni vlerësimet e pikës dhe intervalit (duke dhënë kufijtë për vlerat e vërteta).

Në statistikat matematikore ekziston një teori e përgjithshme e testimit të hipotezave dhe numër i madh metodat e dedikuara për testimin e hipotezave specifike. Hipotezat merren parasysh për vlerat e parametrave dhe karakteristikave, për kontrollimin e homogjenitetit (d.m.th., për koincidencën e karakteristikave ose funksioneve të shpërndarjes në dy mostra), për përputhjen e funksionit të shpërndarjes empirike me një funksion të caktuar shpërndarjeje ose me një parametrik. familja e funksioneve të tilla, për simetrinë e shpërndarjes etj.

Me rëndësi të madhe është seksioni i statistikave matematikore që lidhet me kryerjen e anketave kampione, me vetitë e skemave të ndryshme të kampionimit dhe ndërtimin e metodave adekuate për vlerësimin dhe testimin e hipotezave.

Problemet e rikuperimit të varësisë janë studiuar në mënyrë aktive për më shumë se 200 vjet, që nga zhvillimi i metodës së katrorëve më të vegjël nga K. Gauss në 1794. Aktualisht, metodat e kërkimit të një nëngrupi informativ të variablave dhe metodave joparametrike janë më të rëndësishmet.

Zhvillimi i metodave për përafrimin e të dhënave dhe reduktimin e dimensioneve të përshkrimit filloi më shumë se 100 vjet më parë, kur K. Pearson krijoi metodën e komponentit kryesor. Më vonë, u zhvilluan analiza faktoriale dhe përgjithësime të shumta jolineare.

Metodat e ndryshme të ndërtimit (analiza grupore), analiza dhe përdorimi (analiza diskriminuese) e klasifikimeve (tipologjive) quhen edhe metoda të njohjes së modeleve (me dhe pa mësues), klasifikimi automatik, etj.

Metodat matematikore në statistikë bazohen ose në përdorimin e shumave (bazuar në Teoremën e Kufirit Qendror të teorisë së probabilitetit) ose në treguesit e diferencës (distancat, metrikat), si në statistikat e objekteve jo numerike. Zakonisht vetëm rezultatet asimptotike vërtetohen në mënyrë rigoroze. Në ditët e sotme kompjuterët luajnë një rol të madh në statistikat matematikore. Ato përdoren si për llogaritjet ashtu edhe për modelimin e simulimit (në veçanti, në metodat e marrjes së mostrave dhe në studimin e përshtatshmërisë së rezultateve asimptotike).

Konceptet bazë të statistikave matematikore

2.1 Konceptet bazë të metodës së kampionimit

Le të jetë një ndryshore e rastësishme e vëzhguar në një eksperiment të rastësishëm. Supozohet se hapësira e probabilitetit është dhënë (dhe nuk do të na interesojë).

Do të supozojmë se, pasi e kemi kryer këtë eksperiment një herë në të njëjtat kushte, kemi marrë numrat , , , - vlerat e kësaj ndryshoreje të rastësishme në të parën, të dytën, etj. eksperimente. Një ndryshore e rastësishme ka një shpërndarje, e cila është pjesërisht ose plotësisht e panjohur për ne.

Le të hedhim një vështrim më të afërt në një grup të quajtur një mostër.

Në një seri eksperimentesh të kryera tashmë, një mostër është një grup numrash. Por nëse kjo seri eksperimentesh përsëritet përsëri, atëherë në vend të këtij grupi do të marrim një grup të ri numrash. Në vend të një numri, do të shfaqet një numër tjetër - një nga vlerat e një ndryshoreje të rastësishme. Kjo do të thotë, (dhe , dhe, etj.) është një variabël që mund të marrë të njëjtat vlera si ndryshorja e rastësishme, dhe po aq shpesh (me të njëjtat probabilitete). Prandaj, para eksperimentit - një ndryshore e rastësishme e shpërndarë në mënyrë të barabartë me , dhe pas eksperimentit - numri që vërejmë në këtë eksperiment të parë, d.m.th. një nga vlerat e mundshme të ndryshores së rastësishme.

Një mostër vëllimi është një grup variablash të rastësishme të pavarura dhe identike të shpërndara ("kopje") që, si dhe , kanë një shpërndarje.

Çfarë do të thotë "të nxjerrësh një përfundim në lidhje me shpërndarjen nga një mostër"? Shpërndarja karakterizohet nga një funksion shpërndarjeje, dendësi ose tabelë, një grup karakteristikash numerike - , , etj. Në bazë të mostrës, duhet të jetë në gjendje të ndërtojë përafërsi për të gjitha këto karakteristika.

.2 Marrja e mostrave

Konsideroni zbatimin e mostrës në një rezultat elementar - një grup numrash , , . Në një hapësirë ​​të përshtatshme probabiliteti, ne prezantojmë një ndryshore të rastësishme duke marrë vlerat, , me probabilitete në (nëse disa nga vlerat përkojnë, ne shtojmë probabilitetet numrin përkatës të herë). Tabela e shpërndarjes së probabilitetit dhe funksioni i shpërndarjes së ndryshoreve të rastësishme duken kështu:

Shpërndarja e një sasie quhet shpërndarja empirike ose e mostrës. Le të llogarisim pritshmërinë matematikore dhe variancën e një sasie dhe të prezantojmë shënimin për këto sasi:

Në të njëjtën mënyrë, ne llogarisim momentin e rendit

Në rastin e përgjithshëm, shënojmë me sasi

Nëse, kur ndërtojmë të gjitha karakteristikat e prezantuara nga ne, ne e konsiderojmë kampionin , , si një grup variablash të rastësishëm, atëherë vetë këto karakteristika - , , , , - do të bëhen variabla të rastit. Këto karakteristika të shpërndarjes së mostrës përdoren për të vlerësuar (përafërt) karakteristikat e panjohura përkatëse të shpërndarjes së vërtetë.

Arsyeja e përdorimit të karakteristikave të shpërndarjes për të vlerësuar karakteristikat e shpërndarjes së vërtetë (ose ) është në afërsinë e këtyre shpërndarjeve për të mëdha.

Konsideroni, për shembull, hedhjen e një jetike të zakonshme. Le - numri i pikëve që ranë në gjuajtjen e -të, . Le të supozojmë se një në mostër do të ndodhë një herë, dy - një herë, e kështu me radhë. Pastaj ndryshorja e rastësishme do të marrë vlerat 1 , , 6 me probabilitete, përkatësisht. Por këto përmasa afrohen me rritjen sipas ligjit të numrave të mëdhenj. Kjo do të thotë, shpërndarja e madhësisë në një farë kuptimi i afrohet shpërndarjes së vërtetë të numrit të pikave që bien kur hidhet koka e saktë.

Ne nuk do të specifikojmë se çfarë nënkuptohet me afërsinë e mostrës dhe shpërndarjet e vërteta. Në paragrafët e mëposhtëm, ne do të hedhim një vështrim më të afërt në secilën nga karakteristikat e paraqitura më sipër dhe do të shqyrtojmë vetitë e tij, duke përfshirë sjelljen e tij me rritjen e madhësisë së mostrës.

.3 Funksioni empirik i shpërndarjes, histogrami

Meqenëse shpërndarja e panjohur mund të përshkruhet, për shembull, nga funksioni i saj i shpërndarjes, ne do të ndërtojmë një "vlerësim" për këtë funksion nga mostra.

Përkufizimi 1.

Një funksion i shpërndarjes empirike i ndërtuar mbi një mostër vëllimi quhet funksion i rastësishëm, për çdo të barabartë

Përkujtues: funksion i rastësishëm

quhet tregues i ngjarjes. Për secilën, kjo është një ndryshore e rastësishme që ka një shpërndarje Bernoulli me parametër . pse?

Me fjalë të tjera, për çdo vlerë prej , e barabartë me probabilitetin e vërtetë që ndryshorja e rastësishme të jetë më e vogël se , përqindja e elementeve të mostrës më e vogël se çmuar.

Nëse elementët e mostrës, , renditen në rend rritës (për çdo rezultat elementar), do të merret një grup i ri variablash të rastësishëm, të quajtur seri variacionesh:

Elementi , , quhet anëtari i th i serisë variacionale ose statistika e rendit të th .

Shembulli 1

Shembull:

Seritë e variacioneve:

Oriz. një. Shembulli 1

Funksioni i shpërndarjes empirike ka kërcime në pikat e mostrës, vlera e kërcimit në pikë është , ku është numri i elementeve të mostrës që përputhen me .

Mund të ndërtohet funksion empirik shpërndarja sipas serisë së variacioneve:

Një karakteristikë tjetër e shpërndarjes është tabela (për shpërndarje diskrete) ose dendësia (për absolutisht të vazhdueshme). Një analog empirik ose selektiv i një tabele ose densiteti është i ashtuquajturi histogram.

Histogrami bazohet në të dhëna të grupuara. Gama e vlerësuar e vlerave të një ndryshoreje të rastësishme (ose diapazoni i të dhënave të mostrës) ndahet, pavarësisht nga kampioni, në një numër të caktuar intervalesh (jo domosdoshmërisht të njëjta). Le të jenë , , intervale në linjë, të quajtur intervale grupimi . Le të shënojmë me numrin e elementeve të mostrës që bien në intervalin:

(1)

Në secilin prej intervaleve, ndërtohet një drejtkëndësh, sipërfaqja e së cilës është në përpjesëtim me. Sipërfaqja totale e të gjithë drejtkëndëshave duhet të jetë e barabartë me një. Le të jetë gjatësia e intervalit. Lartësia e drejtkëndëshit sipër është

Shifra që rezulton quhet histogram.

Shembulli 2

Në dispozicion seri variacionesh(shih shembullin 1):

Këtu është logaritmi dhjetor, pra, d.m.th. kur kampioni dyfishohet, numri i intervaleve të grupimit rritet me 1. Vini re se sa më shumë intervale grupimi, aq më mirë. Por, nëse marrim numrin e intervaleve, të themi, të rendit të , atëherë me rritjen histogrami nuk do t'i afrohet densitetit.

Deklarata e mëposhtme është e vërtetë:

Nëse dendësia e mostrës është funksion të vazhdueshëm, atëherë për në mënyrë që të bëhet konvergjenca pikësore në probabilitetin e histogramit me densitetin.

Pra, zgjedhja e logaritmit është e arsyeshme, por jo e vetmja e mundshme.

konkluzioni

Statistikat matematikore (ose teorike) bazohen në metodat dhe konceptet e teorisë së probabilitetit, por në një farë kuptimi zgjidh probleme të anasjellta.

Nëse vëzhgojmë shfaqjen e njëkohshme të dy (ose më shumë) shenjave, d.m.th. ne kemi një grup vlerash të disa ndryshoreve të rastësishme - çfarë mund të thuhet për varësinë e tyre? A është ajo atje apo jo? Dhe nëse po, çfarë është kjo varësi?

Shpesh është e mundur të bëhen disa supozime për shpërndarjen e fshehur në "kutinë e zezë" ose për vetitë e saj. Në këtë rast, sipas të dhënave eksperimentale, kërkohet të konfirmohen ose hedhin poshtë këto supozime ("hipoteza"). Në të njëjtën kohë, duhet të kujtojmë se përgjigjja "po" ose "jo" mund të jepet vetëm me një shkallë të caktuar sigurie dhe sa më gjatë të vazhdojmë eksperimentin, aq më të sakta mund të jenë përfundimet. Situata më e favorshme për hulumtim është kur mund të pohohet me siguri për disa veti të eksperimentit të vëzhguar - për shembull, për praninë e një varësie funksionale midis sasive të vëzhguara, për normalitetin e shpërndarjes, për simetrinë e tij, për praninë e dendësia në shpërndarje ose për natyrën e saj diskrete, etj.

Pra, ka kuptim të mbani mend për statistikat (matematikore) nëse

ekziston një eksperiment i rastësishëm, vetitë e të cilit janë pjesërisht ose plotësisht të panjohura,

Ne jemi në gjendje ta riprodhojmë këtë eksperiment në të njëjtat kushte disa (ose më mirë, çdo) disa herë.

Bibliografi

1. Baumol U. Teoria ekonomike dhe kërkimin e operacioneve. - M.; Shkencë, 1999.

2. Bolshev L.N., Smirnov N.V. Tabelat e statistikave matematikore. Moskë: Nauka, 1995.

3. Borovkov A.A. Statistikat e matematikës. Moskë: Nauka, 1994.

4. Korn G., Korn T. Manual i matematikës për shkencëtarë dhe inxhinierë. - Shën Petersburg: Shtëpia Botuese Lan, 2003.

5. Korshunov D.A., Chernova N.I. Mbledhja e detyrave dhe ushtrimeve në statistikat matematikore. Novosibirsk: Shtëpia Botuese e Institutit të Matematikës. S.L. Sobolev SB RAS, 2001.

6. Peheletsky I.D. Matematika: Libër mësuesi për nxënës. - M.: Akademia, 2003.

7. Sukhodolsky V.G. Leksione për matematikën e lartë për shkencat humane. - Shtëpia Botuese e Shën Petersburgut të Shën Petersburgut Universiteti Shtetëror. 2003

8. Feller V. Hyrje në teorinë e probabilitetit dhe aplikimet e saj. - M.: Mir, T.2, 1984.

9. Harman G., Analiza moderne e faktorëve. - M.: Statistikat, 1972.


Harman G., Analiza moderne e faktorëve. - M.: Statistikat, 1972.

Statistikat matematikore janë një nga seksionet kryesore të një shkence të tillë si matematika, dhe është një degë që studion metodat dhe rregullat për përpunimin e të dhënave të caktuara. Me fjalë të tjera, ai eksploron mënyra për të zbuluar modele që janë të natyrshme në koleksione të mëdha të objekteve identike, bazuar në studimin e tyre të mostrës.

Një detyrë këtë seksion konsiston në ndërtimin e metodave për vlerësimin e probabilitetit ose marrjen e një vendimi të caktuar për natyrën e ngjarjeve në zhvillim, bazuar në rezultatet e marra. Për të përshkruar të dhënat përdoren tabelat, grafikët dhe fushat e korrelacionit. aplikohet rrallë.

Statistikat matematikore përdoren në fusha të ndryshme të shkencës. Për shembull, është e rëndësishme që ekonomia të përpunojë informacione rreth grupeve homogjene të fenomeneve dhe objekteve. Ato mund të jenë produkte të prodhuara nga industria, personeli, të dhënat e fitimit etj. Në varësi të natyrës matematikore të rezultateve të vëzhgimeve, mund të veçohen statistikat e numrave, analizat e funksioneve dhe objekteve të natyrës jo numerike dhe shumëdimensionale. analiza. Përveç kësaj, ata konsiderojnë detyra të përgjithshme dhe të veçanta (të lidhura me rivendosjen e varësive, përdorimin e klasifikimeve, studimet selektive).

Autorët e disa teksteve mendojnë se teoria e statistikave matematikore është vetëm një pjesë e teorisë së probabilitetit, ndërsa të tjerë besojnë se ajo është një shkencë e pavarur me qëllimet, objektivat dhe metodat e veta. Sidoqoftë, në çdo rast, përdorimi i tij është shumë i gjerë.

Kështu, statistikat matematikore janë më qartë të zbatueshme në psikologji. Përdorimi i tij do t'i lejojë specialistit të vërtetojë saktë, të gjejë marrëdhëniet midis të dhënave, t'i përgjithësojë ato, të shmangë shumë gabime logjike dhe shumë më tepër. Duhet të theksohet se shpesh është thjesht e pamundur të matet ky apo ai fenomen psikologjik ose tipari i personalitetit pa procedura llogaritëse. Kjo sugjeron që bazat e kësaj shkence janë të nevojshme. Me fjalë të tjera, mund të quhet burimi dhe baza e teorisë së probabilitetit.

Metoda e hulumtimit, e cila mbështetet në marrjen në konsideratë të të dhënave statistikore, përdoret në fusha të tjera. Sidoqoftë, duhet të theksohet menjëherë se tiparet e tij, kur zbatohen për objekte të një natyre të ndryshme origjine, janë gjithmonë unike. Prandaj, nuk ka kuptim të kombinosh shkencën fizike në një shkencë. Karakteristikat e përbashkëta këtë metodë reduktohen në numërimin e një numri të caktuar objektesh që përfshihen në një grup të caktuar, si dhe studimin e shpërndarjes tipare sasiore dhe aplikimi i teorisë së probabilitetit për të marrë përfundime të caktuara.

Elementet e statistikave matematikore përdoren në fusha të tilla si fizika, astronomia, etj. Këtu mund të vlerësohen vlerat e karakteristikave dhe parametrave, hipotezat për koincidencën e ndonjë karakteristike në dy mostra, për simetrinë e shpërndarjes dhe shumë më tepër. konsiderohen.

Statistikat matematikore luajnë një rol të rëndësishëm në sjelljen e tyre.qëllimi i tyre më së shpeshti është ndërtimi i metodave adekuate për vlerësimin dhe testimin e hipotezave. Aktualisht, teknologjitë kompjuterike kanë një rëndësi të madhe në këtë shkencë. Ato lejojnë jo vetëm të thjeshtojnë ndjeshëm procesin e llogaritjes, por edhe të krijojnë mostra për përsëritje ose kur studiojnë përshtatshmërinë e rezultateve të marra në praktikë.

Në rastin e përgjithshëm, metodat e statistikave matematikore ndihmojnë për të nxjerrë dy përfundime: ose për të bërë gjykimin e dëshiruar për natyrën ose vetitë e të dhënave që studiohen dhe marrëdhëniet e tyre, ose për të vërtetuar se rezultatet e marra nuk janë të mjaftueshme për të nxjerrë përfundime.


përmbajtja.

1. Hyrje:
- Si përdoren statistikat e probabilitetit dhe matematikës? - faqe 2
- Çfarë është "statistika matematikore"? - faqe 3
2) Shembuj të zbatimit të teorisë së probabilitetit dhe statistikave matematikore:
- Përzgjedhja. - faqe 4
- Detyrat e vlerësimit. – faqe 6
- Metodat probabilistiko-statistikore dhe optimizimi. – faqe 7
3) Përfundim.

Prezantimi.

Si përdoren statistikat e probabilitetit dhe matematikës? Këto disiplina janë baza e metodave probabilistiko-statistikore të vendimmarrjes. Për të përfituar prej tyre aparate matematikore, është e nevojshme të shprehen problemet e vendimmarrjes në terma të modeleve probabilistiko-statistikore. Aplikimi i një metode specifike të vendimmarrjes probabilistiko-statistikore përbëhet nga tre faza:
- kalimi nga realiteti ekonomik, menaxherial, teknologjik në një skemë abstrakte matematikore dhe statistikore, d.m.th. ndërtimi i një modeli probabilistik të një sistemi kontrolli, një procesi teknologjik, një procedurë vendimmarrjeje, veçanërisht bazuar në rezultatet e kontrollit statistikor, etj.
- kryerja e llogaritjeve dhe nxjerrja e përfundimeve me mjete thjesht matematikore në kuadrin e një modeli probabilistik;
- interpretimi i përfundimeve matematikore dhe statistikore në lidhje me një situatë reale dhe marrja e një vendimi të duhur (për shembull, për përputhjen ose mospërputhjen e cilësisë së produktit me kërkesat e vendosura, nevojën për të rregulluar procesin teknologjik, etj.), në veçanti. , përfundimi (për proporcionin e njësive të dëmtuara të produkteve në një grumbull, mbi formën specifike të ligjeve të shpërndarjes së parametrave të kontrolluar të procesit teknologjik, etj.).

Statistikat matematikore përdorin konceptet, metodat dhe rezultatet e teorisë së probabilitetit. Le të shqyrtojmë çështjet kryesore të ndërtimit të modeleve probabiliste të vendimmarrjes në situata ekonomike, menaxheriale, teknologjike dhe të tjera. Për përdorimin aktiv dhe korrekt të dokumenteve normativo-teknike dhe udhëzuese-metodike mbi metodat probabilistiko-statistikore të vendimmarrjes nevojiten njohuri paraprake. Pra, është e nevojshme të dihet se në cilat kushte duhet të zbatohet një ose një dokument tjetër, çfarë informacioni fillestar duhet të ketë për zgjedhjen dhe zbatimin e tij, çfarë vendimesh duhet të merren në bazë të rezultateve të përpunimit të të dhënave, etj.

Çfarë është "statistika matematikore"? Statistikat matematikore kuptohen si “një degë e matematikës që i kushtohet metodave matematikore të mbledhjes, sistemimit, përpunimit dhe interpretimit të të dhënave statistikore, si dhe përdorimit të tyre për përfundime shkencore ose praktike. Rregullat dhe procedurat e statistikave matematikore bazohen në teorinë e probabilitetit, e cila bën të mundur vlerësimin e saktësisë dhe besueshmërisë së përfundimeve të marra në çdo problem në bazë të materialit statistikor në dispozicion. Në të njëjtën kohë, të dhënat statistikore i referohen informacionit për numrin e objekteve në një koleksion pak a shumë të gjerë që kanë karakteristika të caktuara.

Sipas llojit të problemeve që zgjidhen, statistikat matematikore zakonisht ndahen në tre seksione: përshkrimi i të dhënave, vlerësimi dhe testimi i hipotezave.

Sipas llojit të të dhënave statistikore që përpunohen, statistikat matematikore ndahen në katër fusha:

Statistikat njëdimensionale (statistikat e variablave të rastit), në të cilat rezultati i një vëzhgimi përshkruhet me një numër real;

Analiza statistikore me shumë variacione, ku rezultati i vëzhgimit të një objekti përshkruhet me disa numra (vektor);

Statistikat e proceseve të rastësishme dhe seritë kohore, ku rezultati i vëzhgimit është një funksion;

Statistikat e objekteve të natyrës jo numerike, në të cilat rezultati i një vëzhgimi është i një natyre jo numerike, për shembull, është një grup (një figurë gjeometrike), një renditje ose e marrë si rezultat i një matjeje nga një atribut cilësor.

Shembuj të aplikimit të teorisë së probabilitetit dhe statistikave matematikore.
Le të shqyrtojmë disa shembuj ku modelet probabilistiko-statistikore janë një mjet i mirë për zgjidhjen e problemeve menaxheriale, industriale, ekonomike dhe ekonomike kombëtare. Pra, për shembull, një monedhë që përdoret si shumë duhet të jetë "simetrike", d.m.th. kur hidhet, mesatarisht, në gjysmën e rasteve, stema duhet të bjerë jashtë, dhe në gjysmën e rasteve - grila (bishti, numri). Por çfarë do të thotë "mesatare"? Nëse kaloni shumë seri prej 10 hedhjesh në secilën seri, atëherë shpesh do të ketë seri në të cilat një monedhë bie 4 herë me një stemë. Për një monedhë simetrike, kjo do të ndodhë në 20.5% të serisë. Dhe nëse ka 40,000 stema për 100,000 hedhje, a mund të konsiderohet monedha simetrike? Procedura e vendimmarrjes bazohet në teorinë e probabilitetit dhe statistikat matematikore.

Shembulli në shqyrtim mund të mos duket mjaft serioz. Megjithatë, nuk është kështu. Tërheqja e shortit përdoret gjerësisht në organizimin e eksperimenteve të fizibilitetit industrial, për shembull, kur përpunohen rezultatet e matjes së indeksit të cilësisë (momenti i fërkimit) të kushinetave në varësi të faktorëve të ndryshëm teknologjikë (ndikimi i një mjedisi të ruajtjes, metodat e përgatitjes së kushinetave para matjes , efekti i ngarkesës mbajtëse në procesin e matjes etj.) P.). Supozoni se është e nevojshme të krahasohet cilësia e kushinetave në varësi të rezultateve të ruajtjes së tyre në vajra të ndryshëm ruajtjeje, d.m.th. në vajrat e përbërjes A dhe B. Kur planifikohet një eksperiment i tillë, lind pyetja se cilat kushineta duhet të vendosen në përbërjen e vajit A, dhe cilat - në përbërjen e vajit B, por në mënyrë të tillë që të shmanget subjektiviteti dhe të sigurohet objektiviteti i vendim.

Mostra
Përgjigja për këtë pyetje mund të merret me short. Një shembull i ngjashëm mund të jepet me kontrollin e cilësisë së çdo produkti. Për të vendosur nëse një grup i inspektuar i produkteve plotëson apo jo kërkesat e përcaktuara, merret një mostër prej saj. Bazuar në rezultatet e kontrollit të mostrës, është bërë një përfundim për të gjithë grupin. Në këtë rast, është shumë e rëndësishme që të shmanget subjektiviteti në formimin e kampionit, pra është e nevojshme që çdo njësi e produktit në lotin e kontrolluar të ketë të njëjtën probabilitet për t'u përzgjedhur në kampion. Në kushtet e prodhimit, zgjedhja e njësive të prodhimit në mostër zakonisht kryhet jo me short, por me tabela të veçanta të numrave të rastit ose me ndihmën e gjeneratorëve kompjuterikë të numrave të rastit.
Probleme të ngjashme të sigurimit të objektivitetit të krahasimit lindin kur krahasohen skema të ndryshme për organizimin e prodhimit, shpërblimit, gjatë mbajtjes së tenderëve dhe konkurseve, përzgjedhjes së kandidatëve për pozita të lira, etj. Kudo keni nevojë për llotari apo procedura të ngjashme. Le të shpjegojmë duke përdorur shembullin e identifikimit të ekipit më të fortë dhe të dytë më të fortë në organizimin e një turneu sipas sistemit olimpik (humbësi eliminohet). Le të fitojë gjithmonë skuadra më e fortë ndaj më të dobëtit. Është e qartë se skuadra më e fortë do të dalë patjetër kampion. Skuadra e dytë më e fortë do të arrijë në finale nëse dhe vetëm nëse nuk ka ndeshje me kampionin e ardhshëm përpara finales. Nëse planifikohet një lojë e tillë, atëherë skuadra e dytë më e fortë nuk do të arrijë në finale. Ai që planifikon turneun mundet ose të "nokautojë" skuadrën e dytë më të fortë nga turneu përpara afatit, duke e rrëzuar atë në takimin e parë me liderin, ose të sigurojë vendin e dytë, duke siguruar takime me ekipe më të dobëta deri në finale. Për të shmangur subjektivitetin, hidhni short. Për një turne me 8 ekipe, probabiliteti që dy skuadrat më të forta të takohen në finale është 4/7. Prandaj, me një probabilitet prej 3/7, skuadra e dytë më e fortë do të largohet nga turneu para afatit.
Në çdo matje të njësive të produktit (duke përdorur një kaliper, mikrometër, ampermetër, etj.), Ka gabime. Për të zbuluar nëse ka gabime sistematike, është e nevojshme të bëhen matje të përsëritura të një njësie produkti, karakteristikat e së cilës janë të njohura (për shembull, një mostër standarde). Duhet mbajtur mend se përveç gabimit sistematik, ekziston edhe një gabim i rastësishëm.

Prandaj, lind pyetja se si të zbulohet nga rezultatet e matjeve nëse ka një gabim sistematik. Nëse vërejmë vetëm nëse gabimi i marrë gjatë matjes së radhës është pozitiv apo negativ, atëherë ky problem mund të reduktohet në atë të mëparshëm. Në të vërtetë, le të krahasojmë matjen me hedhjen e një monedhe, gabimin pozitiv - me humbjen e stemës, negativin - me grilë (gabim zero me një numër të mjaftueshëm ndarjesh të shkallës pothuajse nuk ndodh kurrë). Pastaj kontrollimi i mungesës së një gabimi sistematik është i barabartë me kontrollin e simetrisë së monedhës.

Qëllimi i këtyre konsideratave është të zvogëlojë problemin e kontrollit të mungesës së një gabimi sistematik në problemin e kontrollit të simetrisë së një monedhe. Arsyetimi i mësipërm çon në të ashtuquajturin "kriteri i shenjave" në statistikat matematikore.
"Testi i shenjës" - një test statistikor që ju lejon të testoni hipotezën zero se kampioni i bindet shpërndarjes binomiale me parametrin p=1/2 . Testi i shenjës mund të përdoret si një test statistikor joparametrik për të testuar hipotezën se mediana është e barabartë me një vlerë të caktuar (në veçanti zero), si dhe mungesën e një zhvendosjeje (pa efekt përpunimi) në dy mostra të lidhura. . Gjithashtu ju lejon të testoni hipotezën e simetrisë së shpërndarjes, por ka kritere më të fuqishme për këtë - testi Wilcoxon me një mostër dhe modifikimet e tij.

Në rregullimin statistikor të proceseve teknologjike, bazuar në metodat e statistikave matematikore, zhvillohen rregulla dhe plane për kontrollin statistikor të proceseve, që synojnë zbulimin në kohë të çrregullimeve të proceseve teknologjike dhe marrjen e masave për rregullimin e tyre dhe parandalimin e lëshimit të produkteve që bëjnë. nuk plotësojnë kërkesat e përcaktuara. Këto masa kanë për qëllim reduktimin e kostove të prodhimit dhe humbjeve nga furnizimi me produkte me cilësi të ulët. Me kontrollin e pranimit statistikor, bazuar në metodat e statistikave matematikore, hartohen planet e kontrollit të cilësisë duke analizuar mostrat nga grupet e produkteve. Vështirësia qëndron në aftësinë për të ndërtuar saktë modele të vendimmarrjes probabilistiko-statistikore, mbi bazën e të cilave është e mundur t'u përgjigjemi pyetjeve të parashtruara më sipër. Në statistikat matematikore, për këtë janë zhvilluar modele dhe metoda probabilistike për testimin e hipotezave, në veçanti, hipotezat që proporcioni i njësive të dëmtuara të prodhimit është i barabartë me një numër të caktuar p0, për shembull, p0 = 0.23.

Detyrat e vlerësimit.
Në një numër situatash menaxheriale, industriale, ekonomike, ekonomike kombëtare, lindin probleme të një lloji tjetër - probleme të vlerësimit të karakteristikave dhe parametrave të shpërndarjeve të probabilitetit.

Konsideroni një shembull. Lëreni në kontroll një grup N llambash elektrike. Një kampion prej n llambash elektrike u zgjodh rastësisht nga kjo grumbull. Ngrihen një sërë pyetjesh të natyrshme. Si mund të përcaktohet jeta mesatare e shërbimit të llambave elektrike nga rezultatet e testimit të elementeve të mostrës dhe me çfarë saktësie mund të vlerësohet kjo karakteristikë? Si ndryshon saktësia nëse merret një mostër më e madhe? Në cilin numër orëve T mund të garantohet që të paktën 90% e llambave elektrike do të zgjasin T ose më shumë orë?

Supozoni se gjatë testimit të një kampioni prej n llambash elektrike, X llambat elektrike rezultuan të dëmtuara. Atëherë lindin pyetjet e mëposhtme. Çfarë kufijsh mund të specifikohen për numrin D të llambave elektrike me defekt në një grup, për nivelin e defektit D/N, etj.?

Ose, në një analizë statistikore të saktësisë dhe stabilitetit të proceseve teknologjike, është e nevojshme të vlerësohen tregues të tillë të cilësisë si vlera mesatare e parametrit të kontrolluar dhe shkalla e përhapjes së tij në procesin në shqyrtim. Sipas teorisë së probabilitetit, këshillohet të përdoret pritshmëria e saj matematikore si vlerë mesatare e një ndryshoreje të rastësishme dhe varianca, devijimi standard ose koeficienti i variacionit si një karakteristikë statistikore e përhapjes. Kjo shtron pyetjen: si të vlerësohen këto karakteristika statistikore nga të dhënat e mostrës dhe me çfarë saktësie mund të bëhet kjo? Ka shumë shembuj të ngjashëm. Këtu ishte e rëndësishme të tregohej se si teoria e probabilitetit dhe statistikat matematikore mund të përdoren në menaxhimin e prodhimit kur merren vendime në fushën e menaxhimit statistikor të cilësisë së produktit.

Metodat probabilistiko-statistikore dhe optimizimi. Ideja e optimizimit përshkon statistikat moderne të aplikuara matematikore dhe metoda të tjera statistikore. Domethënë, metodat e planifikimit të eksperimenteve, kontrolli statistikor i pranimit, kontrolli statistikor i proceseve teknologjike, etj. Nga ana tjetër, formulimet e optimizimit në teorinë e vendimeve, për shembull, teoria e aplikuar e optimizimit të cilësisë së produktit dhe kërkesat standarde, parashikojnë përdorimin e gjerë të metoda probabilistiko-statistikore, kryesisht statistika matematikore e aplikuar.

Në menaxhimin e prodhimit, në veçanti, kur optimizoni cilësinë e produktit dhe kërkesat standarde, është veçanërisht e rëndësishme të aplikoni metoda statistikore në fazën fillestare. cikli i jetes produkte, d.m.th. në fazën e përgatitjes kërkimore të zhvillimeve të projektimit eksperimental (zhvillimi i kërkesave premtuese për produktet, dizajni paraprak, termat e referencës për zhvillimin e dizajnit eksperimental). Kjo është për shkak të informacionit të kufizuar të disponueshëm në fazën fillestare të ciklit jetësor të produktit dhe nevojës për të parashikuar mundësitë teknike dhe situatën ekonomike për të ardhmen. Metodat statistikore duhet të zbatohen në të gjitha fazat e zgjidhjes së një problemi optimizimi - gjatë shkallëzimit të variablave, zhvillimit të modeleve matematikore për funksionimin e produkteve dhe sistemeve, kryerjes së eksperimenteve teknike dhe ekonomike, etj.

Në problemet e optimizimit, duke përfshirë optimizimin e cilësisë së produktit dhe kërkesat standarde, përdoren të gjitha fushat e statistikave. Gjegjësisht, statistikat e variablave të rastësishëm, analiza statistikore multivariate, statistikat e proceseve të rastësishme dhe seritë kohore, statistikat e objekteve të natyrës jo numerike. Zgjedhja e një metode statistikore për analizën e të dhënave specifike duhet të bëhet sipas rekomandimeve.

konkluzioni.
AT
etj.................

Çdo hetim në fushën e dukurive të rastësishme është gjithmonë i rrënjosur në eksperiment, në të dhëna eksperimentale. Të dhënat numerike që mblidhen gjatë studimit të ndonjë veçorie të ndonjë objekti quhen statistikore. Të dhënat statistikore janë materiali fillestar i studimit. Që të kenë vlerë shkencore ose praktike, duhet të përpunohen me metoda të statistikave matematikore.

Statistikat e matematikësështë një disiplinë shkencore, lënda e së cilës është zhvillimi i metodave për regjistrimin, përshkrimin dhe analizimin e të dhënave statistikore eksperimentale të marra si rezultat i vëzhgimeve të dukurive masive të rastësishme.

Detyrat kryesore të statistikave matematikore janë:

    përcaktimi i ligjit të shpërndarjes së një ndryshoreje të rastësishme ose një sistemi të ndryshoreve të rastit;

    testimi i besueshmërisë së hipotezave;

    përcaktimi i parametrave të panjohur të shpërndarjes.

Të gjitha metodat e statistikave matematikore bazohen në teorinë e probabilitetit. Megjithatë, për shkak të specifikës së problemeve që zgjidhen, statistikat matematikore ndahen nga teoria e probabilitetit në një fushë të pavarur. Nëse në teorinë e probabilitetit modeli i fenomenit konsiderohet i dhënë dhe llogaritet ecuria e mundshme reale e këtij fenomeni (Fig. 1), atëherë në statistikat matematikore zgjidhet një model i përshtatshëm teorik dhe probabilistik bazuar në të dhënat statistikore (Fig. . 2).

Fig.1. Problemi i përgjithshëm i teorisë së probabilitetit

Fig.2. Problemi i përgjithshëm i statistikave matematikore

Si disiplinë shkencore, statistikat matematikore u zhvilluan së bashku me teorinë e probabilitetit. Aparati matematikor i kësaj shkence u ndërtua në gjysmën e dytë të shekullit të 19-të.

2. Popullata e përgjithshme dhe mostra.

Për të studiuar metodat statistikore, futen konceptet e popullatave të përgjithshme dhe të mostrës. Në përgjithësi, nën popullata e përgjithshme kuptohet si një ndryshore e rastësishme X me funksionin e shpërndarjes
. Një grup mostër ose një mostër e vëllimit n për një ndryshore të rastësishme të dhënë X është një grup
vëzhgime të pavarura të kësaj sasie, ku quhet vlera e mostrës ose zbatimi i ndryshores së rastësishme X. Në këtë mënyrë, mund të konsiderohen si numra (nëse eksperimenti kryhet dhe kampioni është marrë) dhe si variabla të rastësishëm (para eksperimentit), pasi ato ndryshojnë nga kampioni në kampion.

Shembulli 1. Për të përcaktuar varësinë e trashësisë së një trungu peme nga lartësia e tij, u zgjodhën 200 pemë. Në këtë rast, madhësia e kampionit është n=200.

Shembulli 2 Si rezultat i sharrimit të pllakave të grimcave në një sharrë rrethore, u përftuan 15 vlera të punës specifike të prerjes. Në këtë rast, n=15.

D
Për të gjykuar me besim tiparin e popullatës së përgjithshme që na intereson sipas të dhënave të mostrës, objektet e kampionit duhet ta përfaqësojnë saktë atë, domethënë, kampioni duhet të jetë përfaqësuese(përfaqësues). Përfaqësueshmëria e kampionit zakonisht arrihet me përzgjedhje të rastësishme të objekteve: secilit objekt të popullatës së përgjithshme i sigurohet një probabilitet i barabartë për t'u përfshirë në kampion me të gjithë të tjerët.

Fig.3. Demonstrimi i përfaqësimit të mostrës