Pod matematičkom statistikom se podrazumijeva „grana matematike koja se bavi matematičkim metodama prikupljanja, sistematizacije, obrade i tumačenja statističkih podataka, kao i njihovog korištenja za naučne ili praktične zaključke. Pravila i procedure matematičke statistike zasnivaju se na teoriji vjerovatnoće, koja omogućava procjenu tačnosti i pouzdanosti zaključaka dobijenih u svakom problemu na osnovu raspoloživog statističkog materijala. Istovremeno, statistički podaci se odnose na podatak o broju objekata u bilo kojoj manje ili više obimnoj zbirci koji imaju određene karakteristike.

Prema vrsti problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteza.

Prema vrsti statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

— jednodimenzionalna statistika (stat slučajne varijable), u kojem je rezultat posmatranja opisan realnim brojem;

- višedimenzionalni Statistička analiza, pri čemu je rezultat posmatranja nad objektom opisan sa nekoliko brojeva (vektora);

- statistika slučajnih procesa i vremenskih serija, gdje je rezultat posmatranja funkcija;

- statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, to je skup (geometrijska figura), poređan ili dobiven kao rezultat mjerenja kvalitativnim atributom.

Istorijski gledano, najprije su se pojavile neke oblasti statistike objekata nenumeričke prirode (posebno problemi procjene procenta braka i testiranja hipoteza o tome) i jednodimenzionalne statistike. Matematički aparat njima je lakše, pa njihov primjer obično demonstrira osnovne ideje matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika je zasnovana na dokazima, koja je zasnovana na probabilističkim modelima relevantnih stvarnih pojava i procesa. Radi se o o modelima ponašanja potrošača, nastanku rizika, funkcionisanju tehnološke opreme, dobijanju rezultata eksperimenta, toku bolesti itd. Vjerovatni model realnog fenomena treba smatrati izgrađenim ako su veličine koje se razmatraju i odnosi između njih izraženi u terminima teorije vjerovatnoće.

Korespondencija sa probabilističkim modelom stvarnosti, tj. njegova adekvatnost se potkrepljuje, posebno, uz pomoć statističkih metoda za testiranje hipoteza.

Nevjerovatne metode obrade podataka su istraživačke, mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućavaju procjenu tačnosti i pouzdanosti zaključaka dobijenih na osnovu ograničenog statističkog materijala.

Probabilističke i statističke metode primjenjive su gdje god je moguće konstruirati i potkrijepiti probabilistički model pojave ili procesa. Njihova upotreba je obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda).

U određenim oblastima primjene koriste se kako vjerovatno-statističke metode široke primjene, tako i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama kontrole kvaliteta proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Uz pomoć njegovih metoda vrši se statistička analiza tačnosti i stabilnosti tehnoloških procesa i statistička evaluacija kvaliteta. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvaliteta proizvoda, statističke regulacije tehnoloških procesa, procjene i kontrole pouzdanosti itd.

Takve primijenjene probabilističko-statističke discipline kao što su teorija pouzdanosti i teorija čekanja imaju široku primjenu. Sadržaj prvog od njih je jasan iz naziva, drugi proučava sisteme kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevi pretplatnika koji biraju brojeve na svojim telefonima. Trajanje usluge ovih zahtjeva, tj. trajanje razgovora je također modelirano slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije nauka SSSR-a A.Ya. Khinčin (1894-1959), akademik Akademije nauka Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći naučnici.

Svako istraživanje u oblasti slučajnih pojava uvijek je ukorijenjeno u eksperimentu, u eksperimentalnim podacima. Numerički podaci koji se prikupljaju prilikom proučavanja bilo koje karakteristike nekog objekta nazivaju se statistički. Statistički podaci su početni materijal studije. Da bi imali naučnu ili praktičnu vrijednost, moraju se obraditi metodama matematičke statistike.

Math statistics je naučna disciplina čiji je predmet razvoj metoda za snimanje, opisivanje i analizu statističkih eksperimentalnih podataka dobijenih kao rezultat posmatranja masivnih slučajnih pojava.

Glavni zadaci matematičke statistike su:

    utvrđivanje zakona distribucije slučajne varijable ili sistema slučajnih varijabli;

    testiranje vjerodostojnosti hipoteza;

    određivanje nepoznatih parametara distribucije.

Sve metode matematičke statistike zasnovane su na teoriji vjerovatnoće. Međutim, zbog specifičnosti problema koji se rješavaju, matematička statistika je odvojena od teorije vjerovatnoće u samostalnu oblast. Ako se u teoriji vjerovatnoće razmatra dati model pojave i izračuna se mogući stvarni tok ove pojave (slika 1), onda se u matematičkoj statistici na osnovu statističkih podataka bira odgovarajući vjerovatnostni model (slika 2).

Fig.1. Opšti problem teorije vjerovatnoće

Fig.2. Opšti problem matematičke statistike

Kao naučna disciplina, matematička statistika se razvijala zajedno sa teorijom vjerovatnoće. Matematički aparat ove nauke izgrađen je u drugoj polovini 19. veka.

2. Opća populacija i uzorak.

Za proučavanje statističkih metoda uvode se koncepti opće populacije i populacije uzorka. Općenito, pod opšta populacija se shvata kao slučajna varijabla X sa funkcijom distribucije
. Skup uzoraka ili uzorak volumena n za datu slučajnu varijablu X je skup
nezavisna posmatranja ove veličine, gde naziva se vrijednost uzorka ili implementacija slučajne varijable X. Na ovaj način, mogu se posmatrati kao brojevi (ako je eksperiment izveden i uzet uzorak) i kao slučajne varijable (prije eksperimenta), budući da variraju od uzorka do uzorka.

Primjer 1. Za utvrđivanje zavisnosti debljine stabla od njegove visine odabrano je 200 stabala. U ovom slučaju, veličina uzorka je n=200.

Primjer 2 Kao rezultat piljenja iverice na kružnoj pili, dobijeno je 15 vrijednosti specifičnog rada rezanja. U ovom slučaju, n=15.

D
Da bismo na osnovu podataka uzorka pouzdano prosuđivali obilježje opće populacije koja nas zanima, objekti uzorka to moraju ispravno reprezentirati, odnosno uzorak mora biti predstavnik(predstavnik). Reprezentativnost uzorka obično se postiže slučajnim odabirom objekata: svakom objektu opće populacije obezbjeđuje se jednaka vjerovatnoća da bude uključen u uzorak sa svim ostalima.

Fig.3. Demonstracija reprezentativnosti uzorka

Math statistics je jedan od glavnih odjeljaka takve nauke kao što je matematika, i grana je koja proučava metode i pravila za obradu određenih podataka. Drugim riječima, istražuje načine otkrivanja obrazaca koji su svojstveni velikim zbirkama identičnih objekata, na osnovu istraživanja uzorka.

Zadatak ovaj odeljak sastoji se u konstruisanju metoda za procenu verovatnoće ili donošenja određene odluke o prirodi događaja u razvoju, na osnovu dobijenih rezultata. Za opisivanje podataka koriste se tabele, grafikoni i polja korelacije. rijetko se primjenjuje.

Matematička statistika se koristi u raznim oblastima nauka. Na primjer, za privredu je važno da obrađuje informacije o homogenim skupovima pojava i objekata. To mogu biti proizvodi koje proizvodi industrija, kadrovi, podaci o dobiti itd. U zavisnosti od matematičke prirode rezultata posmatranja izdvaja se statistika brojeva, analiza funkcija i objekata nenumeričke prirode i višedimenzionalne prirode. analiza. Osim toga, oni razmatraju opšte i posebne (vezane za obnavljanje zavisnosti, korištenje klasifikacija, selektivne studije) zadatke.

Autori nekih udžbenika smatraju da je teorija matematičke statistike samo dio teorije vjerovatnoće, dok drugi smatraju da je to samostalna nauka sa svojim ciljevima, ciljevima i metodama. Međutim, u svakom slučaju, njegova upotreba je vrlo široka.

Dakle, matematička statistika je najjasnije primjenjiva u psihologiji. Njegova upotreba će omogućiti stručnjaku da ispravno potkrijepi, pronađe odnos između podataka, generalizira ih, izbjegne mnoge logičke greške i još mnogo toga. Treba napomenuti da je često jednostavno nemoguće izmjeriti ovaj ili onaj psihološki fenomen ili crtu ličnosti bez računskih postupaka. To sugerira da su osnove ove nauke neophodne. Drugim riječima, može se nazvati izvorom i osnovom teorije vjerovatnoće.

Metoda istraživanja, koja se oslanja na razmatranje statističkih podataka, koristi se iu drugim oblastima. Međutim, odmah treba napomenuti da su njegove karakteristike, kada se primjenjuju na objekte koji imaju različitu prirodu porijekla, uvijek jedinstvene. Stoga, nema smisla kombinovati fizičku nauku u jednu nauku. Zajedničke karakteristike ovu metodu svode se na prebrojavanje određenog broja objekata koji su uključeni u određenu grupu, kao i na proučavanje distribucije kvantitativne osobine i primjena teorije vjerovatnoće za dobijanje određenih zaključaka.

Elementi matematičke statistike se koriste u oblastima kao što su fizika, astronomija itd. Ovdje se mogu naći vrijednosti karakteristika i parametara, hipoteze o podudarnosti bilo koje karakteristike u dva uzorka, o simetriji distribucije i još mnogo toga razmatrano.

Važnu ulogu u njihovoj implementaciji ima matematička statistika čiji je cilj najčešće izgradnja adekvatnih metoda za procjenu i testiranje hipoteza. Trenutno su kompjuterske tehnologije od velikog značaja u ovoj nauci. Oni omogućavaju ne samo značajno pojednostavljenje procesa proračuna, već i stvaranje uzoraka za replikaciju ili prilikom proučavanja prikladnosti rezultata dobivenih u praksi.

U opštem slučaju, metode matematičke statistike pomažu da se izvuku dva zaključka: ili da se donese željeni sud o prirodi ili svojstvima podataka koji se proučavaju i njihovim odnosima, ili da se dokaže da dobijeni rezultati nisu dovoljni za donošenje zaključaka.

Math statistics je moderna grana matematike koja se bavi statistički opis rezultate eksperimenata i zapažanja, kao i zgrada matematički modeli koji sadrže koncepte vjerovatnoće. Teorijska osnova matematičke statistike je teorija vjerovatnoće.

U strukturi matematičke statistike tradicionalno se razlikuju dva glavna odjeljka: deskriptivna statistika i statističko zaključivanje (Slika 1.1).

Rice. 1.1. Glavni dijelovi matematičke statistike

Deskriptivna statistika koristi se za:

o generalizacija indikatora jedne varijable (statistika slučajnog uzorka);

o identificiranje odnosa između dvije ili više varijabli (korelacijsko-regresiona analiza).

Deskriptivna statistika omogućava dobijanje novih informacija, brzo razumevanje i sveobuhvatnu procenu, odnosno obavlja naučnu funkciju opisivanja predmeta proučavanja, što opravdava svoj naziv. Metode deskriptivne statistike su dizajnirane da pretvore skup pojedinačnih empirijskih podataka u sistem oblika i brojeva koji su vizuelni za percepciju: distribucije frekvencija; indikatori trendova, varijabilnosti, komunikacija. Ove metode izračunavaju statistiku slučajnog uzorka, koja služi kao osnova za implementaciju statističkih zaključaka.

Statistical Inference dati priliku:

o procijeniti tačnost, pouzdanost i efektivnost statistike uzorka, pronaći greške koje se javljaju u procesu statističkog istraživanja (statistička evaluacija)

o sumirati parametre opšte populacije dobijene na osnovu statistike uzorka (provjera statističke hipoteze).

glavni cilj naučno istraživanje- ovo je sticanje novih znanja o velikoj klasi pojava, osoba ili događaja, koji se obično nazivaju opšta populacija.

Populacija je ukupnost objekata proučavanja, uzorak- njegov dio koji je formiran na određeni naučno utemeljen način 2.

Termin "opšta populacija" koristi se kada je u pitanju veliki, ali konačan skup objekata koji se proučavaju. Na primjer, o ukupnom broju podnositelja zahtjeva u Ukrajini 2009. godine ili ukupnoj djeci predškolskog uzrasta grad Rivne. Opšte populacije mogu doseći značajne količine, biti konačne i beskonačne. U praksi se po pravilu radi sa konačnim skupovima. A ako je omjer veličine opće populacije i veličine uzorka veći od 100, tada, prema Glassu i Stanleyju, metode procjene za konačne i beskonačne populacije daju u suštini iste rezultate. Opšti skup se takođe može nazvati kompletnim skupom vrednosti nekog atributa. Činjenica da uzorak pripada opštoj populaciji je osnovna osnova za procenu karakteristika opšte populacije prema karakteristikama uzorka.

Main ideja matematička statistika zasniva se na uvjerenju da je kompletno proučavanje svih objekata opšte populacije u većini naučnih problema ili praktično nemoguće ili ekonomski nepraktično, jer zahtijeva puno vremena i značajne materijalne troškove. Stoga se u matematičkoj statistici koristi selektivni pristup,čiji je princip prikazan na dijagramu na sl. 1.2.

Na primjer, prema tehnologiji formiranja, uzorci su randomizirani (jednostavni i sistematski), stratificirani, grupirani (vidi Odjeljak 4).

Rice. 1.2. Šema primjene metoda matematičke statistike Prema selektivni pristup upotreba matematičkih i statističkih metoda može se izvesti u sljedećem redoslijedu (vidi sliku 1.2):

o sa opšta populacija, svojstva koja su predmet istraživanja, određene metode formiraju uzorak- tipičan, ali ograničen broj objekata na koje se primjenjuju metode istraživanja;

o kao rezultat opservacijskih metoda, eksperimentalnih radnji i mjerenja na objektima uzorka, dobijaju se empirijski podaci;

o obrada empirijskih podataka metodama deskriptivne statistike daje uzorke indikatora, koji se nazivaju statističari – kao i naziv discipline, inače;

o primjena metoda statističkog zaključivanja na statističar, prima parametre koji karakteriziraju svojstva opšta populacija.

Primjer 1.1. Da bi se procijenila stabilnost nivoa znanja (varijabilnog x) testiranje randomiziranog uzorka od 3 studenta sa obimom od n. Testovi su sadržavali m zadataka, od kojih je svaki vrednovan po sistemu bodovanja: "rešeno" "- 1", "neispunjeno" - 0. prosječna trenutna postignuća učenika ostala X

3 randomizirani uzorak(od engleskog. Random - slučajan) je reprezentativan uzorak, koji se formira prema strategiji slučajnih testova.

na nivou prethodnih godina/h? Redoslijed rješenja:

o saznati smislenu hipotezu tipa: „ako se trenutni rezultati testa ne razlikuju od prošlih, onda možemo smatrati da je nivo znanja učenika nepromijenjen, i proces učenja- stabilan";

o formulirati adekvatnu statističku hipotezu, kao što je nulta hipoteza H 0 da je „trenutni GPA X se statistički ne razlikuje od prosjeka prethodnih godina/h“, tj. H 0: X = ⁄ r, protiv odgovarajuće alternativne hipoteze X F ^ ;

o izgraditi empirijske distribucije ispitivane varijable X;

o definisati(ako je potrebno) korelacije, na primjer, između varijable X i drugi pokazatelji, građ regresijske linije;

o provjerite usklađenost empirijska distribucija normalno pravo;

o procijeniti vrijednost bodovnih indikatora i interval pouzdanosti parametara, na primjer, prosjek;

o definisati kriterijume za statističko testiranje hipoteze;

o testirati statističke hipoteze na osnovu odabranih kriterijuma;

o formulisati odluku o statističkoj nul hipotezi o određenom nivo značajnosti;

o odmaknuti se od odluke da se prihvati ili odbije statistička nulta hipoteza interpretacije zaključaka u vezi sa smislenom hipotezom;

o formulisati smislene zaključke.

Dakle, ako sumiramo gore navedene postupke, primjena statističkih metoda sastoji se od tri glavna bloka:

Prelazak sa objekta stvarnosti na apstraktnu matematičku i statističku shemu, odnosno konstrukciju vjerovatnog modela pojave, procesa, svojstva;

Izvođenje računskih radnji odgovarajućim matematičkim sredstvima u okviru probabilističkog modela zasnovanog na rezultatima mjerenja, posmatranja, eksperimenata i formulaciji statističkih zaključaka;

Interpretacija statističkih zaključaka o stvarnom stanju i donošenje odgovarajuće odluke.

Statističke metode za obradu i interpretaciju podataka zasnovane su na teoriji vjerovatnoće. Teorija vjerovatnoće je osnova metoda matematičke statistike. Bez upotrebe osnovnih pojmova i zakona teorije vjerovatnoće, nemoguće je generalizirati zaključke matematičke statistike, a time i njihovu razumnu upotrebu u naučne i praktične svrhe.

Dakle, zadatak deskriptivne statistike je da transformiše skup podataka uzorka u sistem indikatora – statistike – distribucije frekvencija, mere centralne tendencije i varijabilnosti, koeficijenti sprege i sl. Međutim, statistika je zapravo karakteristika određenog uzorka. Naravno, moguće je izračunati distribuciju uzoraka, srednje vrijednosti uzorka, varijanse itd., ali takva "analiza podataka" je ograničene naučne i obrazovne vrijednosti. „Mehaničko“ prenošenje bilo kakvih zaključaka izvedenih na osnovu takvih pokazatelja na druge populacije nije ispravno.

Da bi se mogli prenijeti indikatori uzorka ili drugi, ili na uobičajenije populacije, potrebno je imati matematički opravdane odredbe o usklađenosti i sposobnosti karakteristika uzorka sa karakteristikama ovih uobičajenih tzv populacije. Takve odredbe se zasnivaju na teorijskim pristupima i shemama povezanim sa probabilističkim modelima stvarnosti, na primjer, na aksiomatskom pristupu, u zakonu veliki brojevi itd. Samo uz njihovu pomoć moguće je prenijeti svojstva koja su ustanovljena rezultatima analize ograničenih empirijskih informacija, bilo na druge ili na uobičajene skupove. Dakle, konstrukcija, zakoni funkcionisanja, upotreba probabilističkih modela, predmet je matematičkog polja zvanog „teorija verovatnoće“, postaje suština statističkih metoda.

Tako se u matematičkoj statistici koriste dvije paralelne linije indikatora: prva koja je relevantna za praksu (ovo su indikatori uzorka) i druga, zasnovana na teoriji (to su indikatori vjerovatnog modela). Na primjer, empirijske frekvencije koje su određene na uzorku odgovaraju konceptima teorijske vjerovatnoće; srednja vrijednost uzorka (praksa) odgovara očekivanu vrijednost(teorija) itd. Štaviše, u studijama su selektivne karakteristike, po pravilu, primarne. Izračunavaju se na osnovu zapažanja, mjerenja, eksperimenata, nakon čega se podvrgavaju statističkoj procjeni sposobnosti i djelotvornosti, testiranju statističkih hipoteza u skladu sa ciljevima istraživanja i na kraju se prihvataju sa određenom vjerovatnoćom kao indikatori svojstava proučavanih populacija.

Pitanje. Zadatak.

1. Opišite glavne dijelove matematičke statistike.

2. Koja je glavna ideja matematičke statistike?

3. Opišite omjer opšte populacije i populacije uzorka.

4. Objasniti šemu za primjenu metoda matematičke statistike.

5. Navedite listu glavnih zadataka matematičke statistike.

6. Koji su glavni blokovi primjene statističkih metoda? Opišite ih.

7. Proširiti vezu između matematičke statistike i teorije vjerovatnoće.

Kako se koriste vjerovatnoća i matematička statistika? Ove discipline su osnova probabilističko-statističkih metoda odlučivanje. Da biste koristili njihov matematički aparat, potrebni su vam zadaci odlučivanje izraziti u terminima vjerovatno-statističkih modela. Primjena specifičnog vjerovatno-statističkog metoda odlučivanje sastoji se od tri faze:

  • prelazak sa ekonomske, menadžerske, tehnološke stvarnosti na apstraktnu matematičku i statističku shemu, tj. izgradnja probabilističkog modela upravljačkog sistema, tehnološkog procesa, procedure donošenja odluka, posebno prema rezultatima statističke kontrole i dr.;
  • izvođenje proračuna i dobijanje zaključaka čisto matematičkim sredstvima u okviru vjerovatnog modela;
  • tumačenje matematičkih i statističkih zaključaka u odnosu na realnu situaciju i donošenje odgovarajuće odluke (npr. o usklađenosti ili neusklađenosti kvaliteta proizvoda sa utvrđenim zahtjevima, potrebi prilagođavanja tehnološkog procesa i sl.), posebno, zaključci (o udjelu neispravnih jedinica proizvoda u seriji, o specifičnom obliku zakona o distribuciji kontrolisanih parametara tehnološki proces itd.).

Matematička statistika koristi koncepte, metode i rezultate teorije vjerovatnoće. Razmotrite glavna pitanja izgradnje vjerovatnostnih modela odlučivanje u ekonomskim, menadžerskim, tehnološkim i drugim situacijama. Za aktivnu i pravilnu upotrebu normativno-tehničkih i instruktivno-metodičkih dokumenata o probabilističko-statističkim metodama odlučivanje potrebno je prethodno znanje. Dakle, potrebno je znati pod kojim uslovima treba primijeniti jedan ili drugi dokument, koje početne informacije je potrebno imati za njegov odabir i primjenu, koje odluke treba donijeti na osnovu rezultata obrade podataka itd.

Primjeri primjene teorije vjerovatnoće i matematičke statistike. Razmotrimo nekoliko primjera kada su vjerovatno-statistički modeli dobar alat za rješavanje menadžerskih, industrijskih, ekonomskih i nacionalnih ekonomskih problema. Tako, na primjer, u romanu A.N. Tolstojev "Hod kroz muke" (tom 1) kaže: "radionica daje dvadeset i tri posto braka, ti se drži ove brojke", rekao je Strukov Ivanu Iljiču.

Postavlja se pitanje kako razumjeti ove riječi u razgovoru direktora fabrike, jer jedna jedinica proizvodnje ne može biti neispravna za 23%. Može biti dobar ili neispravan. Možda je Strukov mislio da velika serija sadrži otprilike 23% neispravnih jedinica. Onda se postavlja pitanje šta znači "o"? Neka se pokaže da je 30 od 100 testiranih jedinica proizvoda neispravno, ili od 1000-300, ili od 100 000-30 000 itd., treba li optužiti Strukova za laž?

Ili drugi primjer. Novčić koji se koristi kao lot mora biti "simetričan", tj. kada se baci, u prosjeku bi u polovini slučajeva trebao ispasti grb, a u polovini slučajeva - rešetka (repovi, broj). Ali šta znači "prosjek"? Ako potrošite mnogo serija od 10 bacanja u svakoj seriji, onda će često biti serija u kojima novčić ispadne 4 puta s grbom. Za simetrični novčić, to će se dogoditi u 20,5% serije. A ako postoji 40.000 grbova za 100.000 bacanja, može li se novčić smatrati simetričnim? Procedura odlučivanje zasniva se na teoriji vjerovatnoće i matematičkoj statistici.

Primjer koji se razmatra možda ne izgleda dovoljno ozbiljan. Međutim, nije. Ždrijeb se široko koristi u organizaciji eksperimenata industrijske izvodljivosti, na primjer, prilikom obrade rezultata mjerenja indeksa kvalitete (momenta trenja) ležajeva u zavisnosti od različitih tehnoloških faktora (utjecaj okoline za očuvanje, metode pripreme ležajeva prije mjerenja). , efekat opterećenja ležaja u procesu mjerenja, itd.). P.). Pretpostavimo da je potrebno usporediti kvalitetu ležajeva ovisno o rezultatima njihovog skladištenja u različitim konzervacijskim uljima, tj. u sastavu ulja i . Prilikom planiranja ovakvog eksperimenta postavlja se pitanje koje ležajeve treba staviti u sastav ulja, a koji - u sastav ulja, ali na način da se izbjegne subjektivnost i osigura objektivnost odluke.

Odgovor na ovo pitanje može se dobiti žrijebom. Sličan primjer može se dati s kontrolom kvalitete bilo kojeg proizvoda. Uzorkovanje se vrši kako bi se odlučilo da li pregledana serija proizvoda ispunjava određene zahtjeve. Na osnovu rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju je veoma važno izbjeći subjektivnost u formiranju uzorka, tj. potrebno je da svaka jedinica proizvoda u kontrolisanoj seriji ima istu vjerovatnoću da bude odabrana u uzorku. U proizvodnim uvjetima, odabir proizvodnih jedinica u uzorku obično se ne vrši putem lota, već pomoću posebnih tablica slučajnih brojeva ili uz pomoć kompjuterskih generatora slučajnih brojeva.

Slični problemi obezbeđivanja objektivnosti poređenja javljaju se prilikom poređenja različitih šema. organizacija proizvodnje, naknade, na tenderima i konkursima, izbor kandidata za upražnjena radna mjesta i dr. Svugdje vam je potrebna lutrija ili slične procedure. Objasnimo na primjeru identifikacije najjače i druge najjače ekipe pri organizaciji turnira po olimpijskom sistemu (poraženi je eliminisan). Neka jača ekipa uvijek pobjeđuje slabiju. Jasno je da će najjača ekipa sigurno postati šampion. Druga po snazi ​​ekipa će u finale samo ako nema utakmica sa budućim šampionom prije finala. Ako je takva utakmica planirana, onda druga po snazi ​​ekipa neće doći do finala. Onaj ko planira turnir može ili "nokautirati" drugu najjaču ekipu sa turnira pre vremena, srušivši je u prvom susretu sa liderom, ili joj obezbediti drugo mesto, obezbeđujući susrete sa slabijim ekipama do finala. Da biste izbjegli subjektivnost, izvucite žrijeb. Za turnir sa 8 ekipa, vjerovatnoća da će se dva najjača tima sastati u finalu je 4/7. Shodno tome, sa vjerovatnoćom od 3/7, druga po snazi ​​ekipa će napustiti turnir prije roka.

U svakom mjerenju jedinica proizvoda (pomoću čeljusti, mikrometra, ampermetra, itd.), postoje greške. Da bi se utvrdilo da li postoje sistematske greške, potrebno je izvršiti ponovljena mjerenja jedinice proizvoda čije su karakteristike poznate (na primjer, standardni uzorak). Treba imati na umu da pored sistematske greške postoji i slučajna greška.

Stoga se postavlja pitanje kako iz rezultata mjerenja saznati da li postoji sistemska greška. Ako zapazimo samo da li je greška dobijena prilikom sljedećeg mjerenja pozitivna ili negativna, onda se ovaj problem može svesti na prethodni. Zaista, usporedimo mjerenje s bacanjem novčića, pozitivnu grešku - s gubitkom grba, negativnu - s rešetkom (nulta greška s dovoljnim brojem podjela ljestvice gotovo se nikada ne pojavljuje). Tada je provjera odsustva sistematske greške ekvivalentna provjeri simetrije novčića.

Svrha ovih razmatranja je da se problem provjere odsustva sistematske greške svede na problem provjere simetrije novčića. Gornje rezonovanje dovodi do takozvanog "kriterijuma predznaka" u matematičkoj statistici.

U statističkoj regulaciji tehnoloških procesa, na osnovu metoda matematičke statistike, izrađuju se pravila i planovi za statističku kontrolu procesa u cilju blagovremenog otkrivanja poremećaja tehnoloških procesa, preduzimanja mera za njihovo prilagođavanje i sprečavanje puštanja proizvoda koji rade. ne ispunjavaju utvrđene uslove. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabavke nekvalitetnih proizvoda. Uz statističku kontrolu prihvatljivosti, na osnovu metoda matematičke statistike, izrađuju se planovi kontrole kvaliteta analizom uzoraka iz serija proizvoda. Poteškoća leži u mogućnosti da se pravilno izgrade vjerovatno-statistički modeli odlučivanje na osnovu kojih se može odgovoriti na gornja pitanja. U matematičkoj statistici, za to su razvijeni vjerojatnosni modeli i metode za testiranje hipoteza, posebno hipoteza da je udio neispravnih jedinica proizvodnje jednak određenom broju, na primjer (sjetite se riječi Strukova iz romana A.N. Tolstoj).

Zadaci ocjenjivanja. U nizu upravljačkih, industrijskih, ekonomskih, nacionalno-ekonomskih situacija javljaju se problemi drugačijeg tipa – problemi procjene karakteristika i parametara distribucije vjerovatnoće.

Razmotrimo primjer. Neka serija od N električnih lampi dođe u kontrolu. Iz ove serije nasumično je odabran uzorak od n električnih lampi. Postavlja se niz prirodnih pitanja. Kako se iz rezultata ispitivanja elemenata uzorka može odrediti prosječni vijek trajanja električnih svjetiljki i s kojom se tačnošću može procijeniti ova karakteristika? Kako će se promijeniti tačnost ako se uzme veći uzorak? Za koji broj sati se može garantovati da će najmanje 90% električnih lampi trajati duže od sati?

Pretpostavimo da se prilikom testiranja uzorka s volumenom električnih svjetiljki pokazalo da su električne lampe neispravne. Tada se postavljaju sljedeća pitanja. Koje granice se mogu odrediti za broj neispravnih električnih lampi u seriji, za nivo neispravnosti itd.?

Ili je u statističkoj analizi tačnosti i stabilnosti tehnoloških procesa potrebno vrednovati takve indikatori kvaliteta, kao prosjek kontrolisanog parametra i stepen njegove rasprostranjenosti u procesu koji se razmatra. Prema teoriji vjerovatnoće, preporučljivo je koristiti njeno matematičko očekivanje kao prosječnu vrijednost slučajne varijable, a varijansu, standardnu ​​devijaciju ili koeficijent varijacije. Ovo postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom tačnošću se to može učiniti? Ima mnogo sličnih primjera. Ovdje je bilo važno pokazati kako se teorija vjerovatnoće i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u oblasti statističkog upravljanja kvalitetom proizvoda.

Šta je "matematička statistika"? Pod matematičkom statistikom se podrazumijeva „grana matematike koja se bavi matematičkim metodama prikupljanja, sistematizacije, obrade i tumačenja statističkih podataka, kao i njihovim korištenjem za naučne ili praktične zaključke. Pravila i procedure matematičke statistike zasnovane su na teoriji vjerovatnoće, što omogućava procjenu tačnosti i pouzdanosti zaključaka dobijenih u svakom zadatku na osnovu dostupnog statističkog materijala“ [ [ 2.2], str. 326]. Istovremeno, statistički podaci se odnose na podatak o broju objekata u bilo kojoj manje ili više obimnoj zbirci koji imaju određene karakteristike.

Prema vrsti problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteza.

Prema vrsti statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

  • jednodimenzionalna statistika (statistika slučajnih varijabli), u kojoj je rezultat posmatranja opisan realnim brojem;
  • multidimenzionalna statistička analiza, gde se rezultat posmatranja objekta opisuje sa više brojeva (vektora);
  • statistika slučajnih procesa i vremenskih serija, gdje je rezultat posmatranja funkcija;
  • statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, to je skup (geometrijska figura), poredak ili dobiven kao rezultat mjerenja pomoću kvalitativni atribut.

Istorijski gledano, prve su se pojavile neke oblasti statistike nenumeričkih objekata (posebno problemi procene procenta braka i testiranja hipoteza o tome) i jednodimenzionalne statistike. Matematički aparat im je jednostavniji, pa svojim primjerom obično demonstriraju glavne ideje matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika je zasnovana na dokazima, koja je zasnovana na probabilističkim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, nastanku rizika, funkcionisanju tehnološke opreme, dobijanju rezultata eksperimenta, toku bolesti itd. Vjerovatni model realnog fenomena treba smatrati izgrađenim ako su veličine koje se razmatraju i odnosi između njih izraženi u terminima teorije vjerovatnoće. Korespondencija sa probabilističkim modelom stvarnosti, tj. njegova adekvatnost se potkrepljuje, posebno, korištenjem statističkih metoda za testiranje hipoteza.

Nevjerovatne metode obrade podataka su istraživačke, mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućavaju procjenu tačnosti i pouzdanosti zaključaka dobijenih na osnovu ograničenog statističkog materijala.

Vjerovatni i statističke metode primjenjivi su svuda gdje je moguće konstruirati i potkrijepiti probabilistički model pojave ili procesa. Njihova upotreba je obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda).

U specifičnim aplikacijama, oni se koriste kao probabilistički statističke metodeširoku primjenu, kao i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama kontrole kvaliteta proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Uz pomoć svojih metoda, Statistička analiza tačnost i stabilnost tehnoloških procesa i statističku procjenu kvaliteta. Specifične metode uključuju statističku kontrolu prihvatljivosti kvaliteta proizvoda, statističku regulaciju tehnoloških procesa, procjenu i kontrolu pouzdanosti itd.

Takve primijenjene probabilističko-statističke discipline kao što su teorija pouzdanosti i teorija čekanja imaju široku primjenu. Sadržaj prvog od njih je jasan iz naslova, drugi se bavi proučavanjem sistema kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevima pretplatnika koji biraju brojeve na svojim telefonima. Trajanje usluge ovih zahtjeva, tj. trajanje razgovora je također modelirano slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije nauka SSSR-a A.Ya. Khinčin (1894-1959), akademik Akademije nauka Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći naučnici.

Ukratko o istoriji matematičke statistike. Matematička statistika kao nauka počinje radovima poznatog njemačkog matematičara Carla Friedricha Gausa (1777-1855), koji je na osnovu teorije vjerovatnoće istraživao i potkrijepio metoda najmanjeg kvadrata, koju je kreirao 1795. godine i koristio se za obradu astronomskih podataka (kako bi se precizirala orbita male planete Ceres). Jedna od najpopularnijih distribucija vjerovatnoće, normalna, često se naziva po njemu, a u teoriji slučajnih procesa glavni predmet proučavanja su Gausovi procesi.

AT kasno XIX in. - početak dvadesetog veka. veliki doprinos matematičkoj statistici dali su engleski istraživači, prvenstveno K. Pearson (1857-1936) i R.A. Fisher (1890-1962). Konkretno, Pearson je razvio "hi-kvadrat" kriterijum za testiranje statističkih hipoteza, a Fisher - analiza varijanse, teorija planiranja eksperimenata, metoda maksimalne vjerovatnoće procjene parametara.

Tridesetih godina dvadesetog veka. Poljak Jerzy Neumann (1894-1977) i Englez E. Pearson razvili su opću teoriju testiranja statističkih hipoteza, a sovjetski matematičari akademik A.N. Kolmogorov (1903-1987) i dopisni član Akademije nauka SSSR N.V. Smirnov (1900-1966) postavio je temelje neparametarske statistike. Četrdesetih godina dvadesetog veka. Rumun A. Wald (1902-1950) izgradio je teoriju konzistentne statističke analize.

Matematička statistika se u današnje vrijeme ubrzano razvija. Dakle, u proteklih 40 godina, mogu se izdvojiti četiri fundamentalno nova područja istraživanja [ [ 2.16 ] ]:

  • razvoj i implementacija matematičkih metoda za planiranje eksperimenata;
  • razvoj statistike objekata nenumeričke prirode kao samostalnog pravca u primijenjenoj matematičkoj statistici;
  • razvoj statističkih metoda otpornih na mala odstupanja od korištenog vjerovatnostnog modela;
  • široki rad na kreiranju računarskih softverskih paketa dizajniranih za statističku analizu podataka.

Probabilističko-statističke metode i optimizacija. Ideja optimizacije prožima savremenu primijenjenu matematičku statistiku i drugo statističke metode. Naime, metode planiranja eksperimenata, statistička kontrola prihvatljivosti, statistička regulacija tehnoloških procesa itd. S druge strane, optimizacijske formulacije u teoriji odlučivanje, na primjer, primijenjena teorija optimizacije kvaliteta proizvoda i zahtjevi standarda, omogućavaju široku upotrebu vjerovatno-statističkih metoda, prvenstveno primijenjene matematičke statistike.

U upravljanju proizvodnjom, posebno kada se optimizira kvalitet proizvoda i zahtjevi standarda, posebno je važna primjena statističke metode u početnoj fazi životni ciklus proizvodi, tj. u fazi istraživačke pripreme razvoja eksperimentalnog dizajna (izrada obećavajućih zahtjeva za proizvode, idejni projekt, projektni zadatak za izradu eksperimentalnog dizajna). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost. Statističke metode treba primijeniti u svim fazama rješavanja problema optimizacije - pri skaliranju varijabli, razvoju matematičkih modela funkcionisanja proizvoda i sistema, izvođenju tehničko-ekonomskih eksperimenata itd.

U problemima optimizacije, uključujući optimizaciju kvaliteta proizvoda i standardne zahtjeve, koriste se sva područja statistike. Naime - statistika slučajnih varijabli, multivarijantna Statistička analiza, statistika slučajnih procesa i vremenskih serija, statistika objekata nenumeričke prirode. Izbor statističke metode za analizu konkretnih podataka treba izvršiti prema preporukama [