Kako se koriste vjerovatnoća i matematička statistika? Ove discipline su osnova probabilističko-statističkih metoda odlučivanje. Da biste koristili njihov matematički aparat, potrebni su vam zadaci odlučivanje izraziti u terminima vjerovatno-statističkih modela. Primjena specifičnog vjerovatno-statističkog metoda odlučivanje sastoji se od tri faze:

  • prelazak sa ekonomske, menadžerske, tehnološke stvarnosti na apstraktnu matematičku i statističku shemu, tj. izgradnja probabilističkog modela upravljačkog sistema, tehnološkog procesa, procedure donošenja odluka, posebno prema rezultatima statističke kontrole i dr.;
  • izvođenje proračuna i dobijanje zaključaka čisto matematičkim sredstvima u okviru vjerovatnog modela;
  • tumačenje matematičkih i statističkih zaključaka u odnosu na realnu situaciju i donošenje odgovarajuće odluke (npr. o usaglašenosti ili neusklađenosti kvaliteta proizvoda sa utvrđenim zahtjevima, potrebi prilagođavanja tehnološkog procesa i sl.), posebno, zaključci (o udjelu neispravnih jedinica proizvoda u seriji, o specifičnom obliku zakona o distribuciji kontrolisanih parametara tehnološki proces itd.).

Matematička statistika koristi koncepte, metode i rezultate teorije vjerovatnoće. Razmotrite glavna pitanja izgradnje vjerovatnostnih modela odlučivanje u ekonomskim, menadžerskim, tehnološkim i drugim situacijama. Za aktivnu i pravilnu upotrebu normativno-tehničkih i instruktivno-metodičkih dokumenata o probabilističko-statističkim metodama odlučivanje potrebno je prethodno znanje. Dakle, potrebno je znati pod kojim uslovima treba primijeniti jedan ili drugi dokument, koje početne informacije je potrebno imati za njegov odabir i primjenu, koje odluke treba donijeti na osnovu rezultata obrade podataka itd.

Primjeri primjene teorije vjerovatnoće i matematičke statistike. Razmotrimo nekoliko primjera kada su probabilističko-statistički modeli dobar alat za rješavanje menadžerskih, industrijskih, ekonomskih i nacionalnih ekonomskih problema. Tako, na primjer, u romanu A.N. Tolstojev "Hod kroz muke" (tom 1) kaže: "radionica daje dvadeset i tri posto braka, ti se drži ove brojke", rekao je Strukov Ivanu Iljiču.

Postavlja se pitanje kako razumjeti ove riječi u razgovoru direktora fabrike, jer jedna jedinica proizvodnje ne može biti neispravna za 23%. Može biti dobar ili neispravan. Možda je Strukov mislio da velika serija sadrži otprilike 23% neispravnih jedinica. Onda se postavlja pitanje šta znači "o"? Neka se pokaže da je 30 od 100 testiranih jedinica proizvoda neispravno, ili od 1000-300, ili od 100 000-30 000 itd., treba li optužiti Strukova za laž?

Ili drugi primjer. Novčić koji se koristi kao lot mora biti "simetričan", tj. kada se baci, u prosjeku bi u polovini slučajeva trebao ispasti grb, a u polovini slučajeva - rešetka (repovi, broj). Ali šta znači "prosjek"? Ako potrošite mnogo serija od 10 bacanja u svakoj seriji, onda će često biti serija u kojima novčić ispadne 4 puta s grbom. Za simetrični novčić, to će se dogoditi u 20,5% serije. A ako postoji 40.000 grbova za 100.000 bacanja, može li se novčić smatrati simetričnim? Procedura odlučivanje zasniva se na teoriji vjerovatnoće i matematičkoj statistici.

Primjer koji se razmatra možda ne izgleda dovoljno ozbiljan. Međutim, nije. Žreb se široko koristi u organizovanju eksperimenata industrijske izvodljivosti, na primer, prilikom obrade rezultata merenja indeksa kvaliteta (momenta trenja) ležajeva u zavisnosti od različitih tehnoloških faktora (uticaj okoline za očuvanje, metode pripreme ležajeva pre merenja, uticaj opterećenja ležaja u procesu merenja itd.). P.). Pretpostavimo da je potrebno usporediti kvalitetu ležajeva ovisno o rezultatima njihovog skladištenja u različitim konzervacijskim uljima, tj. u sastavu ulja i . Prilikom planiranja ovakvog eksperimenta postavlja se pitanje koje ležajeve treba staviti u sastav ulja, a koji - u sastav ulja, ali na način da se izbjegne subjektivnost i osigura objektivnost odluke.

Odgovor na ovo pitanje može se dobiti žrijebom. Sličan primjer može se dati s kontrolom kvalitete bilo kojeg proizvoda. Uzorkovanje se vrši kako bi se odlučilo da li pregledana serija proizvoda ispunjava određene zahtjeve. Na osnovu rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju je veoma važno izbjeći subjektivnost u formiranju uzorka, tj. potrebno je da svaka jedinica proizvoda u kontrolisanoj seriji ima istu vjerovatnoću da bude odabrana u uzorku. U proizvodnim uvjetima, odabir proizvodnih jedinica u uzorku obično se ne vrši putem lota, već pomoću posebnih tablica slučajnih brojeva ili uz pomoć kompjuterskih generatora slučajnih brojeva.

Slični problemi obezbeđivanja objektivnosti poređenja javljaju se prilikom poređenja različitih šema. organizacija proizvodnje, naknade, na tenderima i konkursima, izbor kandidata za upražnjena radna mjesta i dr. Svugdje vam je potrebna lutrija ili slične procedure. Objasnimo na primjeru identifikacije najjače i druge najjače ekipe pri organizaciji turnira po olimpijskom sistemu (poraženi je eliminisan). Neka jača ekipa uvijek pobjeđuje slabiju. Jasno je da će najjača ekipa sigurno postati šampion. Druga po snazi ​​ekipa će u finale samo ako nema utakmica sa budućim šampionom prije finala. Ako je takva utakmica planirana, onda druga po snazi ​​ekipa neće doći do finala. Onaj ko planira turnir može ili "nokautirati" drugu najjaču ekipu sa turnira pre vremena, srušivši je u prvom susretu sa liderom, ili joj obezbediti drugo mesto, obezbeđujući susrete sa slabijim ekipama do finala. Da biste izbjegli subjektivnost, izvucite žrijeb. Za turnir sa 8 ekipa, vjerovatnoća da će se dva najjača tima sastati u finalu je 4/7. Shodno tome, sa vjerovatnoćom od 3/7, druga po snazi ​​ekipa će napustiti turnir prije roka.

U svakom mjerenju jedinica proizvoda (pomoću čeljusti, mikrometra, ampermetra, itd.), postoje greške. Da bi se utvrdilo da li postoje sistematske greške, potrebno je izvršiti ponovljena mjerenja jedinice proizvodnje čije su karakteristike poznate (na primjer, standardni uzorak). Treba imati na umu da pored sistematske greške postoji i slučajna greška.

Stoga se postavlja pitanje kako iz rezultata mjerenja saznati da li postoji sistemska greška. Ako zapazimo samo da li je greška dobijena prilikom sljedećeg mjerenja pozitivna ili negativna, onda se ovaj problem može svesti na prethodni. Zaista, usporedimo mjerenje s bacanjem novčića, pozitivnu grešku - s gubitkom grba, negativnu - s rešetkom (nulta greška s dovoljnim brojem podjela ljestvice gotovo se nikada ne pojavljuje). Tada je provjera odsustva sistematske greške ekvivalentna provjeri simetrije novčića.

Svrha ovih razmatranja je da se problem provjere odsustva sistematske greške svede na problem provjere simetrije novčića. Gornje rezonovanje dovodi do takozvanog "kriterijuma predznaka" u matematičkoj statistici.

U statističkoj regulaciji tehnoloških procesa, na osnovu metoda matematičke statistike, izrađuju se pravila i planovi za statističku kontrolu procesa u cilju blagovremenog otkrivanja poremećenosti tehnoloških procesa, preduzimanja mera za njihovo prilagođavanje i sprečavanje puštanja proizvoda koji rade. ne ispunjavaju utvrđene uslove. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabavke nekvalitetnih proizvoda. Uz statističku kontrolu prihvata, na osnovu metoda matematičke statistike, izrađuju se planovi kontrole kvaliteta analizom uzoraka iz serija proizvoda. Poteškoća leži u mogućnosti da se pravilno izgrade vjerovatno-statistički modeli odlučivanje na osnovu kojih se može odgovoriti na gornja pitanja. U matematičkoj statistici, za to su razvijeni vjerojatnosni modeli i metode za testiranje hipoteza, posebno hipoteza da je udio neispravnih jedinica proizvodnje jednak određenom broju, na primjer, (sjetite se riječi Strukova iz romana A.N. Tolstoj).

Zadaci ocjenjivanja. U nizu upravljačkih, industrijskih, ekonomskih, nacionalno-ekonomskih situacija javljaju se problemi drugačijeg tipa – problemi procjene karakteristika i parametara distribucije vjerovatnoće.

Razmotrimo primjer. Neka serija od N električnih lampi dođe u kontrolu. Iz ove serije nasumično je odabran uzorak od n električnih lampi. Postavlja se niz prirodnih pitanja. Kako se iz rezultata ispitivanja elemenata uzorka može odrediti prosječni vijek trajanja električnih svjetiljki i s kojom se tačnošću može procijeniti ova karakteristika? Kako će se promijeniti tačnost ako se uzme veći uzorak? Za koji broj sati se može garantovati da će najmanje 90% električnih lampi trajati duže od sati?

Pretpostavimo da se prilikom testiranja uzorka s volumenom električnih svjetiljki pokazalo da su električne lampe neispravne. Tada se postavljaju sljedeća pitanja. Koje granice se mogu odrediti za broj neispravnih električnih lampi u seriji, za nivo neispravnosti itd.?

Ili je u statističkoj analizi tačnosti i stabilnosti tehnoloških procesa potrebno vrednovati takve indikatori kvaliteta, kao prosjek kontrolisanog parametra i stepen njegove rasprostranjenosti u procesu koji se razmatra. Prema teoriji vjerovatnoće, preporučljivo je koristiti je kao prosječnu vrijednost slučajne varijable očekivanu vrijednost, a kao statistička karakteristika širenja - disperzija, standardna devijacija ili koeficijent varijacije. Ovo postavlja pitanje: kako ih ocijeniti statističke karakteristike prema uzorku podataka i sa kojom tačnošću se to može uraditi? Ima mnogo sličnih primjera. Ovdje je bilo važno pokazati kako se teorija vjerovatnoće i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u oblasti statističkog upravljanja kvalitetom proizvoda.

Šta je "matematička statistika"? Ispod matematičke statistike razumjeti "granu matematike posvećenu matematičkim metodama prikupljanja, sistematizacije, obrade i tumačenja statističkih podataka, kao i njihovom korištenju za naučne ili praktične zaključke. Pravila i procedure matematičke statistike zasnivaju se na teoriji vjerovatnoće, koja čini moguće je proceniti tačnost i pouzdanost zaključaka dobijenih u svakom problemu na osnovu dostupnog statističkog materijala“ [ [ 2.2], str. 326]. Istovremeno, statistički podaci se odnose na podatak o broju objekata u bilo kojoj manje ili više obimnoj zbirci koji imaju određene karakteristike.

Prema vrsti problema koji se rješava, matematička statistika se obično dijeli u tri dijela: opis podataka, procjena i testiranje hipoteza.

Prema vrsti statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

  • jednodimenzionalna statistika (statistika slučajnih varijabli), u kojoj je rezultat posmatranja opisan realnim brojem;
  • multidimenzionalna statistička analiza, gde se rezultat posmatranja objekta opisuje sa više brojeva (vektora);
  • statistika slučajnih procesa i vremenskih serija, gdje je rezultat posmatranja funkcija;
  • statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, skup ( geometrijska figura), naručivanje ili dobijeno kao rezultat mjerenja na kvalitativnoj osnovi.

Istorijski gledano, prve su se pojavile neke oblasti statistike nenumeričkih objekata (posebno problemi procene procenta braka i testiranja hipoteza o tome) i jednodimenzionalne statistike. Matematički aparat im je jednostavniji, pa svojim primjerom obično demonstriraju glavne ideje matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika je zasnovana na dokazima, koja je zasnovana na probabilističkim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, nastanku rizika, funkcionisanju tehnološke opreme, dobijanju rezultata eksperimenta, toku bolesti itd. Vjerovatni model realnog fenomena treba smatrati izgrađenim ako su veličine koje se razmatraju i odnosi između njih izraženi u terminima teorije vjerovatnoće. Korespondencija sa probabilističkim modelom stvarnosti, tj. njegova adekvatnost se potkrepljuje, posebno, korištenjem statističkih metoda za testiranje hipoteza.

Nevjerovatne metode obrade podataka su istraživačke, mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućavaju procjenu tačnosti i pouzdanosti zaključaka dobijenih na osnovu ograničenog statističkog materijala.

Vjerovatni i statističke metode primjenjivi su svuda gdje je moguće konstruirati i potkrijepiti probabilistički model pojave ili procesa. Njihova upotreba je obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda).

U specifičnim aplikacijama, oni se koriste kao probabilistički statističke metodeširoku primjenu, kao i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Uz pomoć svojih metoda, Statistička analiza tačnost i stabilnost tehnoloških procesa i statistička evaluacija kvaliteta. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvaliteta proizvoda, statističke regulacije tehnoloških procesa, procjene i kontrole pouzdanosti itd.

Takve primijenjene probabilističko-statističke discipline kao što su teorija pouzdanosti i teorija čekanja imaju široku primjenu. Sadržaj prvog od njih je jasan iz naslova, drugi se bavi proučavanjem sistema kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevima pretplatnika koji biraju brojeve na svojim telefonima. Trajanje usluge ovih zahtjeva, tj. trajanje razgovora je također modelirano slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije nauka SSSR-a A.Ya. Khinčin (1894-1959), akademik Akademije nauka Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći naučnici.

Ukratko o istoriji matematičke statistike. Matematička statistika kao nauka počinje radovima poznatog njemačkog matematičara Carla Friedricha Gausa (1777-1855), koji je na osnovu teorije vjerovatnoće istraživao i potkrijepio metoda najmanjeg kvadrata, koju je kreirao 1795. godine i koristio se za obradu astronomskih podataka (kako bi se precizirala orbita male planete Ceres). Jedna od najpopularnijih distribucija vjerovatnoće, normalna, često se naziva po njemu, a u teoriji slučajnih procesa glavni predmet proučavanja su Gausovi procesi.

AT kasno XIX in. - početak dvadesetog veka. veliki doprinos matematičkoj statistici dali su engleski istraživači, prvenstveno K. Pearson (1857-1936) i R.A. Fisher (1890-1962). Pearson je posebno razvio "hi-kvadrat" test za testiranje statističke hipoteze, a Fischer - analiza varijanse, teorija planiranja eksperimenata, metoda maksimalne vjerovatnoće procjene parametara.

Tridesetih godina dvadesetog veka. Poljak Jerzy Neumann (1894-1977) i Englez E. Pearson razvili su opću teoriju testiranja statističkih hipoteza, a sovjetski matematičari akademik A.N. Kolmogorov (1903-1987) i dopisni član Akademije nauka SSSR N.V. Smirnov (1900-1966) postavio je temelje neparametarske statistike. Četrdesetih godina dvadesetog veka. Rumun A. Wald (1902-1950) izgradio je teoriju konzistentne statističke analize.

Matematička statistika se u današnje vrijeme ubrzano razvija. Dakle, u proteklih 40 godina, mogu se izdvojiti četiri fundamentalno nova područja istraživanja [ [ 2.16 ] ]:

  • razvoj i implementacija matematičkih metoda za planiranje eksperimenata;
  • razvoj statistike objekata nenumeričke prirode kao samostalnog pravca u primijenjenoj matematičkoj statistici;
  • razvoj statističkih metoda otpornih na mala odstupanja od korištenog vjerovatnostnog modela;
  • široki rad na kreiranju računarskih softverskih paketa dizajniranih za statističku analizu podataka.

Probabilističko-statističke metode i optimizacija. Ideja optimizacije prožima savremenu primijenjenu matematičku statistiku i drugo statističke metode. Naime, metode planiranja eksperimenata, statistička kontrola prihvatanja, statistička kontrola tehnoloških procesa itd. S druge strane, optimizacijske formulacije u teoriji odlučivanje, na primjer, primijenjena teorija optimizacije kvaliteta proizvoda i zahtjevi standarda, omogućavaju široku upotrebu vjerovatno-statističkih metoda, prvenstveno primijenjene matematičke statistike.

U upravljanju proizvodnjom, posebno kada se optimizira kvalitet proizvoda i zahtjevi standarda, posebno je važna primjena statističke metode u početnoj fazi životni ciklus proizvodi, tj. u fazi istraživačke pripreme razvoja eksperimentalnog dizajna (izrada obećavajućih zahtjeva za proizvode, idejni projekt, projektni zadatak za izradu eksperimentalnog dizajna). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost. Statističke metode treba primijeniti u svim fazama rješavanja problema optimizacije - pri skaliranju varijabli, razvoju matematičkih modela funkcionisanja proizvoda i sistema, izvođenju tehničko-ekonomskih eksperimenata itd.

U problemima optimizacije, uključujući optimizaciju kvaliteta proizvoda i standardne zahtjeve, koriste se sva područja statistike. Naime - statistika slučajnih varijabli, multivarijantna Statistička analiza, statistika slučajnih procesa i vremenskih serija, statistika objekata nenumeričke prirode. Izbor statističke metode za analizu specifičnih podataka treba izvršiti prema preporukama [

3.5.1. Probabilističko-statistički metod istraživanja.

U mnogim slučajevima potrebno je istražiti ne samo determinističke, već i slučajne vjerovatnoće (statističke) procese. Ovi procesi se razmatraju na osnovu teorije vjerovatnoće.

Ukupnost slučajne varijable x je primarni matematički materijal. Kolekcija se shvata kao skup homogenih događaja. Skup koji sadrži najrazličitije varijante masovnog fenomena naziva se opšta populacija, ili veliki uzorak N. Obično se proučava samo dio opće populacije, tzv populacija uzorka ili mali uzorak.

Vjerovatnoća R(x) razvoj događaja X naziva se odnos broja slučajeva N(x), koje dovode do nastanka događaja X, to ukupan broj mogući slučajevi N:

P(x)=N(x)/N.

Teorija vjerovatnoće razmatra teorijske distribucije slučajnih varijabli i njihove karakteristike.

Math statistics bavi se načinima obrade i analize empirijskih događaja.

Ove dvije srodne nauke čine jedinstvenu matematičku teoriju masovnih slučajnih procesa, koja se široko koristi za analizu naučno istraživanje.

Vrlo često se metode vjerovatnoće i matematičke statistike koriste u teoriji pouzdanosti, preživljavanja i sigurnosti, koja se široko koristi u raznim granama nauke i tehnologije.

3.5.2. Metoda statističkog modeliranja ili statistički testovi (Monte Carlo metoda).

Ova metoda je numerička metoda rješavanje složenih problema i zasniva se na korištenju slučajnih brojeva koji simuliraju probabilističke procese. Rezultati rješenja ovom metodom omogućavaju empirijski utvrđivanje zavisnosti procesa koji se proučavaju.

Rješavanje problema metodom Monte Carlo efikasno je samo uz korištenje računara velike brzine. Za rješavanje zadataka metodom Monte Carlo potrebno je imati statističku seriju, poznavati zakon njene distribucije, prosječnu vrijednost matematičkog očekivanja. t(x), standardna devijacija.

Koristeći ovu metodu, može se dobiti proizvoljno zadana tačnost rješenja, tj.

-> m(x)

3.5.3. Metoda analize sistema.

Sistemska analiza se shvata kao skup tehnika i metoda za proučavanje složeni sistemi, koji su složeni skup interakcijskih elemenata. Interakciju elemenata sistema karakterišu direktne i povratne veze.

Suština sistemske analize je da se ti odnosi identifikuju i da se utvrdi njihov uticaj na ponašanje čitavog sistema u celini. Najpotpunija i najdublja analiza sistema može se izvesti pomoću metoda kibernetike, nauke o složenim dinamičkim sistemima koji mogu da percipiraju, pohranjuju i obrađuju informacije u svrhu optimizacije i kontrole.

Analiza sistema se sastoji od četiri faze.

Prva faza se sastoji u postavljanju zadatka: određuju objekt, ciljeve i ciljeve studije, kao i kriterijume za proučavanje objekta i upravljanje njime.

U drugoj fazi utvrđuju se granice sistema koji se proučava i utvrđuje njegova struktura. Svi objekti i procesi koji se odnose na cilj podijeljeni su u dvije klase - sistem koji se proučava i eksterno okruženje. Razlikovati zatvoreno i otvoren sistemima. Prilikom istraživanja zatvoreni sistemi uticaj spoljašnje okruženje njihovo ponašanje je zanemareno. Zatim odvojite pojedinačne komponente sistema – njegove elemente, uspostavite interakciju između njih i spoljašnjeg okruženja.

Treća faza analize sistema je kompilacija matematičkog modela sistema koji se proučava. Prvo se parametariše sistem, opisuju se glavni elementi sistema i elementarni efekti na njega pomoću određenih parametara. Istovremeno, postoje parametri koji karakterišu kontinuirane i diskretne, determinističke i probabilističke procese. U zavisnosti od karakteristika procesa, koristi se jedan ili više njih. matematički aparat.

Kao rezultat treće faze analize sistema formiraju se potpuni matematički modeli sistema, opisani formalnim, na primjer, algoritamskim jezikom.

U četvrtoj fazi analizira se dobijeni matematički model, pronalaze njegovi ekstremni uslovi u cilju optimizacije procesa i sistema upravljanja i formulisanja zaključaka. Optimizacija se ocjenjuje prema kriteriju optimizacije, koji u ovom slučaju uzima ekstremne vrijednosti (minimum, maksimum, minimum).

Obično se bira jedan kriterij, a za druge se postavljaju granične maksimalno dopuštene vrijednosti. Ponekad se koriste mješoviti kriteriji, koji su funkcija primarnih parametara.

Na osnovu izabranog kriterijuma optimizacije sastavlja se zavisnost kriterijuma optimizacije od parametara modela objekta (procesa) koji se proučava.

Postoje različite matematičke metode za optimizaciju modela koji se proučavaju: metode linearnog, nelinearnog ili dinamičkog programiranja; probabilističko-statističke metode zasnovane na teoriji čekanja; teorija igara, koja razvoj procesa posmatra kao slučajne situacije.

Pitanja za samokontrolu znanja

Metodologija teorijskih istraživanja.

Glavni dijelovi faze teorijskog razvoja naučnog istraživanja.

Vrste modela i vrste modeliranja predmeta proučavanja.

Analitičke metode istraživanja.

Metode analitičkog istraživanja korištenjem eksperimenta.

Probabilističko-analitička metoda istraživanja.

Metode statičkog modeliranja (Monte Carlo metoda).

Metoda analize sistema.

Statističke metode

Statističke metode- metode analize statističkih podataka. Postoje metode primijenjene statistike, koje se mogu primijeniti u svim oblastima naučno-istraživačkog rada i svim sektorima nacionalne privrede, i druge statističke metode čija je primjena ograničena na određenu oblast. To se odnosi na metode kao što su statistička kontrola prihvatljivosti, statistička kontrola tehnoloških procesa, pouzdanost i ispitivanje, te dizajn eksperimenata.

Klasifikacija statističkih metoda

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i potkrijepiti bilo kakve prosudbe o grupi (objektima ili subjektima) s nekom unutrašnjom heterogenošću.

Preporučljivo je razlikovati tri vrste naučnih i primenjenih aktivnosti u oblasti statističkih metoda analize podataka (prema stepenu specifičnosti metoda povezanih sa uranjanjem u specifične probleme):

a) razvoj i istraživanje metoda opšte namene, bez uzimanja u obzir specifičnosti oblasti primene;

b) razvoj i istraživanje statističkih modela realnih pojava i procesa u skladu sa potrebama određene oblasti djelatnosti;

c) primjena statističkih metoda i modela za statističku analizu specifičnih podataka.

Primijenjena statistika

Opis vrste podataka i mehanizma njihovog generisanja je početak svakog statistička studija. Za opisivanje podataka koriste se i determinističke i probabilističke metode. Uz pomoć determinističkih metoda moguće je analizirati samo one podatke koji su na raspolaganju istraživaču. Na primjer, korišćene su za dobijanje tabela koje su izračunali zvanični organi državne statistike na osnovu statističkih izvještaja preduzeća i organizacija. Dobijene rezultate moguće je prenijeti na širi skup, koristiti ih za predviđanje i kontrolu samo na osnovu vjerovatno-statističkog modeliranja. Stoga se u matematičku statistiku često uključuju samo metode zasnovane na teoriji vjerovatnoće.

Ne smatramo da je moguće suprotstaviti determinističke i vjerovatno-statističke metode. Smatramo ih uzastopnim fazama statističke analize. U prvoj fazi potrebno je analizirati dostupne podatke, prikazati ih u obliku pogodnom za percepciju pomoću tabela i grafikona. Zatim je preporučljivo analizirati statističke podatke na osnovu određenih vjerovatno-statističkih modela. Napominjemo da mogućnost dubljeg uvida u suštinu realnog fenomena ili procesa pruža se izradom adekvatnog matematičkog modela.

U najjednostavnijoj situaciji, statistički podaci su vrijednosti neke karakteristike karakteristične za objekte koji se proučavaju. Vrijednosti mogu biti kvantitativne ili predstavljati indikaciju kategorije kojoj se objekt može dodijeliti. U drugom slučaju govorimo o kvalitativnom znaku.

Prilikom mjerenja po nekoliko kvantitativnih ili kvalitativnih karakteristika, dobijamo vektor kao statistički podatak o objektu. Može se smatrati novom vrstom podataka. U ovom slučaju, uzorak se sastoji od skupa vektora. Ako su dio koordinata brojevi, a dio kvalitativni (kategorizirani) podaci, onda govorimo o vektoru heterogenih podataka.

Jedan element uzorka, odnosno jedna dimenzija, može biti funkcija kao cjelina. Na primjer, opisivanje dinamike indikatora, odnosno njegove promjene tijekom vremena, je pacijentov elektrokardiogram ili amplituda otkucaja osovine motora. Ili vremenska serija koja opisuje dinamiku performansi određene firme. Tada se uzorak sastoji od skupa funkcija.

Elementi uzorka mogu biti i drugi matematički objekti. Na primjer, binarne relacije. Tako, prilikom anketiranja stručnjaka, često koriste poređanje (rangiranje) objekata ekspertize – uzoraka proizvoda, investicijskih projekata, opcija za donošenje upravljačkih odluka. U zavisnosti od propisa stručne studije, elementi uzorka mogu biti različite vrste binarnih relacija (uređenje, particionisanje, tolerancija), skupovi, rasplinuti skupovi itd.

Dakle, matematička priroda elemenata uzorka u različitim problemima primijenjene statistike može biti vrlo različita. Međutim, mogu se razlikovati dvije klase statistike - numerička i nenumerička. Shodno tome, primijenjena statistika je podijeljena na dva dijela - numeričku statistiku i nenumeričku statistiku.

Numeričke statistike su brojevi, vektori, funkcije. Mogu se sabirati, množiti koeficijentima. Dakle, u numeričkoj statistici veliki značaj imaju različite količine. Matematički aparat za analizu suma nasumičnih elemenata uzorka su (klasični) zakoni veliki brojevi i centralne granične teoreme.

Nenumerički statistički podaci su kategorisani podaci, vektori heterogenih karakteristika, binarne relacije, skupovi, rasplinuti skupovi, itd. Ne mogu se sabirati i množiti koeficijentima. Dakle, nema smisla govoriti o zbiru nenumeričke statistike. Oni su elementi nenumeričkih matematičkih prostora (skupova). Matematički aparat za analizu nenumeričkih statističkih podataka zasniva se na korištenju udaljenosti između elemenata (kao i mjera blizine, indikatora razlika) u takvim prostorima. Uz pomoć udaljenosti određuju se empirijski i teorijski prosjeci, dokazuju zakoni velikih brojeva, konstruiraju se neparametrijske procjene gustine raspodjele vjerovatnoće, rješavaju problemi dijagnostike i klaster analize itd. (vidi).

Primijenjena istraživanja koriste statističke podatke razne vrste. To je posebno zbog metoda njihovog dobivanja. Na primjer, ako se ispitivanje nekih tehničkih uređaja nastavi do određenog vremena, onda se dobija tzv. cenzurisani podaci koji se sastoje od skupa brojeva - trajanje rada određenog broja uređaja prije kvara i informacija da su preostali uređaji nastavili raditi na kraju testa. Cenzurisani podaci se često koriste u proceni i kontroli pouzdanosti tehničkih uređaja.

Obično se posebno razmatraju statističke metode analize podataka prve tri vrste. Ovo ograničenje je uzrokovano gore navedenom okolnošću da se matematički aparat za analizu podataka nenumeričke prirode bitno razlikuje od onog za podatke u obliku brojeva, vektora i funkcija.

Probabilističko-statističko modeliranje

Primenom statističkih metoda u određenim oblastima znanja i sektorima nacionalne privrede dobijamo naučne i praktične discipline kao što su „statističke metode u industriji“, „statističke metode u medicini“ itd. Sa ovog stanovišta, ekonometrija je „statistička metode u ekonomiji”. Ove discipline grupe b) obično se zasnivaju na vjerovatno-statističkim modelima izgrađenim u skladu sa karakteristikama područja primjene. Vrlo je poučno uporediti probabilističko-statističke modele koji se koriste u raznim poljima, da otkriju njihovu bliskost i ujedno navedu neke razlike. Tako se može uočiti bliskost iskaza problema i statističkih metoda koje se koriste za njihovo rješavanje u oblastima kao što su naučna medicinska istraživanja, specifična sociološka istraživanja i marketing istraživanja, ili, ukratko, u medicini, sociologiji i marketingu. One se često grupišu pod nazivom "studije uzorkovanja".

Razlika između selektivnih studija i ekspertskih studija očituje se, prije svega, u broju predmeta ili predmeta koji se ispituju - u selektivnim studijama obično se govori o stotinama, a u stručnim studijama o desetinama. Ali tehnologija ekspertskog istraživanja je mnogo sofisticiranija. Specifičnost je još izraženija u demografskim ili logističkim modelima, u obradi narativnih (tekstualnih, hroničnih) informacija ili u proučavanju međusobnog uticaja faktora.

Pitanja pouzdanosti i sigurnosti tehničkih uređaja i tehnologija, teorija čekanja detaljno se razmatraju u velikom broju naučnih radova.

Statistička analiza specifičnih podataka

Primjena statističkih metoda i modela za statističku analizu konkretnih podataka usko je vezana za probleme dotične oblasti. Rezultati trećeg od identifikovanih vidova naučne i primenjene delatnosti nalaze se na preseku disciplina. Mogu se smatrati primjerima praktične primjene statističkih metoda. Ali nema manjeg razloga da ih pripišemo odgovarajućem polju ljudske aktivnosti.

Na primjer, rezultati ankete potrošača instant kafe prirodno se pripisuju marketingu (što oni rade kada drže predavanja o marketinškom istraživanju). Proučavanje dinamike rasta cijena korištenjem indeksa inflacije izračunatih iz nezavisno prikupljenih informacija je od interesa prvenstveno sa stanovišta ekonomije i menadžmenta. nacionalne ekonomije(kako na makro nivou tako i na nivou pojedinačnih organizacija).

Perspektive razvoja

Teorija statističkih metoda usmjerena je na rješavanje stvarnih problema. Stoga se u njemu stalno pojavljuju nove formulacije matematičkih problema statističke analize podataka, razvijaju se i potkrepljuju nove metode. Opravdanje se često provodi matematičkim sredstvima, odnosno dokazivanjem teorema. Važnu ulogu igra metodološka komponenta – kako tačno postaviti zadatke, koje pretpostavke prihvatiti u svrhu daljeg matematičkog proučavanja. Uloga modernog informacione tehnologije posebno kompjuterski eksperiment.

Hitan zadatak je analiza istorije statističkih metoda kako bi se identifikovali trendovi razvoja i primenili ih za predviđanje.

Književnost

2. Naylor T. Eksperimenti simulacije mašina sa modelima ekonomskih sistema. - M.: Mir, 1975. - 500 str.

3. Kramer G. Matematičke metode statistika. - M.: Mir, 1948 (1. izd.), 1975 (2. izd.). - 648 str.

4. Bolshev L. N., Smirnov N. V. Tabele matematičke statistike. - M.: Nauka, 1965 (1. izd.), 1968 (2. izd.), 1983. (3. izd.).

5. Smirnov N. V., Dunin-Barkovsky I. V. Kurs teorije vjerovatnoće i matematičke statistike za tehničke primjene. Ed. 3., stereotipno. - M.: Nauka, 1969. - 512 str.

6. Norman Draper, Harry Smith Primijenjena regresiona analiza. Višestruka regresija = Primijenjena regresijska analiza. - 3. izd. - M.: "Dijalektika", 2007. - S. 912. - ISBN 0-471-17082-8

Vidi također

Wikimedia fondacija. 2010 .

  • Yat Kha
  • amalgam (višeznačna odrednica)

Pogledajte šta je "Statističke metode" u drugim rječnicima:

    STATISTIČKE METODE- STATISTIČKE METODE naučne metode opise i studije masovnih pojava koje dozvoljavaju kvantitativni (numerički) izraz. Reč „statistika“ (od jigal. stato stanje) ima zajednički koren sa rečju „država“. U početku je…… Philosophical Encyclopedia

    STATISTIČKE METODE -- naučne metode opisa i proučavanja masovnih pojava koje omogućavaju kvantitativno (numeričko) izražavanje. Reč "statistika" (od italijanskog stato - država) ima zajednički koren sa rečju "država". U početku se to odnosilo na nauku o menadžmentu i ... Philosophical Encyclopedia

    Statističke metode- (u ekologiji i biocenologiji) metode statistike varijacija koje vam omogućavaju da istražite cjelinu (na primjer, fitocenozu, populaciju, produktivnost) u njenim određenim skupovima (na primjer, prema podacima dobijenim na stranicama za registraciju) i procijenite stupanj točnosti ... ... Ekološki rječnik

    statističke metode- (u psihologiji) (od latinskog status status) neke metode primijenjene matematičke statistike koje se koriste u psihologiji uglavnom za obradu eksperimentalnih rezultata. Glavna svrha korištenja S. m je povećanje valjanosti zaključaka u ... ... Velika psihološka enciklopedija

    Statističke metode- 20.2. Statističke metode Specifične statističke metode koje se koriste za organizovanje, regulisanje i validaciju aktivnosti uključuju, ali nisu ograničene na: a) dizajn eksperimenata i faktorske analize; b) analiza varijanse i… Rječnik-priručnik pojmova normativne i tehničke dokumentacije

    STATISTIČKE METODE- Metode za proučavanje veličina. aspekte masovnih društava. pojavama i procesima. S. m. omogućavaju u digitalnom smislu karakterizaciju tekućih promjena u društvima. procesa, proučavati razl. oblici društveno-ekonomske. obrasci, promjena...... Poljoprivredni enciklopedijski rječnik

    STATISTIČKE METODE- neke metode primijenjene matematičke statistike koje se koriste za obradu eksperimentalnih rezultata. Određeni broj statističkih metoda je razvijen posebno za osiguranje kvaliteta psihološki testovi, za upotrebu u profesionalnim ... ... Stručno obrazovanje. Rječnik

    STATISTIČKE METODE- (u inženjerskoj psihologiji) (od latinskog status status) neke metode primijenjene statistike koje se koriste u inženjerskoj psihologiji za obradu eksperimentalnih rezultata. Glavna svrha korištenja S. m je povećanje valjanosti zaključaka u ... ... Enciklopedijski rečnik psihologije i pedagogije

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Objavljeno na http://www.allbest.ru/

Uvod

1. Hi-kvadrat raspodjela

Zaključak

Aplikacija

Uvod

Kako se pristupi, ideje i rezultati teorije vjerovatnoće koriste u našim životima? matematička teorija kvadrata

Osnova je probabilistički model realne pojave ili procesa, tj. matematički model, u kojem su objektivni odnosi izraženi u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“). Ponekad se slučajnost namjerno unosi u situaciju, na primjer, prilikom izvlačenja ždrijeba, slučajnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerovatnoće omogućava da se izračunaju druge vjerovatnoće koje su od interesa za istraživača.

Vjerovatni model pojave ili procesa je osnova matematičke statistike. Koriste se dvije paralelne serije koncepata - oni koji se odnose na teoriju (vjerovatni model) i oni koji se odnose na praksu (uzorak rezultata opservacije). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Po pravilu, karakteristike uzorka su procjene teorijskih. Istovremeno, količine koje se odnose na teorijsku seriju "su u glavama istraživača", odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za direktno mjerenje. Istraživači imaju samo selektivne podatke, uz pomoć kojih pokušavaju da utvrde svojstva teorijskog vjerovatnog modela koja ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da je samo uz njegovu pomoć moguće prenijeti svojstva utvrđena rezultatima analize određenog uzorka na druge uzorke, kao i na cjelokupnu tzv. opštu populaciju. Termin "populacija" se koristi kada mi pričamo o velikom, ali konačnom skupu jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kafe u Moskvi. Svrha marketinških ili socioloških istraživanja je da se izjave primljene sa uzorka od stotina ili hiljada ljudi prenesu na opću populaciju od nekoliko miliona ljudi. U kontroli kvaliteta u ulozi stanovništva pojavljuje se serija proizvoda.

Da bi se zaključci prenijeli iz uzorka na veću populaciju, potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke su zasnovane na odgovarajućem vjerovatnostnom modelu.

Naravno, moguće je obraditi podatke uzorka bez korištenja jednog ili drugog vjerovatnostnog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, izračunati učestalost ispunjenja određenih uslova itd. Međutim, rezultati proračuna primjenjivat će se samo na određeni uzorak; prenošenje zaključaka dobivenih uz njihovu pomoć na bilo koji drugi skup je pogrešno. Ova aktivnost se ponekad naziva i "analiza podataka". U poređenju sa probabilističko-statističkim metodama, analiza podataka ima ograničenu kognitivnu vrednost.

Dakle, upotreba probabilističkih modela zasnovanih na procjeni i testiranju hipoteza uz pomoć karakteristika uzorka je suština vjerovatno-statističkih metoda odlučivanja.

1. Hi-kvadrat raspodjela

Normalna distribucija definira tri distribucije koje se danas najčešće koriste u statističkoj obradi podataka. Ovo su distribucije Pirsona ("chi - kvadrat"), Studenta i Fishera.

Fokusiraćemo se na distribuciju ("chi - kvadrat"). Ovu distribuciju prvi je proučavao astronom F. Helmert 1876. godine. U vezi sa Gausovom teorijom grešaka, proučavao je sume kvadrata n nezavisnih standardno normalno distribuiranih slučajnih varijabli. Kasnije je Karl Pearson ovu funkciju distribucije nazvao "hi-kvadrat". I sada distribucija nosi njegovo ime.

Zbog svoje bliske veze sa normalnom distribucijom, distribucija h2 igra važnu ulogu u teoriji vjerovatnoće i matematičkoj statistici. Distribucija h2, i mnoge druge distribucije koje su definirane distribucijom h2 (na primjer, Studentova distribucija), opisuju uzorke distribucije različitih funkcija iz normalno raspoređenih opservacija i koriste se za konstruiranje intervala povjerenja i statističkih testova.

Pearsonova distribucija (chi - kvadrat) - distribucija slučajne varijable gdje su X1, X2, ..., Xn normalne nezavisne slučajne varijable, a matematičko očekivanje svake od njih je nula, a standardna devijacija jedan.

Zbir kvadrata

distribuiraju u skladu sa zakonom ("chi - kvadrat").

U ovom slučaju, broj pojmova, tj. n, naziva se "broj stepena slobode" hi-kvadrat distribucije. Kako se broj stupnjeva slobode povećava, distribucija se polako približava normalnoj.

Gustina ove distribucije

Dakle, distribucija h2 zavisi od jednog parametra n - broja stepeni slobode.

Funkcija distribucije h2 ima oblik:

ako je h2?0. (2.7.)

Slika 1 prikazuje grafik gustine vjerovatnoće i funkcije raspodjele χ2 za različite stupnjeve slobode.

Slika 1. Zavisnost gustine vjerovatnoće q (x) u distribuciji h2 (hi - kvadrat) za različit broj stupnjeva slobode

Trenuci distribucije "hi-kvadrat":

Hi-kvadrat distribucija se koristi u procjeni varijanse (koristeći interval povjerenja), u testiranju hipoteza o slaganju, homogenosti, nezavisnosti, prvenstveno za kvalitativne (kategorizirane) varijable koje uzimaju konačan broj vrijednosti, te u mnogim drugim zadacima statističkih podataka analiza.

2. "Hi-kvadrat" u problemima statističke analize podataka

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i potkrijepiti bilo kakve prosudbe o grupi (objektima ili subjektima) s nekom unutrašnjom heterogenošću.

Savremeni stupanj razvoja statističkih metoda može se računati od 1900. godine, kada je Englez K. Pearson osnovao časopis "Biometrika". Prva trećina 20. veka prošla pod znakom parametarske statistike. Proučavane su metode zasnovane na analizi podataka iz parametarskih familija distribucija opisanih krivuljama Pearsonove porodice. Najpopularnija je bila normalna distribucija. Za testiranje hipoteza korišteni su kriterijumi Pearson, Student i Fisher. Predložena je metoda maksimalne vjerovatnoće, analiza varijanse i formulirane glavne ideje za planiranje eksperimenta.

Hi-kvadrat distribucija je jedna od najčešće korištenih u statistici za testiranje statističkih hipoteza. Na osnovu "hi-kvadrat" distribucije, konstruisan je jedan od najmoćnijih testova dobrote uklapanja, Pirsonov "hi-kvadrat" test.

Test ispravnosti je kriterij za testiranje hipoteze o predloženom zakonu nepoznate raspodjele.

P2 ("hi-kvadrat") test se koristi za testiranje hipoteze različitih distribucija. To je njegova zasluga.

Proračunska formula kriterija je jednaka

gdje su m i m" empirijske i teorijske frekvencije, respektivno

distribucija koja se razmatra;

n je broj stepeni slobode.

Za verifikaciju, potrebno je da uporedimo empirijske (opažene) i teorijske (izračunate pod pretpostavkom normalne distribucije) frekvencije.

Ako se empirijske frekvencije potpuno poklapaju sa frekvencijama izračunatim ili očekivanim, S (E - T) = 0 i kriterij ch2 će također biti jednak nuli. Ako S (E - T) nije jednako nuli, to će ukazati na neslaganje između izračunatih frekvencija i empirijskih frekvencija serije. U takvim slučajevima potrebno je procijeniti značajnost kriterija p2, koji teoretski može varirati od nule do beskonačnosti. Ovo se radi upoređivanjem stvarno dobijene vrijednosti ch2f sa njegovom kritičnom vrijednošću (ch2st) (a) i brojem stupnjeva slobode (n).

Distribucija vjerojatnih vrijednosti slučajne varijable h2 je kontinuirana i asimetrična. Zavisi od broja stupnjeva slobode (n) i pristupa normalna distribucija kako se broj zapažanja povećava. Dakle, primjena kriterija p2 na ocjenu diskretne distribucije je povezan sa nekim greškama koje utiču na njegovu vrednost, posebno za male uzorke. Da bi se dobile preciznije procjene, uzorak distribuiran u nizu varijacija treba imati najmanje 50 opcija. Ispravna primjena kriterijum p2 takođe zahteva da frekvencije varijanti u ekstremnim klasama ne budu manje od 5; ako ih je manje od 5, onda se kombinuju sa frekvencijama susjednih klasa tako da je njihov ukupni iznos veći ili jednak 5. U skladu sa kombinacijom frekvencija, smanjuje se i broj klasa (N). Broj stupnjeva slobode se postavlja prema sekundarnom broju klasa, uzimajući u obzir broj ograničenja slobode varijacije.

Pošto tačnost određivanja kriterijuma p2 u velikoj meri zavisi od tačnosti izračunavanja teorijskih frekvencija (T), za dobijanje razlike između empirijske i izračunate frekvencije treba koristiti nezaokružene teorijske frekvencije.

Kao primjer uzmimo studiju objavljenu na web stranici posvećenoj primjeni statističkih metoda u humanističkim naukama.

Hi-kvadrat test omogućava poređenje frekvencijskih distribucija, bez obzira da li su one normalno raspoređene ili ne.

Učestalost se odnosi na broj pojavljivanja događaja. Obično se učestalost pojavljivanja događaja bavi kada se varijable mjere u skali imena i njihove druge karakteristike, osim učestalosti, nemoguće je ili problematično odabrati. Drugim riječima, kada varijabla ima kvalitativne karakteristike. Takođe, mnogi istraživači imaju tendenciju da prevedu rezultate testova u nivoe (visoki, srednji, niski) i prave tabele distribucije rezultata kako bi saznali broj ljudi na ovim nivoima. Da bi se dokazalo da je na jednom od nivoa (u jednoj od kategorija) broj ljudi zaista veći (manji), koristi se i hi-kvadrat koeficijent.

Pogledajmo najjednostavniji primjer.

Proveden je test samopoštovanja među mlađim adolescentima. Rezultati testova su prevedeni u tri nivoa: visok, srednji, nizak. Frekvencije su raspoređene na sljedeći način:

Visoka (H) 27 pers.

Srednje (C) 12 osoba

Niska (H) 11 pers.

Očigledno je da je većina djece sa visokim samopoštovanjem, međutim, to treba statistički dokazati. Da bismo to učinili, koristimo Hi-kvadrat test.

Naš zadatak je provjeriti da li se dobijeni empirijski podaci razlikuju od teorijski jednako vjerovatnih. Da biste to učinili, potrebno je pronaći teorijske frekvencije. U našem slučaju, teorijske frekvencije su jednako vjerojatne frekvencije koje se nalaze sabiranjem svih frekvencija i dijeljenjem sa brojem kategorija.

u našem slučaju:

(B + C + H) / 3 = (27 + 12 + 11) / 3 = 16,6

Formula za izračunavanje hi-kvadrat testa je:

h2 \u003d? (E - T) I / T

Pravimo sto:

Empirijski (uh)

Teorijski (T)

(E - T)Í / T

Pronađite zbir zadnje kolone:

Sada morate pronaći kritičnu vrijednost kriterija prema tabeli kritičnih vrijednosti (tabela 1 u dodatku). Da bismo to učinili, potreban nam je broj stupnjeva slobode (n).

n = (R - 1) * (C - 1)

gdje je R broj redova u tabeli, C je broj kolona.

U našem slučaju postoji samo jedna kolona (što znači originalne empirijske frekvencije) i tri reda (kategorije), pa se formula mijenja - izuzimamo kolone.

n = (R - 1) = 3-1 = 2

Za vjerovatnoću greške p?0,05 i n = 2, kritična vrijednost je h2 = 5,99.

Dobijena empirijska vrijednost je veća od kritične vrijednosti – razlike u učestalosti su značajne (n2= 9,64; p≤0,05).

Kao što vidite, izračunavanje kriterija je vrlo jednostavno i ne oduzima puno vremena. Praktična vrijednost hi-kvadrat testa je ogromna. Ova metoda je najvrednija u analizi odgovora na upitnike.

Uzmimo složeniji primjer.

Na primjer, psiholog želi da zna da li je istina da su nastavnici pristrasniji prema dječacima nego prema djevojčicama. One. verovatnije je da hvali devojke. Da bi to uradila, psiholog je analizirao karakteristike učenika koje su napisali nastavnici za učestalost pojavljivanja tri reči: „aktivan“, „marljiv“, „disciplinovan“, prebrojani su i sinonimi reči.

Podaci o učestalosti pojavljivanja riječi uneseni su u tabelu:

Za obradu dobijenih podataka koristimo hi-kvadrat test.

Da bismo to uradili, konstruišemo tabelu raspodele empirijskih frekvencija, tj. frekvencije koje opažamo:

Teoretski, očekujemo da frekvencije budu ravnomjerno raspoređene, tj. učestalost će biti raspoređena proporcionalno između dječaka i djevojčica. Napravimo tabelu teoretskih frekvencija. Da biste to učinili, pomnožite zbir reda sa zbirom kolone i podijelite rezultirajući broj sa ukupnim zbrojem (s).

Dobivena tabela za izračune će izgledati ovako:

Empirijski (uh)

Teorijski (T)

(E - T)Í / T

momci

"aktivan"

"Marljiv"

"disciplinovan"

"aktivan"

"Marljiv"

"disciplinovan"

Iznos: 4.21

h2 \u003d? (E - T) I / T

gdje je R broj redova u tabeli.

U našem slučaju, hi-kvadrat = 4,21; n = 2.

Prema tabeli kritičnih vrijednosti kriterija nalazimo: sa n = 2 i nivoom greške od 0,05, kritična vrijednost h2 = 5,99.

Rezultirajuća vrijednost je manja od kritične vrijednosti, što znači da je nulta hipoteza prihvaćena.

Zaključak: nastavnici ne pridaju značaj polu djeteta kada pišu njegove karakteristike.

Zaključak

Studenti gotovo svih specijalnosti izučavaju sekciju „teorija verovatnoće i matematička statistika“ na kraju kursa više matematike, u stvarnosti se upoznaju samo sa nekim osnovnim pojmovima i rezultatima, koji očigledno nisu dovoljni za praktičan rad. Nekim matematičkim metodama istraživanja studenti se susreću u specijalnim predmetima (npr. „Prognoziranje i tehničko-ekonomsko planiranje“, „Tehnička i ekonomska analiza“, „Kontrola kvaliteta proizvoda“, „Marketing“, „Kontroliranje“, „Matematičke metode prognoziranje“, „Statistika“ itd. – u slučaju studenata ekonomskih specijalnosti), međutim, prikaz je u većini slučajeva vrlo štur i recepturne prirode. Kao rezultat toga, znanje primijenjenih statističara je nedovoljno.

Stoga je predmet "Primijenjena statistika" u tehnički univerziteti, i u ekonomskih univerziteta- predmet "Ekonometrija", budući da je ekonometrija, kao što znate, statistička analiza konkretnih ekonomskih podataka.

Teorija vjerovatnoće i matematička statistika pružaju osnovna znanja za primijenjenu statistiku i ekonometriju.

Potrebni su specijalistima za praktičan rad.

Razmatrao sam kontinuirani probabilistički model i pokušao na primjerima pokazati njegovu upotrebljivost.

I na kraju svog rada došao sam do zaključka da je kompetentna implementacija osnovnih postupaka matematičke i statičke analize podataka, statičko testiranje hipoteza nemoguća bez poznavanja hi-kvadrat modela, kao i sposobnosti korištenja njen sto.

Bibliografija

1. Orlov A.I. Primijenjena statistika. M.: Izdavačka kuća "Ispit", 2004.

2. Gmurman V.E. Teorija vjerojatnosti i matematička statistika. M.: postdiplomske škole, 1999. - 479s.

3. Ayvozyan S.A. Teorija vjerojatnosti i primijenjena statistika, v.1. M.: Jedinstvo, 2001. - 656s.

4. Khamitov G.P., Vedernikova T.I. Vjerovatnoće i statistika. Irkutsk: BSUEP, 2006 - 272 str.

5. Ezhova L.N. Ekonometrija. Irkutsk: BSUEP, 2002. - 314 str.

6. Mosteller F. Pedeset zabavnih probabilističkih problema s rješenjima. M.: Nauka, 1975. - 111 str.

7. Mosteller F. Vjerovatnoća. M.: Mir, 1969. - 428s.

8. Yaglom A.M. Vjerovatnoća i informacija. M.: Nauka, 1973. - 511s.

9. Čistjakov V.P. Kurs vjerovatnoće. M.: Nauka, 1982. - 256s.

10. Kremer N.Sh. Teorija vjerojatnosti i matematička statistika. M.: UNITI, 2000. - 543s.

11. Matematička enciklopedija, v.1. M.: Sovjetska enciklopedija, 1976. - 655s.

12. http://psystat.at.ua/ - Statistika u psihologiji i pedagogiji. Članak Hi-kvadrat test.

Aplikacija

Kritične tačke distribucije p2

Tabela 1

Hostirano na Allbest.ru

...

Slični dokumenti

    Vjerovatni model i aksiomatika A.N. Kolmogorov. Slučajne varijable i vektori, klasični granični problem teorije vjerovatnoće. Primarna obrada statističkih podataka. Tačkaste procjene numeričkih karakteristika. Statističko testiranje hipoteza.

    priručnik za obuku, dodan 03.02.2010

    Pravila za izvođenje i dizajn kontrolni radovi za dopisni odjel. Zadaci i primjeri rješavanja zadataka iz matematičke statistike i teorije vjerojatnosti. Tablice referentnih podataka o distribuciji, standardna normalna gustina distribucije.

    priručnik za obuku, dodan 29.11.2009

    Osnovne metode formalizovanog opisa i analize slučajnih pojava, obrade i analize rezultata fizičkih i numeričkih eksperimenata teorije verovatnoće. Osnovni pojmovi i aksiomi teorije vjerovatnoće. Osnovni pojmovi matematičke statistike.

    kurs predavanja, dodato 08.04.2011

    Određivanje zakona raspodjele vjerovatnoće rezultata mjerenja u matematičkoj statistici. Provjera usklađenosti empirijska distribucija teorijski. Određivanje intervala pouzdanosti u kojem se nalazi vrijednost mjerene veličine.

    seminarski rad, dodan 11.02.2012

    Konvergencija nizova slučajnih varijabli i distribucije vjerovatnoće. Metoda karakterističnih funkcija. Testiranje statističkih hipoteza i ispunjavanje središnje granične teoreme za date nizove nezavisnih slučajnih varijabli.

    seminarski rad, dodan 13.11.2012

    Glavne faze obrade podataka iz prirodnih posmatranja metodom matematičke statistike. Evaluacija dobijenih rezultata, njihova upotreba u donošenju upravljačkih odluka u oblasti zaštite prirode i upravljanja prirodom. Testiranje statističkih hipoteza.

    praktični rad, dodato 24.05.2013

    Suština zakona distribucije i njegova praktična primjena za rješavanje statističkih problema. Određivanje varijanse slučajne varijable, matematičko očekivanje i standardna devijacija. Osobine jednosmjerne analize varijanse.

    test, dodano 12.07.2013

    Vjerovatnoća i njena opšta definicija. Teoreme sabiranja i množenja vjerovatnoća. Diskretne slučajne varijable i njihove numeričke karakteristike. Zakon velikih brojeva. Statistička distribucija uzorka. Elementi korelacione i regresione analize.

    kurs predavanja, dodato 13.06.2015

    Program predmeta, osnovni pojmovi i formule teorije vjerovatnoće, njihova opravdanost i značaj. Mjesto i uloga matematičke statistike u disciplini. Primjeri i objašnjenja za rješavanje najčešćih zadataka na različite teme ovih akademskih disciplina.

    priručnik za obuku, dodan 15.01.2010

    Teorija vjerovatnoće i matematička statistika su nauke o metodama kvantitativne analize masovnih slučajnih pojava. Skup vrijednosti slučajne varijable naziva se uzorak, a elementi skupa se nazivaju vrijednosti uzorka slučajne varijable.

Od posebnog interesa je kvantifikacija poduzetnički rizik korištenjem metoda matematičke statistike. Glavni alati ove metode procjene su:

§ vjerovatnoća pojave slučajne varijable,

§ matematičko očekivanje ili prosječna vrijednost slučajne varijable koja se proučava,

§ varijansa,

§ standardna (srednja kvadratna) devijacija,

§ koeficijent varijacije,

§ raspodjela vjerovatnoće slučajne varijable koja se proučava.

Da biste doneli odluku, morate znati veličinu (stepen) rizika koji se meri pomoću dva kriterijuma:

1) prosječna očekivana vrijednost (matematičko očekivanje),

2) fluktuacije (varijabilnost) mogućeg rezultata.

Prosječna očekivana vrijednost je ponderisani prosjek slučajne varijable, koja je povezana s neizvjesnošću situacije:

,

gdje je vrijednost slučajne varijable.

Srednja očekivana vrijednost mjeri rezultat koji u prosjeku očekujemo.

Srednja vrijednost je generalizirana kvalitativna karakteristika i ne dozvoljava donošenje odluke u korist bilo koje pojedinačne vrijednosti slučajne varijable.

Za donošenje odluke potrebno je izmjeriti fluktuacije indikatora, odnosno odrediti mjeru varijabilnosti mogućeg rezultata.

Fluktuacija mogućeg rezultata je stepen odstupanja očekivane vrijednosti od prosječne vrijednosti.

Da bi se to postiglo, u praksi se obično koriste dva blisko povezana kriterija: "disperzija" i "standardna devijacija".

Disperzija – ponderisani prosek kvadrata stvarni rezultati od prosječnog očekivanog:

standardna devijacija je kvadratni korijen varijanse. To je dimenzionalna veličina i mjeri se u istim jedinicama u kojima se mjeri proučavani predmet. slučajna vrijednost:

.

Disperzija i standardna devijacija služe kao mjera apsolutne fluktuacije. Za analizu se obično koristi koeficijent varijacije.

Koeficijent varijacije je omjer standardne devijacije i srednje očekivane vrijednosti, pomnožen sa 100%

ili .

Apsolutne vrijednosti proučavanog indikatora ne utiču na koeficijent varijacije.

Uz pomoć koeficijenta varijacije mogu se uporediti čak i fluktuacije karakteristika izraženih u različitim mjernim jedinicama. Koeficijent varijacije može varirati od 0 do 100%. Što je veći omjer, to je veća fluktuacija.


AT ekonomska statistika utvrđena je sljedeća procjena različitih vrijednosti koeficijenta varijacije:

do 10% - slaba fluktuacija, 10 - 25% - umjerena, preko 25% - visoka.

Shodno tome, što su fluktuacije veće, to je veći rizik.

Primjer. Vlasnik malog dućana na početku svakog dana kupi neki kvarljivi proizvod na prodaju. Jedinica ovog proizvoda košta 200 UAH. Prodajna cijena - 300 UAH. za jedinicu. Iz zapažanja je poznato da potražnja za ovim proizvodom tokom dana može biti 4, 5, 6 ili 7 jedinica sa odgovarajućim vjerovatnoćama 0,1; 0,3; 0,5; 0.1. Ako se proizvod ne proda tokom dana, onda će se na kraju dana uvijek kupiti po cijeni od 150 UAH. za jedinicu. Koliko jedinica ovog proizvoda bi vlasnik trgovine trebao kupiti na početku dana?

Rješenje. Hajde da napravimo matricu profita za vlasnika prodavnice. Izračunajmo dobit koju će vlasnik dobiti ako, na primjer, kupi 7 jedinica proizvoda, a proda u toku dana 6 i na kraju dana jednu jedinicu. Svaka jedinica prodanog proizvoda tijekom dana daje dobit od 100 UAH, a na kraju dana - gubitak od 200 - 150 = 50 UAH. Dakle, dobit će u ovom slučaju biti:

Proračuni se vrše na sličan način za druge kombinacije ponude i potražnje.

Očekivani profit se izračunava kao matematičko očekivanje mogućih vrijednosti profita za svaki red konstruirane matrice, uzimajući u obzir odgovarajuće vjerovatnoće. Kao što vidite, među očekivanim profitom najveći je 525 UAH. Odgovara kupovini predmetnog proizvoda u količini od 6 jedinica.

Da bismo potkrijepili konačnu preporuku o kupovini potrebnog broja jedinica proizvoda, izračunavamo varijansu, standardnu ​​devijaciju i koeficijent varijacije za svaku moguću kombinaciju ponude i potražnje proizvoda (svaka linija profitne matrice):

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Što se tiče kupovine 6 jedinica proizvoda od strane vlasnika prodavnice u odnosu na 5 i 4 jedinice, to nije očigledno, jer je rizik pri kupovini 6 jedinica proizvoda (19,2%) veći nego kod kupovine 5 jedinica (9,3). %), pa čak i više nego pri kupovini 4 jedinice (0%).

Tako imamo sve informacije o očekivanoj dobiti i rizicima. I odlučite koliko jedinica proizvoda trebate kupiti svakog jutra za vlasnika trgovine, uzimajući u obzir njegovo iskustvo, apetit za rizik.

Po našem mišljenju, vlasnika radnje treba savjetovati da kupi 5 jedinica proizvoda svakog jutra i njegov prosječni očekivani profit će biti 485 UAH. a ako to uporedimo sa kupovinom 6 jedinica proizvoda, u kojima je prosječna očekivana dobit 525 UAH, što je 40 UAH. više, ali će rizik u ovom slučaju biti 2,06 puta veći.