Osnovni koncepti korelacione i regresione analize

Istražujući prirodu, društvo, ekonomiju, potrebno je voditi računa o odnosu posmatranih procesa i pojava. U ovom slučaju, potpunost opisa je određena na ovaj ili onaj način. kvantitativne karakteristike uzročne veze između njih. Evaluacija najznačajnijih od njih, kao i uticaja nekih faktora na druge, jedan je od glavnih zadataka statistike.

Oblici ispoljavanja međusobnih odnosa su veoma raznovrsni. Kao dva najčešća tipa dodijeliti funkcionalne(potpuno) i korelacija(nepotpuna) veza. U prvom slučaju, vrijednost atributa faktora striktno odgovara jednoj ili više vrijednosti funkcije. Često se funkcionalna veza manifestira u fizici, hemiji. U ekonomiji, primjer je direktno proporcionalan odnos između produktivnosti rada i povećanja proizvodnje.

Korelacija (koja se još naziva i nepotpuna, ili statistička) pojavljuje se u prosjeku, za masovna promatranja, kada date vrijednosti zavisne varijable odgovaraju određenom broju vjerojatnih vrijednosti nezavisne varijable. Objašnjenje za to je složenost odnosa između analiziranih faktora, na čiju interakciju utiču neobračunate slučajne varijable. Stoga se odnos između znakova ispoljava samo u prosjeku, u masi slučajeva. Uz korelaciju, svaka vrijednost argumenta odgovara nasumično raspoređenim vrijednostima funkcije u određenom intervalu.

Na primjer, neko povećanje argumenta povlači za sobom samo prosječno povećanje ili smanjenje (ovisno o smjeru) funkcije, dok će se specifične vrijednosti za pojedinačne jedinice promatranja razlikovati od prosjeka. Ove zavisnosti su sveprisutne. Na primjer, u poljoprivredi, to može biti odnos između prinosa i količine primijenjenog gnojiva. Očigledno, potonji su uključeni u formiranje usjeva. Ali za svako specifično polje, parcelu, ista količina unesenog đubriva će uzrokovati različito povećanje prinosa, jer postoji niz drugih faktora (vremenski uslovi, uslovi zemljišta, itd.) konačni rezultat. Međutim, u prosjeku se opaža takav odnos - povećanje mase primijenjenih gnojiva dovodi do povećanja prinosa.



U komunikacijskom pravcu postoje ravno, kada se zavisna varijabla povećava sa povećanjem faktorske osobine, i obrnuto, pri čemu je rast potonjeg praćen smanjenjem funkcije. Takvi odnosi se također mogu nazvati pozitivnim i negativnim.

Što se tiče njihovog analitičkog oblika komunikacije, postoje linearno i nelinearne. U prvom slučaju, u prosjeku se pojavljuju linearni odnosi između znakova. Nelinearni odnos je izražen nelinearna funkcija, a varijable su međusobno povezane u prosjeku nelinearno.

Postoji još jedna prilično važna karakteristika veza sa stanovišta interakcijskih faktora. Ako je odnos između dvije karakteristike karakteriziran, onda se naziva parna soba. Ako se proučava više od dvije varijable − višestruko.

Gore navedene karakteristike klasifikacije najčešće se nalaze u Statistička analiza. Ali pored navedenih, postoje i oni direktno, indirektno i false veze. Zapravo, suština svakog od njih je očigledna iz imena. U prvom slučaju, faktori su u direktnoj interakciji jedni s drugima. Indirektni odnos karakteriše učešće neke treće varijable, koja posreduje u odnosu između proučavanih osobina. Lažna veza je veza uspostavljena formalno i, po pravilu, potvrđena samo kvantitativnim procjenama. Ona nema kvalitativnu osnovu ili je besmislena.

Razlikuju se po snazi slab i jaka veze. Ova formalna karakteristika izražena je specifičnim vrijednostima i tumači se u skladu s općeprihvaćenim kriterijima za snagu veze za određene pokazatelje.

U većini opšti pogled Zadatak statistike u oblasti proučavanja odnosa je da kvantifikuje njihovu prisutnost i usmerenost, kao i da okarakteriše snagu i oblik uticaja jednih faktora na druge. Za njegovo rješavanje koriste se dvije grupe metoda, od kojih jedna uključuje metode korelacione analize a druga je regresiona analiza. Istovremeno, jedan broj istraživača kombinuje ove metode u korelaciono-regresionu analizu, koja ima neke osnove: prisustvo niza uobičajenih računskih procedura, komplementarnost u tumačenju rezultata itd.

Stoga se u ovom kontekstu može govoriti o korelacionoj analizi u širem smislu – kada se odnos sveobuhvatno karakteriše. Istovremeno, postoje i korelaciona analiza u užem smislu – kada se proučava snaga veze – i regresiona analiza, tokom koje se vrednuje njen oblik i uticaj nekih faktora na druge.

Pravilni zadaci korelacione analize svode se na mjerenje bliskosti veze između različitih karakteristika, određivanje nepoznatog uzročnost i evaluacija faktora koji imaju najveći uticaj na rezultirajući atribut.

Zadaci regresiona analiza leže u polju uspostavljanja oblika zavisnosti, određivanja regresione funkcije, koristeći jednadžbu za procenu nepoznatih vrednosti zavisne varijable.

Rješenje ovih problema zasniva se na odgovarajućim tehnikama, algoritmima, indikatorima, čija upotreba daje povoda da se govori o statističkom proučavanju odnosa.

Treba napomenuti da tradicionalne metode korelacije i regresije su široko zastupljene u raznim vrstama statističkih softverskih paketa za računare. Istraživaču jedino preostaje da pravilno pripremi informacije, odabere softverski paket koji zadovoljava zahtjeve analize i bude spreman za interpretaciju dobijenih rezultata. Postoji mnogo algoritama za izračunavanje komunikacijskih parametara, a trenutno je teško da je preporučljivo izvoditi tako složenu vrstu analize ručno. Računski postupci su od nezavisnog interesa, ali je poznavanje principa proučavanja odnosa, mogućnosti i ograničenja pojedinih metoda interpretacije rezultata preduslov za istraživanje.

Metode za procjenu nepropusnosti veze dijele se na korelacijske (parametrijske) i neparametarske. Parametarske metode se zasnivaju na korištenju, po pravilu, procjena normalna distribucija i koriste se u slučajevima kada se ispitana populacija sastoji od veličina koje su u skladu sa zakonom normalne distribucije. U praksi se ova pozicija najčešće zauzima a priori. Zapravo, ove metode su parametarske i obično se nazivaju korelacionim metodama.

Neparametarske metode ne nameću ograničenja na zakon raspodjele proučavanih veličina. Njihova prednost je i jednostavnost proračuna.

^ TEMA 7. STATISTIČKA PROUČAVANJA ODNOSA

  1. Vrste i oblici korelacionih odnosa među pojavama

Prije nego što pređemo na proučavanje odnosa između pojava, potrebno je utvrditi vrstu odnosa između faktora i rezultantnih karakteristika. U statistici se razlikuju funkcionalni odnos i stohastička zavisnost.funkcionalan nazvati takvu vezu u kojoj je određena vrijednost faktor atribut odgovara samo jednoj vrijednosti rezultirajućeg atributa. Ako se uzročna ovisnost ne pojavljuje u svakom pojedinačnom slučaju, već općenito, u prosjeku, uz veliki broj zapažanja, tada se takva ovisnost nazivastohastički . Poseban slučaj stohastičke veze jekorelacija veza u kojoj je promjena prosječne vrijednosti efektivnog atributa posljedica promjene predznaka faktora.

Ovisno o smjeru djelovanja, razlikuje se vezadirektno i obrnuto . Kod direktnog povezivanja, smjer promjene rezultirajućeg atributa poklapa se sa smjerom atributa-faktora, tj. sa povećanjem atributa faktora, rezultantni se takođe povećava i obrnuto.

Prema analitičkom izrazu (formi) veze mogu bitipravolinijski i krivolinijski. Kod pravolinijskog odnosa sa povećanjem vrijednosti atributa faktora, dolazi do kontinuiranog povećanja ili smanjenja vrijednosti efektivnog atributa. Matematički, takav odnos je predstavljen jednadžbom prave linije y \u003d a o +a 1 x, a grafički - ravna linija.

Sa krivolinijskim odnosom sa povećanjem vrijednosti faktorskog atributa, povećanje (ili smanjenje) efektivnog atributa se dešava neravnomjerno ili se njegov smjer obrće. Geometrijski, takve veze su predstavljene zakrivljenim linijama (hiperbola, parabola, itd.).

Još jedna važna karakteristika odnosa je u smislu interakcijskih faktora. Ako je odnos između dvije karakteristike okarakteriziran, onda se naziva parna soba. Ako se proučava više od dvije varijable - višestruko.

Odnosi između pojava utvrđenih na osnovu teorijske analize mogu se proučavati, mjeriti i kvantificirati korištenjem različitih statističkih metoda. Metode ravnoteže i indeksa koriste se za proučavanje funkcionalnih odnosa. Proučiti korelacije između atributnih obeležja - metoda međusobne kontingencije, za kvantitativno promenljiva obeležja - metoda paralelnih nizova, grafička metoda, metoda analitičkog grupisanja, korelaciona i regresiona analiza.

2. Korelacija parova i regresija parova

U najopštijem obliku, zadatak statistike u oblasti proučavanja odnosa je da kvantifikuje njihovu prisutnost i usmerenost, kao i da okarakteriše snagu i oblik uticaja jednih faktora na druge. Zadaci same korelacione analize svode se na merenje bliskosti odnosa između različitih obeležja, utvrđivanje nepoznatih uzročno-posledičnih veza i procenu faktora koji imaju najveći uticaj na rezultujuću osobinu. Zadaci regresione analize leže u oblasti utvrđivanja oblika zavisnosti, određivanja regresione funkcije, korišćenjem jednadžbe za procenu nepoznatih vrednosti zavisne varijable.

Uparena regresija karakterizira odnos između dvije karakteristike: rezultantne i faktorijske. Analitički odnos između njih opisan je jednadžbama:

Pravo at X = a o + a 1 X

Hiperbole

Parabole
itd.

Možete odrediti vrstu jednačine grafičkim ispitivanjem zavisnosti. Međutim, postoje općenitije indikacije koje omogućavaju da se otkrije jednačina komunikacije bez pribjegavanja grafička slika, ako se efektivni i faktorski predznak povećavaju podjednako, otprilike u aritmetičkoj progresiji, onda to ukazuje da je odnos između njih linearan, a sa povratnom spregom - hiperboličan. Ako se predznak faktora povećava u aritmetičkoj progresiji, a rezultantni predznak raste mnogo brže, tada se koristi parabolična ili regresija po stepenu.

Procjena parametara regresijskih jednačina vrši se metodom najmanjih kvadrata. Suština ove metode je pronalaženje parametara modela pri kojima je zbir kvadrata odstupanja empirijskih vrijednosti rezultirajuće karakteristike od teorijskih minimiziran.

Sistemi normalnih jednadžbi za pronalaženje parametara regresije imaju oblik:

Za linearna zavisnost

Hiperbole

Parabole

Parametar ao u jednadžbi regresije - konstantan i, obično nema ekonomskog smisla. Ostali parametri na x nazivaju se koeficijenti regresije, koji pokazuju koliko jedinica u prosjeku promijeni y kada se x promijeni za jednu jedinicu.

Kvantitativno, zavisnost promene teorijske vrednosti y x od promene x, koja je izražena koeficijentima regresije, često je pogodnije izraziti u relativnim terminima. Da biste to učinili, izračunajte koeficijent elastičnosti (E). Karakterizira za koliko posto se x povećava kada se x poveća za jedan posto i izračunava se po formuli:

Za kvantificiranje nepropusnosti veze s linearnom formom, široko se koristi koeficijent linearne korelacije:

,

Gdje je n broj zapažanja.

Koeficijent korelacije uzima vrijednosti u rasponu od -1 do +1. Općenito je prihvaćeno da ako je r0,3, onda je veza slaba; pri r=(0,3-0,7) - prosjek; na r> 0,7 - jaka ili blizu. Kada je r= 1 - veza je funkcionalna.

U slučaju linearnog i nelinearnog odnosa između dvije karakteristike, za mjerenje bliskosti odnosa koristi se takozvani korelacijski omjer ili indeks korelacije (). Indeks korelacije zasniva se na poređenju razlike između dvije varijanse
i . - disperzija, koja mjeri odstupanja stvarnih (empirijskih) vrijednosti (y) od teorijskih (y x), i karakterizira zaostalu varijaciju zbog drugih faktora, Disperzija mjeri varijaciju zbog faktora x.

Indeks korelacije kreće se od 0 do 1 i pogodan je za mjerenje bliskosti veze u bilo kojem obliku. Štoviše, usklađivanjem vrijednosti y s obzirom na različite funkcije, moguće je veličinom varijanse koja karakterizira preostalu varijaciju
procijeniti koja funkcija najbolje usklađuje empirijsku liniju komunikacije.

3. Višestruka regresija i korelacija

Proučavanje odnosa između dvije ili više povezanih karakteristika naziva se višestruka (multifaktorska) regresija. Prilikom proučavanja zavisnosti korištenjem metoda višestruke regresije, problem se formuliše na isti način kao i kod korištenja uparene regresije, tj. potrebno je odrediti analitički izraz odnosa između rezultujuće karakteristike i faktorskih karakteristika.

Većina težak problem predstavljen je izbor oblika komunikacije. Poteškoća je u tome što je iz beskonačnog skupa funkcija potrebno pronaći onu koja će bolje od ostalih izraziti realne odnose između proučavanih indikatora i faktora. Izbor tipa funkcije može se zasnivati ​​na teorijskom znanju o fenomenu koji se proučava ili na iskustvu prethodnih sličnih studija. Oblik komunikacije se može odrediti nabrajanjem funkcija različite vrste. Ali u većini praktičnih slučajeva, bilo koja funkcija mnogih varijabli može se svesti na linearni oblik, tj. jednadžba višestruke regresije može se izgraditi u linearnom obliku:

Svaki koeficijent ove jednačine pokazuje stepen uticaja odgovarajućeg faktora na analizirani indikator sa fiksnom pozicijom (na prosečnom nivou) ostalih faktora: sa promenom svakog faktora za jedan, indikator se menja za odgovarajući koeficijent regresije. .

U slučaju neadekvatnosti linearna jednačina preporučuje se višestruka regresija kako bi se povećao red jednačine.

Problem odabira faktorskih karakteristika za izgradnju modela odnosa može se riješiti na osnovu heurističkih ili multivarijantnih statističkih metoda analize.

Parametri jednačine se mogu odrediti grafičkom metodom, metodom najmanjih kvadrata itd. Na primjer, za dvosmjernu linearnu regresiju najmanjih kvadrata, morate riješiti sljedeći sistem normalnih jednačina:

Uz pomoć multivarijantne korelacione analize pronalaze se različite vrste karakteristika bliskosti odnosa između proučavanog indikatora i faktora: upareni, parcijalni i višestruki koeficijenti korelacije, višestruki koeficijent determinacije.

Da bismo proučavali bliskost odnosa između dvije razmatrane varijable (bez uzimanja u obzir njihove interakcije s drugim varijablama), koristimo upareni koeficijenti korelacije. Metodologija za izračunavanje takvih koeficijenata je slična koeficijentu linearne korelacije.

^ Parcijalni koeficijenti korelacije karakterišu stepen uticaja jednog od argumenata na funkciju, pod uslovom da su preostale nezavisne varijable fiksirane na konstantnom nivou. U zavisnosti od broja varijabli čiji je uticaj isključen, one mogu biti prvog reda (ako je isključen uticaj jedne varijable), drugog reda (ako je isključen uticaj dve varijable) itd. Na primjer, parcijalni koeficijent korelacije prvog reda između karakteristika y i x 1 uz isključenje utjecaja x 2 izračunava se po formuli:

Gdje r - upareni koeficijenti korelacije između odgovarajućih karakteristika.

Pokazatelj bliskosti uspostavljene veze između efektivne i dvije ili više faktorskih karakteristika je kumulativni koeficijent višestruke korelacije. U slučaju linearnog dvofaktorskog odnosa, može se izračunati pomoću formule:

Vrijednost R 2 se zove kumulativni koeficijent višestruke determinacije. Pokazuje koliki je udio varijacije proučavanog indikatora objašnjen utjecajem faktora uključenih u jednadžbu višestruke regresije.

Vrijednosti R i R2 su između 0 i 1.

Da bi se utvrdilo koji od faktora ima najveći uticaj na indikator koji se proučava, izračunavaju se parcijalni koeficijenti elastičnosti (E i) pomoću kojih se eliminiše razlika u mernim jedinicama. Izračunavaju se prema formuli:

4. Neparametarske metode za procjenu odnosa

Metode korelacijske i analize varijanse mogu se primijeniti kada su sve karakteristike koje se proučavaju kvantitativne. U međuvremenu, u statističkoj praksi se mora suočiti s problemima mjerenja odnosa između kvalitativnih karakteristika.

Za utvrđivanje čvrstoće veze između dvije kvalitativne karakteristike, od kojih se svaka sastoji od samo dvije grupe, koriste se koeficijenti asocijacije i kontingencije. Prilikom proučavanja veze, numerički materijal se postavlja u obliku kontingentnih tablica:

Tabela I

Tabela za izračunavanje koeficijenata asocijacije i kontingenta


a

in

a+b

With

d

c+d

a+c

c+d

a+b+c+d

Koeficijenti se određuju po formulama:

udruženja

kontingenti

Koeficijent kontingencije je uvijek manji od koeficijenta asocijacije. Veza se smatra potvrđenom ako je K a  0,5 ili K k  0,3.

Kada se svaka od kvalitativnih karakteristika sastoji od više od dvije grupe, tada je za određivanje čvrstoće veze moguće koristiti Pearsonov (C) i Chuprov (K) koeficijent uzajamne kontingencije:

gdje je  2 - indikator srednje kvadratne kontingencije, koji se utvrđuje oduzimanjem jedan od zbira omjera kvadrata frekvencija svake ćelije u tabeli i umnožaka frekvencija odgovarajuće kolone i reda;

K je broj grupa za svaki od znakova.

Vrijednost koeficijenata C i K kreće se od 0 do 1. Čuprov koeficijent obično daje oprezniju procjenu odnosa.

^ TEMA 8. STATISTIČKI POKAZATELJI PROIZVODA,

RADNA SNAGE I EFIKASNOST

PROIZVODNJA

I. Statističko računovodstvo industrijske proizvodnje

^ U proizvodnji industrija razumiju direktan koristan rezultat industrijskih i proizvodnih aktivnosti preduzeća, izražen ili u obliku proizvoda ili u obliku radova i usluga industrijske prirode.

Da bi se pravilno prikazao sastav i obim industrijskih proizvoda proizvedenih u svakom periodu, potrebno je razlikovati faze njegove spremnosti. Nakon što je predmet rada ušao u prvu fazu svoje obrade i na njega primijenjen živi rad, formira se početni stepen spremnosti proizvoda - nedovršena proizvodnja. Predmet rada koji je prošao sve potrebne radnje u procesu obrade u datoj radionici, ali je predmet naknadne obrade u drugim radionicama, naziva se poluproizvod. Proizvod koji je u potpunosti završen preradom u datom preduzeću - gotov proizvod.

Rezultat aktivnosti preduzeća može biti u obliku nove potrošačke vrednosti, biti rezultat transformacije predmeta rada u novi oblik proizvoda, a rezultat aktivnosti može biti restauracija prethodno stvorene stvari ( popravka) potpuno ili djelomično izgubljena zbog habanja. Ovaj oblik rezultata aktivnosti industrijskog preduzeća naziva se industrijski radovi.

Da bi se osiguralo ispravno računovodstvo proizvoda, potrebno je imati čvrsto utvrđenu nomenklaturu i mjerne jedinice. Računovodstvo se može vršiti u prirodnim, uslovno prirodnim i troškovnim metrima.

U teoriji i praksi planiranja, računovodstva i statistike u različitim fazama proizvodnog procesa koristi se niz međusobno povezanih pokazatelja obima industrijske proizvodnje u monetarnom smislu.

Vrijednost ukupne proizvodnje za određenom periodu pozivaju se svi odjeli industrijske proizvodnje preduzeća bruto proizvodni promet. Dio bruto prometa čini tzv interni promet- je vrijednost proizvoda koje su proizvele neke i potrošile druge radnje preduzeća u istom periodu.

Pokazatelj koji karakteriše ukupni rezultat industrijske i proizvodne aktivnosti preduzeća za dati period u novčanom smislu naziva se bruto proizvodnja prema fabričkoj metodi.

Vrijednost bruto proizvodnje industrijskog preduzeća može se odrediti na dva načina. Prvo, isključivanjem troškova unutarfabričkog prometa iz vrijednosti bruto prometa. Drugo, direktnim zbrajanjem troškova proizvedenih gotovih proizvoda (minus utrošenih u istom periodu za potrebe industrijske proizvodnje), poluproizvoda puštenih u stranu i industrijskih radova izvedenih po narudžbi izvana, kao i troškova promjene bilans poluproizvoda i proizvodnje u toku.

Konačni rezultat industrijskih i proizvodnih aktivnosti, u potpunosti pripremljen u izvještajnom periodu za puštanje na stranu, karakterizira indikator obima tržišnih proizvoda. Vrijednost tržišne proizvodnje može se odrediti zbrajanjem njenih sastavnih elemenata ili oduzimanjem od vrijednosti bruto proizvodnje vrijednosti njenih unutrašnjih elemenata.

^ Prodani proizvodi predstavlja isporučene proizvode plaćene u ovom periodu. Istovremeno, plaćeni proizvodi se mogu slati iu ovom iu prethodnim periodima.

2. Klasifikacija radne snage prema ekonomskoj djelatnosti

I status u radnom odnosu

^ Ekonomski aktivno stanovništvo (radna snaga) je dio stanovništva koji obezbjeđuje ponudu rada za proizvodnju dobara i usluga. Stopa ekonomski aktivnog stanovništva je udio ekonomski aktivnog stanovništva u ukupnom stanovništvu.

To zauzeto obuhvata lica oba pola starosti od 16 i više godina, kao i lica mlađih uzrasta koji su u posmatranom periodu bili u radnom odnosu, bili privremeno odsutni sa posla iz razloga dozvoljenih zakonom o radu ili su obavljali poslove bez naknade u porodičnom preduzeću.

Nezaposleni obuhvataju lica sa 16 i više godina koja u posmatranom periodu nisu imala posao (rentabilno zanimanje), tražili su posao ili su bili spremni da počnu da rade. Kada se radi o nezaposlenima, sva tri ova kriterijuma moraju biti ispunjena istovremeno.

^ Stopa nezaposlenosti je udio nezaposlenih u ekonomski aktivnom stanovništvu.

Ekonomski neaktivno stanovništvo stanovništvo koje nije dio radne snage. Ovaj dio stanovništva predstavljen je sljedećim kategorijama:

A) učenici i studenti, slušaoci i kadeti koji pohađaju dnevne obrazovne ustanove;

b) lica koja primaju penzije;

c) lica koja se bave domaćinstvom, njegom djece, bolesnih i sl.;

D) ljudi koji očajnički žele da nađu posao;

E) druga lica koja nemaju potrebu za radom, bez obzira na izvor prihoda.

Klasifikacija prema statusu u zaposlenosti podrazumijeva podelu ekonomski aktivnog stanovništva na zaposlene; samozaposlene osobe i poslodavci. Zaposleni su pak podijeljeni u dvije podgrupe - civilno stanovništvo i vojsku, kao i trajanje radnog odnosa za stalne, privremene, sezonske radnike, kao i radnike angažovane na povremenim poslovima.

3. Pokazatelji zaposlenosti i zaposlenosti stanovništva

Sa rođenjem tržišta rada u statističkom izvještavanju pojavile su se informacije o nezaposlenima, čiji se broj može okarakterisati i apsolutnim i relativnim pokazateljima.

Apsolutni broj nezaposlenih dat je kao trenutni indikator na početku svakog mjeseca. U okviru mjesečnog ciklusa bilježi se dinamika: koliko je nezaposlenih odjavljeno, zaposleno, izdato za prijevremenu penziju, upućeno na stručno osposobljavanje, zaposleno nakon završenog stručnog osposobljavanja.

Kvalitativni sastav nezaposlenih karakteriše pol, stepen obrazovanja i mesto stanovanja.

Relativni pokazatelji obuhvataju procenat nezaposlenih u ukupnom broju nezaposlenih radno sposobnih građana koji su prijavljeni na evidenciji zavoda za zapošljavanje i procenat onih koji primaju naknadu za nezaposlene.

U svjetskoj praksi stopa nezaposlenosti se izračunava po formuli:

Za kvantificiranje zaposlenosti stanovništva, statistika koristi posebne indikatore, apsolutne i relativne. Apsolutni pokazatelji uključuju broj zaposlenih u nacionalnoj ekonomiji; raspored zaposlenih po sferama i sektorima privrede, polu, starosti, stepenu obrazovanja; broj radno sposobnih ljudi zaposlenih u nacionalnoj privredi itd.

Relativni pokazatelji uključuju: stopu zaposlenosti stanovništva:

-

Stopa zaposlenosti radnih resursa

Stopa zaposlenosti radno sposobnog stanovništva

Stopa zaposlenosti radno sposobnog stanovništva radnog uzrasta

Gdje S z.n.- broj zaposlenih lica;

S - ukupna populacija;

TR- broj radnih resursa;

S TV - radno sposobno stanovništvo;

S TNTV - broj radno sposobnog stanovništva radno sposobnog.

4. Bilans radnih resursa

Sistem bilansa radnih resursa je niz međusobno povezanih tabela koje karakterišu procese reprodukcije i korišćenja radnih resursa zemlje i njenih pojedinačnih teritorija u specifičnim uslovima društvenog razvoja.

Bilans radnih resursa za godinu sastavlja se u prosječnoj godini zaposlenih i detaljan je. Sadrži najvažnije grupe radnih resursa po sferama proizvodnje i sektorima privrede.

Glavni pokazatelj resursnog dijela bilansa stanja je radno sposobno stanovništvo. Radne starosne granice su regulisane radnim zakonodavstvom. U Rusiji radno sposobno stanovništvo uključuje žene od 16-54 godine i muškarce od 16-59 godina. Ali pošto je u radnu snagu uključeno samo radno sposobno stanovništvo, radno sposobno stanovništvo treba umanjiti za broj neradnih invalida I i II grupe radnog uzrasta i broj neradnih penzionera radno sposobnih. godine koji primaju starosnu penziju po povlašćenim uslovima. Radna snaga uključuje osobe starosne dobi za penzionisanje koje nastavljaju da rade.

Imajući u vidu da se prilikom utvrđivanja broja nezaposlenih u sastav nezaposlenih uračunavaju i penzioneri koji traže posao i koji su spremni da započnu rad, ova kategorija lica je takođe uključena u sastav radne snage. U sastav radne snage uključena su i lica do 16 godina starosti zaposlena u privredi.

U rashodovnom dijelu bilansa predviđena je raspodjela radnih resursa po vrstama zapošljavanja i sektorima privrede. Analitičke mogućnosti bilansa radnih resursa se šire kao rezultat distribucije zaposlenih između preduzeća različitih oblika svojine i zaposlenih u oblasti privatnog preduzetništva.

5. Pokazatelji korišćenja radnog vremena,

Sredstva radnog vremena

Radni vrijeme je dio kalendarskog vremena utrošenog na proizvodnju proizvoda ili na obavljanje određene vrste posla. U statističkoj praksi, čovjek-dan i čovjek-sat služe kao jedinica za korištenje radnog vremena.

Potrošeno Za zaposlenog se radnim danom smatra onaj dan kada se pojavio i počeo da radi, bez obzira na njegovo trajanje, uklj. dana provedenih na službenim putovanjima.

Obračun radnog vremena u čovjeko-danima ne dozvoljava otkrivanje gubitka radnog vremena u radnom danu, stoga se evidentira i u radnim satima. Odrađen čovek-sat računati sat stvarnog rada jedne osobe.

Prema obračunu radnog vremena u čovjek-danima utvrđuju se fondovi radnog vremena. Postoje kalendarski, kadrovski i maksimalno mogući vremenski fondovi. kalendarski fond sastoji se od broja osoba-dana pojavljivanja i odsustva. Ako od toga oduzmemo broj osoba-dana odsustva praznicima i vikendom, dobićemo kadrovski fond, a isključujući broj čovjek-dana plaćenog godišnjeg odmora - maksimalni mogući fond radno vrijeme.

Stepen iskorišćenosti jednog ili drugog fonda radnog vremena utvrđuje se korišćenjem koeficijenata koji se određuju odnosom broja radnih dana u odnosu na odgovarajući fond.

Prema obračunu radnog vremena u čovjek-danima i čovjek-satima izračunavaju se sljedeći pokazatelji korištenja radnog vremena: - prosječna stvarna dužina radnog dana:

Prosječan broj radnih dana po jednom navedenom radniku;


  • prosječan broj radnih sati po navedenom radniku.
^ Prosječan stvarni radni dan se dobija dijeljenjem stvarno odrađenih čovjek-sati sa brojem odrađenih čovjek-dana. Prosječan broj radnih dana po radniku se definiše kao omjer broja radnih dana i prosječnog broja radnika. Prosječan broj radnih sati po radniku je potpuni ili integralni pokazatelj korištenja radnog vremena. Određuje se odnosom broja radnih sati i prosječnog broja radnika ili kao proizvod prosječnog radnog dana na prosječan broj dana rada po radniku.

6. Glavni pokazatelji i metode obračuna

produktivnost rada

Produktivnost rada znači plodnost, produktivnost aktivnosti ljudi. U ekonomskoj praksi, nivo produktivnosti rada karakteriše se pokazateljima učinka i intenziteta rada. izlaz (W) proizvodi po jedinici vremena mjeri se omjerom obima proizvodnje (q) i cijene (T) radnog vremena: W = q: T. Inverzni indikator je napornost: t=T:q.

Sistem statističkih pokazatelja produktivnosti rada određen je mjernom jedinicom obima proizvedenih proizvoda. Shodno tome, za mjerenje nivoa i dinamike produktivnosti rada koriste se prirodne, uslovno prirodne, radne i troškovne metode.

U zavisnosti od toga kako se mjere troškovi rada, razlikuju se prosječna satna (W r), prosječna dnevna (W g) i prosječna mjesečna proizvodnja (W). Dobivaju se dijeljenjem obima proizvedenih proizvoda sa brojem radnih sati u određenom vremenskom periodu; broj radnih dana svih radnika preduzeća; prosječan broj radnika (zaposlenih).

Postoji veza između pokazatelja prosječne satnice radnika i pokazatelja njihovog korištenja radnog vremena:

Da bi se stekla predstava o prosječnom mjesečnom (tromjesečnom, godišnjem) proizvodu jednog radnika industrijskog i proizvodnog osoblja, potrebno je uvesti još jedan faktor - udio radnika u prosječnom broju radnika PPP (d p) . onda:

W=W r TDd p .

Na osnovu ove zavisnosti vrši se faktorska analiza produktivnosti rada metodom indeksa.

Produktivnost rada se proučava na različitim nivoima - od individualne produktivnosti rada do produktivnosti društvenog rada u nacionalnoj ekonomiji cijele zemlje u cjelini:

Dinamika produktivnosti rada, ovisno o načinu mjerenja njenog nivoa, analizira se statističkim indeksima: prirodni (I), radni (2, 3) i troškovni (4):


Za analizu promjene prosječne proizvodnje pod utjecajem niza faktora koristi se sistem indeksa prosječnih vrijednosti u kojima je output indeksirana vrijednost, a udio u ukupnim troškovima rada ponder.

7. Indikatori troškova proizvoda

^ Troškovi proizvodnje -u novcu izraženi troškovi preduzeća za proizvodnju i prodaju proizvoda. tojedan od najopštijih indikatora koji karakteriše efikasnost preduzeća.

U praksi planiranja, računovodstva i statistike razlikuju se dvije glavne vrste troškova proizvodnje:proizvodnja , pokrivajući samo troškove vezane za proizvodni proces ikompletan , uključujući troškove proizvodnje i troškove povezane sa skladištenjem i marketingom proizvoda.

Prema ekonomskom sadržaju, troškovi proizvodnje se dijele na one koji se odnose na korištenje živog rada, sredstava rada i predmeta rada, a uzimaju se u obzir posebno za ove ekonomske elemente.

Prema prirodi veze sa proizvodnim procesom razlikuju semain troškovi direktno vezani za proizvodni proces, ifakture povezan sa procesom organizovanja i upravljanja proizvodnjom. Obično se nazivaju glavni troškovivarijable , tj. mijenjaju se proporcionalno rastu proizvodnje, fakture -uslovno trajno .

Za proučavanje troškova proizvodnje koriste se glavne statističke metode: grupisanje, prosječne i relativne vrijednosti, grafički, indeksni, kao i metoda poređenja.

Najvažnije grupe u proučavanju troškova su:

I) grupisanje troškova proizvodnje po ekonomskim elementima (Šta se troši na proizvodnju proizvoda?);

2) grupisanje troškova proizvodnje prema stavkama koštanja (Gde se troši?);

3) grupisanje po troškovima koji zauzimaju najveće učešće u ukupnim troškovima (radno intenzivni, materijalno intenzivni, energetski intenzivni, kapitalno intenzivni);

4) po vrstama troškova proizvodnje (tehnološki, proizvodni, radionički, kompletni);

5) grupisanje u zavisnosti od načina pripisivanja troškova ceni koštanja (posredno i direktno);

6) grupisanje prema obimu proizvodnje (proporcionalno, neproporcionalno).

Metoda prosječnih i relativnih vrijednosti koristi se u proračunu prosječnih nivoa troškova za homogene proizvode, u proučavanju strukture i dinamike troškova.

Grafička metoda vam omogućava da vizualizirate strukturu troškova, promjene koje se u njoj dešavaju, kao i dinamiku njegovih komponenti.

Metoda indeksa je neophodna za zbirni opis dinamike troškova uporedivih i svih komercijalnih proizvoda, za proučavanje dinamike i utvrđivanje uticaja pojedinih faktora na nju.

8. Analiza strukture i dinamike troškova proizvodnje

Analiza troškova proizvodnje vrši se poređenjem specifična gravitacija stvarni troškovi za elemente sa planiranim podacima ili sa podacima za prethodni (izvještajni) period. Prilikom analize troškova proizvodnje po elementima, treba imati u vidu da se pokazatelji za prethodni period uzimaju bez preračuna za obim i asortiman stvarno proizvedenih proizvoda u izvještajnom periodu po tekućim cijenama.

Imajući podatke o jediničnoj cijeni proizvoda za prethodni period (Z 0), prema planskim kalkulacijama (Z pl) i za izvještajni period (Z 1), možemo dati opšte karakteristike stepen ispunjenosti planiranog zadatka za smanjenje troškova i njegovu dinamiku, kao i utvrđivanje apsolutnog iznosa uštede ili prekomjerne potrošnje kao rezultat promjene troškova.

U tom slučaju će se odrediti pojedinačni indeksi troškova:

Indeks planiranih poslova


Indeks dinamike troškova

Dati indeksi su međusobno povezani:

Ukupan iznos uštede (prekoračivanja) od promjene cijene proizvoda određuje se formulom
.

Oduzimajući planiranu uštedu od stvarne uštede, dobijamo gore planiranu uštedu (prekomjernu potrošnju):

Prilikom proučavanja dinamike cijene koštanja za grupu poduzeća koja proizvode proizvode istog tipa, koriste se indeksi varijabilnog sastava, konstantnog sastava i strukturnih promjena.

U fabrikama koje proizvode različite vrste u ukupnoj proizvodnji prevladavaju proizvodi i uporedivi proizvodi, izračunavaju se pokazatelji smanjenja troškova uporedivih tržišnih proizvoda. Uporedivi proizvodi uključuju proizvode koji su proizvedeni u izvještajnom i prethodnim periodima. U ovom slučaju koriste se sljedeća tri indeksa:

Indeks planiranih poslova

Indeks izvršenja zadatka plana

Indeks stvarne promjene troškova uporedivih komercijalnih proizvoda

Razlika između brojnika i nazivnika ovih indeksa karakterizira odgovarajuće promjene troška uporedivih tržišnih proizvoda u apsolutnom iznosu.

9. Statistika finansijske aktivnosti preduzeća.

Pokazatelji profita i profitabilnosti

Predmet proučavanja statistike finansija preduzeća je kvantitativni opis njihovih finansijskih i monetarnih odnosa, uzimajući u obzir njihove kvalitativne karakteristike, usled formiranja, raspodele i korišćenja finansijskih sredstava, ispunjenja obaveza privrednih subjekata jedni prema drugima, prema finansijski i bankarski sistem i država.

Konačni finansijski rezultat preduzeća je bilansna dobit (gubitak). Bilansna dobit je zbir dobiti od prodaje proizvoda (radova, usluga), dobiti (ili gubitka) od druge prodaje, prihoda i rashoda iz vanprodajnih poslova.

^ Dobit od prodaje proizvodi se definiše kao razlika između prihoda od prodaje proizvoda po veleprodajnim cijenama preduzeća (bez PDV-a) i njihovog punog troška.

^ Neto prihod je dobit koja ostaje na raspolaganju preduzeću. Definiše se kao razlika između oporezive bilansne dobiti i vrijednosti poreza, uzimajući u obzir davanja.

Pokazatelji profita karakterišu apsolutnu efikasnost ekonomska aktivnost preduzeća. Uz ovu apsolutnu ocjenu izračunavaju se i relativni pokazatelji ekonomske efikasnosti – pokazatelji rentabilnosti. U zavisnosti od toga koji se pokazatelji koriste u proračunima, postoji nekoliko pokazatelja profitabilnosti. Njihov brojilac je obično jedna od tri vrijednosti: dobit od prodaje (PR), bilansna dobit (PB) ili neto dobit (NP). U nazivniku - jedan od sljedećih pokazatelja: troškovi proizvodnje prodatih proizvoda (Z itd ), proizvodna sredstva
, bruto prihod, kapital itd.

razlikovati:

Profitabilnost proizvodnog bilansa (ukupno)

Profitabilnost prodatih proizvoda

Profitabilnost proizvoda

I druge vrste toga.

U procesu analize uticaja različitih faktora na dobit od prodaje proizvoda, koja ima najveće učešće u strukturi bilansne dobiti, vrše se proračuni prema sledećim formulama.

1) Uticaj promjena cijena (tarifa):

2) Uticaj promjene cijene prodane robe:

3) Uticaj promene obima prodaje proizvoda:

4) Uticaj promena u strukturi prodatih proizvoda:

gdje PR' - stvarni dobitak izvještajnog perioda po cijenama i trošku prethodnog perioda.

Utjecaj različitih faktora na promjenu rentabilnosti proizvodnje prema metodi faktorske analize indeksa provodi se prema sljedećem modelu:

Gdje je \u003d IIB: PR - koeficijent promjene bilansne dobiti;

b \u003d PR: Z pr - profitabilnost prodatih proizvoda;

u \u003d W pr : - koeficijent prometa, izračunat na osnovu ukupne cijene prodate robe;

r =
- učešće obrtnih sredstava u ukupnim troškovima proizvodnih sredstava.

^ TEMA 9. STATISTIČKA OCJENA EKONOM

RAZVOJ DRŽAVE

1. Statistika nacionalnog bogatstva i nacionalne imovine

nacionalno bogatstvo- to je skup materijalnih resursa, akumuliranih proizvoda minulog rada i prirodnih resursa uzetih u obzir i uključenih u privredni promet, kojima društvo raspolaže u određenom trenutku.

Statistika nacionalnog bogatstva rješava probleme u vezi sa razvojem sistema indikatora i opravdanjem metodologije za njihovo izračunavanje, kao i zadatke praktične organizacije. statističko posmatranje i obradu primljenih informacija.

Sistem indikatora statistike nacionalnog bogatstva koji se koristi u analizi uključuje sljedeće glavne karakteristike:

1) prisustvo (obim) i struktura bogatstva;

2) reprodukcija njegovih najvažnijih delova;

3) dinamiku cjelokupnog bogatstva i njegovih sastavnih elemenata;

4) raspodela bogatstva na teritoriji zemlje;

5) zaštita prirodni resursi i njihovo popunjavanje.

Koristeći ovaj sistem, moguće je okarakterisati promene u obimu i sastavu celokupnog bogatstva iz različitih uglova konstruisanjem odgovarajućih grupacija, nizova dinamike, izračunavanjem indeksa i sastavljanjem bilansa nacionalnog bogatstva i njegovih pojedinačnih delova.

Statistika nacionalnog bogatstva u cjelini je konstruirana kao statistika akumulirano bogatstvo i statistiku prirodnih resursa. Akumulirano bogatstvo je u obliku skupa materijalnih dobara za različite namjene i namjene.

Grupiranje elemenata bogatstva prema karakteristikama njihovog prometa (stalna proizvodna sredstva, prometna proizvodna sredstva itd.) i prema prirodnom materijalnom sastavu, ovisno o ulozi koju igraju ili mogu imati u procesu reprodukcije, je široko rasprostranjena. korišteno. Od posebnog interesa je raspodjela bogatstva po oblicima svojine i društvenim grupama stanovništva, prema ekonomske regije i teritorijama, kao i po granama materijalne proizvodnje i neproizvodnoj sferi.

Prelaskom na sistem nacionalnih računa to postaje od posebnog značaja metod stalnog popisa. Prednost ove metode je što je dizajnirana za procjenu vrijednosti stvarnog bogatstva.

2. Pokazatelji statistike osnovnih proizvodnih sredstava

^ Osnovna sredstva više puta učestvuju u procesu proizvodnje i prenose svoju vrijednost na gotov proizvod u dijelovima u obliku amortizacije.

Najvažniji zadaci statističke studije osnovnih sredstava su:

1) utvrđivanje raspoloživosti i proučavanje sastava osnovnih sredstava;

2) proučavanje stanja, kretanja i korišćenja osnovnih proizvodnih sredstava;

3) proučavanje naoružanja rada po glavnim proizvodnim sredstvima.

Prisustvo osnovnih sredstava u cjelini i njihovih pojedinačnih vrsta može se okarakterisati trenutnim i prosječnim pokazateljima. Prilikom proučavanja sastava osnovnih sredstava koriste se različite vrste njihovog grupisanja. To je prvenstveno njihova podjela na proizvodne i neproizvodne, po industrijama Nacionalna ekonomija, kao i prema njihovoj uobičajenoj klasifikaciji vrsta.

Za analizu dinamike i strukture osnovnih sredstava, izradu njihovih bilansa i utvrđivanje efektivnosti, potrebno je razlikovati vrste vrednovanja osnovnih sredstava (puna početna, rezidualna vrijednost, potpuna zamjena, restauracija, uzimajući u obzir amortizaciju).

Najpotpuniju sliku raspoloživosti i dinamike osnovnih sredstava daje bilans osnovnih sredstava. Takav bilans, uz podatke o raspoloživosti osnovnih sredstava na početku i na kraju izvještajnog perioda, sadrži podatke o njihovom prijemu iz različitih izvora i njihovom otuđenju iz različitih razloga. Može se sastaviti kako za sva osnovna sredstva, tako i za njihove pojedinačne vrste, bilo po punom početnom trošku, bilo po ostatku. Bilansi se sastavljaju za preduzeća, industrije i nacionalnu ekonomiju u cjelini.

Za karakterizaciju intenziteta kretanja osnovnih sredstava izračunavaju se sljedeći pokazatelji:

1) Opšti koeficijent prijema pokazuje udio svih primljenih (P) u izvještajnom periodu osnovnih sredstava u njihovom ukupnom obimu na kraju ovog perioda:

2) Koeficijent penzionisanja osnovnih sredstava, jednak odnosu vrednosti svih osnovnih sredstava penzionisanih za dati period (B) prema vrednosti osnovnih sredstava na početku ovog perioda

3) Koeficijent amortizacije osnovnih sredstava obračunava se na određeni datum kao procenat odnosa iznosa amortizacije osnovnih sredstava (I) prema njihovoj ukupnoj nabavnoj vrednosti.

4) koeficijent korisnosti osnovnih sredstava, definisan kao razlika između 100% i koeficijenta amortizacije.

Opšti pokazatelj upotrebe osnovnih proizvodnih sredstava je povrat na sredstva - odnos količine proizvedenih proizvoda u datom periodu (O) i prosječne vrijednosti osnovnih proizvodnih sredstava u ovom periodu: FD = 0/F.

Za kvantifikovanje proizvodnje na nivou pojedinačnih preduzeća i industrija koristi se njen obim, a za nacionalnu ekonomiju u celini nacionalni dohodak ili ukupan društveni proizvod.

Uz kapitalnu produktivnost, koristi se njegov inverzni pokazatelj - kapitalni intenzitet: FE = F / 0.

Odnos kapitala i rada ima veliki utjecaj na vrijednost kapitalne produktivnosti i kapitalnog intenziteta: FV \u003d F / T

Gdje je T broj radnika ili zaposlenih.

Odnos zaliha i rada može se definisati kao trenutni indikator (od određenog datuma) ili kao intervalni indikator (za određeni period).

Omjer kapitala i rada i kapitalna produktivnost međusobno su povezani preko indikatora produktivnosti rada, određenog formulom PT = 0 / T. Ova zavisnost ima oblik: PT = FO FV.

Efekat poboljšanja korišćenja osnovnih sredstava može se odrediti različitim statističke metode, a prije svega indeks.

Kada se analizira dinamika prosječnih pokazatelja upotrebe osnovnih sredstava za skup preduzeća, njihove vrijednosti zavise ne samo od odgovarajućih pokazatelja u svakom preduzeću, već i od promjena u strukturi. Sistem indeksa za određivanje uticaja strukturnih pomeranja na kapitalnu produktivnost za grupu preduzeća je sledeći:

Indeks kapitalne produktivnosti varijabilnog sastava

stalno osoblje

strukturne promjene

Gde je dF učešće vrednosti osnovnih sredstava i-tog preduzeća u njihovoj ukupnoj vrednosti za grupu preduzeća.

Utvrđivanje uticaja promjene kapitalne produktivnosti i vrijednosti osnovnih sredstava na promjenu obima proizvodnje metodom indeksa vrši se prema sljedećem strukturnom modelu: 0= FD F, tj.

Kao rezultat Kao rezultat

Promjena proizvodnje = promjena + promjena količine

Povrat na sredstva osnovnih sredstava

U relativnom smislu:


U apsolutnom smislu:

Po kompaniji

Po grupi preduzeća

Slično, metodom indeksa utvrđuje se uticaj promjena ostalih pokazatelja upotrebe osnovnih sredstava, na primjer, utjecaj stepena korištenja osnovnih sredstava na njihovu ukupnu potrebu utvrđuje se prema sljedećoj strukturnoj zavisnosti: F = FU 0.

3. Pokazatelji obima, strukture i korištenja rezervi

materijalne vrijednosti

U statističkoj literaturiresurse najčešće se podrazumijevaju materijalne vrijednosti, uključujući sirovine, materijale, gorivo, poluproizvode koji se koriste za zadovoljavanje proizvodnih i operativnih potreba i kapitalne izgradnje.

dionice materijalna sredstva mjereno iu apsolutnom iznosu i u danima prosječne dnevne potrošnje. Iznos rezervi se obračunava u novčanom ili u naturi u skladu sa prihvaćenom klasifikacijom. Prisustvo rezervi u monetarnom smislu karakterišu trenutni i prosječni pokazatelji.

^ Prosječne zalihe može se odrediti formulama aritmetičke sredine (jednostavne ili ponderisane) ili hronološke sredine.Snabdevanje preduzeća rezervama u danima se izračunava tako što se veličina zaliha materijalnih sredstava podijeli sa prosječnom dnevnom potrošnjom ove vrste zaliha.

Strukturu materijalnih resursa karakterišu relativne vrijednosti udjela svake vrste rezervi u skladu sa utvrđenom klasifikacijom.

Za karakterizaciju efikasnosti korišćenja resursa na nivou nacionalne ekonomije, generalizujući indikator je materijalni intenzitet nacionalnog dohotka, koji odražava iznos materijalnih troškova utrošenih na proizvodnju jedne rublje nacionalnog dohotka (bruto nacionalnog proizvoda), a za pojedinačne sektore proizvodnog sektora - za jednu rublju bruto ili tržišne proizvodnje.

Indeksi specifične potrošnje nam omogućavaju da zaključimo koje su se promjene dogodile u specifičnoj potrošnji tokom izvještajnog perioda u odnosu na osnovnu ili normu.

Za karakterizaciju upotrebe razne vrste materijala za proizvodnju nekoliko vrsta proizvoda, koristi se kompozitni indeks jediničnih troškova:

Gdje su m 0 i m 1 specifični troškovi date vrste materijala za proizvodnju svake vrste proizvoda u baznom i izvještajnom periodu.

Razlika između brojnika i nazivnika ovog indeksa pokazuje uštede (prekoračivanja) u materijalnim troškovima (u novčanom smislu) samo zbog promjena jediničnih troškova.

Za karakterizaciju upotrebe inventara koriste se sljedeći pokazatelji:

Koeficijent obrta (stopa obrta)

K o \u003d R: Z


  • prosječno vrijeme obrade u danima


  • faktor fiksiranja K zatvoren = 3: R
gdje je T trajanje radnog perioda (30,90 ili 360 dana)

R - prodaja proizvoda ili usluga; 3 - obim zaliha.

Pokazatelji prometa za skup preduzeća predstavljaju prosječnu vrijednost sličnih indikatora za pojedina preduzeća. U isto vrijeme izračunavaju se K o i K zatvoreno

Poglavlje 8

8.1. Vrste društvenih pojava i oblika

veze između njih

Statistička studija međuodnosi proizlaze iz pretpostavke o univerzalnoj povezanosti i interakciji fenomena društvenog života. Međusobna povezanost i međuzavisnost se uočava kada se razmatra učinak bilo kojeg preduzeća. Na primjer, povećanje produktivnosti rada podrazumijeva smanjenje jediničnih troškova proizvodnje. One društvene pojave (ili njihove individualne karakteristike) koje utječu na druge i uzrokuju njihove promjene nazivaju se faktorijskim. One društvene pojave (ili njihove individualne karakteristike) koje se mijenjaju pod uticajem faktorskih nazivaju se produktivne (produktivnost rada je faktorijal, a trošak proizvodnje je proizvodni pokazatelj).

Prema prirodi ovisnosti pojava, razlikuju se funkcionalne (potpune) i korelacijske (nepotpune) veze između njih. Odnos se naziva funkcionalnim, za koji svaka vrijednost faktorskog indikatora odgovara dobro definiranoj vrijednosti efektivnog indikatora. Funkcionalne zavisnosti se široko koriste u egzaktnim naukama. Što se tiče društvenih pojava, oni se formiraju pod uticajem mnogih faktora, koji, zauzvrat, međusobno deluju. Štaviše, tačno se zna u kojoj meri svaki od njih utiče na veličinu fenomena. Takvi odnosi se nazivaju korelacije. U korelacijama između uzroka i posledice ne postoji potpuna korespondencija, već se posmatra samo poznati odnos. U ovom slučaju, svaka vrijednost indikatora faktora odgovara određenom broju vrijednosti efektivnog atributa. Međutim, i to je vrlo važno, s promjenom vrijednosti atributa faktora mijenja se i prosječna vrijednost efektivnog atributa.

Odnosi između pojava mogu se klasifikovati prema drugim kriterijumima:

  • U smjeru (direktno, obrnuto).
  • Analitičkim izrazom (linearni, nelinearni).
  • Prema bliskosti veze ili stepenu njene aproksimacije funkcionalnoj (jaka, slaba).

Povezanost dva znaka naziva se parna korelacija, a uticaj nekoliko faktorskih znakova na efektivni znak naziva se višestruka korelacija.

8.2. Metode za proučavanje odnosa između pojava i karakteristika koje ih karakterišu

Proučavanje odnosa je najvažniji kognitivni zadatak statistike, koji ona rješava uz pomoć posebnih metoda. Pored analitičkog grupisanja, ove metode uključuju: metodu uparivanja paralelnih nizova, metodu ravnoteže i metode zasnovane na odredbama i teoremama matematičke statistike(korelacija, faktor, disperzija).

Suština metode poređenja paralelnih redova je da se rezultujući sažeci i obrada materijala slažu u paralelne redove ili na osnovu prostora ili na osnovu vremena. Zajedničko proučavanje ove vrste serije omogućava praćenje odnosa i smjera promjena u upoređivanim karakteristikama fenomena koji se proučava. Važan uslov za dobijanje pouzdanih rezultata primenom ove metode je preliminarna detekcija uzročne veze između proučavanih karakteristika.

Suština metode bilansa je karakterizacija resursa fenomena koji se proučava i njihova distribucija. Najjednostavniji saldo je stanje materijalnih sredstava u preduzeću, i to: stanje na početku analiziranog perioda + prihod = rashod + stanje na kraju analiziranog perioda. Jasno je da, budući da prijem i potrošnja materijalnih sredstava moraju biti u određenoj korespondenciji (na primjer, u jednakosti), mora se održavati određena proporcionalnost između desnog i lijevog dijela (elemenata) gornje ravnoteže. Karakteristiku ove proporcionalnosti treba pronaći kao rezultat konstrukcija ravnoteže. Mogućnosti u karakterizaciji odnosa i proporcija značajno su proširene ako se prihodi u bilansu podijele po izvorima (dobavljači), a rashodi po destinacijama (kupcima). U ovom slučaju, bilans će pokazati odnos ne samo između prihoda, rashoda i bilansa unutar preduzeća, već i između ovog preduzeća i drugih preduzeća, od kojih ga neka snabdevaju materijalnim resursima, a druga troše njegove proizvode. Koristeći metodu bilansa, možete proučavati promet ne samo materijalnih, već i radnih resursa, gotovine, osnovnih sredstava.

U vezi sa naznačenim karakteristikama korelacionih zavisnosti, metode za proučavanje odnosa zasnovane na odredbama matematičke statistike suočavaju se sa dva zadatka:

jedan). otkriti ovu zavisnost od stvarnog materijala i utvrditi analitički izraz veze;

2). izmjerite snagu veze.

Za rješavanje prvog zadatka potrebno je odabrati faktorske i efektivne indikatore, prikupiti relevantan činjenični materijal i obraditi ga pomoću grafičkih konstrukcija.

Drugi zadatak se rješava izračunavanjem koeficijenata korelacije, parametara regresije.

Metodu korelacione analize demonstrirat ćemo na primjeru utvrđivanja bliskosti veze između indikatora električne snage rada i produktivnosti rada, ako je dostupan sljedeći činjenični materijal:

Sada, da bismo riješili prvi problem, ostaje da se utvrdi koji je od dva analizirana indikatora faktorski (X), a koji efektivni (Y), a zatim grafički predstaviti odnos između njih. Očigledno je da je od dva analizirana indikatora električna snaga rada faktor, a njegova produktivnost pokazatelj rezultata. Stoga će se u sistemu pravokutnih koordinata vrijednosti prve iscrtati duž ose apscise, a vrijednosti druge duž ordinatne ose (vidi sliku 3).

Rice. 3 Vrijednosti faktora i indikatora učinka

Kao što se može vidjeti sa sl. 3, vrijednosti efektivnog indikatora nisu smještene duž prave linije koja povezuje njegove ekstremne vrijednosti, već u obliku "oblaka", izduženog duž ove prave linije. Postoje posebne tehnike koje vam omogućavaju da pronađete tip analitičkog izraza veze (prava linija, hiperbola, parabola, itd.) koji najbolje odgovara funkcionalnoj zavisnosti. Najjednostavniji oblik korelacione zavisnosti izražava se jednačinom y=a+bx, gde je, u odnosu na primer koji razmatramo, y stopa rasta produktivnosti rada; h koeficijent rasta električne energije; i b parametara jednačine.

Mjerenje čvrstoće odnosa (određivanje vrijednosti a, b) između dva indikatora (x, y) povezanih linearnim odnosom moguće je kao rezultat rješavanja sljedećeg sistema jednadžbi:

gdje je n broj opservacija (u našem slučaju n=7).

Za rješavanje sistema jednadžbi napravićemo tabelu u koju ćemo, uz početne podatke, smjestiti rezultate svih potrebnih međuproračuna, i to:

Tada sistem jednadžbi sa dvije nepoznate (a, c) poprima oblik:

a njegovo rješenje omogućava određivanje njihove specifične vrijednosti: a = -0,45;

c = 1,542. Dakle, y = 1,542x 0,45. Zamjenom određenih vrijednosti x u ovu jednačinu (tzv. regresijska jednadžba), dobijamo izračunatu vrijednost funkcije - :

Uspoređujući vrijednosti "y" i "" vidimo da su bliske, ali da se ne poklapaju jedna s drugom. To znači da na stopu rasta produktivnosti rada utiče ne samo stopa rasta njenog napajanja, već i drugi faktori koji nisu uzeti u obzir. Kvantitativna karakteristika čvrstoće odnosa između para indikatora koji se proučava je koeficijent korelacije između njih r, čije vrijednosti variraju od

(1) do (+1) i što je veća apsolutna vrijednost, manji je deformirajući utjecaj neuračunatih faktora.

Proučavanje statističke zavisnosti efektivne karakteristike od nekoliko faktorskih karakteristika sugeriše da će najznačajniji od njih biti izabran kao potonji. Uvod veliki broj faktori otežavaju rješavanje problema. Njihovo loše osmišljeno smanjenje dovodi do činjenice da jednačina neće reproducirati fenomen koji se proučava. Nemoguće je u jednačinu unijeti faktor koji je jedan s drugim u funkcionalnom ili bliskom funkcionalnom odnosu. Kada se oni unesu u jednačinu, uočava se fenomen kolinearnosti (ako postoje dva faktora) ili multikolinearnosti (ako ima više od dva faktora). Identifikacija navedenih pojava vrši se izračunavanjem koeficijenata korelacije između faktora. Ako je vrijednost koeficijenata korelacije između faktora veća ili jednaka 0,8, tada se u daljem istraživanju jedan od ovih faktora odbacuje. Ovaj postupak neće biti potreban kada se koristi faktorska analiza. Faktorska analiza se razlikuje po tome što, bez oslanjanja na unaprijed određenu listu faktora, pomaže da se identificiraju najvažniji od njih. Na primjer, ekonomista direktno posmatra mnoge različite pokazatelje statističkog računovodstva aktivnosti preduzeća kako bi identifikovao obrasce koji utiču na rast produktivnosti rada (obrazovani nivo radnika, omjer smjene opreme, radna snaga, starost opreme, itd.). Na ovaj ili onaj način, svi faktori koje odražavaju ovi pokazatelji utiču na produktivnost rada. Istovremeno, mnogi od njih su međusobno povezani, odražavajući u suštini iste fenomene sa različitih strana. Koristeći tehnike faktorske analize ovih odnosa, moguće je otkriti da je zapravo samo nekoliko generalizirajućih faktora (na primjer, veličina preduzeća, nivo organizacije rada, priroda proizvoda) koji nisu direktno uočeni u studije, imaju presudan uticaj na rast produktivnosti rada. Stoga je izazov otkriti skrivene generalizirajuće faktore. Identifikovani faktori omogućavaju da se konstruiše jednačina višestruke regresije sa relativno malim brojem koeficijenata.

Analiza varijanse je osmišljena tako da otkrije uticaj pojedinačnih faktora na rezultat eksperimenta. Suština ove metode je da se ukupnost posmatranja grupiše prema faktorskom kriterijumu, pronalazeći srednju vrednost rezultata i varijansu za svaku grupu. Zatim odredite ukupnu disperziju i izračunajte koliki njen udio zavisi od uslova zajedničkih za sve grupe, koji od faktora koji se proučava, a koji od slučajnih uzroka. I konačno, uz pomoć posebnog kriterijuma, određuju koliko su značajne razlike između grupa posmatranja i, samim tim, da li se uticaj određenih faktora može smatrati opipljivim. U suštini, analiza varijanse služi kao preliminarni korak u regresijskoj analizi statističkih podataka, koji omogućava izdvajanje relativno malog, ali za potrebe studije dovoljan broj regresijskih parametara.

Bibliografska lista

društveno - ekonomska statistika: radionica / ur. V.N. Salina, E.P. Shpakovskaya. M.: Finansije i statistika, 2006.

Vrste društvenih pojava i oblici povezanosti među njima. Metode za proučavanje odnosa između pojava i karakteristika koje ih karakterišu.

Imamo najveću bazu podataka u RuNetu, tako da uvijek možete pronaći slične upite

1.8.1. Statističko proučavanje odnosa, njihova klasifikacija.

1.8.2. Zadaci proučavanja odnosa.

1.8.3. Koncept korelaciono-regresione analize, uslovi za njenu primenu.

1.8.4. Indikatori nepropusnosti veze, koeficijent linearne korelacije.

1.8.5. Mjere za procjenu nepropusnosti veze za atributne karakteristike.

1.8.1. Statističko proučavanje odnosa, njihova klasifikacija

Statističko proučavanje odnosa jedan je od najvažnijih odjeljaka statistike. Proučavanje međuodnosa između različitih pojava društvenog života omogućava da se predvidi razvoj procesa zavisnih od drugih i, u konačnici, utiče na njih. Dakle, proučavanje veza omogućava da se od objašnjavanja činjenica pređe na promjenu činjenica.

Odnos je zajednička koordinirana promjena dvije ili više karakteristika.

Prisustvo veze između različitih pojava, procesa izražava se u međusobno konzistentnoj promeni statističkih podataka koji opisuju ove procese.

Na primjer, radno iskustvo je jedan od faktora rasta produktivnosti rada. Stoga povećanje iskustva, po pravilu, dovodi do povećanja proizvodnje. Statistički podaci odražavaju konzistentnost u promjeni oba indikatora.

Sva raznolikost odnosa obično se klasificira prema različitim kriterijima: Oblik manifestacije:

uzročno-posledične veze- u slučaju kada je moguće izdvojiti uzrok i posljedicu iz dva znaka koji međusobno djeluju, znak-faktor (X) i znak-rezultat ( X).

Na primjer, odnos između obima proizvodnje i jediničnih troškova proizvodnje očituje se na sljedeći način: s povećanjem obima proizvodnje, jedinični trošak proizvodnje se smanjuje. Ovdje je obim proizvodnje znak-faktor, a cijena koštanja je znak rezultata.

Linkovi za usklađenost - u slučaju kada nije moguće izdvojiti uzrok i posljedicu, posebno, oba znaka koji se stalno mijenjaju su posljedice trećeg znaka. Mehanizam komunikacije:

funkcionalan;

Stohastički (statistički).


Pod funkcionalnom zavisnošću među pojavama se podrazumijeva takva veza, koja se za svaki slučaj sasvim definitivno može izraziti strogom matematičkom formulom. Uz funkcionalnu ovisnost, svaka vrijednost jedne veličine odgovara jednoj ili više, ali dobro definiranih vrijednosti druge veličine. Na primjer, odnos između stranice i površine kvadrata (S = a 2), vrijeme i putanja pri kretanju konstantnom brzinom ( S = vt) i slične količine, koje se često nalaze u geometriji, mehanici. Masovne društvene pojave karakteriziraju ovisnosti različite vrste, koje nastaju kao rezultat interakcije mnogih uzroka i uvjeta i komplicirane su djelovanjem objektivne slučajnosti i grešaka u promatranju. Nemoguće je izraziti takve zavisnosti koristeći nedvosmislene, precizne formule prikladne za opisivanje svakog pojedinačnog slučaja.

At statistička povezanost različite vrijednosti jedne varijable odgovaraju različitim distribucijama vrijednosti druge varijable.

Korelacija je poseban slučaj statističke povezanosti.

Korelaciona zavisnost- odnos između znakova koji se sastoji u tome da prosječna vrijednost vrijednosti jednog atributa variraju ovisno o promjeni drugog atributa (na primjer, odnos između rezultata i radnog staža, između broja osuđujućih presuda i vremena kada je bio na slobodi između njih, itd.). Ovdje, za razliku od funkcionalne ovisnosti, u pojedinačnim slučajevima, pri određivanju vrijednosti jednog atributa, mogu postojati različite vrijednosti drugog, odnosno uopće nije nužno da će otkriveni odnos biti potvrđen u svakom konkretan slučaj.

Na primjer, promjena nastavnog osoblja u pravcu povećanja broja

nastavnici koji imaju stepen na kraju dovodi do poboljšanja kvaliteta obrazovanja. Ali to ne znači da će svaki pojedinačni diplomac imati veći skup znanja od diplomiranog obrazovne ustanove imaju "slabiji" nastavni kadar.

Posljedično, u statističkoj analizi, korelacije se ne pojavljuju između svakog para upoređenih podataka, već između promjena u seriji distribucije skupa odgovarajućih vrijednosti.

Pored činjenice da korelaciono zavisnost nema funkcionalnu prirodu, treba uzeti u obzir dve njene karakteristike:

Zaključak se može izvesti samo na osnovu analize dovoljno velikih agregati, koji omogućavaju konstruisanje relativno dugih statističkih serija;
- poželjno je da broj posmatranja bude najmanje 5-6 puta više broja faktori.

Korelaciona analiza ima smisla samo u onim slučajevima kada je mogućnost uzročne veze između analiziranih karakteristika teorijski potkrijepljena barem na nivou suštinske hipoteze.

Ako se promjenom vrijednosti nekog svojstva ne mijenja na pravilan način prosječna vrijednost drugog svojstva, već se statistička karakteristika(na primjer, indikatori varijacije), tada odnos nije korelacioni, već je statistički.

U slučaju statističkog odnosa, pretpostavlja se da oba obilježja imaju slučajnu varijaciju pojedinačnih vrijednosti u odnosu na prosječnu vrijednost, odnosno da svaka od karakteristika traje nekoliko slučajne vrijednosti. U slučaju da jedan od znakova ima takvu varijaciju, a vrijednosti drugog su strogo određene, onda se govori o regresija, ali ne o statističkom odnosu. U analizi vremenskih serija, moguće je izmjeriti regresiju nivoa serije (koji imaju nasumične fluktuacije) na broj godina. Na primjer, dinamika proizvodnje. Ali, nemoguće je govoriti o korelaciji (odnosu) između rezultata i vremena i vrednovati tesnost odnosa između njih.

Smjer komunikacije:

Obrnuto.

U slučaju da sa povećanjem faktora znaka, znak-rezultat raste, govore o tome direktna korelacija. Na primjer, što je veći stepen alkoholiziranosti društva, to je veći kriminal, a zločin je specifičan („pijan“). Ako se s povećanjem znaka-uzroka, znak-rezultat smanjuje, oni govore o tome inverzna korelacija. Na primjer, što je veća društvena kontrola u društvu, to je niža stopa kriminala.

Kontakt obrazac:

Rectilinear;

Curvilinear.

Veze za naprijed i nazad mogu biti direktno i krivolinijski. Matematički, linearni odnosi se mogu opisati pomoću jednačine prave linije:

y \u003d a + in,

gdje at- znak-rezultat; X- faktor znaka.

Krivolinijske veze su drugačije prirode. Povećanje vrijednosti atributa faktora ima neujednačen učinak na vrijednost rezultirajućeg atributa.

Na primjer, odnos zločina sa godinama počinitelja. U početku, kriminalna aktivnost pojedinaca raste u direktnoj proporciji sa porastom starosti (do otprilike 30 godina), a zatim počinje opadati. Matematički, takve veze se opisuju pomoću krivulja (hiperbole, parabole).

Pravolinijske korelacije mogu biti unifaktorne kada se istražuje odnos između jednog faktora obilježja i jedne karakteristike-posljedice. (korelacija parova). Oni mogu biti multifaktorski kada se proučava uticaj mnogih znakova-faktora u interakciji na znak-posljedicu. (višestruka korelacija).

8.1. Osnovni koncepti korelacione i regresione analize

Istražujući prirodu, društvo, ekonomiju, potrebno je voditi računa o odnosu posmatranih procesa i pojava. Istovremeno, potpunost opisa je na neki način određena kvantitativnim karakteristikama uzročno-posledičnih veza među njima. Evaluacija najznačajnijih od njih, kao i uticaja nekih faktora na druge, jedan je od glavnih zadataka statistike.

Oblici ispoljavanja međusobnih odnosa su veoma raznovrsni. Kao dva najčešća tipa dodijeliti funkcionalne(potpuno) i korelacija(nepotpuna) veza. U prvom slučaju, vrijednost atributa faktora striktno odgovara jednoj ili više vrijednosti funkcije. Često se funkcionalna veza manifestira u fizici, hemiji. U ekonomiji, primjer je direktno proporcionalan odnos između produktivnosti rada i povećanja proizvodnje.

Korelacija (koja se još naziva i nepotpuna, ili statistička) pojavljuje se u prosjeku, za masovna promatranja, kada date vrijednosti zavisne varijable odgovaraju određenom broju vjerojatnih vrijednosti nezavisne varijable. Objašnjenje za to je složenost odnosa između analiziranih faktora, na čiju interakciju utiču neobračunate slučajne varijable. Stoga se odnos između znakova ispoljava samo u prosjeku, u masi slučajeva. Uz korelaciju, svaka vrijednost argumenta odgovara nasumično raspoređenim vrijednostima funkcije u određenom intervalu.

Na primjer, neko povećanje argumenta povlači za sobom samo prosječno povećanje ili smanjenje (ovisno o smjeru) funkcije, dok će se specifične vrijednosti za pojedinačne jedinice promatranja razlikovati od prosjeka. Ove zavisnosti su sveprisutne. Na primjer, u poljoprivredi, to može biti odnos između prinosa i količine primijenjenog gnojiva. Očigledno, potonji su uključeni u formiranje usjeva. Ali za svako specifično polje, parcelu, ista količina unesenog đubriva će uzrokovati različito povećanje prinosa, jer postoji niz drugih faktora (vremenski uslovi, uslovi zemljišta, itd.) u interakciji koji formiraju konačni rezultat. Međutim, u prosjeku se opaža takav odnos - povećanje mase primijenjenih gnojiva dovodi do povećanja prinosa.

U komunikacijskom pravcu postoje ravno, kada se zavisna varijabla povećava sa povećanjem faktorske osobine, i obrnuto, pri čemu je rast potonjeg praćen smanjenjem funkcije. Takvi odnosi se također mogu nazvati pozitivnim i negativnim.

Što se tiče njihovog analitičkog oblika komunikacije, postoje linearno i nelinearne. U prvom slučaju, u prosjeku se pojavljuju linearni odnosi između znakova. Nelinearni odnos se izražava nelinearnom funkcijom, a varijable su međusobno povezane u prosjeku nelinearno.

Postoji još jedna prilično važna karakteristika veza sa stanovišta interakcijskih faktora. Ako je odnos između dvije karakteristike karakteriziran, onda se naziva parna soba. Ako se proučava više od dvije varijable − višestruko.

Gore navedene karakteristike klasifikacije najčešće se nalaze u statističkoj analizi. Ali pored navedenih, postoje i oni direktno, indirektno i false veze. Zapravo, suština svakog od njih je očigledna iz imena. U prvom slučaju, faktori su u direktnoj interakciji jedni s drugima. Indirektni odnos karakteriše učešće neke treće varijable, koja posreduje u odnosu između proučavanih osobina. Lažna veza je veza uspostavljena formalno i, po pravilu, potvrđena samo kvantitativnim procjenama. Ona nema kvalitativnu osnovu ili je besmislena.

Razlikuju se po snazi slab i jaka veze. Ova formalna karakteristika izražena je specifičnim vrijednostima i tumači se u skladu s općeprihvaćenim kriterijima za snagu veze za određene pokazatelje.

U najopštijem obliku, zadatak statistike u oblasti proučavanja odnosa je da kvantifikuje njihovu prisutnost i usmerenost, kao i da okarakteriše snagu i oblik uticaja jednih faktora na druge. Za njegovo rješavanje koriste se dvije grupe metoda, od kojih jedna uključuje metode korelacione analize, a druga - regresionu analizu. Istovremeno, jedan broj istraživača kombinuje ove metode u korelaciono-regresionu analizu, koja ima neke osnove: prisustvo niza uobičajenih računskih procedura, komplementarnost u tumačenju rezultata itd.

Stoga se u ovom kontekstu može govoriti o korelacionoj analizi u širem smislu – kada se odnos sveobuhvatno karakteriše. Istovremeno, postoje i korelaciona analiza u užem smislu – kada se proučava snaga veze – i regresiona analiza, tokom koje se vrednuje njen oblik i uticaj nekih faktora na druge.

Pravilni zadaci korelacione analize svode se na mjerenje bliskosti odnosa između različitih osobina, utvrđivanje nepoznatih uzročno-posledičnih veza i procjenu faktora koji imaju najveći utjecaj na rezultirajuću osobinu.

Zadaci regresiona analiza leže u polju uspostavljanja oblika zavisnosti, određivanja regresione funkcije, koristeći jednadžbu za procenu nepoznatih vrednosti zavisne varijable.

Rješenje ovih problema zasniva se na odgovarajućim tehnikama, algoritmima, indikatorima, čija upotreba daje povoda da se govori o statističkom proučavanju odnosa.

Treba napomenuti da su tradicionalne metode korelacije i regresije široko zastupljene u različitim statističkim softverskim paketima za računare. Istraživaču jedino preostaje da pravilno pripremi informacije, odabere softverski paket koji zadovoljava zahtjeve analize i bude spreman za interpretaciju dobijenih rezultata. Postoji mnogo algoritama za izračunavanje komunikacijskih parametara, a trenutno je teško da je preporučljivo izvoditi tako složenu vrstu analize ručno. Računski postupci su od nezavisnog interesa, ali je poznavanje principa proučavanja odnosa, mogućnosti i ograničenja pojedinih metoda interpretacije rezultata preduslov za istraživanje.

Metode za procjenu nepropusnosti veze dijele se na korelacijske (parametrijske) i neparametarske. Parametarske metode se temelje na korištenju, po pravilu, procjena normalne distribucije i koriste se u slučajevima kada se ispitana populacija sastoji od količina koje su u skladu sa zakonom normalne distribucije. U praksi se ova pozicija najčešće zauzima a priori. Zapravo, ove metode su parametarske i obično se nazivaju korelacionim metodama.

Neparametarske metode ne nameću ograničenja na zakon raspodjele proučavanih veličina. Njihova prednost je i jednostavnost proračuna.

8.2. Korelacija parova i linearna regresija para

Najjednostavnija tehnika za identifikaciju odnosa između dvije karakteristike je izgradnja tabela korelacije:

\Y
\
X\
Y 1 Y2 ... Yz Ukupno Y i
x1 f 11 12 ... f 1z
x1 f 21 22 ... f2z
... ... ... ... ... ... ...
X r f k1 k2 ... fkz
Ukupno ... n
... -

Grupiranje je zasnovano na dvije osobine proučavane u odnosu - X i Y. Frekvencije f ij pokazuju broj odgovarajućih kombinacija X i Y. Ako su f ij raspoređeni nasumično u tabeli, možemo govoriti o odsustvu odnosa između varijable. U slučaju formiranja bilo koje karakteristične kombinacije f ij, dozvoljeno je tvrditi vezu između X i Y. U ovom slučaju, ako je f ij koncentrisan blizu jedne od dvije dijagonale, postoji direktna ili obrnuta linearna veza.

Vizuelni prikaz korelacione tabele je korelaciono polje. To je grafik na kojem su vrijednosti X iscrtane na osi apscise, vrijednosti Y iscrtane duž ordinatne ose, a kombinacija X i Y prikazana je tačkama. Po lokaciji tačaka, njihova koncentracija u a određenom pravcu, može se suditi o prisutnosti veze.

U rezultatima korelacione tabele za redove i kolone date su dve distribucije - jedna za X, druga za Y. Izračunajmo za svaki X i prosečnu vrednost Y, tj. , kako

Niz tačaka (X i , ) daje grafik koji ilustruje zavisnost prosečne vrednosti efektivne karakteristike Y od faktora X, - empirijska regresijska linija, pokazujući kako se Y mijenja kako se X mijenja.

U suštini, i korelaciona tabela, i korelaciono polje, i empirijska regresijska linija prethodno karakterišu odnos kada se biraju faktor i rezultujuća obeležja i potrebno je formulisati pretpostavke o obliku i pravcu odnosa. Istovremeno, kvantitativna procjena blizine veze zahtijeva dodatne proračune.

U praksi, da bi se kvantifikovala nepropusnost veze, linearna koeficijent korelacije. Ponekad se naziva jednostavno koeficijent korelacije. Ako su date vrijednosti varijabli X i Y, onda se izračunava po formuli

Možete koristiti druge formule, ali rezultat bi trebao biti isti za sve opcije izračuna.

Koeficijent korelacije uzima vrijednosti u rasponu od -1 do +1. Općenito je prihvaćeno da ako |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – prosjek; at |r| > 0,70 - jako ili blizu. Kada |r| = 1 – funkcionalna veza. Ako r zauzme vrijednost blizu 0, to daje osnovu da se govori o odsustvu linearne veze između Y i X. Međutim, u ovom slučaju je moguća nelinearna interakcija. što zahtijeva dodatnu verifikaciju i druga brojila o kojima se govori u nastavku.

Za karakterizaciju utjecaja promjena X na varijaciju Y, koriste se metode regresione analize. U slučaju uparene linearne zavisnosti gradi se regresijski model

gdje je n broj zapažanja;
a 0 , a 1 – nepoznati parametri jednačine;
e i je greška slučajne varijable Y.

Jednačina regresije se piše kao

gdje je Y iteor izračunata izjednačena vrijednost efektivne karakteristike nakon zamjene u jednačinu X.

Parametri a 0 i a 1 se procjenjuju korištenjem procedura, od kojih je najčešće korištena metoda najmanjeg kvadrata. Njegova suština leži u činjenici da se najbolje procjene za ag i a dobijaju kada

one. zbir kvadrata odstupanja empirijskih vrijednosti zavisne varijable od onih izračunatih pomoću regresione jednadžbe treba biti minimalan. Zbir kvadrata odstupanja je funkcija parametara a 0 i a 1 . Njegova minimizacija se vrši rješavanjem sistema jednačina

Možete koristiti druge formule koje slijede iz metode najmanjih kvadrata, na primjer:

Aparat linearne regresije je prilično dobro razvijen i po pravilu je dostupan u setu standardnih programa za procjenu odnosa za računar. Značenje parametara je važno: a 1 je koeficijent regresije koji karakterizira učinak koji promjena X ima na Y. Pokazuje koliko će se jedinica Y u prosjeku promijeniti kada se X promijeni za jednu jedinicu. Ako je a veće od 0, tada se uočava pozitivna veza. Ako a ima negativnu vrijednost, onda povećanje X za jedan dovodi do smanjenja Y u prosjeku za 1 . Parametar a 1 ima dimenziju omjera Y prema X.

Parametar a 0 je konstantna vrijednost u jednadžbi regresije. Po našem mišljenju, to nema ekonomsko značenje, ali se u nekim slučajevima tumači kao početna vrijednost W.

Na primjer, prema podacima o cijeni opreme X i produktivnosti rada Y, metodom najmanjih kvadrata dobijena je jednačina

Y \u003d -12,14 + 2,08X.

Koeficijent a znači povećanje cijene opreme za 1 milion rubalja. dovodi u prosjeku do povećanja produktivnosti rada za 2,08 hiljada rubalja.

Vrijednost funkcije Y \u003d a 0 + a 1 X naziva se izračunata vrijednost i formira se na grafikonu teorijska regresijska linija.

Značenje teorijske regresije je da je to procjena srednje vrijednosti varijable Y za datu vrijednost X.

Parna korelacija ili parna regresija se mogu smatrati poseban slučaj odražavajući odnos neke zavisne varijable, s jedne strane, i jedne od mnogih nezavisnih varijabli, s druge strane. Kada je potrebno okarakterisati odnos čitavog specificiranog skupa nezavisnih varijabli sa rezultujućim atributom, govori se o višestruka korelacija ili višestruka regresija.

8.3. Procjena značaja parametara odnosa

Nakon što su dobijene procjene korelacije i regresije, potrebno je provjeriti njihovu usklađenost sa pravim parametrima odnosa.

Postojeći kompjuterski programi uključuju, po pravilu, nekoliko najčešćih kriterijuma. Da bi se procijenila značajnost koeficijenta korelacije para, izračunava se standardna greška koeficijenta korelacije:

Kao prvu aproksimaciju, potrebno je da . Značaj r xy se provjerava poređenjem sa , i dobija se

gdje je t calc takozvana izračunata vrijednost t-kriterijuma.

Ako je t calc veći od teorijske (tabelarne) vrijednosti Studentovog t-testa (t tabl) za dati nivo vjerovatnoće i (n-2) stepena slobode, onda se može tvrditi da je r xy značajan.

Slično, na osnovu odgovarajućih formula, izračunavaju se standardne greške parametara regresione jednačine, a zatim t-testovi za svaki parametar. Važno je ponovo provjeriti da li je uvjet t calc > t tab. U suprotnom, nema razloga vjerovati dobivenoj procjeni parametara.

Zaključak o pravilnom izboru vrste odnosa i karakteristike značajnosti cijele regresione jednadžbe dobija se korištenjem F-kriterijuma, računajući njenu izračunatu vrijednost:

gdje je n broj zapažanja;
m je broj parametara jednadžbe regresije.

F calc bi također trebao biti veći od F teor na v 1 = (m-1) i v 2 = (n-m) stepenima slobode. U suprotnom, formu jednačine, listu varijabli itd. treba revidirati.

8.4. Neparametarske metode za procjenu odnosa

Metode analize korelacije i varijanse nisu univerzalne: mogu se primijeniti ako su sve karakteristike koje se proučavaju kvantitativne. Prilikom korištenja ovih metoda ne može se bez izračunavanja glavnih parametara distribucije (prosjeci, varijanse), pa se oni nazivaju parametarske metode.

U međuvremenu, u statističkoj praksi se moraju baviti problemima mjerenja odnosa između kvalitativnih karakteristika, na koje parametarske metode analize u svom uobičajenom obliku nisu primjenjive. Statistička nauka je razvila metode koje se mogu koristiti za mjerenje odnosa između pojava bez korištenja kvantitativnih vrijednosti atributa, a time i parametara distribucije. Takve metode se nazivaju neparametarski.

Ako se proučava odnos dvaju kvalitativnih obilježja, tada se koristi kombinacijska distribucija jedinica stanovništva u obliku tzv. tabele unakrsnih veza.

Razmotrimo metodu analize tabela međusobne kontingencije na konkretnom primjeru socijalne mobilnosti kao procesa prevazilaženja izolacije određenih društvenih i profesionalnih grupa stanovništva. U nastavku dajemo podatke o raspodjeli svršenih srednjoškolaca po sferama zaposlenja sa raspodjelom sličnih društvenih grupa njihovih roditelja.

Distribucija frekvencija u redovima i kolonama tabele unakrsne sprege omogućava da se identifikuju glavni obrasci socijalne mobilnosti: 42,9% dece roditelja u grupi 1 („Industrija i građevinarstvo“) zaposleno je u oblasti intelektualni rad (39 od 91); 38,9% djece. čiji roditelji rade u poljoprivredi, rade u industriji (34 od 88) itd.

Uočava se i jasna nasljednost u prijenosu zanimanja. Tako, od onih koji su došli u poljoprivredu, 29 lica ili 64,4% su djeca poljoprivrednika; više od 50% u oblasti intelektualnog rada ima roditelje iz iste društvene grupe itd.

Međutim, važno je dobiti generalizirajući pokazatelj koji karakterizira bliskost odnosa između obilježja i koji vam omogućava da uporedite manifestaciju odnosa u različitim populacijama. U tu svrhu, npr. koeficijenti konjugacije Pearson (C) i Chuprov (C):

gdje je f 2 srednji kvadratni indeks kontingencije, određen oduzimanjem jedan od zbira omjera kvadrata frekvencija svake ćelije korelacijske tablice na proizvod frekvencija odgovarajuće kolone i reda:

K 1 i K 2 - broj grupa za svaki od znakova. Vrijednost koeficijenta međusobne kontingencije, koja odražava bliskost odnosa između kvalitativnih karakteristika, fluktuira unutar uobičajenog raspona za ove pokazatelje od 0 do 1.

U socio-ekonomskim studijama često se dešavaju situacije kada neko obeležje nije izraženo kvantitativno, ali se jedinice populacije mogu poredati. Takvo sređivanje jedinica populacije prema vrijednosti atributa naziva se rangiranje. Primjeri mogu biti rangiranje studenata (učenika) prema njihovim sposobnostima, bilo kojeg skupa ljudi prema stepenu obrazovanja, zanimanju, sposobnosti za kreativnost itd.

Prilikom rangiranja dodjeljuje se svaka jedinica populacije čin, one. serijski broj. Ako je vrijednost atributa ista za različite jedinice, njima se dodjeljuje kombinovani prosječni serijski broj. Na primjer, ako 5. i 6. jedinica populacije imaju iste vrijednosti karakteristika, obje će dobiti rang jednak (5 + 6) / 2 = 5,5.

Odnos između rangiranih karakteristika se mjeri pomoću koeficijenti korelacije ranga Spearman (r) i Kendall (t). Ove metode su primjenjive ne samo za kvalitativne, već i za kvantitativne pokazatelje, posebno s malim obimom populacije, budući da neparametarske metode korelacije ranga nisu povezane s bilo kakvim ograničenjima na prirodu distribucije osobine.

Prethodno