6. Llojet e grupimeve statistikore, rëndësia e tyre njohëse.

7. Tabelat statistikore: llojet, rregullat e ndërtimit, teknikat e leximit

8. Vlerat absolute: llojet, vlera njohëse. Kushtet për përdorimin shkencor të treguesve absolutë dhe relativë.

9. Vlerat mesatare: përmbajtja, llojet, llojet, kushtet shkencore të aplikimit.

11. Vetitë e dispersionit. Rregulli i shtimit (zbërthimit) të variancës dhe përdorimi i tij në analizat statistikore.

12. Llojet e grafikëve statistikorë sipas përmbajtjes së detyrave që do të zgjidhen dhe metodave të ndërtimit.

13. Seria e dinamikës: llojet, treguesit e analizës.

14. Metodat për identifikimin e tendencave në seritë kohore.

15. Indekset: përkufizimi, elementet kryesore të indekseve, detyrat e zgjidhura me ndihmën e indekseve, sistemi i indekseve në statistikë.

16. Rregulla për ndërtimin e indekseve dinamike dhe territoriale.

17. Bazat e teorisë së metodës së kampionimit.

18. Teoria e mostrave të vogla.

19. Metodat për përzgjedhjen e njësive në kampion.

20. Llojet e marrëdhënieve, metodat statistikore për analizimin e marrëdhënieve, koncepti i korrelacionit.

21.Përmbajtja e analizës së korrelacionit, modelet e korrelacionit.

22. Vlerësimi i forcës (ngushtësisë) së korrelacionit.

23. Sistemi i treguesve të statistikave social-ekonomike.

24. Grupimet dhe klasifikimet bazë në statistikat socio-ekonomike.

25. Pasuria kombëtare: përmbajtja e kategorisë dhe përbërja.

26. Përmbajtja e regjistrit të tokës. Treguesit e përbërjes së tokës sipas formës së pronësisë, qëllimit dhe llojeve të tokës.

27. Klasifikimi i aktiveve fikse, metodat e vlerësimit dhe rivlerësimit, treguesit e lëvizjes, gjendjes dhe përdorimit.

28. Detyrat e statistikave të punës. Koncepti dhe përmbajtja e kategorive kryesore të tregut të punës.

29. Statistikat e përdorimit të fuqisë punëtore dhe kohës së punës.

30. Treguesit e produktivitetit të punës dhe metodat e analizës.

31. Treguesit e prodhimit bimor dhe rendimenteve të bimëve. Kulturat dhe tokat.

32. Treguesit e prodhimit blegtoral dhe produktivitetit të kafshëve të fermës.

33. Statistikat e kostove sociale dhe kostot e prodhimit.

34. Statistikat e pagave dhe kostove të punës.

35. Statistikat e prodhimit dhe të ardhurave bruto.

36. Treguesit e lëvizjes dhe shitjes së produkteve bujqësore.

37. Detyrat e analizës statistikore të ndërmarrjeve bujqësore.

38. Statistikat e çmimeve dhe të mallrave të sektorëve të ekonomisë kombëtare: detyra dhe metoda analize.

39. Statistikat e tregut të mallrave dhe shërbimeve.

40. Statistikat e treguesve të prodhimit shoqëror.

41. Analiza statistikore e çmimeve të tregut të konsumit.

42. Statistikat e inflacionit dhe treguesit kryesorë të vlerësimit të tij.

43. Detyrat e statistikave të financave të biznesit.

44.Treguesit kryesorë të rezultateve financiare të ndërmarrjeve.

45.Detyrat e statistikave të buxhetit të shtetit.

46. Sistemi i treguesve të statistikave të buxhetit të shtetit.

47. Sistemi i treguesve të statistikave të qarkullimit monetar.

48. Statistikat e përbërjes dhe strukturës së ofertës monetare në vend.

49. Detyrat kryesore të statistikave bankare.

50.Treguesit bazë të statistikave bankare.

51. Koncepti dhe klasifikimi i kredisë. Detyrat e studimit statistikor të tij.

52. Sistemi i treguesve të statistikave të kredisë.

53. Treguesit bazë dhe metodat e analizës së biznesit të kursimeve.

54. Detyrat e statistikave të tregut të aksioneve dhe letrave me vlerë.

56. Statistikat e shkëmbimeve të mallrave: detyrat dhe sistemi i treguesve.

57. Sistemi i llogarive kombëtare: konceptet, kategoritë kryesore dhe klasifikimi.

58.Parimet bazë për ndërtimin e SNS.

59. Treguesit bazë makroekonomikë – përmbajtja, metodat e përcaktimit.

60. Bilanci ndërsektorial: konceptet, detyrat, llojet e turmës.

62. Statistikat e të ardhurave dhe shpenzimeve të popullsisë

18. Teoria e mostrave të vogla.

Në numra të mëdhenj njësi kampionimi (n>100) shpërndarja gabime të rastësishme Mesatarja e mostrës në përputhje me teoremën e A.M. Lyapunov është normale ose i afrohet normales me rritjen e numrit të vëzhgimeve.

Megjithatë, në praktikën e kërkimit statistikor në një ekonomi tregu, është gjithnjë e më e nevojshme të merret me mostra të vogla.

Një mostër e vogël është një vëzhgim i tillë i mostrës, numri i njësive të të cilit nuk i kalon 30.

Gjatë vlerësimit të rezultateve mostër e vogël madhësia e popullsisë nuk përdoret. Për të përcaktuar kufijtë e mundshëm të gabimit, përdoret kriteri i Studentit.

Vlera e σ llogaritet në bazë të të dhënave të vëzhgimit të mostrës.

Kjo vlerë përdoret vetëm për popullatën e studiuar, dhe jo si një vlerësim i përafërt i σ në popullatën e përgjithshme.

Një vlerësim probabilistik i rezultateve të një kampioni të vogël ndryshon nga një vlerësim në një kampion të madh në atë që, me një numër të vogël vëzhgimesh, shpërndarja e probabilitetit për mesataren varet nga numri i njësive të zgjedhura.

Megjithatë, për një kampion të vogël, vlera e koeficientit të besimit t lidhet me vlerësimin probabilistik në një mënyrë të ndryshme sesa për një kampion të madh (pasi ligji i shpërndarjes ndryshon nga ai normal).

Sipas ligjit të shpërndarjes të vendosur nga Studenti, gabimi i mundshëm i shpërndarjes varet si nga vlera e koeficientit të besimit t ashtu edhe nga madhësia e kampionit B.

Gabimi mesatar i një kampioni të vogël llogaritet me formulën:

ku është varianca e një kampioni të vogël.

Në MW, koeficienti n / (n-1) duhet të merret parasysh dhe duhet të korrigjohet. Gjatë përcaktimit të variancës S2, numri i shkallëve të lirisë është:

Gabimi margjinal i një kampioni të vogël përcaktohet nga formula

Në këtë rast, vlera e koeficientit të besimit t varet jo vetëm nga probabiliteti i dhënë i besimit, por edhe nga numri i njësive të mostrës n. Për vlerat individuale të t dhe n, probabiliteti i besimit të një kampioni të vogël përcaktohet nga tabelat speciale të Studentit, në të cilat jepen shpërndarjet e devijimeve të standardizuara:

Vlerësimi probabilistik i rezultateve të SW ndryshon nga vlerësimi në BV në atë që, me një numër të vogël vëzhgimesh, shpërndarja e probabilitetit për mesataren varet nga numri i njësive të zgjedhura

19. Metodat për përzgjedhjen e njësive në kampion.

1. Mostra duhet të jetë mjaft e madhe në numër.

2. Struktura e popullsisë së mostrës duhet të pasqyrojë më së miri strukturën e popullsisë së përgjithshme.

3. Metoda e përzgjedhjes duhet të jetë e rastësishme

Në varësi të faktit nëse njësitë e përzgjedhura marrin pjesë në mostër, metoda dallohet - jo e përsëritur dhe e përsëritur.

Përzgjedhja jo e përsëritur është një përzgjedhje e tillë, në të cilën njësia që ka rënë në kampion nuk i kthehet popullatës nga e cila kryhet përzgjedhja e mëtejshme.

Llogaritja e gabimit mesatar të një kampioni të rastësishëm jo të përsëritur:

Llogaritja e gabimit margjinal të kampionimit të rastësishëm jo të përsëritur:

Gjatë rizgjedhjes, njësia që ra në kampion pas regjistrimit të karakteristikave të vëzhguara kthehet në popullatën origjinale (të përgjithshme) për të marrë pjesë në procedurën e mëtejshme të përzgjedhjes.

Llogaritja e gabimit mesatar të kampionimit të rastësishëm të thjeshtë të përsëritur kryhet si më poshtë:

Llogaritja e gabimit margjinal të kampionimit të rastësishëm të përsëritur:

Lloji i formimit të mostrës ndahet në - individual, grupor dhe i kombinuar.

Metoda e përzgjedhjes - përcakton një mekanizëm specifik për njësitë e kampionimit nga popullata e përgjithshme dhe ndahet në: realisht - rastësore; mekanike; tipike; serial; të kombinuara.

Në fakt, rastësore metoda më e zakonshme e përzgjedhjes në një kampion të rastësishëm, quhet edhe metoda e lotarisë, në të cilën përgatitet një biletë me numër serik për çdo njësi të popullsisë statistikore. Më pas, zgjidhet rastësisht numri i kërkuar i njësive të popullsisë statistikore. Në këto kushte, secili prej tyre ka të njëjtën probabilitet për t'u përfshirë në kampion.

Marrja e mostrave mekanike. Përdoret në rastet kur popullata e përgjithshme është në një farë mënyre e renditur, d.m.th. ekziston një sekuencë e caktuar në rregullimin e njësive.

Për të përcaktuar gabimin mesatar të kampionimit mekanik, përdoret formula e gabimit mesatar për zgjedhjen e duhur të rastësishme jo të përsëritur.

përzgjedhje tipike. Përdoret kur të gjitha njësitë e popullsisë së përgjithshme mund të ndahen në disa grupe tipike. Përzgjedhja tipike përfshin zgjedhjen e njësive nga vetë secili grup - në mënyrë të rastësishme ose mekanike.

Për një kampion tipik, vlera e gabimit standard varet nga saktësia e përcaktimit të mesatares së grupit. Pra, në formulën e gabimit margjinal të një kampioni tipik merret parasysh mesatarja e variancave të grupit, d.m.th.

përzgjedhja serike. Përdoret në rastet kur njësitë e popullsisë kombinohen në grupe ose seri të vogla. Thelbi i kampionimit serial qëndron në përzgjedhjen aktuale të rastësishme ose mekanike të serive, brenda së cilës kryhet një studim i plotë i njësive.

Me kampionimin serik, madhësia e gabimit të kampionimit nuk varet nga numri i njësive të studiuara, por nga numri i serive të ekzaminuara (s) dhe nga vlera e variancës ndërgrupore:

Zgjedhja e kombinuar mund të kalojë një ose më shumë hapa. Një kampion quhet njëfazor nëse njësitë e popullatës së zgjedhur një herë i nënshtrohen studimit.

Mostra quhet shumëshkallëshe, nëse përzgjedhja e popullatës kalon nëpër hapa, faza të njëpasnjëshme dhe çdo hap, fazë përzgjedhjeje ka njësinë e vet të përzgjedhjes.

Në procesin e vlerësimit të shkallës së përfaqësimit të të dhënave të vëzhgimit të mostrës, çështja e madhësisë së kampionit bëhet e rëndësishme. mostër koeficienti i konvertimit student

Ai përcakton jo vetëm madhësinë e kufijve që gabimi i kampionimit nuk do të tejkalojë me një probabilitet të caktuar, por edhe metodat për përcaktimin e këtyre kufijve.

Me një numër të madh të njësive të kampionimit (), shpërndarja e gabimeve të rastësishme të kampionit do të thotë në përputhje me Teorema e Lyapunovit normale ose i afrohet normales me rritjen e numrit të vëzhgimeve.

Probabiliteti i një gabimi përtej kufijve të caktuar vlerësohet në bazë të tabelave Integrali Laplace . Llogaritja e gabimit të kampionimit bazohet në vlerën e variancës së përgjithshme, pasi në përgjithësi koeficienti me të cilin varianca e mostrës shumëzohet për të marrë variancën e përgjithshme nuk luan një rol të madh.

Në praktikën e kërkimit statistikor, shpesh hasen mostra të vogla, të ashtuquajtura të vogla.

Një mostër e vogël është një vëzhgim i tillë i mostrës, numri i njësive të të cilit nuk i kalon 30.

Zhvillimi i teorisë së kampionimit të vogël filloi nga një statisticien anglez V.S. Gosset (botuar me pseudonimin Studenti ) në vitin 1908. Ai vërtetoi se vlerësimi i mospërputhjes midis mesatares së një kampioni të vogël dhe mesatares së përgjithshme ka një ligj të veçantë shpërndarjeje.

Për të përcaktuar kufijtë e mundshëm të gabimit, të ashtuquajturat Kriteri i studentit, përcaktuar nga formula

ku është një masë e luhatjeve të rastësishme të mesatares së kampionit

mostër e vogël.

Vlera llogaritet në bazë të të dhënave të vëzhgimit të mostrës:

Kjo vlerë përdoret vetëm për popullatën e studiuar, dhe jo si një vlerësim i përafërt në popullatën e përgjithshme.

Me një madhësi të vogël kampioni, shpërndarja Studenti ndryshon nga normalja: vlerat e mëdha të kriterit kanë një probabilitet më të lartë këtu sesa me një shpërndarje normale.

Gabimi marxhinal i një kampioni të vogël si funksion i gabimit mesatar paraqitet si

Por në këtë rast, madhësia lidhet ndryshe me vlerësimin e mundshëm sesa me një kampion të madh.

Sipas shpërndarjes Studenti , vlerësimi i mundshëm varet si nga madhësia ashtu edhe nga madhësia e kampionit nëse gabimi marxhinal nuk e kalon gabimin mesatar në mostrat e vogla.

Tabela 3.1 Shpërndarja e probabilitetit në mostra të vogla në varësi të nga koeficienti i besimit dhe madhësia e mostrës

Siç shihet nga skedën. 3.1 , me rritje kjo shpërndarje tenton në atë normale dhe në , tashmë ndryshon pak nga ajo.

Le të tregojmë se si të përdorim tabelën e shpërndarjes së Studentit.

Supozoni se një studim mostër i punëtorëve në një ndërmarrje të vogël tregoi se punëtorët shpenzuan kohë (min.) në një nga operacionet e prodhimit: . Gjeni modelin e kostove mesatare:

Varianca e mostrës

Prandaj gabimi mesatar i një kampioni të vogël

Nga skedën. 3.1 gjejmë se për koeficientin e besimit dhe madhësinë e një kampioni të vogël, probabiliteti është i barabartë.

Kështu, mund të argumentohet me probabilitet se mospërputhja midis kampionit dhe mesatares së përgjithshme qëndron në intervalin nga deri në, d.m.th. diferenca nuk do të kalojë në vlerë absolute ().

Prandaj, koha mesatare e shpenzuar në të gjithë popullsinë do të jetë në intervalin nga deri në.

Probabiliteti që ky supozim është në të vërtetë i gabuar dhe gabimi për arsye të rastësishme do të jetë më i madh se sa është i barabartë me: .

Tabela e probabilitetit Studenti shpesh paraqitet në një formë të ndryshme se tabela 3.1 . Besohet se në disa raste kjo formë është më e përshtatshme për përdorim praktik ( skedën. 3.2 ).

Nga skedën. 3.2 rrjedh se për çdo numër të shkallëve të lirisë, tregohet një vlerë kufi, e cila me një probabilitet të caktuar nuk do të tejkalohet për shkak të luhatjeve të rastësishme në rezultatet e mostrës.

Bazuar në skedën. 3.2 përcaktohen sasitë intervalet e besimit : dhe.

Kjo është zona e atyre vlerave të mesatares së përgjithshme, përtej së cilës ka një probabilitet shumë të vogël, të barabartë me:

Si nivel besimi në një kontroll të dyanshëm, ata zakonisht përdorin ose, gjë që nuk përjashton, megjithatë, zgjedhjen e të tjerëve që nuk janë renditur në skedën. 3.2 .

Tabela 3.2 Disa kuptime -Shpërndarjet e nxënësve

Probabilitetet e një dalje të rastësishme të vlerës mesatare të vlerësuar përtej kufijve të intervalit të besimit, përkatësisht, do të jenë të barabarta dhe, d.m.th. janë shumë të vogla.

Zgjedhja midis probabiliteteve dhe është deri në një masë arbitrare. Kjo zgjedhje përcaktohet kryesisht nga përmbajtja e atyre detyrave për të cilat përdoret një mostër e vogël.

Si përfundim, vërejmë se llogaritja e gabimeve në një mostër të vogël ndryshon pak nga llogaritje të ngjashme mostër e madhe. Dallimi është se me një kampion të vogël, probabiliteti i pohimit tonë është disi më i vogël se sa me një kampion më të madh (në veçanti, në shembullin e mësipërm dhe përkatësisht).

Megjithatë, e gjithë kjo nuk do të thotë që ju mund të përdorni një mostër të vogël kur keni nevojë për një mostër të madhe. Në shumë raste, mospërputhjet midis kufijve të gjetur mund të arrijnë madhësi të konsiderueshme, gjë që vështirë se i kënaq studiuesit. Prandaj, një kampion i vogël duhet përdorur në një studim statistikor të dukurive socio-ekonomike me shumë kujdes, me justifikimin e duhur teorik dhe praktik.

Pra, përfundimet e bazuara në rezultatet e një kampioni të vogël kanë rëndësi praktike vetëm me kushtin që shpërndarja e veçorisë në popullatën e përgjithshme të jetë normale ose asimptotike normale. Është gjithashtu e nevojshme të merret parasysh fakti se saktësia e rezultateve të një kampioni të vogël është akoma më e ulët se sa me një kampion të madh.

JAM. Nosovsky1*, A.E. Pihlak2, V.A. Logaçev2, I.I. Chursinova3, N.A. Mutyeva2 STATISTIKA E MOSTRAVE TË VOGLA NË KËRKIMET MJEKËSORE

“Qendra Shkencore Shtetërore Federata Ruse- Instituti i Problemeve Biomjekësore Akademia Ruse Sciences, 123007, Moskë, Rusi; 2A.I Evdokimov Universiteti Shtetëror i Mjekësisë dhe Stomatologjisë në Moskë, Ministria e Shëndetësisë e Federatës Ruse, 127473, Moskë, Rusi; 3ANO Spitali Artrologjik NPO SKAL, 109044, Moskë, Rusi

*Nosovsky Andrey Maksimovich, E-mail: [email i mbrojtur]

♦ Gjenden në mënyrë eksperimentale karakteristikat e kritereve statistikore. Si rezultat, u llogarit vlera e statistikave W. Ansari-Bradley (Ansari-Bradly) dhe K. Klotts (Klotz). Për çdo statistikë fillestare, llogaritet një përafrim normal (Z-statistikë) dhe një nivel i rëndësisë p i hipotezës zero për mungesën e dallimeve në përhapjen e vlerave të dy mostrave. Nëse p>

Metodat e propozuara të statistikave matematikore bëjnë të mundur konfirmimin e besueshmërisë së ndryshimeve në rezultatet e marra edhe në grupe të vogla vëzhgimesh, nëse ndryshimet janë mjaft të rëndësishme. Shembujt klinik të pacientëve me patologji osteoartikulare shërbyen si ilustrim. Fjalë kyçe: kampion i vogël, fuqia e kriterit, koksartroza, artriti përdhes

JAM. Nosovskiy1, A.E.Pikhlak2, V.A. Logaçev2, I.I. Chursinova3, N.AMuteva2 ANALIZA E STATISTIKAVE TË TË DHËNAVE TË VOGLA NË STUDIMET MJEKËSORE

1 Qendra Kërkimore Shtetërore-Instituti i problemeve mjekësore biologjike të Akademisë Ruse të Shkencave Mjekësore, 123007 Moskë, Rusi; 2 Universiteti Shtetëror i Mjekësisë dhe Stomatologjisë në Moskë me emrin A.I. Evdokimov, 127473 Moskë, Rusi; 3 Spitali Artrologjik i shoqatës shkencore dhe praktike SKAL, 109044 Moskë, Rusi

♦ Eksperimentalisht u gjetën karakteristika të kritereve statistikore. Si rezultat, u llogarit vlera e statistikave nga W. An-sari-Bradly dhe K. Klotz. Për çdo burim statistikash llogaritet përafrimi normal (statistikat Z) dhe niveli i rëndësisë së p të hipotezës zero pa dallim në përhapjen e vlerave të dy mostrave. Atp>0.05 hipoteza zero mund të pranohet. Metodat e sugjeruara të statistikave matematikore mund të konfirmojnë saktësinë e dallimeve të rezultateve, edhe në grupe të vogla vëzhgimesh, nëse dallimet janë mjaft të rëndësishme.

Ne kemi përdorur raste mjekësore të pacientëve me patologji të kyçeve dhe kockave.

Fjalët kyçe: analiza e të dhënave të vogla, fuqia e kritereve, koksartroza, artriti përdhes

Parimet e mjekësisë së bazuar në prova vendosin kërkesa të larta për besueshmërinë e vlerësimit krahasues të rezultateve të fituara të kërkimit. Kjo bëhet edhe më e rëndësishme sepse shumica e mjekëve kanë një kuptim shumë sipërfaqësor të metodave të përpunimit statistikor, duke u kufizuar në publikimet e tyre, përveç llogaritjes së përqindjeve, në rastin më të mirë, në kriterin e Studentit.

Megjithatë, për një analizë të plotë të rezultateve të studimit, në disa raste kjo nuk mjafton. Zakonisht nuk ka dyshim për besueshmërinë e rregullsive të zbuluara kur numri i vëzhgimeve është disa mijëra apo edhe qindra. Po sikur të jenë disa dhjetëra? Po sikur të kemi vetëm disa raste? Në të vërtetë, në mjekësi ka sëmundje mjaft të rralla, kirurgët ndonjëherë kryejnë operacione unike kur numri i vëzhgimeve është shumë i vogël. Ku është ajo linjë, ajo sasi e nevojshme dhe e mjaftueshme e kërkimit që na lejon të pohojmë praninë e padyshimtë të kësaj apo asaj rregullsie?

Kjo pyetje ka një rëndësi të madhe jo vetëm në vlerësimin e studimeve të kryera tashmë, por edhe në planifikim punë shkencore. A mjafton vëzhgimi i 20 pacientëve apo është i nevojshëm minimumi 40? Apo ndoshta 10 raste do të mjaftojnë? Nga një përgjigje në kohë dhe e saktë për këtë pyetje varet jo vetëm besueshmëria e përfundimeve të nxjerra, por edhe koha e hulumtimit, kostoja e tyre, nevoja për personel, pajisje etj.

Statistikat moderne dinë mjaft truke me të cilat mund të përcaktoni besueshmërinë e rezultateve edhe me një numër të vogël vëzhgimesh. Këto janë metoda "mostra të vogla". Në përgjithësi pranohet se fillimi i statistikave të mostrave të vogla u hodh në dekadën e parë të shekullit të 20-të nga botimi i veprës së U.

set, ku ai, me pseudonimin "Studenti" (student), postuloi të ashtuquajturën /-shpërndarje. Ndryshe nga teoria shpërndarje normale, teoria e shpërndarjes për mostrat e vogla nuk kërkon njohuri apriori ose vlerësime të sakta pritje matematikore dhe variancën e popullsisë, dhe nuk kërkon supozime rreth parametrave. Në shpërndarjen /, një nga devijimet nga mesatarja e mostrës është gjithmonë fikse, pasi shuma e të gjitha devijimeve të tilla duhet të jetë e barabartë me zero. Kjo ndikon në shumën e katrorëve kur llogaritet varianca e mostrës si një vlerësim i paanshëm i variancës së popullatës dhe çon në faktin se numri i shkallëve të lirisë df është i barabartë me numrin e matjeve minus një për çdo kampion. Prandaj, në formulat dhe procedurat për llogaritjen e /-statistikave për të testuar hipotezën zero df=w-1. Të njohura janë edhe veprat klasike të statisticienit më të madh anglez R.A. Fisher (pas të cilit mori emrin ^-shpërndarja) në analizën e variancës - një metodë statistikore që fokusohet qartë në analizën e mostrave të vogla. Nga statistikat e shumta që mund të zbatohen në mënyrë të arsyeshme për mostrat e vogla, mund të përmendim: Testi i saktë i probabilitetit të Fisher; analiza joparametrike (rang) me dy faktorë të variancës Friedman; koeficienti i korrelacionit të rangut / Kendall; faktori i konkordencës së Kendall-it; Kruskal-Wallace R-test për analizën e variancës joparametrike (të renditjes); ^/-Testi Mann-Whitney; kriteri mesatar; kriteri i shenjës; koeficienti i korrelacionit të gradës Z. Spearman; /-Testi Wilcoxon.

Nuk ka një përgjigje të qartë për pyetjen se sa i madh duhet të jetë një kampion në mënyrë që të konsiderohet i vogël. Megjithatë, kufiri i kushtëzuar ndërmjet një kampioni të vogël dhe të madh konsiderohet të jetë df=30. themeli

për këtë, deri diku, shërben një zgjidhje arbitrare, rezultati i krahasimit të shpërndarjes /- (për mostrat e vogla) me shpërndarjen normale (r). Mospërputhja midis vlerave të / dhe r ka tendencë të rritet me zvogëlimin dhe zvogëlimin me rritjen Në fakt, 1 fillon t'i afrohet ngushtë b shumë përpara rastit kufizues kur / = r. Një ekzaminim i thjeshtë vizual i vlerave të tabelës / ju lejon të shihni se ky përafrim bëhet mjaft i shpejtë, duke filluar nga ^=30 e lart. Vlerat krahasuese të / (në t=30) dhe r janë përkatësisht: 2.04 dhe 1.96 për p=0.05; 2,75 dhe 2,58 për p=0,01; 3.65 dhe 3.29 për p=0.001.

Në statistikat matematikore, përdoret faktori i besimit /, vlerat e funksionit janë tabeluar për vlerat e ndryshme të tij dhe merren nivelet përkatëse të besimit (Tabela 1).

Koeficienti i besimit ju lejon të llogaritni gabimin marxhinal të kampionimit AX, i llogaritur me formulën AXav = 1tsav, d.m.th. gabimi margjinal i kampionimit është i barabartë me /-fish numrin e gabimeve mesatare të kampionimit.

Kështu, vlera e gabimit margjinal të kampionimit mund të vendoset me një probabilitet të caktuar. Siç mund të shihet nga kolona e fundit e tabelës 1, probabiliteti i një gabimi të barabartë ose më të madh se trefishi i gabimit mesatar të kampionimit, d.m.th., AXs = 3tss, është jashtëzakonisht i vogël dhe i barabartë me 0,003 (1-0,997). Ngjarje të tilla të pamundura konsiderohen praktikisht të pamundura, dhe për këtë arsye vlera AX = 3cs mund të merret si kufi i gabimit të mundshëm të kampionimit p3].

Intervali në të cilin, me një shkallë të caktuar probabiliteti, do të përmbyllet sasi e panjohur Parametri i vlerësuar quhet besim, dhe probabiliteti P - probabiliteti i besimit. Më shpesh, probabiliteti i besimit merret i barabartë me 0.95 ose 0.99, atëherë koeficienti i besimit prej 1 është i barabartë me 1.96 dhe 2.58, përkatësisht.

Kjo do të thotë se intervali i besimit dhënë probabilitet përmban mesataren e përgjithshme.

Sa më e madhe të jetë vlera e gabimit margjinal të kampionimit, aq më e madhe është vlera e intervalit të besimit dhe, rrjedhimisht, sa më e ulët është saktësia e vlerësimit.

Zbatimi i kësaj qasjeje mund të ilustrohet nga vëzhgimi i 20 pacientëve me koksartrozë, të cilët janë trajtuar në Spitalin Arthrologjik NPO "SKAL" (Shoqata Shkencore dhe Prodhuese "Trajtimi Ambulator i Kursit të Specializuar") në Moskë.

Gjatë testimit të një hipoteze statistikore, gabimet janë të mundshme. Ka dy lloje gabimesh. Gabimi i tipit I është refuzimi asnje hipoteze, ndërsa në realitet kjo hipotezë është e vërtetë. Një gabim i tipit II ndodh kur hipoteza zero pranohet kur, në fakt, hipoteza zero është e rreme.

Probabiliteti i një gabimi të tipit I quhet niveli i rëndësisë dhe shënohet a. Kështu, a=P(W¥ | H0), d.m.th. niveli i rëndësisë a është probabiliteti i ngjarjes (Ce¥), i llogaritur nën supozimin se hipoteza zero H0 është e vërtetë.

Niveli i rëndësisë dhe fuqia e testit kombinohen në konceptin e funksionit të fuqisë së testit - një funksion që përcakton probabilitetin që hipoteza zero të refuzohet. Funksioni i fuqisë varet nga rajoni kritik ¥ dhe shpërndarja aktuale e rezultateve të vëzhgimeve. Në parametrik

Tabela 1

Faktori i besimit t dhe nivelet përkatëse të besimit

t 1,00 1,96 2,00 2,58 3,00

F(0 0,683 0,950 0,954 0,990 0,997

Në problemin e testimit të hipotezave, shpërndarja e rezultateve të vëzhgimeve jepet me parametrin 0. Në këtë rast, funksioni i fuqisë shënohet me M(¥,0) dhe varet nga rajoni kritik ¥ dhe vlera aktuale e parametri në studim 0. Nëse H0: 0=00, H1: 0=01, atëherë M (¥,00) \u003d a, M(¥,01) \u003d 1-c, ku a është probabiliteti i një gabimi prej lloji i parë, b është probabiliteti i një gabimi të llojit të dytë. Atëherë, fuqia e testit është probabiliteti që hipoteza zero të refuzohet kur hipoteza alternative është e vërtetë.

Funksioni i fuqisë M(¥,0) në rastin e një parametri njëdimensional 0 zakonisht arrin një minimum të barabartë me a në 0=00, rritet në mënyrë monotone me distancën nga 00 dhe i afrohet 1 në | 0 - 00 | ^ po.

Le të vlerësojmë fuqinë e kërkuar të kritereve statistikore (Fig. 1), të cilat mund të përdoren për të analizuar trajtimin e 20 pacientëve me koksartrozë.

Siç mund ta shihni, me një devijim standard prej 3.0, i cili është jashtëzakonisht i rrallë, rezultatet do të merren me një shkallë të lartë besueshmërie /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

Për të përcaktuar nivelin e rëndësisë p, zakonisht përdoret një përafrim i përafërt normal 2 i statistikës përkatëse. Ky përafrim jep një përafrim të mirë për madhësi mjaft të mëdha të mostrës. Me një madhësi të vogël kampioni dhe vlerat p afër 0.05, ne testuam përfundimin në lidhje me hipotezën zero duke krahasuar

Kurba e fuqisë alfa=0.05, sigma=

Kurba e fuqisë alfa=0.05, sigma=1,

Dallimi i vërtetë midis mjeteve

Oriz. 1. Karakteristikat e gjetura eksperimentalisht të statistikave

kriteret.

Tabela 2.

Grupet e vëzhgimit

Grupi 1 Grupi 2 Grupi 3 Vëzhgime totale

Nimesulide, vitamina, kondroprotektorë, terapi ushtrimore + + + 20

Fizioterapi --- + + 15

Masazh... --- + 8

Dhimbje në lëvizje

Dhimbje në qetësi 43±13 27±17

llogaritja e vlerës së llogaritur të statistikave me vlerë kritike në tabelën e shpërndarjes përkatëse nga manuali statistikor.

Kriteret e dallimeve në ndërrim (pozicion). Ne përdorëm këto kritere për të testuar hipotezat e mëposhtme:

♦ nuk ka dallime në pozicionin e ndërsjellë (medianë) të dy mostrave të studiuara;

♦ zhvendosja e mostrave në raport me njëri-tjetrin është e barabartë me një vlerë d;

♦ medianaja e një kampioni të analizuar është e barabartë me vlerën d.

Në rastin b) ishte e nevojshme të zvogëloheshin të gjitha vlerat e kampionit të dytë me vlerën d: yi=yi-d.

Në rastin c), është e nevojshme të përgatitet një mostër ndihmëse e çiftuar, të gjithë elementët e së cilës janë të barabartë me d.

Si rezultat, ne kemi llogaritur:

♦ vlera e statistikave të W. Wilcoxon (Wilco-xon) - shuma e renditjeve Rxi të elementeve të njërit prej mostrave në kampionin e renditur të kombinuar;

♦ vlera e statistikës së van der Varden V bazuar në përdorimin e metodës së "shenjave arbitrare".

Për secilën statistikë, u llogarit një përafrim normal (Z-statistikë) dhe një nivel i rëndësisë P i hipotezës zero pa ndryshim në ndryshim në raport me njëri-tjetrin. Nëse p>0.05 hipoteza zero mund të pranohet.

Disa paketa dhe autorë sugjerojnë përdorimin e testit Mann-Whitney ^/- dhe testit Wald-Wolfowitz. Megjithatë, prej kohësh është vërtetuar se kriteri Mann-Whitney është ekuivalent, d.m.th. ka të njëjtat aftësi si kritike

Tabela 3.

Treguesit mesatarë të intensitetit të dhimbjes (në pikë sipas VAS)

Grupi 1 (n= 5) Grupi 2 (n=7) Grupi 3 (n= =8)

Parametri Fillimi i ndjekjes Fundi i ndjekjes Ulje e dhimbjes Fillimi i ndjekjes Fundi i ndjekjes Ulje e dhimbjes Fillimi i ndjekjes Fundi i ndjekjes Ulje e dhimbjes

Tabela 4

Të dhënat e ekzaminimit laboratorik të pacientit B.

Nr. Norma e treguesit Rezultati i rezultatit të parafundit të fundit

atë duke vizituar për vizitë

Hematokriti, % 40-48 38.7

Limfocitet, % 19-37 42

ESR, mm/orë 2-10 39

Acidi urik, μmol/l 200-416 504

Kreatininë, µmol/l 44-106 238

Hormoni paratiroid, pg/ml 7-53 76.8

Fibrinogjen, g/l 1,69-3,92 5,7

Proteina në urinë, g/l 0-0,1 1

43,5 39 10 489 202 101 3

e parafundit

Gjëja e fundit

Oriz. 2. P-vlerat e treguesve klinik të pacientit B. në ekzaminimin e parafundit dhe të fundit.

testi Wilcoxon dhe testi Wald-Wolfowitz vuan nga ndjeshmëria relativisht e ulët.

Kriteret e ndryshimit të shkallës (shpërndarja). Ne përdorëm këto kritere për të testuar hipotezat e mëposhtme:

♦ hipoteza se nuk ka dallime në shkallët (në përhapjen ose shpërndarjen e vlerave) të mostrave të studiuara;

♦ hipoteza se raporti i shkallëve të mostrës është i barabartë me një vlerë të caktuar prej g.

Në rastin e fundit, është e nevojshme që fillimisht të ndryshohen vlerat e kampionit të dytë y1=(y1-m0)^, ku m0 është mesatarja e përbashkët e dy spektrave të studiuar.

Nëse medianat e popullatave nga të cilat janë nxjerrë mostrat nuk janë të barabarta në madhësi, por

aplikoni pasi të keni modifikuar një nga përzgjedhjet, për shembull, në përzgjedhjen yi=yi-m2+mr

Nëse medianat nuk janë të barabarta dhe nuk dihen, atëherë hipoteza e mungesës së dallimeve në zhvendosje duhet të konfirmohet, ose metoda duhet të përdoret për të zbuluar alternativa arbitrare.

Si rezultat, u llogarit vlera e statistikave të W. Ansari-Bradley (Ansari-Bradly) dhe K. Klotz (Klotz), të cilat janë analoge konceptuale të statistikave të Wilcoxon dhe Van der Waerden.

Për çdo statistikë fillestare, llogaritet një përafrim normal (statistikë Z) dhe një nivel i rëndësisë P i hipotezës zero për mungesën e dallimeve në shpërndarjen e vlerave të dy mostrave. Nëse />>0.05, hipoteza zero mund të pranohet.

Kështu, metodat e statistikave matematikore të propozuara më sipër bëjnë të mundur konfirmimin e besueshmërisë së dallimeve

ka marrë rezultate edhe në grupe të vogla vëzhgimesh, nëse dallimet janë mjaft domethënëse.

Dy shembuj klinik të pacientëve me patologji osteoartikulare mund të shërbejnë si ilustrim.

Shembulli klinik nr. 1. Në 20 pacientë me koksartrozë është përdorur një kompleks trajtimi bazë, duke përfshirë administrimin oral të nimesulidit, kondroprotektorëve, injeksione intramuskulare të vitaminave dhe ushtrime fizioterapie. Gjithashtu, në 15 prej tyre është përdorur fizioterapi, ndërsa në 6 pacientë është përdorur masazh. Kështu, u formuan 3 grupe pacientësh me një numër të vogël (nga 5 në 8) vëzhgimesh (Tabela 2).

Ndër parametrat e tjerë, para fillimit të trajtimit dhe pas përfundimit të kursit (21 ± 2 ditë), intensiteti i dhimbjes gjatë lëvizjes dhe në pushim u vlerësua duke përdorur një shkallë analoge vizuale 100 pikësh (VAS).

Metodat e mëposhtme statistikore janë përdorur nga W. Ansari-Bradly dhe K. Klotz (Tabela 3).

Sipas të dhënave të marra (Tabela 3), u vu re se reduktimi i dhimbjes në pushim në grupin 1 në fund të vëzhgimit nuk ishte i rëndësishëm. Megjithatë, vlera të rëndësishme u gjetën për të gjithë parametrat e tjerë të studiuar. Shembulli klinik i konsideruar tregon mundësinë e marrjes së rezultateve të besueshme në një madhësi të vogël kampioni.

Në shembullin klinik nr. 2, të dhënat laboratorike të pacientit B., i cili vuan nga poliartriti kronik i përdhes, nefropatia gute me simptoma të CRF, të cilat ishin jashtë vlerave të referencës, janë konsideruar në dinamikë (Tabela 4).

Le të llogarisim probabilitetin që rezultatet e analizës statistikisht të tejkalojnë ndjeshëm kufijtë e normës klinike. Për ta bërë këtë, ne përdorim kalkulatorin probabilistik të paketës statistikore "STATISTICA 6.0". Në këtë rast, vlera p karakterizon gabimin e llojit të parë: probabilitetin e refuzimit të hipotezës së saktë kur në fakt është e vërtetë. Në shumicën e rasteve, rezultatet e vizitës së parafundit ishin statistikisht dukshëm të ndryshme nga norma (Fig. 2). Duke qenë se niveli i pragut të rëndësisë në këtë rast, marrim të barabartë me 0.05, rezultatet e hematokritit, limfociteve, ESR, fibrinogjenit u përmirësuan statistikisht dukshëm në vizitën e fundit. Prandaj, treguesit klinik të acidit urik, kreatininës, hormonit paratiroid dhe proteinës në urinë, për sa i përket statistikave matematikore, nuk u përmirësuan.

Kështu, kur planifikohet një studim, është e rëndësishme të merret parasysh fuqia e kritereve statistikore të aplikuara, të cilat përcaktohen nga ndryshueshmëria e kampionit dhe niveli i dhënë i rëndësisë.

Qasja e propozuar mund të jetë me interes për specialistët në fushën e mjekësisë së personalizuar për

analiza në dinamikën e metodave të trajtimit dhe ilaçeve të përdorura, duke monitoruar masat e vazhdueshme terapeutike dhe diagnostikuese.

LITERATURA

1. Bolshev L.N., Smirnov N.V. Tabelat e statistikave matematikore. M.: Nauka; 1995.

2. Korn G., Korn T. Manual i matematikës për shkencëtarë dhe inxhinierë. M.: Nauka; 2003.

3. Kobzar A.I. Aplikuar statistikat e matematikës. Për inxhinierë dhe shkencëtarë. Moskë: FIZMATLIT; 2006.

4. Pravetsky N.V., Nosovsky A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Arsyetimi matematik i një numri të mjaftueshëm matjesh për një vlerësim të besueshëm të parametrave të regjistruar në biologjinë dhe mjekësinë hapësinore. Biologjia e hapësirës dhe mjekësia e hapësirës ajrore. M.: Mjekësi; 1990; 5:53-6.

5. HollenderM., Wulf D.A. Metodat joparametrike të statistikave. M.: Financa dhe statistika; 1983.

6. Nosovsky A.M. Zbatimi i modeleve probabiliste në një rreth në kërkimin biomjekësor. Biologjia e hapësirës dhe mjekësia e hapësirës ajrore. Abstrakte Konferenca e IX Gjithë Bashkimit. Kaluga, 19-21 qershor 1990.

7. Nosovsky A.M., Pravetsky N.V., Kholin S.F. Qasje matematikore për vlerësimin e saktësisë së matjeve të një parametri fiziologjik me metoda të ndryshme. Biologjia e hapësirës dhe mjekësia e hapësirës ajrore. M.: Mjekësi; 1991; 6:53-5.

1. Bol "shev L.N., Smirnov N.V. Tabelat e Statistikave Matematikore. Moskë: Nauka; 1995 (në Rusisht).

2. Korn G., Korn T. Manual Matematik për Shkencëtarët dhe Inxhinierët. Moska: Nauka; 2003 (në Rusisht).

3. Kobzar" A.I. Statistika e Aplikuar Matematikore. Për inxhinierë dhe shkencëtarë. Moskë: FIZMATLIT; 2006 (në Rusisht).

4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Arsyetimi matematik i një numri të mjaftueshëm matjesh për vlerësim të besueshëm të parametrave të regjistruar në biologjinë dhe mjekësinë hapësinore. Biologjia Hapësinore dhe Mjekësia Hapësinore Ajrore. Moskë: Meditsina; 1990; 5:53-6 (në Rusisht).

5. Khollender M., Vul "f D.A. Metodat statistikore joparametrike. Moskë: Finansy dhe statistika; 1983 (në Rusisht).

6. Nosovskiy A.M. Përdorimi i modeleve probabiliste në rreth në kërkimin biomjekësor. Biologjia Hapësinore dhe Mjekësia Hapësinore Ajrore. Abstrakte të Konferencës së IX Gjithë Bashkimit. Kaluga, 19-21 qershor 1990 (në rusisht).

7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Qasje matematikore për vlerësimin e saktësisë së parametrit fiziologjik me metoda të ndryshme. Biologjia Hapësinore dhe Mjekësia Hapësinore Ajrore. Moskë: Me-ditsina; 1991; 6:53-5 (në Rusisht).

Gjatë kontrollit të cilësisë së mallrave në kërkimin ekonomik, një eksperiment mund të kryhet në bazë të një kampioni të vogël mostër e vogël kuptohet si një vrojtim statistikor jo i vazhdueshëm, në të cilin popullata e mostrës formohet nga një numër relativisht i vogël njësish të popullsisë së përgjithshme. Madhësia e një kampioni të vogël zakonisht nuk i kalon 30 njësi dhe mund të arrijë deri në 4 - 5 njësi. Gabimi mesatar i një kampioni të vogël llogaritet me formulën:, ku është varianca e një kampioni të vogël. Gjatë përcaktimit të variancës, numri i shkallëve të lirisë është n-1: . Gabimi margjinal i një kampioni të vogël përcaktohet nga formula: Në këtë rast, vlera e koeficientit të besimit t varet jo vetëm nga probabiliteti i dhënë i besimit, por edhe nga numri i njësive të mostrës n. Për vlerat individuale të t dhe n, probabiliteti i besimit të një kampioni të vogël përcaktohet nga tabelat speciale të Studentit (Tabela 9.1.), në të cilat jepen shpërndarjet e devijimeve të standardizuara: atëherë përdoren treguesit e mëposhtëm të shpërndarjes së Studentit për përcaktoni gabimin margjinal të një kampioni të vogël:

Metodat për zgjerimin e karakteristikave të mostrës në popullatën e përgjithshme. Metoda e kampionimit përdoret më shpesh për të marrë karakteristikat e popullatës së përgjithshme sipas treguesve përkatës të kampionit. Në varësi të objektivave të hulumtimit, kjo kryhet ose me rillogaritje të drejtpërdrejtë të treguesve të mostrës për popullatën e përgjithshme, ose duke llogaritur faktorët korrigjues. Metoda e llogaritjes direkte. Ai konsiston në faktin se treguesit e peshës së mostrës ose mesatares shtrihen në popullatën e përgjithshme, duke marrë parasysh gabimin e kampionimit.Kështu, në tregti përcaktohet numri i produkteve jo standarde të marra në një grup mallrash. Për ta bërë këtë (duke marrë parasysh shkallën e pranuar të probabilitetit), treguesit e pjesës së produkteve jo standarde në mostër shumëzohen me numrin e produkteve në të gjithë grupin e mallrave. Metoda e faktorëve korrigjues. Përdoret në rastet kur qëllimi i metodës së kampionimit është përpunimi i rezultateve të një regjistrimi të plotë.Në praktikën statistikore kjo metodë përdoret për të rafinuar të dhënat e regjistrimeve vjetore të bagëtive në pronësi të popullsisë. Për ta bërë këtë, pas përmbledhjes së të dhënave të kontabilitetit të plotë, praktikohet një vrojtim kampion prej 10% me përcaktimin e të ashtuquajturës "përqindje e nënvlerësimit". Metodat për zgjedhjen e njësive nga popullata e përgjithshme. Në statistika përdoren metoda të ndryshme të formimit të grupeve të mostrave, të cilat përcaktohen nga objektivat e studimit dhe varen nga specifikat e objektit të studimit.Kushti kryesor për kryerjen e një sondazhi kampion është parandalimi i shfaqjes së gabimeve sistematike që rrjedhin nga shkelje e parimit mundesi te barabarta godet në kampionin e çdo njësie të popullsisë së përgjithshme. Parandalimi i gabimeve sistematike arrihet si rezultat i përdorimit të metodave të bazuara shkencërisht për formimin e një popullate mostër. Ekzistojnë metodat e mëposhtme për zgjedhjen e njësive nga popullata e përgjithshme: 1) përzgjedhja individuale - njësitë individuale përzgjidhen në kampion; 2) përzgjedhja në grup - grupet cilësore homogjene ose seritë e njësive në studim përfshihen në kampion; 3) përzgjedhja e kombinuar është një kombinim i përzgjedhjes individuale dhe grupore. Metodat e përzgjedhjes përcaktohen nga rregullat për formimin e një popullate kampione.Mostra mund të jetë: - realisht e rastësishme; - mekanike; - tipike; - serike; - e kombinuar. Kampionimi vetë i rastësishëm konsiston në faktin se kampioni është formuar si rezultat i përzgjedhjes së rastësishme (të paqëllimshme) të njësive individuale nga popullata e përgjithshme. Në këtë rast, numri i njësive të zgjedhura në grupin e mostrës zakonisht përcaktohet në bazë të proporcionit të pranuar të mostrës. Pjesa e mostrës është raporti i numrit të njësive të popullsisë së mostrës n me numrin e njësive të popullatës së përgjithshme N, pra, me një kampion prej 5% nga një grup mallrash prej 2000 njësive. madhësia e mostrës n është 100 njësi. (5 * 2000:100), dhe me një mostër 20% do të jetë 400 njësi. (20*2000:100) etj. Marrja e mostrave mekanike konsiston në faktin se përzgjedhja e njësive në kampion bëhet nga popullata e përgjithshme, e ndarë në intervale (grupe) të barabarta. Në të njëjtën kohë, madhësia e intervalit në popullatën e përgjithshme është e barabartë me reciprocitetin e pjesës së mostrës.Pra, me një kampion prej 2%, zgjidhet çdo njësi e 50-të (1:0.02), me një kampion 5%, çdo Njësia e 20-të (1: 0,05), etj. Kështu, në përputhje me proporcionin e pranuar të përzgjedhjes, popullsia e përgjithshme, si të thuash, ndahet mekanikisht në grupe të barabarta. Nga secili grup në kampion zgjidhet vetëm një njësi.Një tipar i rëndësishëm i kampionimit mekanik është se formimi i një popullate të mostrës mund të kryhet pa përdorur listën. Në praktikë, shpesh përdoret rendi në të cilin janë vendosur njësitë e popullsisë. Për shembull, sekuenca e prodhimit të produkteve të gatshme nga një transportues ose linjë prodhimi, rendi në të cilin vendosen njësitë e një grupi mallrash gjatë ruajtjes, transportit, shitjes, etj. Mostra tipike. Me një kampion tipik, popullsia fillimisht ndahet në grupe tipike homogjene. Më pas, nga çdo grup tipik, një përzgjedhje individuale e njësive në kampion bëhet nga një kampion i rastësishëm ose mekanik. Mostra tipike zakonisht përdoret në studimin e komplekseve. agregate. Për shembull, në një studim mostër të produktivitetit të punës së punëtorëve të tregtisë, i përbërë nga grupe të veçanta aftësish.Një tipar i rëndësishëm i një kampioni tipik është se ai jep rezultate më të sakta në krahasim me metodat e tjera të përzgjedhjes së njësive në një popullatë mostër.Për të përcaktuar mesataren gabim i një kampioni tipik, përdoren formulat e mëposhtme: rizgjedhja

, përzgjedhje jo e përsëritur

, Dispersioni përcaktohet nga formulat e mëposhtme:

, Në një fazë Në kampion, çdo njësi e përzgjedhur i nënshtrohet menjëherë studimit mbi një bazë të caktuar. Ky është rasti me kampionimin e duhur të rastësishëm dhe serial. shumëshkallëshe kampioni zgjidhet nga popullata e përgjithshme e grupeve individuale, dhe njësitë individuale përzgjidhen nga grupet. Kështu bëhet një kampion tipik me një metodë mekanike të përzgjedhjes së njësive në popullatën e mostrës. Të kombinuara mostra mund të jetë me dy faza. Në këtë rast, popullsia e përgjithshme fillimisht ndahet në grupe. Më pas zgjidhen grupet dhe brenda këtyre të fundit zgjidhen njësitë individuale.

Përveç vetë kampionit të rastësishëm me justifikimin e tij të qartë probabilistik, ekzistojnë mostra të tjera që nuk janë absolutisht të rastësishme, por përdoren gjerësisht. Duhet të theksohet se zbatimi i rreptë i përzgjedhjes aktuale të rastësishme të njësive nga popullata e përgjithshme nuk është aspak gjithmonë i mundur në praktikë. Mostra të tilla përfshijnë marrjen e mostrave mekanike, tipike, serike (ose të mbivendosura), shumëfazore dhe një sërë të tjerash.

Rrallëherë ndodh që popullsia e përgjithshme të jetë homogjene; ky është më shumë përjashtim sesa rregull. Prandaj, nëse ka lloje të ndryshme dukurish në popullatën e përgjithshme, shpesh është e dëshirueshme të sigurohet një përfaqësim më i barabartë i llojeve të ndryshme në popullatën e mostrës. Ky qëllim arrihet me sukses duke përdorur një mostër tipike. Vështirësia kryesore është se ne duhet Informacion shtese për të gjithë popullsinë e përgjithshme, gjë që në disa raste është e vështirë.

Një kampion tipik quhet gjithashtu një mostër e shtresuar ose e shtresuar; përdoret gjithashtu për të paraqitur në mënyrë më të barabartë rajone të ndryshme në mostër, me ç'rast mostra quhet mostër e rajonit.

Pra nën tipike Një kampion kuptohet si një kampion i tillë në të cilin popullata e përgjithshme ndahet në nëngrupe tipike të formuara nga një ose më shumë veçoritë thelbësore(për shembull, popullsia ndahet në 3-4 nëngrupe sipas të ardhurave mesatare për frymë ose nivelit të arsimit - fillor, i mesëm, i lartë, etj.). Më tej, nga të gjitha grupet tipike, është e mundur të zgjidhen njësitë në mostër në disa mënyra, duke formuar:

a) një kampion tipik i ndarë në mënyrë të barabartë, nga tipe te ndryshme(shtresa) zgjidhet një numër i barabartë njësish. Kjo skemë funksionon mirë nëse në popullatën e përgjithshme shtresat (llojet) nuk ndryshojnë shumë nga njëra-tjetra në numrin e njësive;

b) kampionimi tipik me vendosje proporcionale, kur kërkohet (në krahasim me vendosjen uniforme) që proporcioni (%) i përzgjedhjes për të gjitha shtresat të jetë i njëjtë (për shembull, 5 ose 10%);

c) një kampion tipik me vendosje optimale, kur merret parasysh shkalla e variacionit të veçorive në grupe të ndryshme të popullatës së përgjithshme. Me këtë vendosje, përqindja e përzgjedhjes për grupet me një luhatje të madhe të tiparit rritet, gjë që përfundimisht çon në një ulje të gabimit të rastësishëm.

Formula për gabimin mesatar në përzgjedhjen tipike është e ngjashme me gabimin e zakonshëm të kampionimit për vetë një kampion të rastësishëm, me ndryshimin e vetëm që në vend të variancës totale, vihet mesatarja e variancave private brenda grupit, gjë që natyrisht çon në një ulje e gabimit në krahasim me një kampion të duhur të rastësishëm. Megjithatë, zbatimi i tij nuk është gjithmonë i mundur (për shumë arsye). Nëse nuk ka nevojë për saktësi të madhe, është më e lehtë dhe më e lirë të përdoret kampionimi serik.

Seriali kampionimi (i mbivendosur) konsiston në faktin se në kampion nuk zgjidhen njësi të popullsisë (për shembull, studentët), por seri ose fole të veçanta (për shembull, grupe studimi). Me fjalë të tjera, me përzgjedhjen serike (të mbivendosur), njësia e vëzhgimit dhe njësia e përzgjedhjes nuk përkojnë: zgjidhen grupe të caktuara njësish ngjitur me njëra-tjetrën (foletë) dhe njësitë e përfshira në këto fole i nënshtrohen ekzaminimit. Kështu, për shembull, në një studim mostër të kushteve të banimit, ne mund të zgjedhim rastësisht një numër të caktuar familjesh (njësi kampionimi) dhe më pas të zbulojmë kushtet e jetesës së familjeve që jetojnë në këto shtëpi (njësi vëzhgimi).

Seritë (foletë) përbëhen nga njësi të ndërlidhura gjeografikisht (rrethe, qytete, etj.), Organizativ (ndërmarrje, punishte, etj.), ose në kohë (për shembull, një grup njësish produktesh të prodhuara gjatë një periudhe të caktuar kohe).

Përzgjedhja serike mund të organizohet në formën e përzgjedhjes njëfazore, dyfazore ose shumëfazore.

Seritë e përzgjedhura rastësisht i nënshtrohen kërkimeve të vazhdueshme. Kështu, kampionimi serik përbëhet nga dy faza të përzgjedhjes së rastësishme të serive dhe studimit të vazhdueshëm të këtyre serive. Zgjedhja serike siguron kursime të konsiderueshme në fuqi punëtore dhe burime dhe për këtë arsye përdoret shpesh në praktikë. Gabimi i përzgjedhjes serike ndryshon nga gabimi aktual i përzgjedhjes rastësore në atë që varianca e ndërserive (ndërgrupeve) përdoret në vend të vlerës totale të variancës dhe numri i serive përdoret në vend të madhësisë së mostrës. Saktësia zakonisht nuk është shumë e lartë, por në disa raste është e pranueshme. Marrja e mostrave serike mund të përsëritet dhe të mos përsëritet, dhe seritë mund të jenë të barabarta dhe të pabarabarta.

Marrja e mostrave serike mund të organizohet sipas skemave të ndryshme. Për shembull, është e mundur të formohet një grup kampionimi në dy faza: së pari, seritë që do të ekzaminohen zgjidhen në mënyrë të rastësishme, pastaj një numër i caktuar njësish që do të vëzhgohen drejtpërdrejt (të matura, të peshuara, etj.) zgjidhen gjithashtu rastësisht nga secila. seritë e zgjedhura. Gabimi i një kampioni të tillë do të varet nga gabimi i përzgjedhjes serike dhe nga gabimi i përzgjedhjes individuale, d.m.th. përzgjedhja me shumë faza zakonisht jep rezultate më pak të sakta se përzgjedhja me një fazë, e cila shpjegohet me shfaqjen e gabimeve të përfaqësimit në çdo fazë të kampionimit. Në këtë rast, kërkohet të përdoret formula e gabimit të kampionimit për zgjedhjen e kombinuar.

Një formë tjetër e përzgjedhjes është përzgjedhja shumëfazore (1, 2, 3 faza ose faza). Kjo përzgjedhje ndryshon në strukturën e saj nga përzgjedhja shumëfazore, pasi në përzgjedhjen shumëfazore përdoren të njëjtat njësi përzgjedhjeje në secilën fazë. Gabimet në përzgjedhjen shumëfazore llogariten për secilën fazë veç e veç. tipar kryesor kampionimi dyfazor konsiston në faktin se mostrat ndryshojnë nga njëri-tjetri sipas tre kritereve në varësi të: 1) proporcionit të njësive të studiuara në fazën e parë të kampionit dhe të ripërfshirë në fazën e dytë dhe të mëpasshme; 2) nga respektimi i barazisë së shanseve të secilës njësi mostër të fazës së parë për të qenë sërish objekt studimi; 3) në madhësinë e intervalit që ndan fazat nga njëra-tjetra.

Le të ndalemi në një lloj tjetër përzgjedhjeje, domethënë mekanike(ose sistematike). Kjo përzgjedhje është ndoshta më e zakonshme. Kjo me sa duket për faktin se nga të gjitha metodat e përzgjedhjes, kjo është më e thjeshta. Në veçanti, është shumë më e thjeshtë se zgjedhja e rastësishme, e cila përfshin aftësinë për të përdorur tabela me numra të rastësishëm dhe nuk kërkon informacion shtesë për popullatën e përgjithshme dhe strukturën e saj. Për më tepër, përzgjedhja mekanike është e ndërthurur ngushtë me përzgjedhjen e shtresuar proporcionale, e cila çon në një ulje të gabimit të kampionimit.

Për shembull, përdorimi i një përzgjedhjeje mekanike të anëtarëve të një kooperativë strehimi nga një listë e hartuar në rendin e pranimit në këtë kooperativë do të sigurojë përfaqësim proporcional të anëtarëve të kooperativës me kohëzgjatje të ndryshme shërbimi. Përdorimi i së njëjtës teknikë për të përzgjedhur të anketuarit nga një listë alfabetike personash ofron shanse të barabarta për mbiemrat që fillojnë me shkronja të ndryshme, e kështu me radhë. Përdorimi i personelit ose listave të tjera në ndërmarrje ose në institucionet arsimore dhe të tjerët mund të ofrojnë proporcionalitetin e nevojshëm në përfaqësimin e punëtorëve me kohëzgjatje të ndryshme të shërbimit. Vini re se përzgjedhja mekanike përdoret gjerësisht në sociologji, në studimin e opinionit publik, etj.

Për të reduktuar madhësinë e gabimit dhe veçanërisht koston e marrjes së mostrave, kombinime të ndryshme lloje të caktuara përzgjedhja (mekanike, serike, individuale, shumëfazore etj.) Në raste të tilla duhet të llogariten gabime më komplekse të kampionimit, të cilat përbëhen nga gabime që ndodhin në faza të ndryshme të studimit.

Një kampion i vogël është një grup njësish më pak se 30. Mostrat e vogla janë mjaft të zakonshme në praktikë. Për shembull, numri i rasteve të sëmundjeve të rralla ose numri i njësive me një tipar të rrallë; përveç kësaj, një mostër e vogël përdoret kur kërkimi është i shtrenjtë ose kërkimi përfshin shkatërrimin e produkteve ose mostrave. Mostrat e vogla përdoren gjerësisht në fushën e anketave të cilësisë së produktit. Baza teorike për të përcaktuar gabimet e një kampioni të vogël u shtruan nga shkencëtari anglez W. Gosset (pseudonimi Student).

Duhet mbajtur mend se kur përcaktoni gabimin për një mostër të vogël, në vend të madhësisë së mostrës, merrni vlerën ( n- 1) ose, para përcaktimit të gabimit mesatar të kampionimit, llogaritni të ashtuquajturën variancë të korrigjuar të kampionimit (në emërues në vend të n duhet vënë ( n- një)). Vini re se një korrigjim i tillë bëhet vetëm një herë - kur llogaritet varianca e mostrës ose kur përcaktohet gabimi. vlera ( n– 1) quhet shkalla e lirisë. Gjithashtu, shpërndarja normale është zëvendësuar t-shpërndarja (Shpërndarja e nxënësit), e cila është në tabelë dhe varet nga numri i shkallëve të lirisë. Parametri i vetëm i shpërndarjes Studenti është vlera ( n- një). Theksojmë edhe një herë se amendamenti ( n– 1) është i rëndësishëm dhe i rëndësishëm vetëm për popullatat e vogla të mostrës; në n> 30 e lart, diferenca zhduket, duke iu afruar zeros.

Deri tani kemi folur për mostra të rastësishme, d.m.th. të tilla kur zgjedhja e njësive nga popullata e përgjithshme bëhet në mënyrë të rastësishme (ose pothuajse rastësisht) dhe të gjitha njësitë kanë një probabilitet të barabartë (ose pothuajse të barabartë) për t'u përfshirë në kampion. Megjithatë, përzgjedhja e njësive mund të bazohet në parimin e përzgjedhjes jo të rastësishme, kur parimi i aksesueshmërisë dhe qëllimshmërisë është në krye. Në raste të tilla, është e pamundur të flitet për përfaqësimin e kampionit të marrë, dhe llogaritja e gabimeve të përfaqësimit mund të bëhet vetëm nëse kemi informacion për popullatën e përgjithshme.

Janë të njohura disa skema për formimin e mostrave jo të rastësishme, të cilat janë përhapur dhe përdoren kryesisht në kërkime sociologjike: përzgjedhja e njësive të disponueshme të vëzhgimit, përzgjedhja sipas metodës së Nurembergut, kampionimi i synuar gjatë përcaktimit të ekspertëve etj. Ka rëndësi edhe kampioni i kuotës, i cili formohet nga studiuesi sipas një numri të vogël parametrash domethënës dhe jep një përputhje shumë të ngushtë. me popullatën e përgjithshme. Me fjalë të tjera, përzgjedhja e kuotave duhet t'i sigurojë studiuesit një përputhje pothuajse të plotë midis kampionit dhe popullatës së përgjithshme sipas parametrave të zgjedhur prej tij. Arritja e qëllimshme e afërsisë së dy popullsive në një gamë të kufizuar treguesish arrihet, si rregull, duke përdorur një mostër me një madhësi dukshëm më të vogël sesa kur përdoret përzgjedhja e rastësishme. Është kjo rrethanë që e bën përzgjedhjen e kuotave tërheqëse për një studiues që nuk është në gjendje të fokusohet në një kampion të rastësishëm të vetë-peshuar me një madhësi të madhe. Duhet shtuar se zvogëlimi i madhësisë së kampionit më së shpeshti kombinohet me uljen e kostove monetare dhe kohën e studimit, gjë që rrit avantazhet e kësaj metode përzgjedhjeje. Vëmë re gjithashtu se me një kampion kuotash, ka mjaft informacion paraprak për strukturën e popullsisë së përgjithshme. Avantazhi kryesor këtu është se madhësia e kampionit është dukshëm më e vogël se sa me një kampion të rastësishëm. Karakteristikat e identifikuara (më shpesh socio-demografike - gjinia, mosha, arsimi) duhet të lidhen ngushtë me karakteristikat e studiuara të popullatës së përgjithshme, d.m.th. objekt studimi.

Siç është përmendur tashmë, metoda e kampionimit bën të mundur marrjen e informacionit për popullatën e përgjithshme me shumë më pak para, kohë dhe përpjekje sesa me vëzhgim të vazhdueshëm. Është gjithashtu e qartë se një studim i vazhdueshëm i të gjithë popullsisë së përgjithshme është i pamundur në një numër rastesh, për shembull, kur kontrollohet cilësia e produkteve, mostrat e të cilave janë shkatërruar.

Së bashku me këtë, megjithatë, duhet theksuar se popullata e përgjithshme nuk është plotësisht një "kuti e zezë" dhe ne kemi ende disa informacione për të. Duke kryer, për shembull, një studim selektiv në lidhje me jetën, mënyrën e jetesës, gjendjen pasurore, të ardhurat dhe shpenzimet e studentëve, opinionet, interesat e tyre, etj., ne kemi ende informacion për numrin total të tyre, grupimin sipas gjinisë, moshës, statusit martesor. , vendbanimi , kursi i studimit dhe karakteristika të tjera. Ky informacion përdoret gjithmonë në një studim mostër.

Ekzistojnë disa lloje të shpërndarjes së karakteristikave të mostrës në popullatën e përgjithshme: metoda e rillogaritjes së drejtpërdrejtë dhe metoda e faktorëve korrigjues. Rillogaritja e karakteristikave të mostrës kryhet, si rregull, duke marrë parasysh intervalet e besueshmërisë dhe mund të shprehet në vlera absolute dhe relative.

Është me vend të theksohet këtu se shumica informacion statistikor në lidhje me jetën ekonomike të shoqërisë në manifestimet dhe llojet e ndryshme të saj, bazohet në të dhënat e mostrës. Natyrisht, ato plotësohen nga të dhënat e plota të regjistrimit dhe informacionet e marra si rezultat i regjistrimeve (të popullsisë, ndërmarrjeve, etj.). Për shembull, të gjitha statistikat buxhetore (për të ardhurat dhe shpenzimet e popullsisë) të ofruara nga Rosstat bazohen në të dhënat e anketës së mostrës. Informacioni për çmimet, vëllimet e prodhimit, vëllimet e tregtisë, të shprehura në indekset përkatëse, bazohet gjithashtu kryesisht në të dhënat e mostrës.

Hipoteza statistikore dhe teste statistikore. Konceptet bazë

Konceptet e testit statistikor dhe hipotezës statistikore janë të lidhura ngushtë me kampionimin. Një hipotezë statistikore (ndryshe nga hipotezat e tjera shkencore) konsiston në supozimin e disa vetive të popullatës së përgjithshme që mund të testohen bazuar në të dhënat nga një kampion i rastësishëm. Duhet mbajtur mend se rezultati i marrë është i natyrës probabiliste. Rrjedhimisht, rezultati i studimit, që konfirmon vlefshmërinë e hipotezës së paraqitur, pothuajse nuk mund të shërbejë si bazë për pranimin përfundimtar të tij, dhe anasjelltas, rezultati, në kundërshtim me të, është mjaft i mjaftueshëm për të hedhur poshtë hipotezën e paraqitur si e gabuar ose e rreme. Kjo është kështu sepse rezultati i marrë mund të jetë në përputhje me hipotezat e tjera, dhe jo vetëm me atë të paraqitur.

Nën kriter statistikor kuptohet si një grup rregullash që lejojnë t'i përgjigjemi pyetjes se në cilat rezultate të vëzhgimit hipoteza refuzohet dhe në bazë të cilave jo. Me fjalë të tjera, një test statistikor është a rregull vendimi, e cila siguron pranimin e një hipoteze të vërtetë (të vërtetë) dhe refuzimin e një hipoteze të rreme me në një masë të madhe probabilitetet. Testet statistikore janë të njëanshme dhe të dyanshme, parametrike dhe joparametrike, pak a shumë të fuqishme. Disa kritere përdoren shpesh, të tjerët përdoren më rrallë. Disa nga kriteret janë krijuar për të zgjidhur probleme të veçanta, dhe disa kritere mund të përdoren për të zgjidhur një klasë të gjerë problemesh. Këto kritere janë përhapur gjerësisht në sociologji, ekonomi, psikologji, shkencat natyrore etj.

Le të prezantojmë disa koncepte bazë të testimit të hipotezave statistikore. Testimi i hipotezës fillon me hipotezën zero H 0, d.m.th. disa supozime të studiuesit, si dhe një hipotezë konkurruese, alternative H 1 , e cila bie ndesh me kryesoren. Për shembull: H 0: , H 1: ose H 0: , H 1: (ku a- mesatarja e përgjithshme).

Qëllimi kryesor i studiuesit kur teston një hipotezë është të refuzojë hipotezën e paraqitur prej tij. Siç shkroi R. Fisher, qëllimi i testimit të çdo hipoteze është refuzimi i saj. Testimi i hipotezave bazohet në të kundërtën. Prandaj, nëse besojmë se, për shembull, pagat mesatare të punëtorëve, të marra nga të dhënat e një kampioni të caktuar dhe e barabartë me 186 njësi monetare në muaj, nuk përkojnë me pagat aktuale për të gjithë popullsinë, atëherë supozohet si një hipotezë zero se këto paga janë të barabarta.

Hipoteza konkurruese H 1 mund të formulohet në mënyra të ndryshme:

H 1: , H 1: , H 1: .

Tjetra përcaktohet gabim i tipit I(a), i cili përcakton probabilitetin që një hipotezë e vërtetë të refuzohet. Natyrisht, ky probabilitet duhet të jetë i vogël (zakonisht nga 0.01 në 0.1, më shpesh si parazgjedhje 0.05, ose i ashtuquajturi niveli i rëndësisë 5%). Këto nivele rrjedhin nga metoda e kampionimit, sipas së cilës gabimi i dyfishtë ose i trefishtë paraqet kufijtë përtej të cilëve variacioni i rastësishëm i karakteristikave të mostrës më së shpeshti nuk shkon. Gabim i tipit II(b) është probabiliteti që hipoteza e gabuar të pranohet. Si rregull, gabimi i tipit I është më "i rrezikshëm"; Është ajo që fiksohet nga statisticieni. Nëse në fillim të studimit duam të rregullojmë njëkohësisht a dhe b (për shembull, a = 0,05; b = 0,1), atëherë për këtë fillimisht duhet të llogarisim madhësinë e kampionit.

Zonë kritike(ose zona) është një grup vlerash kriteri nën të cilat H 0 refuzohet. pikë kritike T kr është pika që ndan rajonin e pranimit të hipotezës nga rajoni i devijimit, ose zona kritike.

Siç është përmendur tashmë, gabimi i tipit I (a) është probabiliteti i refuzimit të një hipoteze të saktë. Sa më i vogël a, aq më pak ka gjasa që të bëjë një gabim të tipit I. Por në të njëjtën kohë, kur a zvogëlohet (për shembull, nga 0.05 në 0.01), është më e vështirë të refuzosh hipotezën zero, e cila, në fakt, është ajo që vendos vetë studiuesi. Theksojmë edhe një herë se një ulje e mëtejshme në a në 0.05 e më tej do të çojë në faktin se të gjitha hipotezat, të vërteta dhe të rreme, do të bien në fushën e pranimit të hipotezës zero dhe do ta bëjnë të pamundur dallimin midis tyre. .

Një gabim i tipit II (b) ndodh kur dikush pranon H 0, por në fakt hipoteza alternative është e vërtetë H një. Vlera g = 1 – b quhet fuqia e kriterit. Gabimi i tipit II (d.m.th. pranimi i gabuar i një hipoteze të rreme) zvogëlohet me rritjen e madhësisë së kampionit dhe rritjen e nivelit të rëndësisë. Nga kjo rrjedh se është e pamundur të zvogëlohet a dhe b në të njëjtën kohë. Kjo arrihet vetëm duke rritur madhësinë e kampionit (gjë që nuk është gjithmonë e mundur).

Më shpesh, detyrat e testimit të një hipoteze reduktohen në krahasimin e dy mjeteve ose aksioneve të mostrës; për të krahasuar mesataren e përgjithshme (ose ndarjen) me kampionin; krahasimi i shpërndarjeve empirike dhe teorike (kriteret e përshtatshmërisë); krahasimi i dy variancave të mostrës (c 2 -kriteri); krahasimi i dy koeficientëve të korrelacionit të mostrës ose koeficientëve të regresionit dhe disa krahasime të tjera.

Vendimi për të pranuar ose refuzuar hipotezën zero konsiston në krahasimin e vlerës aktuale të kriterit me atë tabelor (teorik). Nëse vlera aktuale është më e vogël se vlera e tabelës, atëherë konkludohet se mospërputhja është e rastësishme, e parëndësishme dhe hipoteza zero nuk mund të hidhet poshtë. Situata e kundërt (vlera aktuale është më e madhe se ajo tabelare) çon në refuzimin e hipotezës zero.

Gjatë kontrollit hipoteza statistikore më të përdorurat janë tabelat e shpërndarjes normale, shpërndarjet c 2 (lexo: chi-square), t-shpërndarjet (Student's distributions) dhe F-distribucionet (Fisher shpërndarjet).

Formula e mostrës së vogël. Llojet e mostrave. Mostra e vogël. Metodat për zgjedhjen e njësive nga popullata e përgjithshme

18. Teoria e mostrave të vogla.

19. Metodat për përzgjedhjen e njësive në kampion.

Artikuj të ngjashëm