Chi kvadrat taqsimotiga misol. Pearson (chi - kvadrat), Student va Fisherning taqsimotlari. Teskari chi2 taqsimot funksiyasi
U 1, U 2, ..,U k mustaqil etalon bo'lsin normal qiymatlar. Tarqatish tasodifiy o'zgaruvchi K = U 1 2 +U 2 2 + .. + U k 2 bilan xi-kvadrat taqsimot deyiladi. k erkinlik darajalari (ular K~c 2 (k) ni yozadilar). Bu ijobiy egrilik va quyidagi xarakteristikaga ega bo'lgan unimodal taqsimot: rejim M=k-2 kutilgan qiymat m=k dispersiya D=2k (rasm). Qachon yetarli katta ahamiyatga ega parametr k taqsimot ch 2 (k) parametrlari bilan taxminan normal taqsimotga ega
Muammolarni hal qilishda matematik statistika kritik nuqtalar ch 2 (k) ga qarab ishlatiladi berilgan ehtimollik a va erkinlik darajalari soni k(2-ilova). Kritik nuqta c 2 kr = Χ 2 (k; a) mintaqaning chegarasi bo'lib, uning o'ng tomonida tarqalish zichligi egri chizig'i ostidagi maydonning 100-a% i yotadi. Sinov paytida tasodifiy miqdorning qiymati K~c 2 (k) ch 2 (k) nuqtadan o‘ngga tushishi ehtimolligi a P(K≥c 2 kp)≤ a) dan oshmaydi. Masalan, K~c 2 (20) tasodifiy miqdor uchun a=0,05 ehtimollikni o‘rnatamiz. Jadvalga ko'ra tanqidiy nuqtalar taqsimot "chi-kvadrat" (jadvallar) biz topamiz ch 2 kp = ch 2 (20;0,05)=31,4. Shunday qilib, bu tasodifiy o'zgaruvchining ehtimoli K 31,4 dan katta, 0,05 dan kichik qiymatni oling (rasm).
Guruch. Erkinlik darajalari sonining turli qiymatlari uchun ch 2 (k) taqsimot zichligi grafigi k
Kritik nuqtalar ch 2 (k) quyidagi kalkulyatorlarda qo'llaniladi:
- Multikollinearlikni tekshirish (multikollinearlik haqida).
Shuning uchun aloqa yo'nalishini tekshirish uchun tanlangan korrelyatsiya tahlili, xususan, Pearson korrelyatsiya koeffitsienti yordamida gipotezani sinab ko'rish, t-testi yordamida ishonchlilikni keyingi sinovdan o'tkazish.
Muhimlik darajasining har qanday qiymati uchun a kh 2 ni MS Excel funksiyasi yordamida topish mumkin: = XI2OBR (a; erkinlik darajalari)
n-1 | .995 | .990 | .975 | .950 | .900 | .750 | .500 | .250 | .100 | .050 | .025 | .010 | .005 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0.00004 | 0.00016 | 0.00098 | 0.00393 | 0.01579 | 0.10153 | 0.45494 | 1.32330 | 2.70554 | 3.84146 | 5.02389 | 6.63490 | 7.87944 |
2 | 0.01003 | 0.02010 | 0.05064 | 0.10259 | 0.21072 | 0.57536 | 1.38629 | 2.77259 | 4.60517 | 5.99146 | 7.37776 | 9.21034 | 10.59663 |
3 | 0.07172 | 0.11483 | 0.21580 | 0.35185 | 0.58437 | 1.21253 | 2.36597 | 4.10834 | 6.25139 | 7.81473 | 9.34840 | 11.34487 | 12.83816 |
4 | 0.20699 | 0.29711 | 0.48442 | 0.71072 | 1.06362 | 1.92256 | 3.35669 | 5.38527 | 7.77944 | 9.48773 | 11.14329 | 13.27670 | 14.86026 |
5 | 0.41174 | 0.55430 | 0.83121 | 1.14548 | 1.61031 | 2.67460 | 4.35146 | 6.62568 | 9.23636 | 11.07050 | 12.83250 | 15.08627 | 16.74960 |
6 | 0.67573 | 0.87209 | 1.23734 | 1.63538 | 2.20413 | 3.45460 | 5.34812 | 7.84080 | 10.64464 | 12.59159 | 14.44938 | 16.81189 | 18.54758 |
7 | 0.98926 | 1.23904 | 1.68987 | 2.16735 | 2.83311 | 4.25485 | 6.34581 | 9.03715 | 12.01704 | 14.06714 | 16.01276 | 18.47531 | 20.27774 |
8 | 1.34441 | 1.64650 | 2.17973 | 2.73264 | 3.48954 | 5.07064 | 7.34412 | 10.21885 | 13.36157 | 15.50731 | 17.53455 | 20.09024 | 21.95495 |
9 | 1.73493 | 2.08790 | 2.70039 | 3.32511 | 4.16816 | 5.89883 | 8.34283 | 11.38875 | 14.68366 | 16.91898 | 19.02277 | 21.66599 | 23.58935 |
10 | 2.15586 | 2.55821 | 3.24697 | 3.94030 | 4.86518 | 6.73720 | 9.34182 | 12.54886 | 15.98718 | 18.30704 | 20.48318 | 23.20925 | 25.18818 |
11 | 2.60322 | 3.05348 | 3.81575 | 4.57481 | 5.57778 | 7.58414 | 10.34100 | 13.70069 | 17.27501 | 19.67514 | 21.92005 | 24.72497 | 26.75685 |
12 | 3.07382 | 3.57057 | 4.40379 | 5.22603 | 6.30380 | 8.43842 | 11.34032 | 14.84540 | 18.54935 | 21.02607 | 23.33666 | 26.21697 | 28.29952 |
13 | 3.56503 | 4.10692 | 5.00875 | 5.89186 | 7.04150 | 9.29907 | 12.33976 | 15.98391 | 19.81193 | 22.36203 | 24.73560 | 27.68825 | 29.81947 |
14 | 4.07467 | 4.66043 | 5.62873 | 6.57063 | 7.78953 | 10.16531 | 13.33927 | 17.11693 | 21.06414 | 23.68479 | 26.11895 | 29.14124 | 31.31935 |
15 | 4.60092 | 5.22935 | 6.26214 | 7.26094 | 8.54676 | 11.03654 | 14.33886 | 18.24509 | 22.30713 | 24.99579 | 27.48839 | 30.57791 | 32.80132 |
16 | 5.14221 | 5.81221 | 6.90766 | 7.96165 | 9.31224 | 11.91222 | 15.33850 | 19.36886 | 23.54183 | 26.29623 | 28.84535 | 31.99993 | 34.26719 |
17 | 5.69722 | 6.40776 | 7.56419 | 8.67176 | 10.08519 | 12.79193 | 16.33818 | 20.48868 | 24.76904 | 27.58711 | 30.19101 | 33.40866 | 35.71847 |
18 | 6.26480 | 7.01491 | 8.23075 | 9.39046 | 10.86494 | 13.67529 | 17.33790 | 21.60489 | 25.98942 | 28.86930 | 31.52638 | 34.80531 | 37.15645 |
19 | 6.84397 | 7.63273 | 8.90652 | 10.11701 | 11.65091 | 14.56200 | 18.33765 | 22.71781 | 27.20357 | 30.14353 | 32.85233 | 36.19087 | 38.58226 |
20 | 7.43384 | 8.26040 | 9.59078 | 10.85081 | 12.44261 | 15.45177 | 19.33743 | 23.82769 | 28.41198 | 31.41043 | 34.16961 | 37.56623 | 39.99685 |
21 | 8.03365 | 8.89720 | 10.28290 | 11.59131 | 13.23960 | 16.34438 | 20.33723 | 24.93478 | 29.61509 | 32.67057 | 35.47888 | 38.93217 | 41.40106 |
22 | 8.64272 | 9.54249 | 10.98232 | 12.33801 | 14.04149 | 17.23962 | 21.33704 | 26.03927 | 30.81328 | 33.92444 | 36.78071 | 40.28936 | 42.79565 |
23 | 9.26042 | 10.19572 | 11.68855 | 13.09051 | 14.84796 | 18.13730 | 22.33688 | 27.14134 | 32.00690 | 35.17246 | 38.07563 | 41.63840 | 44.18128 |
24 | 9.88623 | 10.85636 | 12.40115 | 13.84843 | 15.65868 | 19.03725 | 23.33673 | 28.24115 | 33.19624 | 36.41503 | 39.36408 | 42.97982 | 45.55851 |
25 | 10.51965 | 11.52398 | 13.11972 | 14.61141 | 16.47341 | 19.93934 | 24.33659 | 29.33885 | 34.38159 | 37.65248 | 40.64647 | 44.31410 | 46.92789 |
26 | 11.16024 | 12.19815 | 13.84390 | 15.37916 | 17.29188 | 20.84343 | 25.33646 | 30.43457 | 35.56317 | 38.88514 | 41.92317 | 45.64168 | 48.28988 |
27 | 11.80759 | 12.87850 | 14.57338 | 16.15140 | 18.11390 | 21.74940 | 26.33634 | 31.52841 | 36.74122 | 40.11327 | 43.19451 | 46.96294 | 49.64492 |
28 | 12.46134 | 13.56471 | 15.30786 | 16.92788 | 18.93924 | 22.65716 | 27.33623 | 32.62049 | 37.91592 | 41.33714 | 44.46079 | 48.27824 | 50.99338 |
29 | 13.12115 | 14.25645 | 16.04707 | 17.70837 | 19.76774 | 23.56659 | 28.33613 | 33.71091 | 39.08747 | 42.55697 | 45.72229 | 49.58788 | 52.33562 |
30 | 13.78672 | 14.95346 | 16.79077 | 18.49266 | 20.59923 | 24.47761 | 29.33603 | 34.79974 | 40.25602 | 43.77297 | 46.97924 | 50.89218 | 53.67196 |
Erkinlik darajalari soni k | Muhimlik darajasi a | |||||
0,01 | 0,025 | 0.05 | 0,95 | 0,975 | 0.99 | |
1 | 6.6 | 5.0 | 3.8 | 0.0039 | 0.00098 | 0.00016 |
2 | 9.2 | 7.4 | 6.0 | 0.103 | 0.051 | 0.020 |
3 | 11.3 | 9.4 | 7.8 | 0.352 | 0.216 | 0.115 |
4 | 13.3 | 11.1 | 9.5 | 0.711 | 0.484 | 0.297 |
5 | 15.1 | 12.8 | 11.1 | 1.15 | 0.831 | 0.554 |
6 | 16.8 | 14.4 | 12.6 | 1.64 | 1.24 | 0.872 |
7 | 18.5 | 16.0 | 14.1 | 2.17 | 1.69 | 1.24 |
8 | 20.1 | 17.5 | 15.5 | 2.73 | 2.18 | 1.65 |
9 | 21.7 | 19.0 | 16.9 | 3.33 | 2.70 | 2.09 |
10 | 23.2 | 20.5 | 18.3 | 3.94 | 3.25 | 2.56 |
11 | 24.7 | 21.9 | 19.7 | 4.57 | 3.82 | 3.05 |
12 | 26.2 | 23.3 | 21 .0 | 5.23 | 4.40 | 3.57 |
13 | 27.7 | 24.7 | 22.4 | 5.89 | 5.01 | 4.11 |
14 | 29.1 | 26.1 | 23.7 | 6.57 | 5.63 | 4.66 |
15 | 30.6 | 27.5 | 25.0 | 7.26 | 6.26 | 5.23 |
16 | 32.0 | 28.8 | 26.3 | 7.96 | 6.91 | 5.81 |
17 | 33.4 | 30.2 | 27.6 | 8.67 | 7.56 | 6.41 |
18 | 34.8 | 31.5 | 28.9 | 9.39 | 8.23 | 7.01 |
19 | 36.2 | 32.9 | 30.1 | 10.1 | 8.91 | 7.63 |
20 | 37.6 | 34.2 | 31.4 | 10.9 | 9.59 | 8.26 |
21 | 38.9 | 35.5 | 32.7 | 11.6 | 10.3 | 8.90 |
22 | 40.3 | 36.8 | 33.9 | 12.3 | 11.0 | 9.54 |
23 | 41.6 | 38.1 | 35.2 | 13.1 | 11.7 | 10.2 |
24 | 43.0 | 39.4 | 36.4 | 13.8 | 12.4 | 10.9 |
25 | 44.3 | 40.6 | 37.7 | 14.6 | 13.1 | 11.5 |
26 | 45.6 | 41.9 | 38.9 | 15.4 | 13.8 | 12.2 |
27 | 47.0 | 43.2 | 40.1 | 16.2 | 14.6 | 12.9 |
28 | 48.3 | 44.5 | 41.3 | 16.9 | 15.3 | 13.6 |
29 | 49.6 | 45.7 | 42.6 | 17.7 | 16.0 | 14.3 |
30 | 50.9 | 47.0 | 43.8 | 18.5 | 16.8 | 15.0 |
Chi-kvadrat taqsimoti
Yordamida normal taqsimot uchta taqsimot aniqlangan bo'lib, ular hozirda statistik ma'lumotlarni qayta ishlashda tez-tez qo'llaniladi. Bular Pearson ("chi - kvadrat"), Student va Fisherning taqsimotlari.
Biz taqsimotga ("chi - kvadrat") e'tibor qaratamiz. Bu taqsimot birinchi marta 1876 yilda astronom F. Helmert tomonidan o'rganilgan. Gauss xatolar nazariyasi bilan bog'liq holda u n ta mustaqil standart normal taqsimlangan tasodifiy o'zgaruvchilarning kvadratlari yig'indisini o'rgandi. Keyinchalik Karl Pirson bu taqsimot funksiyasini “chi-kvadrat” deb atadi. Va endi tarqatish uning nomini oladi.
Oddiy taqsimot bilan chambarchas bog'liqligi tufayli h2 taqsimoti ehtimollar nazariyasi va matematik statistikada muhim rol o'ynaydi. h2 taqsimoti va h2 taqsimoti bilan aniqlangan ko'plab boshqa taqsimotlar (masalan, Talaba taqsimoti) normal taqsimlangan kuzatishlar bo'yicha turli funktsiyalarning namunaviy taqsimotlarini tavsiflaydi va ishonch oraliqlari va statistik testlarni qurish uchun ishlatiladi.
Pirson taqsimoti (chi - kvadrat) - tasodifiy o'zgaruvchining taqsimlanishi, bunda X1, X2,…, Xn normal mustaqil tasodifiy o'zgaruvchilar bo'lib, ularning har birining matematik kutilishi nolga teng, standart og'ish esa bitta.
Kvadratlar yig'indisi
qonunga muvofiq taqsimlanadi ("chi - kvadrat").
Bunday holda, atamalar soni, ya'ni. n, chi-kvadrat taqsimotining "erkinlik darajalari soni" deb ataladi. Erkinlik darajalari soni ortib borishi bilan taqsimot asta-sekin me'yorga yaqinlashadi.
Ushbu taqsimotning zichligi
Shunday qilib, h2 ning taqsimlanishi bitta parametrga bog'liq n - erkinlik darajalari soni.
Tarqatish funktsiyasi h2 quyidagi ko'rinishga ega:
agar h2?0. (2.7.)
1-rasmda turli erkinlik darajalari uchun ehtimollik zichligi va ch2 taqsimot funksiyasining grafigi berilgan.
1-rasm Turli xil erkinlik darajalari uchun h2 (chi - kvadrat) taqsimotida q (x) ehtimollik zichligining bog'liqligi.
"Xi-kvadrat" taqsimotining momentlari:
Xi-kvadrat taqsimoti dispersiyani baholashda (ishonch oralig'idan foydalangan holda), muvofiqlik, bir xillik, mustaqillik gipotezalarini sinab ko'rishda, birinchi navbatda cheklangan miqdordagi qiymatlarni qabul qiladigan sifatli (toifalangan) o'zgaruvchilar uchun va boshqa ko'plab masalalarda qo'llaniladi. statistik tahlil ma'lumotlar.
Statistik ma'lumotlarni tahlil qilish muammolarida "Chi-kvadrat"
Ma'lumotlarni tahlil qilishning statistik usullari inson faoliyatining deyarli barcha sohalarida qo'llaniladi. Ular har qanday ichki xilma-xillikka ega bo'lgan guruh (ob'ektlar yoki sub'ektlar) to'g'risida har qanday mulohazalarni olish va asoslash zarur bo'lganda qo'llaniladi.
Rivojlanishning zamonaviy bosqichi statistik usullar 1900 yilda ingliz K.Pirson "Biometrika" jurnaliga asos solgan paytdan boshlab hisoblash mumkin. 20-asrning birinchi uchdan bir qismi parametrik statistika belgisi ostida o'tdi. Pearson oilasi egri chiziqlari bilan tavsiflangan taqsimotlarning parametrik oilalari ma'lumotlarini tahlil qilishga asoslangan usullar o'rganildi. Eng mashhuri oddiy taqsimot edi. Gipotezalarni tekshirish uchun Pearson, Student va Fisher mezonlaridan foydalanilgan. Maksimal ehtimollik usuli, dispersiyani tahlil qilish taklif qilindi va eksperimentni rejalashtirishning asosiy g'oyalari shakllantirildi.
Chi-kvadrat taqsimoti statistikada sinov uchun eng ko'p qo'llaniladigan usullardan biridir statistik farazlar. "Xi-kvadrat" taqsimoti asosida eng kuchli moslik testlaridan biri - Pirsonning "chi-kvadrat" testi tuzilgan.
Muvofiqlik testi noma'lum taqsimotning taklif qilingan qonuni haqidagi gipotezani tekshirish mezoni hisoblanadi.
P2 ("chi-kvadrat") testi turli xil taqsimotlar gipotezasini tekshirish uchun ishlatiladi. Bu uning xizmati.
Mezonning hisoblash formulasi ga teng
bu yerda m va m" mos ravishda empirik va nazariy chastotalardir
ko'rib chiqilayotgan taqsimot;
n - erkinlik darajalari soni.
Tekshirish uchun biz empirik (kuzatilgan) va nazariy (normal taqsimot taxmini ostida hisoblangan) chastotalarni solishtirishimiz kerak.
Agar empirik chastotalar hisoblangan yoki kutilgan chastotalar bilan to'liq mos kelsa, S (E - T) = 0 va ch2 mezoni ham nolga teng bo'ladi. Agar S (E - T) nolga teng bo'lmasa, bu hisoblangan chastotalar va seriyaning empirik chastotalari o'rtasidagi nomuvofiqlikni ko'rsatadi. Bunday hollarda nazariy jihatdan noldan cheksizgacha o'zgarishi mumkin bo'lgan p2 mezonining ahamiyatini baholash kerak. Bu ch2f ning haqiqiy olingan qiymatini uning kritik qiymati (ch2st) (a) va erkinlik darajalari soni (n) bilan solishtirish orqali amalga oshiriladi.
H2 tasodifiy o'zgaruvchining mumkin bo'lgan qiymatlarini taqsimlash doimiy va assimetrikdir. Bu erkinlik darajalari soniga (n) bog'liq va kuzatishlar soni ortib borishi bilan normal taqsimotga yaqinlashadi. Shuning uchun baholashga p2 mezonini qo'llash diskret taqsimotlar uning qiymatiga ta'sir qiluvchi ba'zi xatolar bilan bog'liq, ayniqsa kichik namunalar uchun. Aniqroq hisob-kitoblarni olish uchun namuna taqsimlanadi variatsion qator, kamida 50 ta variant bo'lishi kerak. To'g'ri ariza p2 mezoni, shuningdek, ekstremal sinflardagi variantlarning chastotalari 5 dan kam bo'lmasligini talab qiladi; agar ularning soni 5 dan kam bo'lsa, u holda ular qo'shni sinflarning chastotalari bilan birlashtiriladi, shunda umumiy miqdor 5 dan katta yoki teng bo'ladi. Chastotalar birikmasiga ko'ra, sinflar soni (N) ham kamayadi. Erkinlik darajalari soni o'zgaruvchanlik erkinligiga cheklovlar sonini hisobga olgan holda sinflarning ikkinchi darajali soniga qarab belgilanadi.
p2 mezonini aniqlashning aniqligi ko'p jihatdan nazariy chastotalarni (T) hisoblashning aniqligiga bog'liq bo'lganligi sababli, empirik va hisoblangan chastotalar orasidagi farqni olish uchun yaxlitlanmagan nazariy chastotalardan foydalanish kerak.
Misol tariqasida, gumanitar fanlarda statistik usullarni qo'llashga bag'ishlangan veb-saytda chop etilgan tadqiqotni olaylik.
Chi-kvadrat testi chastota taqsimotini, ular normal taqsimlanganmi yoki yo'qmi, taqqoslash imkonini beradi.
Chastotasi hodisaning sodir bo'lish sonini bildiradi. Odatda, hodisaning paydo bo'lish chastotasi o'zgaruvchilar nomlar shkalasida o'lchanganda va ularning chastotasidan tashqari boshqa xususiyatlarini tanlash imkonsiz yoki muammoli bo'lganda ko'rib chiqiladi. Boshqacha qilib aytganda, o'zgaruvchi sifat xususiyatlariga ega bo'lganda. Bundan tashqari, ko'plab tadqiqotchilar test ballarini darajalarga (yuqori, o'rta, past) tarjima qiladilar va bu darajadagi odamlar sonini bilish uchun ballar taqsimoti jadvallarini tuzadilar. Darajaning birida (toifalarning birida) odamlar soni haqiqatan ham ko'proq (kamroq) ekanligini isbotlash uchun Chi-kvadrat koeffitsienti ham qo'llaniladi.
Keling, eng oddiy misolni ko'rib chiqaylik.
Yosh o'smirlar o'rtasida o'z-o'zini hurmat qilish testi o'tkazildi. Test ballari uchta darajaga aylantirildi: yuqori, o'rta, past. Chastotalar quyidagicha taqsimlandi:
Yuqori (H) 27 kishi.
O'rta (C) 12 kishi
Past (H) 11 kishi.
Ko'rinib turibdiki, o'z-o'zini hurmat qiladigan bolalarning aksariyati, ammo buni statistik jihatdan isbotlash kerak. Buning uchun biz Chi-kvadrat testidan foydalanamiz.
Bizning vazifamiz olingan empirik ma'lumotlar nazariy jihatdan bir xil ehtimolli ma'lumotlardan farq qiladimi yoki yo'qligini tekshirishdir. Buning uchun nazariy chastotalarni topish kerak. Bizning holatlarimizda nazariy chastotalar teng ehtimolli chastotalar bo'lib, ular barcha chastotalarni qo'shish va toifalar soniga bo'lish yo'li bilan topiladi.
Bizning holatda:
(B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16,6
Xi-kvadrat testini hisoblash formulasi:
h2 \u003d? (E - T)? / T
Biz jadval tuzamiz:
Empirik (Uh) |
Nazariy (T) |
||
Oxirgi ustunning yig'indisini toping:
Endi siz kriteriyaning kritik qiymatini kritik qiymatlar jadvaliga muvofiq topishingiz kerak (Ilovadagi 1-jadval). Buning uchun bizga erkinlik darajalari soni (n) kerak.
n = (R - 1) * (C - 1)
Bu erda R - jadvaldagi qatorlar soni, C - ustunlar soni.
Bizning holatda, faqat bitta ustun (asl empirik chastotalarni anglatadi) va uchta qator (toifalar) mavjud, shuning uchun formula o'zgaradi - biz ustunlarni istisno qilamiz.
n = (R - 1) = 3-1 = 2
Xatolik ehtimoli p?0,05 va n = 2 uchun kritik qiymat h2 = 5,99 ga teng.
Olingan empirik qiymat kritik qiymatdan katta - chastotalar farqlari sezilarli (n2= 9,64; p≤0,05).
Ko'rib turganingizdek, mezonni hisoblash juda oddiy va ko'p vaqt talab qilmaydi. Chi-kvadrat testining amaliy ahamiyati juda katta. Bu usul anketalarga berilgan javoblarni tahlil qilishda eng qimmatlidir.
Keling, murakkabroq misolni olaylik.
Masalan, psixolog o'qituvchilarning qizlarga nisbatan o'g'il bolalarga nisbatan ko'proq tarafkashlik qilishlari rostmi yoki yo'qligini bilmoqchi. Bular. qizlarni maqtash ehtimoli ko'proq. Buning uchun psixolog o'quvchilarning o'qituvchilar tomonidan yozilgan xususiyatlarini tahlil qilib, uchta so'zning paydo bo'lish chastotasi bo'yicha: "faol", "tirishqoq", "intizomli", so'zlarning sinonimlari ham hisobga olingan. So'zlarning paydo bo'lish chastotasi to'g'risidagi ma'lumotlar jadvalga kiritilgan:
Olingan ma'lumotlarni qayta ishlash uchun biz chi-kvadrat testidan foydalanamiz.
Buning uchun biz empirik chastotalarni taqsimlash jadvalini tuzamiz, ya'ni. Biz kuzatadigan chastotalar:
Nazariy jihatdan biz chastotalarning teng taqsimlanishini kutamiz, ya'ni. chastota o'g'il va qiz bolalar o'rtasida mutanosib ravishda taqsimlanadi. Keling, nazariy chastotalar jadvalini tuzamiz. Buning uchun satr yig'indisini ustun yig'indisiga ko'paytiring va olingan sonni umumiy yig'indiga (s) bo'ling.
Olingan hisob-kitoblar jadvali quyidagicha ko'rinadi:
h2 \u003d? (E - T)? / T
n = (R - 1), bu erda R - jadvaldagi qatorlar soni.
Bizning holatda, chi-kvadrat = 4,21; n = 2.
Mezonning kritik qiymatlari jadvaliga ko'ra, biz quyidagilarni topamiz: n = 2 va xato darajasi 0,05, kritik qiymat h2 = 5,99.
Olingan qiymat kritik qiymatdan kichik, bu esa nol gipoteza qabul qilinganligini bildiradi.
Xulosa: o'qituvchilar bolaning xususiyatlarini yozishda uning jinsiga ahamiyat bermaydilar.
Ilova
Kritik taqsimot nuqtalari p2
\(\chi^2\) testi ("chi-kvadrat", shuningdek, "Pirsonning moslik testi") statistikada juda keng qo'llaniladi. DA umumiy ko'rinish u kuzatilgan tasodifiy o'zgaruvchining ma'lum bir nazariy taqsimot qonuniga bo'ysunishi haqidagi nol gipotezani tekshirish uchun ishlatiladi, deb aytishimiz mumkin (batafsilroq, masalan, qarang). Maxsus so'zlar tekshirilishi mumkin bo'lgan gipoteza har bir holatda farq qiladi.
Ushbu postda men immunologiyadan (gipotetik) misol yordamida \(\chi^2\) testi qanday ishlashini tasvirlab beraman. Tasavvur qiling-a, biz tanaga tegishli antikorlar kiritilganda mikrobial kasallikning rivojlanishini bostirish samaradorligini aniqlash uchun tajriba o'tkazdik. Tajribada jami 111 ta sichqon ishtirok etdi, biz ularni ikkita guruhga, jumladan, mos ravishda 57 va 54 ta hayvonlarga ajratdik. Sichqonlarning birinchi guruhiga patogen bakteriyalar kiritildi, keyin bu bakteriyalarga qarshi antikorlarni o'z ichiga olgan qon zardobi kiritildi. Ikkinchi guruh hayvonlari nazorat sifatida xizmat qildi - ular faqat bakterial in'ektsiyalarni oldilar. Bir muncha vaqt inkubatsiyadan so'ng, 38 ta sichqon vafot etgani va 73 tasi tirik qolgani ma'lum bo'ldi. Halok bo‘lganlarning 13 nafari birinchi guruhga, 25 nafari ikkinchi (nazorat) guruhiga tegishli. bu tajribada sinab ko'rildi nol gipoteza quyidagicha shakllantirish mumkin: zardobni antikorlar bilan kiritish sichqonlarning omon qolishiga ta'sir qilmaydi. Boshqacha qilib aytganda, biz sichqonlarning omon qolishida kuzatilgan farqlar (birinchi guruhda 77,2% va ikkinchi guruhda 53,7%) mutlaqo tasodifiy va antikorlarning ta'siri bilan bog'liq emasligini ta'kidlaymiz.
Tajribada olingan ma'lumotlarni jadval shaklida taqdim etish mumkin:
Jami |
|||
Bakteriyalar + sarum |
|||
Faqat bakteriyalar |
|||
Jami |
Shunga o'xshash jadvallar favqulodda jadvallar deb ataladi. Ushbu misolda jadval 2x2 o'lchamga ega: ob'ektlarning ikkita klassi ("Bakteriyalar + sarum" va "Faqat bakteriyalar") mavjud bo'lib, ular ikkita mezon bo'yicha ("O'lik" va "Omon qolgan") tekshiriladi. bu eng oddiy holat favqulodda jadvallar: albatta, o'rganilayotgan sinflar soni ham, xususiyatlar soni ham ko'proq bo'lishi mumkin.
Yuqorida keltirilgan nol gipotezani sinab ko'rish uchun, agar antikorlar haqiqatan ham sichqonlarning omon qolishiga ta'sir qilmasa, vaziyat qanday bo'lishini bilishimiz kerak. Boshqacha qilib aytganda, siz hisoblashingiz kerak kutilgan chastotalar favqulodda vaziyatlar jadvalining tegishli kataklari uchun. Buni qanday qilish kerak? Tajribada jami 38 ta sichqon vafot etdi, bu ularning 34,2% ni tashkil qiladi umumiy soni jalb qilingan hayvonlar. Agar antikorlarning kiritilishi sichqonlarning omon qolishiga ta'sir qilmasa, ikkala eksperimental guruhda ham bir xil o'lim foizi kuzatilishi kerak, ya'ni 34,2%. 57 va 54 ning 34,2% qancha ekanligini hisoblab, biz 19,5 va 18,5 ni olamiz. Bu bizning eksperimental guruhlarimizda kutilayotgan o'lim ko'rsatkichlari. Kutilayotgan omon qolish darajasi xuddi shunday tarzda hisoblanadi: jami 73 ta sichqon yoki ularning umumiy sonining 65,8 foizi omon qolganligi sababli, kutilayotgan omon qolish darajasi 37,5 va 35,5 ni tashkil qiladi. Keling, kutilayotgan chastotalar bilan yangi favqulodda vaziyatlar jadvalini tuzamiz:
o'lik |
Omon qolganlar |
Jami |
|
Bakteriyalar + sarum |
|||
Faqat bakteriyalar |
|||
Jami |
Ko'rib turganingizdek, kutilgan chastotalar kuzatilganlardan ancha farq qiladi, ya'ni. antikorlarni qo'llash patogen bilan kasallangan sichqonlarning omon qolishiga ta'sir qiladi. Biz bu taassurotni Pearsonning muvofiqlik testi \(\chi^2\) yordamida aniqlashimiz mumkin:
\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]
Bu erda \(f_o\) va \(f_e\) mos ravishda kuzatilgan va kutilayotgan chastotalardir. Yig'ish jadvalning barcha kataklari bo'ylab amalga oshiriladi. Shunday qilib, ko'rib chiqilayotgan misol uchun bizda bor
\[\chi^2 = (13-19,5)^2/19,5 + (44-37,5)^2/37,5 + (25-18,5)^2/18,5 + (29-35,5)^2/35,5 = \]
\(\chi^2\) nol gipotezani rad etish uchun etarlicha kattami? Bu savolga javob berish uchun mezonning tegishli kritik qiymatini topish kerak. \(\chi^2\) uchun erkinlik darajalari soni \(df = (R - 1)(C - 1)\ sifatida hisoblanadi), bu erda \(R\) va \(C\) sondir. jadval konjugasiyasidagi satrlar va ustunlar. Bizning holatda \(df = (2 -1)(2 - 1) = 1\). Erkinlik darajalari sonini bilgan holda, biz qchisq() standart R-funktsiyasidan foydalanib, kritik qiymatni \(\chi^2\) osonlikcha bilib olamiz:
Shunday qilib, bir darajadagi erkinlik uchun \(\chi^2\) mezonining qiymati faqat 5% hollarda 3,841 dan oshadi. Biz olgan qiymat, 6,79, bu muhim qiymatdan sezilarli darajada oshadi, bu bizga antikorlarni yuborish va yuqtirgan sichqonlarning omon qolishi o'rtasidagi bog'liqlik yo'qligi haqidagi nol gipotezani rad etish huquqini beradi. Ushbu gipotezani rad etib, biz 5% dan kam ehtimollik bilan xato qilish xavfi bor.
Shuni ta'kidlash kerakki, 2x2 o'lchamdagi favqulodda vaziyatlar jadvallari bilan ishlashda \(\chi^2\) mezonining yuqoridagi formulasi biroz yuqori baholangan qiymatlarni beradi. Buning sababi shundaki, \(\chi^2\) mezonining taqsimlanishi uzluksiz, ikkilik xususiyatlarning chastotalari ("o'lgan" / "omon qolgan") ta'rifi bo'yicha diskretdir. Shu munosabat bilan, mezonni hisoblashda, deb ataladigan narsani kiritish odatiy holdir. uzluksizlikni tuzatish, yoki Yates tuzatish :
\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0,5)^2)(f_e).\]
Pearson Yates bilan "Xi-kvadrat testi" uzluksizlikni tuzatish ma'lumotlari: sichqonlar X-kvadrat = 5,7923, df = 1, p-qiymati = 0,0161
Ko'rib turganingizdek, R avtomatik ravishda doimiylik uchun Yates tuzatishini qo'llaydi ( Yatesning uzluksizligini tuzatish bilan Pearsonning Chi-kvadrat testi). Dastur tomonidan hisoblangan \(\chi^2\) qiymati 5,79213 edi. Antikor ta'sirining yo'qligi haqidagi nol gipotezani 1% dan sal ko'proq ehtimollik bilan noto'g'ri bo'lish xavfi ostida rad etishimiz mumkin (p-qiymati = 0,0161).
Xi-kvadrat taqsimoti statistik gipotezalarni tekshirish uchun statistikada eng ko'p qo'llaniladigan usullardan biridir. "Xi-kvadrat" taqsimoti asosida eng kuchli moslik testlaridan biri - Pirsonning "chi-kvadrat" testi qurilgan.
Muvofiqlik testi noma'lum taqsimotning taklif qilingan qonuni haqidagi gipotezani tekshirish mezoni hisoblanadi.
ch2 (“chi-kvadrat”) testi turli taqsimotlar gipotezasini tekshirish uchun ishlatiladi. Bu uning xizmati.
Mezonning hisoblash formulasi ga teng
bu yerda m va m' mos ravishda empirik va nazariy chastotalar
ko'rib chiqilayotgan taqsimot;
n - erkinlik darajalari soni.
Tekshirish uchun biz empirik (kuzatilgan) va nazariy (normal taqsimot taxmini ostida hisoblangan) chastotalarni solishtirishimiz kerak.
Agar empirik chastotalar hisoblangan yoki kutilgan chastotalar bilan to'liq mos tushsa, S (E - T) = 0 va ch2 mezoni ham nolga teng bo'ladi. Agar S (E - T) nolga teng bo'lmasa, bu hisoblangan chastotalar va seriyaning empirik chastotalari o'rtasidagi nomuvofiqlikni ko'rsatadi. Bunday hollarda nazariy jihatdan noldan cheksizgacha o'zgarishi mumkin bo'lgan ch2 mezonining ahamiyatini baholash kerak. Bu ch2ph ning haqiqatda olingan qiymatini uning kritik qiymati (ch2st) bilan solishtirish yo‘li bilan amalga oshiriladi.Nol gipoteza, ya’ni empirik va nazariy yoki kutilayotgan chastotalar o‘rtasidagi nomuvofiqlik tasodifiy degan taxmin, agar ch2ph dan katta yoki teng bo‘lsa, rad etiladi. Qabul qilingan muhimlik darajasi (a) va erkinlik darajalari soni (n) uchun ch2-gacha.
ch2 tasodifiy o'zgaruvchining ehtimoliy qiymatlarini taqsimlash uzluksiz va assimetrikdir. Bu erkinlik darajalari soniga (n) bog'liq va kuzatishlar soni ortib borishi bilan normal taqsimotga yaqinlashadi. Shuning uchun, diskret taqsimotlarni baholashda ch2 mezonini qo'llash, ayniqsa kichik namunalar uchun uning qiymatiga ta'sir qiluvchi ba'zi xatolar bilan bog'liq. Aniqroq hisob-kitoblarni olish uchun o'zgaruvchanlik qatorida taqsimlangan namunada kamida 50 ta variant bo'lishi kerak. ch2 mezonini to'g'ri qo'llash, shuningdek, ekstremal sinflardagi variantlarning chastotalari 5 dan kam bo'lmasligini talab qiladi; agar ularning soni 5 dan kam bo'lsa, u holda ular qo'shni sinflarning chastotalari bilan birlashtiriladi, shunda umumiy miqdor 5 dan katta yoki teng bo'ladi. Chastotalar birikmasiga ko'ra, sinflar soni (N) ham kamayadi. Erkinlik darajalari soni o'zgaruvchanlik erkinligiga cheklovlar sonini hisobga olgan holda sinflarning ikkinchi darajali soniga qarab belgilanadi.
ch2 mezonini aniqlashning aniqligi ko'p jihatdan nazariy chastotalarni (T) hisoblashning aniqligiga bog'liq bo'lganligi sababli, empirik va hisoblangan chastotalar orasidagi farqni olish uchun yaxlitlanmagan nazariy chastotalardan foydalanish kerak.
Misol tariqasida, gumanitar fanlarda statistik usullarni qo'llashga bag'ishlangan veb-saytda chop etilgan tadqiqotni olaylik.
Chi-kvadrat testi chastota taqsimotini, ular normal taqsimlanganmi yoki yo'qmi, taqqoslash imkonini beradi.
Chastotasi hodisaning sodir bo'lish sonini bildiradi. Odatda, hodisaning paydo bo'lish chastotasi o'zgaruvchilar nomlar shkalasida o'lchanganda va ularning chastotasidan tashqari boshqa xususiyatlarini tanlash imkonsiz yoki muammoli bo'lganda ko'rib chiqiladi. Boshqacha qilib aytganda, o'zgaruvchi sifat xususiyatlariga ega bo'lganda. Bundan tashqari, ko'plab tadqiqotchilar test ballarini darajalarga (yuqori, o'rta, past) tarjima qiladilar va bu darajadagi odamlar sonini bilish uchun ballar taqsimoti jadvallarini tuzadilar. Darajaning birida (toifalarning birida) odamlar soni haqiqatan ham ko'proq (kamroq) ekanligini isbotlash uchun Chi-kvadrat koeffitsienti ham qo'llaniladi.
Keling, eng oddiy misolni ko'rib chiqaylik.
Yosh o'smirlar o'rtasida o'z-o'zini hurmat qilish testi o'tkazildi. Test ballari uchta darajaga aylantirildi: yuqori, o'rta, past. Chastotalar quyidagicha taqsimlandi:
Yuqori (H) 27 kishi.
O'rta (C) 12 kishi
Past (H) 11 kishi.
Ko'rinib turibdiki, o'z-o'zini hurmat qiladigan bolalarning aksariyati, ammo buni statistik jihatdan isbotlash kerak. Buning uchun biz Chi-kvadrat testidan foydalanamiz.
Bizning vazifamiz olingan empirik ma'lumotlar nazariy jihatdan bir xil ehtimolli ma'lumotlardan farq qiladimi yoki yo'qligini tekshirishdir. Buning uchun nazariy chastotalarni topish kerak. Bizning holatlarimizda nazariy chastotalar teng ehtimolli chastotalar bo'lib, ular barcha chastotalarni qo'shish va toifalar soniga bo'lish yo'li bilan topiladi.
Bizning holatda:
(B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16,6
Xi-kvadrat testini hisoblash formulasi:
ch2 = ∑(E - T)I / T
Biz jadval tuzamiz:
Oxirgi ustunning yig'indisini toping:
Endi siz kriteriyaning kritik qiymatini kritik qiymatlar jadvaliga muvofiq topishingiz kerak (Ilovadagi 1-jadval). Buning uchun bizga erkinlik darajalari soni (n) kerak.
n = (R - 1) * (C - 1)
Bu erda R - jadvaldagi qatorlar soni, C - ustunlar soni.
Bizning holatda, faqat bitta ustun (asl empirik chastotalarni anglatadi) va uchta qator (toifalar) mavjud, shuning uchun formula o'zgaradi - biz ustunlarni istisno qilamiz.
n = (R - 1) = 3-1 = 2
Xatolik ehtimoli p≤0,05 va n = 2 uchun kritik qiymat ch2 = 5,99.
Olingan empirik qiymat kritik qiymatdan katta - chastotalar farqlari sezilarli (ch2= 9,64; p≤0,05).
Ko'rib turganingizdek, mezonni hisoblash juda oddiy va ko'p vaqt talab qilmaydi. Chi-kvadrat testining amaliy ahamiyati juda katta. Bu usul anketalarga berilgan javoblarni tahlil qilishda eng qimmatlidir.
Keling, murakkabroq misolni olaylik.
Masalan, psixolog o'qituvchilarning qizlarga nisbatan o'g'il bolalarga nisbatan ko'proq tarafkashlik qilishlari rostmi yoki yo'qligini bilmoqchi. Bular. qizlarni maqtash ehtimoli ko'proq. Buning uchun psixolog o'quvchilarning o'qituvchilar tomonidan yozilgan xususiyatlarini tahlil qilib, uchta so'zning paydo bo'lish chastotasi bo'yicha: "faol", "tirishqoq", "intizomli", so'zlarning sinonimlari ham hisobga olingan. So'zlarning paydo bo'lish chastotasi to'g'risidagi ma'lumotlar jadvalga kiritilgan:
Olingan ma'lumotlarni qayta ishlash uchun biz chi-kvadrat testidan foydalanamiz.
Buning uchun biz empirik chastotalarni taqsimlash jadvalini tuzamiz, ya'ni. Biz kuzatadigan chastotalar:
Nazariy jihatdan biz chastotalarning teng taqsimlanishini kutamiz, ya'ni. chastota o'g'il va qiz bolalar o'rtasida mutanosib ravishda taqsimlanadi. Keling, nazariy chastotalar jadvalini tuzamiz. Buning uchun satr yig'indisini ustun yig'indisiga ko'paytiring va olingan sonni umumiy yig'indiga (s) bo'ling.
Olingan hisob-kitoblar jadvali quyidagicha ko'rinadi:
ch2 = ∑(E - T)I / T
n = (R - 1), bu erda R - jadvaldagi qatorlar soni.
Bizning holatda, chi-kvadrat = 4,21; n = 2.
Mezonning kritik qiymatlari jadvaliga ko'ra, biz topamiz: n = 2 va xato darajasida 0,05, kritik qiymat ch2 = 5,99.
Olingan qiymat kritik qiymatdan kichik, bu esa nol gipoteza qabul qilinganligini bildiradi.
Xulosa: o'qituvchilar bolaning xususiyatlarini yozishda uning jinsiga ahamiyat bermaydilar.
Xulosa.
K.Pirson matematik statistikaning rivojlanishiga katta hissa qo'shdi (ko'p sonli fundamental tushunchalar). Pirsonning asosiy falsafiy pozitsiyasi quyidagicha ifodalangan: fan tushunchalari - bu sun'iy konstruktsiyalar, hissiy tajribani tasvirlash va tartibga solish vositalari; ularni ilmiy takliflarga bog‘lash qoidalari fan falsafasi bo‘lgan fan grammatikasi tomonidan alohida ajratilgan. Heterojen tushunchalar va hodisalarni bog'lash universal intizomga - amaliy statistikaga imkon beradi, garchi Pirsonga ko'ra bu ham sub'ektivdir.
K.Pirsonning ko'pgina konstruktsiyalari antropologik materiallar yordamida bevosita bog'liq yoki ishlab chiqilgan. U fanning barcha sohalarida qo'llaniladigan sonli tasniflash va statistik mezonlarning ko'plab usullarini ishlab chiqdi.
Adabiyot.
1. A. N. Bogolyubov, Matematika. Mexanika. Biografik qo'llanma. - Kiev: Naukova Dumka, 1983 yil.
2. Kolmogorov A. N., Yushkevich A. P. (tahr.). 19-asr matematikasi. - M.: Fan. - T.I.
3. 3. Borovkov A.A. Matematik statistika. Moskva: Nauka, 1994 yil.
4. 8. Feller V. Ehtimollar nazariyasiga kirish va uning qo‘llanilishi. - M.: Mir, T.2, 1984 y.
5. 9. Xarman G., Zamonaviy faktoriy tahlil. - M.: Statistika, 1972 yil.
Tarqatish. Pearson taqsimoti Ehtimollar zichligi ... Vikipediya
chi-kvadrat taqsimoti- tarqatish "chi kvadrat" - Mavzular axborot xavfsizligi EN chi kvadrat tarqatish ... Texnik tarjimon uchun qo'llanma
chi-kvadrat taqsimoti- 0 dan 0 gacha bo'lgan qiymatlari bo'lgan uzluksiz tasodifiy o'zgaruvchining ehtimollik taqsimoti, uning zichligi formula bilan berilgan, bu erda 0 parametr bilan =1,2,...; gamma funktsiyasidir. Misollar. 1) Mustaqil normallashtirilgan normal tasodifiy kvadratlar yig'indisi ... ... Sotsiologik statistika lug'ati
CHI-KAVRA TARQATISH (chi2)- Chi2 tasodifiy o'zgaruvchining taqsimlanishi.agar o'rtacha (va dispersiya q2) bo'lgan normal taqsimotdan 1 o'lchamdagi tasodifiy tanlamalar olingan bo'lsa, u holda chi2 = (X1 u)2/q2, bu erda X tanlanma qiymati.Agar tanlanma hajmi o'zboshimchalik bilan ortib ketsa. N gacha, keyin chi2 = … …
Ehtimollar zichligi ... Vikipediya
- (Snedecor taqsimoti) Ehtimollar zichligi ... Vikipediya
Fisher taqsimoti Ehtimollik zichligi Tarqatish funksiyasi Raqam parametrlari bilan ... Vikipediya
Ehtimollar nazariyasi va matematik statistikaning asosiy tushunchalaridan biri. Da zamonaviy yondashuv matematik sifatida O'rganilayotgan tasodifiy hodisaning modeli, mos keladigan ehtimollik maydoni (W, S, P) olinadi, bu erda W - elementar ... Matematik entsiklopediya
Gamma taqsimoti ehtimollik zichligi Tarqatish funksiyasi Parametrlar ... Vikipediya
F TARQATISH- tasodifiy o'zgaruvchining nazariy ehtimollik taqsimoti F. Agar N o'lchamdagi tasodifiy namunalar oddiy populyatsiyadan mustaqil ravishda tanlansa, ularning har biri erkinlik darajasi = N bo'lgan chi-kvadrat taqsimotini hosil qiladi. Ikkita shunday ... nisbati. .. Izohli lug'at psixologiyada
Kitoblar
- Masalalarda ehtimollar nazariyasi va matematik statistika. 360 dan ortiq vazifa va mashqlar, Borzykh D.A. Taklif etilayotgan qo'llanmada vazifalar mavjud turli darajalar qiyinchiliklar. Biroq, asosiy e'tibor o'rtacha murakkablikdagi vazifalarga qaratilgan. Bu talabalarni rag'batlantirish uchun ataylab qilingan ...