İSTATİSTİKSEL KONTROL

İstatistiksel hipotez kavramı.

Hipotez türleri. Birinci ve ikinci tür hatalar

Hipotez- bu, incelenen fenomenlerin bazı özellikleri hakkında bir varsayımdır. Altında istatistiksel hipotez Rastgele bir örneklemdeki gözlemlerin sonuçlarına dayanarak, istatistiksel olarak doğrulanabilen genel popülasyon hakkında herhangi bir ifadeyi anlayın. İki tür istatistiksel hipotez düşünülür: hipotezler dağıtım yasaları hakkında nüfus ve hipotezler parametreler hakkında bilinen dağılımlar

Böylece, aynı adı taşıyan ve yaklaşık olarak aynı teknik ve ekonomik üretim koşullarına sahip olan bir grup makine atölyesinde bir makine aksamını monte etmek için harcanan zamanın, aşağıdakilere göre dağıtıldığı hipotezi normal hukuk, dağıtım yasası hakkında bir hipotezdir. Ve aynı koşullarda aynı işi yapan iki takımdaki işçilerin üretkenliklerinin farklı olmadığı hipotezi (her takımdaki işçilerin üretkenliği normal bir dağılım yasasına sahipken) dağılım parametreleriyle ilgili bir hipotezdir.

Test edilecek hipotez denir hükümsüz, veya temel, ve belirtilen H 0 . Sıfır hipotezi karşı çıkıyor rekabet veya alternatif olan hipotez, H bir . Kural olarak, rekabet eden hipotez H 1 ana hipotezin mantıksal bir olumsuzlamasıdır H 0.

Bir örnek sıfır hipotezi Aşağıdaki gibi olabilir: normal olarak dağılmış iki popülasyonun ortalamaları eşittir, o zaman rekabet eden hipotez, araçların eşit olmadığı varsayımından oluşabilir. Sembolik olarak şöyle yazılır:

H 0: M(X) = M(Y); H 1: M(X) M(Y) .

Boş (önerilen) hipotez reddedilirse, rekabet eden bir hipotez vardır.

Basit ve karmaşık hipotezler vardır. Bir hipotez yalnızca bir varsayım içeriyorsa, o zaman - basit hipotez. karmaşık bir hipotez, sonlu veya sonsuz sayıda basit hipotezden oluşur.

Örneğin, hipotez H 0: p = p 0 (bilinmeyen olasılık p varsayımsal olasılığa eşit p 0 ) basittir ve hipotez H 0: p < p 0 - karmaşık, formun sayısız basit hipotezinden oluşur H 0: p = p i, nerede p i- herhangi bir sayıdan küçük p 0 .

Önerilen istatistiksel hipotez doğru veya yanlış olabilir, bu nedenle Doğrulayın rastgele bir örneklemdeki gözlemlerin sonuçlarına dayanarak; doğrulama yapılır istatistiksel yöntemler, bu yüzden istatistiksel olarak adlandırılır.

İstatistiksel bir hipotezi test ederken, özel olarak oluşturulmuş bir rastgele değişken kullanılır. istatistiksel kriter(veya İstatistik). Hipotezin doğruluğu (veya yanlışlığı) hakkında kabul edilen sonuç, bu hipotezin dağılımının incelenmesine dayanmaktadır. rastgele değişkenörnek verilere göre. Bu nedenle, hipotezlerin istatistiksel olarak test edilmesi, doğası gereği olasılıksaldır: bir hipotezi kabul ederken (reddederken) her zaman bir hata yapma riski vardır. Bu durumda, iki tür hata mümkündür.

Tip I hatası sıfır hipotezinin gerçekte doğru olmasına rağmen reddedileceğidir.

Tip II hata Rakip olan aslında doğru olmasına rağmen sıfır hipotezinin kabul edileceğidir.

Çoğu durumda, bu hataların sonuçları eşit değildir. Neyin daha iyi ya da daha kötü olduğu, problemin özel formülasyonuna ve sıfır hipotezinin içeriğine bağlıdır. Örnekleri düşünün. İşletmede ürünlerin kalitesinin seçici kontrol sonuçlarıyla değerlendirildiğini varsayalım. Örnek evlilik fraksiyonu önceden belirlenmiş bir değeri aşmıyorsa p 0 , daha sonra parti kabul edilir. Başka bir deyişle, boş hipotez ileri sürülür: H 0: p p 0 . Bu hipotezi test ederken bir Tip I hata yapılırsa, iyi ürünü reddedeceğiz. İkinci tür bir hata yapılırsa, ret tüketiciye gönderilir. Açıkçası, Tip II hatanın sonuçları çok daha ciddi olabilir.

Bir başka örnek de hukuk alanından verilebilir. Yargıçların çalışmalarını, sanığın masumiyet karinesini doğrulamak için yapılan eylemler olarak ele alacağız. Test edilecek ana hipotez hipotezdir. H 0 : sanık masumdur. Daha sonra alternatif hipotez H 1 hipotez şudur: sanık bir suçtan suçludur. Mahkemenin sanığı cezalandırırken birinci veya ikinci tür hatalar yapabileceği açıktır. Birinci türden bir hata yapılırsa, bu, mahkemenin masumu cezalandırdığı anlamına gelir: sanık, aslında suç işlemediği halde hüküm giymiştir. Yargıçlar ikinci tür bir hata yaptıysa, bu, aslında sanık bir suçtan suçluyken, mahkemenin suçsuz olduğuna dair bir karar verdiği anlamına gelir. Açıktır ki, birinci tür bir hatanın sonuçları sanık için çok daha ciddi olurken, toplum için ikinci tür bir hatanın sonuçları en tehlikelidir.

olasılık işlemek hata birinci tür aranan önem düzeyi kriterler ve belirtmek.

Çoğu durumda, kriterin anlamlılık düzeyi 0,01 veya 0,05 olarak alınır. Örneğin, anlamlılık düzeyi 0,01 olarak alınırsa, bu, yüzde bir durumda bir tip I hata yapma (yani, doğru boş hipotezi reddetme) riskinin olduğu anlamına gelir.

olasılık işlemek tip II hata belirtmek. olasılık
Tip II hata yapmamak, yani yanlış olduğunda boş hipotezi reddetmek denir. kriterin gücü.

İstatistiksel kriter.

Kritik alanlar

İstatistiksel bir hipotez, kesin veya yaklaşık dağılımı bilinen özel olarak seçilmiş bir rastgele değişken kullanılarak test edilir (bunu şu şekilde belirtiriz: İle). Bu rastgele değişken denir istatistiksel kriter(ya da sadece kriter).

Uygulamada kullanılan çeşitli istatistiksel kriterler vardır: sen- ve Z-kriter (bu rastgele değişkenler normal bir dağılıma sahiptir); F- kriter (Fisher-Snedekor yasasına göre rastgele bir değişken dağıtılır); t- kriter (Öğrenci yasasına göre); - kriter ("ki-kare" yasasına göre), vb.

Kriterin tüm olası değerleri kümesi, örtüşmeyen iki alt kümeye ayrılabilir: bunlardan biri, sıfır hipotezinin kabul edildiği kriterin değerlerini, diğeri ise reddedildiği kriterleri içerir.

Sıfır hipotezinin reddedildiği test değerleri kümesine denir. kritik bölge. Kritik bölgeyi şu şekilde belirteceğiz W.

Sıfır hipotezinin kabul edildiği ölçüt değerleri kümesine denir. hipotez kabul alanı(veya kriterin kabul edilebilir değer aralığı). Bu alana şu şekilde değineceğiz: .

Boş hipotezin geçerliliğini test etmek için örnek verilere göre gözlenen kriter değeri. onu belirteceğiz İle obs.

İstatistiksel hipotezleri test etmenin temel ilkesi aşağıdaki gibi formüle edilebilir: kriterin gözlenen değeri kritik bölgeye düşerse (yani,
), sonra boş hipotez reddedilir; kriterin gözlenen değeri hipotezi kabul etme alanına girerse (yani,
), o zaman boş hipotezi reddetmek için hiçbir neden yoktur.

Kritik bir bölge inşa edilirken hangi ilkelere uyulmalıdır? W ?

Varsayalım ki hipotez H 0 aslında doğrudur. Daha sonra kritere ulaşmak
İstatistiksel hipotezleri test etmenin temel ilkesi sayesinde kritik bölgeye girmek, doğru hipotezin reddedilmesini gerektirir. H 0 , bu da Tip I hatası yapmak anlamına gelir. Bu nedenle, çarpma olasılığı
bölgeye W hipotez doğruysa H 0 kriterin anlamlılık düzeyine eşit olmalıdır, yani.

.

Tip I hata yapma olasılığının yeterince küçük seçildiğine dikkat edin (kural olarak,
). Daha sonra kritere ulaşmak
kritik bölgeye W hipotez doğruysa H 0 neredeyse imkansız bir olay olarak kabul edilebilir. Örnekleme verilerine göre, olay
yine de gerçekleşti, o zaman hipotezle uyumsuz olarak kabul edilebilir. H 0 (sonuç olarak reddedilir), ancak hipotezle uyumludur H 1 (ki sonunda kabul edilir).

Şimdi varsayımın doğru olduğunu varsayalım. H 1 . Daha sonra kritere ulaşmak
hipotezin kabul alanına yanlış bir hipotezin benimsenmesine yol açar H 0 bu da Tip II hata yapmak anlamına gelir. Bu yüzden
.

olaylardan beri
ve
karşılıklı olarak zıt ise, o zaman kritere ulaşma olasılığı
kritik bölgeye W hipotez varsa kriterin gücüne eşit olacaktır H 1 doğru, yani

.

Açıkçası, kritik bölge, belirli bir önem düzeyinde, kriterin gücü olacak şekilde seçilmelidir.
maksimum oldu. Testin gücünü maksimize etmek, Tip II hata yapma olasılığını minimuma indirecektir.

Önemlilik düzeyinin değeri ne kadar küçük olursa olsun, kritik bölgeye düşen kriterin yalnızca olası olmayan bir olay olduğu, ancak kesinlikle imkansız olmadığı belirtilmelidir. Bu nedenle, gerçek bir sıfır hipotezi ile, örnek verilerden hesaplanan kriterin değerinin kritik bölgede kalması mümkündür. Bu durumda hipotezi reddetmek H 0 , olasılıklı bir Tip I hata yaparız . Ne kadar küçükse, Tip I hatası yapma olasılığı o kadar düşüktür. Bununla birlikte, bir azalma ile kritik bölge azalır, bu da gözlemlenen değerin içine düşmesinin daha az olası olduğu anlamına gelir. İle obs, hipotez olsa bile H 0 Hata. =0 hipotezinde H 0 numune sonuçları ne olursa olsun her zaman kabul edilecektir. Bu nedenle, bir azalma, yanlış bir sıfır hipotezini kabul etme, yani bir Tip II hata yapma olasılığında bir artışa neden olur. Bu anlamda, birinci ve ikinci tür hatalar rekabet halindedir.

Birinci ve ikinci türden hataları dışlamak imkansız olduğundan, en azından her bir özel durumda bu hatalardan kaynaklanan kayıpları en aza indirmek için çaba sarf etmek gerekir. Elbette her iki hatayı da aynı anda azaltmak arzu edilir, ancak rekabet halinde oldukları için birini yapma olasılığının azalması diğerini yapma olasılığının artmasına neden olur. Tek yol eşzamanlı azalmak hata riski yatıyor örnek boyutunu artırmak.

Rakip hipotezin türüne bağlı olarak H 1 Inşa ediliyorlar tek taraflı (sağ taraflı ve sol taraflı) ve iki taraflı kritik bölgeler. Kritik bölgeyi ayıran noktalar
hipotezin kabul edildiği alandan , aranan kritik noktalar ve belirtmek k Girit. İçin kritik bölgeyi bulma kritik noktaları bilmeniz gerekir.

sağ el kritik bölge eşitsizlik ile tanımlanabilir
İle>k Girit. pr, burada doğru kritik noktanın olduğu varsayılır k Girit. pr >0. Böyle bir bölge, kritik noktanın sağ tarafında bulunan noktalardan oluşur. k Girit. pr, yani, kriterin bir dizi pozitif ve yeterince büyük değerlerini içerir. İLE. Bulmak için k Girit. pr önce kriterin anlamlılık düzeyini belirler. Daha fazla sağ kritik nokta k Girit. pr koşulundan bulunur. Bu gereksinim neden tam olarak sağ elini kullanan bir kritik bölgeyi tanımlar? Bir olayın olasılığı olduğundan (İLE>k Girit. vb ) küçük ise, olası olmayan olayların pratik olarak imkansızlığı ilkesi nedeniyle, tek bir denemede sıfır hipotezi doğruysa bu olay meydana gelmemelidir. Yine de geldiyse, yani örneklerin verilerinden hesaplanan kriterin gözlenen değeri
daha fazla olduğu ortaya çıktı k Girit. pr, bu, boş hipotezin gözlemsel verilerle tutarlı olmadığı ve bu nedenle reddedilmesi gerektiği gerçeğiyle açıklanabilir. Böylece gereksinim
sıfır hipotezinin reddedildiği kriterin bu tür değerlerini belirler ve sağ kritik bölgeyi oluştururlar.

Eğer
kriterin kabul edilebilir değerleri aralığına düştü , yani
< k Girit. pr, o zaman ana hipotez reddedilmez, çünkü gözlemsel verilerle uyumludur. Kriterlere ulaşma olasılığına dikkat edin.
kabul edilebilir değerler aralığında sıfır hipotezi doğruysa, (1-)'e eşittir ve 1'e yakındır.

Unutulmamalıdır ki kriter değerlerinin isabeti
kabul edilebilir değerler aralığına girmek, boş hipotezin geçerliliğinin kesin bir kanıtı değildir. Yalnızca önerilen hipotez ile numunenin sonuçları arasında önemli bir farklılık olmadığını gösterir. Bu nedenle, bu gibi durumlarda, gözlemsel verilerin sıfır hipotezi ile tutarlı olduğunu ve reddetmek için bir neden olmadığını söylüyoruz.

Diğer kritik bölgeler de benzer şekilde inşa edilmiştir.

Yani, bensol taraf kritik bölge eşitsizlik ile tanımlanır
İle<k Girit. ben, nerede k kritik.l<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k crit.l, yani, kriterin negatif, ancak yeterince büyük modülo değerleri kümesidir. kritik nokta k crit.l koşuldan bulunur
(İle<k Girit. ben)
, yani kriterin değerinden daha küçük bir değer alma olasılığı k crit.l, sıfır hipotezi doğruysa, kabul edilen anlamlılık düzeyine eşittir.

iki taraflı kritik bölge
aşağıdaki eşitsizliklerle tanımlanır: ( İle< k kritik.l veya İle>k Girit. pr), olduğu varsayıldığında k kritik.l<0 и k Girit. pr >0. Böyle bir alan, kriterin yeterince büyük modülo değerleri kümesidir. Kritik noktalar gereksinimden bulunur: Kriterin değerinden daha düşük bir değer alacağı olasılıkların toplamı. k Girit. l veya daha fazla k Girit. pr, sıfır hipotezi doğruysa, yani kabul edilen anlamlılık düzeyine eşit olmalıdır.

(İLE< k Girit. ben )+
(İLE>k Girit. vb )= .

Kriter dağılımı ise İle orijine göre simetrik, o zaman kritik noktalar sıfıra göre simetrik olarak yerleştirilecektir, yani k Girit. ben = - k Girit. vb. Sonra iki taraflı kritik bölge simetrik hale gelir ve aşağıdaki eşitsizlikle tanımlanabilir: > k Girit. dw, nerede k Girit. dw = k Girit. pr Kritik nokta k Girit. dw koşulundan bulunabilir

P(K< -k Girit. dvd )=P(K>k Girit. dvd )= .

Açıklama 1. Her kriter için İle belirli bir önem düzeyinde kritik noktalar
durumundan bulunabilir
sadece sayısal olarak. Sayısal hesaplamaların sonuçları k ilgili tablolarda verilmiştir (örneğin, "Ekler" dosyasındaki ek 4 - 6'ya bakınız).

Açıklama 2. Yukarıda açıklanan istatistiksel bir hipotezi test etme ilkesi, henüz onun doğruluğunu veya yanlışlığını kanıtlamaz. Hipotezin Kabulü H 0 karşılaştırıldı alternatif hipotez ile H 1 hipotezin mutlak doğruluğundan emin olduğumuz anlamına gelmez. H 0 - sadece bir hipotez H 0 sahip olduğumuz gözlemsel verilerle aynı fikirdedir, yani deneyimle çelişmeyen oldukça makul bir ifadedir. Örneklem büyüklüğünün artmasıyla mümkün n hipotez H 0 reddedilecektir.

5. Uygulanan istatistiklerin ana sorunları - veri tanımı, hipotezlerin tahmini ve test edilmesi

Hipotez Testinde Kullanılan Anahtar Kavramlar

İstatistiksel hipotez - rastgele değişkenlerin (elemanların) bilinmeyen dağılımına ilişkin herhangi bir varsayım. İşte birkaç istatistiksel hipotezin formülasyonları:

1. Gözlem sonuçları sıfır matematiksel beklenti ile normal bir dağılıma sahiptir.
2. Gözlem sonuçlarının bir dağılım işlevi vardır N(0,1).
3. Gözlem sonuçları normal bir dağılıma sahiptir.
4. İki bağımsız numunedeki gözlemlerin sonuçları aynı normal dağılıma sahiptir.
5. İki bağımsız örneklemdeki gözlemlerin sonuçları aynı dağılıma sahiptir.

Boş ve alternatif hipotezler vardır. Boş hipotez, test edilecek hipotezdir. Alternatif bir hipotez, boş hipotez dışındaki her geçerli hipotezdir. Sıfır hipotezi 0 , alternatif - H1(Hipotezden - “hipotez” (İngilizce)).

Bir veya daha fazla boş veya alternatif hipotezin seçimi, yönetici, ekonomist, mühendis, araştırmacının karşılaştığı uygulamalı görevlerle belirlenir. Örnekleri düşünün.

Örnek 11. Boş hipotez, yukarıdaki listeden hipotez 2 ve alternatif hipotez hipotez 1 olsun. Bu, gerçek durumun, gözlem sonuçlarının bağımsız özdeş dağıtılmış rastgele değişkenlerin gerçekleşmeleri olarak kabul edildiği bir olasılık modeli tarafından tanımlandığı anlamına gelir. dağıtım fonksiyonu ile N(0,σ), burada σ parametresi istatistikçi tarafından bilinmiyor. Bu modelde sıfır hipotezi şu şekilde yazılır:

H 0: σ = 1,

ve bunun gibi bir alternatif:

H 1: σ ≠ 1.

Örnek 12. Boş hipotez yukarıdaki listedeki hipotez 2 olsun ve alternatif hipotez aynı listedeki hipotez 3 olsun. Daha sonra, yönetimsel, ekonomik veya üretim durumunun olasılıklı bir modelinde, gözlem sonuçlarının normal dağılımdan bir örnek oluşturduğu varsayılır. N(m, σ) bazı değerler için m ve σ. Hipotezler şöyle yazılır:

H 0: m= 0, σ = 1

(her iki parametre de sabit değerler alır);

H 1: m≠ 0 ve/veya σ ≠ 1

(yani ya m≠ 0 veya σ ≠ 1 veya her ikisi m≠ 0 ve σ ≠ 1).

Örnek 13İzin vermek H 0, yukarıdaki listeden hipotez 1'dir ve H 1 - aynı listeden hipotez 3. O zaman olasılık modeli, örnek 12'deki ile aynıdır,

H 0: m= 0, σ keyfidir;

H 1: m≠ 0, σ keyfidir.

Örnek 14İzin vermek H 0, yukarıdaki listeden hipotez 2'dir ve buna göre H 1 gözlemsel sonucun bir dağıtım işlevi vardır F(x), standart normal dağılım işleviyle eşleşmiyor F(x). O zamanlar

H 0: F(x) = F(x) hepsi için X(olarak yazılır F(x) ≡ F(x));

H 1: F(x 0) ≠ F (x 0) bazı x 0(yani bu doğru değil F(x) ≡ F(x)).

Not. Burada ≡, fonksiyonların aynı tesadüfünün işaretidir (yani, argümanın tüm olası değerleri için tesadüf X).

Örnek 15İzin vermek H 0, yukarıdaki listeden hipotez 3'tür ve buna göre H 1 gözlemsel sonucun bir dağıtım işlevi vardır F(x), normal olmamak. O zamanlar

Bazı m, σ;

H 1: herhangi biri için m, σ var x 0 = x 0(m, σ) öyle ki .

Örnek 16İzin vermek H 0 - yukarıdaki listeden hipotez 4, olasılık modeline göre, dağılım fonksiyonlarına sahip popülasyonlardan iki örnek alınır F(x) ve G(x), parametrelerle normal olan m 1 , σ 1 ve m 2 , σ 2 sırasıyla ve H 1 - olumsuzlama H 0 . O zamanlar

H 0: m 1 = m 2 , σ 1 = σ 2 , ve m 1 ve σ 1 keyfidir;

H 1: m 1 ≠ m 2 ve/veya σ 1 ≠ σ 2 .

Örnek 17.Örnek 16'nın koşulları altında ayrıca σ 1 = σ 2 olduğu bilinsin. O zamanlar

H 0: m 1 = m 2 , σ > 0 ve m 1 ve σ keyfidir;

H 1: m 1 ≠ m 2 , σ > 0.

Örnek 18.İzin vermek H 0 - yukarıdaki listeden hipotez 5, olasılık modeline göre, dağılım fonksiyonlarına sahip popülasyonlardan iki örnek alınır F(x) ve G(x) sırasıyla ve H 1 - olumsuzlama H 0 . O zamanlar

H 0: F(x) G(x) , nerede F(x)

H 1: F(x) ve G(x) keyfi dağıtım fonksiyonlarıdır ve

F(x) G(x) bazılarıyla X.

Örnek 19.Örnek 17'nin koşullarında ayrıca dağıtım fonksiyonlarının F(x) ve G(x) sadece vardiyada farklılık gösterir, yani. G(x) = F(x- a) bazı a. O zamanlar

H 0: F(x) G(x) ,

nerede F(x) keyfi bir dağıtım işlevidir;

H 1: G(x) = F(x- a), bir ≠ 0,

nerede F(x) keyfi bir dağıtım işlevidir.

Örnek 20.Örnek 14'ün koşullarında, durumun olasılık modeline göre ayrıca bilindiği gibi F(x) birim varyanslı bir normal dağılım fonksiyonudur, yani forma sahip N(m, bir). O zamanlar

H 0: m = 0 (şunlar. F(x) = F(x)

hepsi için X); (olarak yazılır F(x) ≡ F(x));

H 1: m 0

(yani bu doğru değil F(x) ≡ F(x)).

Örnek 21. Teknolojik, ekonomik, yönetsel veya diğer süreçlerin istatistiksel olarak düzenlenmesinde, normal dağılıma ve bilinen varyansa sahip bir popülasyondan alınan bir örneklem ve hipotezler düşünün.

H 0: m = m 0 ,

H 1: m= m 1 ,

parametre değeri nerede m = m 0 sürecin yerleşik seyrine ve geçiş sürecine karşılık gelir. m= m 1 bir bozulmayı gösterir.

Örnek 22.İstatistiksel kabul kontrolü ile numunedeki kusurlu ürün birimlerinin sayısı hipergeometrik bir dağılıma uyar, bilinmeyen parametre p = D/ N kusur seviyesidir, burada N- ürün partisinin hacmi, Dtoplam sayısı bir partideki kusurlu ürünler. Düzenleyici, teknik ve ticari belgelerde (standartlar, tedarik sözleşmeleri vb.) kullanılan kontrol planları genellikle bir hipotezi test etmeyi amaçlar.

H 0: p < AQL

H 1: p > LQ,

nerede AQL - kusurluluğun kabul seviyesi, LQ kusurların kusurluluk seviyesidir (tabii ki, AQL < LQ).

Örnek 23. Teknolojik, ekonomik, yönetsel veya diğer bir sürecin istikrarının göstergeleri olarak, kontrollü göstergelerin dağılımının bir takım özellikleri, özellikle de varyasyon katsayısı kullanılır. v = σ/ M(X). Sıfır hipotezini test etme ihtiyacı

H 0: v < v 0

alternatif hipotez altında

H 1: v > v 0 ,

nerede v 0 önceden belirlenmiş bir sınır değeridir.

Örnek 24.İki örneğin olasılık modeli Örnek 18'deki ile aynı olsun, birinci ve ikinci örneklerdeki gözlem sonuçlarının matematiksel beklentilerini belirtelim. M(X) ve M(saat) sırasıyla. Bazı durumlarda sıfır hipotezi test edilir.

H 0: M(X) = M(Y)

alternatif hipoteze karşı

H 1: M(X) ≠ M(Y).

Örnek 25. Yukarıda not edildi büyük önem 0'a göre simetrik dağılım fonksiyonlarının matematiksel istatistiklerinde, Simetriyi kontrol ederken

H 0: F(- x) = 1 – F(x) hepsi için x, aksi halde F keyfi;

H 1: F(- x 0 ) ≠ 1 – F(x 0 ) bazı x 0 , aksi halde F keyfi.

Olasılıksal-istatistiksel karar verme yöntemlerinde, istatistiksel hipotezleri test etmek için birçok başka problem formülasyonu da kullanılır. Bazıları aşağıda tartışılmaktadır.

Eğer boş ve alternatif hipotezler verilirse, istatistiksel bir hipotezi test etmenin özel görevi tam olarak açıklanmıştır. İstatistiksel bir hipotezi test etmek için bir yöntemin seçimi, yöntemlerin özellikleri ve özellikleri hem boş hem de alternatif hipotezler tarafından belirlenir. Aynı sıfır hipotezini farklı alternatif hipotezler altında test etmek için, genel olarak konuşursak, farklı yöntemler kullanılmalıdır. Dolayısıyla, örnek 14 ve 20'de, sıfır hipotezi aynıdır, alternatif olanlar farklıdır. Bu nedenle, örnek 14'ün koşullarında, parametrik bir aileye (Kolmogorov tipi veya omega-kare tipi) sahip uygunluk kriterlerine dayalı yöntemler ve örnek 20'nin koşullarında Student testi veya Cramer-Welch testine dayalı yöntemler kullanılmalıdır. Örnek 14'ün koşullarında Öğrenci kriteri kullanılırsa, o zaman belirlenen görevleri çözmeyecektir. Örnek 20'nin koşullarında, Kolmogorov tipi bir uyum iyiliği kriteri kullanırsak, o zaman, tam tersine, bu durum, Öğrenci'nin bu durum için özel olarak uyarlanmış kriterinden belki de daha kötü olmasına rağmen, belirlenen görevleri çözecektir.

Gerçek verileri işlerken, doğru hipotez seçimi büyük önem taşımaktadır. H 0 ve H bir . Dağılımın normalliği gibi yapılan varsayımlar, özellikle istatistiksel yöntemlerle dikkatli bir şekilde gerekçelendirilmelidir. Belirli uygulanan ayarların büyük çoğunluğunda, gözlem sonuçlarının dağılımının normalden farklı olduğuna dikkat edin.

Boş hipotezin biçimi, uygulanan problemin formülasyonundan sonra geldiğinde, ancak alternatif hipotezin biçimi net olmadığında genellikle bir durum ortaya çıkar. Bu gibi durumlarda, alternatif bir hipotez düşünülmelidir. Genel görünüm ve sorunu mümkün olan her şey için çözen yöntemler kullanın. H bir . Özellikle, hipotez 2'yi (yukarıdaki listeden) boş olarak test ederken, alternatif bir hipotez olarak kullanılmalıdır. H Alternatif hipotez altında gözlem sonuçlarının dağılımının normalliği için özel bir gerekçe yoksa, örnek 14'ten 1, örnek 20'den değil.

Öncesi

Bir araştırma yöntemi olarak istatistik, araştırmacının ilgilendiği kalıpların çeşitli rastgele faktörler tarafından çarpıtıldığı verilerle ilgilendiğinden, çoğu istatistiksel hesaplamaya, bu verilerin kaynağı hakkında bazı varsayımların veya hipotezlerin test edilmesi eşlik eder.

Pedagojik hipotez (bilimsel hipotez süreçte bir yöntemin veya diğerinin avantajı hakkında) istatistiksel analiz istatistik biliminin diline çevrilmiş ve en az iki istatistiksel hipotezde yeniden formüle edilmiştir.

İki tür hipotez vardır: birinci tür - tanımlayıcı nedenleri ve olası sonuçları açıklayan hipotezler. İkinci tip - açıklayıcı : belirli nedenlerden kaynaklanan olası sonuçların bir açıklamasını verirler ve ayrıca bu sonuçların mutlaka izleyeceği koşulları karakterize ederler, yani bu sonucun hangi faktörler ve koşullar sayesinde olacağı açıklanır. Açıklayıcı hipotezlerin varken, tanımlayıcı hipotezlerin öngörüsü yoktur. Açıklayıcı hipotezler, araştırmacıları fenomenler, faktörler ve koşullar arasında belirli düzenli ilişkilerin varlığını varsaymaya yönlendirir.

Pedagojik araştırmalardaki hipotezler, araçlardan birinin (veya bir grubunun) diğer araçlardan daha etkili olacağını öne sürebilir. Burada, araçların, yöntemlerin, yöntemlerin, eğitim biçimlerinin karşılaştırmalı etkinliği hakkında varsayımsal bir varsayım yapılır.

Daha yüksek düzeyde bir varsayımsal tahmin, çalışmanın yazarının, bazı ölçüm sistemlerinin yalnızca diğerinden daha iyi olmayacağını, aynı zamanda bir dizi olası sistem arasında belirli kriterler açısından optimal göründüğünü varsaymasıdır. Böyle bir varsayımın daha kesin ve dolayısıyla daha ayrıntılı bir kanıta ihtiyacı vardır.

Kulaichev A.P. Windows ortamında veri analizi için yöntemler ve araçlar. Ed. 3., revize edildi. ve ek - M: InKo, 1999, s. 129-131

Öğretmenler ve eğitim kurumlarının başkanları için psikolojik-pedagojik sözlük. - Rostov-n / D: Phoenix, 1998, s. 92

Bu bölümü incelemenin bir sonucu olarak, öğrenci şunları yapmalıdır:

bilmek

  • istatistiksel hipotez nedir;
  • teorik, deneysel ve istatistiksel hipotezlerin oranı;
  • sıfır ve alternatif hipotezler arasındaki farklar;
  • istatistiksel hipotezleri değerlendirme, kabul etme ve reddetme mantığı;
  • birinci ve ikinci tür hata kavramları, İstatistiksel anlamlılık(güvenilirlik);
  • parametrik ve parametrik olmayan istatistikler arasındaki farklar, bu iki tür istatistiksel testin olanakları ve sınırlamaları;

yapabilmek

  • kullanarak ortalama hakkında en basit hipotezleri test edin t - Öğrencinin eşleştirilmiş (bağlı) ve eşleştirilmemiş (bağımsız) örnekler için testi;
  • kullanarak homojenlik için iki numuneyi değerlendirin t - Öğrenci testi ve F - Fisher testi;
  • tahmin edilen parametreler için güven aralıkları oluşturun;

sahip olmak

  • istatistiksel hipotez önermek ve test etmek için metodolojik aygıt ve temel beceriler;
  • istatistiksel hipotezleri değerlendirme ve güven aralıkları oluşturma becerileri.

Genel strateji

İstatistiksel analizde "parametre" ve "istatistik" kavramlarını birbirinden ayırmanın geleneksel olduğunu zaten biliyorsunuz. Bu farklılıklar Bölüm'de ayrıntılı olarak tartışılmaktadır. bir; masada. 2.1 gerçekleşen tartışmayı özetler.

Herhangi bir dağılımın belirli teorik parametrelerle karakterize edilebileceğini hatırlayın. Matematiksel beklenti, varyans, çarpıklık, basıklık, genel popülasyonda rastgele bir değişkenin dağılımının bu tür parametrelerine örnektir. Bu önemli gerçeği bir kez daha not ediyoruz, hepsi pratikte neredeyse hiç bilinmeyen teorik nicelikler. Bir araştırmacının pratik faaliyetinde, bunlar ancak çeşitli doğruluk dereceleri hesaplanarak çeşitli doğruluk dereceleriyle tahmin edilebilirler. İstatistik, paragraf 1.4'te daha önce gördüğümüz gibi, parametrelerin teorik değerlerine ve birbirlerine her zaman eşit olmayan, kadınlık gibi bir kişilik özelliğinin dağılımının çeşitli parametrelerini değerlendirmenin pratik örneklerini göz önünde bulundurarak - erkeklik.

Tablo 2.1

Parametreler ve istatistikler arasındaki ilişki

Ve bu şaşırtıcı değil: sonuçta istatistikler rastgele değişkenlerin davranışını genel popülasyonun kendisinde değil, yalnızca deneyci tarafından oluşturulan örnekte yansıtır. Bu nedenle deneyci, hesaplanan istatistiklerin teorik dağılım parametreleriyle nasıl bir ilişki içinde olduğunu merak edebilir. Başka bir deyişle, deneyci, emrindeki örnek verilerin teoride varsayılan dağılım parametreleriyle karakterize edilen genel bir popülasyondan gerçekten çekilip çekilmediğiyle ilgilenebilir. Bu soruyu cevaplamak için deneyci, istatistiksel hipotezleri ortaya koyar ve test eder.

istatistiksel hipotezler genel popülasyonda rastgele bir değişkenin dağılım parametrelerinin olası değerleri hakkında varsayımlar denir. İstatistiksel hipotezlerin test edilmesi ve analizi, istatistiklerin toplanması ve oluşturulması sonucunda gerçekleştirilir. Bu iş için araçlar istatistiksel testler, veya kriterler bunların her biri bir takım standartlaştırılmış kurallardır. Bu kurallara dayanarak, istatistiksel hipotezin doğruluğu veya yanlışlığı hakkında bir karar verilir.

Yazı tura atma örneğini tekrar ele alalım. Normal, yanlış olmayan ve hasarsız bir madeni para atıldığında "tura" gelme olasılığının %50 olduğu varsayılabilir. Demek oluyor beklenen değer 100 kat yazı tura ile böyle bir olay 50'ye eşit olacaktır. Bu hipotezin testi, benzer bir test yapmaktan, ilgili istatistikleri hesaplayarak sonuç olarak ilgilendiğimiz parametreyi tahmin etmekten ve bu istatistikleri kullanarak öne sürülen hipotezin güvenilirliğini test eder. Örneğin, bir madeni para üzerinde 100 deneme yaparak, her bir tarafın gerçekten 50 kez geldiğini doğrulayabiliriz. Bununla birlikte, böyle bir testin sonucunun teorik olarak beklenenden hala biraz farklı olması muhtemeldir. Başka bir deyişle, 50 defadan biraz daha az veya biraz daha fazla tura gelse bile, madalyonun sahte olduğuna inanmak için bir nedenimiz yok. Teorik olarak beklenen değerlerden böyle bir sapma daha büyük değerlere ulaştığında, örneğin “kartal” madalyonun 100 denemesinde bir kez bile düşmediğinde durum şüpheli olacaktır. Madeni para ile her şeyin yolunda olduğu göz önüne alındığında, böyle bir düzenleme olası görünmüyor.

Dolayısıyla, madeni paranın 100 kat atılması sırasında, "kartal" tam olarak 50 kez düşerse, madeni para ile her şeyin yolunda olduğu açıktır. "Kartal" asla düşmediyse, madeni parada bir şeylerin yanlış olduğuna inanmak için sebep var. Ama olumlu ve olumsuz sonuçları ayıran çizgi nerede? Bu soru seçilen karar kriteri ile ilgilidir. İstatistiksel hipotezleri test etmek için matematiksel istatistiklerde geliştirilen bu kriterler, istatistiksel testler, bu nedenle genellikle istatistiksel kriterler olarak adlandırılır.

Böylece, istatistiksel hipotezlerin test edilmesi, olasılığın tahmin edilmesinin bir sonucu olarak gerçekleştirilir. rastgele olay, ki bu istatistiklerin değeri olarak kabul edilir. Bu olasılık, önerilen hipotezin doğru olması koşuluyla çok küçük çıkarsa, test edilen istatistiksel hipotez reddedilir, aksi takdirde hipotez kabul edilir.

Ancak bu prosedürün zorluğu, analiz edilen rastgele değişkenin dağılım parametresinin spesifik değerini önceden bilemememiz gerçeğinde yatmaktadır. Örneğin, bir madeni para söz konusu olduğunda, madeni paranın sahte olduğu varsayılabilir ve bu nedenle, tura düşme olasılığı %50'den aşağı yukarı farklıdır. Bu durumda, bir dizi test yaptıktan sonra, analiz edilen olayın matematiksel beklentisinin değerini karakterize eden elde edilen istatistikler ile gerçek değeri arasındaki farkın derecesini değerlendiremeyeceğiz. Ve sonra istatistiksel hipotezi test etmek imkansız görünebilir. Ancak bu durumdan çıkış yolu, öne sürülen hipotezin tersi bir hipotezin olasılığını tahmin etmek olabilir. Başka bir deyişle, bu durumda, örneğin teorik olasılığın %50'sinin eşitliği hakkında bir hipotez ileri sürmek mümkündür. Bu hipotezin yanlış olduğu ortaya çıkarsa, alternatif hipotez kabul edilir.

Gerçekten de, istatistiksel hipotezleri test ederken, araştırmacı her zaman bir değil iki hipotezle ilgilenir. H 0 ve H 1. Bu hipotezlerden birine boş, diğerine alternatif denir, yani. sıfırı reddediyor.

Boş hipotez H 0 her zaman spesifiktir. Her zaman dağıtım parametresinin belirli bir değerini belirtir. Örneğin, beklenti hipotezi şu şekilde formüle edilebilir: μ = ANCAK, nerede ANCAK μ'nin belirli bir değeridir ve varyansın iki büyüklüğünün eşitliğine ilişkin hipotez σ1 = σ2'dir.

Alternatif hipotez H 1 her zaman daha az spesifik olarak formüle edilir, örneğin: μ > ANCAK ; * σ2, vb. Ancak, bir kural olarak, deneycinin belirli bir boş hipotezle ilgilenmediği ortaya çıktı. H 0, ancak daha az spesifik bir alternatif hipotez H 1, çünkü deneyde test ettiği bilimsel hipotezle daha tutarlı olan budur.

Teorik bir parametrenin ampirik bir değerlendirmesini yapan deneyci, gerçeğin varsayımını temel alarak elde edilen sonucun istatistiksel önemini belirler. H 0. İstatistiksel önem, deneyin koşullarını tamamen yeniden üreten sonsuz sayıda deneyde, oluşturulan istatistiklerin aynı veya daha büyük değerini alma olasılığıdır. Sıfır hipotezinin doğru olduğu göz önüne alındığında, aynı koşullarla sonsuz sayıda deneyde böyle ve hatta daha büyük istatistiklerin elde edilme olasılığı küçük çıkarsa, deneyci alternatif hipotez lehine sıfır hipotezinden vazgeçer.

Görsel olarak açıklanan mantık Şekil 2'de gösterilmektedir. 2.1. Açıkçası, burada iki alternatif hipotez ileri sürülmektedir. Bunlardan biri spesifiktir ve matematiksel beklentinin sıfıra eşit olduğunu varsayar. Bu hipotez etiketli H 0. Buna karşılık gelen eğri, bu hipotez tarafından tahmin edilen rastgele değişken Z'nin dağılımını tanımlar. olarak belirtilen ikinci hipotez, H 1 daha az spesifiktir. Yalnızca matematiksel beklentinin değerinin sıfırı aşması gerektiğini belirtir. Prensipte, bu hipoteze karşılık gelen dağılımları tanımlayan sonsuz sayıda eğri vardır. Gösterilen eğri, olası olanlardan biridir. Değer Ζ exp, deneydeki teorik parametre μ'yi tahmin eden istatistiklerin değerini karakterize eder. Deneycinin elinde olan, ampirik verileri toplayarak elde edebildikleri budur. Örneğin, örnek için aritmetik ortalamanın değeri olabilir. Daha sonra ileri sürülen istatistiksel hipotezlerin doğrulanması, başka bir benzer deneyde aynı Zexp değerini veya sıfır hipotez doğruysa daha fazlasını elde etmenin ne kadar muhtemel olduğunu tahmin etmeye çalışmaktan oluşmalıdır. Açıkçası, bu olasılık, bu hipotez tarafından varsayılan dağılım eğrisinin altındaki alana eşittir. Soldaki bu alan hesaplanan istatistiklerle sınırlıdır, sağdaki ise sınırlı değildir. Böyle bir alan, hatırladığımız gibi (bkz. paragraf 1.2), dağılım niceliği olarak adlandırılır. Şu şekilde tanımlanabilir:

Pirinç. 2.1.

Bir hipotezi kabul etmek veya reddetmek için gereken nicelik miktarı R bu denklemde sözde önem düzeyi hesaplanan istatistikler Zexp. Bu değer ne kadar büyük olursa, deneyde elde edilen verilerin dağılımla tanımlanması o kadar olasıdır. f Ho( Z ), yani hipotez tarafından tahmin edilen dağılım H 0. Aksine, değer ne kadar küçükse R, ampirik verilerin aslında dağılıma uyması daha az olasıdır f H0(Z) ve daha yüksek bir μ değeri alan bir dağılımla tanımlanmaları daha olasıdır. Böylece değerin değerlendirilmesi R, öne sürülen iki hipotezden biri lehine bir karar verilebilir.

Hipotez H Ampirik değerin istatistiksel anlamlılığını belirleyen niceliğin değeri ise 0 kabul edilebilir. x, yeterince büyük görünüyor. Alternatif hipotez H Deneyde elde edilen sonucun istatistiksel olarak anlamlılığını belirleyen kuantilin değerinin ihmal edilebilecek kadar küçük olduğu ortaya çıkarsa 1 kabul edilir. Ancak sorun, istatistiksel anlamlılığı belirleyen niceliğin hangi değerinin yeterince büyük, hangisinin ihmal edilebilecek kadar küçük kabul edilmesi gerektiğidir. Bu sorunu çözmek için, deneycinin istatistiksel hipotezleri değerlendirirken hangi seçeneklere sahip olduğuna daha yakından bakalım (Tablo 2.2).

Öne sürülen istatistiksel hipotezlerin doğru veya yanlış olabileceği açıktır. hipotezler beri H 0 ve H 1 alternatiftir, yani Birbirlerini dışlarlar, söz konusu hipotezlerin doğruluğunu veya yanlışlığını karakterize eden yalnızca iki varsayımsal durum vardır: ya H 0 doğru olacak ve H 1 sırasıyla yanlış veya tam tersi. Hipotezleri değerlendiren deneyci, hipotezlerden hangisinin doğru olduğunu asla bilemediği için, hipotezi kabul etmek veya reddetmek için yüz karar H 0'ın doğruluğu veya yanlışlığı ile hiçbir ilgisi yoktur - sonuçta, kurmaya çalıştığı tam olarak bunlardır. Bu nedenle, istatistiksel hipotezleri test etme sürecinde, araştırmacının gerçekte hangi hipotezi kanıtlamak istediğine bakılmaksızın, deneyci için yalnızca ikisinin olumlu olduğu düşünülebilecek dört olası sonuç vardır.

Tablo 2.2

İstatistiksel Hipotezlerin Değerlendirilmesinde Sonuç Matrisi

hipotez ise H 0 doğrudur ve istatistiksel analiz sonucunda kabul edilir, deneyci hata yapmaz. Alternatif bir hipotezi kabul etmek istese bile bu, araştırmacı için olumlu bir sonuçtur. Ayrıca deneyci hipotezi reddettiğinde hata yapmaz. H 0, aslında yanlıştır. Bununla birlikte, sıfır hipotezi gerçekten doğru olabilir, ancak deneyci yine de onu reddeder. Bu durumda, yaygın olarak adlandırılan bir hata yapar. bir hata yazın veya α( alfa )- bir hata. Tip II hata veya β( beta )- bir hata Bir sonuca, deneycinin aslında yanlış olduğu ortaya çıkan boş hipotezi kabul ettiği bir sonuç denir.

Açıktır ki, deneycinin sıfır hipotezini alternatif bir hipotez lehine terk etmeye hazır olduğu deneyde elde edilen sonucun istatistiksel önemini belirleyen olasılık ne kadar büyükse, tip I hata olasılığı da o kadar büyük olur ve tip II hata olasılığını düşürür (Şekil 2.2). Aksine, deneycinin sıfır hipotezini reddettiği olasılığın değerini azaltarak, daha büyük olasılıkla Tip II hata yapma riskini alır, ancak böylece kendisini Tip I hatadan daha büyük ölçüde korur. Dolayısıyla soru, hipotezin hangi düzeyde anlamlı olduğudur. H 0 reddedilebilir veya kabul edilebilir, aslında iki olası hatadan hangisinin deneyci için daha az önemli olduğu ile ilgilidir. Deneyci, istatistiksel bir hipotezi test etmek için daha muhafazakar bir strateji uygulayarak, Tip II hata tehlikesini ihmal eder. Eylemin daha radikal bir versiyonunu uygulayan deneyci, olduğu gibi, birinci tür hatayı unutur.

Pirinç. 2.2.

İstatistiksel bir hipotezin kabulü, herhangi bir önemli sosyal sonucu ima ediyorsa, değerlendirmesi için daha muhafazakar bir strateji uygulanabilir. Eğer istatistiksel hipotezin kabul edilmemesi ciddi sonuçlara yol açabiliyorsa, daha az ihtiyatlı bir şekilde ilerlenebilir.

Örneğin, belirli bir çocuğun zihinsel geriliğini belirleme konusunu ele alalım. Psikolojik bir muayene sırasında, IQ'sunun bu denek popülasyonu için ortalamanın altında olduğu bulundu. Böylece, bu çocuğun yetersiz entelektüel gelişimi ve bununla bağlantılı olarak onu zihinsel engelliler için özel bir yatılı okula gönderme ihtiyacı hakkında bir varsayım ortaya çıktı. Bu hipotezi test etmek için, biri anket sırasında elde edilen verilerin normal nüfus dağılımını, zihinsel geriliği belirleyen sınıra eşit bir matematiksel beklenti ile, örneğin 75 puan (hipotez) karakterize ettiğini varsayan iki alternatif istatistiksel hipotez formüle edildi. H 0) ve ikincisi matematiksel beklentinin daha düşük bir değerini varsayar, yani. matematiksel beklenti belirli bir sınırdan daha azdır (hipotez H bir). Bir çocuğun entelektüel gelişiminin ampirik bir göstergesinin istatistiksel önemini değerlendirirken, başka bir rastgele testte aynı sonucu, hatta daha düşük olanı elde etme olasılığının birden fazla olmadığı ortaya çıktığını varsayalım. 20'de şans. Soru ortaya çıkıyor: sıfır hipotezinin yetersiz ampirik geçerliliği hakkında bu sonuca dayanarak karar vermek ve bu nedenle alternatif bir hipotez lehine terk etmek mümkün müdür? H bir? Bu sorunun cevabının büyük ölçüde ne tür hatalı eylemlerin daha kabul edilebilir olduğuna bağlı olacağı açıktır. Düşük de olsa normal bir çocuğun kalmasına ikna olursak Akıl fakülteleri Zihinsel engelliler için yatılı bir okulda okumak, normal bir okulda zihinsel engelli bir kişiyi eğitmekten daha iyidir, önem düzeyine sınırlar koymak konusunda bir karar verebiliriz, farklı düşünürsek başka bir karar vermemiz gerekir.

Neyse ki, araştırmacı genellikle bu tür bir problemi çözme zahmetinden kurtulur. Gerçek şu ki, istatistiksel hipotezleri seçerken referans olarak alınabilecek optimal anlamlılık seviyesini doğrulamak istatistiksel olarak imkansızdır. Ancak, varsayılan olarak kabul edilen bazı istatistiki konvansiyonlar vardır (Tablo 2.3). Ampirik sonuç dikkate alınır istatistiksel olarak anlamlı başka bir rastgele testte aynı veya daha büyük (daha küçük) sonuç alma olasılığı 20'de bir şanstan azsa, boş hipotezi reddetmek, yani. değer ne zaman R 0.05'ten küçük olduğu ortaya çıkıyor. eğer değer R 0,01'den küçükse sonuç dikkate alınır son derece önemli sıfır hipotezini reddetmek için. değeri olması durumunda R 0.10'ı aşarsa, deneyin sıfır hipotezi tarafından varsayılan teorik parametreden istatistiksel olarak anlamlı farklılıklar oluşturmadığı kabul edilir. alınan değer ise R 0,10 ile 0,05 arasında ise sonuç belirsiz olarak kabul edilir. Önem düzeylerinin sınırında olduğu söylenir. Başka bir şekilde, bu sonuca denir marjinal olarak anlamlı.

Tablo 2.3

İstatistiksel karar vermeyi belirleyen standart nicel değerler

Hipotezleri test etmek ve kabul etmek için açıklanan strateji evrenseldir ve en yaygın olanıdır. Daha muhafazakar bir strateji, sırasıyla 0,01 ve 0,001 olasılık değerlerini güvenilir ve oldukça güvenilir seviyeler olarak almak ve güvenilmez seviye için olasılık değerini 0,05 olarak ayarlamak olabilir (O. Yu. Ermolaev, ). O zaman marjinal olarak anlamlı sonuç 0,01 ile 0,05 aralığında olan sonuç olacaktır. Ancak böyle bir strateji psikolojik araştırma olsa da nadiren kullanılır.

Her durumda, istatistiksel hipotezlerin analizinin sonuçlarının, tüm deneysel durumla bağlantı kurmadan kendi başlarına alındığında deneysel hipotezleri değerlendirmek için yeterli kabul edilemeyeceği akılda tutulmalıdır.

İstatistiksel hipotezler, deneysel ve teorik hipotezlerle karıştırılmamalıdır. Teorik hipotezler, incelenen fenomenlerin bağlantılarının ve düzenliliklerinin doğasını yansıtır. Deneysel hipotezler, belirli bir alanda bu tür teorik bilgilerin incelenmesi temelinde ortaya konulur ve böylece teorik hipotezleri kendileri somutlaştırır. İstatistiksel hipotezler gibi, iddia edilen nedensel ilişkinin varlığını inkar ederek rekabet eden hipotezlerin eşzamanlı formülasyonunu içerirler. Bu nedenle, incelenen ampirik düzenlilik, rekabet eden hipotezler olarak adlandırılan farklı nedensel yorumlara izin verebilir.

Deneysel olanlardan farklı olarak, istatistiksel hipotezler yalnızca deney sırasında toplanan verileri değerlendirmek için bir araçtır ve başlangıçta herhangi bir ampirik düzenlilik ima etmez. Doğrulamalarının sonucu, doğası gereği yalnızca istatistikseldir ve bu nedenle hem deneysel hem de dahası teorik hipotezlerin otomatik olarak kabulü veya reddi anlamına gelmez.

İSTATİSTİK HİPOTEZLER

Deneylerde elde edilen örnek veriler her zaman sınırlıdır ve büyük ölçüde rastgeledir. Bu nedenle, bu tür verileri analiz etmek için matematiksel istatistikler kullanılır, bu da örneklemde elde edilen kalıpları genelleştirmeyi ve bunları tüm genel popülasyona genişletmeyi mümkün kılar.

Herhangi bir örnek üzerinde yapılan deney sonucunda elde edilen veriler, genel popülasyonu değerlendirmek için temel teşkil eder. Bununla birlikte, rastgele olasılık nedenlerinin etkisi nedeniyle, deneysel (örnek) verilere dayanarak yapılan genel popülasyon parametrelerinin bir tahmini her zaman bir hataya eşlik edecektir ve bu nedenle bu tür tahminler varsayımsal olarak kabul edilmelidir ve değil. son açıklamalar olarak. Genel popülasyonun özellikleri ve parametreleri hakkında benzer varsayımlara denir. istatistiksel hipotezler . G.V. Sukhodolsky: "İstatistiksel bir hipotez, genellikle, bazı parametrik veya işlevsel özelliklerin benzerliğinin (veya farkının) rastgele olduğu veya tersine rastgele olmadığı şeklindeki resmi bir varsayım olarak anlaşılır."

İstatistiksel bir hipotezi test etmenin özü, deneysel verilerin ve öne sürülen hipotezin tutarlı olup olmadığını, hipotez ile deneysel verilerin istatistiksel analizinin sonucu arasındaki uyuşmazlığın rastgele nedenlere atfedilmesine izin verilip verilmediğini belirlemektir. Bu nedenle, istatistiksel bir hipotez, istatistiksel testlere izin veren bilimsel bir hipotezdir ve matematiksel istatistik, görevi istatistiksel hipotezlerin test edilmesini bilimsel olarak doğrulamak olan bilimsel bir disiplindir.

İstatistiksel hipotezler boş ve alternatif, yönlü ve yönsüz olarak ikiye ayrılır.

Sıfır hipotezi(H0) farksızlık hipotezidir. Farklılıkların önemini kanıtlamak istiyorsak, boş hipotez gereklidir. yalanlamak, aksi takdirde gereklidir onaylamak.

Alternatif hipotez (H1) farklılıkların önemi hakkında bir hipotezdir. Kanıtlamak istediğimiz şey bu, bu yüzden bazen ona denir. deneysel hipotez.

Tam olarak kanıtlamak istediğimizde görevler var önemsiz farklılıklar, yani boş hipotezi doğrulamak için. Örneğin, farklı deneklerin farklı, ancak zorluk açısından dengeli görevler aldığından veya deney ve kontrol örneklerinin bazı önemli özelliklerde birbirinden farklı olmadığından emin olmamız gerekiyorsa. Ancak, çoğu zaman, yine de kanıtlamamız gerekir. farklılıkların önemiçünkü onlar bizim için yeniyi aramamızda daha bilgilendiricidir.

Boş ve alternatif hipotezler yönlü veya yönsüz olabilir.

Yönlendirilmiş hipotezler - bir grupta karakteristik değerlerin daha yüksek ve diğerinde daha düşük olduğu varsayılırsa:

H0: 1 daha az 2,

H 1: 1 aşıyor 2.

Yönlendirilmemiş hipotezler - bir özelliğin gruplardaki dağılım biçimlerinin farklı olduğu varsayılırsa:

H0: 1 farklı değil 2,

H 1: 1 farklı 2.

Gruplardan birinde, örneğin sosyal aktivitede bazı nitelikler için konuların bireysel değerlerinin daha yüksek ve diğerinde daha düşük olduğunu fark edersek, bu farklılıkların önemini test etmek için, yönlendirilmiş hipotezler formüle etmemiz gerekiyor.

Grupta bunu kanıtlamak istiyorsak ANCAK bazı deneysel etkilerin etkisi altında, gruptan daha belirgin değişiklikler meydana geldi B, o zaman yönlendirilmiş hipotezleri de formüle etmemiz gerekir.

Bir özelliğin gruplardaki dağılım biçimlerinin farklı olduğunu kanıtlamak istiyorsak ANCAK ve B, daha sonra yönlendirilmemiş hipotezler formüle edilir.

Hipotez testi kriterler kullanılarak gerçekleştirilir istatistiksel değerlendirme farklılıklar.

Ortaya çıkan sonuca istatistiksel karar denir. Böyle bir çözümün her zaman olasılıklı olduğunu vurguluyoruz. Bir hipotezi test ederken, deneysel veriler hipotezle çelişebilir. 0 , sonra bu hipotez reddedilir. Aksi takdirde, yani deneysel veriler hipotezle tutarlıysa H 0 O sapmaz. Bu gibi durumlarda genellikle hipotezin H 0 kabul edilmiş. Bu, deneysel örnek verilere dayanan hipotezlerin istatistiksel olarak test edilmesinin, kaçınılmaz olarak yanlış bir karar verme riski (olasılığı) ile ilişkili olduğunu göstermektedir. Bu durumda, iki tür hata mümkündür. Hipotezi reddetmek için bir karar verildiğinde Tip I hata oluşacaktır. 0 , gerçekte doğru olduğu ortaya çıksa da. Hipotezi reddetmemeye karar verildiğinde Tip II hata ortaya çıkacaktır. H 0, gerçekte yanlış olmasına rağmen. Açıkçası, iki durumda da doğru sonuçlar çıkarılabilir. Tablo 7.1 yukarıdakileri özetlemektedir.

Tablo 7.1

Bir psikoloğun kendisinde yanılmış olması mümkündür. istatistiksel çözüm; Tablo 7.1'den gördüğümüz gibi, bu hatalar sadece iki çeşit olabilir. İstatistiksel hipotezlerin benimsenmesinde hataları dışlamak imkansız olduğundan, olası sonuçları en aza indirmek, yani. Yanlış bir istatistiksel hipotezi kabul etmek. Çoğu durumda tek yol Hata minimizasyonu örneklem boyutunu artırmaktır.

İSTATİSTİK KRİTERLER

istatistiksel test- bu karar kuralı güvenilir davranış sağlayan, yani doğruyu kabul etmek ve yanlış hipotezi yüksek olasılıkla reddetmek.

İstatistiksel kriterler ayrıca belirli bir sayıyı hesaplama yöntemini ve bu sayının kendisini gösterir.

Farklılıkların öneminin kriter tarafından belirlendiğini söylediğimizde j *(kriter Fisher açısal dönüşümüdür), o zaman yöntemi kullandığımızı kastediyoruz. j * Belirli bir sayıyı hesaplamak için

Kriterin ampirik ve kritik değerlerinin oranıyla, boş hipotezin doğrulanıp doğrulanmadığına veya reddedildiğine karar verebiliriz.

Çoğu durumda, farklılıkları anlamlı olarak kabul edebilmemiz için, içinde bulunduğumuz kriterler (örneğin, Mann-Whitney testi veya işaret testi) olmasına rağmen, kriterin ampirik değerinin kritik olanı aşması gerekir. tersi kurala uymak zorundadır.

Bazı durumlarda, kriterin hesaplama formülü, çalışma örneklemindeki gözlemlerin sayısını içerir ve şu şekilde gösterilir: n. Bu durumda, kriterin ampirik değeri aynı zamanda istatistiksel hipotezleri test etmek için bir testtir. Özel bir tablo kullanarak, belirli bir ampirik değere karşılık gelen farklılıkların istatistiksel anlamlılık düzeyini belirleriz. Böyle bir kriterin bir örneği, kriterdir. j *, Fisher açısal dönüşümü temelinde hesaplanır.

Bununla birlikte, çoğu durumda, kriterin aynı ampirik değeri, çalışma örneklemindeki gözlem sayısına bağlı olarak anlamlı veya önemsiz olabilir ( n) veya olarak ifade edilen sözde serbestlik derecesi sayısı üzerinde v veya nasıl df.

Serbestlik derecesi sayısı v sınıf sayısına eşit varyasyon serisi eksi oluşturulduğu koşulların sayısı. Bu koşullar, örnek boyutunu ( n), ortalama ve varyans.

50 kişilik bir grubun ilkeye göre üç sınıfa ayrıldığını varsayalım:

Bilgisayarda çalışabilme;

Yalnızca belirli işlemleri gerçekleştirebilme;

Bir bilgisayarda çalışamaz.

Birinci ve ikinci grupta 20, üçüncü grupta 10 kişi vardı.

Bir koşulla sınırlıyız - örneklem büyüklüğü. Dolayısıyla bilgisayar kullanmayı bilmeyen kaç kişinin verisini kaybetsek bile birinci ve ikinci sınıflarda 20 denek olduğunu bilerek bunu tespit edebiliyoruz. Üçüncü kategorideki özne sayısını belirlemekte özgür değiliz, "özgürlük" sadece sınıflandırmanın ilk iki hücresine kadar uzanır: