7.3.1. Korelasyon ve belirleme katsayıları. sayısallaştırılabilir iletişim yakınlığı faktörler arasında ve oryantasyon(doğrudan veya ters) aşağıdakileri hesaplayarak:

1) İki faktör arasında doğrusal bir ilişki belirlemek gerekirse, - çift ​​katsayısı korelasyonlar: 7.3.2 ve 7.3.3'te, eşleştirilmiş doğrusal Bravais-Pearson korelasyon katsayısını hesaplama işlemleri ( r) ve Spearman'ın ikili sıra korelasyon katsayısı ( r);

2) İki faktör arasındaki ilişkiyi belirlemek istiyorsak, ancak bu ilişki açıkça doğrusal değilse, o zaman korelasyon ilişkisi ;

3) bir faktör ile diğer bir dizi faktör arasındaki ilişkiyi belirlemek istiyorsak - o zaman (veya eşdeğer olarak, "çoklu korelasyon katsayısı");

4) Bir faktörün, ilkini etkileyen bir grup faktörün parçası olan ve bunun için diğer tüm faktörlerin etkisinin değişmediğini düşünmemiz gereken belirli bir diğeriyle ilişkisini tek başına belirlemek istiyorsak, o zaman özel (kısmi) korelasyon katsayısı .

Herhangi bir korelasyon katsayısı (r, r) mutlak değerde 1'i aşamaz, yani –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Korelasyon katsayısındaki işaret, bağlantının yönünü belirler: “+” işareti (veya bir işaretin olmaması), bağlantının olduğu anlamına gelir. dümdüz (pozitif), “–” işareti - bağlantının tersi (olumsuz). İşaretin bağlantının sıkılığı ile ilgisi yoktur.

Korelasyon katsayısı istatistiksel ilişkiyi karakterize eder. Ancak çoğu zaman başka bir bağımlılık türünü belirlemek gerekir, yani: belirli bir faktörün başka bir ilgili faktörün oluşumuna katkısı nedir. Bu tür bir bağımlılık, belirli bir derecede geleneksellik ile karakterize edilir: belirleme katsayısı (D ) formül ile belirlenir D = r 2 ´100% (burada r, Bravais-Pearson korelasyon katsayısıdır, bkz. 7.3.2). ölçümler yapılmış olsaydı sipariş ölçeği (sıra ölçeği), daha sonra bir miktar güvenilirlik kaybı ile, r değeri yerine r değeri (Spearman's korelasyon katsayısı, bkz. 7.3.3) formüle ikame edilebilir.

Örneğin, B faktörünün A faktörüne bağımlılığının bir özelliği olarak korelasyon katsayısı r = 0.8 veya r = –0.8 elde edersek, o zaman D = 0.8 2 ´100% = %64, yani yaklaşık 2 ½ 3. Dolayısıyla A faktörünün ve B faktörünün oluşumuna yaptığı değişikliklerin katkısı yaklaşık 2'dir. ½ 3, genel olarak tüm faktörlerin toplam katkısından.

7.3.2. Bravais-Pearson korelasyon katsayısı. Bravais-Pearson korelasyon katsayısını hesaplama prosedürü ( r ) sadece bağlantının normal frekans dağılımına sahip numuneler bazında düşünüldüğü durumlarda kullanılabilir ( normal dağılım ) ve aralık veya oran ölçeklerinde ölçümlerle elde edilir. Bu korelasyon katsayısı için hesaplama formülü:



å ( x i - )( y i-)

r = .

n×sx×sy

Korelasyon katsayısı neyi gösterir? İlk olarak, korelasyon katsayısındaki işaret, ilişkinin yönünü gösterir, yani: “-” işareti ilişkinin olduğunu gösterir. tersi, veya olumsuz(bir eğilim var: bir faktörün değerleri azaldıkça, diğer faktörün karşılık gelen değerleri artar ve arttıkça azalır) ve bir işaretin veya “+” işaretinin olmaması gösterir dümdüz, veya pozitif bağlantılar (bir eğilim vardır: bir faktörün değerlerinde bir artış ile diğerinin değerleri artar ve bir azalma ile azalır). İkincisi, korelasyon katsayısının mutlak (işaretten bağımsız) değeri, bağlantının sıkılığını (kuvvetini) gösterir. Almak gelenekseldir (oldukça geleneksel olarak): r değerleri için< 0,3 корреляция çok zayıf, genellikle 0,3 £ r için basitçe dikkate alınmaz< 5 корреляция güçsüz, 0,5 £ r için< 0,7) - ortalama, 0,7 £ r £ 0,9'da) - kuvvetli ve son olarak, r > 0.9 için - çok güçlü. Bizim durumumuzda (r » 0.83), ilişki ters (negatif) ve güçlüdür.

Korelasyon katsayısının değerlerinin -1 ile +1 arasında olabileceğini hatırlayın. r'nin değeri bu sınırların dışına çıkarsa, hesaplamalarda bir hata yapıldı . Eğer bir r= 1, bu, bağlantının istatistiksel değil, işlevsel olduğu anlamına gelir - bu, sporda, biyolojide, tıpta pratikte gerçekleşmez. Az sayıda ölçümle, işlevsel bir ilişkinin resmini veren rastgele bir değer seçimi mümkündür, ancak böyle bir durum daha az olasıdır, karşılaştırılan örneklerin hacmi (n) ne kadar büyükse, yani karşılaştırılan ölçüm çiftlerinin sayısı.

Hesaplama tablosu (Tablo 7.1) formüle göre oluşturulmuştur.

Tablo 7.1.

Bravais-Pearson hesaplaması için hesaplama tablosu

x ben ben (x i-) (x ben – ) 2 (y i-) (y ben – ) 2 (x i - )( y i-)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx ben \u003d 137 \u003d 13.00 ay ben =56,1 =5.1 å( x ben - ) 2 \u003d \u003d 1.78 å( y ben – ) 2 = = 1.015 å( x i - )( y ben – )= = –1.24

Çünkü s x = ï ï = ï ï» 0.42, bir

s y= ï ï» 0,32, r" –1,24ï (11'0.42'0.32) » –1,24ï 1,48 » –0,83 .

Başka bir deyişle, korelasyon katsayısının çok kesin olduğunu bilmeniz gerekir. yapamamak mutlak değerde 1.0'ı aşıyor. Bu genellikle büyük hatalardan kaçınmayı veya daha doğrusu hesaplamalarda yapılan hataları bulup düzeltmeyi mümkün kılar.

7.3.3. Spearman korelasyon katsayısı. Daha önce de belirtildiği gibi, Bravais-Pearson korelasyon katsayısını (r) sadece analiz edilen faktörlerin frekans dağılımı açısından normale yakın olduğu ve varyantın değerlerinin zorunlu olarak ölçümlerle elde edildiği durumlarda uygulamak mümkündür. oranlar ölçeği veya ifade edildiklerinde meydana gelen aralıklar ölçeğinde fiziksel birimler. Diğer durumlarda, Spearman korelasyon katsayısı bulunur ( r). Ancak bu oran Yapabilmek izin verildiği (ve arzu edildiği) durumlarda da geçerlidir. ! ) Bravais-Pearson korelasyon katsayısını uygulayın. Ancak, Bravais-Pearson katsayısını belirleme prosedürünün sahip olduğu akılda tutulmalıdır. daha fazla güç ("çözme kabiliyet"), bu yüzden r daha bilgilendirici r. Hatta büyük bir n sapma r±%10 düzeyinde olabilir.

Tablo 7.2 Katsayı için hesaplama formülü

x ben y ben R x R y |d R | d R 2 Spearman korelasyon katsayısı

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . vos

13.5 4.70 11.0 2.0 9.0 81.00 Örneğimizi kullanıyoruz

12.7 5.10 4.5 6.5 2.0 4.00 hesaplama için r, ama hadi inşa edelim

12.5 5.40 3.0 9.0 6.0 36.00 diğer tablo (Tablo 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Değerleri değiştirin:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13.4 4.65 10.0 1.0 9.0 81.00 Görüyoruz: r biraz olduğu ortaya çıktı

12,4 5,60 2,0 11,0 9,0 81.00'den fazla r, ama bu farklı

12.3 5.50 1.0 10.0 9.0 81.00 çok büyük değil. Sonuçta,

12,7 5,20 4,5 8,0 3,5 12,25 çok küçük n değerler r ve r

åd R 2 = 423 çok yaklaşık değerlerdir, çok güvenilir değildir, gerçek değerleri büyük ölçüde dalgalanabilir, dolayısıyla fark r ve r 0.1'de önemsizdir. Genellikleranalog olarak kabulr , ancak daha az doğru. İşaretler r ve r bağlantı yönünü gösterir.

7.3.4. Korelasyon katsayılarının uygulanması ve doğrulanması.İhtiyacımız olan faktörün gelişimini kontrol etmek için faktörler arasındaki korelasyon derecesini belirlemek gereklidir: bunun için onu önemli ölçüde etkileyen diğer faktörleri etkilememiz ve bunların etkinliğinin ölçüsünü bilmemiz gerekir. Hazır testler geliştirmek veya seçmek için faktörlerin ilişkisini bilmek gerekir: bir testin bilgi içeriği, sonuçlarının bizi ilgilendiren bir özelliğin veya özelliğin tezahürleriyle korelasyonuyla belirlenir. Korelasyon bilgisi olmadan, herhangi bir seçim şekli imkansızdır.

Yukarıda, sporda ve genel olarak pedagojik, tıbbi ve hatta ekonomik ve sosyolojik pratikte, bunların olup olmadığını belirlemenin büyük ilgi gördüğü belirtilmişti. katkı , hangisi bir faktör diğerinin oluşumuna katkıda bulunur. Bunun nedeni, dikkate alınan faktör-nedenlerine ek olarak hedef(bizi ilgilendiren) faktör yasası, her biri ona şu veya bu katkıyı ve diğerleri.

Her bir faktör-nedenin katkısının ölçüsünün olabileceğine inanılmaktadır. determinasyon katsayısı D ben = r 2 ´100%. Yani, örneğin, r = 0.6 ise, yani. A ve B faktörleri arasındaki ilişki ortalama, o zaman D = 0,6 2 ´100% = %36. Bu nedenle, A faktörünün B faktörünün oluşumuna katkısının yaklaşık 1 olduğunu bilmek ½ 3, örneğin, yaklaşık 1 ayırmak mümkündür. ½ 3 antrenman zamanı. Korelasyon katsayısı r \u003d 0.4 ise, o zaman D \u003d r 2 %100 \u003d %16 veya yaklaşık 1 ½ 6 - iki s bir kez daha daha az ve bu mantığa göre sadece 1 ½ Eğitim süresinin 6 kısmı.

Çeşitli önemli faktörler için D i değerleri, aslında diğer faktörler üzerinde çalıştığımız iyileştirme uğruna, bizi ilgilendiren hedef faktör üzerindeki etkilerinin nicel ilişkisi hakkında yaklaşık bir fikir verir ( örneğin, uzun bir jumper, atlayışlarda sonucun oluşumuna en önemli katkıyı yapan faktör olduğu için sprintinin hızını arttırmaya çalışıyor).

tanımlayarak hatırla D onun yerine r koy r, elbette, tespitin doğruluğu daha düşük olmasına rağmen.

Temelli seçici(örnek verilerden hesaplanan) korelasyon katsayısının genel olarak ele alınan faktörler arasında bir bağlantı olduğu sonucuna varmak mümkün değildir. Değişken derecelerde geçerlilik ile böyle bir sonuç çıkarmak için standardı kullanın. korelasyon önem kriterleri. Uygulamaları, faktörler arasında doğrusal bir ilişki olduğunu varsayar ve normal dağılım her birindeki frekanslar (seçici değil, genel temsilleri anlamına gelir).

Örneğin, Student t-testlerini uygulayabilirsiniz. onun ırkı

eşit formül: tp= –2 , burada k, çalışılan örnek korelasyon katsayısıdır, a n- karşılaştırılan örneklerin hacmi. Elde edilen t-kriterinin (t p) hesaplanan değeri, seçtiğimiz önem düzeyindeki tablo değeri ve n = n - 2 serbestlik derecesi sayısı ile karşılaştırılır. Hesaplama çalışmasından kurtulmak için kullanabilirsiniz. özel bir masa örnek korelasyon katsayılarının kritik değerleri(yukarıya bakın), faktörler arasında önemli bir ilişkinin varlığına karşılık gelen (göz önünde bulundurularak n ve a).

Tablo 7.3.

Örnek korelasyon katsayısının güvenilirliğinin sınır değerleri

Korelasyon katsayılarının belirlenmesinde serbestlik derecesi sayısı 2'ye eşit alınır (yani. n= 2) Tabloda belirtilmiştir. 7.3 değerlerinin güven aralığında bir alt sınırı vardır doğru korelasyon katsayısı 0'dır, yani bu değerlerle korelasyonun hiç gerçekleştiği söylenemez. Örnek korelasyon katsayısının değeri tabloda belirtilenden yüksekse, gerçek korelasyon katsayısının sıfıra eşit olmadığı uygun anlamlılık düzeyinde kabul edilebilir.

Ancak, incelenen faktörler arasında gerçek bir bağlantı olup olmadığı sorusunun cevabı, başka bir soruya yer bırakıyor: hangi aralıkta? gerçek değer korelasyon katsayısı, gerçekte olabileceği gibi, sonsuz büyüklükte n? Herhangi bir belirli değer için bu aralık r ve n karşılaştırılan faktörler hesaplanabilir, ancak bir grafik sistemi kullanmak daha uygundur ( nomogram), burada her bir eğri çifti, üzerlerinde belirtilenlerden bazıları için oluşturulmuştur. n, aralığın sınırlarına karşılık gelir.

Pirinç. 7.4. Örnek korelasyon katsayısının güven sınırları (a = 0.05). Her eğri, üstündekine karşılık gelir. n.

Şekil 2'deki nomograma atıfta bulunarak. 7.4, örnek korelasyon katsayısının hesaplanan değerleri için gerçek korelasyon katsayısının değer aralığını a = 0.05 olarak belirlemek mümkündür.

7.3.5. korelasyon ilişkileri. Eğer çift korelasyonu doğrusal olmayan, korelasyon katsayısını hesaplamak imkansız, belirlemek korelasyon ilişkileri . Zorunlu gereksinim: özellikler bir oran ölçeğinde veya bir aralık ölçeğinde ölçülmelidir. Faktörün korelasyon bağımlılığını hesaplayabilirsiniz. X faktörden Y ve faktörün korelasyon bağımlılığı Y faktörden X- onlar farklı. Küçük bir hacim ile n faktörleri temsil eden dikkate alınan örnekler, korelasyon ilişkilerini hesaplamak için formülleri kullanabilirsiniz:

korelasyon oranı h x ½ y= ;

korelasyon oranı h y ½ x= .

Burada ve X ve Y örneklerinin aritmetik ortalamaları ve - sınıf içi aritmetik ortalamalar. Yani, faktör X örneğindeki bu değerlerin aritmetik ortalaması, eşlenik eşit değerler Y faktörü örneğinde (örneğin, faktör X, 4, 6 ve 5 değerlerine sahipse, aynı değerde 9 olan 3 seçenek Y faktörü örneğinde ilişkilendirilirse, o zaman = (4+6+) 5) ½ 3 = 5). Buna göre, - X faktörü örneğinde aynı değerlerle ilişkilendirilen Y faktörü örneğindeki bu değerlerin aritmetik ortalaması. Bir örnek verelim ve hesaplayalım:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tablo 7.4

Hesaplama tablosu

x ben ben x y x ben - x (x ben - x) 2 x ben - x y (x benx y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Bu nedenle h y½ x= » 0.63.

7.3.6. Kısmi ve çoklu korelasyon katsayıları. 2 faktör arasındaki ilişkiyi değerlendirmek için, korelasyon katsayılarını hesaplayarak, varsayılan olarak bu ilişki üzerinde başka hiçbir faktörün etkisinin olmadığını varsayıyoruz. Gerçekte, durum böyle değil. Dolayısıyla kilo ve boy arasındaki ilişki alınan kalori, sistematik fiziksel aktivite miktarı, kalıtım vb. faktörlerden çok önemli ölçüde etkilenir. Gerektiğinde 2 faktör arasındaki ilişki değerlendirilirken önemli etkiyi hesaba katmak diğer faktörler ve aynı zamanda kendilerini onlardan nasıl izole edecekleri, onları değişmemiş olarak kabul etmek, hesaplamak özel (aksi halde - kısmi ) korelasyon katsayıları.

Örnek: 3 temel faktör X, Y ve Z arasındaki eşleştirilmiş bağımlılıkları değerlendirmeniz gerekir. r XY (Z) X ve Y faktörleri arasındaki özel (kısmi) korelasyon katsayısı (bu durumda Z faktörünün değeri değişmemiş olarak kabul edilir), r ZX (Y) - Z ve X faktörleri arasındaki kısmi korelasyon katsayısı (Y faktörünün sabit değeri ile), r YZ (X) - Y ve Z faktörleri arasındaki kısmi korelasyon katsayısı (faktör X'in sabit değeri ile). Hesaplanmış basit eşleştirilmiş (Bravais-Pearson'a göre) korelasyon katsayılarını kullanma r xy, r XZ ve r YZ, m

Aşağıdaki formülleri kullanarak özel (kısmi) korelasyon katsayılarını hesaplayabilirsiniz:

rXY- r XZ' r YZ r XZ- r XY' r ZY r ZY –r ZX ´ r YZ

r XY(Z) = ; r XZ(Y) = ; r ZY(X) =

Ö(1– r 2XZ)(1– r 2 YZ) Ö(1– r 2XY)(1– r 2 ZY) Ö(1– r 2ZX)(1– r 2YX)

Kısmi korelasyon katsayıları ise -1 ile +1 arasında değerler alabilir. Bunların karesini alarak karşılık gelen bölümleri elde ederiz. belirleme katsayıları olarak da adlandırılır özel kesinlik önlemleri(100 ile çarpılarak %% olarak ifade edilir). Kısmi korelasyon katsayıları, 3. faktörün onlar üzerindeki etkisinin gücüne (değişmemiş gibi) bağlı olan basit (tam) çift katsayılarından az çok farklıdır. Sıfır hipotezi (H 0), yani X ve Y faktörleri arasında bağlantı (bağımlılık) olmadığı hipotezi (toplam özellik sayısı ile) test edilir. k) aşağıdaki formüle göre t-testini hesaplayarak: t P = r XY (Z) ´ ( n–k) 1 ½ 2 ´ (1– r 2XY(Z)) –1 ½ 2 .

Eğer bir t R< t a n , hipotez kabul edilir (bağımlılık olmadığını varsayıyoruz), eğer tt a n - hipotez reddedilir, yani bağımlılığın gerçekten gerçekleştiğine inanılır. t tablodan bir n alınır t-Öğrenci kriteri ve k- dikkate alınan faktör sayısı (örneğimiz 3'te), serbestlik derecesi sayısı n= n - 3. Diğer kısmi korelasyon katsayıları da benzer şekilde kontrol edilir (bunun yerine formüle r XY (Z) buna göre değiştirilir r XZ (Y) veya r ZY(X)).

Tablo 7.5

İlk veri

Ö (1 – 0,71 2)(1 – 0,71 2) Ö (1 – 0,5)(1 – 0,5)

X faktörünün birkaç faktörün (burada, Y ve Z faktörleri) birleşik etkisine bağımlılığını değerlendirmek için, basit eşleştirilmiş korelasyon katsayılarının değerlerini hesaplayın ve bunları kullanarak hesaplayın. çoklu korelasyon katsayısı r X (YZ) :

Ö r 2XY+ r 2XZ - 2 r XY' r XZ' r YZ

r X (YZ) = .

1 - r 2 YZ

7.2.7. ilişki katsayısı. arasındaki ilişkiyi ölçmek genellikle gereklidir. kalite işaretler, yani nicel olarak temsil edilemeyen (karakterize edilemeyen) bu tür işaretler, ölçülemez. Örneğin, görev, katılanların spor uzmanlığı ile içe dönüklük (kişiliğin kendi öznel dünyasının fenomenlerine odaklanması) ve dışa dönüklük (kişiliğin dünya üzerindeki odaklanması) gibi kişisel özellikler arasında bir ilişki olup olmadığını bulmaktır. dış nesneler). Semboller Tabloda sunulmuştur. 7.6.

Tablo 7.6.

X (yıl) Y (kez) Z (kez) X (yıl) Y (kez) Z (kez)
Özellik 1 Özellik 2 içe dönüklük Dışadönüklük
Spor Oyunları a b
Jimnastik İle birlikte d

Açıkçası, burada elimizdeki sayılar sadece dağıtım frekansları olabilir. Bu durumda hesaplayın ilişki katsayısı (diğer adı " olasılık katsayısı "). Düşünmek en basit durum: iki özellik çifti arasındaki ilişki, hesaplanan olasılık katsayısı ise tetrakorik (tabloya bakınız).

Tablo 7.7.

bir = 20 b = 15 a + b = 35
c =15 d=5 c + d = 20
a + c = 35 b + d = 20 n = 55

Aşağıdaki formüle göre hesaplamalar yapıyoruz:

ad-bc 100-225-123

Daha fazla sayıda öznitelikle birliktelik katsayılarının (konjugasyon katsayıları) hesaplanması, karşılık gelen sıradaki benzer bir matris kullanılarak yapılan hesaplamalarla ilişkilendirilir.

ders çalışırken korelasyonlar Aynı örneklemdeki iki gösterge arasında herhangi bir ilişki olup olmadığını (örneğin, çocukların boy ve kilosu arasında veya IQ ve okul performansı) veya iki farklı örneklem arasında (örneğin, ikiz çiftlerini karşılaştırırken) ve bu ilişki varsa, bir göstergedeki artışa, başka.

Başka bir deyişle, korelasyon analizi, bir diğerinin değerini bilerek bir göstergenin olası değerlerini tahmin etmenin mümkün olup olmadığını belirlemeye yardımcı olur.

Şimdiye kadar, esrarın etkilerini inceleme konusundaki deneyimlerimizin sonuçlarını analiz ederken, tepki süresi gibi bir göstergeyi kasıtlı olarak görmezden geldik. Bu arada, reaksiyonların etkinliği ile hızları arasında bir ilişki olup olmadığını kontrol etmek ilginç olurdu. Bu, örneğin, bir kişi ne kadar yavaşsa, eylemlerinin o kadar doğru ve etkili olacağını ve bunun tersini savunmaya izin verir.

Bu amaçla iki farklı yöntem kullanılabilir: Bravais-Pearson katsayısının hesaplanması için parametrik yöntem (r) ve Spearman sıralarının korelasyon katsayısının hesaplanması (r s ), bu, sıralı veriler için geçerlidir, yani parametrik değildir. Ancak, önce bir korelasyon katsayısının ne olduğunu anlayalım.

Korelasyon katsayısı

Korelasyon katsayısı -1 ile 1 arasında değişebilen bir değerdir. Tam bir pozitif korelasyon durumunda, bu katsayı artı 1'dir ve tam negatif - eksi 1'dir. Grafikte bu, düz bir çizgi geçişine karşılık gelir. her bir çift verisinin değerlerinin kesişme noktalarından:

Değişken

Bu noktalar düz bir çizgide sıralanmıyor ve bir "bulut" oluşturuyorsa, korelasyon katsayısının mutlak değeri birden küçük olur ve bulut yuvarlandıkça sıfıra yaklaşır:

Korelasyon katsayısı 0 ise, her iki değişken de birbirinden tamamen bağımsızdır.

Beşeri bilimlerde, katsayısı 0.60'tan büyükse bir korelasyon güçlü olarak kabul edilir; 0.90'ı aşarsa, korelasyon çok güçlü olarak kabul edilir. Ancak, değişkenler arasındaki ilişkiler hakkında sonuç çıkarabilmek için örneklem büyüklüğü büyük önem taşımaktadır: Örneklem ne kadar büyükse, elde edilen korelasyon katsayısının değeri o kadar güvenilirdir. Farklı sayıda serbestlik derecesi için Bravais-Pearson ve Spearman korelasyon katsayılarının kritik değerlerine sahip tablolar vardır (eksi 2 çift sayısına eşittir, yani. n-2). Ancak korelasyon katsayıları bu kritik değerlerden büyükse güvenilir kabul edilebilirler. Dolayısıyla 0.70 olan korelasyon katsayısının güvenilir olabilmesi için analize en az 8 çift verinin alınması gerekmektedir. ( = P - 2 = 6) hesaplarken r(Tablo B.4) ve 7 veri çifti (= n - 2 = 5) hesaplarken r s (Ek B. 5'teki Tablo 5).

Bravais-Pearson katsayısı

Bu katsayıyı hesaplamak için aşağıdaki formül kullanılır (y farklı yazarlar farklı görünebilir):

nerede  XY her bir çiftten gelen verilerin ürünlerinin toplamıdır;

n - çift sayısı;

- değişken veriler için ortalama X;

Değişken veriler için ortalama Y;

S X - x;

s Y - dağıtım için standart sapma y.

Şimdi bu katsayıyı, deneklerin tepki süreleri ile eylemlerinin etkinliği arasında bir ilişki olup olmadığını belirlemek için kullanabiliriz. Örneğin, kontrol grubunun arka plan seviyesini alın.

n= 15  15,8  13,4 = 3175,8;

(n 1)S x S y = 14  3,07  2,29 = 98,42;

r =

Korelasyon katsayısının negatif bir değeri, reaksiyon süresi ne kadar uzun olursa verimliliğin o kadar düşük olduğu anlamına gelebilir. Ancak değeri bu iki değişken arasında anlamlı bir ilişkiden söz edemeyecek kadar küçüktür.

nXY=………

(n- 1)S X S Y = ……

Bu sonuçlardan nasıl bir sonuç çıkarılabilir? Değişkenler arasında bir ilişki olduğunu düşünüyorsanız, o zaman nedir - doğrudan mı yoksa ters mi? Güvenilir mi [bkz. sekme. 4 (Ek B. 5'te) kritik değerlerle r]?

Spearman sıra korelasyon katsayısır s

Bu katsayının hesaplanması daha kolaydır, ancak sonuçlar kullanmaktan daha az doğrudur. r. Bunun nedeni, Spearman katsayısını hesaplarken, nicel özellikleri ve sınıflar arasındaki aralıkları değil, verilerin sırasının kullanılmasıdır.

Mesele şu ki, sıra korelasyon katsayısını kullanırken Mızrakçı(r s ) sadece bazı örneklem için veri sıralamasının, birinci örnekle eşleştirilen bu örnek için bir dizi başka veriyle aynı olup olmayacağını kontrol ederler (örneğin, öğrencilerin hem psikolojiyi hem de matematiği geçtiklerinde eşit olarak “sıralanıp” sıralanmayacaklarını veya iki farklı psikoloji profesörüyle bile mi?). Katsayı + 1'e yakınsa, bu her iki serinin de pratik olarak çakıştığı anlamına gelir ve bu katsayı - 1'e yakınsa, tam bir ters ilişkiden bahsedebiliriz.

katsayı r s formüle göre hesaplanır

nerede d- eşlenik özellik değerlerinin sıraları arasındaki fark (işaretinden bağımsız olarak) ve n- çift sayısı.

Tipik olarak, bu parametrik olmayan test, hakkında çok fazla olmayan bazı sonuçlar çıkarmanız gereken durumlarda kullanılır. aralıklar veriler arasında, onlar hakkında ne kadar rütbeler, ve ayrıca dağılım eğrileri çok asimetrik olduğunda ve katsayı gibi parametrik kriterlerin kullanımına izin vermediğinde r(bu durumlarda nicel verileri sıralı verilere dönüştürmek gerekebilir).

Deney grubunda maruziyet sonrası verim ve tepkime süresi değerlerinin dağılımında durum böyle olduğundan, bu grup için daha önce yapmış olduğunuz hesaplamaları tekrarlayabilirsiniz, ancak şimdi katsayı için değil r, ve gösterge için r s . Bu, bu iki göstergenin ne kadar farklı olduğunu görmenizi sağlayacaktır*.

* Unutulmamalıdır ki

1) isabet sayısı için 1. sıra en yüksek ve 15. sıra en düşük performansa karşılık gelirken, tepki süresi için 1. sıra en kısa süreye ve 15. sıra en uzun süreye karşılık gelir;

2) ex aequo verilerine ortalama bir sıralama verilir.

Böylece, katsayı durumunda olduğu gibi r, güvenilmez de olsa olumlu bir sonuç aldı. İki sonuçtan hangisi daha makul: r=-0.48 veya r s = +0.24? Böyle bir soru ancak sonuçlar güvenilir ise ortaya çıkabilir.

Bu iki katsayının özünün biraz farklı olduğunu bir kez daha vurgulamak isterim. negatif katsayı r katsayı hesaplanırken verimliliğin genellikle daha yüksek olduğunu, reaksiyon süresinin daha hızlı olduğunu gösterir. r s Daha hızlı deneklerin her zaman daha doğru tepki gösterip göstermediğini ve daha yavaş olanların daha az doğru tepki gösterip göstermediğini kontrol etmek gerekiyordu.

Deney grubunda maruz kaldıktan sonra bir katsayı elde edildiğinden r s , 0.24'e eşit, böyle bir eğilim burada açıkça görülmez. Maruz kaldıktan sonra kontrol grubu için verileri kendi başınıza anlamaya çalışın, bunu bilerek  d 2 = 122,5:

; güvenilir mi?

Sonucunuz nedir?………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Bu nedenle, psikolojide kullanılan çeşitli parametrik ve parametrik olmayan istatistiksel yöntemleri inceledik. İncelememiz çok yüzeyseldi ve ana görevi, okuyucunun istatistiklerin göründüğü kadar korkutucu olmadığını ve çoğunlukla sağduyu gerektirdiğini anlamasını sağlamaktı. Burada ele aldığımız "deneyim" verilerinin hayali olduğunu ve herhangi bir sonuca dayandırılamayacağını hatırlatırız. Ancak, böyle bir deney yapmaya değer. Bu deney için tamamen klasik bir teknik seçildiğinden, aynı istatistiksel analiz birçok farklı deneyde kullanılabilir. Her halükarda, sonuçların istatistiksel analizine nereden başlayacağını bilmeyenler için yararlı olabilecek bazı ana yönergeleri özetledik gibi görünüyor.

Üç ana istatistiğin dalı vardır: tanımlayıcı istatistikler, tümevarımsal istatistikler ve korelasyon analizi.

Regresyon analizi, bir değişkenin diğerine nasıl bağlı olduğunu ve bağımlı değişkenin değerlerinin ilişkiyi tanımlayan düz çizgi etrafında yayılmasının ne olduğunu değerlendirmenize olanak tanır. Bu tahminler ve karşılık gelen güven aralıkları, bağımlı değişkenin değerini tahmin etmeyi ve bu tahminin doğruluğunu belirlemeyi mümkün kılar.

Regresyon analizinin sonuçları ancak oldukça karmaşık bir dijital veya grafik biçimde sunulabilir. Bununla birlikte, genellikle bir değişkenin değerini diğerinin değerinden tahmin etmekle değil, sadece tek bir sayı olarak ifade edilirken aralarındaki ilişkinin sıkılığını (kuvvetini) karakterize etmekle ilgileniriz.

Bu özelliğe korelasyon katsayısı denir, genellikle r harfi ile gösterilir. Korelasyon katsayısı şu şekilde olabilir:

-1 ile +1 arasında değerler alabilir. Korelasyon katsayısının işareti bağlantının yönünü (doğrudan veya ters), mutlak değer ise bağlantının yakınlığını gösterir. -1'e eşit bir katsayı, 1'e eşit aynı rijit bağlantıyı belirler. Bir bağlantının yokluğunda korelasyon katsayısı sıfırdır.

Şek. 8.10, bağımlılık örneklerini ve bunlara karşılık gelen r değerlerini gösterir.İki korelasyon katsayısını ele alacağız.

Pearson korelasyon katsayısının, nicel özelliklerin doğrusal ilişkisini tanımlaması amaçlanmıştır; regresyon gibi
iyonik analiz, normal bir dağılım gerektirir. İnsanlar sadece "korelasyon katsayısı" hakkında konuştuklarında hemen hemen her zaman Pearson korelasyon katsayısını kastediyorlar ve biz de tam olarak bunu yapacağız.

Spearman'ın sıra korelasyon katsayısı, ilişki doğrusal olmadığında kullanılabilir - ve yalnızca nicel için değil, aynı zamanda sıralı özellikler için de kullanılabilir. Bu parametrik olmayan bir yöntemdir ve belirli bir dağıtım türü gerektirmez.

Bölümde nicel, nitel ve sıralı özellikler hakkında zaten konuştuk. 5. Nicel işaretler, boy, ağırlık, sıcaklık gibi sıradan sayısal verilerdir. değerler nicel özellik Birbirinizle karşılaştırabilir ve hangisinin daha büyük olduğunu, ne kadar ve kaç kez söyleyebilirsiniz. Örneğin, bir Marslı 15 g ve diğeri 10 ise, birincisi ikinciden bir buçuk kat ve 5 g kaç kat daha ağırdır. Tıpta, sıra işaretleri oldukça yaygındır. Örneğin, bir vajinal Pap testinin sonuçları şu ölçekte değerlendirilir: 1) normal, 2) hafif displazi, 3) orta derecede displazi, 4) şiddetli displazi, 5) in situ kanser. Hem nicel hem de sıralı işaretler sırayla düzenlenebilir - bu konuda ortak mülk Spearman sıralama korelasyon katsayısını içeren geniş bir parametrik olmayan kriterler grubuna dayanmaktadır. Diğer parametrik olmayan kriterlerle Bölüm'de tanışacağız. on.

Pearson korelasyon katsayısı

Yine de, ilişkinin sıkılığını tanımlamak için neden regresyon analizi kullanılamıyor? Artık standart sapma, ilişkinin yakınlığının bir ölçüsü olarak kullanılabilir. Ancak, bağımlı ve bağımsız değişkenleri değiştirirseniz, regresyon analizinin diğer göstergeleri gibi artık standart sapma farklı olacaktır.

Figür'e bakalım. 8.11. Bildiğimiz 10 Marslı örneğine dayanarak, iki regresyon çizgisi oluşturuldu. Bir durumda ağırlık bağımlı değişken, ikinci durumda bağımsız değişkendir. Regresyon çizgileri belirgin şekilde farklı



20

X ve y'yi değiştirirseniz, regresyon denklemi farklı olacaktır, ancak korelasyon katsayısı aynı kalacaktır.

Ümit etmek. Boy ile ağırlık arasındaki ilişkinin bir, ağırlık ile boy arasındaki ilişkinin başka olduğu ortaya çıktı. Regresyon analizinin asimetrisi, bir ilişkinin gücünü karakterize etmek için doğrudan kullanılmasını engelleyen şeydir. Korelasyon katsayısı, fikri regresyon analizinden kaynaklansa da bu eksiklikten muaftır. Formülü sunuyoruz.

rY(X - X)(Y - Y)

&((- X) S(y - Y)2"

burada X ve Y, X ve Y değişkenlerinin ortalama değerleridir. r için ifade "simetrik" - X ve Y'yi değiştirerek aynı değeri elde ederiz. Korelasyon katsayısı -1 ile +1 arasında değerler alır. İlişki ne kadar yakınsa, korelasyon katsayısının mutlak değeri o kadar büyük olur. İşaret, bağlantının yönünü gösterir. r > 0 için doğrudan bir korelasyondan bahsederler (bir değişken arttıkça diğeri de artar), r için daha önce regresyon analizi açısından ele aldığımız 10 Marslı örneğini ele alalım. Korelasyon katsayısını hesaplayalım. Hesaplamaların ilk verileri ve ara sonuçları Tablo'da verilmiştir. 8.3. Örnek boyutu n = 10, ortalama yükseklik

X = £ X/n = 369/10 = 36.9 ve ağırlık Y = £ Y/n = 103.8/10 = 10.38.

Shch-X)(Y-Y) = 99.9, Shch-X)2 = 224.8, £(Y - Y)2 = 51,9 buluyoruz.

Elde edilen değerleri korelasyon katsayısı için formüle koyalım:

224.8 x 51,9'"

r'nin değeri 1'e yakındır, bu boy ve kilo arasında yakın bir ilişki olduğunu gösterir. Hangi korelasyon katsayısının büyük, hangilerinin önemsiz sayılması gerektiği konusunda daha iyi bir fikir edinmek için şuraya bir göz atın:

Tablo 8.3. Korelasyon katsayısının hesaplanması
X Y X-X Y-Y (X-X)(Y-Y) (X-X)2 (Y-Y)2
31 7,8 -5,9 -2,6 15,3 34,8 6,8
32 8,3 -4,9 -2,1 10,3 24,0 4,4
33 7,6 -3,9 -2,8 10,9 15,2 7,8
34 9,1 -2,9 -1,3 3,8 8,4 1,7
35 9,6 -1,9 -0,8 1,5 3,6 0,6
35 9,8 -1,9 -0,6 1,1 3,6 0,4
40 11,8 3,1 1,4 4,3 9,6 2,0
41 12,1 4,1 1,7 7,0 16,8 2,9
42 14,7 5,1 4,3 22,0 26,0 18,5
46 13,0 9,1 2,6 23,7 82,8 6,8
369 103,8 0,0 0,2 99,9 224,8 51,9


masadakiler. 8.4 - Daha önce analiz ettiğimiz örnekler için korelasyon katsayılarını gösterir.

Regresyon ve korelasyon arasındaki ilişki

Başlangıçta, regresyon çizgileri oluşturmak için tüm korelasyon katsayıları örneklerini (Tablo 8.4) kullandık. Gerçekten de korelasyon katsayısı ile şimdi göstereceğimiz regresyon analizi parametreleri arasında yakın bir ilişki vardır. Bu durumda elde edeceğimiz korelasyon katsayısını sunmanın farklı yolları, bu göstergenin anlamını daha iyi anlamamızı sağlayacaktır.

Regresyon denkleminin, regresyon çizgisinden sapmaların karelerinin toplamını en aza indirecek şekilde yapılandırıldığını hatırlayın.


Bu minimum kareler toplamını S ile gösteririz (bu değere artık kareler toplamı denir). Y bağımlı değişkeninin değerlerinin ortalama Y'den sapmalarının karelerinin toplamı S^ ile gösterilecektir. O zamanlar:

r2 değerine belirleme katsayısı denir - bu sadece korelasyon katsayısının karesidir. Belirleme katsayısı, bağlantının gücünü gösterir, ancak yönünü göstermez.

Yukarıdaki formülden, bağımlı değişkenin değerleri doğrudan regresyona bağlıysa, o zaman S = 0 ve dolayısıyla r = +1 veya r = -1 olduğu, yani aralarında doğrusal bir ilişki olduğu görülebilir. bağımlı ve bağımsız değişken. Bağımsız değişkenin herhangi bir değeri, bağımlı değişkenin değerini doğru bir şekilde tahmin edebilir. Aksine, değişkenler hiç ilişkili değilse, o zaman Soci = SofSisi O zaman r = 0 olur.

Belirleme katsayısının, lineer regresyondan kaynaklanan veya dedikleri gibi, lineer regresyonla açıklanan toplam varyans S^ payına eşit olduğu da görülebilir.

S karelerinin kalan toplamı, Socj = (n - 2) s^ ilişkisi ile s2y\x artık varyansı ile ve S^ karelerinin toplam toplamı ile s2 varyansı S^ = (n - 1) ilişkisi ile ilişkilidir. )s2 . Bu durumda

r2 = 1 _ n _ 2 sy\x n _1 sy

Bu formül, korelasyon katsayısının toplam varyansta kalan varyansın payına bağımlılığını yargılamayı mümkün kılar.

altı/s2y Bu oran ne kadar küçükse, korelasyon katsayısı o kadar büyük (mutlak değerde) ve bunun tersi de geçerlidir.

Korelasyon katsayısının değişkenlerin doğrusal ilişkisinin sıkılığını yansıttığını gördük. Ancak, eğer Konuşuyoruz bir değişkenin değerini diğerinin değerinden tahmin etmekle ilgili,
korelasyon katsayısına aşırı güvenilmemelidir. Örneğin, Şekil 2'deki veriler. 8.7, çok yüksek bir korelasyon katsayısına (r = 0.92) karşılık gelir, ancak güven bölgesinin genişliği, tahmin belirsizliğinin oldukça önemli olduğunu gösterir. Bu nedenle, büyük bir korelasyon katsayısıyla bile güven aralığını hesapladığınızdan emin olun.


Ve sonunda, korelasyon katsayısının oranını ve doğrudan regresyon b'nin eğim katsayısını veriyoruz:

b, regresyon doğrusunun eğimi, sx ve sY değişkenlerin standart sapmalarıdır.

Eğer sx = 0 durumunu dikkate almazsak, o zaman korelasyon katsayısı ancak ve ancak b = 0 ise sıfıra eşittir. Şimdi bu gerçeği, korelasyonun istatistiksel önemini tahmin etmek için kullanacağız.

Korelasyonun İstatistiksel Önemi

b = 0, r = 0 anlamına geldiğinden, korelasyon yok hipotezi, doğrudan regresyonun sıfır eğimi hipotezine eşdeğerdir. Bu nedenle, korelasyonun istatistiksel önemini değerlendirmek için, b ve sıfır arasındaki farkın istatistiksel önemini değerlendirmek için zaten bildiğimiz formülü kullanabiliriz:

Burada serbestlik derecesi sayısı v = n - 2'dir. Ancak, korelasyon katsayısı zaten hesaplanmışsa, formülü kullanmak daha uygundur:

Buradaki serbestlik derecesi sayısı da v = n - 2'dir.

t için iki formülün dışsal farklılığı ile, aynıdırlar. Doğrusu, neyden


r 2 _ 1 - n_ 2 Sy]x_

Standart hata için formülde sy^x değerinin değiştirilmesi

Hayvansal yağ ve meme kanseri

Laboratuvar hayvanları üzerinde yapılan deneylerde, diyette yüksek miktarda hayvansal yağ bulunmasının meme kanseri riskini artırdığı gösterilmiştir. Bu bağımlılık insanlarda gözlenir mi? K. Carroll, 39 ülkede hayvansal yağ tüketimi ve meme kanserinden ölüm oranı hakkında veri topladı. Sonuç, Şek. 8.12A. Hayvansal yağ tüketimi ile meme kanserinden ölüm oranı arasındaki korelasyon katsayısı 0.90 olarak bulundu. Korelasyonun istatistiksel önemini tahmin edelim.

0,90 1 - 0,902 39 - 2

v = 39 - 2 = 37 serbestlik derecesi sayısı için t'nin kritik değeri, tarafımızdan elde edilenden daha az olan 3.574'tür. Bu nedenle, 0.001 anlamlılık düzeyinde, hayvansal yağ alımı ile meme kanserinden ölüm arasında bir korelasyon olduğu söylenebilir.

Şimdi, ölüm oranının bitkisel yağ tüketimi ile ilişkili olup olmadığını kontrol edelim mi? İlgili veriler, Şek. 8.12B. Korelasyon katsayısı 0.15'tir. O zamanlar

1 - 0,152 39 - 2

0.10 anlamlılık düzeyinde bile hesaplanan t değeri kritik değerden küçüktür. Korelasyon istatistiksel olarak anlamlı değildir.

Korelasyon katsayısı+1 ile -1 arasında değişebilen bir değerdir. Tam bir pozitif korelasyon durumunda, bu katsayı artı 1'e eşittir (bir değişkenin değerindeki bir artışla başka bir değişkenin değerinin arttığını söylerler) ve tam bir negatif korelasyonla - eksi 1 (geri bildirimi gösterir) , yani bir değişkenin değerleri arttığında, diğerinin değerleri azalır).

Örn 1:

Utangaçlık ve depresyonun bağımlılık grafiği. Gördüğünüz gibi, noktalar (nesneler) rastgele yerleştirilmez, ancak bir çizgi etrafında sıralanır ve bu çizgiye bakarak, bir kişide utangaçlık ne kadar yüksek ifade edilirse, o kadar depresif, yani. bu fenomenler birbirine bağlıdır.

Ör 2: Utangaçlık ve Sosyallik Grafiği. Utangaçlık arttıkça sosyalliğin azaldığını görüyoruz. Korelasyon katsayıları -0.43'tür. Bu nedenle, 0'dan 1'e kadar olan bir korelasyon katsayısı, doğrudan orantılı bir ilişkiyi (ne kadar çok ... o kadar fazla ...) gösterir ve -1'den 0'a kadar bir katsayı ters orantılı bir ilişkiyi gösterir (ne kadar çok ... o kadar az . ..)

Korelasyon katsayısı 0 ise, her iki değişken de birbirinden tamamen bağımsızdır.

korelasyon- bu, bireysel faktörlerin etkisinin, gerçek verilerin toplu olarak gözlemlenmesiyle (ortalama olarak) yalnızca bir eğilim olarak göründüğü bir ilişkidir. Korelasyon bağımlılığına örnek olarak bankanın varlıklarının büyüklüğü ile bankanın kârının miktarı arasındaki bağımlılık, emek verimliliğinin artması ve çalışanların hizmet süresi verilebilir.

Güçlerine göre iki korelasyon sınıflandırma sistemi kullanılır: genel ve özel.

Korelasyonların genel sınıflandırması: 1) güçlü veya r> 0.70 korelasyon katsayısı ile yakın; 2) 0.500.70'de orta ve sadece bir korelasyon değil yüksek seviyeönem.

Aşağıdaki tablo, farklı ölçek türleri için korelasyon katsayılarının adlarını listeler.

İkili ölçek (1/0) Sıra (sıra) ölçeği
İkili ölçek (1/0) Pearson'ın birliktelik katsayısı, Pearson'ın dört hücreli konjugasyon katsayısı. iki seri korelasyon
Sıra (sıra) ölçeği Sıra-iki seri korelasyon. Spearman's veya Kendall's rank korelasyon katsayısı.
Aralık ve mutlak ölçek iki seri korelasyon Aralık ölçeğinin değerleri sıralara dönüştürülür ve sıra katsayısı kullanılır Pearson korelasyon katsayısı (doğrusal korelasyon katsayısı)

saat r=0 doğrusal bir korelasyon yoktur. Bu durumda, değişkenlerin grup ortalamaları genel ortalamalarıyla örtüşür ve regresyon çizgileri koordinat eksenlerine paraleldir.

eşitlik r=0 sadece doğrusal bir korelasyon bağımlılığının (ilişkisiz değişkenler) yokluğundan bahseder, ancak genel olarak bir korelasyonun yokluğundan ve hatta daha çok istatistiksel bir bağımlılıktan bahsetmez.

Bazen hiçbir korelasyon olmadığı sonucu, güçlü bir korelasyonun varlığından daha önemlidir. İki değişkenin sıfır korelasyonu, ölçüm sonuçlarına güvenmemiz koşuluyla, bir değişkenin diğeri üzerinde etkisinin olmadığını gösterebilir.

SPSS'de: 11.3.2 Korelasyon katsayıları

Şimdiye kadar, yalnızca iki özellik arasında istatistiksel bir ilişkinin varlığı gerçeğini bulduk. Daha sonra, bu bağımlılığın gücü veya zayıflığı ile şekli ve yönü hakkında hangi sonuçların çıkarılabileceğini bulmaya çalışacağız. Kriterler niceleme değişkenler arasındaki bağımlılıklara korelasyon katsayıları veya bağlantı ölçüleri denir. Aralarında doğrudan, tek yönlü bir ilişki varsa, iki değişken pozitif olarak ilişkilidir. Tek yönlü bir ilişkide, bir değişkenin küçük değerleri diğer değişkenin küçük değerlerine karşılık gelir, büyük değerler büyük olanlara karşılık gelir. Aralarında ters bir ilişki varsa, iki değişken negatif olarak ilişkilidir. Çok yönlü bir ilişki ile, bir değişkenin küçük değerleri, diğer değişkenin büyük değerlerine karşılık gelir ve bunun tersi de geçerlidir. Korelasyon katsayılarının değerleri her zaman -1 ile +1 arasındadır.

Sıralı ölçeğe ait değişkenler arasında korelasyon katsayısı olarak Spearman katsayısı, aralık ölçeğine ait değişkenler için ise Pearson korelasyon katsayısı (çarpımların momenti) kullanılır. Bu durumda her bir ikili değişkenin, yani nominal ölçeğe ait ve iki kategorisi olan bir değişkenin sıralı olarak kabul edilebileceğine dikkat edilmelidir.

İlk olarak, studium.sav dosyasından cinsiyet ve psyche değişkenleri arasında bir korelasyon olup olmadığını kontrol edeceğiz. Bunu yaparken, ikili değişken cinsiyetin sıralı bir değişken olarak kabul edilebileceğini dikkate alıyoruz. Aşağıdakileri yapın:

Komut menüsünden seçin Analiz Et (Analiz) Tanımlayıcı İstatistikler (Tanımlayıcı istatistikler) Çapraz tablolar... (Olağan durum tabloları)

· Değişken cinsiyeti bir satır listesine ve değişken psişeyi bir sütun listesine taşıyın.

· İstatistikler... düğmesini tıklayın. Çapraz Tablolar: İstatistikler iletişim kutusunda, Korelasyonlar kutusunu işaretleyin. Devam butonu ile seçiminizi onaylayın.

· Çapraz tablolar iletişim kutusunda, Tabloları bastır onay kutusunu işaretleyerek tabloların görüntülenmesini durdurun. Tamam düğmesini tıklayın.

Spearman ve Pearson korelasyon katsayıları hesaplanacak ve önemleri test edilecektir:

/ Teori. Korelasyon katsayısı

Korelasyon katsayısı- iki boyutlu tanımlayıcı istatistikler, iki değişken arasındaki ilişkinin (ortak değişkenlik) nicel bir ölçüsü.

Bugüne kadar çok sayıda çeşitli katsayılar korelasyonlar. Ancak, en önemli iletişim önlemleri, Pearson, Spearman ve Kendall . Onlara ortak özellik bu mu iki özelliğin ilişkisini yansıtırlar , nicel bir ölçekte ölçülür - rütbe veya metrik .

Genel konuşma, hiç ampirik araştırma iki veya daha fazla değişken arasındaki ilişkilerin incelenmesine odaklanan .

Bir değişkende bir birimlik bir değişiklik, diğer değişkende her zaman aynı miktarda bir değişikliğe neden oluyorsa, fonksiyon şudur: doğrusal (grafiği düz bir çizgidir); başka herhangi bir bağlantı doğrusal olmayan . Bir değişkendeki artış diğerindeki artışla ilişkilendiriliyorsa, o zaman bağ - pozitif ( dümdüz ) ; Bir değişkendeki artış, diğerinde bir azalma ile ilişkiliyse, sonra bağlantı - olumsuz ( tersi ) . Bir değişkenin değişim yönü, diğer değişkenin artması (azalması) ile değişmiyorsa, böyle bir fonksiyon monoton ; aksi halde fonksiyon çağrılır monoton olmayan .

İşlevsel bağlantılar idealleştirmelerdir. Onların özelliği, bir değişkenin bir değerinin, başka bir değişkenin kesin olarak tanımlanmış bir değerine karşılık gelmesi gerçeğinde yatmaktadır. Örneğin, iki fiziksel değişkenin ilişkisi böyledir - ağırlık ve vücut uzunluğu (doğrusal pozitif). Bununla birlikte, fiziksel deneylerde bile, ampirik ilişki, açıklanmayan veya bilinmeyen nedenlerden dolayı fonksiyonel ilişkiden farklı olacaktır: malzemenin bileşimindeki dalgalanmalar, ölçüm hataları, vb.

Araştırmacı, özelliklerin ilişkisini incelerken, bu özelliklerin değişkenliğine ilişkin birçok olası nedeni kaçınılmaz olarak kaybeder. Sonuç, gerçekte var olan değişkenler arasındaki işlevsel ilişkinin bile ampirik olarak olasılıksal (stokastik) görünmesidir: bir değişkenin aynı değeri, başka bir değişkenin farklı değerlerinin dağılımına karşılık gelir (ve tersi).

En basit örnek, insanların boy ve kilo oranıdır. Bu iki işaretin çalışmasının ampirik sonuçları elbette olumlu ilişkilerini gösterecektir. Ancak katı, doğrusal, pozitif - idealden farklı olacağını tahmin etmek kolaydır. matematiksel fonksiyon, araştırmacının tüm hileleriyle bile deneklerin uyumunu veya dolgunluğunu dikkate alması. Bu temelde, vücudun uzunluğu ve ağırlığı arasında katı bir işlevsel ilişkinin varlığını inkar etmek kimsenin aklına gelmez.

Yani, fenomenlerin işlevsel ara bağlantıları, yalnızca karşılık gelen özelliklerin olasılıksal bir bağlantısı olarak ampirik olarak ortaya çıkarılabilir.

Olasılık ilişkisinin doğasının görsel bir temsili, bir dağılım diyagramı ile verilir - eksenleri iki değişkenin değerlerine karşılık gelen bir grafik ve her konu bir noktadır. Olarak sayısal karakteristik olasılıksal bağlantı, korelasyon katsayıları kullanılır.

Bağlantının gücüne göre üç dereceli korelasyon değeri girebilirsiniz:

r< 0,3 - слабая связь (менее 10% от общей доли дисперсии);

0,3 < r < 0,7 - умеренная связь (от 10 до 50% от общей доли дисперсии);

r > 0.7 - güçlü ilişki (toplam varyansın %50'si veya daha fazlası).

Kısmi Korelasyon

Genellikle, her ikisinin de üçüncü bir değişkenin etkisi altında değişmesi gerçeği nedeniyle, iki değişkenin birbiriyle ilişkili olduğu görülür. Yani aslında bu iki değişkenin karşılık gelen özellikleri arasında bir bağlantı yoktur, ancak kendini şu şekilde gösterir. istatistiksel ilişki veya korelasyonlar, etkisi altında yaygın nedenüçüncü değişken).

Bu nedenle, sabit bir üçüncü rastgele değişkenle iki değişken arasındaki korelasyon azalırsa, bu onların karşılıklı bağımlılığının kısmen bu üçüncü değişkenin etkisiyle ortaya çıktığı anlamına gelir. Kısmi korelasyon sıfır veya çok küçükse, karşılıklı bağımlılıklarının tamamen kendi etkilerinden kaynaklandığı ve hiçbir şekilde üçüncü değişkenle ilgili olmadığı sonucuna varabiliriz.

Ayrıca, kısmi korelasyon iki değişken arasındaki ilk korelasyondan daha büyükse, diğer değişkenlerin ilişkiyi zayıflattığı veya korelasyonu "gizlediği" sonucuna varılabilir.

Ayrıca unutulmamalıdır ki, korelasyon nedensellik değildir . Buna dayanarak, varlığı hakkında kategorik olarak konuşmaya hakkımız yok nedensellik: Analizde ele alınanlardan tamamen farklı bazı değişkenler bu korelasyonun kaynağı olabilir. Hem olağan hem de kısmi korelasyonlarda, nedensellik varsayımının her zaman kendi istatistiksel olmayan temelleri olmalıdır.

Pearson korelasyon katsayısı

r- Pearson iki metrik değişken arasındaki ilişkiyi incelemek için kullanılır , aynı numune üzerinde ölçülen . Kullanmanın uygun olduğu birçok durum vardır. Zeka lisans performansını etkiler mi? Bir çalışanın maaşı, meslektaşlarına karşı iyi niyetiyle ilgili mi? Bir öğrencinin ruh hali, karmaşık bir aritmetik problemini çözme başarısını etkiler mi? Bu tür soruları yanıtlamak için araştırmacı, örneklemin her bir üyesine yönelik iki ilgi göstergesini ölçmelidir.

Korelasyon katsayısının değeri, özelliklerin sunulduğu birimlerden etkilenmez. Bu nedenle, herhangi doğrusal dönüşümleröznitelikler (bir sabitle çarpma, bir sabitin eklenmesi) korelasyon katsayısının değerini değiştirmez. Bir istisna, işaretlerden birinin negatif bir sabitle çarpılmasıdır: korelasyon katsayısı, işaretini tersine değiştirir.

Pearson korelasyonu iki değişken arasındaki doğrusal ilişkinin bir ölçüsüdür . belirlemenizi sağlar , iki değişkenin değişkenliği ne kadar orantılıdır . Değişkenler birbiriyle orantılıysa, aralarındaki ilişki grafiksel olarak pozitif (doğru orantı) veya negatif (ters orantı) eğimli düz bir çizgi olarak temsil edilebilir.

Pratikte, eğer varsa, iki değişken arasındaki ilişki olasılıklıdır ve grafiksel olarak elipsoidal bir saçılma bulutu gibi görünür. Ancak bu elipsoid, düz bir çizgi veya bir regresyon çizgisi olarak temsil edilebilir (yaklaşık olarak). regresyon hattı en küçük kareler düz çizgisidir: saçılım grafiğinin her noktasından düz çizgiye olan uzaklıkların karesi (y ekseni boyunca hesaplanır) toplamı minimumdur.

Tahminin doğruluğunu değerlendirmek için özellikle önemli olan, bağımlı değişkenin tahminlerinin varyansıdır. Özünde, bağımlı değişken Y'nin tahminlerinin varyansı, bağımsız değişken X'in etkisinden kaynaklanan toplam varyansının bir parçasıdır. Başka bir deyişle, bağımlı değişkenin tahminlerinin varyansının gerçek varyansına oranıdır. korelasyon katsayısının karesine eşittir.

Bağımlı ve bağımsız değişkenlerin korelasyon katsayısının karesi, bağımsız değişkenin etkisi nedeniyle bağımlı değişkenin varyansının oranını temsil eder ve denir. belirleme katsayısı . Belirleme katsayısı, bu nedenle, bir değişkenin değişkenliğinin, başka bir değişkenin etkisiyle ne ölçüde bağlı olduğunu (belirlendiğini) gösterir.

Belirleme katsayısının korelasyon katsayısına göre önemli bir avantajı vardır. korelasyon değil doğrusal fonksiyon iki değişken arasındaki ilişki. Bu nedenle, birkaç örnek için korelasyon katsayılarının aritmetik ortalaması, bu örneklerden tüm denekler için hemen hesaplanan korelasyon ile çakışmaz (yani, korelasyon katsayısı toplamsal değildir). Aksine, belirleme katsayısı ilişkiyi doğrusal olarak yansıtır ve bu nedenle toplamsaldır: birkaç örnek üzerinden ortalaması alınabilir.

Bağlantının gücü hakkında ek bilgi, korelasyon katsayısının karesinin değeri ile verilir - belirleme katsayısı: bu, bir değişkenin varyansının başka bir değişkenin etkisiyle açıklanabilen kısmıdır. Korelasyon katsayısının aksine, belirleme katsayısı bağlantının gücündeki artışla doğrusal olarak artar.

Spearman ve τ-Kendall korelasyon katsayıları (sıra korelasyonları). Arasındaki ilişkinin incelendiği her iki değişken de sıralı bir ölçekte sunuluyorsa veya bunlardan biri sıralı ölçekte ve diğeri metrik ölçekte ise, sıra korelasyon katsayıları uygulanır: Mızraklı veya τ - Kendella . ve o , ve diğer katsayı, uygulaması için her iki değişkenin de önceden sıralanmasını gerektirir. .

Spearman's rank korelasyon katsayısı - bu parametrik olmayan bir yöntemdir , fenomenler arasındaki ilişkinin istatistiksel olarak incelenmesi amacıyla kullanılan . Bu durumda, incelenen özelliklerin iki nicel serisi arasındaki gerçek paralellik derecesi belirlenir ve kurulan ilişkinin sıkılığı, nicel olarak ifade edilen bir katsayı kullanılarak tahmin edilir.

Bir grubun üyeleri önce x değişkeni ve ardından y değişkeni tarafından sıralanırsa, x ve y değişkenleri arasındaki korelasyon, iki sıra serisi için Pearson katsayısının hesaplanmasıyla elde edilebilir. Her iki değişken için de sıralarda bağlantı olmadığı (yani tekrarlanan sıralar olmadığı) varsayarsak, Pearson formülü sayısal olarak büyük ölçüde basitleştirilebilir ve olarak bilinen formüle dönüştürülebilir. Mızrakçı .

Spearman sıra korelasyon katsayısının gücü, parametrik korelasyon katsayısının gücünden biraz daha düşüktür..

Az sayıda gözlemin varlığında sıra korelasyon katsayısının kullanılması tavsiye edilir. . Bu method nicel verilerden daha fazlası için kullanılabilir , ama aynı zamanda durumlarda , kaydedilen değerler değişen yoğunluktaki tanımlayıcı özelliklerle belirlendiğinde .

Karşılaştırılan değişkenlerin biri veya her ikisi için çok sayıda aynı sıraya sahip Spearman'ın sıra korelasyon katsayısı kabalaştırılmış değerler verir. İdeal olarak, her iki bağıntılı seri, eşleşmeyen değerlerin iki dizisi olmalıdır.

Sıralamalar için Spearman korelasyonuna bir alternatif, korelasyondur. τ-kendall . M. Kendall tarafından önerilen korelasyon, bağlantının yönünün özneler çiftler halinde karşılaştırılarak yargılanabileceği fikrine dayanmaktadır: eğer bir özne çiftinde x'de bir değişiklik varsa ve bu yön y'deki bir değişiklikle çakışıyorsa, o zaman bu eşleşmiyorsa olumlu bir ilişkiyi gösterir - olumsuz bir ilişki hakkında bir şey.

Korelasyon katsayıları, sayısal ölçeklerde ölçülen iki özellik arasındaki ilişkinin gücünü ve yönünü sayısal olarak belirlemek için özel olarak tasarlanmıştır.(metrik veya derece).

Daha önce de belirtildiği gibi, Korelasyon değerleri +1 (kesin doğrudan veya doğrudan orantılı ilişki) ve -1 (kesin ters veya ters orantılı ilişki) ilişkinin maksimum gücüne karşılık gelir, sıfıra eşit korelasyon, ilişkinin yokluğuna karşılık gelir.

Bağlantının gücü hakkında ek bilgi, belirleme katsayısının değeri ile sağlanır: bir değişkenin varyansının başka bir değişkenin etkisiyle açıklanabilen kısmıdır.

Konu 12 Korelasyon analizi

İşlevsel bağımlılık ve korelasyon. VI yüzyılda Hipokrat bile. M.Ö e. insanların fiziği ile mizaçları, vücut yapısı ile bazı hastalıklara yatkınlık arasında bir bağlantının varlığına dikkat çekti. Bu tür bir bağlantının belirli türleri de hayvanda tanımlanmıştır ve bitki örtüsü. Yani çiftlik hayvanlarında fizik ve verimlilik arasında bir ilişki vardır; tohum kalitesi ve mahsul verimi arasındaki ilişki bilinmektedir, vb. Ekolojideki bu tür bağımlılıklara gelince, topraktaki ve kar örtüsündeki ağır metallerin içeriği arasında, topraktaki konsantrasyonlarına bağımlılıklar vardır. atmosferik hava vb. Bu nedenle, bu düzenliliği insanın çıkarları için kullanmaya, ona az çok kesin bir nicel ifade vermeye çalışmak doğaldır.

Bildiğiniz gibi, değişkenler arasındaki ilişkileri tanımlamak için kullanıyoruz matematiksel kavram fonksiyonlar f bağımsız değişkenin her bir belirli değerine atanan x bağımlı değişkenin belirli bir değeri y, yani . Değişkenler arasındaki bu tür belirsiz ilişki x ve y aranan işlevsel. Ancak, bu tür ilişkiler her zaman doğal nesnelerde bulunmaz. Bu nedenle, biyolojik ve ekolojik özellikler arasındaki ilişki işlevsel değil, doğada istatistikseldir, homojen bireylerin kütlesinde, argüman olarak kabul edilen bir özelliğin belirli bir değeri aynı sayısal değere değil, tüm bir gamına karşılık gelir. bağımlı değişken veya fonksiyon olarak kabul edilen başka bir özelliğin değişkenlik serisi değerlerine dağılmış sayısal değerler. Değişkenler arasındaki bu tür ilişkiye denir. korelasyon veya korelasyon..

Fonksiyonel ilişkilerin tek ve grup nesnelerinde saptanması ve ölçülmesi kolaydır, ancak bu, yalnızca yöntemler kullanılarak grup nesneleri üzerinde çalışılabilen korelasyonlarla yapılamaz. matematiksel istatistik. Özellikler arasındaki korelasyon ilişkisi doğrusal ve doğrusal olmayan, pozitif ve negatif olabilir. Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü ve biçimini oluşturmaya, sıkılığını ölçmeye ve son olarak, örnek korelasyon göstergelerinin güvenilirliğini doğrulamaya indirgenir.

Değişkenler arasındaki bağımlılık X ve Y analitik olarak (formüller ve denklemler kullanılarak) ve grafik olarak (dikdörtgen koordinat sistemindeki noktaların yeri olarak) ifade edilebilir. Korelasyon grafiği, veya olarak adlandırılan fonksiyonun denklemine göre oluşturulur. gerileme. Burada ve şu koşul altında bulunan aritmetik araçlardır: X veya Y bazı değerler alacak x veya y. Bu ortalamalar denir koşullu.

11.1. İletişimin parametrik göstergeleri

Korelasyon katsayısı. Değişkenler arasında eşlenik x ve y birinin sayısal değerleri diğerinin karşılık gelen değerleri ile karşılaştırılarak kurulabilir. Bir değişkendeki artış diğerini artırıyorsa, bu pozitif bağlantı bu değerler arasında ve bunun tersi, bir değişkendeki artışa diğerinin değerinde bir azalma eşlik ettiğinde, bu, negatif bağlantı.

İlişkiyi, yönünü ve değişkenlerin konjugasyon derecesini karakterize etmek için aşağıdaki göstergeler kullanılır:

    doğrusal bağımlılık - korelasyon katsayısı;

    doğrusal olmayan - korelasyon oranı.

Ampirik korelasyon katsayısını belirlemek için aşağıdaki formül kullanılır:

. (1)

Burada s x ve s y standart sapmalardır.

Korelasyon katsayısı, aşağıdaki benzer formül kullanılarak, hesaplama işini basitleştiren standart sapmaların hesaplanmasına başvurmadan hesaplanabilir:

. (2)

Korelasyon katsayısı –1 ile +1 arasında değişen boyutsuz bir sayıdır. İşaretlerin bağımsız varyasyonu ile, aralarındaki bağlantı tamamen olmadığında, . Özellikler arasındaki olasılık ne kadar güçlü olursa, korelasyon katsayısının değeri o kadar yüksek olur. Sonuç olarak, bu göstergede sadece varlığı değil, aynı zamanda işaretler arasındaki konjugasyonun derecesini de karakterize eder. Pozitif veya doğrudan bir ilişki ile, bir özelliğin büyük değerleri diğerinin büyük değerlerine karşılık geldiğinde, korelasyon katsayısı pozitif bir işarete sahiptir ve büyük değerler olduğunda negatif veya geri besleme ilişkisi ile 0 ile +1 arasında değişir. bir özelliğin diğerinin daha küçük değerlerine karşılık gelmesi, korelasyon katsayısına negatif bir işaret eşlik eder ve 0 ile -1 arasında değişir.

Korelasyon katsayısı pratikte geniş bir uygulama bulmuştur, ancak yalnızca doğrusal ilişkileri, yani. doğrusal bir regresyon denklemi ile ifade edilir (bkz. konu 12). Varsa, değil doğrusal bağımlılık değişen işaretler arasında, aşağıda tartışılan bağlantının diğer göstergeleri kullanılır.

Korelasyon katsayısının hesaplanması. Bu hesaplama, gözlem sayısına (örnek büyüklüğü) bağlı olarak farklı şekillerde ve farklı şekillerde yapılır. Küçük örneklerin ve büyük örneklerin varlığında korelasyon katsayısını hesaplamanın özelliklerini ayrı ayrı ele alalım.

Küçük örnekler. Küçük numunelerin varlığında, korelasyon katsayısı, numune verilerinin varyasyon serilerine ön gruplandırılmasına gerek kalmadan doğrudan eşlenik özelliklerin değerlerinden hesaplanır. Bunun için yukarıdaki (1) ve (2) formülleri kullanılır. Özellikle varyantın sapmalarını ifade eden çok basamaklı ve kesirli sayıların varlığında daha uygun X i ve y i ortalamalardan ve aşağıdaki çalışma formülleri hizmet eder:

nerede ;

;

Burada x i ve y i– eşlenik özelliklerin eşleştirilmiş varyantları x ve y; ve aritmetik ortalamalardır; - eşlenik özelliklerin eşleştirilmiş varyantları arasındaki fark x ve y; ntoplam sayısı eşleştirilmiş gözlemler veya örneklem büyüklüğü.

Ampirik korelasyon katsayısı, diğer herhangi bir örnek gösterge gibi, onun tahmini olarak hizmet eder. genel parametre ρ ve rastgele değere bir hatanın nasıl eşlik ettiği:

Örnek korelasyon katsayısının hatasına oranı, sıfır hipotezini test etmek için bir kriter olarak hizmet eder - nüfus bu parametre sıfıra eşittir, yani. . Boş hipotez, kabul edilen anlamlılık düzeyinde reddedilir. α , eğer

değerler kritik noktalar t Aziz farklı önem seviyeleri için α ve serbestlik derecesi sayıları Ek Tablo 1'de verilmiştir.

Küçük numuneler işlenirken (özellikle n< 30 ) korelasyon katsayısının formül (1) - (3) ile hesaplanması, genel parametrenin biraz hafife alınmış tahminlerini verir ρ , yani aşağıdaki değişikliğin yapılması gerekmektedir:

Fisher z-dönüşümü. Doğru Uygulama korelasyon katsayısı, rastgele değişkenlerin iki boyutlu eşlenik değerlerinin normal dağılımını varsayar x ve y. Matematiksel istatistiklerden, değişkenler arasında anlamlı bir korelasyon varsa, yani. ne zaman R xy > 0,5 için korelasyon katsayısının örnek dağılımı daha fazla normal olarak dağılmış bir popülasyondan alınan küçük numuneler, normal eğriden önemli ölçüde sapar.

Bu durum göz önüne alındığında, R. Balıkçıörnek korelasyon katsayısının değeriyle genel parametreyi tahmin etmenin daha doğru bir yolunu buldu. Bu yöntem yerine R xy ampirik korelasyon katsayısı ile ilgili dönüştürülmüş z değeri aşağıdaki gibidir:

z değerinin dağılımı, örneklem büyüklüğüne ve genel popülasyondaki korelasyon katsayısının değerine fazla bağlı olmadığından ve normal bir dağılıma yaklaştığından şekil olarak hemen hemen değişmez.

z göstergesinin güvenilirliği için kriter aşağıdaki orandır:

Boş hipotez, kabul edilen anlamlılık düzeyinde reddedilir. α ve serbestlik derecesi sayısı. Kritik nokta değerleri t Aziz Uygulamalar Tablo 1'de verilmiştir.

Başvuru z-dönüşümleriörnek korelasyon katsayısının istatistiksel öneminin yanı sıra gerektiğinde ampirik katsayılar arasındaki farkı değerlendirmede daha fazla güven sağlar.

Korelasyon katsayısının doğru bir tahmini için minimum örnek boyutu. Sıfır hipotezini çürütmek için yeterli olacak belirli bir korelasyon katsayısı değeri için örneklem boyutunu hesaplamak mümkündür (özellikler arasındaki korelasyon Y ve X gerçekten var). Bunun için aşağıdaki formül kullanılır:

nerede n istenen örnek boyutudur; t kabul edilen anlamlılık düzeyine göre belirtilen değerdir (α = %1 için daha iyi); z dönüştürülmüş ampirik korelasyon katsayısıdır.

Büyük örnekler. Çok sayıda başlangıç ​​verisinin varlığında, bunların varyasyon serileri halinde gruplandırılması gerekir ve bir korelasyon kafesi oluşturduktan sonra, hücrelerindeki (hücrelerindeki) fark, eşlenik serilerin toplam frekanslarıdır. Korelasyon kafesi, sayıları ilişkili serilerin grup veya sınıflarının sayısına eşit olan satır ve sütunların kesişmesinden oluşur. Sınıflar, korelasyon tablosunun en üst satırında ve ilk (sol) sütununda ve sembolü ile gösterilen ortak frekanslarda bulunur. f xy, – korelasyon tablosunun ana parçası olan korelasyon ızgarasının hücrelerinde.

Tablonun en üst satırına yerleştirilen sınıflar, genellikle artan sırada soldan sağa ve tablonun ilk sütununda - yukarıdan aşağıya azalan sırayla düzenlenir. Böyle bir varyasyon serisi sınıfları düzenlemesiyle, ortak frekansları (işaretler arasında pozitif bir ilişkinin varlığında) Y ve X) ızgara hücreleri üzerinde ızgaranın sol alt köşesinden sağ üst köşesine çapraz olarak veya (özellikler arasında olumsuz bir ilişki varsa) sol üst köşeden köşeye doğru bir elips şeklinde dağıtılacaktır. ızgaranın sağ alt köşesi. frekanslar ise f xy korelasyon ızgarasının hücreleri üzerinde bir elips oluşturmadan aşağı yukarı eşit olarak dağıtılırsa, bu işaretler arasında bir korelasyon olmadığını gösterecektir.

Frekans tahsisi f xy korelasyon kafesinin hücreleri tarafından sadece verir Genel fikirözellikler arasında bir ilişkinin varlığı veya yokluğu hakkında. Sıkılığı veya daha az kesinliği yalnızca anlam ve işarete göre yargılayın korelasyon katsayısı. Örnek verilerin bir ön gruplandırmasından aralık varyasyon serilerine korelasyon katsayısı hesaplanırken, çok geniş sınıf aralıkları alınmamalıdır. Kaba gruplama, korelasyon katsayısının değeri üzerinde, ortalamaları ve varyasyon göstergelerini hesaplarken olduğundan çok daha güçlü bir etkiye sahiptir.

Sınıf aralığının değerinin formül tarafından belirlendiğini hatırlayın.

nerede x maksimum , x dk- popülasyonun maksimum ve minimum değişkenleri; İleözellik varyasyonunun bölünmesi gereken sınıfların sayısıdır. Deneyimler, korelasyon analizi alanında, değerin İleörneklem büyüklüğüne bağlı olarak yaklaşık olarak aşağıdaki gibi konulabilir (Tablo 1).

tablo 1

Örnek boyut

K değeri

50 ≥ n > 30

100 ≥ n > 50

200 ≥ n > 100

300 ≥ n > 200

İlk verilerin varyasyon serileri halinde bir ön gruplandırılmasıyla hesaplanan diğer istatistiksel özellikler gibi, korelasyon katsayısı da tamamen aynı sonuçları vererek farklı şekillerde belirlenir.

Çalışma şekli. Korelasyon katsayısı, temel formüller (1) veya (2) kullanılarak hesaplanabilir ve bunları dimer popülasyonundaki varyantın tekrarlanabilirliği için düzeltir. Aynı zamanda, sembolizmi basitleştirerek, varyantların ortalamalarından sapmaları ile gösterilecektir. a, yani ve . Daha sonra formül (2), sapmaların sıklığını dikkate alarak aşağıdaki ifadeyi alacaktır:

Bu göstergenin güvenilirliği, örnek korelasyon katsayısının formülle belirlenen hatasına oranını temsil eden Öğrenci testi kullanılarak değerlendirilir.

Dolayısıyla ve bu değer aşılırsa standart değer Serbestlik derecesi ve anlamlılık düzeyi α için öğrenci testi t st (Ek Tablo 2'ye bakın), ardından sıfır hipotezi reddetmek.

Koşullu ortalamalar yöntemi. Sapma korelasyon katsayısını hesaplarken, varyant (“sınıflar”) sadece aritmetik ortalamalardan ve 'den değil, aynı zamanda koşullu ortalamalardan da bulunabilir A x ve A y . Bu yöntemle formül (2)'nin payı değiştirilir ve formül aşağıdaki şekli alır:

nerede f xy bir ve diğer dağıtım serilerinin sınıflarının frekanslarıdır; ve , yani sınıf aralıklarının büyüklüğüne bağlı olarak sınıfların koşullu ortalamalardan sapmaları λ ; n eşleştirilmiş gözlemlerin toplam sayısı veya örneklem büyüklüğüdür; ve birinci derecenin koşullu anlarıdır, burada f x– seri frekanslar X, a f y– seri frekanslar Y; s x ve s y serinin standart sapmalarıdır X ve Y, formülü ile hesaplanır .

Koşullu ortalamalar yöntemi, ürünler yöntemine göre bir avantaja sahiptir, çünkü kesirli sayılarla işlemlerden kaçınmanıza ve sapmalara aynı (pozitif) işareti vermenize olanak tanır. a x ve a yözellikle çok basamaklı sayıların varlığında, hesaplamalı çalışma tekniğini basitleştiren .

Korelasyon katsayıları arasındaki farkı tahmin etme. İki bağımsız örneğin korelasyon katsayılarını karşılaştırırken, boş hipotez, genel popülasyonda bu göstergeler arasındaki farkın sıfır olduğu varsayımına indirgenir. Başka bir deyişle, karşılaştırılan ampirik korelasyon katsayıları arasında gözlenen farkın tesadüfen ortaya çıktığı varsayımından hareket edilmelidir.

Sıfır hipotezini test etmek için Student t-testi kullanılır, yani. ampirik korelasyon katsayıları arasındaki fark oranı R 1 ve R 2 aşağıdaki formülle belirlenen istatistiksel hatasına:

nerede s R1 ve s R2 karşılaştırılan korelasyon katsayılarının hatalarıdır.

Kabul edilen anlamlılık düzeyi için boş hipotez reddedilir. α ve serbestlik derecesi sayısı.

Korelasyon katsayısının güvenilirliğinin daha doğru bir değerlendirmesinin çevrilerek elde edildiği bilinmektedir. R xy sayıca z. Örnek korelasyon katsayıları arasındaki farkın değerlendirilmesi bir istisna değildir. R 1 ve R 2 , özellikle ikincisinin nispeten küçük boyutlu numuneler üzerinde hesaplandığı durumlarda ( n< 100 ) ve mutlak değerlerinde 0,50'yi önemli ölçüde aşar.

Fark, formülle hesaplanan hatasına göre bu farkla ilgili olarak oluşturulan Student t-testi kullanılarak tahmin edilir.

Boş hipotez, kabul edilen anlamlılık düzeyi α ise reddedilir.

korelasyon ilişkisi. Değişkenler arasındaki doğrusal olmayan ilişkileri ölçmek için x ve y adlı bir gösterge kullanın korelasyon ilişkisi, ilişkiyi çift yönlü olarak açıklar. Bir korelasyon ilişkisinin inşası, iki tür varyasyonun karşılaştırmasını içerir: kısmi araçlarla ilgili olarak bireysel gözlemlerin değişkenliği ve genel ortalamaya kıyasla kısmi araçların kendilerinin değişimi. Birinci bileşenin parçası ikinciye göre ne kadar küçükse, bağlantının yakınlığı o kadar büyük olacaktır. Sınırda, kısmi ortalamalara yakın özniteliğin bireysel değerlerinde herhangi bir değişiklik gözlemlenmediğinde, bağlantının sıkılığı son derece büyük olacaktır. Benzer şekilde, kısmi araçlarda değişkenliğin yokluğunda, ilişkinin sıkılığı minimum olacaktır. Bu değişkenlik oranı, iki özelliğin her biri için dikkate alınabileceğinden, ilişkinin sıkılığının iki göstergesi elde edilir - h yx ve h xy. Korelasyon oranı göreceli bir değerdir ve 0'dan 1'e kadar değerler alabilir. Bu durumda korelasyon oranının katsayıları genellikle birbirine eşit değildir, yani. . Bu göstergeler arasındaki eşitlik, ancak özellikler arasında kesinlikle doğrusal bir ilişki ile mümkündür. Korelasyon oranı evrensel bir göstergedir: hem doğrusal hem de doğrusal olmayan herhangi bir korelasyon biçimini karakterize etmenize olanak tanır.

korelasyon katsayıları h yx ve h xy yukarıda tartışılan yöntemlerle belirlenir, yani. ürünler yöntemi ve koşullu ortalamalar yöntemi.

Çalışma şekli. korelasyon katsayıları h yx ve h xy aşağıdaki formüllerle belirlenir:

grup varyansları nerede ve nerede,

ve ve ortak varyanslardır.

Burada ve ortak aritmetik ortalamalardır ve grup aritmetik ortalamalarıdır; f yi– seri frekanslar Y, a f xi– seri frekanslar X; k- sınıf sayısı; n değişken özelliklerin sayısıdır.

Korelasyon oranının katsayılarını hesaplamak için çalışma formülleri aşağıdaki gibidir:

Koşullu ortalamalar yöntemi. Formüllere (15) göre korelasyon ilişkisinin katsayılarının belirlenmesi, sınıf varyantının sapmaları x i ve y i sadece aritmetik ortalamalardan ve 'den değil, aynı zamanda Аx ve A y koşullu ortalamalarından da alınabilir. Bu gibi durumlarda, grup ve toplam sapmalar ve formülleri kullanılarak hesaplanır ve , ve ayrıca ve , nerede ve .

Genişletilmiş biçimde, formüller (15) aşağıdaki gibi görünür:

;

. (17)

Bu formüllerde ve sınıfların koşullu ortalamalardan sapmaları, sınıf aralıklarının değeriyle azaltılır; değerler a y ve a x doğal sayılarla ifade edilir: 0, 1, 2, 3, 4, .... Sembollerin geri kalanı yukarıda açıklanmıştır.

Ürün yöntemini koşullu ortalama yöntemiyle karşılaştırırken, özellikle çok basamaklı sayılarla uğraşmak zorunda olduğunuz durumlarda, ilk yöntemin avantajını fark etmekte başarısız olamazsınız. Diğer örnek göstergeler gibi, korelasyon oranı da genel parametresinin bir tahminidir ve rastgele bir değer olarak formül tarafından belirlenen bir hata eşlik eder.

Korelasyon ilişkisinin tahmininin güvenilirliği Student t-testi ile kontrol edilebilir. H 0 -hipotezi, genel parametrenin sıfıra eşit olduğu varsayımından hareket eder, yani. aşağıdaki koşul sağlanmalıdır:

serbestlik derecesi sayısı ve önem düzeyi α için.

belirleme katsayısı. Korelasyonun yakınlığının göstergeleri tarafından alınan değerleri yorumlamak için, belirleme katsayıları bir özelliğin varyasyonunun ne kadarının başka bir özelliğin varyasyonuna bağlı olduğunu gösteren . Doğrusal bir ilişkinin varlığında, belirleme katsayısı, R2 xy korelasyon katsayısının karesidir ve özellikler arasında doğrusal olmayan bir ilişki olması durumunda y ve x h2 yx korelasyon oranının karesidir. Belirleme katsayıları, işaretler arasındaki ilişkinin yakınlığını yargılamayı mümkün kılan aşağıdaki yaklaşık ölçeği oluşturmak için zemin sağlar: ilişki ortalama olarak kabul edildiğinde; zayıf bir bağlantıyı gösterir ve yalnızca güçlü bir bağlantıya karar vermek mümkün olduğunda, özelliğin varyasyonunun yaklaşık %50'si olduğunda Yözellik varyasyonuna bağlıdır X.

İletişim Formu Değerlendirmesi. Değişkenler arasında kesinlikle doğrusal bir ilişki ile y ve x eşitlik sağlanır. Bu gibi durumlarda, korelasyon oranının katsayıları, korelasyon katsayısının değeri ile çakışmaktadır. Bu durumda, belirleme katsayıları da değerleriyle çakışacaktır, yani. . Bu nedenle, bu değerler arasındaki farkla, değişkenler arasındaki korelasyon bağımlılığının biçimi yargılanabilir. y ve x:

Açıkçası, değişkenler arasında doğrusal bir ilişki ile y ve xγ üssü sıfıra eşit olacaktır; değişkenler arasındaki ilişki ise y ve x doğrusal olmayan, γ > 0.

γ göstergesi genel parametrenin bir tahminidir ve rastgele bir değer olarak doğrulanması gerekir. Bu durumda, miktarlar arasındaki ilişkinin olduğu varsayımından hareket ediyoruz. y ve x doğrusal (boş hipotez). Fisher'ın F-kriteri bu hipotezi test etmenizi sağlar:

nerede a- varyasyon serisinin gruplarının veya sınıflarının sayısı; N örnek boyutudur. (Ek Tablo 2'de yatay olarak bulun), (aynı tablonun ilk sütununda bulun) ve kabul edilen anlamlılık düzeyi α ise boş hipotez reddedilir.

Bir Korelasyonun Öneminin Belirlenmesi

Korelasyon katsayılarının sınıflandırılması

Korelasyon katsayıları, güç ve önem ile karakterize edilir.

Korelasyon katsayılarının kuvvete göre sınıflandırılması.

Korelasyon katsayılarının önem derecesine göre sınıflandırılması.

Bu 2 sınıflandırma, farklı özellikler tanımladıkları için karıştırılmamalıdır. Güçlü bir korelasyon rastgele ve bu nedenle güvenilmez olabilir. Bu özellikle küçük numune boyutları için geçerlidir. Ve büyük bir örneklemde, zayıf bir korelasyon bile oldukça anlamlı olabilir.

Korelasyon katsayısını hesapladıktan sonra istatistiksel hipotezler ortaya koymak gerekir:

H 0: Korelasyon indeksi sıfırdan önemli ölçüde farklı değil (rastgele).

H 1: korelasyon göstergesi sıfırdan önemli ölçüde farklıdır (rastgele değildir).

Hipotez testi, elde edilen ampirik katsayılar ile tablolaştırılmış kritik değerler karşılaştırılarak gerçekleştirilir. Ampirik değer kritik değere ulaşır veya onu aşarsa, boş hipotez reddedilir: r emp ≥ r cr Ho, Þ H 1 . Bu gibi durumlarda anlamlı bir farkın bulunduğu sonucuna varılır.

Ampirik değer kritik değeri aşmazsa, boş hipotez reddedilmez: r emp< r кр Þ Н 0 . В таких случаях делают вывод, что достоверность различий не установлена.

/ İstatistikler / Korelasyon

Çift katsayı matrisinin hesaplanması

korelasyonlar

Eşleştirilmiş korelasyon katsayılarının matrisini hesaplamak için menüyü arayın korelasyon matrisleri modül Temel bilgilerveri istatistikleri.

Pirinç. 1 Ana istatistik modülü paneli

Örnek verileri kullanarak STATISTICA sistemindeki korelasyon analizinin ana aşamalarını ele alacağız (bkz. Şekil 2). İlk veriler, sektörlerden birinde 23 işletmenin faaliyetlerine ilişkin gözlemlerin sonuçlarıdır.

Şekil.2 İlk veriler

Tablonun sütunları aşağıdaki göstergeleri içerir:

KİRALAMA - karlılık,%;

KÖLELERİ PAYLAŞ - spesifik yer çekimi PPP'deki işçiler, birimler;

FUNDOOTD - varlıkların getirisi, birimler;

SERMAYE FONU - sabit üretim varlıklarının yıllık ortalama değeri, milyon ruble;

NEPRRASH - üretim dışı giderler, bin ruble. Kârlılığın diğerlerine bağımlılığının araştırılması gerekmektedir.

diğer göstergeler.

Genel popülasyonda dikkate alınan işaretlerin tabi olduğunu varsayalım. normal hukuk dağılımlar ve gözlemsel veriler popülasyondan bir örnektir.

Tüm değişkenler arasındaki ikili korelasyon katsayılarını hesaplayalım. Bir satır seçtikten sonra korelasyon matrisleri ekranda bir iletişim kutusu belirecektir. Pearson korelasyonları. Adı, bu katsayının ilk kez Pearson, Edgeworth ve Weldon olduğu gerçeğinden kaynaklanmaktadır.

Analiz için değişkenleri seçelim. Bunun için iletişim kutusunda iki düğme vardır: Meydan matris(bir liste) ve dikdörtgen matris(iki liste).


Pirinç. 3 Korelasyon Analizi İletişim Kutusu

İlk düğme, normal matrisi hesaplamak için tasarlanmıştır. tüm değişken kombinasyonlarının eşleştirilmiş korelasyon katsayıları ile simetrik form. Analizde tüm göstergeler kullanılıyorsa, değişken seçimi iletişim kutusunda düğmesine tıklayabilirsiniz. Hepsini seç. (Değişkenler ardışık değilse, bir fare tıklaması ile seçilebilirler aynı anda basılan tuşla Ctrl)


Eğer düğmeye basarsan Detaylar iletişim kutusunda, her değişken için uzun adlar görüntülenecektir. Bu düğmeye tekrar tıklayarak (adını alacaktır) Kısaca), kısa isimler alıyoruz.

Buton Bilgi seçilen değişken için özelliklerini görüntüleyebileceğiniz bir pencere açar: uzun ad, görüntüleme biçimi, sıralanmış değerler listesi, tanımlayıcı istatistikler (değer sayısı, ortalama, standart sapma).

Değişkenleri seçtikten sonra OK veya düğmesine basın. korreilişki iletişim kutusu korelasyonlar Pearson. Hesaplanan korelasyon matrisi ekranda görünecektir.

Önemli korelasyon katsayıları ekranda kırmızı ile vurgulanır.

Örneğimizde, karlılık göstergesinin en çok göstergelerle ilgili olduğu ortaya çıktı. sermaye verimliliği(doğrudan bağlantı) ve üretim maliyeti(X arttıkça V'nin azaldığını gösteren geri bildirim). Fakat işaretler ne kadar yakından ilişkilidir? Modülo katsayı değerleri 0,7'den büyük ve zayıf - 0,3'ten küçük olduğunda yakın bir ilişki düşünülür. Bu nedenle, regresyon denkleminin daha ileri inşasında, en bilgilendirici olarak “Ürün getirisi” ve “Üretim dışı maliyetler” göstergeleri ile sınırlandırılmalıdır.

Ancak, örneğimizde bir fenomen var. çok renkli, bağımsız değişkenlerin kendileri arasında bir ilişki olduğunda (çift korelasyon katsayısı modülü 0,8'den büyük).

Dikdörtgen matris seçeneği (iki değişken listesi), iki değişken listesi seçmek için bir iletişim kutusu açar. Gösterildiği gibi yerleştirin


Sonuç olarak, yalnızca bağımlı değişkenle korelasyon katsayılarını içeren dikdörtgen bir korelasyon matrisi elde ederiz.


Seçenek ayarlanmışsa Düzelt Matris (önemli vurgulayın), sonra düğmeye bastıktan sonra korelasyon anlamlılık düzeyinde vurgulanan katsayılarla bir matris oluşturulacaktır R.


Seçenek seçilirse Ayrıntılı sonuç tablosu, ardından düğmesine basarak korelasyonlar, sadece korelasyon katsayılarını değil, aynı zamanda ortalamaları, standart sapmaları, regresyon denklemi katsayılarını, regresyon denkleminde serbest bir terimi ve diğer istatistikleri içeren bir tablo elde ederiz.


Değişkenler küçük göreli varyasyona sahip olduğunda (standart sapmanın 0.0000000000001'den az olması), daha yüksek bir tahmin gereklidir. Pearson Korelasyonları iletişim kutusundaki Yüksek hassasiyetli Hesaplamalar onay kutusu işaretlenerek ayarlanabilir.

Eksik verilerle çalışma modu, PD'nin satır satır silme seçeneği ile belirlenir. Seçilirse, İSTATİSTİK, boşlukları olan tüm gözlemleri yok sayar. Aksi takdirde, çiftler halinde çıkarılırlar.

Uzun değişken adlarını göster onay kutusu, uzun değişken adlarına sahip bir tabloyla sonuçlanacaktır.

Korelasyon bağımlılıklarının grafiksel gösterimi

Pearson Korelasyonu iletişim kutusu, aşağıdakileri elde etmek için bir dizi düğme içerir. grafik görüntü korelasyon bağımlılıkları.

2M dağılım grafiği seçeneği, seçilen her değişken için bir dizi dağılım grafiği oluşturur. Seçimleri için pencere Şekil 6 ile aynıdır. Solda bağımlı değişkenleri, sağda bağımsız - KİRALANABİLİR. Tamam'ı tıklatarak, geçilen regresyon çizgisini ve tahminin güven sınırlarını gösterecek bir grafik elde edeceğiz.

Doğrusal korelasyon katsayısı, koordinat sistemindeki noktaların konumu düz bir çizgiye veya uzun bir elipse benziyorsa, ancak noktalar bir eğri şeklinde yerleştirilmişse, bağlantının sıkılığının en objektif tahminini verir. korelasyon katsayısı eksik bir tahmin verir.

Grafiğe dayanarak, gözlemsel veriler eğimli bir elips şeklinde düzenlendiğinden, karlılık ve varlıkların getirisi arasındaki ilişkiyi bir kez daha doğrulayabiliriz. Bağlantının ne kadar yakın olduğu düşünülürse, noktaların elipsin ana eksenine o kadar yakın olduğu söylenmelidir.

Örneğimizde, birim başına varlıkların getiri oranındaki bir değişiklik, karlılıkta %5,7376 oranında bir değişikliğe yol açacaktır.

Üretim dışı maliyetlerin karlılık değeri üzerindeki etkisine bakalım. Bunu yapmak için benzer bir grafik oluşturacağız.

Analiz edilen veriler şekil olarak bir elipse daha az benziyor ve korelasyon katsayısı biraz daha düşük. Regresyon katsayısının bulunan değeri, üretim dışı maliyetlerde 1 bin ruble artışla karlılığın% 0,7017 azaldığını göstermektedir.

Denklem aynı anda her iki özelliği de içerdiğinde çoklu regresyon yapısının (sonraki bölümlerde tartışılan) açıklayıcı değişkenlerin etkileşimi ile açıklanan regresyon katsayılarının diğer değerlerine yol açtığı belirtilmelidir. herbiri.

Adlandırılmış düğmesini kullanırken, dağılım grafiğindeki noktalar, önceden tanımlanmışsa karşılık gelen numaralarını veya adlarını alacaktır.

Çizim göstergeli bir sonraki seçenek Matris, seçilen değişkenler için bir dağılım grafiği matrisi çizer.

Bu matrisin her bir grafik öğesi, karşılık gelen değişkenler tarafından oluşturulan korelasyon alanlarını içerir.

üzerlerine çizilen regresyon çizgisi.

Dağılım grafiği matrisini analiz ederken, regresyon çizgileri X eksenine önemli bir eğime sahip olan ve karşılık gelen işaretler arasında bir karşılıklı bağımlılığın varlığını düşündüren grafiklere dikkat edilmelidir.

3B saçılma seçeneği, seçilen değişkenler için bir 3B korelasyon alanı oluşturur. Adlandırılmış düğmesi kullanılırsa, dağılım grafiğindeki noktalar, varsa bunlara karşılık gelen gözlemlerin sayıları veya adları ile etiketlenecektir.

Yüzey grafiği seçeneği, ikinci dereceden bir yüzey ile birlikte seçilen değişken üçlüsü için bir 3M dağılım grafiği çizer.

Seçenek Kategorisi. dağılım grafikleri, sırayla, seçilen göstergeler için bir dizi korelasyon alanı oluşturur.

İlgili düğmeye bastıktan sonra, program kullanıcıdan Değişkenler düğmesi kullanılarak önceden seçilmiş olanlardan iki set oluşturmasını isteyecektir. Ardından ekranda yeni bir tane belirecektir.

mevcut tüm durumların sınıflandırılacağı bir gruplandırma değişkeni belirtmek için bir sorgu penceresi.

Sonuç, farklı listelere atanan her bir değişken çifti için gözlem grupları bağlamında korelasyon alanlarının oluşturulmasıdır.

3.4. Kısmi ve çoklu katsayıların hesaplanmasıkorelasyon elemanları

Özel ve çoklu katsayıları hesaplamak için cor. ilişki modülünü çağır Çoklu regresyon modül seçici düğmesini kullanarak. Ekranda aşağıdaki iletişim kutusu görünecektir:

bir düğmeye basmak Değişkenler, analiz için değişkenleri seçin: solda bağımlı - karlılık, ve sağda bağımsız - sermaye verimliliği ve üretim dışı giderler. Kalan değişkenler daha sonraki analizlere katılmayacak - korelasyon analizine dayalı olarak, regresyon modeli için bilgilendirici olmadığı kabul edilmektedir.

alanında Giriş dosyası girdi verileri olarak, değişkenler ve gözlemler içeren bir tablo veya bir korelasyon matrisi olan olağan başlangıç ​​verileri sunulur. Korelasyon matrisi, Çoklu Regresyon modülünün kendisinde önceden oluşturulabilir veya Hızlı Temel İstatistik seçeneği kullanılarak hesaplanabilir.

Kaynak veri dosyasıyla çalışırken, boşluklarla çalışma modunu ayarlayabilirsiniz:

    Satır satır silme. Bu seçenek seçildiğinde sadece seçilen değişkenlerin tamamında eksik değer bulunmayan durumlar analizde kullanılır.

    Ortalamanın değiştirilmesi. Her değişkendeki eksik değerler, mevcut tam gözlemlerden hesaplanan ortalama ile değiştirilir.

    Eksik verilerin ikili olarak kaldırılması. Bu seçenek seçilirse, ikili korelasyonlar hesaplanırken karşılık gelen değişken çiftlerinde eksik değerlere sahip gözlemler kaldırılır.

alanında Regresyon türü kullanıcı standart veya sabit doğrusal olmayan regresyon seçebilir. Varsayılan olarak, seçilen tüm değişkenlerin standart korelasyon matrisini hesaplayan standart çoklu regresyon analizi seçilir.

mod Sabit doğrusal olmayan regresyon bağımsız değişkenlerin çeşitli dönüşümlerini gerçekleştirmenizi sağlar. Seçenek Bir analiz yapın varsayılan olarak, bir kesme içeren standart bir regresyon çizgisinin tanımına karşılık gelen ayarları kullanır. Bu seçeneğin seçimi kaldırılırsa, başlatma panelinin Tamam düğmesine tıklamak, hem regresyon analizi türünü (örneğin, adım adım, sırt, vb.) hem de diğer seçenekleri seçebileceğiniz Model Tanımı iletişim kutusunu açar.

Seçenek satırının onay kutusunu işaretleyerek Açıklayıcı açıklayıcıyı göster, doğru. matrisler ve Tamam'ı tıklatarak, verilerin istatistiksel özelliklerini içeren bir iletişim kutusu alırız.

İçinde ayrıntılı tanımlayıcı istatistikleri görüntüleyebilirsiniz (her bir değişken çifti için korelasyon katsayısının hesaplandığı gözlem sayısı dahil). Analize devam etmek için Tamam'a tıklayın ve Model Tanımlayıcılar iletişim kutusunu açın.

Analiz edilen göstergeler, toplam varyansın ortalamaya bölünmesiyle hesaplanan çok küçük bir göreli varyansa sahipse, seçeneğin yanındaki kutuyu işaretlemeniz gerekir. Yüksek Hassasiyetli Hesaplamalar korelasyon matrisinin elemanlarının daha doğru değerlerini elde etmek.

İletişim kutusunda gerekli tüm parametreleri ayarlayarak Çoklu regresyon, Tamam'a basın ve gerekli hesaplamaların sonuçlarını alın.

Örneğimize göre, çoklu korelasyon katsayısı 0.61357990 ve buna göre belirleme katsayısı - 0.37648029 olarak ortaya çıktı. Böylece, "karlılık" göstergesinin dağılımının sadece %37,6'sı "sermaye verimliliği" ve "üretim dışı maliyetler" göstergelerindeki değişim ile açıklanmaktadır. Bu kadar düşük bir değer, modele yetersiz sayıda faktörün dahil edildiğini gösterir. Listeye "Sabit kıymetler" değişkenini ekleyerek bağımsız değişkenlerin sayısını değiştirmeye çalışalım (modele "İşçilerin KÖİ'deki payı" göstergesinin eklenmesi, kabul edilemez olan çok ortaklılığa yol açmaktadır). Belirleme katsayısı biraz arttı, ancak sonuçları önemli ölçüde iyileştirmek için yeterli değil - değeri yaklaşık %41 idi. Açıkçası, kulübemiz karlılığı etkileyen faktörleri belirlemek için ek araştırma gerektiriyor.

Çoklu korelasyon katsayısının önemi Fisher F-ölçüt tablosuna göre hesaplanır. Sapma olasılığı değeri belirli bir düzeyi aşarsa, anlamlılığının hipotezi reddedilir (çoğunlukla a = 0.1, 0.05; 0.01 0.001 alınır). Örneğimizde p=0.008882< 0.05, что свидетельствует о значимости коэффициента.

Sonuç tablosu aşağıdaki sütunları içerir:

    Beta katsayısı (in)- karşılık gelen değişken için standartlaştırılmış regresyon katsayısı;

    Kısmi Korelasyon- modele dahil edilen geri kalanının etkisini sabitlerken, karşılık gelen değişken ile bağımlı olan arasındaki kısmi korelasyon katsayıları.

Örneğimizde karlılık ve sermaye verimliliği arasındaki kısmi korelasyon katsayısı 0.459899'dur. Bu, modele girdikten sonra, üretken olmayan ırk-ev göstergesinin, sermaye verimliliğinin karlılık üzerindeki etkisinin bir şekilde azaldığı anlamına gelir - 0,49'dan (çift korelasyon katsayısının değeri) 0,46'ya. Üretilmeyen giderlerin göstergesi için benzer bir katsayı da azaldı - 0,46'dan (çift korelasyon katsayısının değeri) 0,42'ye (değer modül tarafından alınır), girdikten sonra bağımlı değişkenle ilişkideki değişikliği karakterize eder. sermaye verimliliği göstergesi modele dahil edilmiştir.

    Yarı kısmi korelasyon, modele dahil edilen diğerlerinin etkisi dikkate alınarak, düzeltilmemiş bağımlı değişken ile karşılık gelen bağımlı olmayan değişken arasındaki korelasyondur.

    Tolerans (1 eksi regresyon denklemindeki ilgili değişken ve tüm bağımsız değişkenler arasındaki çoklu korelasyonun karesi olarak tanımlanır).

    Belirleme katsayısı, karşılık gelen bağımsız değişken ile regresyon denkleminde yer alan diğer tüm değişkenler arasındaki çoklu korelasyon katsayısının karesidir.

    1-değerler - Kısmi korelasyon katsayısının belirtilen (parantez içinde) serbestlik derecesi sayısı ile önemi hakkındaki hipotezi test etmek için Student t testinin hesaplanan değeri.

    p-seviyesi! - kısmi korelasyon katsayısının önemi hakkındaki hipotezi reddetme olasılığı.

Bizim durumumuzda birinci katsayı (0.031277) için elde edilen p değeri seçilen =0.05'ten küçüktür. İkinci katsayının değeri onu biraz aşıyor (0.050676), bu da bu düzeyde önemsizliğini gösteriyor. Ancak, örneğin,  = 0.1 olduğunda önemlidir (yüzden on durumda, hipotez yine de yanlış olacaktır).

Burada x y , x , y örneklerin ortalama değerleridir; σ(x), σ(y) - standart sapmalar.
Ayrıca, Pearson'ın doğrusal çift korelasyon katsayısı b regresyon katsayısı ile belirlenebilir: burada σ(x)=S(x), σ(y)=S(y) standart sapmalardır, b regresyon denkleminde x'in önündeki katsayıdır y=a+ bx.

Diğer formül seçenekleri:
veya

K xy - korelasyon momenti (kovaryans katsayısı)

Doğrusal Pearson korelasyon katsayısını bulmak için, x ve y örnek ortalamalarını ve bunların standart sapmalarını σ x = S(x), σ y = S(y) bulmak gerekir:

Doğrusal korelasyon katsayısı, bir bağlantının varlığını gösterir ve -1 ile +1 arasında değerler alır (Chaddock ölçeğine bakın). Örneğin, iki değişken arasındaki doğrusal bir korelasyonun sıkılığı analiz edilirken, -1'e eşit bir çift doğrusal korelasyon katsayısı elde edildi. Bu, değişkenler arasında tam bir ters doğrusal ilişki olduğu anlamına gelir.

Korelasyon katsayısının değerini verilen örnek araçları kullanarak veya doğrudan hesaplayabilirsiniz.

Xy#x #y #σ x #σ y " data-id="a;b;c;d;e" data-formul="(a-b*c)/(d*e)" data-r="r xy "> Değerinizi hesaplayın

Korelasyon katsayısının geometrik anlamı: r xy, iki regresyon doğrusu: y(x) ve x(y)'nin eğiminin ne kadar farklı olduğunu, x ve y'deki sapmaları minimize etmenin sonuçlarının ne kadar farklı olduğunu gösterir. Çizgiler arasındaki açı ne kadar büyük olursa, r xy o kadar büyük olur.
Korelasyon katsayısının işareti, regresyon katsayısının işaretiyle çakışır ve regresyon doğrusunun eğimini belirler, yani. genel bağımlılık yönü (artış veya azalma). Korelasyon katsayısının mutlak değeri, noktaların regresyon doğrusuna yakınlık derecesine göre belirlenir.

Korelasyon katsayısının özellikleri

  1. |r xy | ≤ 1;
  2. X ve Y bağımsız ise, o zaman r xy =0, bunun tersi her zaman doğru değildir;
  3. |r xy |=1 ise, o zaman Y=aX+b, |r xy (X,aX+b)|=1, burada a ve b sabittir ve ≠ 0;
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, burada a 1 , a 2 , b 1 , b 2 sabitlerdir.

Bu nedenle, bağlantı yönü kontrolleri Pearson korelasyon katsayısı kullanılarak bir hipotez testi ve aşağıdakiler kullanılarak güvenilirlik için başka bir test seçilir. t testi(aşağıdaki örneğe bakın).

Tipik görevler (ayrıca bkz. doğrusal olmayan regresyon)

Tipik görevler
Emek verimliliğinin y'nin işin mekanizasyon düzeyine bağımlılığı x (%) 14 sanayi kuruluşunun verilerine göre incelenmiştir. İstatistiksel veriler tabloda verilmiştir.
Gerekli:
1) x üzerinde lineer regresyon y parametreleri için tahminleri bulun. Bir dağılım grafiği oluşturun ve dağılım grafiğinde regresyon çizgisini çizin.
2) Anlamlılık düzeyinde α=0.05, doğrusal regresyon ve gözlemsel sonuçlar arasındaki uyum hipotezini test edin.
3) Güvenilirlik γ=0.95 ile doğrusal regresyon parametreleri için güven aralıklarını bulun.

Bu hesap makinesiyle aşağıdakiler de kullanılır:
Çoklu regresyon denklemi

Örnek. Ek 1'de verilen ve tercihinize (Tablo 2) karşılık gelen verilere dayanarak, şunlara ihtiyacınız vardır:

  1. Doğrusal çift korelasyon katsayısını hesaplayın ve bir özelliğin diğerinden doğrusal çift regresyonu denklemini oluşturun. Seçeneğinize karşılık gelen işaretlerden biri faktöriyel (x), diğeri - etkili (y) rolünü oynayacaktır. Ekonomik analiz temelinde işaretler arasında neden-sonuç ilişkileri kurun. Denklemin parametrelerinin anlamını açıklayın.
  2. Teorik belirleme katsayısını ve artık (regresyon denklemi tarafından açıklanmayan) varyansı belirleyin. Bir sonuca varın.
  3. Fisher's F-testini kullanarak bir bütün olarak regresyon denkleminin istatistiksel önemini yüzde 5 düzeyinde değerlendirin. Bir sonuca varın.
  4. Ortalama x düzeyinin %105'i olan öznitelik-faktörü x'in tahmini değeri ile öznitelik-sonucu y'nin beklenen değerine ilişkin bir tahmin gerçekleştirin. Tahmin hatasını ve güven aralığını 0.95 olasılıkla hesaplayarak tahminin doğruluğunu değerlendirin.
Çözüm. Denklem y = ax + b
ortalamalar



Dağılım


standart sapma



Y faktörü X özelliği arasındaki ilişki güçlü ve doğrudandır (Chaddock ölçeği ile belirlenir).
Regresyon Denklemi

Regresyon katsayısı: k = a = 4.01
belirleme katsayısı
R2 = 0.99 2 = 0.97, yani vakaların %97'sinde x'deki değişiklikler y'de bir değişikliğe yol açar. Başka bir deyişle, regresyon denkleminin seçiminin doğruluğu yüksektir. Artık dağılım: %3.
xyx2y2x yy(x)(y ben -y ) 2(y-y(x)) 2(x-x p) 2
1 107 1 11449 107 103.19 333.06 14.5 30.25
2 109 4 11881 218 107.2 264.06 3.23 20.25
3 110 9 12100 330 111.21 232.56 1.47 12.25
4 113 16 12769 452 115.22 150.06 4.95 6.25
5 120 25 14400 600 119.23 27.56 0.59 2.25
6 122 36 14884 732 123.24 10.56 1.55 0.25
7 123 49 15129 861 127.26 5.06 18.11 0.25
8 128 64 16384 1024 131.27 7.56 10.67 2.25
9 136 81 18496 1224 135.28 115.56 0.52 6.25
10 140 100 19600 1400 139.29 217.56 0.51 12.25
11 145 121 21025 1595 143.3 390.06 2.9 20.25
12 150 144 22500 1800 147.31 612.56 7.25 30.25
78 1503 650 190617 10343 1503 2366.25 66.23 143

Not: y(x) değerleri elde edilen regresyon denkleminden bulunur:
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
... ... ...

Korelasyon katsayısının önemi

Hipotezler ortaya koyuyoruz:
H 0: r xy = 0, değişkenler arasında doğrusal bir ilişki yoktur;
H 1: r xy ≠ 0, değişkenler arasında doğrusal bir ilişki vardır;
α anlamlılık düzeyinde sıfır hipotezini test etmek için normal iki boyutlu normalin genel korelasyon katsayısı rastgele değişken rekabet eden bir hipotez H 1 ≠ 0 ile, kriterin gözlemlenen değerini (rastgele hatanın değeri) hesaplamak gerekir:

Öğrenci tablosuna göre t sekmesi (n-m-1; α / 2) = (10; 0.025) = 2.228 buluyoruz.
Tobs > t sekmesinden, korelasyon katsayısının 0'a eşit olduğu hipotezini reddediyoruz. Başka bir deyişle, korelasyon katsayısı istatistiksel olarak anlamlıdır.
Korelasyon katsayısı için aralık tahmini (güven aralığı)


r - Δr ≤ r ≤ r + Δr
Δ r = ±t tablosu m r = ±2.228 0.0529 = 0.118
0,986 - 0,118 ≤ r ≤ 0,986 + 0,118
Korelasyon katsayısı için güven aralığı: 0.868 ≤ r ≤ 1

Regresyon katsayılarının tahminlerini belirleme doğruluğunun analizi





Sa =0.2152

Bağımlı değişken için güven aralıkları

Y'nin olası değerlerinin %95'inin sınırsız olarak yoğunlaşacağı aralığın sınırlarını hesaplayalım. büyük sayılar gözlemler ve X = 7
(122.4;132.11)
Katsayılarla ilgili hipotezleri test etme Doğrusal Denklem gerileme

1) t-istatistik




Regresyon katsayısının istatistiksel önemi doğrulandı
Regresyon denkleminin katsayıları için güven aralığı
%95 güvenilirlikle aşağıdaki gibi olacak olan regresyon katsayılarının güven aralıklarını belirleyelim:
(a - t bir S a ; a + t bir S a)
(3.6205;4.4005)
(b - t b S b ; b + t b S b)
(96.3117;102.0519)