korelasyon katsayıları

Şimdiye kadar, yalnızca iki özellik arasında istatistiksel bir ilişkinin varlığı gerçeğini bulduk. Daha sonra, bu bağımlılığın gücü veya zayıflığı ile şekli ve yönü hakkında hangi sonuçların çıkarılabileceğini bulmaya çalışacağız. Değişkenler arasındaki ilişkiyi ölçmek için kriterlere korelasyon katsayıları veya bağlantı ölçüleri denir. Aralarında doğrudan, tek yönlü bir ilişki varsa, iki değişken pozitif olarak ilişkilidir. Tek yönlü bir ilişkide, bir değişkenin küçük değerleri diğer değişkenin küçük değerlerine karşılık gelir, büyük değerler büyük değerlere karşılık gelir. Aralarında ters bir ilişki varsa, iki değişken negatif olarak ilişkilidir. Çok yönlü bir ilişki ile, bir değişkenin küçük değerleri, diğer değişkenin büyük değerlerine karşılık gelir ve bunun tersi de geçerlidir. Korelasyon katsayılarının değerleri her zaman -1 ile +1 arasındadır.

ait değişkenler arasında bir korelasyon katsayısı olarak sıralı uygulanan ölçek Spearman katsayısı, ve ait değişkenler için Aralıkölçek - Pearson korelasyon katsayısı(çalışma anı). Her bir ikili değişken, yani nominal ölçeğe ait ve iki kategoriye sahip bir değişken olarak kabul edilebileceği belirtilmelidir. sıralı.

İlk olarak, studium.sav dosyasından cinsiyet ve psyche değişkenleri arasında bir korelasyon olup olmadığını kontrol edeceğiz. Bu durumda ikili değişken seks sıralı olarak kabul edilebilir. Aşağıdakileri yapın:

    Komut menüsünden seçin Analiz Et (Analiz) Tanımlayıcı İstatistikler (Tanımlayıcı istatistikler) Çapraz tablolar... (Olumsuzluk tabloları)

    Değişkeni taşı seks bir dizi listesine ve bir değişkene ruh- sütun listesine.

    Düğmeye bas İstatistik... (İstatistik). Çapraz Tablolar: İstatistikler iletişim kutusunda, Korelasyonlar kutusunu işaretleyin. Devam butonu ile seçiminizi onaylayın.

    diyalogda çapraz tablolar Tabloları bastır onay kutusunu işaretleyerek tabloların görüntülenmesini durdurun. Tamam düğmesini tıklayın.

Spearman ve Pearson korelasyon katsayıları hesaplanacak ve önemleri test edilecektir:

Simetrik Ölçüler

değer asimpt. Std. Hata(a) (Asimptotik standart hata) Yaklaşık. T (b) (Yaklaşık T) Yaklaşık. imzala. (Yaklaşık önem)
Aralığa Göre Aralık (Aralık - Aralık) Pearson'ın R'si
(R Pearson)
,441 ,081 5,006 .000 (s)
Sıraya Göre Sıra (Sıra - Sıra) Mızrakçı Korelasyonu (Spearman Korelasyonu) ,439 ,083 4,987 .000 (s)
Geçerli Vaka Sayısı 106

Burada aralık ölçekli değişkenler olmadığından Spearman korelasyon katsayısını dikkate alacağız. 0.439'dur ve en önemlisidir (p<0,001).

Korelasyon katsayısının değerlerini sözlü olarak açıklamak için aşağıdaki tablo kullanılır:

Yukarıdaki tabloya dayanarak, aşağıdaki sonuçlara varılabilir: Cinsiyet ve psişe değişkenleri arasında zayıf bir korelasyon vardır (bağımlılığın gücü hakkında sonuç), değişkenler pozitif olarak ilişkilidir (bağımlılığın yönü hakkında sonuç).

Psişe değişkeninde, daha küçük değerler olumsuz bir zihinsel duruma, daha büyük değerler ise olumlu bir duruma karşılık gelir. Cinsiyet değişkeninde, sırayla, "1" değeri kadın cinsiyetine ve "2" - erkek değerine karşılık gelir.

Sonuç olarak, tek yönlü ilişki şu şekilde yorumlanabilir: kız öğrenciler, erkek meslektaşlarına göre zihinsel durumlarını daha olumsuz değerlendirirler veya büyük olasılıkla, bir anket yaparken böyle bir değerlendirmeye katılma olasılıkları daha yüksektir. iki özellik arasındaki korelasyonun, onların işlevsel veya nedensel ilişkileriyle mutlaka aynı olmadığını hesaba katarsanız, bununla ilgili daha fazla bilgi için Bölüm 15.3'e bakın.

Şimdi alter ve dönem değişkenleri arasındaki korelasyonu kontrol edelim. Yukarıda anlatılan yöntemi uygulayalım. Aşağıdaki katsayıları alacağız:

Simetrik Ölçüler

asimpt. Std. hata(a)

Aralığa Göre Aralık

Sıra ile Sıra

Mızrakçı Korelasyonu

Geçerli Vaka Sayısı

a. Boş hipotezi varsaymamak (Boş hipotez kabul edilmez).

e. Sıfır hipotezi varsayarak asimptotik standart hatayı kullanma.

İle birlikte. Normal yaklaşıma dayalıdır.

Alter ve sömestr metrik değişkenler olduğundan Pearson katsayısını (çarpımların momenti) dikkate alacağız. 0.807'dir. Alter ve dönem değişkenleri arasında güçlü bir ilişki vardır. Değişkenler pozitif olarak ilişkilidir. Sonuç olarak, daha büyük öğrenciler, aslında beklenmedik bir sonuç olmayan son sınıflarda eğitim görürler.

Korelasyon için sozial (sosyal konumun değerlendirilmesi) ve psişe değişkenlerini kontrol edelim. Aşağıdaki katsayıları alacağız:

Simetrik Ölçüler

asimpt. Std. hata(a)

Aralığa Göre Aralık

Sıra ile Sıra

Mızrakçı Korelasyonu

Geçerli Vaka Sayısı

a. Boş hipotezi varsaymamak (Boş hipotez kabul edilmez).

b. Sıfır hipotezi varsayarak asimptotik standart hatayı kullanma.

İle birlikte. Normal yaklaşıma dayalıdır.

Bu durumda Spearman korelasyon katsayısını ele alacağız; -0.703. Sozial ve psişe arasında orta ila güçlü bir korelasyon vardır (kesim 0.7). Değişkenler negatif ilişkilidir, yani birinci değişkenin değeri ne kadar büyükse, ikincisinin değeri o kadar düşüktür ve bunun tersi de geçerlidir. Sozial değişkeninin küçük değerleri olumlu bir durumu karakterize ettiğinden (1 = çok iyi, 2 = iyi) ve büyük psişe değerleri olumsuz bir durumu karakterize ettiğinden (1 = aşırı kararsız, 2 = kararsız), bu nedenle psikolojik zorluklar büyük ölçüde sosyal sorunlardan kaynaklanmaktadır.

Korelasyon katsayısı, iki değişken arasındaki ilişkinin derecesidir. Hesaplaması, iki veri seti arasında bir ilişki olup olmadığı hakkında fikir verir. Regresyondan farklı olarak korelasyon, değerlerin tahmin edilmesine izin vermez. Ancak katsayının hesaplanması, ön istatistiksel analizde önemli bir adımdır. Örneğin, doğrudan yabancı yatırım düzeyi ile GSYİH büyümesi arasındaki korelasyon katsayısının yüksek olduğunu bulduk. Bu bize, refahı sağlamak için yabancı girişimciler için uygun bir iklim yaratmanın gerekli olduğu fikrini veriyor. İlk bakışta çok açık olmayan bir sonuç!

Korelasyon ve nedensellik

Belki de hayatımızda bu kadar sağlam bir şekilde kurulacak tek bir istatistik alanı yoktur. Korelasyon katsayısı, kamu bilgisinin tüm alanlarında kullanılır. Başlıca tehlikesi, insanları ikna etmek ve bazı sonuçlara inanmalarını sağlamak için genellikle yüksek değerlerinin speküle edilmesi gerçeğinde yatmaktadır. Bununla birlikte, aslında, güçlü bir korelasyon, miktarlar arasında nedensel bir ilişki olduğunu hiç göstermez.

Korelasyon katsayısı: Pearson ve Spearman formülü

İki değişken arasındaki ilişkiyi karakterize eden birkaç ana gösterge vardır. Tarihsel olarak, ilki Pearson'ın lineer korelasyon katsayısıdır. Okulda geçer. K. Pearson ve J. Yule tarafından Fr. Galton. Bu katsayı, rasyonel olarak değişen rasyonel sayılar arasındaki ilişkiyi görmenizi sağlar. Her zaman -1'den büyük ve 1'den küçüktür. Negatif bir sayı, ters orantılı bir ilişkiyi gösterir. Katsayı sıfır ise, değişkenler arasında ilişki yoktur. Pozitif bir sayıya eşittir - incelenen miktarlar arasında doğrudan orantılı bir ilişki vardır. Spearman'ın sıra korelasyon katsayısı, değişken değerler hiyerarşisi oluşturarak hesaplamaları basitleştirmeyi mümkün kılar.

Değişkenler arasındaki ilişkiler

Korelasyon iki soruyu yanıtlamaya yardımcı olur. Birincisi, değişkenler arasındaki ilişkinin pozitif mi yoksa negatif mi olduğudur. İkincisi, bağımlılığın ne kadar güçlü olduğu. Korelasyon analizi, bu önemli bilgiyi elde etmek için güçlü bir araçtır. Hanehalkı gelir ve giderlerinin orantılı olarak arttığını ve düştüğünü görmek kolaydır. Böyle bir ilişki olumlu olarak kabul edilir. Aksine, bir ürünün fiyatı yükseldiğinde, o ürüne olan talep düşer. Böyle bir ilişkiye olumsuz denir. Korelasyon katsayısının değerleri -1 ile 1 arasındadır. Sıfır, çalışılan değerler arasında ilişki olmadığı anlamına gelir. Gösterge uç değerlere ne kadar yakınsa, ilişki (olumsuz veya pozitif) o kadar güçlüdür. Bağımlılığın yokluğu, -0.1 ila 0.1 arasında bir katsayı ile kanıtlanır. Böyle bir değerin yalnızca doğrusal bir ilişkinin olmadığını gösterdiği anlaşılmalıdır.

Uygulama özellikleri

Her iki göstergenin kullanımı belirli varsayımlara tabidir. Birincisi, güçlü bir ilişkinin varlığı, bir değerin diğerini belirlediği gerçeğini belirlemez. Her birini tanımlayan üçüncü bir nicelik olabilir. İkinci olarak, yüksek bir Pearson korelasyon katsayısı, çalışılan değişkenler arasında nedensel bir ilişki olduğunu göstermez. Üçüncüsü, yalnızca doğrusal bir ilişki gösterir. Korelasyon, cinsiyet veya favori renk gibi kategoriler yerine anlamlı nicel verileri (örneğin barometrik basınç, hava sıcaklığı) değerlendirmek için kullanılabilir.

Çoklu korelasyon katsayısı

Pearson ve Spearman, iki değişken arasındaki ilişkiyi araştırdı. Ama üç veya daha fazlası varsa ne yapmalı. Çoklu korelasyon katsayısının geldiği yer burasıdır. Örneğin, gayri safi milli hasıla sadece doğrudan yabancı yatırımlardan değil, devletin para ve maliye politikalarının yanı sıra ihracat düzeyinden de etkilenmektedir. Büyüme oranı ve GSYİH hacmi, bir dizi faktörün etkileşiminin sonucudur. Ancak, çoklu korelasyon modelinin bir takım basitleştirmelere ve varsayımlara dayandığı anlaşılmalıdır. İlk olarak, miktarlar arasındaki çoklu doğrusallık hariç tutulur. İkinci olarak, bağımlı değişken ile onu etkileyen değişkenler arasındaki ilişkinin doğrusal olduğu varsayılır.

Korelasyon ve regresyon analizinin kullanım alanları

Miktarlar arasındaki ilişkiyi bulmanın bu yöntemi istatistikte yaygın olarak kullanılmaktadır. En sık üç ana durumda başvurulur:

  1. İki değişkenin değerleri arasındaki nedensel ilişkileri test etmek için. Sonuç olarak, araştırmacı doğrusal bir ilişki bulmayı ve nicelikler arasındaki bu ilişkileri tanımlayan bir formül türetmeyi ummaktadır. Ölçü birimleri farklı olabilir.
  2. Değerler arasındaki ilişkiyi kontrol etmek için. Bu durumda, hiç kimse hangi değişkenin bağımlı olduğunu belirleyemez. Her iki niceliğin değerinin başka bir faktörü belirlediği ortaya çıkabilir.
  3. Bir denklem elde etmek için. Bu durumda, sayıları basitçe değiştirebilir ve bilinmeyen değişkenin değerlerini öğrenebilirsiniz.

Nedensel bir ilişki arayan bir adam

Bilinç öyle düzenlenmiştir ki, çevresinde meydana gelen olayları mutlaka açıklamamız gerekir. İnsan her zaman yaşadığı dünyanın resmi ile aldığı bilgiler arasında bir bağlantı arar. Çoğu zaman beyin kaostan düzen yaratır. Hiçbirinin olmadığı yerde nedensel bir ilişkiyi kolayca görebilir. Bilim adamları bu eğilimin üstesinden gelmeyi özellikle öğrenmelidir. Veriler arasındaki ilişkileri değerlendirme yeteneği, akademik bir kariyerde nesnel olarak önemlidir.

Medya önyargı

Bir korelasyonun varlığının nasıl yanlış yorumlanabileceğini düşünün. Bir grup huysuz İngiliz öğrenciye, ebeveynlerinin sigara içip içmediği soruldu. Ardından test gazetede yayınlandı. Sonuç, ebeveynlerin sigara içmesi ile çocuklarının suçluluğu arasında güçlü bir ilişki olduğunu gösterdi. Hatta bu çalışmayı yapan profesör, sigara paketlerinin üzerine bu konuda bir uyarı koymayı bile önerdi. Ancak, bu sonuca ilişkin bir takım sorunlar vardır. İlk olarak, korelasyon niceliklerden hangisinin bağımsız olduğunu göstermez. Bu nedenle, ebeveynlerin zararlı alışkanlığının, çocukların itaatsizliğinden kaynaklandığını varsaymak oldukça mümkündür. İkinci olarak, her iki sorunun da üçüncü bir faktörden dolayı ortaya çıkmadığını kesin olarak söylemek mümkün değildir. Örneğin, düşük gelirli aileler. Çalışmayı yürüten profesörün ilk sonuçlarının duygusal yönüne dikkat edilmelidir. Sigaranın ateşli bir rakibiydi. Bu nedenle, çalışmasının sonuçlarını bu şekilde yorumlaması şaşırtıcı değildir.

sonuçlar

Korelasyonu iki değişken arasındaki nedensel ilişki olarak yanlış yorumlamak, utanç verici araştırma hatalarına yol açabilir. Sorun şu ki, insan bilincinin tam merkezinde yatıyor. Birçok pazarlama hilesi bu özelliğe dayanmaktadır. Nedensellik ve korelasyon arasındaki farkı anlamak, hem günlük yaşamda hem de profesyonel kariyerinizde bilgileri rasyonel olarak analiz etmenizi sağlar.

Korelasyon katsayısı+1 ile -1 arasında değişebilen bir değerdir. Tam bir pozitif korelasyon durumunda, bu katsayı artı 1'e eşittir (bir değişkenin değerindeki bir artışla başka bir değişkenin değerinin arttığını söylerler) ve tam bir negatif korelasyonla - eksi 1 (geri bildirimi gösterir) , yani bir değişkenin değerlerinde bir artış ile diğerinin değerleri azalır).

Örn 1:

Utangaçlık ve depresyonun bağımlılık grafiği. Gördüğünüz gibi, noktalar (nesneler) rastgele yerleştirilmez, ancak bir çizgi etrafında sıralanır ve bu çizgiye bakarak, bir kişide utangaçlık ne kadar yüksek ifade edilirse, o kadar depresif, yani. bu fenomenler birbirine bağlıdır.

Ör 2: Utangaçlık ve Sosyallik Grafiği. Utangaçlık arttıkça sosyalliğin azaldığını görüyoruz. Korelasyon katsayıları -0.43'tür. Bu nedenle, 0'dan 1'e kadar olan bir korelasyon katsayısı, doğrudan orantılı bir ilişkiyi gösterir (ne kadar çok ... o kadar fazla ...) ve -1'den 0'a kadar bir katsayı ters orantılı bir ilişkiyi gösterir (ne kadar çok ... o kadar az . ..)

Korelasyon katsayısı 0 ise, her iki değişken de birbirinden tamamen bağımsızdır.

korelasyon- bu, bireysel faktörlerin etkisinin, gerçek verilerin toplu olarak gözlemlenmesiyle (ortalama olarak) yalnızca bir eğilim olarak göründüğü bir ilişkidir. Korelasyon bağımlılığına örnek olarak bankanın varlıklarının büyüklüğü ile bankanın kârının miktarı arasındaki bağımlılık, emek verimliliğinin artması ve çalışanların hizmet süresi verilebilir.

Güçlerine göre iki korelasyon sınıflandırma sistemi kullanılır: genel ve özel.

Korelasyonların genel sınıflandırması: 1) güçlü veya r> 0.70 korelasyon katsayısı ile yakın; 2) 0.500.70'de orta ve sadece yüksek anlamlılık düzeyinde bir korelasyon değil.

Aşağıdaki tablo, farklı ölçek türleri için korelasyon katsayılarının adlarını listeler.

İkili ölçek (1/0) Sıra (sıra) ölçeği
İkili ölçek (1/0) Pearson'ın birliktelik katsayısı, Pearson'ın dört hücreli konjugasyon katsayısı. iki seri korelasyon
Sıra (sıra) ölçeği Sıra-iki seri korelasyon. Spearman's veya Kendall's rank korelasyon katsayısı.
Aralık ve mutlak ölçek iki seri korelasyon Aralık ölçeğinin değerleri sıralara dönüştürülür ve sıra katsayısı kullanılır Pearson korelasyon katsayısı (doğrusal korelasyon katsayısı)

saat r=0 doğrusal bir korelasyon yoktur. Bu durumda, değişkenlerin grup ortalamaları genel ortalamalarıyla örtüşür ve regresyon çizgileri koordinat eksenlerine paraleldir.

eşitlik r=0 sadece doğrusal bir korelasyon bağımlılığının (ilişkisiz değişkenler) yokluğundan bahseder, ancak genel olarak bir korelasyonun yokluğundan ve daha da fazlası istatistiksel bir bağımlılıktan bahsetmez.

Bazen hiçbir korelasyon olmadığı sonucu, güçlü bir korelasyonun varlığından daha önemlidir. İki değişkenin sıfır korelasyonu, ölçüm sonuçlarına güvenmemiz koşuluyla, bir değişkenin diğeri üzerinde etkisinin olmadığını gösterebilir.

SPSS'de: 11.3.2 Korelasyon katsayıları

Şimdiye kadar, yalnızca iki özellik arasında istatistiksel bir ilişkinin varlığı gerçeğini bulduk. Daha sonra, bu bağımlılığın gücü veya zayıflığı ile şekli ve yönü hakkında hangi sonuçların çıkarılabileceğini bulmaya çalışacağız. Değişkenler arasındaki ilişkiyi ölçmek için kriterlere korelasyon katsayıları veya bağlantı ölçüleri denir. Aralarında doğrudan, tek yönlü bir ilişki varsa, iki değişken pozitif olarak ilişkilidir. Tek yönlü bir ilişkide, bir değişkenin küçük değerleri diğer değişkenin küçük değerlerine karşılık gelir, büyük değerler büyük değerlere karşılık gelir. Aralarında ters bir ilişki varsa, iki değişken negatif olarak ilişkilidir. Çok yönlü bir ilişki ile, bir değişkenin küçük değerleri, diğer değişkenin büyük değerlerine karşılık gelir ve bunun tersi de geçerlidir. Korelasyon katsayılarının değerleri her zaman -1 ile +1 arasındadır.

Sıralı ölçeğe ait değişkenler arasında korelasyon katsayısı olarak Spearman katsayısı, aralık ölçeğine ait değişkenler için ise Pearson korelasyon katsayısı (çarpımların momenti) kullanılır. Bu durumda, her bir ikili değişkenin, yani nominal ölçeğe ait ve iki kategorisi olan bir değişkenin sıralı olarak kabul edilebileceğine dikkat edilmelidir.

İlk olarak, studium.sav dosyasından cinsiyet ve psyche değişkenleri arasında bir korelasyon olup olmadığını kontrol edeceğiz. Bunu yaparken, ikili değişken cinsiyetin sıralı bir değişken olarak kabul edilebileceğini dikkate alıyoruz. Aşağıdakileri yapın:

Komut menüsünden seçin Analiz Et (Analiz) Tanımlayıcı İstatistikler (Tanımlayıcı istatistikler) Çapraz tablolar... (Olağan durum tabloları)

· Değişken cinsiyeti bir satır listesine ve değişken psişeyi bir sütun listesine taşıyın.

· İstatistikler... düğmesini tıklayın. Çapraz Tablolar: İstatistikler iletişim kutusunda, Korelasyonlar kutusunu işaretleyin. Devam butonu ile seçiminizi onaylayın.

· Çapraz tablolar iletişim kutusunda, Tabloları bastır onay kutusunu işaretleyerek tabloların görüntülenmesini durdurun. Tamam düğmesini tıklayın.

Spearman ve Pearson korelasyon katsayıları hesaplanacak ve önemleri test edilecektir:

/ SPSS 10

Görev numarası 10 Korelasyon analizi

korelasyon kavramı

Korelasyon veya korelasyon katsayısı istatistiksel bir göstergedir olasılıksal nicel ölçeklerde ölçülen iki değişken arasındaki ilişkiler. Bir değişkenin her değerinin karşılık geldiği fonksiyonel bağlantının aksine kesin olarak tanımlanmış başka bir değişkenin değeri, olasılıksal bağlantı bir değişkenin her bir değerinin karşılık geldiği gerçeği ile karakterize edilir. değerler kümesi Başka bir değişken, Olasılıksal bir ilişki örneği, insanların boy ve kilo arasındaki ilişkidir. Farklı ağırlıktaki insanların aynı boyda olabileceği ve bunun tersi olduğu açıktır.

Korelasyon -1 ile + 1 arasında bir değerdir ve r harfi ile gösterilir. Ayrıca, değer 1'e yakınsa, bu güçlü bir bağlantının varlığı anlamına gelir ve 0'a yakınsa, o zaman zayıf bir bağlantı vardır. 0,2'den küçük korelasyon değeri zayıf korelasyon, 0,5'ten büyük - yüksek olarak kabul edilir. Korelasyon katsayısı negatifse, bu ters bir ilişki olduğu anlamına gelir: bir değişkenin değeri ne kadar yüksekse, diğerinin değeri o kadar düşük olur.

r katsayısının kabul edilen değerlerine bağlı olarak, farklı korelasyon türleri ayırt edilebilir:

Güçlü pozitif korelasyon r=1 değeri ile belirlenir. "Kesin" terimi, bir değişkenin değerinin başka bir değişkenin değerleri tarafından benzersiz bir şekilde belirlendiği anlamına gelir ve " pozitif" - yani bir değişkenin değeri arttıkça diğer değişkenin değeri de artar.

Kesin korelasyon matematiksel bir soyutlamadır ve gerçek araştırmalarda neredeyse hiç gerçekleşmez.

pozitif korelasyon 0 değerlerine karşılık gelir

korelasyon eksikliği r=0 değeri ile belirlenir. Korelasyon katsayısının sıfır olması, değişkenlerin değerlerinin hiçbir şekilde birbiriyle ilişkili olmadığını gösterir.

korelasyon eksikliği H Ö : 0 r xy =0 bir yansıma olarak formüle hükümsüz korelasyon analizinde hipotezler.

Negatif korelasyon: -1

Güçlü negatif korelasyon r= -1 değeri ile belirlenir. Katı bir pozitif korelasyon gibi, bir soyutlamadır ve pratik araştırmalarda ifade bulmaz.

tablo 1

Korelasyon türleri ve tanımları

Korelasyon katsayısını hesaplama yöntemi, değişkenin değerlerinin ölçüldüğü ölçeğin türüne bağlıdır.

Korelasyon katsayısı rPearson ana olanıdır ve nominal ve kısmen sıralı aralık ölçeklerine sahip değişkenler için kullanılabilir, değerlerin dağılımı normale karşılık gelir (ürün momentlerinin korelasyonu). Pearson korelasyon katsayısı, anormal dağılımların olduğu durumlarda da oldukça doğru sonuçlar verir.

Normal olmayan dağılımlar için Spearman ve Kendall sıra korelasyon katsayılarının kullanılması tercih edilir. Sıralanırlar çünkü program ilişkili değişkenleri önceden sıralar.

SPSS programı r-Spearman korelasyonunu şu şekilde hesaplar: önce değişkenler sıralara dönüştürülür ve ardından sıralara Pearson formülü uygulanır.

M. Kendall tarafından önerilen korelasyon, konuların çiftler halinde karşılaştırılmasıyla bağlantının yönünün yargılanabileceği fikrine dayanmaktadır. Bir denek çifti için X'deki değişim, Y'deki değişim doğrultusunda çakışıyorsa, bu pozitif bir ilişkiyi gösterir. Eşleşmiyorsa, olumsuz bir ilişki hakkında. Bu katsayı esas olarak küçük örneklerle çalışan psikologlar tarafından kullanılır. Sosyologlar büyük veri dizileriyle çalıştıkları için, örneklemdeki tüm denek çiftlerinin göreli frekansları ve tersine çevrilmeleri arasındaki farkı belirlemek, çiftleri sıralamak zordur. En yaygın olanı katsayıdır. Pearson.

Korelasyon katsayısı rPearson temel olduğundan ve nicel ölçeklerde ölçülen tüm değişkenler için (ölçek türüne ve dağılımdaki anormallik düzeyine bağlı olarak bazı hatalarla birlikte) kullanılabildiğinden, kullanım örneklerini ele alacağız ve karşılaştıracağız. diğer korelasyon katsayıları kullanılarak yapılan ölçümlerin sonuçlarıyla elde edilen sonuçlar.

Katsayı hesaplama formülü r- Pearson:

r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙

Nerede: Xi, Yi- İki değişkenin değerleri;

Xav, Yav - iki değişkenin ortalama değerleri;

σ x , σ y standart sapmalardır,

N, gözlem sayısıdır.

çift ​​korelasyonlar

Örneğin, farklı geleneksel değer türleri arasındaki cevapların, öğrencilerin ideal iş yeri hakkındaki fikirlerinde nasıl bir ilişki olduğunu öğrenmek istiyoruz (değişkenler: a9.1, a9.3, a9.5, a9.7). , ve sonra liberal değerlerin oranı hakkında (a9 .2, a9.4, a9.6, a9.8). Bu değişkenler 5 terimli sıralı ölçeklerde ölçülür.

Prosedürü kullanıyoruz: "Analiz",  "Korelasyonlar",  "Eşleştirilmiş". Varsayılan olarak, katsayı Pearson, iletişim kutusunda ayarlanır. katsayısını kullanıyoruz Pearson

Test edilen değişkenler seçim penceresine aktarılır: a9.1, a9.3, a9.5, a9.7

Tamam'a basarak hesaplamayı alıyoruz:

korelasyonlar

a9.1.t. Aile ve kişisel yaşam için yeterli zamana sahip olmak ne kadar önemlidir?

Pearson korelasyonu

Değer(2 taraflı)

a9.3.t. İşinizi kaybetmekten korkmamak ne kadar önemli?

Pearson korelasyonu

Değer(2 taraflı)

a9.5.t. Şu veya bu kararı verirken size danışacak böyle bir patronunuzun olması ne kadar önemli?

Pearson korelasyonu

Değer(2 taraflı)

a9.7.t. İyi koordine edilmiş bir ekipte çalışmak, bunun bir parçası gibi hissetmek ne kadar önemlidir?

Pearson korelasyonu

Değer(2 taraflı)

** Korelasyon 0,01 düzeyinde (2 taraflı) anlamlıdır.

Oluşturulan korelasyon matrisinin nicel değerleri tablosu

Kısmi korelasyonlar:

İlk olarak, bu iki değişken arasında ikili bir ilişki kuralım:

korelasyonlar

c8. Yakınınızda yaşayanlara yakın hissedin, komşular

Pearson korelasyonu

Değer(2 taraflı)

c12. Ailelerine yakın hissetmek

Pearson korelasyonu

Değer(2 taraflı)

**. Korelasyon 0,01 düzeyinde (2 taraflı) anlamlıdır.

Sonra kısmi bir korelasyon oluşturmak için prosedürü kullanırız: "Analiz",  "Korelasyonlar",  "Kısmi".

Belirtilen değişkenlerle ilgili olarak “İşinizin sırasını bağımsız olarak belirlemek ve değiştirmek önemlidir” değerinin, etkisi altında önceden tanımlanmış ilişkinin ortadan kalkacağı veya çok az önemli olacağı belirleyici faktör olacağını varsayalım. .

korelasyonlar

Hariç tutulan değişkenler

c8. Yakınınızda yaşayanlara yakın hissedin, komşular

c12. Ailelerine yakın hissetmek

c16. Sizinle aynı servete sahip insanlara yakın hissedin

c8. Yakınınızda yaşayanlara yakın hissedin, komşular

korelasyon

Önem (2-taraflı)

c12. Ailelerine yakın hissetmek

korelasyon

Önem (2-taraflı)

Tablodan görülebileceği gibi, kontrol değişkeninin etkisi altında ilişki biraz azaldı: 0.120'den 0.102'ye. yeterince yüksek kalır ve kişinin gerçeği çürütmesine izin verir. sıfır hipotezi.

Korelasyon katsayısı

Korelasyonun sıkılığını ve doğasını belirlemenin en doğru yolu korelasyon katsayısını bulmaktır. Korelasyon katsayısı, aşağıdaki formülle belirlenen bir sayıdır:


burada r xy korelasyon katsayısıdır;

x i -ilk özelliğin değerleri;

i -ikinci özelliğin değerleri;

İlk özelliğin değerlerinin aritmetik ortalaması

İkinci özelliğin değerlerinin aritmetik ortalaması

Formül (32)'yi kullanmak için, korelasyon katsayısının payını ve paydasını bulmak için sayıların hazırlanmasında gerekli diziyi sağlayacak bir tablo oluşturuyoruz.

Formül (32)'den görülebileceği gibi, eylemlerin sırası aşağıdaki gibidir: hem x hem de y işaretlerinin aritmetik ortalamasını buluruz, işaretin değerleri ile ortalaması arasındaki farkı buluruz (х i - ) ve y ben - ), sonra onların çarpımını (х i - ) ( y ben - ) buluruz – ikincisinin toplamı korelasyon katsayısının payını verir. Paydasını bulmak için, (x i -) ve (y i -) farklarının karesini almalı, toplamlarını bulmalı ve ürünlerinden karekökünü çıkarmalıdır.

Dolayısıyla, örneğin 31, formül (32)'ye göre korelasyon katsayısının bulunması aşağıdaki gibi gösterilebilir (Tablo 50).

Ortaya çıkan korelasyon katsayısı sayısı, ilişkinin varlığını, yakınlığını ve doğasını belirlemeyi mümkün kılar.

1. Korelasyon katsayısı sıfır ise özellikler arasında ilişki yoktur.

2. Korelasyon katsayısı bire eşitse, özellikler arasındaki ilişki o kadar büyüktür ki, işlevsel hale gelir.

3. Korelasyon katsayısının mutlak değeri, sıfırdan bire aralığın ötesine geçmez:

Bu, bağlantının sıkılığına odaklanmayı mümkün kılar: katsayı sıfıra ne kadar yakınsa, bağlantı o kadar zayıf ve birliğe ne kadar yakınsa bağlantı o kadar yakın olur.

4. Korelasyon katsayısının işareti "artı" doğrudan korelasyon anlamına gelir, "eksi" işareti tam tersi anlamına gelir.

Masa 50

x ben i (x ben - ) (y ben - ) (x ben - )(y ben - ) (x ben - )2 (y ben - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Böylece, Örnek 31'de hesaplanan korelasyon katsayısı r xy = +0.9'dur. aşağıdaki sonuçları çıkarmamızı sağlar: çalışılan okul çocuklarında sağ ve sol ellerin kas kuvvetinin büyüklüğü arasında bir korelasyon var (r xy \u003d + 0.9 katsayısı sıfır değil), ilişki çok yakın (r xy \u003d + 0.9 katsayısı) birliğe yakın), korelasyon doğrudandır (r xy = +0.9 katsayısı pozitiftir), yani. bir elin kas gücündeki artışla diğer elin gücü artar.

Korelasyon katsayısı hesaplanırken ve özellikleri kullanılırken, öznitelikler normal dağıldığında ve her iki özelliğin çok sayıda değeri arasındaki ilişki göz önüne alındığında sonuçların doğru sonuçlar verdiği dikkate alınmalıdır.

Ele alınan örnek 31'de, her iki özelliğin de sadece 7 değeri analiz edildi, bu elbette bu tür çalışmalar için yeterli değil. Burada, genel olarak bu kitaptaki ve özel olarak bu bölümdeki örneklerin, herhangi bir bilimsel deneyin ayrıntılı bir sunumu değil, yöntemleri açıklayan nitelikte olduğunu tekrar hatırlatırız. Sonuç olarak, az sayıda özellik değeri dikkate alınır, ölçümler yuvarlanır - tüm bunlar, yöntem fikrini hantal hesaplamalarla engellememek için yapılır.

İncelenen ilişkinin özüne özellikle dikkat edilmelidir. Öznitelikler arasındaki ilişkinin analizi formal olarak yapılırsa, korelasyon katsayısı çalışmanın doğru sonuçlarına yol açmaz. Örnek 31'e geri dönelim. Her iki işaret de sağ ve sol elin kas gücünün değerleriydi. Örnek 31'deki (14.0; 14.2; 14.9... ...18.1) x i özelliği ile santimetre cinsinden rastgele yakalanan balığın uzunluğunu ve y i özelliğiyle (12.1 ; 13.8; 14.2 ... ...) kastettiğimizi düşünelim. 17.4) - laboratuvardaki aletlerin kilogram cinsinden ağırlığı. Korelasyon katsayısını bulmak için hesaplama aygıtını resmi olarak kullandıktan ve bu durumda da r xy =+0>9 elde ettikten sonra, balığın uzunluğu ile ağırlığı arasında doğrudan bir doğaya sahip yakın bir ilişki olduğu sonucuna varmalıydık. enstrumanlar. Böyle bir sonucun saçmalığı açıktır.

Korelasyon katsayısını kullanmaya yönelik resmi bir yaklaşımdan kaçınmak için, işaretler arasında bir korelasyon olasılığını belirlemek, yani işaretlerin organik birliğini tespit etmek için başka herhangi bir yöntem - matematiksel, mantıksal, deneysel, teorik - kullanılmalıdır. Ancak o zaman kişi korelasyon analizini kullanmaya başlayabilir ve ilişkinin büyüklüğünü ve doğasını belirleyebilir.

Matematiksel istatistikte de şu kavram vardır: çoklu korelasyon- Üç veya daha fazla özellik arasındaki ilişkiler. Bu durumlarda, yukarıda açıklanan ikili korelasyon katsayılarından oluşan bir çoklu korelasyon katsayısı kullanılır.

Örneğin, üç işaretin korelasyon katsayısı - x і , y і , z і -:

burada R xyz - x i özelliğinin y ben ve z i özelliklerine nasıl bağlı olduğunu ifade eden çoklu korelasyon katsayısı;

x ben ve y ben özellikleri arasındaki r xy -korelasyon katsayısı;

r xz - Xi ve Zi özellikleri arasındaki korelasyon katsayısı;

r yz - özellikler arasındaki korelasyon katsayısı y ben , z ben

Korelasyon analizi:

Korelasyon analizi

korelasyon- iki veya daha fazla rasgele değişkenin (veya kabul edilebilir bir doğruluk derecesi ile bu şekilde kabul edilebilecek değişkenlerin) istatistiksel ilişkisi. Aynı zamanda, bu niceliklerden bir veya birkaçındaki değişiklik, diğer veya diğer niceliklerde sistematik bir değişikliğe yol açar. Korelasyon katsayısı, iki rastgele değişkenin korelasyonunun matematiksel bir ölçüsü olarak hizmet eder.

Korelasyon pozitif ve negatif olabilir (örneğin, bağımsız rastgele değişkenler için - istatistiksel bir ilişki olmaması da mümkündür). Negatif korelasyon - bir değişkendeki artışın başka bir değişkendeki azalmayla ilişkilendirildiği, korelasyon katsayısının negatif olduğu korelasyon. pozitif korelasyon - korelasyon katsayısı pozitif iken bir değişkendeki artışın başka bir değişkendeki artışla ilişkilendirildiği bir korelasyon.

otokorelasyon - arasındaki istatistiksel ilişki rastgele değişkenler bir satırdan, ancak örneğin rastgele bir süreç için bir kayma ile alınır - zaman kayması ile.

Değişkenler arasındaki katsayıları (korelasyonları) incelemekten oluşan istatistiksel verileri işleme yöntemine denir. korelasyon analizi.

Korelasyon katsayısı

Korelasyon katsayısı veya çift ​​korelasyon katsayısı olasılık teorisi ve istatistikte bu, iki rastgele değişkendeki değişimin doğasının bir göstergesidir. Korelasyon katsayısı Latin harfi R ile gösterilir ve -1 ile +1 arasında değerler alabilir. Modulo değeri 1'e yakınsa, bu, güçlü bir bağlantının varlığı anlamına gelir (bire eşit bir korelasyon katsayısı ile, işlevsel bir bağlantıdan bahsederler) ve 0'a yakınsa, o zaman zayıf bir bağlantı vardır.

Pearson korelasyon katsayısı

Metrik miktarlar için, kesin formülü Francis Galton tarafından tanıtılan Pearson korelasyon katsayısı kullanılır:

İzin vermek X,Y- aynı olasılık uzayında tanımlanmış iki rastgele değişken. Daha sonra korelasyon katsayıları aşağıdaki formülle verilir:

,

burada cov kovaryans ve D varyans veya eşdeğerdir,

,

burada sembol matematiksel beklentiyi gösterir.

Böyle bir ilişkiyi grafiksel olarak temsil etmek için, her iki değişkene de karşılık gelen eksenleri olan bir dikdörtgen koordinat sistemi kullanabilirsiniz. Her bir değer çifti belirli bir sembolle işaretlenmiştir. Böyle bir arsaya "dağılım grafiği" denir.

Korelasyon katsayısını hesaplama yöntemi, değişkenlerin atıfta bulunduğu ölçeğin türüne bağlıdır. Bu nedenle, değişkenleri aralık ve nicel ölçeklerle ölçmek için Pearson korelasyon katsayısını (çarpım momentlerinin korelasyonu) kullanmak gerekir. İki değişkenden en az birinin sıralı ölçeği varsa veya normal dağılmamışsa, Spearman's rank korelasyonu veya Kendal's τ (tau) kullanılmalıdır. İki değişkenden birinin ikili olması durumunda nokta iki dizi korelasyonu, her iki değişkenin de ikili olması durumunda dört alanlı korelasyon kullanılır. İkili olmayan değişkenler arasındaki korelasyon katsayısının hesaplanması, yalnızca aralarındaki ilişkinin doğrusal (tek yönlü) olması durumunda anlamlıdır.

Kendell korelasyon katsayısı

Karşılıklı düzensizliği ölçmek için kullanılır.

Spearman korelasyon katsayısı

Korelasyon katsayısının özellikleri

  • Cauchy - Bunyakovsky eşitsizliği:
Kovaryansı iki rastgele değişkenin skaler ürünü olarak alırsak, rastgele değişkenin normu şuna eşit olacaktır: ve Cauchy-Bunyakovsky eşitsizliğinin sonucu şöyle olacaktır: . , nerede . Ayrıca, bu durumda işaretler ve k kibrit: .

Korelasyon analizi

Korelasyon analizi- katsayıları incelemekten oluşan istatistiksel verileri işleme yöntemi ( korelasyonlar) değişkenler arasında. Bu durumda, aralarında istatistiksel ilişkiler kurmak için bir veya birden fazla özellik çifti arasındaki korelasyon katsayıları karşılaştırılır.

Hedef korelasyon analizi - başka bir değişkenin yardımıyla bir değişken hakkında bazı bilgiler sağlar. Amaca ulaşmanın mümkün olduğu durumlarda değişkenlerin ilişkilendirmek. En genel haliyle, bir korelasyonun varlığı hipotezini kabul etmek, A değişkeninin değerindeki bir değişikliğin, B değerindeki orantılı bir değişiklikle aynı anda gerçekleşeceği anlamına gelir: her iki değişken de artarsa, o zaman korelasyon pozitif değişkenlerden biri artarken diğeri azalırsa, korelasyon negatif.

Korelasyon, niceliklerin yalnızca doğrusal bağımlılığını yansıtır, ancak işlevsel bağlantılarını yansıtmaz. Örneğin değerler arasındaki korelasyon katsayısını hesaplarsak A = sin(x) ve B = cÖs(x), o zaman sıfıra yakın olacaktır, yani miktarlar arasında bağımlılık yoktur. Bu arada, A ve B miktarları açıkça yasaya göre işlevsel olarak ilişkilidir. sin 2(x) + cÖs 2(x) = 1.

Korelasyon analizinin sınırlamaları



Her biri için karşılık gelen x ve y korelasyon katsayıları ile (x,y) çiftlerinin dağılımlarının grafikleri. Korelasyon katsayısının doğrusal bir ilişkiyi (üst sıra) yansıttığını, ancak bir ilişki eğrisini (orta sıra) tanımlamadığını ve karmaşık, doğrusal olmayan ilişkileri (alt sıra) tanımlamak için hiç uygun olmadığını unutmayın.
  1. Çalışmak için yeterli vaka varsa uygulama mümkündür: belirli bir korelasyon katsayısı türü için 25 ila 100 çift gözlem arasında değişir.
  2. İkinci sınırlama, aşağıdakileri içeren korelasyon analizi hipotezinden kaynaklanmaktadır: değişkenlerin doğrusal bağımlılığı. Çoğu durumda, ilişkinin var olduğu güvenilir bir şekilde bilindiğinde, ilişki doğrusal olmadığı için (örneğin bir parabol olarak ifade edildiğinde) korelasyon analizi sonuç vermeyebilir.
  3. Kendi başına, korelasyon gerçeği, değişkenlerden hangisinin önce geldiğini veya değişikliklere neden olduğunu veya değişkenlerin, örneğin üçüncü bir faktörün etkisi nedeniyle, genellikle nedensel olarak birbirleriyle ilişkili olduğunu iddia etmek için temel oluşturmaz.

Uygulama alanı

İstatistiksel verileri işlemenin bu yöntemi, ekonomi ve sosyal bilimlerde (özellikle psikoloji ve sosyolojide) çok popülerdir, ancak korelasyon katsayılarının uygulama kapsamı geniştir: endüstriyel ürünlerin kalite kontrolü, metalurji, tarım kimyası, hidrobiyoloji, biyometri, ve diğerleri.

Yöntemin popülaritesi iki noktadan kaynaklanmaktadır: korelasyon katsayılarının hesaplanması nispeten kolaydır, uygulamaları özel matematik eğitimi gerektirmez. Yorumlama kolaylığı ile birleşince, katsayının uygulama kolaylığı, istatistiksel veri analizi alanında yaygın olarak kullanılmasına yol açmıştır.

sahte korelasyon

Bir korelasyon çalışmasının genellikle cezbedici basitliği, araştırmacıyı, özellik çiftleri arasında nedensel bir ilişkinin varlığı hakkında yanlış sezgisel sonuçlar çıkarmaya teşvik ederken, korelasyon katsayıları yalnızca istatistiksel ilişkiler kurar.

Aslında, sosyal bilimlerin modern nicel metodolojisinde, gözlemlenen değişkenler arasında ampirik yöntemlerle nedensel ilişkiler kurma girişimleri terk edilmiştir. Bu nedenle, sosyal bilimlerdeki araştırmacılar, çalıştıkları değişkenler arasında ilişki kurmaktan bahsettiklerinde, ya genel bir teorik varsayım ya da istatistiksel bir bağımlılık ima edilir.

Ayrıca bakınız

  • otokorelasyon fonksiyonu
  • Çapraz korelasyon işlevi
  • kovaryans
  • belirleme katsayısı
  • Regresyon analizi

Wikimedia Vakfı. 2010.

Burada x y , x , y örneklerin ortalama değerleridir; σ(x), σ(y) - standart sapmalar.
Ayrıca, Pearson'ın doğrusal çift korelasyon katsayısı b regresyon katsayısı ile belirlenebilir: burada σ(x)=S(x), σ(y)=S(y) standart sapmalardır, b regresyon denkleminde x'in önündeki katsayıdır y=a+ bx.

Diğer formül seçenekleri:
veya

K xy - korelasyon momenti (kovaryans katsayısı)

Doğrusal Pearson korelasyon katsayısını bulmak için, x ve y örnek ortalamalarını ve bunların standart sapmalarını σ x = S(x), σ y = S(y) bulmak gerekir:

Doğrusal korelasyon katsayısı, bir bağlantının varlığını gösterir ve -1 ile +1 arasında değerler alır (Chaddock ölçeğine bakın). Örneğin, iki değişken arasındaki doğrusal bir korelasyonun sıkılığı analiz edilirken, -1'e eşit bir çift doğrusal korelasyon katsayısı elde edildi. Bu, değişkenler arasında tam bir ters doğrusal ilişki olduğu anlamına gelir.

Korelasyon katsayısının değerini verilen örnek araçları kullanarak veya doğrudan hesaplayabilirsiniz.

Xy#x #y #σ x #σ y " data-id="a;b;c;d;e" data-formul="(a-b*c)/(d*e)" data-r="r xy "> Değerinizi hesaplayın

Korelasyon katsayısının geometrik anlamı: r xy, iki regresyon doğrusu: y(x) ve x(y)'nin eğiminin ne kadar farklı olduğunu, x ve y'deki sapmaları minimize etmenin sonuçlarının ne kadar farklı olduğunu gösterir. Çizgiler arasındaki açı ne kadar büyük olursa, r xy o kadar büyük olur.
Korelasyon katsayısının işareti, regresyon katsayısının işaretiyle çakışır ve regresyon doğrusunun eğimini belirler, yani. genel bağımlılık yönü (artış veya azalma). Korelasyon katsayısının mutlak değeri, noktaların regresyon doğrusuna yakınlık derecesine göre belirlenir.

Korelasyon katsayısının özellikleri

  1. |r xy | ≤ 1;
  2. X ve Y bağımsız ise, o zaman r xy =0, bunun tersi her zaman doğru değildir;
  3. |r xy |=1 ise, o zaman Y=aX+b, |r xy (X,aX+b)|=1, burada a ve b sabittir ve ≠ 0;
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, burada a 1 , a 2 , b 1 , b 2 sabitlerdir.

Bu nedenle, bağlantı yönü kontrolleri Pearson korelasyon katsayısı kullanılarak bir hipotez testi ve aşağıdakiler kullanılarak güvenilirlik için başka bir test seçilir. t testi(aşağıdaki örneğe bakın).

Tipik görevler (ayrıca bkz. doğrusal olmayan regresyon)

Tipik görevler
Emek verimliliğinin y'nin işin mekanizasyon düzeyine bağımlılığı x (%) 14 sanayi kuruluşunun verilerine göre incelenmiştir. İstatistiksel veriler tabloda verilmiştir.
Gerekli:
1) x üzerinde lineer regresyon y parametreleri için tahminleri bulun. Bir dağılım grafiği oluşturun ve dağılım grafiğinde regresyon çizgisini çizin.
2) Anlamlılık düzeyinde α=0.05, doğrusal regresyon ve gözlemsel sonuçlar arasındaki uyum hipotezini test edin.
3) Güvenilirlik γ=0.95 ile doğrusal regresyon parametreleri için güven aralıklarını bulun.

Bu hesap makinesiyle aşağıdakiler de kullanılır:
Çoklu regresyon denklemi

Örnek. Ek 1'de verilen ve tercihinize (Tablo 2) karşılık gelen verilere dayanarak, ihtiyacınız olan:

  1. Doğrusal çift korelasyon katsayısını hesaplayın ve bir özelliğin diğerinden doğrusal çift regresyonu denklemini oluşturun. Seçeneğinize karşılık gelen işaretlerden biri faktöriyel (x), diğeri - etkili (y) rolünü oynayacaktır. Ekonomik analiz temelinde işaretler arasında neden-sonuç ilişkileri kurun. Denklemin parametrelerinin anlamını açıklayın.
  2. Teorik belirleme katsayısını ve artık (regresyon denklemi tarafından açıklanmayan) varyansı belirleyin. Bir sonuca varın.
  3. Tahmin etmek İstatistiksel anlamlılık Fisher's F-testi kullanılarak yüzde beş düzeyinde bir bütün olarak regresyon denklemleri. Bir sonuca varın.
  4. Ortalama x düzeyinin %105'i olan öznitelik faktörü x'in tahmin edilen değeriyle öznitelik-sonucu y'nin beklenen değerine ilişkin bir tahmin gerçekleştirin. Tahmin hatasını ve güven aralığını 0.95 olasılıkla hesaplayarak tahminin doğruluğunu değerlendirin.
Çözüm. Denklem y = ax + b
ortalamalar



Dağılım


standart sapma



Y faktörü X özelliği arasındaki ilişki güçlü ve doğrudandır (Chaddock ölçeği ile belirlenir).
Regresyon Denklemi

Regresyon katsayısı: k = a = 4.01
belirleme katsayısı
R2 = 0.99 2 = 0.97, yani vakaların %97'sinde x'deki değişiklikler y'de bir değişikliğe yol açar. Başka bir deyişle, regresyon denkleminin seçiminin doğruluğu yüksektir. Artık dağılım: %3.
xyx2y2x yy(x)(y ben -y ) 2(y-y(x)) 2(x-x p) 2
1 107 1 11449 107 103.19 333.06 14.5 30.25
2 109 4 11881 218 107.2 264.06 3.23 20.25
3 110 9 12100 330 111.21 232.56 1.47 12.25
4 113 16 12769 452 115.22 150.06 4.95 6.25
5 120 25 14400 600 119.23 27.56 0.59 2.25
6 122 36 14884 732 123.24 10.56 1.55 0.25
7 123 49 15129 861 127.26 5.06 18.11 0.25
8 128 64 16384 1024 131.27 7.56 10.67 2.25
9 136 81 18496 1224 135.28 115.56 0.52 6.25
10 140 100 19600 1400 139.29 217.56 0.51 12.25
11 145 121 21025 1595 143.3 390.06 2.9 20.25
12 150 144 22500 1800 147.31 612.56 7.25 30.25
78 1503 650 190617 10343 1503 2366.25 66.23 143

Not: y(x) değerleri elde edilen regresyon denkleminden bulunur:
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
... ... ...

Korelasyon katsayısının önemi

Hipotezler ortaya koyuyoruz:
H 0: r xy = 0, değişkenler arasında doğrusal bir ilişki yoktur;
H 1: r xy ≠ 0, değişkenler arasında doğrusal bir ilişki vardır;
Normal iki boyutlu bir rastgele değişkenin genel korelasyon katsayısının, rekabet eden bir hipotez H 1 ≠ 0 ile sıfıra eşit olduğu anlamlılık düzeyinde α sıfır hipotezini test etmek için, kriterin gözlenen değerini hesaplamak gerekir ( rastgele hatanın değeri):

Öğrenci tablosuna göre t sekmesi (n-m-1; α / 2) = (10; 0.025) = 2.228 buluyoruz.
Tobs > t sekmesinden, korelasyon katsayısının 0'a eşit olduğu hipotezini reddediyoruz. Başka bir deyişle, korelasyon katsayısı istatistiksel olarak anlamlıdır.
Korelasyon katsayısı için aralık tahmini (güven aralığı)


r - Δr ≤ r ≤ r + Δr
Δ r = ±t tablosu m r = ±2.228 0.0529 = 0.118
0,986 - 0,118 ≤ r ≤ 0,986 + 0,118
Korelasyon katsayısı için güven aralığı: 0.868 ≤ r ≤ 1

Regresyon katsayılarının tahminlerini belirleme doğruluğunun analizi





Sa = 0,2152

Bağımlı değişken için güven aralıkları

Y'nin olası değerlerinin %95'inin sınırsız olarak yoğunlaşacağı aralığın sınırlarını hesaplayalım. büyük sayılar gözlemler ve X = 7
(122.4;132.11)
Katsayılarla ilgili hipotezleri test etme Doğrusal Denklem gerileme

1) t-istatistik




Regresyon katsayısının istatistiksel önemi doğrulandı
Regresyon denkleminin katsayıları için güven aralığı
%95 güvenilirlikle aşağıdaki gibi olacak olan regresyon katsayılarının güven aralıklarını belirleyelim:
(a - t bir S a ; a + t bir S a)
(3.6205;4.4005)
(b - t b S b ; b + t b S b)
(96.3117;102.0519)

Korelasyon analizinin amacı bazı gerçek süreçleri karakterize eden rastgele değişkenler (özellikler) arasındaki bağlantının gücünün bir tahminini belirlemektir.
Korelasyon analizi sorunları:
a) İki veya daha fazla olgunun bağlantı derecesinin (sıkılık, kuvvet, şiddet, yoğunluk) ölçümü.
b) Olgular arasındaki bağlantı derecesinin ölçülmesine dayalı olarak, ortaya çıkan öznitelik üzerinde en önemli etkiye sahip faktörlerin seçimi. Bu açıdan önemli faktörler, regresyon analizinde daha sonra kullanılır.
c) Bilinmeyen nedensel ilişkilerin tespiti.

Karşılıklı ilişkilerin tezahür biçimleri çok çeşitlidir. En yaygın türleri olarak fonksiyonel (tam) ve korelasyon (eksik) bağlantı.
korelasyon Bağımlı değişkenin verilen değerleri, bağımsız değişkenin belirli sayıda olasılık değerine karşılık geldiğinde, kütle gözlemleri için ortalama olarak kendini gösterir. Bağlantıya korelasyon denir, faktör özelliğinin her değeri iyi tanımlanmış rastgele olmayan bir değere karşılık geliyorsa etkili özellik.
Korelasyon alanı, korelasyon tablosunun görsel bir temsili görevi görür. X değerlerinin apsis eksenine çizildiği, Y değerlerinin ordinat ekseni boyunca çizildiği ve X ve Y kombinasyonlarının noktalarla gösterildiği bir grafiktir.Bir bağlantının varlığı, konumuna göre değerlendirilebilir. noktalar.
Sızdırmazlık göstergeleri ortaya çıkan özelliğin varyasyonunun, özellik faktörünün varyasyonuna bağımlılığını karakterize etmeyi mümkün kılar.
Sızdırmazlık derecesinin daha iyi bir göstergesi korelasyon dır-dir doğrusal korelasyon katsayısı. Bu gösterge hesaplanırken, yalnızca özniteliğin bireysel değerlerinin ortalamadan sapmaları değil, aynı zamanda bu sapmaların büyüklüğü de dikkate alınır.

Bu konunun temel konuları, elde edilen özellik ile açıklayıcı değişken arasındaki regresyon ilişkisinin denklemleri, regresyon modelinin parametrelerini tahmin etmek için en küçük kareler yöntemi, elde edilen regresyon denkleminin kalitesini analiz etmek, tahmin için güven aralıkları oluşturmaktır. regresyon denklemi kullanılarak elde edilen özelliğin değerleri.

Örnek 2


Normal denklemler sistemi.
bir n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Verilerimiz için denklem sistemi şu şekildedir:
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
İlk denklemden ifade ediyoruz a ve ikinci denklemde yerine:
b = -3.46, a = 1379.33 elde ederiz.
Regresyon denklemi:
y = -3,46 x + 1379,33

2. Regresyon denkleminin parametrelerinin hesaplanması.
Örnek anlamına gelir.



Örnek varyanslar:


standart sapma


1.1. Korelasyon katsayısı
kovaryans.

İletişimin yakınlığının göstergesini hesaplıyoruz. Böyle bir gösterge, aşağıdaki formülle hesaplanan seçici bir doğrusal korelasyon katsayısıdır:

Doğrusal korelasyon katsayısı –1 ile +1 arasında değerler alır.
Özellikler arasındaki ilişkiler zayıf veya güçlü (yakın) olabilir. Kriterleri Chaddock ölçeğinde değerlendirilir:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Örneğimizde, Y özelliği ile X faktörü arasındaki ilişki yüksek ve terstir.
Ek olarak, doğrusal çift korelasyon katsayısı, regresyon katsayısı b cinsinden belirlenebilir:

1.2. Regresyon Denklemi(regresyon denkleminin değerlendirilmesi).

Doğrusal regresyon denklemi y = -3.46 x + 1379.33'tür

b = -3,46 katsayısı, ölçüm birimi başına x faktörünün değerinde bir artış veya azalma ile etkin göstergedeki (y birimi cinsinden) ortalama değişikliği gösterir. AT bu örnek 1 birim artışla y ortalama -3,46 azalmaktadır.
a = 1379.33 katsayısı, resmi olarak y'nin öngörülen seviyesini gösterir, ancak yalnızca x=0 örnek değerlere yakınsa.
Fakat eğer x=0 örnek x değerlerinden uzaksa, o zaman harfi harfine bir yorum yanlış sonuçlara yol açabilir ve regresyon çizgisi gözlemlenen örneğin değerlerini doğru bir şekilde tanımlasa bile bunun da olacağının garantisi yoktur. sola veya sağa ekstrapolasyon yaparken durum.
x'in karşılık gelen değerlerini regresyon denkleminde değiştirerek, her gözlem için etkin gösterge y(x)'in hizalanmış (tahmin edilen) değerlerini belirlemek mümkündür.
y ve x arasındaki ilişki, b regresyon katsayısının işaretini belirler (eğer > 0 - doğrudan ilişki, aksi takdirde - ters). Örneğimizde, ilişki terstir.
1.3. elastikiyet katsayısı.
Etkili gösterge y ve faktör niteliği x'in ölçüm birimlerinde bir fark varsa, faktörlerin etkin nitelik üzerindeki etkisinin doğrudan değerlendirilmesi için (örnek b'de) regresyon katsayılarının kullanılması istenmeyen bir durumdur.
Bu amaçlar için esneklik katsayıları ve beta katsayıları hesaplanır.
Ortalama esneklik katsayısı E, sonucun toplamda ortalama yüzde kaç değişeceğini gösterir. de faktörü değiştirirken ortalama değerinden x ortalama değerinin% 1'i.
Elastikiyet katsayısı şu formülle bulunur:


Esneklik katsayısı 1'den küçüktür. Dolayısıyla X %1 değişirse, Y %1'den az değişir. Başka bir deyişle, X'in Y üzerindeki etkisi önemli değildir.
beta katsayısı faktör niteliği, sabit bir seviyede sabit kalan bağımsız değişkenlerin değeri ile standart sapma değerine göre değiştiğinde, etkin özelliğin değerinin standart sapma değerinin hangi kısmı ile değişeceğini gösterir:

Şunlar. x'de standart sapma S x değeri kadar bir artış, Y'nin ortalama değerinde 0,74 standart sapma S y kadar bir azalmaya yol açacaktır.
1.4. Yaklaşım hatası.
Mutlak yaklaşım hatasını kullanarak regresyon denkleminin kalitesini değerlendirelim. Ortalama yaklaşım hatası, hesaplanan değerlerin gerçek değerlerden ortalama sapmasıdır:


Hata %15'ten az olduğu için bu denklem regresyon olarak kullanılabilir.
Dağılım analizi.
Varyans analizinin görevi, bağımlı değişkenin varyansını analiz etmektir:
∑(y ben - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
nerede
∑(y ben - y cp) 2 - sapmaların toplam toplamı;
∑(y(x) - y cp) 2 - regresyona bağlı sapmaların karelerinin toplamı (“açıklanan” veya “faktöriyel”);
∑(y - y(x)) 2 - sapmaların karelerinin kalan toplamı.
teorik korelasyon oranı doğrusal bir ilişki için korelasyon katsayısı r xy'ye eşittir.
Herhangi bir bağımlılık biçimi için, bağlantının sıkılığı kullanılarak belirlenir. çoklu korelasyon katsayısı:

Bu katsayı, bağlantının sıkılığını ve modelin doğruluğunu yansıttığı için evrenseldir ve değişkenler arasındaki herhangi bir bağlantı şekli için de kullanılabilir. Tek faktörlü bir korelasyon modeli oluşturulurken, çoklu korelasyon katsayısı katsayısına eşitçift ​​korelasyon r xy .
1.6. Belirleme katsayısı.
(Çoklu) korelasyon katsayısının karesine, faktör özelliğinin varyasyonu tarafından açıklanan sonuçtaki özelliğin varyasyonunun oranını gösteren belirleme katsayısı denir.
Çoğu zaman, belirleme katsayısının bir yorumunu vererek, yüzde olarak ifade edilir.
R 2 \u003d -0,74 2 \u003d 0,5413
şunlar. vakaların %54,13'ünde x'deki değişiklikler y'de bir değişikliğe yol açar. Başka bir deyişle, regresyon denkleminin seçiminin doğruluğu ortalamadır. Y'deki değişimin kalan %45,87'si modelde dikkate alınmayan faktörlerden kaynaklanmaktadır.

bibliyografya

  1. Ekonometri: Ders Kitabı / Ed. I.I. Eliseeva. - M.: Finans ve istatistik, 2001, s. 34..89.
  2. Magnus Ya.R., Katyshev P.K., Peresetsky A.A. Ekonometri. Başlangıç ​​kursu. öğretici. - 2. baskı, Rev. – M.: Delo, 1998, s. 17..42.
  3. Ekonometri üzerine çalıştay: Proc. ödenek / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko ve diğerleri; Ed. I.I. Eliseeva. - M.: Finans ve istatistik, 2001, s. 5..48.