7.3.1. Koeficientët e korrelacionit dhe përcaktimit. Mund të kuantifikohet afërsia e komunikimit ndërmjet faktorëve dhe orientim(e drejtpërdrejtë ose e kundërt) duke llogaritur:

1) nëse është e nevojshme të përcaktohet një marrëdhënie lineare midis dy faktorëve, - koeficienti i çiftit korrelacionet: në 7.3.2 dhe 7.3.3, operacionet e llogaritjes së koeficientit të korrelacionit linear të çiftëzuar Bravais–Pearson ( r) dhe koeficienti i korrelacionit të renditjes në çift të Spearman ( r);

2) nëse duam të përcaktojmë marrëdhënien midis dy faktorëve, por kjo marrëdhënie është qartësisht jolineare, atëherë lidhje korrelacioni ;

3) nëse duam të përcaktojmë marrëdhënien midis një faktori dhe një grupi faktorësh të tjerë - atëherë (ose, në mënyrë ekuivalente, "koeficienti i korrelacionit të shumëfishtë");

4) nëse duam të identifikojmë të izoluar marrëdhënien e një faktori vetëm me një tjetër specifik, i cili është pjesë e grupit të faktorëve që ndikojnë të parin, për të cilin duhet të konsiderojmë ndikimin e të gjithë faktorëve të tjerë të pandryshuar, atëherë koeficienti i korrelacionit privat (i pjesshëm). .

Çdo koeficient korrelacioni (r, r) nuk mund të kalojë 1 në vlerë absolute, pra –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Shenja në koeficientin e korrelacionit përcakton drejtimin e lidhjes: shenja "+" (ose mungesa e një shenje) do të thotë që lidhja drejt (pozitive), shenja “–” - që lidhja e kundërta (negativ). Shenja nuk ka të bëjë fare me ngushtësinë e lidhjes.

Koeficienti i korrelacionit karakterizon marrëdhënien statistikore. Por shpesh është e nevojshme të përcaktohet një lloj tjetër varësie, domethënë: cili është kontributi i një faktori të caktuar në formimin e një faktori tjetër të lidhur. Kjo lloj varësie, me një shkallë të caktuar konvencionaliteti, karakterizohet nga koeficienti i përcaktimit (D ) përcaktohet nga formula D = r 2 ´100% (ku r është koeficienti i korrelacionit Bravais-Pearson, shih 7.3.2). Nëse matjet janë marrë në shkalla e rendit (shkalla e renditjes), atëherë me disa humbje të besueshmërisë, në vend të vlerës së r, vlera e r (koeficienti i korrelacionit të Spearman-it, shih 7.3.3) mund të zëvendësohet në formulë.

Për shembull, nëse marrim si karakteristikë të varësisë së faktorit B nga faktori A koeficientin e korrelacionit r = 0,8 ose r = –0,8, atëherë D = 0,8 2 ´100% = 64%, pra rreth 2 ½ 3. Prandaj, kontributi i faktorit A dhe ndryshimet e tij në formimin e faktorit B është afërsisht 2 ½ 3 nga kontributi total i të gjithë faktorëve në përgjithësi.

7.3.2. Koeficienti i korrelacionit Bravais-Pearson. Procedura për llogaritjen e koeficientit të korrelacionit Bravais-Pearson ( r ) mund të zbatohet vetëm në ato raste kur marrëdhënia konsiderohet në bazë të mostrave që kanë shpërndarje normale frekuencat ( shpërndarje normale ) dhe përftohet nga matje në shkallë intervalesh ose raportesh. Formula e llogaritjes për këtë koeficient korrelacioni është:



å ( x i – )( y i-)

r = .

n×sx×sy

Çfarë tregon koeficienti i korrelacionit? Së pari, shenja në koeficientin e korrelacionit tregon drejtimin e marrëdhënies, përkatësisht: shenja "–" tregon se marrëdhënia e kundërta, ose negativ(ka një tendencë: ndërsa vlerat e njërit faktor zvogëlohen, vlerat përkatëse të faktorit tjetër rriten, dhe me rritjen e tyre, ato zvogëlohen), dhe mungesa e një shenje ose shenjës "+" tregon drejt, ose pozitive lidhjet (ka një tendencë: me një rritje të vlerave të një faktori, vlerat e tjetrit rriten, dhe me një rënie, ato ulen). Së dyti, vlera absolute (e pavarur nga shenja) e koeficientit të korrelacionit tregon ngushtësinë (forcën) e lidhjes. Është e zakonshme të supozohet (përkundrazi në mënyrë konvencionale): për vlerat e r< 0,3 корреляция shumë i dobët, shpesh thjesht nuk merret parasysh, për 0,3 £ r< 5 корреляция i dobët, për 0,5 £ r< 0,7) - mesatare, në 0,7 £ r 0,9 £) - të fortë dhe, së fundi, për r > 0.9 - shume i forte. Në rastin tonë (r » 0.83), marrëdhënia është e kundërt (negative) dhe e fortë.

Kujtojmë që vlerat e koeficientit të korrelacionit mund të jenë në rangun nga -1 në +1. Nëse vlera e r shkon përtej këtyre kufijve, kjo tregon se në llogaritjet u bë një gabim . Nese nje r= 1, kjo do të thotë se lidhja nuk është statistikore, por funksionale - gjë që praktikisht nuk ndodh në sport, biologji, mjekësi. Edhe pse me një numër të vogël matjesh, një përzgjedhje e rastësishme e vlerave që jep një pamje të një marrëdhënie funksionale është e mundur, por një rast i tillë është më pak i mundshëm, aq më i madh është vëllimi i mostrave të krahasuara (n), domethënë numri i çifteve të matjeve të krahasuara.

Tabela e llogaritjes (Tabela 7.1) është ndërtuar sipas formulës.

Tabela 7.1.

Tabela e llogaritjes për llogaritjen Bravais-Pearson

x i y i (x i-) (x i – ) 2 (y i-) (y i – ) 2 (x i – )( y i-)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
në orën 13.00, i = 137 åy i =56,1 =5,1 å( x i - ) 2 \u003d \u003d 1,78 å( y i – ) 2 = = 1,015 å( x i – )( y i – )= = –1,24

Sepse s x = ï ï = ï ï» 0.42, a

s y= ï ï» 0,32, r" –1,24ï (11´0.42´0.32) » –1,24ï 1,48 » –0,83 .

Me fjalë të tjera, ju duhet të dini shumë fort se koeficienti i korrelacionit nuk mundet tejkalojnë 1.0 në vlerë absolute. Kjo shpesh bën të mundur shmangien e gabimeve të mëdha, ose më mirë, gjetjen dhe korrigjimin e gabimeve të bëra në llogaritje.

7.3.3. Koeficienti i korrelacionit Spearman. Siç është përmendur tashmë, është e mundur të zbatohet koeficienti i korrelacionit Bravais-Pearson (r) vetëm në ato raste kur faktorët e analizuar janë afër normales për sa i përket shpërndarjes së frekuencës dhe vlerat e variantit merren nga matjet domosdoshmërisht në shkalla e raporteve ose në shkallën e intervaleve, që ndodh nëse ato shprehen njësitë fizike. Në raste të tjera, gjendet koeficienti i korrelacionit Spearman ( r). Megjithatë, ky raport mund zbatohet edhe në rastet kur lejohet (dhe e dëshirueshme ! ) zbatohet koeficienti i korrelacionit Bravais-Pearson. Por duhet pasur parasysh se procedura për përcaktimin e koeficientit Bravais-Pearson ka më shumë fuqi ("zgjidhja aftësia"), kjo është arsyeja pse r më informuese se r. Edhe me një të madhe n devijimi r mund të jetë i rendit ±10%.

Tabela 7.2 Formula e llogaritjes për koeficientin

x i y i R x R y |d R | d R 2 Koeficienti i korrelacionit Spearman

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 ne përdorim shembullin tonë

12,7 5,10 4,5 6,5 2,0 4,00 për llogaritjen r, por le të ndërtojmë

12,5 5,40 3,0 9,0 6,0 36,00 tabelë tjetër (Tabela 7.2).

13.0 5.10 6.0 6.5 0.5 0.25 Zëvendësoni vlerat:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Ne shohim: r doli të jetë pak

12,4 5,60 2,0 11,0 9,0 81,00 më shumë se r, por kjo është ndryshe

12,3 5,50 1,0 10,0 9,0 81,00 jo shumë e madhe. Në fund të fundit, në

12,7 5,20 4,5 8,0 3,5 12,25 kaq e vogël n vlerat r dhe r

åd R 2 = 423 janë shumë të përafërta, jo shumë të besueshme, vlera e tyre aktuale mund të luhatet shumë, kështu që ndryshimi r dhe r në 0.1 është i parëndësishëm. Zakonishtrkonsiderohet si një analogr , por më pak i saktë. Shenjat në r dhe r tregon drejtimin e lidhjes.

7.3.4. Zbatimi dhe vërtetimi i koeficientëve të korrelacionit. Përcaktimi i shkallës së korrelacionit midis faktorëve është i nevojshëm për të kontrolluar zhvillimin e faktorit që na nevojitet: për këtë, duhet të ndikojmë në faktorë të tjerë që ndikojnë ndjeshëm në të dhe duhet të dimë masën e efektivitetit të tyre. Është e nevojshme të dihet për marrëdhëniet e faktorëve për të zhvilluar ose zgjedhur teste të gatshme: përmbajtja e informacionit të një testi përcaktohet nga korrelacioni i rezultateve të tij me manifestimet e një veçorie ose vetie me interes për ne. Pa njohuri për korrelacionet, çdo formë e përzgjedhjes është e pamundur.

Më lart u theksua se në sport dhe në praktikën e përgjithshme pedagogjike, mjekësore, madje edhe ekonomike dhe sociologjike, është me interes të madh të përcaktohet nëse kontribut , të cilat një faktor kontribuon në formimin e një tjetri. Kjo për faktin se përveç faktorëve të konsideruar-shkaqet mbi objektiv(me interes për ne) akt faktor, secili duke dhënë një ose një tjetër kontribut për të, dhe të tjerët.

Besohet se masa e kontributit të secilit faktor-shkak mund të jetë koeficienti i përcaktimit D i = r 2 ´100%. Kështu, për shembull, nëse r = 0,6, d.m.th. lidhja ndërmjet faktorëve A dhe B është mesatare, atëherë D = 0,6 2 ´100% = 36%. Duke ditur, pra, se kontributi i faktorit A në formimin e faktorit B është afërsisht 1 ½ 3, është e mundur, për shembull, të kushtohet afërsisht 1 ½ 3 herë stërvitje. Nëse koeficienti i korrelacionit r \u003d 0,4, atëherë D \u003d r 2 100% \u003d 16%, ose afërsisht 1 ½ 6 - dy s edhe njehere më pak, dhe sipas kësaj logjike, vetëm 1 ½ 6 pjesë e kohës së trajnimit.

Vlerat e D i për faktorë të ndryshëm të rëndësishëm japin një ide të përafërt të marrëdhënies sasiore të ndikimeve të tyre në faktorin e synuar të interesit për ne, për hir të përmirësimit të të cilit ne, në fakt, po punojmë për faktorë të tjerë ( për shembull, një kërcyes së gjati po punon për të rritur shpejtësinë e sprintit të tij, pra pasi është faktori që jep kontributin më domethënës në formimin e rezultatit në kërcime).

Kujtojmë se duke përcaktuar D në vend të r vënë r, megjithëse, natyrisht, saktësia e përcaktimit është më e ulët.

I bazuar selektive(e llogaritur nga të dhënat e mostrës) të koeficientit të korrelacionit, është e pamundur të konkludohet se fakti i ekzistencës së një lidhjeje midis faktorëve të konsideruar në përgjithësi është i besueshëm. Për të nxjerrë një përfundim të tillë me shkallë të ndryshme vlefshmërie, përdorni standardin kriteret e rëndësisë së korrelacionit. Zbatimi i tyre supozon një marrëdhënie lineare midis faktorëve dhe shpërndarje normale frekuencat në secilën prej tyre (që do të thotë jo një përfaqësim selektiv, por i përgjithshëm i tyre).

Ju, për shembull, mund të aplikoni testet t Student-it. Raca e tij

edhe formula: tp= –2 , ku k është koeficienti i korrelacionit të mostrës së studiuar, a n- vëllimi i mostrave të krahasuara. Vlera e llogaritur që rezulton e kriterit t (t p) krahasohet me vlerën e tabelës në nivelin e rëndësisë që kemi zgjedhur dhe numrin e shkallëve të lirisë n = n - 2. Për të hequr qafe punën e llogaritjes, mund të përdorni një tavolinë të veçantë vlerat kritike të koeficientëve të korrelacionit të mostrës(shih më lart), që korrespondon me praninë e një marrëdhënie të rëndësishme midis faktorëve (duke marrë parasysh n dhe a).

Tabela 7.3.

Vlerat kufitare të besueshmërisë së koeficientit të korrelacionit të mostrës

Numri i shkallëve të lirisë në përcaktimin e koeficientëve të korrelacionit merret i barabartë me 2 (d.m.th. n= 2) Tregohet në tabelë. Vlerat 7.3 kanë një kufi më të ulët në intervalin e besimit e vërtetë koeficienti i korrelacionit është 0, domethënë, me vlera të tilla nuk mund të argumentohet se korrelacioni ndodh fare. Nëse vlera e koeficientit të korrelacionit të mostrës është më e lartë se sa tregohet në tabelë, mund të konsiderohet në nivelin e duhur të rëndësisë që koeficienti i vërtetë i korrelacionit të mos jetë i barabartë me zero.

Por përgjigjja në pyetjen nëse ka një lidhje reale midis faktorëve në shqyrtim lë vend për një pyetje tjetër: në çfarë intervali vlerën e vërtetë koeficienti i korrelacionit, siç mund të jetë në të vërtetë, me një pafundësisht të madh n? Ky interval për çdo vlerë të veçantë r dhe n faktorët e krahasuar mund të llogariten, por është më i përshtatshëm të përdoret një sistem grafikësh ( nomogrami), ku çdo çift kurbash ndërtohet për disa të përcaktuara sipër tyre n, korrespondon me kufijtë e intervalit.

Oriz. 7.4. Kufijtë e besimit të koeficientit të korrelacionit të mostrës (a = 0.05). Çdo kurbë korrespondon me atë mbi të. n.

Duke iu referuar nomogramit në Fig. 7.4, është e mundur të përcaktohet intervali i vlerave të koeficientit të korrelacionit të vërtetë për vlerat e llogaritura të koeficientit të korrelacionit të mostrës në a = 0.05.

7.3.5. marrëdhëniet e korrelacionit. Nëse korrelacioni i çiftit jolineare, është e pamundur të llogaritet koeficienti i korrelacionit, të përcaktohet marrëdhëniet e korrelacionit . Kërkesa e detyrueshme: veçoritë duhet të maten në një shkallë raporti ose në një shkallë intervali. Ju mund të llogarisni varësinë e korrelacionit të faktorit X nga faktori Y dhe varësia nga korrelacioni i faktorit Y nga faktori X- ato janë të ndryshme. Me volum të vogël n mostrat e konsideruara që përfaqësojnë faktorët, për të llogaritur marrëdhëniet e korrelacionit, mund të përdorni formulat:

raporti i korrelacionit h x ½ v= ;

raporti i korrelacionit h y ½ x= .

Këtu dhe janë mesataret aritmetike të mostrave X dhe Y, dhe - brenda klasës mesataret aritmetike. Kjo do të thotë, mesatarja aritmetike e atyre vlerave në kampionin e faktorit X, me të cilin konjugojnë vlera të barabarta në kampionin e faktorit Y (për shembull, nëse faktori X ka vlera 4, 6 dhe 5, me të cilat 3 opsione me të njëjtën vlerë 9 janë konjuguar në mostrën e faktorit Y, atëherë = (4+6+ 5) ½ 3 = 5). Prandaj - mesatarja aritmetike e atyre vlerave në mostrën e faktorit Y, të cilat shoqërohen me të njëjtat vlera në mostrën e faktorit X. Le të japim një shembull dhe të llogarisim:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabela 7.4

Tabela e llogaritjes

x i y i x y x i – x (x i – x) 2 x i - x y (x ix y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Prandaj h y ½ x= » 0,63.

7.3.6. Koeficientët e korrelacionit të pjesshëm dhe të shumëfishtë. Për të vlerësuar lidhjen midis 2 faktorëve, duke llogaritur koeficientët e korrelacionit, supozojmë si parazgjedhje se asnjë faktor tjetër nuk ka ndonjë ndikim në këtë marrëdhënie. Në realitet, nuk është kështu. Pra, marrëdhënia ndërmjet peshës dhe gjatësisë ndikohet shumë nga marrja e kalorive, sasia e aktivitetit fizik sistematik, trashëgimia, etj. Kur është e nevojshme kur vlerësohet marrëdhënia midis 2 faktorëve. marrë parasysh ndikimin e rëndësishëm faktorë të tjerë dhe në të njëjtën kohë si të izolohen prej tyre, duke i konsideruar të pandryshuara, llogarit private (përndryshe - i pjesshëm ) koeficientët e korrelacionit.

Shembull: ju duhet të vlerësoni varësitë e çiftëzuara midis 3 faktorëve thelbësorë X, Y dhe Z. Shënoni r XY (Z) koeficienti i korrelacionit privat (i pjesshëm) midis faktorëve X dhe Y (në këtë rast, vlera e faktorit Z konsiderohet e pandryshuar), r ZX (Y) - koeficienti i korrelacionit të pjesshëm midis faktorëve Z dhe X (me vlerën konstante të faktorit Y), r YZ (X) - koeficienti i korrelacionit të pjesshëm midis faktorëve Y dhe Z (me vlerën konstante të faktorit X). Duke përdorur koeficientët e korrelacionit të llogaritur të thjeshtë të çiftëzuar (sipas Bravais-Pearson) r xy, r XZ dhe r YZ, m

Ju mund të llogaritni koeficientët e korrelacionit privat (të pjesshëm) duke përdorur formulat:

rXY- r XZ' r YZ r XZ- r XY' r Z Y r ZY –r ZX ´ r YZ

r XY (Z) = ; r XZ (Y) = ; r ZY (X) =

Ö(1- r 2XZ)(1- r 2 YZ) Ö(1- r 2XY)(1- r 2 ZY) Ö(1- r 2ZX)(1- r 2YX)

Dhe koeficientët e korrelacionit të pjesshëm mund të marrin vlera nga -1 në +1. Duke i kuadruar ato, marrim koeficientët përkatës koeficientët e përcaktimit quajtur edhe masat private të sigurisë(duke shumëzuar me 100, shprehemi në%%). Koeficientët e korrelacionit të pjesshëm ndryshojnë pak a shumë nga koeficientët e çiftit të thjeshtë (të plotë), i cili varet nga forca e ndikimit të faktorit të tretë (sikur i pandryshuar). Hipoteza zero (H 0), pra hipoteza se nuk ka lidhje (varësi) midis faktorëve X dhe Y, testohet (me numrin total të veçorive k) duke llogaritur testin t sipas formulës: t P = r XY (Z) '' ( n–k) 1 ½ 2' (1- r 2XY(Z)) –1 ½ 2 .

Nese nje t R< t a n, hipoteza pranohet (supozojmë se nuk ka varësi), nëse tt a n - hipoteza është hedhur poshtë, domethënë, besohet se varësia ndodh vërtet. t një n është marrë nga tabela t-Kriteri i studentit, dhe k- numri i faktorëve të marrë parasysh (në shembullin tonë 3), numri i shkallëve të lirisë n= n - 3. Koeficientët e tjerë të korrelacionit të pjesshëm kontrollohen në mënyrë të ngjashme (në formulë në vend të r XY (Z) zëvendësohen në përputhje me rrethanat r XZ (Y) ose r ZY (X)).

Tabela 7.5

Të dhënat fillestare

Ö (1 - 0,71 2) (1 - 0,71 2) Ö (1 - 0,5) (1 - 0,5)

Për të vlerësuar varësinë e faktorit X nga veprimi i kombinuar i disa faktorëve (këtu, faktorët Y dhe Z), llogaritni vlerat e koeficientëve të thjeshtë të korrelacionit të çiftëzuar dhe, duke përdorur ato, llogaritni koeficienti i korrelacionit të shumëfishtë r X (YZ):

Ö r 2XY+ r 2XZ - 2 r XY' r XZ' r YZ

r X (YZ) = .

Ö 1 - r 2 YZ

7.2.7. koeficienti i shoqërimit. Shpesh është e nevojshme të përcaktohet sasia e marrëdhënies ndërmjet cilësisë shenjat, d.m.th. shenja të tilla që nuk mund të përfaqësohen (karakterizohen) në mënyrë sasiore, të cilat të pamatshme. Për shembull, detyra është të zbulohet nëse ka një lidhje midis specializimit sportiv të atyre që janë përfshirë dhe vetive të tilla personale si introversioni (përqendrimi i personalitetit në fenomenet e botës së tij subjektive) dhe ekstraversioni (përqendrimi i personalitetit në botën e objekte të jashtme). Simbolet janë paraqitur në tabelë. 7.6.

Tabela 7.6.

X (vjet) Y (herë) Z (herë) X (vjet) Y (herë) Z (herë)
Tipari 1 Tipari 2 introversioni Ekstraversioni
Lojëra sportive a b
Gjimnastikë Me d

Natyrisht, numrat që kemi në dispozicion këtu mund të jenë vetëm frekuenca të shpërndarjes. Në këtë rast, llogarisni koeficienti i shoqërimit (emri tjeter" koeficienti i kontingjentit "). Konsideroni rasti më i thjeshtë: lidhja midis dy çifteve të veçorive, ndërsa koeficienti i llogaritur i kontingjentit quhet tetrakorike (shih tabelën).

Tabela 7.7.

a = 20 b = 15 a + b = 35
c =15 d=5 c + d = 20
a + c = 35 b + d = 20 n = 55

Ne bëjmë llogaritjet sipas formulës:

pas Krishtit 100-225-123

Llogaritja e koeficientëve të lidhjes (koeficientët e konjugimit) me një numër më të madh karakteristikash shoqërohet me llogaritjet duke përdorur një matricë të ngjashme të rendit përkatës.

Kur studioni korrelacionet përpiquni të përcaktoni nëse ka ndonjë lidhje midis dy treguesve në të njëjtin kampion (për shembull, midis gjatësisë dhe peshës së fëmijëve ose midis nivelit IQ dhe performancën e shkollës) ose midis dy mostrave të ndryshme (për shembull, kur krahasohen çiftet e binjakëve), dhe nëse kjo marrëdhënie ekziston, nëse një rritje në një tregues shoqërohet me një rritje (korrelacion pozitiv) ose një ulje (korrelacion negativ) të tjera.

Me fjalë të tjera, analiza e korrelacionit ndihmon për të përcaktuar nëse është e mundur të parashikohen vlerat e mundshme të një treguesi, duke ditur vlerën e një tjetri.

Deri më tani, kur analizojmë rezultatet e përvojës sonë në studimin e efekteve të marihuanës, ne kemi injoruar qëllimisht një tregues të tillë si koha e reagimit. Ndërkohë, do të ishte interesante të kontrollohej nëse ka një lidhje midis efikasitetit të reaksioneve dhe shpejtësisë së tyre. Kjo do të lejonte, për shembull, të argumentohej se sa më i ngadalshëm të jetë një person, aq më të sakta dhe efektive do të jenë veprimet e tij dhe anasjelltas.

Për këtë qëllim mund të përdoren dy metoda të ndryshme: metoda parametrike për llogaritjen e koeficientit Bravais-Pearson. (r) dhe duke llogaritur koeficientin e korrelacionit të gradave të Spearman (r s ), që vlen për të dhënat rendore, pra është joparametrike. Sidoqoftë, së pari le të kuptojmë se çfarë është një koeficient korrelacioni.

Koeficienti i korrelacionit

Koeficienti i korrelacionit është një vlerë që mund të ndryshojë nga -1 në 1. Në rastin e një korrelacioni të plotë pozitiv, ky koeficient është plus 1, dhe me një negativ të plotë - minus 1. Në grafik, kjo korrespondon me një vijë të drejtë që kalon përmes pikave të kryqëzimit të vlerave të çdo çifti të dhënash:

E ndryshueshme

Nëse këto pika nuk rreshtohen në një vijë të drejtë, por formojnë një "re", vlera absolute e koeficientit të korrelacionit bëhet më e vogël se një dhe i afrohet zeros kur reja rrumbullakohet:

Nëse koeficienti i korrelacionit është 0, të dy variablat janë plotësisht të pavarur nga njëri-tjetri.

Në shkencat humane, një korrelacion konsiderohet i fortë nëse koeficienti i tij është më i madh se 0.60; nëse kalon 0.90, atëherë korrelacioni konsiderohet shumë i fortë. Megjithatë, për të qenë në gjendje të nxirren përfundime rreth marrëdhënieve midis variablave, madhësia e kampionit ka një rëndësi të madhe: sa më i madh të jetë kampioni, aq më e besueshme është vlera e koeficientit të korrelacionit të marrë. Ekzistojnë tabela me vlera kritike të koeficientëve të korrelacionit Bravais-Pearson dhe Spearman për një numër të ndryshëm të shkallëve të lirisë (është e barabartë me numrin e çifteve minus 2, d.m.th. n-2). Vetëm nëse koeficientët e korrelacionit janë më të mëdhenj se këto vlera kritike, ato mund të konsiderohen të besueshme. Pra, në mënyrë që koeficienti i korrelacionit prej 0.70 të jetë i besueshëm, duhet të merren të paktën 8 palë të dhëna në analizë. ( = P - 2 = 6) gjatë llogaritjes r(Tabela B.4) dhe 7 çifte të dhënash (= n - 2 = 5) gjatë llogaritjes r s (Tabela 5 në Shtojcën B. 5).

Koeficienti Bravais–Pearson

Për të llogaritur këtë koeficient, përdoret formula e mëposhtme (y autorë të ndryshëm mund të duket ndryshe):

ku  XY është shuma e produkteve të të dhënave nga çdo çift;

n - numri i çifteve;

- mesatare për të dhënat e ndryshueshme X;

Mesatarja për të dhënat e ndryshueshme Y;

S X - x;

s Y - devijimi standard për shpërndarje y.

Tani mund ta përdorim këtë koeficient për të përcaktuar nëse ka një lidhje midis kohës së reagimit të subjekteve dhe efektivitetit të veprimeve të tyre. Merrni, për shembull, nivelin e sfondit të grupit të kontrollit.

n= 15  15,8  13,4 = 3175,8;

(n 1)S x S y = 14  3,07  2,29 = 98,42;

r =

Një vlerë negative e koeficientit të korrelacionit mund të nënkuptojë se sa më e gjatë të jetë koha e reagimit, aq më i ulët është efikasiteti. Megjithatë, vlera e tij është shumë e vogël për të qenë në gjendje të flitet për një lidhje të rëndësishme midis këtyre dy variablave.

nXY=………

(n- 1) S X S Y = ……

Çfarë përfundimi mund të nxirret nga këto rezultate? Nëse mendoni se ekziston një marrëdhënie midis variablave, atëherë çfarë është ajo - e drejtpërdrejtë apo e kundërt? A është i besueshëm [krh. skedën. 4 (në Shtojcën B. 5) me vlera kritike r]?

Koeficienti i korrelacionit të gradës Spearmanr s

Ky koeficient është më i lehtë për t'u llogaritur, por rezultatet janë më pak të sakta sesa përdorimi r. Kjo për faktin se gjatë llogaritjes së koeficientit Spearman përdoret rendi i të dhënave dhe jo karakteristikat e tyre sasiore dhe intervalet midis klasave.

Çështja është se kur përdoret koeficienti i korrelacionit të rangut Shtizëri(r s ) ata kontrollojnë vetëm nëse renditja e të dhënave për disa mostra do të jetë e njëjtë si në një seri të dhënash të tjera për këtë kampion të çiftëzuar me të parin (për shembull, nëse studentët do të "renditen" në mënyrë të barabartë kur të kalojnë psikologjinë dhe matematikën, ose edhe me dy profesorë të ndryshëm të psikologjisë?). Nëse koeficienti është afër + 1, atëherë kjo do të thotë që të dyja seritë praktikisht përkojnë, dhe nëse ky koeficient është afër - 1, mund të flasim për një marrëdhënie të kundërt të plotë.

Koeficient r s llogaritet sipas formulës

ku d- ndryshimi midis gradave të vlerave të veçorive të konjuguara (pavarësisht nga shenja e tij), dhe n- numri i çifteve.

Në mënyrë tipike, ky test joparametrik përdoret në rastet kur duhet të nxirrni disa përfundime jo aq shumë për intervale mes të dhënave, sa për to gradat, dhe gjithashtu kur kurbat e shpërndarjes janë shumë asimetrike dhe nuk lejojnë përdorimin e kritereve të tilla parametrike si koeficienti r(në këto raste, mund të jetë e nevojshme të konvertohen të dhënat sasiore në të dhëna rendore).

Meqenëse ky është rasti me shpërndarjen e vlerave të efikasitetit dhe kohës së reagimit në grupin eksperimental pas ekspozimit, ju mund të përsërisni llogaritjet që keni bërë tashmë për këtë grup, vetëm tani jo për koeficientin r, dhe për treguesin r s . Kjo do t'ju lejojë të shihni se sa të ndryshëm janë këta dy tregues*.

* Duhet mbajtur mend se

1) për numrin e goditjeve, renditja 1 korrespondon me performancën më të lartë dhe renditja 15 me performancën më të ulët, ndërsa për kohën e reagimit, renditja 1 korrespondon me kohën më të shkurtër, dhe renditja 15 me më të gjatën;

2) të dhënave ex aequo u jepet një gradë mesatare.

Kështu, si në rastin e koeficientit r, mori një rezultat pozitiv, megjithëse jo të besueshëm. Cili nga dy rezultatet është më i besueshëm: r=-0,48 ose r s = +0,24? Një pyetje e tillë mund të lindë vetëm nëse rezultatet janë të besueshme.

Dua të theksoj edhe një herë se thelbi i këtyre dy koeficientëve është disi i ndryshëm. Koeficienti negativ r tregon se efikasiteti është më shpesh sa më i lartë, aq më i shpejtë është koha e reagimit, ndërsa kur llogaritet koeficienti r s ishte e nevojshme të kontrollohej nëse subjektet më të shpejtë reagojnë gjithmonë më saktë, dhe ata më të ngadaltë më pak saktë.

Meqenëse në grupin eksperimental, pas ekspozimit, u mor një koeficient r s , e barabartë me 0.24, një trend i tillë padyshim nuk gjurmohet këtu. Përpiquni të kuptoni vetë të dhënat për grupin e kontrollit pas ekspozimit, duke e ditur se  d 2 = 122,5:

; a është e besueshme?

Cili është përfundimi juaj?…………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Pra, ne kemi shqyrtuar metoda të ndryshme statistikore parametrike dhe joparametrike të përdorura në psikologji. Rishikimi ynë ishte shumë sipërfaqësor dhe detyra e tij kryesore ishte t'i bënte lexuesit të kuptonte se statistikat nuk janë aq të frikshme sa duken dhe kërkojnë kryesisht sens të përbashkët. Kujtojmë se të dhënat e “përvojës” me të cilat jemi marrë këtu janë fiktive dhe nuk mund të shërbejnë si bazë për asnjë përfundim. Sidoqoftë, një eksperiment i tillë ia vlen të bëhej. Meqenëse për këtë eksperiment u zgjodh një teknikë thjesht klasike, e njëjta analizë statistikore mund të përdoret në shumë eksperimente të ndryshme. Në çdo rast, na duket se kemi përvijuar disa drejtime kryesore që mund të jenë të dobishme për ata që nuk dinë se ku ta nisin analizën statistikore të rezultateve.

Ekzistojnë tre degë kryesore të statistikave: statistika përshkruese, statistika induktive dhe analiza e korrelacionit.

Analiza e regresionit ju lejon të vlerësoni se si një variabël varet nga një tjetër dhe cila është përhapja e vlerave të ndryshores së varur rreth vijës së drejtë që përcakton marrëdhënien. Këto vlerësime dhe intervalet përkatëse të besimit bëjnë të mundur parashikimin e vlerës së ndryshores së varur dhe përcaktimin e saktësisë së këtij parashikimi.

Rezultatet e analizës së regresionit mund të paraqiten vetëm në një formë mjaft komplekse dixhitale ose grafike. Sidoqoftë, shpesh ne jemi të interesuar të mos parashikojmë vlerën e një ndryshoreje nga vlera e një tjetri, por thjesht të karakterizojmë ngushtësinë (forcën) e marrëdhënies midis tyre, ndërsa shprehet si një numër i vetëm.

Kjo karakteristikë quhet koeficienti i korrelacionit, zakonisht shënohet me shkronjën r. Koeficienti i korrelacionit mund të jetë

mund të marrë vlera nga -1 në +1. Shenja e koeficientit të korrelacionit tregon drejtimin e lidhjes (drejtpërdrejt ose anasjelltas), dhe vlera absolute tregon afërsinë e lidhjes. Një koeficient i barabartë me -1 përcakton të njëjtën lidhje të ngurtë si të barabartë me 1. Në mungesë të një lidhjeje, koeficienti i korrelacionit është zero.

Në fig. 8.10 tregon shembuj të varësive dhe vlerat e tyre përkatëse të r. Ne do të shqyrtojmë dy koeficientë korrelacioni.

Koeficienti i korrelacionit Pearson synon të përshkruajë marrëdhënien lineare të tipareve sasiore; si regresioni
analiza jonike, kërkon një shpërndarje normale. Kur njerëzit thjesht flasin për "koeficientin e korrelacionit" ata pothuajse gjithmonë nënkuptojnë koeficientin e korrelacionit të Pearson, dhe kjo është pikërisht ajo që ne do të bëjmë.

Koeficienti i korrelacionit të rangut të Spearman mund të përdoret kur marrëdhënia është jolineare - dhe jo vetëm për karakteristikat sasiore, por edhe për tiparet rendore. Kjo është një metodë joparametrike dhe nuk kërkon ndonjë lloj të veçantë shpërndarjeje.

Ne kemi folur tashmë për veçoritë sasiore, cilësore dhe rendore në kapitull. 5. Shenjat sasiore janë të dhëna të zakonshme numerike, si lartësia, pesha, temperatura. vlerat tipar sasior ju mund të krahasoni me njëri-tjetrin dhe të thoni se cili prej tyre është më i madh, për sa dhe sa herë. Për shembull, nëse një marsian peshon 15 g dhe tjetri 10, atëherë i pari është më i rëndë se i dyti një herë e gjysmë dhe 5 g sa herë. Në mjekësi, shenjat rendore janë mjaft të zakonshme. Për shembull, rezultatet e një Pap testi vaginal vlerësohen në shkallën e mëposhtme: 1) normale, 2) displazi e lehtë, 3) displazi e moderuar, 4) displazi e rëndë, 5) kancer in situ. Si shenjat sasiore ashtu edhe ato rendore mund të organizohen në rregull - për këtë pronë e përbashkët bazuar në një grup të madh kriteresh joparametrike, të cilat përfshijnë koeficientin e korrelacionit të gradës Spearman. Me kritere të tjera joparametrike do të njihemi në kapitull. dhjetë.

Koeficienti i korrelacionit Pearson

E megjithatë, pse nuk mund të përdoret analiza e regresionit për të përshkruar ngushtësinë e marrëdhënies? Devijimi standard i mbetur mund të përdoret si një masë e afërsisë së marrëdhënies. Megjithatë, nëse ndërroni variablat e varur dhe të pavarur, atëherë devijimi standard i mbetur, si treguesit e tjerë të analizës së regresionit, do të jetë i ndryshëm.

Le të shohim fig. 8.11. Bazuar në një mostër prej 10 marsianësh të njohur për ne, u ndërtuan dy linja regresioni. Në një rast, pesha është ndryshorja e varur, në rastin e dytë është ndryshorja e pavarur. Linjat e regresionit janë dukshëm të ndryshme



20

Nëse ndërroni x dhe y, ekuacioni i regresionit do të jetë i ndryshëm, por koeficienti i korrelacionit do të mbetet i njëjtë.

shpresë. Rezulton se lidhja e gjatësisë me peshën është një, dhe pesha me gjatësinë është një tjetër. Asimetria e analizës së regresionit është ajo që e pengon atë të përdoret drejtpërdrejt për të karakterizuar forcën e një marrëdhënieje. Koeficienti i korrelacionit, megjithëse ideja e tij buron nga analiza e regresionit, është i lirë nga kjo mangësi. Ne paraqesim formulën.

rY(X - X)(Y - Y)

&((- X) S(y - Y) 2"

ku X dhe Y janë vlerat mesatare të variablave X dhe Y. Shprehja për r është "simetrike" - duke shkëmbyer X dhe Y, marrim të njëjtën vlerë. Koeficienti i korrelacionit merr vlera nga -1 në +1. Sa më e afërt të jetë marrëdhënia, aq më e madhe është vlera absolute e koeficientit të korrelacionit. Shenja tregon drejtimin e lidhjes. Për r > 0, flasim për një korrelacion të drejtpërdrejtë (me një rritje në një variabël, tjetra gjithashtu rritet), për r Le të marrim shembullin me 10 marsianë, të cilin e kemi shqyrtuar tashmë nga pikëpamja e analizës së regresionit. Le të llogarisim koeficientin e korrelacionit. Të dhënat fillestare dhe rezultatet e ndërmjetme të llogaritjeve janë dhënë në tabelë. 8.3. Madhësia e kampionit n = 10, lartësia mesatare

X = £ X/n = 369/10 = 36,9 dhe pesha Y = £ Y/n = 103,8/10 = 10,38.

Gjejmë Shch-X)(Y-Y) = 99.9, Shch-X)2 = 224.8, £(Y - Y)2 = 51.9.

Le të zëvendësojmë vlerat e marra në formulën për koeficientin e korrelacionit:

224,8 x 51,9''

Vlera e r është afër 1, që tregon një marrëdhënie të ngushtë midis lartësisë dhe peshës. Për të pasur një ide më të mirë se cili koeficient korrelacioni duhet të konsiderohet i madh dhe cili duhet të konsiderohet i parëndësishëm, hidhini një sy

Tabela 8.3. Llogaritja e koeficientit të korrelacionit
X Y X-X Y-Y (X-X) (Y-Y) (X-X)2 (Y-Y)2
31 7,8 -5,9 -2,6 15,3 34,8 6,8
32 8,3 -4,9 -2,1 10,3 24,0 4,4
33 7,6 -3,9 -2,8 10,9 15,2 7,8
34 9,1 -2,9 -1,3 3,8 8,4 1,7
35 9,6 -1,9 -0,8 1,5 3,6 0,6
35 9,8 -1,9 -0,6 1,1 3,6 0,4
40 11,8 3,1 1,4 4,3 9,6 2,0
41 12,1 4,1 1,7 7,0 16,8 2,9
42 14,7 5,1 4,3 22,0 26,0 18,5
46 13,0 9,1 2,6 23,7 82,8 6,8
369 103,8 0,0 0,2 99,9 224,8 51,9


ato në tavolinë. 8.4 - tregon koeficientët e korrelacionit për shembujt që kemi analizuar më parë.

Marrëdhënia midis regresionit dhe korrelacionit

Fillimisht kemi përdorur të gjithë shembujt e koeficientëve të korrelacionit (Tabela 8.4) për të ndërtuar linja regresioni. Në të vërtetë, ekziston një lidhje e ngushtë midis koeficientit të korrelacionit dhe parametrave të analizës së regresionit, të cilin do ta demonstrojmë tani. Mënyrat e ndryshme të paraqitjes së koeficientit të korrelacionit, që do të marrim në këtë rast, do të na lejojnë të kuptojmë më mirë kuptimin e këtij treguesi.

Kujtojmë se ekuacioni i regresionit është ndërtuar në mënyrë të tillë që të minimizojë shumën e devijimeve në katror nga vija e regresionit.


Këtë shumë minimale katrorësh e shënojmë me S (kjo vlerë quhet shuma e mbetur e katrorëve). Shuma e devijimeve në katror të vlerave të ndryshores së varur Y nga mesatarja e saj Y do të shënohet me S^. Pastaj:

Vlera e r2 quhet koeficienti i përcaktimit - është thjesht katrori i koeficientit të korrelacionit. Koeficienti i përcaktimit tregon forcën e lidhjes, por jo drejtimin e saj.

Nga formula e mësipërme mund të shihet se nëse vlerat e ndryshores së varur qëndrojnë në regresionin e drejtpërdrejtë, atëherë S = 0, dhe kështu r = +1 ose r = -1, domethënë ekziston një marrëdhënie lineare midis ndryshorja e varur dhe e pavarur. Çdo vlerë e ndryshores së pavarur mund të parashikojë me saktësi vlerën e ndryshores së varur. Përkundrazi, nëse variablat nuk janë fare të lidhur, atëherë Soci = SofSisi Pastaj r = 0.

Mund të shihet gjithashtu se koeficienti i përcaktimit është i barabartë me atë pjesë të variancës totale S^, e cila shkaktohet ose, siç thonë ata, shpjegohet nga regresioni linear.

Shuma e mbetur e katrorëve S lidhet me variancën e mbetur s2y\x nga relacioni Socj = (n - 2) s^, dhe shuma totale e katrorëve S^ lidhet me variancën s2 nga relacioni S^ = (n - 1)s2. Në këtë rast

r2 = 1 _ n _ 2 sy\x n _1 sy

Kjo formulë bën të mundur gjykimin e varësisë së koeficientit të korrelacionit nga pjesa e variancës së mbetur në variancën totale.

gjashtë/s2y Sa më i vogël ky raport, aq më i madh (në vlerë absolute) është koeficienti i korrelacionit dhe anasjelltas.

Kemi parë që koeficienti i korrelacionit pasqyron ngushtësinë e marrëdhënies lineare të variablave. Megjithatë, nëse po flasim në lidhje me parashikimin e vlerës së një ndryshoreje nga vlera e një tjetri,
mbi koeficientin e korrelacionit nuk duhet mbështetur shumë. Për shembull, të dhënat në Fig. 8.7 korrespondon me një koeficient shumë të lartë korrelacioni (r = 0.92), por gjerësia e rajonit të besimit tregon se pasiguria e parashikimit është mjaft domethënëse. Prandaj, edhe me një koeficient të madh korrelacioni, sigurohuni që të llogaritni diapazonin e besimit.


Dhe në fund, ne japim raportin e koeficientit të korrelacionit dhe koeficientit të pjerrësisë së regresionit të drejtpërdrejtë b:

ku b është pjerrësia e vijës së regresionit, sx dhe sY janë devijimet standarde të variablave.

Nëse nuk marrim parasysh rastin sx = 0, atëherë koeficienti i korrelacionit është i barabartë me zero nëse dhe vetëm nëse b = 0. Tani do ta përdorim këtë fakt për të vlerësuar rëndësinë statistikore të korrelacionit.

Rëndësia statistikore e korrelacionit

Meqenëse b = 0 nënkupton r = 0, hipoteza e mungesës së korrelacionit është ekuivalente me hipotezën e pjerrësisë zero të regresionit të drejtpërdrejtë. Prandaj, për të vlerësuar rëndësinë statistikore të korrelacionit, mund të përdorim formulën e njohur tashmë për vlerësimin e rëndësisë statistikore të ndryshimit midis b dhe zeros:

Këtu numri i shkallëve të lirisë është v = n - 2. Megjithatë, nëse koeficienti i korrelacionit tashmë është llogaritur, është më e përshtatshme të përdoret formula:

Numri i shkallëve të lirisë këtu është gjithashtu v = n - 2.

Me pangjashmërinë e jashtme të dy formulave për t, ato janë identike. Në të vërtetë, nga çfarë


r 2 _ 1 - n_ 2 Sy]x_

Zëvendësimi i vlerës së sy^x në formulën për gabimin standard

Yndyra shtazore dhe kanceri i gjirit

Në eksperimentet në kafshë laboratorike, është treguar se një përmbajtje e lartë e yndyrës shtazore në dietë rrit rrezikun e kancerit të gjirit. A vërehet kjo varësi tek njerëzit? K. Carroll mblodhi të dhëna për konsumin e yndyrave shtazore dhe vdekshmërinë nga kanceri i gjirit në 39 vende. Rezultati është treguar në fig. 8.12A. Koeficienti i korrelacionit midis konsumit të yndyrave shtazore dhe vdekshmërisë nga kanceri i gjirit u gjet të ishte 0.90. Le të vlerësojmë rëndësinë statistikore të korrelacionit.

0,90 1 - 0,902 39 - 2

Vlera kritike e t për numrin e shkallëve të lirisë v = 39 - 2 = 37 është 3.574, që është më e vogël se ajo e marrë nga ne. Kështu, në një nivel të rëndësisë prej 0,001, mund të argumentohet se ekziston një korrelacion midis marrjes së yndyrës shtazore dhe vdekshmërisë nga kanceri i gjirit.

Tani le të kontrollojmë nëse vdekshmëria lidhet me konsumimin e yndyrave bimore? Të dhënat përkatëse janë paraqitur në fig. 8.12B. Koeficienti i korrelacionit është 0.15. Pastaj

1 - 0,152 39 - 2

Edhe në një nivel të rëndësisë prej 0.10, vlera e llogaritur e t është më e vogël se vlera kritike. Korrelacioni nuk është statistikisht i rëndësishëm.

Koeficienti i korrelacionitështë një vlerë që mund të ndryshojë nga +1 në -1. Në rastin e një korrelacioni të plotë pozitiv, ky koeficient është i barabartë me plus 1 (ata thonë se me një rritje të vlerës së një ndryshoreje, vlera e një ndryshoreje tjetër rritet), dhe me një korrelacion të plotë negativ - minus 1 (tregoni reagimet d.m.th., me rritjen e vlerave të njërës ndryshore, vlerat e tjetrës zvogëlohen).

Shembulli 1:

Grafiku i varësisë së ndrojtjes dhe depresionit. Siç mund ta shihni, pikat (subjektet) nuk janë të vendosura në mënyrë të rastësishme, por rreshtohen rreth një rreshti dhe, duke parë këtë rresht, mund të themi se sa më e lartë të shprehet ndrojtja tek një person, aq më depresive, pra këto dukuri. janë të ndërlidhura.

Shembulli 2: Grafiku për drojën dhe shoqërueshmërinë. Shohim që me rritjen e ndrojtjes, zvogëlohet shoqërueshmëria. Koeficienti i korrelacionit të tyre është -0.43. Kështu, një koeficient korrelacioni më i madh nga 0 në 1 tregon një marrëdhënie proporcionale (sa më shumë ... aq më shumë ...), dhe një koeficient nga -1 në 0 tregon një marrëdhënie në përpjesëtim të zhdrejtë (sa më shumë ... aq më pak . ..)

Nëse koeficienti i korrelacionit është 0, të dy variablat janë plotësisht të pavarur nga njëri-tjetri.

korrelacioni- kjo është një marrëdhënie ku ndikimi i faktorëve individualë shfaqet vetëm si tendencë (mesatarisht) me vëzhgimin masiv të të dhënave aktuale. Shembuj të varësisë së korrelacionit mund të jenë varësia midis madhësisë së aktiveve të bankës dhe shumës së fitimit të bankës, rritja e produktivitetit të punës dhe kohëzgjatja e shërbimit të punonjësve.

Përdoren dy sisteme të klasifikimit të korrelacioneve sipas fuqisë së tyre: të përgjithshme dhe të veçanta.

Klasifikimi i përgjithshëm i korrelacioneve: 1) i fortë, ose i ngushtë me një koeficient korrelacioni prej r> 0.70; 2) i mesëm në 0.500.70, dhe jo vetëm një korrelacion nivel të lartë rëndësinë.

Tabela e mëposhtme liston emrat e koeficientëve të korrelacionit për lloje të ndryshme shkallësh.

Shkalla dikotomike (1/0) Shkalla e gradave (rendore).
Shkalla dikotomike (1/0) Koeficienti i shoqërimit të Pearson-it, koeficienti i konjugimit me katër qeliza të Pearson-it. Korrelacioni biserial
Shkalla e gradave (rendore). Korrelacioni rang-biserial. Koeficienti i korrelacionit të gradës së Spearman ose Kendall.
Intervali dhe shkalla absolute Korrelacioni biserial Vlerat e shkallës së intervalit shndërrohen në gradë dhe përdoret koeficienti i renditjes Koeficienti i korrelacionit Pearson (koeficienti i korrelacionit linear)

r=0 nuk ka korrelacion linear. Në këtë rast, mesataret e grupit të variablave përputhen me mesataret e tyre të përgjithshme, dhe linjat e regresionit janë paralele me boshtet koordinative.

Barazia r=0 flet vetëm për mungesën e një varësie korrelacioni linear (variabla të pakorreluara), por jo në përgjithësi për mungesën e një korrelacioni dhe aq më tepër për një varësi statistikore.

Ndonjëherë përfundimi se nuk ka korrelacion është më i rëndësishëm se prania e një korrelacioni të fortë. Një korrelacion zero i dy variablave mund të tregojë se nuk ka ndikim të njërës ndryshore në tjetrën, me kusht që t'u besojmë rezultateve të matjeve.

Në SPSS: 11.3.2 Koeficientët e korrelacionit

Deri më tani, ne kemi zbuluar vetëm faktin e ekzistencës së një marrëdhënie statistikore midis dy veçorive. Më tej, ne do të përpiqemi të zbulojmë se cilat përfundime mund të nxirren për forcën ose dobësinë e kësaj varësie, si dhe për formën dhe drejtimin e saj. Kriteret kuantifikimi varësitë ndërmjet variablave quhen koeficientë korrelacioni ose masa të lidhjes. Dy variabla janë të korreluara pozitivisht nëse ka një marrëdhënie të drejtpërdrejtë, të njëanshme midis tyre. Në një marrëdhënie të njëanshme, vlerat e vogla të njërës ndryshore korrespondojnë me vlerat e vogla të ndryshores tjetër, vlerat e mëdha korrespondojnë me ato të mëdha. Dy variabla janë të korreluara negativisht nëse ka një lidhje të anasjelltë midis tyre. Me një marrëdhënie shumëdrejtimëshe, vlerat e vogla të njërës ndryshore korrespondojnë me vlerat e mëdha të ndryshores tjetër dhe anasjelltas. Vlerat e koeficientëve të korrelacionit janë gjithmonë në rangun nga -1 në +1.

Koeficienti i Spearman-it përdoret si koeficient korrelacioni midis variablave që i përkasin shkallës rendore, dhe koeficienti i korrelacionit të Pearson (momenti i produkteve) përdoret për variablat që i përkasin shkallës së intervalit. Në këtë rast, duhet theksuar se çdo ndryshore dikotomike, pra një variabël që i përket shkallës nominale dhe ka dy kategori, mund të konsiderohet si rendore.

Së pari, do të kontrollojmë nëse ka një korrelacion midis variablave të seksit dhe psikikës nga skedari studium.sav. Duke vepruar kështu, marrim parasysh se ndryshorja dikotomike seksi mund të konsiderohet si një ndryshore rendore. Bëni sa vijon:

Zgjidhni nga menyja e komandave Analiza (Analiza) Statistikat përshkruese (Statistikat përshkruese) Crosstabs... (Tabelat e paparashikuara)

· Zhvendosni variablin seks në një listë rreshtash dhe psikikën e ndryshueshme në një listë kolonash.

· Klikoni butonin Statistika.... Në dialogun Crosstabs: Statistics, kontrolloni kutinë Korrelacione. Konfirmoni zgjedhjen tuaj me butonin Vazhdo.

· Në dialogun Crosstabs, ndaloni shfaqjen e tabelave duke kontrolluar kutinë e kontrollit Supress tabelat. Klikoni butonin OK.

Do të llogariten koeficientët e korrelacionit Spearman dhe Pearson dhe do të testohet rëndësia e tyre:

/ Teori. Koeficienti i korrelacionit

Koeficienti i korrelacionit- statistika përshkruese dydimensionale, një masë sasiore e marrëdhënies (ndryshueshmëria e përbashkët) e dy variablave.

Deri më sot, një numër i madh i koeficientë të ndryshëm korrelacionet. Megjithatë, masat më të rëndësishme të komunikimit janë Pearson, Spearman dhe Kendall . Ata tipar i përbashkët eshte ajo ato pasqyrojnë marrëdhënien e dy veçorive , matur në një shkallë sasiore - gradë ose metrikë .

Në përgjithësi, ndonjë hulumtim empirik fokusuar në studimin e marrëdhënieve ndërmjet dy ose më shumë variablave .

Nëse një ndryshim në një variabël me një njësi rezulton gjithmonë në një ndryshim në variablin tjetër me të njëjtën sasi, funksioni është lineare (grafiku i tij është një vijë e drejtë); ndonjë lidhje tjetër jolineare . Nëse një rritje në një variabël shoqërohet me një rritje në një tjetër, atëherë lidhje - pozitive ( drejt ) ; nëse një rritje në një variabël shoqërohet me një rënie në një tjetër, pastaj lidhja - negativ ( e kundërta ) . Nëse drejtimi i ndryshimit të një ndryshoreje nuk ndryshon me rritjen (uljen) e një ndryshoreje tjetër, atëherë një funksion i tillë është monotone ; përndryshe thirret funksioni jo monotonike .

Lidhjet funksionale janë idealizime. E veçanta e tyre qëndron në faktin se një vlerë e një ndryshoreje korrespondon me një vlerë të përcaktuar rreptësisht të një ndryshoreje tjetër. Për shembull, e tillë është marrëdhënia e dy ndryshoreve fizike - pesha dhe gjatësia e trupit (lineare pozitive). Sidoqoftë, edhe në eksperimentet fizike, marrëdhënia empirike do të ndryshojë nga marrëdhënia funksionale për arsye të pa llogaritura ose të panjohura: luhatje në përbërjen e materialit, gabime në matje, etj.

Kur studion marrëdhëniet e veçorive, studiuesi humbet në mënyrë të pashmangshme shumë arsye të mundshme për ndryshueshmërinë e këtyre veçorive. Rezultati është se edhe marrëdhënia funksionale midis variablave që ekziston në realitet shfaqet empirikisht si probabiliste (stokastike): e njëjta vlerë e një ndryshoreje korrespondon me shpërndarjen e vlerave të ndryshme të një ndryshoreje tjetër (dhe anasjelltas).

Shembulli më i thjeshtë është raporti i gjatësisë dhe peshës së njerëzve. Rezultatet empirike të studimit të këtyre dy shenjave, natyrisht, do të tregojnë marrëdhënien e tyre pozitive. Por është e lehtë të merret me mend se do të ndryshojë nga një ideal i rreptë, linear, pozitiv funksioni matematik, edhe me të gjitha truket e studiuesit për të marrë parasysh harmoninë apo plotësinë e subjekteve. Nuk ka gjasa që mbi këtë bazë t'i shkonte ndërmend dikujt të mohojë ekzistencën e një marrëdhënieje të rreptë funksionale midis gjatësisë dhe peshës së trupit.

Kështu që, ndërlidhja funksionale e dukurive mund të zbulohet empirikisht vetëm si një lidhje probabilistike e veçorive përkatëse.

Një paraqitje vizuale e natyrës së marrëdhënies probabilistike jepet nga një diagram shpërndarje - një grafik, boshtet e të cilit korrespondojnë me vlerat e dy ndryshoreve, dhe secila temë është një pikë. Koeficientët e korrelacionit përdoren si një karakteristikë numerike e një lidhjeje probabilistike.

Ju mund të futni tre shkallëzime të vlerave të korrelacionit sipas fuqisë së lidhjes:

r< 0,3 - слабая связь (менее 10% от общей доли дисперсии);

0,3 < r < 0,7 - умеренная связь (от 10 до 50% от общей доли дисперсии);

r > 0.7 - lidhje e fortë (50% ose më shumë e variancës totale).

Korrelacion i pjesshëm

Shpesh ndodh që dy variabla të ndërlidhen me njëra-tjetrën vetëm për faktin se të dyja ndryshojnë nën ndikimin e ndonjë ndryshoreje të tretë. Kjo është, në fakt, nuk ka asnjë lidhje midis vetive përkatëse të këtyre dy variablave, por ajo manifestohet në marrëdhënie statistikore, ose korrelacione, nën ndikim shkaku i përbashkët variabli i tretë).

Kështu, nëse korrelacioni ndërmjet dy variablave zvogëlohet, me një variabël të tretë të rastit fiks, atëherë kjo do të thotë se ndërvarësia e tyre lind pjesërisht përmes ndikimit të kësaj ndryshoreje të tretë. Nëse korrelacioni i pjesshëm është zero ose shumë i vogël, atëherë mund të konkludojmë se ndërvarësia e tyre është tërësisht për shkak të ndikimit të tyre dhe në asnjë mënyrë nuk lidhet me variablin e tretë.

Gjithashtu, nëse korrelacioni i pjesshëm është më i madh se korrelacioni fillestar ndërmjet dy variablave, atëherë mund të konkludohet se variablat e tjerë e kanë dobësuar lidhjen, ose e kanë “fshehur” korrelacionin.

Përveç kësaj, duhet të mbahet mend se korrelacioni nuk është shkakësi . Nisur nga kjo, nuk kemi të drejtë të flasim kategorikisht për prezencën shkakësore: burimi i këtij korrelacioni mund të jetë një variabël krejtësisht i ndryshëm nga ato të konsideruara në analizë. Si në korrelacionet e zakonshme ashtu edhe ato të pjesshme, supozimi i shkakësisë duhet të ketë gjithmonë bazat e veta jostatistikore.

Koeficienti i korrelacionit Pearson

r- Pearson përdoret për të studiuar marrëdhëniet e dy variablave metrikë , matur në të njëjtën mostër . Ka shumë situata në të cilat është e përshtatshme për ta përdorur atë. A ndikon inteligjenca në performancën universitare? A lidhet paga e një punonjësi me vullnetin e tij të mirë ndaj kolegëve? A ndikon gjendja shpirtërore e një studenti në suksesin e zgjidhjes së një problemi kompleks aritmetik? Për t'iu përgjigjur pyetjeve të tilla, studiuesi duhet të matë dy tregues me interes për secilin anëtar të kampionit.

Vlera e koeficientit të korrelacionit nuk ndikohet nga njësitë në të cilat paraqiten tiparet. Prandaj, çdo transformimet lineare tiparet (shumëzimi me një konstante, shtimi i një konstante) nuk e ndryshojnë vlerën e koeficientit të korrelacionit. Një përjashtim është shumëzimi i një prej shenjave me një konstante negative: koeficienti i korrelacionit ndryshon shenjën e tij në të kundërtën.

Korrelacioni Pearson është një masë e marrëdhënies lineare midis dy variablave . Kjo ju lejon të përcaktoni , sa proporcionale është ndryshueshmëria e dy variablave . Nëse variablat janë në përpjesëtim me njëri-tjetrin, atëherë grafikisht lidhja ndërmjet tyre mund të paraqitet si një vijë e drejtë me një pjerrësi pozitive (përpjesëtim të drejtëpërdrejtë) ose negativ (proporcion të kundërt).

Në praktikë, marrëdhënia midis dy variablave, nëse ka, është probabiliste dhe grafikisht duket si një re shpërndarje elipsoidale. Ky elipsoid, megjithatë, mund të përfaqësohet (i përafërt) si një vijë e drejtë, ose një vijë regresioni. vija e regresionit është një vijë e drejtë me më pak katrorë: shuma e distancave në katror (llogaritur përgjatë boshtit y) nga çdo pikë e grafikut të shpërndarjes në vijën e drejtë është minimale.

Rëndësi të veçantë për vlerësimin e saktësisë së parashikimit ka varianca e vlerësimeve të ndryshores së varur. Në thelb, varianca e vlerësimeve të ndryshores së varur Y është ajo pjesë e variancës totale të saj që është për shkak të ndikimit të ndryshores së pavarur X. Me fjalë të tjera, raporti i variancës së vlerësimeve të ndryshores së varur ndaj variancës së saj të vërtetë është e barabartë me katrorin e koeficientit të korrelacionit.

Katrori i koeficientit të korrelacionit të variablave të varur dhe të pavarur paraqet proporcionin e variancës së ndryshores së varur për shkak të ndikimit të ndryshores së pavarur dhe quhet koeficienti i përcaktimit . Prandaj, koeficienti i përcaktimit tregon shkallën në të cilën ndryshueshmëria e një variabli shkaktohet (përcaktohet) nga ndikimi i një ndryshoreje tjetër.

Koeficienti i përcaktimit ka një avantazh të rëndësishëm ndaj koeficientit të korrelacionit. Korrelacioni nuk është funksion linear marrëdhëniet midis dy variablave. Prandaj, mesatarja aritmetike e koeficientëve të korrelacionit për disa mostra nuk përkon me korrelacionin e llogaritur menjëherë për të gjitha subjektet nga këto mostra (d.m.th., koeficienti i korrelacionit nuk është shtesë). Përkundrazi, koeficienti i përcaktimit pasqyron lidhjen në mënyrë lineare dhe, për rrjedhojë, është shtesë: mund të mesatarizohet në disa mostra.

Informacion shtesë për forcën e lidhjes jepet nga vlera e koeficientit të korrelacionit në katror - koeficienti i përcaktimit: kjo është pjesa e variancës së një ndryshore që mund të shpjegohet me ndikimin e një ndryshoreje tjetër. Në ndryshim nga koeficienti i korrelacionit, koeficienti i përcaktimit rritet në mënyrë lineare me një rritje të fuqisë së lidhjes.

Koeficientët e korrelacionit Spearman dhe τ-Kendall (korrelacionet e rangut). Nëse të dy variablat ndërmjet të cilëve po studiohet marrëdhënia paraqiten në një shkallë rendore, ose njëra prej tyre është në një shkallë rendore dhe tjetra është në një shkallë metrike, atëherë aplikohen koeficientët e korrelacionit të renditjes: Spearman ose τ - Kendella . Dhe ai , dhe koeficienti tjetër kërkon renditjen paraprake të të dy variablave për zbatimin e tij .

Koeficienti i korrelacionit të gradës së Spearman - kjo është një metodë joparametrike , që përdoret për qëllimin e studimit statistikor të marrëdhënies ndërmjet dukurive . Në këtë rast, përcaktohet shkalla aktuale e paralelizmit midis dy serive sasiore të veçorive të studiuara dhe një vlerësim i ngushtësisë së marrëdhënies së vendosur jepet duke përdorur një koeficient të shprehur në mënyrë sasiore.

Nëse anëtarët e grupit janë renditur së pari nga ndryshorja x dhe më pas nga ndryshorja y, atëherë korrelacioni midis ndryshoreve x dhe y mund të merret thjesht duke llogaritur koeficientin Pearson për dy seritë e rangut. Duke supozuar se nuk ka lidhje në renditje (d.m.th., nuk ka renditje të përsëritura) për asnjërën variabël, formula për Pearson mund të thjeshtohet shumë në mënyrë llogaritëse dhe të shndërrohet në një formulë të njohur si Shtizëri .

Fuqia e koeficientit të korrelacionit të gradës Spearman është disi inferiore ndaj fuqisë së koeficientit të korrelacionit parametrik.

Këshillohet që të përdoret koeficienti i korrelacionit të renditjes në prani të një numri të vogël vëzhgimesh . Kjo metodë mund të përdoret për më shumë sesa thjesht të dhëna sasiore , por edhe në rastet , kur vlerat e regjistruara përcaktohen nga veçori përshkruese me intensitet të ndryshëm .

Koeficienti i korrelacionit të rangut të Spearman me një numër të madh renditjesh identike për njërën ose të dyja variablat e krahasuar jep vlera të përafërta. Në mënyrë ideale, të dyja seritë e ndërlidhura duhet të jenë dy sekuenca vlerash të papërputhshme

Një alternativë ndaj korrelacionit Spearman për gradat është korrelacioni τ-kendall . Korrelacioni i propozuar nga M. Kendall bazohet në idenë se drejtimi i lidhjes mund të gjykohet duke krahasuar subjektet në çifte: nëse një palë subjektesh ka një ndryshim në x që përkon në drejtim me një ndryshim në y, atëherë kjo tregon një marrëdhënie pozitive, nëse nuk përputhet - diçka për një marrëdhënie negative.

Koeficientët e korrelacionit janë krijuar posaçërisht për të përcaktuar numerikisht forcën dhe drejtimin e një marrëdhënieje midis dy vetive të matura në shkallë numerike.(metrik ose rang).

Siç është përmendur tashmë, Vlerat e korrelacionit +1 (marrëdhënie e rreptë direkte ose drejtpërdrejt proporcionale) dhe -1 (marrëdhënie e rreptë inverse ose anasjelltas proporcionale) korrespondojnë me forcën maksimale të marrëdhënies, korrelacioni i barabartë me zero korrespondon me mungesën e një marrëdhënieje.

Informacion shtesë për forcën e lidhjes jepet nga vlera e koeficientit të përcaktimit: është pjesa e variancës së një ndryshoreje që mund të shpjegohet me ndikimin e një ndryshoreje tjetër.

Tema 12 Analiza e korrelacionit

Varësia dhe korrelacioni funksional. Edhe Hipokrati në shekullin VI. para Krishtit e. tërhoqi vëmendjen për ekzistencën e një lidhjeje midis fizikut dhe temperamentit të njerëzve, midis strukturës së trupit dhe predispozicionit ndaj sëmundjeve të caktuara. Disa lloje të një lidhjeje të tillë janë identifikuar edhe tek kafsha dhe florës. Pra, ekziston një marrëdhënie midis fizikut dhe produktivitetit te kafshët e fermës; dihet marrëdhënia ndërmjet cilësisë së farës dhe rendimentit të bimëve etj. Sa i përket varësive të tilla në ekologji, ka varësi midis përmbajtjes së metaleve të rënda në tokë dhe mbulesës së borës nga përqendrimi i tyre në ajri atmosferik etj. Prandaj, është e natyrshme të përpiqemi ta përdorim këtë rregullsi në interes të njeriut, për t'i dhënë një shprehje sasiore pak a shumë të saktë.

Siç e dini, për të përshkruar marrëdhëniet midis variablave, ne përdorim koncepti matematik funksione f, i cili i cakton çdo vlere specifike të ndryshores së pavarur x vlerë të caktuar të ndryshores së varur y, d.m.th. . Ky lloj i marrëdhënies së paqartë midis variablave x dhe y thirrur funksionale. Sidoqoftë, marrëdhënie të tilla nuk gjenden gjithmonë në objektet natyrore. Prandaj, marrëdhënia midis karakteristikave biologjike dhe ekologjike nuk është funksionale, por statistikore në natyrë, kur në masën e individëve homogjenë një vlerë e caktuar e një atributi të konsideruar si argument nuk korrespondon me të njëjtën vlerë numerike, por me një gamë të tërë. të vlerave numerike të shpërndara në një seri variacionale vlerat e një veçorie tjetër të konsideruar si një variabël ose funksion i varur. Ky lloj marrëdhënieje ndërmjet variablave quhet korrelacioni ose korrelacion..

Marrëdhëniet funksionale janë të lehta për t'u zbuluar dhe matur në objekte të vetme dhe grupore, por kjo nuk mund të bëhet me korrelacione, të cilat mund të studiohen vetëm në objekte grupore duke përdorur metoda statistika matematikore. Marrëdhënia e korrelacionit midis veçorive mund të jetë lineare dhe jolineare, pozitive dhe negative. Detyra e analizës së korrelacionit reduktohet në përcaktimin e drejtimit dhe formës së një marrëdhënieje midis veçorive të ndryshme, matjen e ngushtësisë së saj dhe, së fundi, në verifikimin e besueshmërisë së treguesve të korrelacionit të mostrës.

Varësia ndërmjet variablave X dhe Y mund të shprehet në mënyrë analitike (duke përdorur formula dhe ekuacione) dhe grafikisht (si vendndodhja e pikave në një sistem koordinativ drejtkëndor). Grafiku i korrelacionit ndërtohet sipas ekuacionit të funksionit ose , i cili quhet regresioni. Këtu dhe janë mjetet aritmetike që gjenden nën kushtin që X ose Y do të marrë disa vlera x ose y. Këto mesatare quhen kushtëzuar.

11.1. Treguesit parametrikë të komunikimit

Koeficienti i korrelacionit. Lidhja midis variablave x dhe y mund të përcaktohet duke krahasuar vlerat numerike të njërës prej tyre me vlerat përkatëse të tjetrës. Nëse një rritje në një variabël rrit një tjetër, kjo tregon lidhje pozitive ndërmjet këtyre vlerave, dhe anasjelltas, kur një rritje në një variabël shoqërohet me një ulje të vlerës së një tjetri, kjo tregon lidhje negative.

Për të karakterizuar marrëdhënien, drejtimin e saj dhe shkallën e konjugimit të variablave, përdoren treguesit e mëposhtëm:

    varësia lineare - koeficienti i korrelacionit;

    jolineare - raporti i korrelacionit.

Formula e mëposhtme përdoret për të përcaktuar koeficientin empirik të korrelacionit:

. (1)

Këtu s x dhe s y janë devijime standarde.

Koeficienti i korrelacionit mund të llogaritet pa përdorur llogaritjen e devijimeve standarde, gjë që thjeshton punën llogaritëse, duke përdorur formulën e mëposhtme të ngjashme:

. (2)

Koeficienti i korrelacionit është një numër pa dimension që varion nga –1 në +1. Me variacion të pavarur të shenjave, kur lidhja midis tyre mungon plotësisht, . Sa më e fortë të jetë kontingjenti midis veçorive, aq më e lartë është vlera e koeficientit të korrelacionit. Rrjedhimisht, në këtë tregues karakterizohet jo vetëm prania, por edhe shkalla e konjugimit midis shenjave. Me një marrëdhënie pozitive ose të drejtpërdrejtë, kur vlerat e mëdha të një atributi korrespondojnë me vlerat e mëdha të tjetrit, koeficienti i korrelacionit ka një shenjë pozitive dhe varion nga 0 në +1, me një marrëdhënie negative ose reagime, kur vlera të mëdha i një atributi korrespondon me vlera më të vogla të tjetrit, koeficienti i korrelacionit shoqërohet me një shenjë negative dhe varion nga 0 në -1.

Koeficienti i korrelacionit ka gjetur aplikim të gjerë në praktikë, por nuk është një tregues universal i korrelacioneve, pasi është në gjendje të karakterizojë vetëm marrëdhënie lineare, d.m.th. e shprehur me një ekuacion të regresionit linear (shih temën 12). Nëse disponohet, jo varësia lineare ndërmjet shenjave të ndryshme, përdoren tregues të tjerë të lidhjes, të diskutuar më poshtë.

Llogaritja e koeficientit të korrelacionit. Kjo llogaritje bëhet në mënyra të ndryshme dhe në mënyra të ndryshme në varësi të numrit të vëzhgimeve (madhësia e kampionit). Le të shqyrtojmë veçmas specifikat e llogaritjes së koeficientit të korrelacionit në prani të mostrave të vogla dhe mostrave të mëdha.

Mostra të vogla. Në prani të mostrave të vogla, koeficienti i korrelacionit llogaritet drejtpërdrejt nga vlerat e veçorive të konjuguara, pa grupim paraprak të të dhënave të mostrës në seri variacionesh. Për këtë përdoren formulat e mësipërme (1) dhe (2). Më i përshtatshëm, veçanërisht në praninë e numrave shumëshifrorë dhe thyesorë, të cilët shprehin devijimet e variantit. X i dhe y i nga mesataret dhe , shërbejnë formulat e mëposhtme të punës:

ku ;

;

Këtu x i dhe y i– variante të çiftëzuara të veçorive të konjuguara x dhe y; dhe janë mjete aritmetike; - ndryshimi midis varianteve të çiftëzuara të veçorive të konjuguara x dhe y; nnumri total vëzhgime të çiftuara, ose madhësia e kampionit.

Koeficienti empirik i korrelacionit, si çdo tregues tjetër i mostrës, shërben si një vlerësim i tij parametër i përgjithshëm ρ dhe si vlera e rastësishme shoqërohet me një gabim:

Raporti i koeficientit të korrelacionit të mostrës me gabimin e tij shërben si kriter për testimin e hipotezës zero - supozimi se në popullatë ky parametër është i barabartë me zero, d.m.th. . Hipoteza zero hidhet poshtë në nivelin e pranuar të rëndësisë. α , nëse

vlerat pikat kritike t rr për nivele të ndryshme të rëndësisë α dhe numrat e shkallëve të lirisë janë dhënë në tabelën 1 të shtojcës.

Është konstatuar se gjatë përpunimit të mostrave të vogla (veçanërisht kur n< 30 ) llogaritja e koeficientit të korrelacionit me formula (1) - (3) jep vlerësime disi të nënvlerësuara të parametrit të përgjithshëm ρ , d.m.th. duhet bërë ndryshimi i mëposhtëm:

Fisher z-transformimi. Aplikimi i saktë koeficienti i korrelacionit supozon një shpërndarje normale të një grupi dy-dimensional të vlerave të konjuguara të ndryshoreve të rastit x dhe y. Nga statistikat matematikore dihet se nëse ekziston një korrelacion domethënës ndërmjet variablave, d.m.th. kur R xy > 0,5 shpërndarja e mostrës së koeficientit të korrelacionit për më shumë mostrat e vogla të marra nga një popullatë e shpërndarë normalisht devijojnë ndjeshëm nga kurba normale.

Duke pasur parasysh këtë rrethanë, R. Fisher gjeti një mënyrë më të saktë për të vlerësuar parametrin e përgjithshëm me vlerën e koeficientit të korrelacionit të mostrës. Kjo metodë është për t'u zëvendësuar R xy vlera e transformuar e z, e cila lidhet me koeficientin e korrelacionit empirik, si më poshtë:

Shpërndarja e vlerës z është pothuajse e pandryshuar në formë, pasi nuk varet shumë nga madhësia e kampionit dhe nga vlera e koeficientit të korrelacionit në popullatën e përgjithshme, dhe i afrohet një shpërndarjeje normale.

Kriteri për besueshmërinë e treguesit z është raporti i mëposhtëm:

Hipoteza zero hidhet poshtë në nivelin e pranuar të rëndësisë α dhe numri i shkallëve të lirisë. Vlerat e pikave kritike t rr janë dhënë në Tabelën 1 të Aplikacioneve.

Aplikacion z-transformohet lejon më shumë besim në vlerësimin e rëndësisë statistikore të koeficientit të korrelacionit të mostrës, si dhe ndryshimin midis koeficientëve empirikë kur është e nevojshme.

Madhësia minimale e mostrës për një vlerësim të saktë të koeficientit të korrelacionit.Është e mundur të llogaritet madhësia e kampionit për një vlerë të caktuar të koeficientit të korrelacionit, i cili do të ishte i mjaftueshëm për të hedhur poshtë hipotezën zero (nëse korrelacioni midis veçorive Y dhe X ekziston vërtet). Për këtë, përdoret formula e mëposhtme:

ku nështë madhësia e dëshiruar e mostrës; tështë vlera e specifikuar sipas nivelit të pranuar të rëndësisë (më mirë për α = 1%); zështë koeficienti i korrelacionit empirik i konvertuar.

Mostra të mëdha. Në prani të të dhënave të shumta fillestare, ato duhet të grupohen në seri variacionale dhe, duke ndërtuar një rrjetë korrelacioni, ndryshimi në qelizat (qelizat) e tij është frekuenca totale e serive të konjuguara. Rrjeta e korrelacionit formohet nga kryqëzimi i rreshtave dhe kolonave, numri i të cilave është i barabartë me numrin e grupeve ose klasave të serive të korreluara. Klasat janë të vendosura në rreshtin e sipërm dhe në kolonën e parë (të majtë) të tabelës së korrelacionit, dhe frekuencat e zakonshme, të shënuara me simbolin f xy, – në qelizat e rrjetit të korrelacionit, i cili është pjesa kryesore e tabelës së korrelacionit.

Klasat e vendosura në rreshtin e sipërm të tabelës zakonisht renditen nga e majta në të djathtë në rend rritës, dhe në kolonën e parë të tabelës - nga lart poshtë në rend zbritës. Me një rregullim të tillë të klasave të serive variacionale, frekuencat e tyre të përbashkëta (në prani të një marrëdhënieje pozitive midis shenjave Y dhe X) do të shpërndahet mbi qelizat e rrjetit në formën e një elipsi diagonalisht nga këndi i poshtëm i majtë në këndin e sipërm të djathtë të rrjetës ose (nëse ka një marrëdhënie negative midis veçorive) në drejtim nga këndi i sipërm i majtë në këndi i poshtëm i djathtë i rrjetës. Nëse frekuencat f xy shpërndahen mbi qelizat e rrjetit të korrelacionit pak a shumë në mënyrë të barabartë, pa formuar një elips, kjo do të tregojë mungesën e një korrelacioni midis shenjave.

Shpërndarja e frekuencës f xy nga qelizat e rrjetës së korrelacionit jep vetëm ide e pergjithshme për praninë ose mungesën e një marrëdhënieje midis veçorive. Gjykojeni ngushtësinë ose më pak saktë vetëm nga kuptimi dhe shenja koeficienti i korrelacionit. Kur llogaritet koeficienti i korrelacionit nga një grupim paraprak i të dhënave të mostrës në seritë e variacionit të intervalit, nuk duhet të merren intervale shumë të gjera klasash. Grupimi i përafërt ka një efekt shumë më të fortë në vlerën e koeficientit të korrelacionit sesa është rasti kur llogariten mesataret dhe treguesit e variacionit.

Kujtojmë se vlera e intervalit të klasës përcaktohet nga formula

ku x maksimumi , x min- variantet maksimale dhe minimale të popullsisë; teështë numri i klasave në të cilat duhet të ndahet variacioni i veçorive. Përvoja ka treguar se në fushën e analizës së korrelacionit, vlera te mund të vihet në varësi të madhësisë së kampionit përafërsisht si më poshtë (Tabela 1).

Tabela 1

Madhësia e mostrës

vlera K

50 ≥ n > 30

100 ≥ n > 50

200 ≥ n > 100

300 ≥ n > 200

Ashtu si karakteristikat e tjera statistikore të llogaritura me një grupim paraprak të të dhënave fillestare në seri variacionesh, edhe koeficienti i korrelacionit përcaktohet në mënyra të ndryshme, duke dhënë rezultate krejtësisht identike.

Mënyra e punimeve. Koeficienti i korrelacionit mund të llogaritet duke përdorur formulat bazë (1) ose (2), duke i korrigjuar ato për përsëritshmërinë e variantit në popullatën e dimerit. Në të njëjtën kohë, duke thjeshtuar simbolikën, devijimet e varianteve nga mesataret e tyre do të shënohen me a, d.m.th. dhe . Pastaj formula (2), duke marrë parasysh shpeshtësinë e devijimeve, do të marrë shprehjen e mëposhtme:

Besueshmëria e këtij treguesi vlerësohet duke përdorur testin e Studentit, i cili përfaqëson raportin e koeficientit të korrelacionit të mostrës me gabimin e tij, të përcaktuar nga formula

Prandaj, dhe nëse kjo vlerë tejkalon vlera standarde Testi i studentit t st për shkallën e lirisë dhe nivelin e rëndësisë α (shih Tabelën 2 të Shtojcës), më pas asnje hipoteze refuzoj.

Metoda e mesatareve të kushtëzuara. Gjatë llogaritjes së koeficientit të korrelacionit të devijimit, varianti ("klasat") mund të gjendet jo vetëm nga mesataret aritmetike dhe , por edhe nga mesataret e kushtëzuara A x dhe A y . Me këtë metodë, numëruesi i formulës (2) ndryshohet dhe formula merr formën e mëposhtme:

ku f xy janë frekuencat e klasave të njërës dhe tjetrës seri të shpërndarjes; dhe , d.m.th. devijimet e klasave nga mesataret e kushtëzuara, të lidhura me madhësinë e intervaleve të klasave λ ; nështë numri i përgjithshëm i vëzhgimeve të çiftuara, ose madhësia e kampionit; dhe janë momente të kushtëzuara të rendit të parë, ku f x– frekuencat e serive X, a f y– frekuencat e serive Y; s x dhe s y janë devijimet standarde të serisë X dhe Y, llogaritur me formulën .

Metoda e mesatareve të kushtëzuara ka një avantazh ndaj metodës së produkteve, pasi ju lejon të shmangni operacionet me numra thyesorë dhe t'i jepni të njëjtën shenjë (pozitive) devijimeve. a x dhe a y, e cila thjeshton teknikën e punës llogaritëse, veçanërisht në prani të numrave shumëshifrorë.

Vlerësimi i diferencës ndërmjet koeficientëve të korrelacionit. Kur krahasojmë koeficientët e korrelacionit të dy mostrave të pavarura, hipoteza zero reduktohet në supozimin se në popullatën e përgjithshme diferenca midis këtyre treguesve është zero. Me fjalë të tjera, duhet të vazhdohet nga supozimi se diferenca e vërejtur midis koeficientëve të krahasuar të korrelacionit empirik ka lindur rastësisht.

Për të testuar hipotezën zero përdoret testi i Studentit t, d.m.th. raporti i diferencës ndërmjet koeficientëve të korrelacionit empirik R 1 dhe R 2 ndaj gabimit të tij statistikor, i përcaktuar nga formula:

ku s R1 dhe s R2 janë gabimet e koeficientëve të krahasuar të korrelacionit.

Hipoteza zero hidhet poshtë me kusht që për nivelin e pranuar të rëndësisë α dhe numri i shkallëve të lirisë.

Dihet se një vlerësim më i saktë i besueshmërisë së koeficientit të korrelacionit merret duke përkthyer R xy në numër z. Vlerësimi i diferencës ndërmjet koeficientëve të korrelacionit të mostrës nuk bën përjashtim. R 1 dhe R 2 , veçanërisht në ato raste kur këto të fundit llogariten në mostra të një madhësie relativisht të vogël ( n< 100 ) dhe në vlerën e tyre absolute tejkalojnë dukshëm 0,50.

Diferenca vlerësohet duke përdorur testin t Studentit, i cili ndërtohet në lidhje me këtë diferencë me gabimin e tij, i llogaritur me formulën

Hipoteza zero refuzohet nëse për dhe niveli i pranuar i rëndësisë α.

lidhje korrelacioni. Për të matur marrëdhëniet jolineare ndërmjet variablave x dhe y përdorni një tregues të quajtur lidhje korrelacioni, i cili përshkruan marrëdhënien në mënyrë të dyanshme. Ndërtimi i një relacioni korrelacioni përfshin një krahasim të dy llojeve të variacionit: ndryshueshmërinë e vëzhgimeve individuale në lidhje me mesataret e pjesshme dhe ndryshimin e vetë mesatareve të pjesshme në krahasim me mesataren e përgjithshme. Sa më e vogël të jetë pjesa e komponentit të parë në raport me të dytin, aq më e madhe do të jetë afërsia e lidhjes. Në kufi, kur nuk do të vërehet asnjë ndryshim i vlerave individuale të atributit pranë mesatareve të pjesshme, ngushtësia e lidhjes do të jetë jashtëzakonisht e madhe. Në mënyrë të ngjashme, në mungesë të ndryshueshmërisë në mjetet e pjesshme, ngushtësia e marrëdhënies do të jetë minimale. Meqenëse ky raport i variacionit mund të konsiderohet për secilën nga dy tiparet, fitohen dy tregues të ngushtësisë së marrëdhënies - h yx dhe h xy. Raporti i korrelacionit është një vlerë relative dhe mund të marrë vlera nga 0 në 1. Në këtë rast, koeficientët e raportit të korrelacionit zakonisht nuk janë të barabartë me njëri-tjetrin, d.m.th. . Barazia midis këtyre treguesve është e realizueshme vetëm me një marrëdhënie rreptësisht lineare midis veçorive. Raporti i korrelacionit është një tregues universal: ju lejon të karakterizoni çdo formë korrelacioni - si linear ashtu edhe jolinear.

Koeficientët e korrelacionit h yx dhe h xy përcaktohet nga metodat e diskutuara më sipër, d.m.th. metoda e produkteve dhe metoda e mesatareve të kushtëzuara.

Mënyra e punimeve. Koeficientët e korrelacionit h yx dhe h xy përcaktohet nga formulat e mëposhtme:

ku dhe janë variancat e grupit,

dhe dhe janë variancat e zakonshme.

Këtu, dhe janë mjetet e zakonshme aritmetike, dhe dhe janë mjetet aritmetike të grupit; f yi– frekuencat e serive Y, a f xi– frekuencat e serive X; k– numri i klasave; nështë numri i veçorive të ndryshueshme.

Formulat e punës për llogaritjen e koeficientëve të raportit të korrelacionit janë si më poshtë:

Metoda e mesatareve të kushtëzuara. Përcaktimi i koeficientëve të relacionit të korrelacionit sipas formulave (15), devijimet e variantit të klasës. x i dhe y i mund të merret jo vetëm nga mjetet aritmetike dhe , por edhe nga mjetet e kushtëzuara А x dhe A y . Në raste të tilla, grupi dhe devijimet totale llogariten duke përdorur formulat dhe , dhe gjithashtu, dhe , ku dhe .

Në formë të zgjeruar, formulat (15) duken si më poshtë:

;

. (17)

Në këto formula, dhe janë devijime të klasave nga mesataret e kushtëzuara, të reduktuara me vlerën e intervaleve të klasave; vlerat a y dhe a x shprehen me numra natyrorë: 0, 1, 2, 3, 4, .... Pjesa tjetër e simboleve janë shpjeguar më sipër.

Duke krahasuar metodën e produkteve me metodën e mesatareve të kushtëzuara, nuk mund të mos vërehet përparësia e metodës së parë, veçanërisht në ato raste kur duhet të merret me numra shumëshifrorë. Ashtu si treguesit e tjerë të mostrës, raporti i korrelacionit është një vlerësim i parametrit të tij të përgjithshëm dhe, si një vlerë e rastësishme, shoqërohet nga një gabim i përcaktuar nga formula

Besueshmëria e vlerësimit të marrëdhënies së korrelacionit mund të kontrollohet me anë të testit t Studentit. H 0 -hipoteza rrjedh nga supozimi se parametri i përgjithshëm është i barabartë me zero, d.m.th. duhet të plotësohet kushti i mëposhtëm:

për numrin e shkallëve të lirisë dhe nivelin e rëndësisë α.

Koeficienti i përcaktimit. Për të interpretuar vlerat e marra nga treguesit e afërsisë së korrelacionit, përdorni koeficientët e përcaktimit, të cilat tregojnë se çfarë përqindje e variacionit të një veçorie varet nga variacioni i një tipari tjetër. Në prani të një marrëdhënieje lineare, koeficienti i përcaktimit është katrori i koeficientit të korrelacionit R2 xy, dhe në rastin e një marrëdhënieje jolineare midis shenjave y dhe xështë katrori i raportit të korrelacionit h2 yx . Koeficientët e përcaktimit japin bazë për të ndërtuar shkallën e mëposhtme të përafërt, e cila bën të mundur gjykimin e afërsisë së marrëdhënies midis shenjave: kur marrëdhënia konsiderohet mesatare; tregon një lidhje të dobët dhe vetëm kur është e mundur të gjykohet një lidhje e fortë, kur rreth 50% e variacionit të tiparit Y varet nga variacioni i tipareve X.

Vlerësimi i Formave të Komunikimit. Me një marrëdhënie rreptësisht lineare midis variablave y dhe x arrihet barazia. Në raste të tilla, koeficientët e raportit të korrelacionit përkojnë me vlerën e koeficientit të korrelacionit. Në këtë rast, koeficientët e përcaktimit do të përkojnë gjithashtu në vlerën e tyre, d.m.th. . Prandaj, nga ndryshimi midis këtyre vlerave, mund të gjykohet forma e varësisë së korrelacionit midis variablave y dhe x:

Natyrisht, me një marrëdhënie lineare midis variablave y dhe x eksponenti γ do të jetë i barabartë me zero; nëse lidhja ndërmjet variablave y dhe x jolineare, γ > 0.

Treguesi γ është një vlerësim i parametrit të përgjithshëm dhe, si një vlerë e rastësishme, duhet të verifikohet. Në këtë rast, ne vazhdojmë nga supozimi se marrëdhënia ndërmjet sasive y dhe x lineare (hipoteza zero). Kriteri F i Fisher ju lejon të testoni këtë hipotezë:

ku a- numri i grupeve, ose klasave seri variacionesh; N është madhësia e mostrës. Hipoteza zero refuzohet nëse për (gjeni horizontalisht në tabelën 2 të shtojcës), (gjeni në kolonën e parë të së njëjtës tabelë) dhe niveli i pranuar i rëndësisë α.

Përcaktimi i rëndësisë së një korrelacioni

Klasifikimet e koeficientëve të korrelacionit

Koeficientët e korrelacionit karakterizohen nga forca dhe rëndësia.

Klasifikimi i koeficientëve të korrelacionit sipas fuqisë.

Klasifikimi i koeficientëve të korrelacionit sipas rëndësisë.

Këto 2 klasifikime nuk duhen ngatërruar, pasi ato përcaktojnë karakteristika të ndryshme. Një korrelacion i fortë mund të rezultojë i rastësishëm dhe, për rrjedhojë, i pabesueshëm. Kjo është veçanërisht e vërtetë për madhësi të vogla të mostrave. Dhe në një kampion të madh, edhe një korrelacion i dobët mund të jetë shumë domethënës.

Pas llogaritjes së koeficientit të korrelacionit, është e nevojshme të parashtrohen hipoteza statistikore:

H 0: Indeksi i korrelacionit nuk është dukshëm i ndryshëm nga zero (është i rastësishëm).

H 1: treguesi i korrelacionit është dukshëm i ndryshëm nga zero (është jo i rastësishëm).

Testimi i hipotezave kryhet duke krahasuar koeficientët empirikë të përftuar me vlerat kritike tabelare. Nëse vlera empirike arrin vlerën kritike ose e tejkalon atë, atëherë hipoteza zero hidhet poshtë: r emp ≥ r cr Ho, Þ H 1 . Në raste të tilla, arrihet në përfundimin se është konstatuar një ndryshim domethënës.

Nëse vlera empirike nuk e kalon vlerën kritike, atëherë hipoteza zero nuk refuzohet: r emp< r кр Þ Н 0 . В таких случаях делают вывод, что достоверность различий не установлена.

/ Statistikat / Korrelacioni

Llogaritja e matricës së koeficientëve të çiftit

korrelacionet

Për të llogaritur matricën e koeficientëve të korrelacionit të çiftëzuar, thirrni menunë Matricat e korrelacionit modul Bazatstatistikat e të dhënave.

Oriz. 1 Paneli kryesor i modulit të statistikave

Ne do të shqyrtojmë fazat kryesore të analizës së korrelacionit në sistemin STATISTICA duke përdorur të dhënat e shembullit (shih Fig. 2). Të dhënat fillestare janë rezultatet e vëzhgimeve të aktiviteteve të 23 ndërmarrjeve në një nga industritë.

Fig.2 Të dhënat fillestare

Kolonat e tabelës përmbajnë treguesit e mëposhtëm:

RENTABEL - rentabiliteti,%;

NDAJENI skllevër - gravitet specifik punëtorë në PPP, njësi;

FUNDOOTD - kthimi në aktive, njësi;

FONDI KAPITALI - vlera mesatare vjetore e aktiveve fikse të prodhimit, milion rubla;

NEPRRASH - shpenzime joprodhuese, mijë rubla. Kërkohet të hetohet varësia e përfitimit nga të tjerët

tregues të tjerë.

Le të supozojmë se karakteristikat në shqyrtim në popullatën e përgjithshme i binden ligjit të shpërndarjes normale dhe të dhënat e vëzhgimit përfaqësojnë një mostër nga popullata.

Le të llogarisim koeficientët e korrelacionit në çift midis të gjitha variablave. Pas zgjedhjes së një rreshti Matricat e korrelacionit në ekran do të shfaqet një kuti dialogu. Korrelacionet Pearson. Emri është për faktin se për herë të parë ky koeficient ishte Pearson, Edgeworth dhe Weldon.

Le të zgjedhim variablat për analizë. Ekzistojnë dy butona në kutinë e dialogut për këtë: Sheshi matricë(një listë) dhe Drejtkëndëshe matricë(dy lista).


Oriz. 3 Kutia e dialogut të analizës së korrelacionit

Butoni i parë është krijuar për të llogaritur matricën e zakonshme. formë simetrike me koeficientë të çiftëzuar korrelacioni të të gjitha kombinimeve të variablave. Nëse të gjithë treguesit përdoren në analizë, atëherë në kutinë e dialogut të përzgjedhjes së ndryshoreve, mund të klikoni butonin Zgjidhni të gjitha. (Nëse variablat nuk janë të njëpasnjëshëm, ato mund të zgjidhen me një klikim të mausit me tastin e shtypur njëkohësisht ctrl)


Nëse shtypni butonin Detajet kuti dialogu, emrat e gjatë do të shfaqen për çdo variabël. Duke klikuar sërish këtë buton (ai do të marrë emrin Shkurtimisht), marrim emra të shkurtër.

Butoni Informacion hap një dritare për variablin e zgjedhur, ku mund të shikoni karakteristikat e saj: emri i gjatë, formati i shfaqjes, lista e renditur e vlerave, statistikat përshkruese (numri i vlerave, mesatarja, devijimi standard).

Pasi të zgjidhni variablat, shtypni OK ose butonin Korrelacion kuti dialogu Korrelacionet Pearson. Matrica e llogaritur e korrelacionit do të shfaqet në ekran.

Koeficientët e rëndësishëm të korrelacionit janë theksuar me të kuqe në ekran.

Në shembullin tonë, treguesi i përfitueshmërisë doli të ishte më i lidhur me treguesit produktiviteti i kapitalit(lidhje direkte) dhe kostot e prodhimit(feedback që sugjeron se V zvogëlohet ndërsa X rritet). Por sa afër lidhen shenjat? Një marrëdhënie e ngushtë konsiderohet kur vlerat e koeficientit të modulit janë më të mëdha se 0.7 dhe të dobëta - më pak se 0.3. Kështu, në ndërtimin e mëtejshëm të ekuacionit të regresionit, duhet të kufizoheni në treguesit "Kthimi i produktit" dhe "Kostot joprodhuese" si më informuesit.

Megjithatë, në shembullin tonë, ekziston një fenomen shumëngjyrësh, kur ka një lidhje midis vetë variablave të pavarur (moduli i koeficientit të korrelacionit të çiftit më i madh se 0.8).

Opsioni matricë drejtkëndore (dy lista variablash) hap një kuti dialogu për zgjedhjen e dy listave të variablave. Vendoseni siç tregohet


Si rezultat, marrim një matricë korrelacioni drejtkëndëshe që përmban vetëm koeficientët e korrelacionit me variablin e varur.


Nëse opsioni është vendosur Korr. Matrica (theksimi i rëndësishëm), pastaj pasi të keni shtypur butonin Korrelacioni do të ndërtohet një matricë me koeficientë të theksuar në nivelin e rëndësisë R.


Nëse zgjidhet opsioni Tabela e detajuar e rezultateve, më pas duke shtypur butonin Korrelacionet, marrim një tabelë që përmban jo vetëm koeficientët e korrelacionit, por edhe mesataret, devijimet standarde, koeficientët e ekuacionit të regresionit, një term të lirë në ekuacionin e regresionit dhe statistika të tjera


Kur variablat kanë variacion të vogël relativ (devijimi standard do të thotë më pak se 0.00000000000001), kërkohet një vlerësim më i lartë. Mund të vendoset duke kontrolluar kutinë e kontrollit Llogaritjet me saktësi të lartë në kutinë e dialogut Pearson Correlations.

Mënyra e funksionimit me të dhëna që mungojnë përcaktohet nga opsioni Fshirja rresht pas rreshti i PD. Nëse zgjidhet, STATISTIKA do të injorojë të gjitha vëzhgimet që kanë boshllëqe. Përndryshe, ato hiqen në çifte.

Kutia e kontrollit Trego emrat e variablave të gjata do të rezultojë në një tabelë me emra të gjatë të variablave.

Paraqitja grafike e varësive të korrelacionit

Kutia e dialogut Pearson Correlation përmban një sërë butonash për të marrë imazh grafik varësitë e korrelacionit.

Opsioni i grafikut të shpërndarjes 2M ndërton një sekuencë të grafikëve të shpërndarjes për secilën ndryshore të zgjedhur. Dritarja për zgjedhjen e tyre është identike me Figurën 6. Në të majtë, duhet të tregoni variablat e varur, në të djathtë, të pavarur - RENTABLE. Duke klikuar OK, do të marrim një grafik që do të tregojë vijën e regresionit të kapërcyer dhe kufijtë e besimit të parashikimit.

Koeficienti linear i korrelacionit jep vlerësimin më objektiv të ngushtësisë së lidhjes, nëse vendndodhja e pikave në sistemin e koordinatave ngjan me një vijë të drejtë ose një elipse të zgjatur, por nëse pikat janë të vendosura në formën e një kurbë, atëherë koeficienti i korrelacionit jep një nënvlerësim.

Në bazë të grafikut, mund të konfirmojmë edhe një herë lidhjen midis përfitimit dhe kthimit të aktiveve, pasi të dhënat e vëzhgimit janë rregulluar në formën e një elipsi të prirur. Duhet thënë se lidhja konsiderohet sa më afër, aq më afër janë pikat me boshtin kryesor të elipsit.

Në shembullin tonë, një ndryshim në normën e kthimit të aktiveve për njësi do të çojë në një ndryshim të përfitueshmërisë me 5,7376%.

Le të shohim ndikimin e kostove joprodhuese në vlerën e përfitimit. Për ta bërë këtë, ne do të ndërtojmë një grafik të ngjashëm

Të dhënat e analizuara janë më pak si një elips në formë, dhe koeficienti i korrelacionit është disi më i ulët. Vlera e gjetur e koeficientit të regresionit tregon se me një rritje të kostove joprodhuese me 1 mijë rubla, përfitimi zvogëlohet me 0,7017%.

Duhet të theksohet se ndërtimi i regresionit të shumëfishtë (diskutuar në kapitujt vijues), kur ekuacioni përmban të dyja tiparet në të njëjtën kohë, çon në vlera të tjera të koeficientëve të regresionit, gjë që shpjegohet nga ndërveprimi i variablave shpjegues me njëri tjetrin.

Kur përdorni butonin Named, pikat në scatterplot do të marrin numrat ose emrat e tyre përkatës nëse janë të paracaktuara.

Opsioni tjetër me treguesin e grafikut Matrix paraqet një matricë të skicave të shpërndara për variablat e zgjedhur.

Çdo element grafik i kësaj matrice përmban fusha korrelacioni të formuara nga variablat përkatëse me

vija e regresionit e vizatuar mbi to.

Kur analizohet matrica e grafikëve të shpërndarjes, duhet t'i kushtohet vëmendje atyre grafeve, linjat e regresionit të të cilëve kanë një pjerrësi të konsiderueshme në boshtin X, gjë që sugjeron ekzistencën e një ndërvarësie midis shenjave përkatëse.

Opsioni i shpërndarjes 3D ndërton një fushë korrelacioni 3D për variablat e zgjedhur. Nëse përdoret butoni Named, pikat në scatterplot do të etiketohen me numrat ose emrat e vëzhgimeve përkatëse, nëse i kanë ato.

Opsioni grafik "Sipërfaqja" paraqet një grafik shpërndarjeje 3M për trefishin e përzgjedhur të variablave së bashku me një sipërfaqe të rendit të dytë të montuar.

Kategoria e opsioneve. Scatterplots, nga ana tjetër, ndërtojnë një kaskadë fushash korrelacioni për treguesit e zgjedhur.

Pas shtypjes së butonit përkatës, programi do t'i kërkojë përdoruesit të krijojë dy grupe të tyre nga ato të zgjedhura më parë duke përdorur butonin Variablat. Pastaj një i ri do të shfaqet në ekran.

një dritare pyetëse për të specifikuar një variabël grupimi në bazë të së cilës do të klasifikohen të gjitha rastet e disponueshme.

Rezultati është ndërtimi i fushave të korrelacionit në kontekstin e grupeve të vëzhgimeve për çdo palë variablash të caktuar në lista të ndryshme

3.4. Llogaritja e koeficientëve të pjesshëm dhe të shumëfishtëelementet e korrelacionit

Për të llogaritur koeficientët privatë dhe të shumëfishtë kor. relacioni thirrja e modulit Regresion i shumëfishtë duke përdorur butonin e përzgjedhësit të modulit. Kutia e mëposhtme e dialogut do të shfaqet në ekran:

Duke shtypur një buton Variablat, zgjidhni variablat për analizë: në të majtë të varur - rentabiliteti, dhe në të djathtë janë të pavarur - produktiviteti i kapitalit dhe shpenzimet joprodhuese. Variablat e mbetur nuk do të marrin pjesë në analiza të mëtejshme - bazuar në analizën e korrelacionit, ato njihen si jo informative për modelin e regresionit.

Në fushë Skedari hyrës si të dhëna hyrëse, ofrohen të dhënat fillestare të zakonshme, të cilat janë një tabelë me variabla dhe vëzhgime, ose një matricë korrelacioni. Matrica e korrelacionit mund të krijohet paraprakisht në vetë modulin e Regresionit të Shumëfishtë ose të llogaritet duke përdorur opsionin Quick Basic Statistics.

Kur punoni me skedarin e të dhënave burimore, mund të vendosni mënyrën e punës me boshllëqe:

    Fshirje rresht pas rreshti. Kur zgjidhet ky opsion, në analizë përdoren vetëm rastet që nuk kanë vlera që mungojnë në të gjitha variablat e zgjedhur.

    Zëvendësimi i mesatares. Vlerat që mungojnë në secilën variabël zëvendësohen nga mesatarja e llogaritur nga vëzhgimet e plota të disponueshme.

    Heqja në çift e të dhënave që mungojnë. Nëse zgjidhet ky opsion, atëherë kur llogariten korrelacionet në çift, vrojtimet që kanë vlera që mungojnë në çiftet përkatëse të variablave hiqen.

Në fushë Lloji i regresionit përdoruesi mund të zgjedhë regresionin jolinear standard ose fiks. Si parazgjedhje, zgjidhet analiza standarde e regresionit të shumëfishtë, e cila llogarit matricën standarde të korrelacionit të të gjitha variablave të zgjedhur.

Modaliteti Regresioni jolinear i fiksuar ju lejon të kryeni transformime të ndryshme të variablave të pavarur. Opsioni Kryeni një analizë si parazgjedhje, ai përdor cilësimet që korrespondojnë me përkufizimin e një linje standarde regresioni që përfshin një ndërprerje. Nëse ky opsion anulohet, duke klikuar butonin OK të panelit të nisjes do të shfaqet kutia e dialogut Model Definition, në të cilën mund të zgjidhni llojin e analizës së regresionit (për shembull, hap pas hapi, kreshtë, etj.) dhe opsione të tjera.

Duke kontrolluar kutinë e kontrollit të linjës së opsioneve Trego përshkrues përshkrues, korr. matricat dhe duke klikuar OK, marrim një dialog box me karakteristikat statistikore të të dhënave.

Në të, ju mund të shikoni statistika të detajuara përshkruese (përfshirë numrin e vëzhgimeve mbi të cilat është llogaritur koeficienti i korrelacionit për secilën palë variablash). Klikoni OK për të vazhduar analizën dhe hapni kutinë e dialogut Model Definers.

Nëse treguesit e analizuar kanë një variancë relative jashtëzakonisht të vogël, të llogaritur si varianca totale e ndarë me mesataren, atëherë duhet të kontrolloni kutinë pranë opsionit Llogaritjet me saktësi të lartë për të marrë vlera më të sakta të elementeve të matricës së korrelacionit.

Duke vendosur të gjithë parametrat e nevojshëm në dialog box Regresion i shumëfishtë, shtypni OK dhe merrni rezultatet e llogaritjeve të kërkuara.

Sipas shembullit tonë, koeficienti i korrelacionit të shumëfishtë doli të jetë 0.61357990 dhe, në përputhje me rrethanat, koeficienti i përcaktimit - 0.37648029. Kështu, vetëm 37.6% e shpërndarjes së treguesit të “përfitueshmërisë” shpjegohet me ndryshimin e treguesve të “prodhueshmërisë kapitale” dhe “kostove joprodhuese”. Një vlerë kaq e ulët tregon një numër të pamjaftueshëm faktorësh të futur në model. Le të përpiqemi të ndryshojmë numrin e variablave të pavarur duke shtuar variablin "Aktivet fikse" në listë (futja e treguesit "pjesa e punëtorëve në PPP" në model çon në multikolenialitet, gjë që është e papranueshme). Koeficienti i përcaktimit u rrit pak, por jo mjaftueshëm për të përmirësuar ndjeshëm rezultatet - vlera e tij ishte rreth 41%. Natyrisht, dacha jonë kërkon kërkime shtesë për të identifikuar faktorët që ndikojnë në përfitimin.

Rëndësia e koeficientit të korrelacionit të shumëfishtë llogaritet sipas tabelës së kriterit F Fisher. Hipoteza e rëndësisë së saj refuzohet nëse vlera e probabilitetit të devijimit tejkalon një nivel të caktuar (më shpesh merret a = 0.1, 0.05; 0.01 0.001). Në shembullin tonë p=0.008882< 0.05, что свидетельствует о значимости коэффициента.

Tabela e rezultateve përmban kolonat e mëposhtme:

    Koeficienti beta (në)- koeficienti i standardizuar i regresionit për variablin përkatës;

    Korrelacion i pjesshëm- koeficientët e korrelacionit të pjesshëm ndërmjet variablit përkatës dhe atij të varur, duke fiksuar ndikimin e pjesës tjetër të përfshirë në model.

Koeficienti i korrelacionit të pjesshëm midis rentabilitetit dhe produktivitetit të kapitalit në shembullin tonë është 0.459899. Kjo do të thotë që pas futjes në model të treguesit të rasës joproduktive-ev, ndikimi i produktivitetit të kapitalit në rentabilitetin zvogëlohet disi - nga 0.49 (vlera e koeficientit të korrelacionit të çiftit) 0.46. Një koeficient i ngjashëm për treguesin e shpenzimeve të paprodhuara gjithashtu u ul - nga 0.46 (vlera e koeficientit të korrelacionit të çiftit) në 0.42 (vlera merret nga moduli), karakterizon ndryshimin në marrëdhënien me variablin e varur pas hyrjes në treguesi i produktivitetit të kapitalit në model.

    Një korrelacion gjysmë i pjesshëm është korrelacioni midis ndryshores së varur të parregulluar dhe ndryshores jo të varur korresponduese, duke marrë parasysh ndikimin e të tjerëve të përfshirë në model.

    Toleranca (përcaktuar si 1 minus katrorin e korrelacionit të shumëfishtë midis ndryshores përkatëse dhe të gjithë variablave të pavarur në ekuacionin e regresionit).

    Koeficienti i përcaktimit është katrori i koeficientit të korrelacionit të shumëfishtë ndërmjet ndryshores së pavarur përkatëse dhe të gjithë variablave të tjerë të përfshirë në ekuacionin e regresionit.

    1-vlera - vlera e llogaritur e testit t Studentit për testimin e hipotezës për rëndësinë e koeficientit të korrelacionit të pjesshëm me numrin e specifikuar (në kllapa) të shkallëve të lirisë.

    P-niveli! - probabiliteti për të hedhur poshtë hipotezën për rëndësinë e koeficientit të korrelacionit të pjesshëm.

Në rastin tonë, vlera e fituar e p për koeficientin e parë (0.031277) është më e vogël se ajo e përzgjedhur =0.05. Vlera e koeficientit të dytë e tejkalon pak atë (0.050676), gjë që tregon parëndësinë e tij në këtë nivel. Por është domethënëse, për shembull, kur =0.1 (në dhjetë raste nga njëqind, hipoteza do të jetë ende e gabuar).

Ku x y, x, y janë vlerat mesatare të mostrave; σ(x), σ(y) - devijimet standarde.
Përveç kësaj, Koeficienti i korrelacionit të çiftit linear të Pearson-it mund të përcaktohet përmes koeficientit të regresionit b: , ku σ(x)=S(x), σ(y)=S(y) janë devijime standarde, b është koeficienti përballë x në ekuacionin e regresionit y=a+ bx .

Opsione të tjera të formulës:
ose

K xy - momenti i korrelacionit (koeficienti i kovariancës)

Për të gjetur koeficientin linear të korrelacionit Pearson, është e nevojshme të gjesh mesataren e mostrës x dhe y, dhe devijimet e tyre standarde σ x = S(x), σ y = S(y):

Koeficienti linear i korrelacionit tregon praninë e një lidhjeje dhe merr vlera nga -1 në +1 (shih shkallën Chaddock). Për shembull, kur analizohet ngushtësia e një korrelacioni linear midis dy variablave, është marrë një koeficient korrelacioni linear çift i barabartë me –1. Kjo do të thotë se ekziston një marrëdhënie e saktë lineare e anasjelltë midis variablave.

Ju mund të llogaritni vlerën e koeficientit të korrelacionit duke përdorur mjetet e dhëna të mostrës, ose drejtpërdrejt.

Xy#x #y #σ x #σ y " data-id="a;b;c;d;e" data-formul="(a-b*c)/(d*e)" data-r="r xy "> Llogaritni vlerën tuaj

Kuptimi gjeometrik i koeficientit të korrelacionit: r xy tregon se sa ndryshon pjerrësia e dy vijave të regresionit: y(x) dhe x(y), sa ndryshojnë rezultatet e minimizimit të devijimeve në x dhe në y. Sa më i madh të jetë këndi ndërmjet vijave, aq më i madh është r xy.
Shenja e koeficientit të korrelacionit përkon me shenjën e koeficientit të regresionit dhe përcakton pjerrësinë e vijës së regresionit, d.m.th. drejtimi i përgjithshëm i varësisë (rritje ose ulje). Vlera absolute e koeficientit të korrelacionit përcaktohet nga shkalla e afërsisë së pikave me vijën e regresionit.

Vetitë e koeficientit të korrelacionit

  1. |r xy | ≤ 1;
  2. nëse X dhe Y janë të pavarur, atëherë r xy =0, e kundërta nuk është gjithmonë e vërtetë;
  3. nëse |r xy |=1, atëherë Y=aX+b, |r xy (X,aX+b)|=1, ku a dhe b janë konstante dhe ≠ 0;
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1 , a 2 X+b 2)|, ku a 1 , a 2 , b 1 , b 2 janë konstante.

Prandaj, për kontrollet e drejtimit të lidhjes zgjidhet një test hipoteze duke përdorur koeficientin e korrelacionit Pearson me një test të mëtejshëm për besueshmërinë duke përdorur T-test(shih shembullin më poshtë).

Detyrat tipike (shih gjithashtu regresionin jolinear)

Detyra tipike
Varësia e produktivitetit të punës y nga niveli i mekanizimit të punës x (%) është studiuar sipas të dhënave të 14 ndërmarrjeve industriale. Të dhënat statistikore janë dhënë në tabelë.
Kërkohet:
1) Gjeni vlerësime për parametrat e regresionit linear y mbi x. Ndërtoni një grafik shpërhapjeje dhe vizatoni vijën e regresionit në sketerplot.
2) Në nivelin e rëndësisë α=0.05, provoni hipotezën e marrëveshjes ndërmjet regresionit linear dhe rezultateve të vëzhgimit.
3) Me besueshmëri γ=0.95 gjeni intervalet e besueshmërisë për parametrat e regresionit linear.

Me këtë kalkulator përdoren gjithashtu sa vijon:
Ekuacioni i regresionit të shumëfishtë

Shembull. Bazuar në të dhënat e dhëna në Shtojcën 1 dhe që korrespondojnë me opsionin tuaj (Tabela 2), ju duhet:

  1. Llogaritni koeficientin e korrelacionit të çiftit linear dhe ndërtoni ekuacionin e regresionit të çiftit linear të një tipari nga një tjetër. Një nga shenjat që korrespondon me opsionin tuaj do të luajë rolin e faktorialit (x), tjetri - efektiv (y). Vendosni marrëdhënie shkak-pasojë midis shenjave në bazë të analizës ekonomike. Shpjegoni kuptimin e parametrave të ekuacionit.
  2. Përcaktoni koeficientin teorik të përcaktimit dhe variancën e mbetur (të pashpjegueshme nga ekuacioni i regresionit). Bëni një përfundim.
  3. Vlerësoni rëndësinë statistikore të ekuacionit të regresionit në tërësi në nivelin 5 përqind duke përdorur F-testin e Fisher. Bëni një përfundim.
  4. Kryeni një parashikim të vlerës së pritur të atributit-rezultat y me vlerën e parashikuar të faktorit-atribut x, që është 105% e nivelit mesatar x. Vlerësoni saktësinë e parashikimit duke llogaritur gabimin e parashikimit dhe intervalin e tij të besueshmërisë me një probabilitet prej 0.95.
Zgjidhje. Ekuacioni është y = ax + b
Mesatarja



Dispersion


devijimi standard



Marrëdhënia midis tiparit Y faktori X është e fortë dhe e drejtpërdrejtë (e përcaktuar nga shkalla e Chaddock).
Ekuacioni i regresionit

Koeficienti i regresionit: k = a = 4,01
Koeficienti i përcaktimit
R 2 = 0,99 2 = 0,97, d.m.th. në 97% të rasteve, ndryshimet në x çojnë në një ndryshim në y. Me fjalë të tjera, saktësia e përzgjedhjes së ekuacionit të regresionit është e lartë. Dispersioni i mbetur: 3%.
xyx2y2x yy(x)(y i -y) 2(y-y(x)) 2(x-x p) 2
1 107 1 11449 107 103.19 333.06 14.5 30.25
2 109 4 11881 218 107.2 264.06 3.23 20.25
3 110 9 12100 330 111.21 232.56 1.47 12.25
4 113 16 12769 452 115.22 150.06 4.95 6.25
5 120 25 14400 600 119.23 27.56 0.59 2.25
6 122 36 14884 732 123.24 10.56 1.55 0.25
7 123 49 15129 861 127.26 5.06 18.11 0.25
8 128 64 16384 1024 131.27 7.56 10.67 2.25
9 136 81 18496 1224 135.28 115.56 0.52 6.25
10 140 100 19600 1400 139.29 217.56 0.51 12.25
11 145 121 21025 1595 143.3 390.06 2.9 20.25
12 150 144 22500 1800 147.31 612.56 7.25 30.25
78 1503 650 190617 10343 1503 2366.25 66.23 143

Shënim: vlerat y(x) gjenden nga ekuacioni i regresionit që rezulton:
y(1) = 4,01*1 + 99,18 = 103,19
y(2) = 4,01*2 + 99,18 = 107,2
... ... ...

Rëndësia e koeficientit të korrelacionit

Ne parashtrojmë hipoteza:
H 0: r xy = 0, nuk ka lidhje lineare midis variablave;
H 1: r xy ≠ 0, ekziston një lidhje lineare midis variablave;
Për të testuar hipotezën zero në nivelin e rëndësisë α që koeficienti i përgjithshëm i korrelacionit të normales dy-dimensionale ndryshore e rastësishme me një hipotezë konkurruese H 1 ≠ 0, është e nevojshme të llogaritet vlera e vëzhguar e kriterit (vlera e gabimit të rastit):

Sipas tabelës së Studentit, gjejmë t tab (n-m-1; α / 2) = (10; 0.025) = 2.228
Meqenëse tab Tobs > t, ne hedhim poshtë hipotezën se koeficienti i korrelacionit është i barabartë me 0. Me fjalë të tjera, koeficienti i korrelacionit është statistikisht i rëndësishëm.
Vlerësimi i intervalit për koeficientin e korrelacionit (intervali i besimit)


r - Δr ≤ r ≤ r + Δr
Δ r = ±t tabela m r = ±2,228 0,0529 = 0,118
0,986 - 0,118 ≤ r ≤ 0,986 + 0,118
Intervali i besimit për koeficientin e korrelacionit: 0,868 ≤ r ≤ 1

Analiza e saktësisë së përcaktimit të vlerësimeve të koeficientëve të regresionit





Sa =0,2152

Intervalet e besimit për variablin e varur

Le të llogarisim kufijtë e intervalit në të cilin 95% e vlerave të mundshme të Y do të përqendrohen për një kohë të pakufizuar numra të mëdhenj vrojtimet dhe X = 7
(122.4;132.11)
Testimi i hipotezave për koeficientët ekuacioni linear regresioni

1) t-statistika




Konfirmohet rëndësia statistikore e koeficientit të regresionit
Intervali i besimit për koeficientët e ekuacionit të regresionit
Le të përcaktojmë intervalet e besimit të koeficientëve të regresionit, të cilët, me besueshmëri 95%, do të jenë si më poshtë:
(a - t a S a ; a + t a S a)
(3.6205;4.4005)
(b - t b S b ; b + t b S b)
(96.3117;102.0519)