Képlet a korreláció kiszámításához
A korreláció két változó közötti statisztikai mérőszám, amelyet az egyik változó mennyiségének változásaként határoznak meg, amely megfelel a másik változásának, és kiszámítja az első változó összegének és az első változó átlagának a szorzata összegének összegével a második változó összegének mínuszával. a második változó átlaga elosztva az első változó négyzetének szorzatának gyökérével, az első változó átlagának mínuszával a második változó négyzetének összegével, mínusz a második változó átlagával.
A korreláció értéke -1 és +1 között korlátozott, és a következőképpen értelmezhető:
- -1: Ha -1, akkor a változókat tökéletesen negatív korrelációnak nevezzük. Ez azt jelenti, hogy ha az egyik változó egy irányba mozog, akkor egy másik az ellenkező irányba.
- 0: Ez azt jelenti, hogy a változónak nincs korrelációja.
- +1: Ha +1, akkor a változókat tökéletesen pozitív korrelációnak ismerjük. Mindkét változó pozitív irányba mozog.
Ha 2 változónk x és y, akkor a 2 változó közötti korrelációs együttható megtalálható a következőképpen:
Korrelációs együttható = ∑ (x (i) - átlag (x)) * (y (i) - jelentése (y)) / √ (∑ (x (i) - jelentése (x)) 2 * ∑ (y (i) jelentése: (y)) 2 )
Hol,
- x (i) = a minta x értéke
- Átlag (x) = az x összes értékének átlaga
- y (i) = y értéke a mintában
- Átlag (y) = y összes értékének átlaga
Példák
Könnyű kiszámítani a korrelációt az Excelben. Az alkalmazott függvény szintaxisa a következő:
Korrelációs együttható = CORREL (1. tömb, 2. tömb)
1. példa
Vegyük ugyanazt a példát, amelyet fentebb vettünk a korreláció kiszámításához az excel segítségével.
Megoldás:
Az alábbiakban x és y értékei láthatók:

A számítás a következő.

Az Excel képlete = CORREL (tömb (x), tömb (y))

Együttható = +0,95
Mivel ez az együttható a +1 közelében van, ezért x és y erősen korrelálnak egymással.
2. példa
A korreláció főként a vállalatok részvényárfolyamának elemzéséhez és ennek alapján részvényportfólió létrehozásához hasznos.
Megtudhatjuk az Apple részvények és a Nasdaq index közötti összefüggést az elmúlt egyéves részvényteljesítmény alapján. Az Apple egy amerikai multinacionális vállalat, amely olyan informatikai termékekre specializálódott, mint iPod, iPad, Mac stb.
Megoldás:
Az alábbiakban bemutatjuk az Apple és a Nasdaq részvények havi hozamát az elmúlt egy évben:

Adjuk meg most az értékeket -
Korrelációs együttható = ∑ (x (i) - átlag (x)). (Y (i) - jelentése (y)) / √ ∑ (x (i) - jelentése (x)) 2 ∑ (y (i) - átlag (y)) 2

Az Apple és a Nasdaq közötti összefüggés = 0,039 / (√0,0039)

Együttható = 0,62
Mivel az Apple és a Nasdaq közötti korreláció pozitív, ezért az Apple pozitívan korrelál a Nasdaq-szal.
3. példa
Most nézzük meg a Walmart és a Nasdaq index közötti összefüggést az utolsó egyéves részvényteljesítmény alapján. A Walmart egy amerikai székhelyű vállalat, amelynek kiskereskedelmi szupermarket-lánca van.
Megoldás:
Az alábbiakban bemutatjuk a Walmart és a Nasdaq közötti havi teljesítményt az elmúlt egy évben -

Adjuk meg most az értékeket a képletben -
Korrelációs együttható = ∑ (x (i) - átlag (x)). (Y (i) - jelentése (y)) / √ ∑ (x (i) - jelentése (x)) 2 ∑ (y (i) - átlag (y)) 2
Ezért a számítás a következő,

Összefüggés a Walmart és a Nasdaq között = 0,0032 / (√0,0346 * 0,0219)

Együttható = 0,12
Láthatjuk, hogy a Walmart és a Nasdaq is pozitívan korrelál, de nem annyira, mint az Apple és a Nasdaq közötti korreláció.
Relevancia és felhasználás
A korrelációs együttható hasznos két változó közötti lineáris kapcsolat megállapításához. Azt méri, hogy egy változó hogyan fog mozogni egy másik változó mozgásához képest. Ennek az együtthatónak a gyakorlati felhasználása a részvényár mozgásának és az általános piaci mozgásnak a kapcsolatának megismerése. Ennek az elemzésnek az alapja, a részvényelemző magában foglalja a részvények arányát, hogy optimális portfóliót hozzon létre minimális kockázat mellett. Az adattudományban is hasznos, ha kiderül a 2 változó kapcsolata.
A korrelációs együtthatót nagyon magasan használják az adatok konstrukciós érvényességének tanulmányozásához a faktoranalízis során. A regresszióanalízisben nagyon használják a függő változók értékeinek előrejelzésére a függő és független változók közötti kapcsolat alapján. Ez az egyenlet a kvantitatív elemzés során nagyon hasznos a különböző változók közötti kapcsolat jellegének megismeréséhez. Ennek a kapcsolatnak az alapja, ha egy változó nincs kapcsolatban más változókkal, akkor ki lehet küszöbölni a listából.