R négyzet (R ^ 2) - Meghatározás, képlet, R négyzet kiszámítása

Mi az R négyzet (R2) a regresszióban?

Az R-négyzet (R 2 ) egy fontos statisztikai mérőszám, amely egy olyan regressziós modell, amely a különbség vagy variancia arányát képviseli statisztikai értelemben egy függő változóra vonatkozóan, amely független változóval vagy változókkal magyarázható. Röviden, meghatározza, hogy az adatok mennyire illeszkednek a regressziós modellhez.

R négyzet képlet

Az R négyzet kiszámításához meg kell határoznia a korrelációs együtthatót, majd négyzetbe kell foglalnia az eredményt.

R Négyzetképlet = r 2

Ahol r a korrelációs együttható az alábbiak szerint kiszámítható:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Hol,

  • r = a korrelációs együttható
  • n = szám az adott adatkészletben
  • x = az első változó a kontextusban
  • y = második változó

Magyarázat

Ha van olyan összefüggés vagy összefüggés, amely lineáris vagy nem lineáris lehet e két változó között, akkor jeleznie kell, ha változás áll be a független változó értékében, akkor a másik függő változó valószínűleg megváltozik az értékében, mondjuk lineárisan vagy nem lineárisan.

A képlet számláló része tesztet hajt végre, hogy mozognak-e együtt, és eltávolítja-e az egyes mozgásaikat és relatív erősségüket, ha mindkettő együtt mozog, és a képlet nevező része úgy skálázza a számlálót, hogy felveszi a különbségek szorzatának négyzetgyökét. a változók a négyzetes változókból. És amikor ezt az eredményt négyzetre állítja, R négyzetet kapunk, ami nem más, mint a determinációs együttható.

Példák

1. példa

Vegye figyelembe a következő két változót: x és y. Az R négyzetet regresszióban kell kiszámítania.

Megoldás:

A fent említett képlet segítségével először ki kell számolnunk a korrelációs együtthatót.

Megvan a fenti táblázat összes értéke, n = 4.

Adjuk meg most az értékeket a képletben, hogy elérjük az ábrát.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ ((4 * 21 274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )

r = 17 501,06 / 17 512,88

A korrelációs együttható

r = 0,99932480

Tehát a számítás a következő lesz,

r 2 = (0,99932480) 2

R négyzet alakú képlet regresszióban

r 2 = 0,998650052

2. példa

India, egy fejlődő ország, független elemzést akar végezni arról, hogy a nyersolaj árának változása befolyásolta-e rúpia értékét. Ezt követi a Brent nyersolaj árának és a rúpia értékelésének története, mindkettő dollárral szemben, amely ezek alatt az évek alatt átlagosan uralkodott.

Az RBI, India központi bankja felkereste Önt, hogy a következő ülésen tartson előadást erről. Határozza meg, hogy a nyersolaj mozgása befolyásolja-e a rúpia dolláronként mozgását?

Megoldás:

A fenti korreláció képletének felhasználásával először kiszámíthatjuk a korrelációs együtthatót. Az átlagos kőolajár egy változónak, mondjuk x-nek, a dolláronkénti rúpia pedig egy másik változónak y-ként való kezelése.

Megvan a fenti táblázat összes értéke, n = 6.

Adjuk meg most az értékeket a képletben, hogy elérjük az ábrát.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1,715,95

A korrelációs együttható

r = -0,3614

Tehát a számítás a következő lesz,

R 2 = (-0,3614) 2

R négyzet alakú képlet regresszióban

r 2 = 0,1306

Elemzés: Úgy tűnik, hogy kisebb összefüggés van a nyersolaj árának változása és az indiai rúpia árának változása között. A kőolaj árának emelkedésével az indiai rúpia változásai is hatással vannak. De mivel az R négyzet csak 13%, akkor a kőolaj árának változása sokkal kevésbé magyarázza az indiai rúpia változását, és az indiai rúpia más változókban is változásoknak van kitéve, amellyel számolni kell.

3. példa

Az XYZ laboratórium magasságot és súlyt kutat, és kíváncsi arra, hogy van-e valamilyen összefüggés ezek között a változók között. Miután összegyűjtött egy 5000 fős mintát minden kategóriához, és átlagot és átlagmagasságot ért el az adott csoportban.

Az alábbiakban részletezzük az általuk összegyűjtött részleteket.

Számítania kell az R négyzetet, és arra a következtetésre kell jutnia, hogy ez a modell megmagyarázza, hogy a magasság eltérései befolyásolják-e a súly változásait.

Megoldás:

A fenti korreláció képletének felhasználásával először kiszámíthatjuk a korrelációs együtthatót. A magasság kezelése egy változónak, mondjuk x-nek, a súly kezelése pedig egy másik változónak, mint y.

Megvan a fenti táblázat összes értéke, n = 6.

Adjuk meg most az értékeket a képletben, hogy elérjük az ábrát.

r = (7 * 74 058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6581,05 / 7,075,77

A korrelációs együttható

Korrelációs együttható (r) = 0,9301

Tehát a számítás a következő lesz,

r 2 = 0,8651

Elemzés: Az összefüggés pozitív, és úgy tűnik, hogy van valamilyen kapcsolat a magasság és a súly között. A magasság növekedésével a személy súlya is növekszik. Míg R2 azt javasolja, hogy a magasságváltozások 86% -a a súly változásának tulajdonítható, 14% pedig megmagyarázhatatlan.

Relevancia és felhasználás

Az R négyzetének relevanciája a regresszióban az a képesség, hogy megtalálja a jövőbeni események valószínűségét az adott előre jelzett eredmények vagy kimenetek között. Ha több mintát adunk a modellhez, akkor az együttható megmutatja annak valószínűségét vagy valószínűségét, hogy egy új pont vagy az új adatkészlet a vonalra esik. Még akkor is, ha mindkét változónak erős kapcsolata van, a meghatározás nem bizonyítja az okságot.

Néhány olyan tér, ahol az R négyzetet leginkább használják, a befektetési alapok teljesítményének nyomon követésére, a fedezeti alapok kockázatának követésére, annak meghatározására, hogy a részvények milyen jól mozognak a piaccal, ahol R2 azt javasolja, hogy a részvény mozgásainak mekkora része magyarázható a piaci mozgások által.

érdekes cikkek...