Regresszió (jelentése, típusai) - Mi a regresszióanalízis?

Tartalomjegyzék

Mi a regresszió?

A regresszióanalízis egy statisztikán alapuló mérés, amelyet pénzügyekben, befektetésekben stb. Használnak, és amelynek célja egy függő változó és más független változók sora közötti kapcsolat felállítása, és a fő hangsúly a fenti kapcsolat erősségének meghatározása.

Magyarázatok

  • Ha elmagyarázzuk a regresszió-elemzést laikus kifejezéssel, akkor tegyük fel, hogy egy vállalat értékesítési vezetője keményen megpróbálja megjósolni a következő hónap eladásait. Számos tényező vonzza a termék értékesítését, az időjárástól kezdve a versenytárs új stratégiájáig, fesztiváljáig és a fogyasztók életmódjának megváltozásáig.
  • Ez egy módszer az eladást befolyásoló számos tényező összehangolására, amelyek a legnagyobb hatással vannak. Segíthet számos olyan kérdés megválaszolásában, mint amelyek a legfontosabb tényezők, melyek a kevésbé fontos tényezők, mi a kapcsolat ezek között a tényezők között, és ami a legfontosabb, mi a tényező ezeknek a tényezőknek.
  • Ezeket a tényezőket változónak nevezzük. Az előrejelzésre kerülő fő tényezőt függő változónak nevezzük, a többi tényezőt, amelyek hatással vannak a függő változóra, független változóknak nevezzük.

Képlet

Az egyszerű lineáris regresszióanalízis az excelben az alábbi képletként fejezhető ki, és méri a függő változó és egy független változó közötti kapcsolatot.

Y = a + bX + ϵ

Itt:

  • Y - Függő változó
  • X - Független (magyarázó) változó
  • a - Intercept
  • b - Lejtő
  • ϵ - Maradék (hiba)

Hogyan értelmezhető a regresszióanalízis?

Ez egyszerű forgatókönyv feltételezésével értelmezhető. Itt vesszük figyelembe az árverésre kerülő antik gyűjtemények árának és korának időtartamát. Minél jobban öregszik egy antik, annál nagyobb árat ér el. Feltéve, hogy az elmúlt 50 árverésre kerülő tételre vonatkozóan állítottunk össze adatokat, a tárgy életkora alapján megjósolhatjuk, hogy mi lesz a jövőbeni aukciós ár. Ezen adatok felhasználásával regressziós egyenletet készíthetünk.

A regressziós képlet, amely kapcsolatot hozhat létre az életkor és az ár között, a következő:

y = β0 + β1 x + hiba
  • Itt a függő tényező Y. Y az egyes aukcióra kerülő tételek árát jelenti, míg a független tényező X, amely meghatározza az életkort.
  • A β0 és β1 paraméterek nem ismert paraméterek, amelyeket az egyenlet megbecsül.
  • A β0 olyan állandó, amelyet a lineáris trendvonal definiálására használunk, amely elfogja az Y tengelyt.
  • A β1 állandó, amely a függő változó értékében bekövetkező változás nagyságát mutatja be, mint a független változókra utaló változás összefüggő függvénye.
  • Ezt alapvetően az egyenlet meredekségének nevezzük. Ha a lejtő bélés, az azt jelenti, hogy arányos a kapcsolat az életkor és az ár között, és ahol a lejtés fordított, azt jelenti, hogy a kapcsolat közvetetten arányos.
  • A hiba meghatározható a célváltozó zajaként vagy variációiként, és véletlenszerű.

A regressziós elemzés valós példái

Tegyük fel, hogy kapcsolatot kell létesítenünk a megtörtént értékesítések és a termékkel kapcsolatos hirdetésekre fordított összeg között.

Általában pozitív összefüggést figyelhetünk meg az értékesítési mennyiség és a reklámozásra fordított összeg között. Egyszerű lineáris regressziós egyenletet kapva:

Y = a + bX

Tegyük fel, hogy az értéket as -ként kapjuk meg

Y = 500 + 30x

Eredményértelmezés:

Az előrejelzett 30-as meredekség segít levonni a következtetést, hogy az átlagos eladások évi 30 dollárral nőnek, miközben nő a reklámra fordított kiadás.

A regresszióanalízis típusai

# 1 - Lineáris

Ez az alábbi képletként fejezhető ki, és méri a függő változó és egy független változó közötti kapcsolatot.

# 2 - Polinom

Ebben a módszerben az elemzést az egyetlen függő tényezők és a több független változó közötti kapcsolat mérésére használják.

# 3 - Logisztikai

Itt a függő tényező vagy változó bináris jellegű. A független változók lehetnek folytonosak vagy binárisak. A multinomiális logisztikai regresszióban megengedhetjük magunknak, hogy kettőnél több kategória legyen, független változónk kiválasztása mellett.

# 4 - Kvantilis

Ez a lineáris regresszió additív fogalma, és elsősorban akkor alkalmazzák, ha az adatokban szélsőségesek és ferdeségek vannak.

# 5 - Rugalmas háló

Ez akkor hasznos, ha nagyon magas korrelált független változókat kezelünk.

# 6 - Fő komponensek regressziója (PCR)

Ez egy olyan technika, amely akkor alkalmazható, ha túl sok független változó van vagy multicollinearity létezik az adatokban

# 7 - Részleges legkisebb négyzetek (PLS)

A főkomponens ellentétes módszere, ahol független változók szorosan korrelálnak. Akkor is alkalmazható, ha sok független változó van.

# 8 - Támogatási vektor

Ez megoldást kínálhat lineáris és nem lineáris modellekre. A nemlineáris kernelfunkciókat használja az optimális megoldás megtalálásához a nemlineáris modellek számára.

# 9 - Rendes

Alkalmazható a rangsorolt ​​értékek előrejelzésére. Alapvetően akkor alkalmas, ha a függő változó rendes jellegű

# 10 - Poisson

Ez akkor alkalmazható, ha a függő változó számlálási adatokkal rendelkezik.

# 11 - Negatív binomiál

Csak a számlálási adatok kezelésére alkalmazható, hogy a negatív binomiális regresszió nem feltételezi az átlaggal megegyező szórásszámú eloszlást, míg a Poisson-regresszió az átlagával megegyező varianciát feltételez.

# 12 - Kvázi Poisson

A negatív binomiális regresszió helyettesítője. Szétszórt számlálási adatokra is alkalmazható. A kvázi-Poisson-modell varianciája az átlag lineáris függvénye, míg a negatív binomiális modell varianciája az átlag másodfokú függvénye.

# 13 - Cox

Többet használ az események közötti idő elemzéséhez.

Különbség a regresszió és a korreláció között

  • A regresszió létrehozza a kapcsolatot egy független variancia és egy függõ változó között, ahol mindkét változó különbözik, míg a korreláció két változó asszociációját vagy függõségét határozza meg, ahol nincs különbség mindkét változó között.
  • A regresszió fő célja a legjobban illeszkedő vonal létrehozása, és az egyik változó becslése mások alapján történik, míg a korrelációban két változó közötti lineáris kapcsolatot mutat be.
  • Ebben megbecsüljük az elismert változó (X) egy bizonyos változásának nagyságát a becsült változón (Y), míg a korrelációban az együtthatót használjuk annak mérésére, hogy a két változó milyen mértékben mozog együtt.
  • Ez egy olyan folyamat, amellyel a véletlenszerű független változók nagyságát megbecsülhetjük egy statikus függő változó nagysága alapján, míg a korreláció segít abban, hogy egy adott értékről döntsünk a két változó közötti kölcsönös függőség kifejezése érdekében.

Következtetés

  • A regresszióanalízis elsősorban adatokat használ fel annak érdekében, hogy kapcsolatot teremtsen két vagy több változó között. Itt feltételezzük, hogy a múltban fennálló kapcsolatok a jelenben vagy a jövőben is tükröződni fognak. Kevesen tartják ezt a múlt és a jelen / jövő közötti időeltolódásnak.
  • Ez azonban széles körben alkalmazott előrejelzési és becslési technika. Bár matematikával jár, amelyet sok felhasználó nehéznek találhat, a technika viszonylag könnyen használható, különösen, ha rendelkezésre áll egy modell.

érdekes cikkek...