Lineáris regresszió (meghatározás, példák) Hogyan kell értelmezni?

Mi az a lineáris regresszió?

A lineáris regresszió alapvetően egy statisztikai modellezési technika, amely egy függő változó és egy vagy több független változó közötti kapcsolat bemutatására szolgál. A prediktív elemzés egyik leggyakoribb típusa. Ez a fajta eloszlás egy vonalon képződik, ezért ezt lineáris regressziónak nevezzük. Ebben a cikkben az Excel lineáris regressziós elemzésének példáit vesszük fel.

Először a lineáris regresszióanalízis elvégzéséhez az alábbi lépésekkel hozzá kell adnunk az excel bővítményeket.

Kattintson a Fájl - Beállítások gombra (Ezzel megnyílik az Excel beállításai felugró ablak).

Kattintson a Bővítmények elemre - Válassza ki az Excel-bővítményeket az Excelben a Kezelés legördülő menüből, majd kattintson a Tovább gombra.

Ez megnyitja a Bővítmények felugró ablakot. Válassza az Analysis ToolPak elemet, majd kattintson az OK gombra.

Az Adatelemzés bővítmény a Beszúrás fül alatt jelenik meg.

Az alábbiakban értsük meg példákat a lineáris regressziós elemzésre az excelben.

Lineáris regresszió-analízis példák

1. példa

Tegyük fel, hogy havi értékesítésünk van, és marketingre költöttünk az elmúlt évre, és most meg kell jósolnunk a jövőbeni értékesítéseket a tavalyi értékesítések és a marketing ráfordítások alapján.

Hónap Hirdető Értékesítés
Jan 40937 502729
Február 42376 507553
Márc 43355 516885
Április 44126 528347
Lehet 45060 537298
Június 49546 544066
Július 56105 553664
Augusztus 59322 563201
Szept 59877 568657
Október 60481 569384
November 62356 573764
December 63246 582746

Kattintson az Adatok elemzése elemre az Adatok lapon, és ezzel megnyílik az Adatelemzés felugró ablak.

Most válassza a regressziót a listából, majd kattintson az OK gombra.

Megnyílik a regressziós pop-up.

Válassza az Értékesítési tartomány $ C $ 1: $ C $ 13 értéket az Y-tengely mezőben, mivel ez a függő változó, és a $ B $ 1: $ B $ 14 az X-tengelyben, mivel a hirdetési kiadás a független változó.

Jelölje be a Címkék mezőben a jelölőnégyzetet, ha fejléceket választott az adatokban, máskülönben ez adja a hibát.

Válassza a Kimeneti tartomány lehetőséget, ha meg szeretné kapni az értéket a munkalap adott tartományán, vagy válassza az Új munkalap réteg: lehetőséget, és ez új munkalapot ad hozzá, és megadja az eredményt.

Ezután jelölje be a Maradékok négyzetet, és kattintson az OK gombra.

Ez munkalapokat ad hozzá, és a következő eredményt adja.

Értsük meg a kimenetet.

Összefoglaló kimenet

R többszörös: Ez a korrelációs együtthatót jelenti. Az 1 érték pozitív kapcsolatot mutat, a 0 pedig nem mutat kapcsolatot.

R négyzet: az R négyzet a meghatározási együtthatót jelenti. Ez megmondja a regressziós egyenesre eső pontok százalékos arányát. 0,49 azt jelenti, hogy az értékek 49% -a illik a modellbe

Korrigált R négyzet : Ez a beállított R négyzet, amely akkor szükséges, ha egynél több X változó van.

Standard hiba: Ez a hiba szórásának becsült értékét jelenti. Ez a pontosság a regressziós együttható mérésében.

Megfigyelések: Ez a megfigyelések száma, amelyet egy mintában vett.

ANOVA - Df: A szabadság fokai

SS: Négyzetek összege.

MS: két tagállamunk van

  • A regresszió MS regresszió SS / regresszió Df.
  • A maradék MS az átlagos négyzetes hiba (maradék SS / maradék Df).

F: F teszt a nullhipotézishez.

F szignifikancia: A szignifikanciához kapcsolódó P-értékek

Együttható: Az együttható a legkisebb négyzetek becslését adja meg.

T statisztika: T statisztika nullhipotézishez képest az alternatív hipotézishez.

P-érték: Ez a hipotézis-teszt p-értéke.

Alsó 95% és felső 95%: Ezek a konfidencia intervallum alsó és felső határa

Maradékkimenet: 12 megfigyelésünk van az adatok alapján. 2 nd oszlop mutatja előrejelzett értékesítési és 3 rd oszlop maradványok. A maradványok alapvetően a várható eladások különbségét jelentik a ténylegesnél.

2. példa

Válassza ki a várható értékesítés és marketing oszlopot

Menjen a diagramcsoportra a beszúrás fül alatt. Válassza a scatter chart ikont

Ez beilleszti a szórási ábrát az excelbe. Lásd az alábbi képet

Kattintson a jobb gombbal bármelyik pontra, majd válassza a Trendline hozzáadása az excelben lehetőséget. Ez hozzáad egy trendvonalat a diagramjához.

  • A trendvonalat úgy formázhatja, hogy jobb egérgombbal kattint a trendvonal bármely pontjára, majd kiválasztja a trendvonal formátumát.
  • További javításokat végezhet a diagramon. azaz a trendvonal formázása, a szín és a cím megváltoztatása stb
  • A képletet a grafikonon is megjelenítheti, ha bejelöli a diagram Kijelző képletét, és megjeleníti az R négyzet értékét a diagramon.

Néhány további példa a lineáris regressziós elemzésre:

  1. Az eső alapján eladott esernyő jóslata a környéken történt.
  2. Az eladott AC jóslata a nyári hőmérséklet alapján.
  3. A vizsgaidény során a Stationary, a Exam Guide értékesítése növekedett.
  4. Az értékesítés előrejelzése, amikor a reklámozás megtörtént a High TRP sorozatok alapján, ahol hirdetést hajtanak végre, a márka nagykövete népszerűsége és a reklám közzétételének helyén lévő lábnyomok.
  5. Egy ház értékesítése a helyszín, a terület és az ár alapján.

3. példa

Tegyük fel, hogy kilenc hallgatónk van az IQ szintjével és a teszten elért pontszámával.

Diák Teszt eredmény IQ
Ram 100 145
Shyam 97 140
Kul 93 130
Kappu 91. 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

1. lépés: Először derítse ki a függő és független változókat. Itt a teszt pontszáma a függő változó, és az IQ a független változó, mivel a teszt pontszáma változik, amikor az IQ változik.

2. lépés: Lépjen az Adatok fülre - Kattintson az Adatelemzés - Regresszió kiválasztása elemre - kattintson az OK gombra.

Ez megnyitja az Ön számára a Regresszió ablakot.

3. lépés. Bemeneti teszt pontszámtartomány az Y bemeneti tartomány mezőben és az IQ az Input X tartomány mezőben. (Jelölje be a Címkék jelölőnégyzetet, ha fejlécei vannak az adattartományban. Válassza ki a kimeneti opciókat, majd ellenőrizze a kívánt maradékot. Kattintson az OK gombra.

Megkapja az alábbi képen látható összefoglaló kimenetet.

4. lépés: A regresszió elemzése összefoglaló kimenet alapján

Összefoglaló kimenet

Többszörös R: Itt a korrelációs együttható 0,99, ami nagyon közel áll az 1-hez, ami azt jelenti, hogy a lineáris kapcsolat nagyon pozitív.

R négyzet: az R négyzet értéke 0,983, ami azt jelenti, hogy az értékek 98,3% -a illeszkedik a modellhez.

P-érték: Itt a P-érték 1,86881E-07, ami nagyon alacsonyabb, mint 0,1, ami azt jelenti, hogy az IQ-nak szignifikáns prediktív értékei vannak.

Lásd az alábbi táblázatot.

Láthatja, hogy szinte az összes pont inline vagy egy közeli trendvonal alá esik.

4. példa

Meg kell jósolni az AC értékesítését az eladások és a hőmérséklet alapján egy másik hónapra.

Hónap Temp Értékesítés
Jan 25 38893
Február 28. 42254
Márc 31 42845
Április 33 47917
Lehet 37 51243
Június 40 69588
Július 38 56570
Augusztus 37 50000

A regressziós eredmény eléréséhez kövesse az alábbi lépéseket.

1. lépés: Először derítse ki a függő és független változókat. Itt az Értékesítés a függő változó, a Hőmérséklet pedig független változó, mivel az Értékesítés változik, miközben a hőmérséklet változik.

2. lépés: Lépjen az Adatok fülre - Kattintson az Adatelemzés - Regresszió kiválasztása elemre - kattintson az OK gombra.

Ez megnyitja az Ön számára a Regresszió ablakot.

3. lépés: Bemeneti értékesítés az Y bemeneti tartomány mezőben és a hőmérséklet az X bemeneti tartomány mezőben. (Jelölje be a Címkék jelölőnégyzetet, ha fejlécei vannak az adattartományban. Válassza ki a kimeneti opciókat, majd ellenőrizze a kívánt maradékot. Kattintson az OK gombra.

Ez összefoglaló kimenetet ad az alábbiak szerint.

4. lépés: Elemezze az eredményt.

Többszörös R: Itt a korrelációs együttható 0,877, ami közel 1-hez, ami azt jelenti, hogy a lineáris kapcsolat pozitív.

R négyzet: az R négyzet értéke 0,770, ami azt jelenti, hogy az értékek 77% -a illeszkedik a modellhez

P-érték: Itt a P-érték 1,86881E-07, ami nagyon alacsonyabb, mint 0,1, ami azt jelenti, hogy az IQ-nak szignifikáns prediktív értékei vannak.

5. példa

Most végezzünk regressziós elemzést több független változó számára:

Meg kell jósolnia egy jövő évre induló mobil eladását. Megvan az ára és azoknak az országoknak a száma, amelyek befolyásolják a mobilok értékesítését.

Mobil verzió Értékesítés Mennyiség Népesség
MINKET 63860 858 823
Egyesült Királyság 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RU 49019 689 778

A regressziós eredmény eléréséhez kövesse az alábbi lépéseket.

1. lépés: Először derítse ki a függő és független változókat. Itt az értékesítés függ a változótól, a mennyiségtől és a népességtől. Mindkettő független változó, mivel az értékesítés az ország mennyiségétől és népességétől függően változik.

2. lépés: Menjen az Adatok fülre - Kattintson az Adatelemzés - Regresszió kiválasztása elemre - kattintson az OK gombra.

Ez megnyitja az Ön számára a Regresszió ablakot.

3. lépés: Adja meg az értékesítést az Y bemeneti tartomány mezőben, és válassza ki a mennyiséget és a sokaságot az X bemenet tartomány mezőben. (Jelölje be a Címkék jelölőnégyzetet, ha fejlécei vannak az adattartományban. Válassza ki a kimeneti opciókat, majd ellenőrizze a kívánt maradékot. Kattintson az OK gombra.

Most futtassa a regressziót az Adatok lap alatti adatelemzés segítségével. Ez az alábbi eredményt adja.

Összefoglaló kimenet

Többszörös R: Itt a korrelációs együttható 0,93, ami nagyon közel van az 1-hez, ami azt jelenti, hogy a lineáris kapcsolat nagyon pozitív.

R négyzet: az R négyzet értéke 0,866, ami azt jelenti, hogy az értékek 86,7% -a illeszkedik a modellhez.

F szignifikancia: Az F szignifikancia kisebb, mint 1, ami azt jelenti, hogy a regressziós egyenletnek szignifikáns prediktív értéke van.

P-érték : Ha megnézzük a mennyiség és a népesség P-értékét, láthatjuk, hogy az értékek kisebbek, mint 1, ami azt jelenti, hogy a mennyiség és a populáció jelentős prediktív értékkel bír. A kevesebb P érték azt jelenti, hogy egy változónak szignifikánsabb prediktív értéke van.

Mindazonáltal mind a mennyiségnek, mind a populációnak jelentős prediktív értéke van, de ha megnézzük a mennyiség és a populáció P-értékét, akkor láthatja, hogy a mennyiség kisebb P-értékkel rendelkezik az excelben, mint a Population. Ez azt jelenti, hogy a mennyiség szignifikánsabb prediktív értékkel rendelkezik, mint a Népesség.

Dolgok, amikre emlékezni kell

  • Mindig ellenőrizze a Függő és Független változókat, amikor bármilyen adatot választ.
  • A lineáris regresszióanalízis a változók átlaga közötti kapcsolatot veszi figyelembe.
  • Ez csak a lineáris változók közötti kapcsolatot modellezi
  • Néha ez nem a legalkalmasabb a valós problémákra. Például: (Életkor és a bérek). Legtöbbször a bérek nőnek, mivel az életkor növekszik. Viszont nyugdíjazása után az életkor növekszik, a bérek viszont csökkennek.

érdekes cikkek...