Chi tér teszt az Excel-ben - Hogyan végezzük el a Chi négyzet tesztet példával

Tartalomjegyzék

Chi-Square teszt az Excel programmal

Chi-Square teszt az Excel programmal

A chi-square teszt az excelben a leggyakrabban használt nem parametrikus teszt, amelyet két vagy több változó összehasonlítására használnak véletlenszerűen kiválasztott adatokhoz. Ez egy olyan típusú teszt, amelyet két vagy több változó közötti kapcsolat kiderítésére használnak, ezt használják a statisztikákban, amelyet Chi-Square P-értéknek is neveznek, az excelben nincs beépített függvényünk, de használhatjuk képletek a chi-négyzet teszt excelben történő elvégzésére a Chi-Square teszt matematikai képletének felhasználásával.

Típusok

Chi-Square teszt az illeszkedés jóságára
Chi-Square teszt két változó függetlenségére.

# 1 - Chi-Square teszt az alkalmasság jóságára

Egy populációnak megfelelő minta közelségének érzékelésére szolgál. A Chi-Square teszt szimbóluma a (2). Ez az összes ( Megfigyelt szám - Várható szám) ² / Várható szám összege .

Ahol k-1 szabadságfok vagy DF.
Ahol Oi a megfigyelt gyakoriság, k a kategória és Ei a várható gyakoriság.

Megjegyzés: - A statisztikai modell illeszkedésének jósága annak megértésére utal, hogy a minta adat mennyire illeszkedik egy megfigyelés halmazához.

Használ

A hitelfelvevők hitelképessége korosztályuk és személyi kölcsönök alapján
Az értékesítők teljesítménye és a kapott képzés kapcsolata
Egyetlen részvény és egy olyan szektor részvényeinek megtérülése, mint a gyógyszeripar vagy a banki tevékenység
A nézők kategóriája és egy tévés kampány hatása.

# 2 - Chi-Square teszt két változó függetlenségére

Arra használják, hogy ellenőrizzék, a változók függetlenek-e egymástól vagy sem. (R-1) (c-1) szabadságfokkal

Ahol Oi a megfigyelt gyakoriság, r a sorok száma, c az oszlopok száma és Ei a várható gyakoriság

Megjegyzés: - Két véletlen változót függetlennek nevezünk, ha az egyik változó valószínűségi eloszlását a másik nem befolyásolja.

Használ

A függetlenségi teszt a következő helyzetekre alkalmas:

Van egy kategorikus változó.
Két kategorikus változó létezik, és meg kell határoznia a köztük lévő kapcsolatot.
Kereszt-táblázatok vannak, és meg kell találni a kapcsolatot két kategorikus változó között.
Vannak nem számszerűsíthető változók (például olyan kérdésekre adott válaszok, hogy a különböző korcsoportokban dolgozók különböző típusú egészségügyi terveket választanak-e?)

Hogyan kell elvégezni a Chi-Square tesztet az Excelben? (példával)

Egy étterem vezetője meg akarja találni a kapcsolatot az ügyfelek elégedettsége és az asztalokra várók fizetése között. Ebben fel fogjuk állítani a hipotézist a Chi-Square tesztelésére

Véletlenszerű mintát vesz 100 ügyfélből, és megkérdezi, hogy a szolgáltatás kiváló, jó vagy rossz volt-e.
Ezután a várakozók fizetését alacsony, közepes és magas kategóriába sorolja.
Tegyük fel, hogy a szignifikancia szintje 0,05. Itt H0 és H1 jelöli a szolgáltatás minőségének függetlenségét és függését a várakozó asztalok fizetésétől.
H ₀ - a szolgáltatás minősége nem függ az asztalokra várók fizetésétől.
H ₁ - a szolgáltatás minősége az asztalokra várók fizetésétől függ.
Megállapításait az alábbi táblázat mutatja:

Ebben 9 adatpontunk van, 3 csoportunk van, amelyek mindegyike más-más üzenetet kapott a fizetésről, és az eredményt az alábbiakban adjuk meg.

Most megszámoljuk az összes sor és oszlop összegét. Ezt képlet, azaz SUM segítségével fogjuk megtenni . A Teljes oszlop összesítéséhez a = SUM (B4: D4) értéket írtuk , majd nyomjuk meg az Enter billentyűt.

Ezzel 26-ot kapunk . Ugyanezt fogjuk végrehajtani az összes sorral és oszloppal.

Kiszámításához szabadsági foka (DF), az általunk használt (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

3 kategóriájú szolgáltatás és 3 fizetési kategória létezik.
27 válaszadónk van közepes fizetéssel (alsó sor, közép)
51 válaszadónk van, jó szolgáltatással (utolsó oszlop, középső)

Most ki kell számolnunk a várható frekvenciákat: -

A várható gyakoriságokat egy képlet segítségével lehet kiszámítani: -

A Kiváló kiszámításához az alacsony és a Kiváló összértékének N-vel elosztott szorzatát használjuk .

Tegyük fel, hogy számolnunk kell az 1. sorra és az 1. oszlopra (= B7 * E4 / B9 ) . Ez meg fogja adni a várható ügyfélszámot, akik a Kiváló szolgáltatást választották a várakozók fizetéséhez, alacsony, azaz 8,32 .

E _{11 =} - (32 * 26) / 100 = 8,32 , E ₁₂ = 7,02 , E ₁₃ = 10,66
E ₂₁ = 16,32 , E ₂₂ = 13,77 , E ₂₃ = 20,91
E ₃₁ = 7,36 , E ₃₂ = 6,21 , E ₃₃ = 9,41

Hasonlóképpen, mindenkinek ugyanezt kell tennünk, és a képletet az alábbi ábra alkalmazza.

Megkapjuk a Várható gyakoriság táblázatot az alábbiak szerint: -

Megjegyzés: - Tegyük fel, hogy a szignifikancia szintje 0,05. Itt H0 és H1 jelöli a szolgáltatás minőségének függetlenségét és függését a várakozó asztalok fizetésétől.

A várható gyakoriság kiszámítása után egy képlet segítségével kiszámítjuk a khi-négyzet adatpontokat.

Chi-négyzetpontok = (Megfigyelt-várt) 2 / Várható

Az első pont kiszámításához írjuk = (B4-B14) 2 / B14.

Másoljuk és beillesztjük a képletet más cellákba az érték automatikus kitöltése érdekében.

Ezt követően kiszámítjuk a chi-értéket (Számított érték) a táblázat felett megadott összes érték hozzáadásával.

A Chi-értéket 18.65823 -ban kaptuk .

Ennek kritikus értékének kiszámításához egy chi-négyzet kritikus érték táblázatot használunk, amelyből az alábbi képletet használhatjuk.

Ez a képlet 2 paramétert tartalmaz CHISQ.INV.RT (valószínűség, szabadsági fok).

A valószínűség 0,05, és ez egy jelentős érték, amely segít meghatározni, hogy elfogadjuk-e a Null Hipotézist (H ₀ ) vagy sem.

A chi-négyzet kritikus értéke 9,487729037.

Most megtaláljuk a chi-négyzet vagy a (P-érték) = CHITEST (tényleges_tartomány, várható_tartomány ) értékét

Tartomány = CHITEST (B4: D6, B14: D16) .

Mint láttuk, a chi-teszt vagy a P-érték értéke = 0,00091723.

Kiszámítottuk az összes értéket. A khi-négyzet (Számított érték) értékek csak akkor szignifikánsak, ha értéke megegyezik vagy meghaladja a kritikus értéket 9,48, vagyis a kritikus értéknek (táblázatos értéknek) magasabbnak kell lennie, mint a 18,65, hogy elfogadja a nullhipotézist (H ₀ ) .

De itt Számított érték > Táblázatos érték

X ² (számított)> X ² (táblázatos)

18,65> 9,48

Ebben az esetben elutasítjuk a _nulla hipotézist (H ₀ ), és az alternatívát (H ₁ ) elfogadjuk.

Használhatjuk a P-Value-t is ennek megjóslásához, azaz ha P-érték <= α (szignifikáns érték 0,05), akkor a Null hipotézist elutasítjuk.
Ha a P-érték> α , ne utasítsa el a nullhipotézist .

Itt P-érték (0.0009172) < α (0,05), elutasítja H ₀ , fogadja H ₁

A fenti példából arra következtetünk, hogy a szolgáltatás minősége a várakozók fizetésétől függ.

Dolgok, amikre emlékezni kell

A szokásos normál variáns négyzetét tekinti.
Értékeli, hogy a különböző kategóriákban megfigyelt frekvenciák szignifikánsan eltérnek-e a meghatározott feltételezések alapján elvárt frekvenciáktól.
Meghatározza, hogy egy feltételezett eloszlás mennyire illeszkedik az adatokhoz.
Kontingencia táblázatokat használ (a piackutatás során ezeket a táblázatokat keresztfüleknek nevezzük).
Támogatja a névleges szintű méréseket.