Excel Box Plot
Az excel meződiagramja képi ábrázolás vagy diagram, amely az adatok halmazának eloszlását ábrázolja. Jelzi, hogy az adatkészlet értékei hogyan oszlanak meg. A vonaldiagramon a numerikus adatok összefoglalásként öt szám felhasználásával jelennek meg: Minimum, Maximum, Első kvartilis, Második kvartilis (Medián), Harmadik kvartilis.
Az első és a harmadik kvartilis között egy négyzetet rajzolunk egy további vonallal együtt, amelyet a második kvartilis mentén húzunk a medián jelölésére. Az első és a harmadik kvartilisen kívül meghúzott vonalak húzódnak a minimum és a maximum ábrázolására. Ezeket a meghosszabbított vonalakat bajusznak nevezzük a dobozban.
A boxplot doboza az elsőtől a harmadik kvartilisig mutat, a második kvartilisnél egy vonallal, azaz mediánnal. A bajusz vége a minimumot és a maximumot ábrázolja.
A boxplot által ábrázolt öt szám:
- Minimum: Az adatkészlet legkisebb / legkisebb értéke.
- Első kvartilis: A minimum és a medián középértéke.
- Második kvartilis / medián: Az adatkészlet középértéke .
- Harmadik kvartilis: A medián és a maximum középértéke.
- Maximum: Az adatkészlet legnagyobb értéke.

Hogyan készítsünk dobozdiagramot az Excelben? (egy példával)
Tegyük fel, hogy van egy olyan osztályunk adatállománya, amely a tanulóinak összes jegyét tartalmazza az összes tantárgyból (az 500-ból max. Jegy: 100 minden tantárgyhoz), és szeretnénk létrehozni egy dobozdiagramot az excelben ugyanarra.
A következő hallgatói adatok vannak egy excel lapon:

Most a következő lépésekkel hozhat létre dobozdiagramot a fenti adatokhoz (alapvetően az Excel 2013-ban):
Nagyon egyszerű egy dobozdiagramot létrehozni az Excel 2016 alkalmazással, mivel alapértelmezés szerint a „Diagram és a hab” diagram látható a diagramok szakasz statisztikai diagramjai alatt. Az Excel 2013-ban azonban alapértelmezés szerint nincs diagramsablon a dobozdiagramhoz; így az alábbi lépéseket követve kell létrehoznunk:
Számítsa ki az adatkészletből a statisztikai diagramhoz szükséges öt statisztikát: Minimum, Three Quartiles és Maximum, a következő függvények használatával:

Most számítsa ki a minimális statisztikákat az adatkészletből.

Most számítsa ki a quantile1 statisztikákat az adatkészletből.

Öt statisztika kiszámítása a négyzetdiagramra:

Most létrehozunk egy végső táblázatot (mondjuk a különbségtáblázatot), amelyet felhasználva létrehozzuk a box diagramot az excelben. Ebben a döntő táblázatban lemásoljuk a minimális értéket, és ez lesz a végső asztalunk első bejegyzése. A végső táblázat többi bejegyzése az alábbi statisztikák közötti különbségeket mutatná:

Most létrehozunk egy halmozott oszlopdiagramot ezzel az utolsó táblával, és dobozdiagrammá alakítjuk.
Tehát először hozzunk létre egy halmozott oszlopdiagramot az excelben:
Válassza a Különbségek és érték lehetőséget, majd kattintson a "Beszúrás" -> Minden ábra -> Halmozott oszlopdiagramok gombra:

Ennek során halmozott diagramot kapunk az alábbiak szerint:

Láthatjuk, hogy ez nem hasonlít egy dobozdiagramhoz, mert ezzel a halmozott diagrammal az Excel alapértelmezés szerint vízszintesen, és nem függőleges adatkészletből rajzolja a halmozott oszlopokat. Tehát meg kell fordítanunk a diagram tengelyeit.
Ehhez kattintson a jobb gombbal a diagramra, majd kattintson az 'Adatok kiválasztása' gombra.

Most kattintson a Sor / oszlop váltása gombra.

Halmozott diagramot kapunk az alábbiak szerint:

Ezt a halmozott diagramtípust most konvertáljuk dobozdiagramba az alábbiak szerint:
Válassza ki az oszlop alsó részét (kék terület), és kattintson az 'Adatsorok formázása' gombra.

A „Formátum adatsor” panelen bontsa ki a „Kitöltés” lehetőséget, és válassza a „Nincs kitöltés” gombot, majd a „szegély” legördülő menüből bontsa ki és válassza a „Nincs vonal” gombot:

A következő diagramdiagramot kapjuk az alábbiak szerint:

A következő lépés a bajusz létrehozása az alsó szegmens legfelső és második részének, azaz a piros és narancssárga régiók (ahogyan a legalsót legtöbben töröltük) helyettesítésével vonalakkal / bajuszokkal.
A felső bajusz rajzolásához kiválasztjuk a legfelső régiót / szegmenst (piros), és kibővítjük a 'Kitöltés' fület.

És válassza a "Nincs kitöltés" gombot.

Most kattintson a "Tervezés" -> "Diagramelemek hozzáadása" -> "Hibasávok" -> "Standard eltérés" gombra:

Most kattintson a plusz gombra a diagram jobb felső sarkában, és válassza ki és bontsa ki a „Hibasávok az excelben” lehetőséget, majd válassza a „További opciók” lehetőséget.

Ez megnyitja a „Hibasávok formázása” panelt, és beállítja a következőket:
Beállítás: Irány „Plus” -ra
Stílus vége a „sapkáig”
Százalék 100% -ra.

Tehát most egy felső bajuszt rajzolunk az alábbiak szerint:

Hasonlóképpen, az alsó bajusz megrajzolásához az alsó régióból kiválasztjuk a másodikat (narancssárga, amely most utoljára látható), és ismételjük meg ugyanazokat a lépéseket, mint fent. Az egyetlen változás az lenne, hogy a hibasávokban az „irány” értéke „mínusz” lesz.

Tehát most egy alacsonyabb bajuszt rajzolunk az alábbiak szerint:

Tehát a fenti képernyőképen láthatjuk, hogy a halmozott oszlopdiagram most egy dobozdiagramra hasonlít. A dobozos parcellák általában azonos színűek, ezért egy kitöltési színt használhatunk rá enyhe szegéllyel.

Most nézzük meg, hogyan értelmezik vagy nézik a dobozdiagramot:
A fenti képernyőképen láthatjuk, hogy:
- Alacsonyabb bajusz végpontok 300-nál, amely a minimális értéket ábrázolja.
- A felső bajusz végpontjai valahol 500 alatt vannak, ami pontosan 492, ami a maximumot ábrázolja.
- A zöld mező felső sora a kvartilit3 ábrázolja, amelyet 480,5 pontnál látunk.
- A zöld mező középvonala a medián / kvartilis2 értéket ábrázolja, amelyet 450 pontnál látunk.
- A zöld mező utolsó sora az 1. kvartilit ábrázolja, amelyet a 392 pontnál látunk.
Tehát az adott adatkészlet dobozdiagramját a fentiek szerint kiszámított öt statisztikával (minimum, három kvartilis és maximum) helyesen rajzoljuk meg.
Dolgok, amikre emlékezni kell
- A dobozdiagram egy numerikus adatkészlet képi ábrázolása, amely öt szám összegzéssel ábrázolja az adatkészlet eloszlását.
- A Box plot s más néven box és whisker plot.
- Általában magyarázó adatok elemzésére használják.
- Általában akkor használják őket, ha néhány mintát össze kell hasonlítanunk, és tesztelnünk kell, hogy az adatok szimmetrikusan oszlanak-e meg.
- A dobozdiagramok kevesebb helyet foglalnak el, mint a sűrűségábrák vagy hisztogramok.
- Az eloszlás alakjának, a központi értéknek és annak változékonyságának bemutatására szolgál.
- Nem szükséges, hogy a medián a mező közepén legyen.
- A bajusz különböző hosszúságú lehet.
- A dobozdiagram felhasználható a kiugró értékek felderítésére.