Outlier Formula - Outlier kiszámítása lépésről lépésre (példával)

Tartalomjegyzék

Az Outlier képlet egy grafikus eszközt biztosít az adatok kiszámításához, amelyek az adott eloszlási halmazon kívül helyezkednek el, amelyek a változóktól függően lehetnek belső vagy külső oldalak.

Mi az Outlier Formula?

Kiugró érték az adott minta vagy megfigyelés adatpontja, vagy olyan eloszlásban, amely az általános mintán kívül esik. Általánosan használt szabály, amely azt mondja, hogy egy adatpont akkor tekinthető kiugró értéknek, ha annak több mint 1,5 IQR-je van az első kvartilis alatt vagy a harmadik kvartilis felett.

Másképp mondva, az alacsony kiugró értékeknek Q1-1,5 IQ alatt kell lenniük, a magasaknak pedig Q3 + 1,5IQR alatt kell lenniük

Ki kell számítani a mediánt, a kvartiliseket, ideértve az IQR, Q1 és Q3 értékeket.

A kiugró képletet a következőképpen ábrázolják:

A képlet Q1 = ¼ (n + 1) th távon  a képlet Q3 = ¾ (n + 1) th távon  a képlet Q2 = Q3 - Q1

Outlier kiszámítása lépésről lépésre

Az alábbi lépéseket kell követni a Kiugró érték kiszámításához.

  • 1. lépés: Először számítsa ki a kvartiliseket, azaz a Q1, Q2 és az interkvartiliseket
  • 2. lépés: Most számítsa ki a Q2 * 1,5 értéket
  • 3. lépés: Most vonja le a Q1 értéket a 2. lépésben számított értékből
  • 4. lépés: Itt adjuk meg a Q3 értéket a 2. lépésben kiszámított értékkel
  • 5. lépés: Készítse el a 3. és 4. lépésben kiszámított értéktartományt
  • 6. lépés: Rendezze az adatokat növekvő sorrendbe
  • 7. lépés: Ellenőrizze, hogy vannak-e olyan értékek, amelyek az 5. lépésben létrehozott tartomány alatt vagy alatt vannak.

Példa

Vegyünk egy adatkészletet a következő számokból: 10, 2, 4, 7, 8, 5, 11, 3, 12. Kiszámítania kell az összes Outliert.

Megoldás:

Először az adatokat növekvő sorrendben kell rendezni, hogy megtaláljuk a mediánt, ami számunkra Q2 lesz.

2, 3, 4, 5, 7, 8, 10, 11, 12

Most, mivel a megfigyelések száma páratlan, amely 9, a medián feküdjön egy 5 -én helyzetben, amely 7, és ugyanaz lesz Q2 ebben a példában.

Ezért a Q1 kiszámítása a következő -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 lesz -

Q1 = 2,5 táv

Ez azt jelenti, hogy Q1 a átlaga 2 ND és 3 rd helyzetét a megfigyelések, ami 3 & 4 itt, és átlagosan ugyanez (3 + 4) / 2 = 3,5

Ezért a Q3 kiszámítása a következő -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 lesz -

Q3 = 7,5 kifejezés

Ez azt jelenti, hogy Q3 jelentése az átlag az 7 -én és 8 -én helyzetét a megfigyelések, ami 10 és 11 van, és átlagosan ugyanez (10 + 11) / 2 = 10,5

Most az alacsony kiugró értékek Q1-1.5IQR alatt, a magasak pedig a Q3 + 1.5IQR alatt állnak

Tehát az értékek 3,5 - (1,5 * 7) = -7, a magasabb tartomány pedig 10,5 + (1,5 * 7) = 110,25.

Mivel nincsenek olyan megfigyelések, amelyek 110,25 és -7 alatt lennének, vagy ennél alacsonyabbak, ezért ebben a mintában nincsenek kiugró értékek.

Példa Outlier képletre az Excelben (Excel sablonnal)

A kreatív coaching osztályok fontolgatják azoknak a hallgatóknak a jutalmazását, akik a legjobb 25% -ban szerepelnek. Mindazonáltal szeretnék elkerülni a kiugró értékeket. Az adatok a 25 hallgatóra vonatkoznak. Használja az Outlier egyenletet annak megállapítására, hogy van-e outlier?

Megoldás:

Az alábbiakban adunk adatokat a kiugró érték kiszámításához.

A megfigyelések száma itt 25, és első lépésünk a fenti nyers adatok konvertálása növekvő sorrendben.

Medián lesz -

A mediánérték = ½ (n + 1)

= ½ = ½ (26)

= 13 th távú

A Q2 vagy medián 68,00

Ami a lakosság 50% -a.

Q1 lesz -

Q1 = ¼ (n + 1). Tag

= ¼ (25 + 1)

= ¼ (26)

= 6,5 edik ciklus, amely egyenértékű a 7 th távú

A Q1 56,00, ami az alsó 25%

Q3 lesz -

Végül Q3 = ¾ (n + 1). Tag

= ¾ (26)

= 19,50 kifejezés

Itt az átlagos kell venni, ami a 19 -én és 20 -én kifejezést, amely a 77 és 77, valamint az átlag ugyanez (77 + 77) / 2 = 77,00

A Q3 77, ami a felső 25%

Alacsony tartomány

Most az alacsony kiugró értékek Q1-1.5IQR alatt, a magasak pedig a Q3 + 1.5IQR alatt állnak

Nagy hatótávolság -

Tehát az értékek 56 - (1,5 * 68) = -46, a magasabb tartomány pedig 77 + (1,5 * 68) = 179.

Nincsenek kiemelkedők.

Relevancia és felhasználás

Az Outliers képletet nagyon fontos tudni, mivel lehetnek olyan adatok, amelyek torzulnának egy ilyen érték által. Vegyünk egy példát a 2., 4., 6., 101. megfigyelésre, és ha valaki ezeknek az értékeknek az átlagát veszi, akkor az 28,25 lesz, de a megfigyelések 75% -a 7 alatt van, és ezért egy helytelen döntés lenne a ezt a mintát.

Itt észrevehető, hogy a 101 egyértelműen körvonalazódni látszik, és ha ezt eltávolítják, akkor az átlag 4 lenne, ami azt mondja az értékekről vagy megfigyelésekről, hogy a 4 tartományba esnek. számítással az adatokkal kapcsolatos visszaélések elkerülése érdekében. Ezeket a statisztikusok világszerte széles körben használják, amikor bármilyen kutatást végeznek.

érdekes cikkek...