Empirikus szabály - definíció, képlet, hogyan kell használni a statisztikában?

Mi az empirikus szabály a statisztikában?

Az empirikus szabály a statisztikában kimondja, hogy a normál eloszlásban megfigyelt megfigyelések szinte mindegyike (95%) 3 átlageltérésen belül van. Ez egy nagyon fontos szabály, és segít az előrejelzésben.

Képlet

A képlet megmutatja a megfigyelések előre jelzett százalékos arányát, amelyek az átlagtól eltérnek.

A szabály szerint:

  • A megfigyelések 68% -a +/- 1 szóráson belül lesz az átlagtól
  • A megfigyelések 95% -a +/- 2 szóráson belül lesz az átlagtól
  • A megfigyelések 7% -a +/- 3 szóráson belül lesz az átlagtól

Hogyan kell használni?

Ezt használják egy adatkészlet előrejelzési trendjében. Amikor az adatkészlet kiterjedt, és kihívást jelent a teljes populáció tanulmányozása, akkor az empirikus szabály alkalmazható a mintára, hogy megbecsülje, hogyan reagálnak a populációban lévő adatok, ha arra kérik Önt, hogy keresse meg az összes fizetés átlagát a könyvelők az Egyesült Államokban. Akkor ezt nehéz elvégezni, mivel a népesség hatalmas. Tehát ebben az esetben mondjuk 90 megfigyelést választhat ki véletlenszerűen az egész populációból.

Tehát most 90 fizetése lesz. Meg kell találnia a megfigyelések átlagát és szórását. Ha a megfigyelés normális eloszlást követ, akkor ez alkalmazható, és becsülhető az Egyesült Államok összes könyvelőjének fizetése.

Tegyük fel, hogy a minta átlagos fizetése 90 000 dollár lesz. A szórás pedig 5000 dollár. Tehát a teljes népességből a könyvelők 68% -a +/- 1 standard átlagtól való eltérés közötti fizetést húz. Mivel az átlag 90 000 dollár, a szórás pedig 5000 dollár. Tehát az Egyesült Államokban az összes könyvelő 68% -ának fizetése 90 000 USD +/- (1 * 5000 USD) között van. Ez 85 000 és 95 000 USD között van

Ha valamivel többet terjesztünk, akkor az Egyesült Államokban az összes könyvelő 95% -át az átlag +/- 2 szórás tartományban fizetik. 90 000 USD +/- (2 * 5000). Tehát a tartomány 80 000–100 000 USD.

Szélesebb körben az összes könyvelő 99,7% -a átlagosan +/- 3 standard eltérésig terjedő fizetést vesz fel. Ez 90 000 +/- (3 * 5000). A tartomány 75 000–105 000 USD

Jól látható, hogy a teljes népesség tanulmányozása nélkül becslést lehetne készíteni a népességre vonatkozóan. Ha valaki könyvelőként dolgozik az Egyesült Államokban, akkor könnyen számíthat arra, hogy fizetése 75 000 és 105 000 dollár között mozog

Ez a fajta becslés megkönnyíti a munkát és előrejelzéseket készít a jövőre vonatkozóan.

Empirikus szabálypéldák

X úr megpróbálja megtalálni az emberek átlagos életének számát a nyugdíjazása után, 60 évesnek tekintve a nyugdíjkorhatárt. Ha 50 véletlenszerű megfigyelés átlagos túlélési éve 20 év, SD pedig 3, akkor derítse ki annak valószínűségét, személy 23 évnél hosszabb nyugdíjat fog igénybe venni

Megoldás

Az empirikus szabály kimondja, hogy a megfigyelések 68% -a az átlagtól 1 szóráson belül helyezkedik el. Itt a megfigyelések átlaga 20.

A megfigyelések 68% -a 20 +/- 1 (szórás), azaz 20 +/- 3 tartományba esik, tehát a tartomány 17 és 23 között van.

68% esélye van annak, hogy az ember a nyugdíjazása után túléljen minimális éveket 17 és 23 között. Most ezen a tartományon kívül esik (100 - 68) = 32%. A 32 egyenlő arányban oszlik meg mindkét oldalon, ami 16% esélyt jelent arra, hogy a minimális évek 17 alatt maradnak, és 16% esélyt, hogy a minimális évek meghaladják a 23-at.

Tehát annak valószínűsége, hogy az illető több mint 23 éves nyugdíjat fog igénybe venni, 16%.

Empirikus szabály kontra Csebisev tétele

Az empirikus szabályt olyan adathalmazokra alkalmazzák, amelyek normális eloszlást követnek, ami harang alakú. Normál eloszlás esetén az eloszlás mindkét oldalán 50% a valószínűség.

Ha az adatkészlet nem normálisan oszlik el, akkor van egy másik közelítés vagy szabály, amely minden típusú adathalmazra vonatkozik, ez Cebisev tétele. Három dolgot mond:

  • Legalább 3/4 th összes megfigyelések fekszenek 2Standard Eltérések az átlag. Erős közelítés. Ez azt jelenti, ha van 100 megfigyelések, majd 3/4 th a megfigyelések, amelyek a 75 megfigyelések fekszenek +/- 2 szórás az átlagtól.
  • Legalább 8/9 th összes megfigyelések fekszenek 3Standard Eltérések az átlag.
  • Az összes megfigyelésnek legalább 1 - 1 / k 2-e az átlagtól való K szóráson belül helyezkedik el. Itt K-t tetszőleges egész számnak nevezzük.

Mikor kell használni?

Az adatok olyanok, mint az arany a modern világban. Hatalmas adatok áramlanak különböző forrásokból, és különböző közelítésekhez vagy előrejelzésekhez használják őket. Ha egy adathalmaz normál eloszlást követ, akkor harang alakú görbét mutat; akkor az empirikus szabály használható. Megfigyelésekre alkalmazzák, hogy közelítést hozzanak létre a populáció számára.

Miután láttuk, hogy a megfigyelések normális eloszlási struktúrát mutatnak, akkor az empirikus szabályt követjük a megfigyelések több valószínűségének megtalálásához. A szabály rendkívül hasznos számos statisztikai előrejelzéshez.

Következtetés

Az empirikus szabály egy statisztikai fogalom, amely segít a megfigyelések valószínűségének ábrázolásában, és nagyon hasznos, ha hatalmas populáció közelítését találja meg. Mindig meg kell jegyezni, hogy ezek közelítések. Mindig van esély olyan outlierekre, amelyek nem esnek az eloszlásba. Tehát a megállapítások nem pontosak, és az előrejelzésnek megfelelően kell eljárni.

érdekes cikkek...