Blog

Átlag, vagy medián?

Átlag, vagy medián?
Normalitás vizsgálat Anderson-Darling módszerrel

Tegyük fel, hogy Ön egy kisvállalkozás vezetője, s cége által elért rendkívül sikeres előző éves eredmények alapján a szokásos január eleji emelésen kívül a dolgozók további béremelési igénnyel állnak elő, mert szerintük az elmarad a környéken található cégekhez viszonyítva.

Könyvelőjétől megtudja, hogy az Önök vállalkozásánál az átlagos havi bruttó bér összege 220.100 forint az év eleji béremelések alapján, s ez bizony elmarad a KSH által jelentett 245.000 forint összegtől.

Vajon mi a probléma és mit kellene tenni?

Hogy Ön is könnyen tudjon dönteni, csak meg kell vizsgálnia a rendelkezésre álló adatokat, melyek az alábbiak szerint alakulnak grafikusan ábrázolva:

Folyamatfejlesztőként megtanulhatja Lean Six Sigma képzéseinken, hogy mennyiségi adatokból álló adatsorokat 3 féle várható értékkel jellemezhet:

  • Az átlag, mely az adathalmaz egyszerű számtani átlaga
  • A medián, mely a középső elemet jelenti, azaz az adatpontok 50%-a kisebb, illetve 50%-a magasabb ennél az értéknél
  • A módusz, mely a leggyakrabban előforduló elemet jelenti.


Excelbe bemásolva az adatokat az alábbiakat kapjuk:

  • Átlag      = 220 000 Ft
  • Medián = 111 000 Ft    
  • Módusz = 111 000 Ft


Vajon melyikre támaszkodjunk?

Az átlagbér valóban elmarad a KSH jelentésben szereplő értéktől, azonban nagyobb probléma, hogy az majdnem kétszerese a medián értékének, így nem biztos, hogy az átlagbér a legjobb jellemzője a bérszínvonalnak.

Kérem, tekintsen ismét a fenti grafikonra, s bizony láthatja, hogy a dolgozók 60%-ának alacsonyabb a fizuja, mint az átlag (ez alapján még beszélhetnénk akár egy enyhén eltolódott normál eloszlásról is), azonban ez utóbbit nagyban befolyásolja egy szélsőérték, mely a vezető fizetéséből adódik!

2 megoldást látok a probléma feloldására:

  • Rövidtávon gondolkozó vezetőként valószínűleg igazat adna a kollégák követelésének, s megemelné saját fizetését 850 000 Ft-ról 1 350 000 Ft-ra, így büszkén hirdetné, hogy sikerült felzárkózni a régiót átlagosan jellemző 245 000 Ft átlagbérhez.
  • Hosszútávon gondolkozó vezetőként viszont bizonyára megpróbálná alkalmazni a rétegzés technikáját, azaz külön a fizikai, külön a szellemi dolgozókra számítana várható értéket, s az előbbit talán még tovább bontaná szak-, illetve betanított munkás csoportokra a korrekt összehasonlíthatóság kedvéért, hogy meghozza döntését. Mindenesetre célszerű lenne az átlag mellett legalább egy medián adatot is beszereztetni könyvelőjével a pontosabb összehasonlíthatóság érdekében KSH honlapjáról…


Az élet számos területén gyűjtött mennyiségi adatok esetén hasznos megvizsgálni, hogy vajon átlaggal, vagy inkább mediánnal jellemezhetők inkább elkerülve a fenti problémát.

Amennyiben megpróbálja számszerűsíteni az átlag, illetve medián értéket bármely mennyiségi adatcsoport jellemzésére, tapasztalni fogja, hogy azok az esetek nagyon nagy hányadában eltérnek egymástól.

Vajon, ha a fenti példánál maradunk, akkor 50 000 Ft eltérés már nem jelentős?
Vagy esetleg sokkal szigorúbbnak kell lenni és az átlag, illetve medián közötti 10 000 Ft eltérés esetén már az utóbbit kellene használni, mivel azt nem befolyásolja szélsőérték (főnök fizuja)?

Lean Six Sigma folyamatfejlesztők jól tudják, hogy ez bizony nem szubjektív döntés alapján történik, hanem úgynevezett normalitás tesztet kell végezni, melyre nagyon elterjedt az Anderson-Darling normalitás vizsgálat, hiszen már kis elemszámú adatsorok esetén is pontos becslést ad a döntéshez:

A lényege, hogy egy ún. hipotézis vizsgálat elvégzésével elemezzük eltér-e adathalmazunk jelen esetben a normális eloszlástól valemilyen megbízhatósági szinttel (ez általában 95%, tehát alfa egyenlő 0,05).

Null hipotézis (H0): Az adataink által követett eloszlás nem különbözik a normálistól -> Adatsorunk az átlaggal jellemezhető, mint várható értékkel
Alternatív hipotézis (Ha): Igenis eltér a normálistól, mert vagy szélsőérték befolyásolja, vagy pedig más típusú eloszlás jellemzi azt -> Átlag helyett inkább a mediánnal jellemezzük az adatsort

A wikipedia leírásban szereplő nem túl egyszerű Anderson-Darling normalitás vizsgálat kalkulációt elvégezve azt kapjuk, hogy a p érték kisebb, mint a fent meghatározott 0,05-tel jelölt szignifikancia (alfa) szint, így elégséges bizonyítékunk van a null hipotézis elvetésére (azaz a 111 000 Forintos medián a jobb jellemző, s azt kellene hasonlítanunk a többi mediánjaihoz).

Ha rátekintünk adatainkból készült hisztogram-ra, akkor bizony az távol áll a klasszikus haranggörbétől szintén:

Talán még látványosabb az a grafikon, amelyen „kvázi” kihúzzuk egyenesre a kék vonalat jelentő haranggörbét (különösen a szélsőértéket rejtő széleknél, így az Y tengely nem linerárissá válik) és azt vizsgáljuk mennyire simulnak rá a pirossal jelölt adatpontjaink:

Szeretné Ön is elvégezni a fenti számítást anélkül, hogy a wikipédia leírásban szereplő kalkulációkat tartalmazó számítást elkészítse?

Amennyiben igen, akkor töltse le bátran Anderson-Darling normalitás vizsgálat kalkulátort tartalmazó Lean Six Sigma excel sablonunkat, mely 500 adatpontot képes kezelni egyszerre, s kövesse az instrukciókat!

További információkért folyamatfejlesztési eszközökről olvassa Lean Six Sigma esettanulmányainkat, illetve hírlevelünket, tekintse meg folyamatfejlesztésben használatos sablonjainkat, vagy jelentkezzen képzéseinkre!

Jó folyamatfejlesztést kívánunk!

Megosztás:
Keresés
Legutóbbi bejegyzések

Lean six sigma könyv – Brian Joiner: The Fourth Generation Management

Brian Joiner The Fourth Generation Management: The New Business Consciousness című könyve a minőségmenedzsment és a szervezeti hatékonyság témáit tárgyalja, és bemutatja, hogyan léphetnek a vállalatok a hagyományos menedzsmentről egy új, fejlettebb megközelítés felé. A könyv különösen hasznos azok számára, akik a minőség és a folyamatos fejlesztés szemléletét szeretnék integrálni a vállalatuk mindennapi működésébe.

Tovább olvasom »

Genrich Altshuller TRIZ módszert oktat

Altshuller 1946-ban, fiatal mérnökként kezdte pályafutását a Szovjetunióban, ahol találmányi kérelmeket elemzett. Arra törekedett, hogy rendszerbe foglalja az innováció folyamatát, és felismerte, hogy a találmányok nem teljesen véletlenszerűek, hanem logikus szabályszerűségeken alapulnak. Az 1940-es és 1950-es években több ezer szabadalmat elemzett, és ezekből a mintákból hozta létre a TRIZ-t, amely segít feltalálóknak és mérnököknek új problémamegoldási módszereket kidolgozni.

Tovább olvasom »
Népszerű címkék
Legyen Ön is Leand Six Sigma folyamatfejlesztő!

Jelentkezzen lean six sigma green belt képzésünkre, amelynek alapja a Magyar Minőség Szakirodalmi Díj 2019 elismerésben részesült A lean six sigma folyamatfejlesztés kézikönyve. A képzés oktatója pedig a könyv szerzője Fehér Norbert 17 év lean six sigma tapasztalattal és 500+ mentorált, vezetett projekttel.