Mann–Whitney-próba

A Wikipédiából, a szabad enciklopédiából
Ugrás a navigációhoz Ugrás a kereséshez

A statisztikában a Mann–Whitney-próba (más néven: Mann–Whitney–Wilcoxon- vagy Wilcoxon-féle rangösszegteszt) a kétmintás t-próba nem parametrikus megfelelője, amelyet nem normál eloszlás, valamint ordinális változók esetén használunk. Tehát ezzel a teszttel is azt a nullhipotézist vizsgáljuk, miszerint a két minta ugyanabból a populációból származik.

Történeti áttekintés[szerkesztés]

A Mann–Whitney-teszt statisztikai háttere először 1914-ben jelent meg egy cikkben, amely a német Gustav Deuchler nevéhez köthető. Frank Wilcoxon 1945-ben már említést tett a kétmintás próbáról egyenlő elemszámok mellett, valamint már publikált egy szignifikanciatesztet a nullhipotézis alátámasztására egy alternatív hipotézissel szemben.

A statisztikai módszer alapos analízise, amelyben kidolgozták a rangsorolás eljárását: a két mintát együtt rangsoroljuk (azaz, csoporttól függetlenül határozzuk meg a rangszámokat), majd összeadjuk külön az egyik és külön a másik csoport rangszámait, 1947-ben jelent meg Henry Mann és tanítványa, Donald Ransom Whitney cikkében.

A cikk tartalmazta az egyenlő számok (döntetlen) lehetőségét tetszőleges nagyságú elemszám esetén is, valamint azokat a táblázatokat, amelyben a nyolc vagy annál kisebb elemszámú elemzésekhez tartozó kritikus értékek találhatóak.

A teszt használatának feltételei[szerkesztés]

A Mann–Whitney-tesztet a t-teszt használati feltételeinek sérülése esetén használjuk, például, ha az adatok nem normál eloszlásúak vagy a két minta varianciája szignifikánsan

A teszt használatának feltételei:

  • Az összes minta független egymástól.
  • Az adatok legalább ordinálisak.

Nullhipotézis: a két minta azonos eloszlásból származik.

Számítási módok[szerkesztés]

A próba végrehajtása[szerkesztés]

A két mintát együtt rangsoroljuk (azaz, csoporttól függetlenül határozzuk meg a rangszámokat 1-gyel kezdve). Majd összeadjuk külön az egyik és külön a másik csoport rangszámait, az egyenlő értékek esetében 0,5-ös értékeket használva (pl.: a 3, 5, 5, 9 számsor alapján a rangszámok 1, 2,5, 2,5, 4 lesz). Ha igaz a nullhipotézis, hogy a minták ugyanabból az eloszlásból származnak, akkor ennek a két rangszám összegnek közel egyenlőnek kell lennie. Minél jobban eltér az egyik összeg a másiktól, annál több okunk van feltételezni, hogy a két minta különböző eloszlású populációból származik. A próba értéke általában a kisebb elemszámú csoport rangösszege (de lehet a nagyobb elemszámú csoporté is).

Kitekintés: Az egyik csoport rangszámai nagy valószínűséggel magasabb értéket mutatnak, mint a másik csoporté, ezt azonban akkor tudjuk pontosan meghatározni, ha ismerjük a csoportok nagyságait. Például: a 2-es nem nagy rang érték egy 5 elemből álló csoportba, de egy 50 elemből álló mintába lehet. Vegyünk például egy versenyt, ahol ha 5 versenyzőből másodikként érsz be nem annyira nagy eredmény mintha 50-ből lennél második.

A Mann–Whitney-próbához tartozó táblázatból a csoport elemszámainak segítségével tudjuk meghatározni azt az intervallumot, amelybe ha a vizsgált rangösszeg beleesik, akkor nem szignifikáns a különbség, ha kívül esik, akkor elvetjük a nullhipotézist.

Normál eloszláshoz való közelítés[szerkesztés]

A táblázat azonban csak kis elemszámok esetén használható. Nagy elemszám esetén normál eloszláshoz való közelítést kell alkalmazni. A normál eloszláshoz való közelítés egyenletének használatához az alábbi adatokra lesz szükség:

  • nagyobb elemszámú csoport elemeinek száma = nn
  • kisebb elemszámú csoport elemeinek száma = nk
  • kisebb elemszámú csoport rangösszege = Rk

A képlet általánosságban:

Majd az előbb felsorolt adatokra nézve:

A z érték kiszámítása után standard normál eloszlás és 0,05-ös szignifikanciaszint mellett a kritikus érték 1,96, ha ennél a │z│ nagyobb, akkor a két minta közti különbség szignifikáns 5%-os szinten.

Mann–Whitney U statisztika[szerkesztés]

A Mann–Whitney U statisztikának az alapja a két csoport elemeinek a párba állítása. Tehát, az egyik csoport minden elemét (Ai) párba állítjuk a másik csoport minden elemével (Bi). Az így keletkezett párok száma n1n2. Ezek után megvizsgáljuk, hogy hány olyan párosítás van, ahol az első szám nagyobb, mint a másik (Ai>Bi). Ezeknek a pároknak a száma tulajdonképpen a Mann–Whitney U statisztika. Ha a két csoport nem különbözik, akkor körülbelül ugyanannyi olyan pár lesz, ahol Ai<Bi, mint amennyiben Ai>Bi. Ha az egyik típusú pár aránya nagyban eltér a másiktól, valószínűleg különbség van a két populációban a számok eloszlásában.

A számolást a próba végrehajtása alfejezet alapján kezdjük. Ezek után az U érték kiszámítható:

ahol az n1 az első minta elemszáma és R1 pedig az első minta rangösszege.

Ugyanezzel a képlettel számolhatjuk ki a második mintára vonatkozó U értéket:

A fentiek alapján a meglévő adatok segítségével több összefüggést is ki tudunk még számítani: pl. az összes rang összegét az alábbi képlettel számolhatjuk ki:

Mivel azt már tudjuk, hogy R1 + R2= N(N+1)/2 és N=n1+n2 , így egyszerűsítéseket végezve a képleten ezt kapjuk:

A kisebb elemszámú csoport U értékének meghatározása után, a Mann–Whitney-próbához tartozó U-érték-táblázat segítségével az elemszámoknak megfelelő cellában találjuk azt az intervallumot, amelyen ha az adott U érték kívül esik, 0,05-os szinten a különbség szignifikáns.

Ezek alapján a normál eloszláshoz való közelítés képlete megfogalmazható más módon is:

ahol mu és ϭu az U értékhez (lásd később) tartozó átlag és szórás értéke:

A legtöbb modern statisztikai programcsomag már tartalmaz U-tesztet, azonban kis elemszám esetén kézzel is könnyen kiszámítható.

Számítási módok egy példán levezetve[szerkesztés]

A próba végrehajtása[szerkesztés]

Vegyünk egy egyszerű példát. Tegyük fel, hogy azt szeretnénk megnézni, hogy azok a gyermekek, akik jártak bölcsődébe, jobban teljesítenek-e iskolában a matekfelmérőn, mint azok a gyerekek, akik nem jártak bölcsődébe.

A nullhipotézis: nincs különbség a két csoport között, tehát a bölcsődébe járó gyerekek később nem fognak szignifikánsan jobban teljesíteni a matekfelmérőn, mint a bölcsődébe nem járók.

Szignifikancia szint: 0,05

A kérdésfeltevés: kétoldali, mivel nem tudjuk, hogy melyikről feltételezzük, hogy „jobb” a másiknál.

A csoport Jártak bölcsődébe (elért pontok) Rangszámok B csoport Nem jártak bölcsődébe (elért pontok) Rangszámok
90 12 66 4
71 6 78 8
83 11 50 1
82 10 68 5
75 7 80 9
91 13 60 2
65 3

Mivel általában a kisebb elemszámú csoport rangösszegét használjuk, így RB értékét figyeljük. A Mann–Whitney-táblázatban a két elemszám segítségével kideríthető, hogy a kritikus intervallum a 34–64 közötti rész. Tehát azt látjuk, hogy RB értéke kívül esik a kritikus intervallumon, tehát szignifikánsan különbözik a két csoport 0,05-ös szignifikancia szint mellett.

Mann–Whitney U-statisztika[szerkesztés]

Az előbbi példát nézve:

A fentiek alapján az összes rang összegét az alábbi képlettel számolhatjuk ki:

A kisebb UB értéket figyelembe véve a Mann–Whitney-táblázatban a két elemszám segítségével láthatjuk, hogy a kritikus intervallum a 34-64 közötti rész. Tehát azt látjuk, hogy U értéke kívül esik a kritikus intervallumon, tehát szignifikánsan különbözik a két csoport 0,05-ös szignifikancia szint mellett.

Normál eloszláshoz való közelítés[szerkesztés]

Tegyük fel, hogy a nagy érdeklődésre való tekintettel a vizsgálatokat országos szinten megismételték. A résztvevők száma azonban így már meghaladta a 60-at is.

Ebben az esetben a statisztikai csapat ezekkel az adatokkal dolgozott:

A Mann–Whitney-érték táblázatban nincs 64 elem, így normál eloszláshoz való közelítést alkalmazunk.

Standard normál eloszlás esetén 0,05-ös szignifikanciaszint mellett a kritikus érték 1,96. Ebben az esetben a z abszolút értéke kisebb, mint 1,96, tehát nincs szignifikáns különbség a két csoport között.

A Mann–Whitney-próba t-teszttel való összehasonlítsa[szerkesztés]

Ordinális adatok[szerkesztés]

Ordinális adatok esetén a Mann–Whitney-tesztet kell választani.

Robosztusság[szerkesztés]

A Mann–Whitney-teszt sokkal robosztusabb, mivel a t-teszthez képest a Mann–Whitney-próba kevésbé hajlamos hamis szignifikáns eredményt mutatni az outlierek miatt. Ez azért lehetséges, mivel ha a mintánk tartalmaz egy olyan adatpontot, ami messze van az átlagtól (két szórásnyira), akkor az ronthatja a t-próba eredményeit. Azonban, ha az adatokat ordinálissá teszem, sorba állítom őket, nem lesz egy igazán félreeső adatom se, mindenki egyenlő távolságra lesz a másiktól (kivéve az egyenlő értékeket).

Hatékonyság[szerkesztés]

Abban az esetben, ha az eloszlások nagy mértékben eltérnek a normáltól, és elég nagy a minta, az U-teszt sokkal hatékonyabb, mint a t-teszt.

Alternatív megoldások[szerkesztés]

Abban az esetben, ha a két minta eloszlása nagyon különböző, az U-teszt hamisan adhat szignifikáns eredményt, ezért ekkor a kétmintás t-próba nem egyenlő variánciákra vonatkozó tesztjét alkalmazhatjuk.

Több kutató az U-teszt alternatív megoldásaként ajánlja, hogy transzformáljuk az adatokat rangszámokká (ha eddig nem ezekkel dolgoztunk volna), és a rangszámokon futassunk le egy t-tesztet. Az, hogy melyik típusú t-tesztet használjuk, függ attól, hogy az adatok varianciája egyenlő vagy sem.

Publikálás[szerkesztés]

A Mann–Whitney-teszt esetében az alábbi eredményeket szükséges publikálni:

  • a minták valamely középértéke (átlag, medián – mióta a Mann–Whitney ordinális teszt, azóta a medián ajánlott)
  • U értéke
  • a minták nagysága
  • a szignifikancia szint

A tudományos világban ezeknek az adatoknak a publikálása kielégítőnek számít.

Egy tipikus publikáció így nézne ki: „… nem parametrikus vizsgálatot Mann–Whitney-teszttel végeztem. Az eredmények az alábbiak lettek: Wisconsin Kártyaszortírozó Teszt U=682,5 z=-.411 p=.681…”

Abban az esetben, amennyiben a cikk célja egy statisztikai próba vizsgálata, vagy valamilyen statisztikai téma a fő irányvonal, abban az esetben a publikáció sokkal részletesebb és pontosabb.

Kivitelezés[szerkesztés]

Sok programcsomag tartalmazza ma már a Mann–Whitney-tesztet, amelynek segítségével gyorsan elvégezhetjük a szükséges tesztet.

  • MATLAB
  • COIN
  • SAS
  • Python (programozási nyelv)
  • SigmaStat (SPSS Inc., Chicago, IL)
  • SYSTAT (SPSS Inc., Chicago, IL)
  • JMP (SAS Institute Inc., Cary, NC)
  • S-Plus (MathSoft, Inc., Seattle, WA)
  • STATISTICA (StatSoft, Inc., Tulsa, OK)
  • UNISTAT (Unistat Ltd, London)
  • SPSS (SPSS Inc, Chicago)
  • Arcus Quickstat (Research Solutions, Cambridge, UK)
  • Stata (Stata Corporation, College Station, TX)
  • StatXact (Cytel Software Corporation, Cambridge, MA)
  • PSPP
  • Ropstat

Hivatkozások[szerkesztés]