Khí-négyzet-próba
A Pearson-féle khí-négyzet- (χ²-) próba diszkrét eloszlású vagy ilyenné tehető változók vizsgálatára alkalmas statisztikai eljárás.
Milyen típusú változók esetén alkalmazható?
[szerkesztés]A nominális (vagy kategoriális) változókat tekintjük diszkrét változónak. Különböző kategoriális változók léteznek; alapvető elvárás, hogy egy entitás (személy, dolog stb.) egy kategóriába eshessen csupán (az ilyen típusú változók legáltalánosabb példája a nem). De kategoriális változót jelent az is, hogy valaki helyesen válaszolt egy feltett kérdésre, vagy sem, illetve hogy a lehetséges jelöltek közül végül kire szavazott. Fontos megjegyezni, hogy folytonos eloszlású változók is diszkrétté alakíthatóak, amennyiben véges számú kategóriát alakítunk ki belőlük (például életkor esetében életkori övezeteket, testsúly esetében súlykategóriákat stb.).
Mikor van szükség diszkrét változók kapcsolatának elemzésére?
[szerkesztés]Két diszkrét változó átlagának összehasonlítása értelmetlen, mivel a kategoriális változóknak nincs átlaga. A számszerű érték, amit egy változóhoz hozzárendelünk, nem fejez ki valódi értéket; döntés eredménye, hogy melyik kategóriánkat jelöljük 1-es számmal (személyek neme esetében egyezményesen 1 jelöli a férfiakat), illetve 2-essel (nem esetében a nőket). Ami diszkrét változók esetén elemzésbe vonható, hogy milyen gyakorisággal esnek elemek/változók az egyes kategóriákba (például egy adott sokaságon belül hány nő és hány férfi van). Kapcsolatelemzést pedig akkor érdemes végeznünk, ha kíváncsiak vagyunk, van-e összefüggés, hogy egy egyén két kategoriális változón belül milyen értéket vesz fel.
Például azt a kérdést szeretnénk megválaszolni, hogy fejlődési skálánk mennyire jelzi jól előre a gyerekek zavartalan vagy éppen tipikustól eltérő fejlődését. Annyi dolgunk van, hogy összeszámoljuk, hányan esnek a következő kategóriákba: az egyik a fejlődési skálánk által mutatott eredményre vonatkozik, ami jelen vizsgálat esetében két értéket vehet fel: zavartalan fejlődésű és atipikus. A másik a hosszú távú kimenet, ami szintén zavartalan és atipikus fejlődés lehet. A legegyszerűbb, ha táblázatos formában jelenítjük meg:
| Tipikus | Atipikus | Összesen | |
|---|---|---|---|
| Tipikus | 18 | 2 | 20 |
| Atipikus | 6 | 24 | 30 |
| Összesen | 24 | 26 | 50 |
1. táblázat: Táblázatos példa kategoriális változók gyakorisági eloszlására
Pearson-féle khí-négyzet- (χ²-) próba
[szerkesztés]Khí-négyzet-próbára van szükségünk ahhoz, hogy megállapíthassuk, két kategoriális változó között van-e kapcsolat (példánknál maradva a fejlődési skála becslése és a valós fejlődési kimenet között), vagyis hogy az egyes kategóriában várható gyakoriságok eltérnek-e a véletlen szintjétől. A próba elvégzéséhez szükségünk van a megfigyeléseink standardizálására. Ha az összes standardizált eltérést összeadjuk, megkapjuk a Pearson-féle khí-négyzetet. (Ez az egyenlet az alapja az ANOVA négyzetes eltérések összegét alapul vevő regressziós elemzésének is.)
A próba elvégezhetőségéhez a mintaeloszlásnak a khí-négyzet-eloszlást kell közelítenie. Minél nagyobb a mintánk, ez az előfeltétel annál egyszerűbben teljesül. Ha azonban kicsi a minta (nem közelít kellőképp a χ-eloszláshoz), kisebb a valószínűsége a szignifikanciaszint elérésének (vagyis a nullhipotézis hibás elfogadásának – II. fajú hiba). Emiatt a χ² alkalmazhatósági feltételének sokan a cellánként minimum 5-ös elemszám elérését tekintik. Ez az 5 egy tapasztalati szám (vannak, akik úgy gondolják, 3,5/cella is elegendő). Ez a szabály 2×2-es kontingenciatáblázatoknál alkalmazandó. Előfordulhat azonban nagyobb kontingenciatáblázat is, ahol egy kategórián belül nem csak két értéket vehetnek fel a változók. Gondoljunk például arra, hogy a gyerekek hosszú távú fejlődését nem tipikus/atipikus viszonylatban értelmezzük, hanem több lehetséges értéket adunk meg: (1) tipikus, (2) az első év folyamán fejlődési késést mutat, amit behoz, (3) az első három év folyamán mutat fejlődési késést, amit behoz, stb. Ilyen nagyobb gyakorisági táblázatok esetében a cellák maximum 20%-ában eltekinthetünk a szigorú elemszám szabály (min. 5 fő) alkalmazásától.
Mi a teendő kis elemszám esetén?
[szerkesztés]Kis elemszám esetén a tesztstatisztika nullhipotézis alatti mintaeloszlása általában nem χ²-eloszlású, így az erre az eloszlásra alapozott statisztikai döntés nem lesz korrekt.
Fisher-féle egzakt próba
[szerkesztés]Fisher kidolgozott egy olyan statisztikai eljárást, ami bármilyen, így különösen kis elemszám mellett alkalmazható. Ezen egzakt teszt lényege, hogy a tesztstatisztika nulleloszlását minden elemszám mellett kombinatorikus módszerekkel egzaktan állapítja meg, így az ezen a teszten alapuló statisztikai döntés minden elemszám mellett korrekt lesz. Ez a módszer azonban egyúttal rendkívül számolásigényes, és ha nem is mi magunk végezzük el, hanem valamilyen statisztikai szoftvert használunk (pl. SPSS), az eredmény megjelenésére feltehetően úgy is hosszú perceket fogunk várni (minél nagyobb elemszámú a mintánk, annál többet). Ugyanakkor nagy minta esetén teljesen felesleges is használnunk, mivel az egyszerűbben végrehajtható χ²-próba is azonos eredményre fog vezetni.
Valószínűségi hányados (likelihood ratio)
[szerkesztés]Fisher-egzakt próba mellett valószínűségi hányados számításával is kiküszöbölhetjük, ha kis elemszámú mintánk sérti a χ²-próba alkalmazási feltételét (ugyanakkor erre a módszerre is igaz, amit a Fisher-egzakt-próbáról már elmondtunk: nagy minták esetén alkalmazása értelmét veszti). A valószínűségi hányados számítása a valószínűség maximalizálásának elvén alapszik, vagyis hogy a mért adatok előfordulási valószínűségét maximalizáljuk és összehasonlítjuk a nullhipotézisnek megfelelő adatok előfordulási valószínűségével. A logaritmikus modellben az i és a j a kontingenciatáblázatunk sorait és oszlopait jelöli.
Yates-féle korrekció
[szerkesztés]Akkor érdemes alkalmaznunk, ha 2×2-es χ²-próbánkban a kis elemszám miatt nagyon kicsiny szignifikancia értékeket kaphatunk (vagyis az I. fajú hiba valószínűsége ilyen esetben megnő). A próba logikája azon a felvetésen nyugszik, hogy csökkentjük a χ²-statisztika értékét, ezáltal növeljük a szignifikanciaszintet (vagyis kevésbé lesz szignifikáns). Mindezt úgy tehetjük meg, hogy amikor kiszámítjuk megfigyelésünk modelltől való eltérését (megfigyelésij – modellij egyenlet), le kell vonni 0,5-et az abszolút értékből, mielőtt négyzetre emeljük. Magyarul mindegy, hogy pozitív vagy negatív irányú az eltérés a modellhez képest, 0,5-et levonunk, és csak utána emeljük négyzetre.
A χ²-próba elvégzésének feltételei
[szerkesztés]Előnye a parametrikus próbákhoz képest, hogy nem előfeltétele a mért változók normál eloszlása (a diszkrét változók nem lehetnek normál eloszlásúak, mivel nem folytonosak). Ettől függetlenül két fontos előfeltételnek teljesülnie kell alkalmazhatóságához:
- A változók függetlensége (vagyis a kontingenciatáblázaton belül minden egyed vagy entitás egy cellába tartozik), személyen belüli változások mérésére tehát nem alkalmas.
- Az elvárt gyakoriság a kontingenciatáblázat minden cellájában 5 felett van (kivételt a nagyobb kontingenciatáblázatok jelentenek, ahol a cellák több mint 20%-ában kell, hogy teljesüljön a feltétel; de nagy kontingenciatáblázatok esetén is elvárás, hogy minden cellába kerüljön legalább egy változó).
Bár nem előfeltétele a próba elvégzésének, mégis megemlítendő, hogy ha a cellákon belül a gyakoriságok közel azonosak, és ráadásul a mintánk elég nagy, a változók közti összefüggés könnyen eléri a szignifikanciaszintet (ismét fokozott az I. fajú hiba elkövetésének veszélye).
Hogy néz ki mindez egy jól ismert statisztikai programban?
[szerkesztés]A táblázatkezelő minden egyes sora az esetnek felel meg (eredeti példánk esetén minden sor egy kisgyermeket jelöl). Két változót rendelünk minden résztvevőnkhöz a két vizsgált kategória mentén (fejlődési skálánk eredménye, ill. valós kimenetel), mindegyikhez kreálunk egy számszerű változót is. Fejlődési skálánk szerint tipikus fejlődésű: 1, atipikus: 2. A valóságban tipikus fejlődésű: 1, atipikus: 2.
Más módon is rögzíthetjük az adatainkat, ugyanazokat a változókat alkalmazva: erre való a Weight Cases menüpont, ami a változók súlyozását jelenti. Ekkor be kell vezetnünk egy harmadik változót, mégpedig a gyakoriságot. Előnye főként nagy minták esetén érvényesül, mivel több száz sor helyett négyben foglalja össze az összes lehetséges típusú kimenetet. Statisztikai programunkon belül a Data menüben található a Weight Cases menüpont, ahol beállíthatjuk, hogy melyik (jelen esetben a Gyakoriságnak elnevezett) változónk fejezi ki, hogy milyen gyakorisággal esnek eseteink a megadott kategóriakombinációba. Ennek köszönhetően számítógépünk tudni fogja, hogy 1, 1 lehetőségből (vagyis fejlődési skálánkon OK és valóban tipikus fejlődésű gyerekből) 18 van, tehát mintha 18 ilyen sor lenne az adatfájlunkban (lásd 2. ábra).

Statisztikai programunk segítséget nyújt az egy kategóriába eső esetek gyakoriságának kiszámításában is (Crosstabs). A Crosstabs elérése jól ismert statisztikai programunkon belül: Analyze → Descriptive Statistics → Crosstabs. A párbeszédablakon belül a változóinkat (fejlődési skála eredménye és kimenetel) egyikét egyszerűen csak be kell a nyíl segítségével válogatni a sorok (Rows), a másikat pedig oszlopok (Columns) cellába. Hogy melyik változónkat melyik cellába (Rows/Columns) húzzuk be, csak azt befolyásolja, hogy az Output fájlban a táblázat sorai, illetve oszlopai melyik változónkat jelenítik meg (lásd például jelen fejezet 1. táblázatát).
A Crosstabs parancs továbbá önmagában is alkalmas χ²-próba számítására. Ha a Statistics gombra kattintunk, a megjelenő párbeszédablakban kiválaszthatjuk a χ²-próba elvégzését (az egérrel kattintunk a kis négyzetbe a Chi-square felirat mellett).
A χ²-próba lehetővé teszi két diszkrét változó függetlenségének vizsgálatát. Amennyiben szignifikáns értéket kapunk próbánkon, a phi- és Cramér-féle kontingencia-együttható kiszámításával a két változó közötti kapcsolat erősségére vonatkozó adatot is nyerhetünk (4. ábránkon látható, hogy a Crosstabs → Statistics párbeszédablakon a χ²-próba lefuttatásának kérése mellett ehhez a phi- és Cramér-féle V-próba lefuttatását is bejelöltük). A phi-érték kiszámítása a χ²-érték mintaelemszámmal való elosztásából származik, majd az így kapott eredményből gyököt vonunk. Ha a vizsgált két kategória közül az egyik kettőnél több értéket is felvehet (lásd korábbi példánkat, ahol a fejlődési skála lehetséges kimenetelét nem dichotóm módon fogalmaztuk meg, hanem több különböző értéket is definiáltunk: (1) tipikus, (2) az első év folyamán fejlődési késést mutat, amit behoz, (3) az első három év folyamán mutat fejlődési késést, amit behoz, stb.), akkor a Phi helyett érdemesebb Cramér-féle kontingencia-együtthatót számolni. Ilyen esetben a Phi sokszor hibásan 0 értéket vesz fel (vagyis az jelzi, mintha nem lenne kapcsolat a változók között). A Goodman és Kruskal-féle lambda (λ) a phi-mutatóhoz hasonlóan 0–1 között adja meg a két kategoriális változó közötti kapcsolat erősségét, ahol értelemszerűen 0 azt jelenti, hogy a két változó független egymástól, az 1 pedig, hogy az egyik változó tökéletesen prediktálja a másikat (a lambda-együttható számításának kérése programunkon belül ugyanabban a párbeszédablakban adható meg, ahol a khí-négyzet-próba számítását kérjük: Analyze → Descriptive Statistics → Crosstabs → Statistics).
Hatásnagyság számítása
[szerkesztés]Habár a Cramér-féle együtthatót is elfogadhatnánk a hatásnagyság adekvát mutatójának, a köztudatba mégis inkább az esélyhányados (odds ratio) került be. Különösen jól alkalmazható 2×2-es kontingenciatáblázatoknál (nagyobbaknál nem ajánlatos). További előnye: a könnyű kiszámíthatóság. Ennek lényege, hogy elosztjuk egymással az összetartozó adatokat, majd ezek hányadosait szintén. A példánknál maradva először kiszámítjuk a fejlődési skálánk becslésére vonatkozó adatokat Odds(pozitív jóslat – pozitív kimenet) = (Fejlődési skálán OK – tipikusan fejlődők) / (Fejlődési skálán OK – de nem tipikusan fejlődők) = 18/2 = 9
Odds(negatív jóslat – negatív kimenet) = (Fejlődési skálán nem OK – atipikusan fejlődők) / (Fejlődési skálán nem OK – de tipikusan fejlődők) = 24/6 = 4
Odds ratio(esélyhányados) = 9/4 = 2,25
Annak az esélye tehát, hogy valaki a jóslatnak megfelelően fejlődik majd, 2,25-ször nagyobb, mint az ellenkező lehetőségnek. Ahogy a példa is mutatja, az esélyhányados használata nagyon egyszerű és egyben rendkívül elegáns módja a kapott eredmények interpretálásának.
Hogyan jelenítsük meg publikációnkban a khí-négyzet-próba eredményét?
[szerkesztés]Először is meg kell adnunk a teszt statisztikaértékét, majd utána feltüntetjük zárójelben a szabadságfokot, végül a szignifikanciaszintet, pl. χ²(1) = 25.36, p < .001. Ez esetben eredményünket úgy értelmezhetjük, hogy a fejlődési skálánk által jósolt és a valós fejlődési kimenet jelentős összefüggést mutatott.
Források
[szerkesztés]- Cramer, D. & Howitt, D. (2004). The Sage Dictonary of Statistics. SAGE Publications.
- Field, A. (2007). Discovering Statistics Using SPSS. Chapter 18 Categorical Data. SAGE Publications.
- Vargha András (2000). Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó.