F-teszt

A Wikipédiából, a szabad enciklopédiából

A statisztikában az F-próba a szórásnégyzetek egyenlőségét vizsgáló eljárás, melynél a nullhipotézis, hogy két normális eloszlású mintának azonos a varianciája. Két csoport teljesítménye azonos átlag esetén is lehet különböző a szórás miatt. Az F-próba arra adja meg a választ, hogy szignifikáns-e ez az eltérés. Alapvetően F-teszt alatt bármelyik statisztikai eljárást érthetjük, amely két, vagy több minta szórását hasonlítja össze (Levene-teszt, Brown–Forsythe-teszt), ebben a cikkben F-teszt alatt azt az eljárást értjük, ahol a tesztstatisztika két minta szórásának arányán alapszik. Ez egy rendkívül egyszerű példája a matematikai statisztikának, amelyből az F-eloszlás is levezethető. A gyakorlati statisztikában a használatával kapcsolatban vannak akadályok; a próba túlságosan érzékeny a normalitás meglétére ahhoz, hogy rutin tesztként alkalmazhassuk a szórásnégyzet különbségének megállapításához. Tehát a minták elemzésénél minden esetben, ahol minimálisan sérül a normalitás, nem javasolt a teszt használata, mivel túlságosan sérül a statisztikai ereje.

A teszt[szerkesztés]

Legyen X1, ..., Xn és Y1, ..., Ym független minta két populációból, normális eloszlással. A két populáció várható értékei lehetnek különbözőek, a hipotézis pedig, hogy a varianciájuk egyenlő. Legyen

a minta átlaga. Legyen

a minta varianciája. Ekkor a teszt statisztikának

F-eloszlása van n-1 és m-1 szabadságfokkal, ha a nullhipotézise a szórásnégyzet egyenlőségének igaz. Máskülönben nem centrális F-eloszlása lesz.

Tulajdonságok[szerkesztés]

Az F-teszt rendkívül érzékeny a nem normális eloszlásra, így a Levene-teszt, a Bartlett-teszt vagy a Brown–Forsythe-teszt alkalmasabb a szórásnégyzet egyenlőségének tesztelésére (azonban ezeknél a teszteknél nagyobb esély van első fajú hibára). Az F-tesztet más hipotézisvizsgálatok során is szokták alkalmazni, például átlagok különbségének vizsgálatánál három, vagy több csoportban, vagy faktoriális elrendeződésben. Ezek az F-tesztek általában nem robosztusak, ha sérül a normalitás feltétele, különösen egyenlőtlen elrendezés és magas konfidenciaintervallum (alacsony alpha-szint) esetén. Magas alpha-érték (0.05 felett) és kiegyenlített elrendezés esetén a teszt relatíve robosztus, azonban, a normális eloszlás kis változása esetén is veszít statisztikai erejéből nem parametrikus változataihoz képest.

További információk[szerkesztés]