Kovarianciaanalízis

A Wikipédiából, a szabad enciklopédiából

A kovarianciaanalízis (KOVA, angolul analysis of covariance, ANCOVA) egy általánosított lineáris modell, mely felfogható a varianciaanalízis (VA, angolul analysis of variance, ANOVA) és a regresszió ötvözeteként is.

A megközelítése nagyon hasonlít a parciális korrelációéra, ahol azt vizsgáljuk, hogy két kvantitatív változó kapcsolatából mennyire lehet kiszűrni egy harmadik kvantitatív változó lineáris hatását. KOVA esetén a kérdésünk az, hogy a VA főhatásainak és interakcióinak tesztelésekor hogyan tudjuk kiszűrni egy vagy több kovariáns változó lineáris hatását. A KOVA alkalmazása során tehát megvizsgáljuk, hogy a függő változó átlagai megegyeznek-e egy vagy több csoportosító független változó (ún. szempontváltozó) egyes szintjein (vagyis a szempont szintjein), illetve egy vagy több kvantitatív változó (ún. kovariáns változó) mentén.

Egy jó példa erre, ha egy kísérletet végzünk, ahol a vizsgálati személyek három eltérő pszichológiai intervencióban részesülnek (szempontváltozó) és arra vagyunk kíváncsiak, hogy hogyan hatnak az intervenciók a vizsgálati személy jóllétére (függő változó). A kutatás során felmértük a résztvevők megküzdési módjait is. A kutatás elméleti hátteréből fakadóan tudjuk, hogy a megküzdési mód is hatással lehet függő változónkra, ezért szeretnénk ennek a hatását kiszűrni, hogy tisztán a szempontváltozónk hatását vizsgálhassunk.

Matematikai értelemben a KOVA a függő változó teljes varianciáját lebontja a kovariáns változó és a szempontváltozó által megmagyarázott varianciára, illetve reziduális varianciára.

A KOVA során több szempontváltozónk is lehet. Ennek megfelelően beszélhetünk egyszempontos KOVA-ról vagy akár többszempontos KOVA-ról is.

Kétszempontos KOVA modellegyenlete a szempontváltozók egy adott szintkombinációjához a következőképp írható fel:

μij = μ + αi + βj + γij + C1μ1 + … + Ckμk

Ebben az esetben két szempontváltozónk A és B, szintjeik α1, α2 stb., β1, β2 stb, a kettő közötti interakciót kifejező tag pedig a γij. A kovariáns változók elméleti átlaga μ1, μ2 … μk. A C1 … Ck a kovariáns változók függő változóra vonatkozó regressziós becslésének együtthatója. Az egyenlettel azt fejezzük ki, hogy a függő változó átlagai ezeken a szinteken a kovariánsok hatásainak kiszűrését követően mennyire térnek el az összátlagtól.[1]

A KOVA felhasználásának céljai[szerkesztés]

Statisztikai erő növelésére[szerkesztés]

A KOVA felhasználható a statisztikai erő növelésére azáltal, hogy csökkenti az almintákon belüli hibavarianciát. Ennek megértéséhez szükséges az F-próba megértése, mellyel az alminták közötti eltérést értékeljük. Az F-próba kiszámolásához elosztjuk a csoportok közötti varianciát (amit a csoportosító változó magyaráz) a csoportokon belüli varianciával (hibavariancia). Ennek megfelelően:

F = MShatás/MShiba

Amennyiben a kapott érték nagyobb egy kritikus értéknél, úgy megállapíthatjuk, hogy a csoportok között szignifikáns eltérés figyelhető meg. A hibavariancia magába foglalhat egyéni különbségeket és más tényezők hatásait is. A képletben a kovariánsok hatásait eredetileg a nevező tartalmazza. Amikor kontrolláljuk a kovariánsok hatását a függő változóra, tulajdonképpen eltávolítjuk azt a nevezőből, megnövelve az F értékét. Ennek következtében nő a statisztikai erőnk, tehát annak az esélye, hogy kimutatunk-e egy szignifikáns hatást, ha az valóban fennáll.[2]

Mintaátlagok különbségeinek kiküszöbölésére[szerkesztés]

Ennek a felhasználásnak a lényege, hogy a kovariáns és a függő változó közti regressziós kapcsolatok alapján úgy módosítjuk a mintaátlagokat (ezek lesznek a korrigált mintaátlagok), hogy becslést kapjuk arra vonatkozólag, hogy milyenek lennének a mintaátlagok, ha nem lenne eltérés a csoportok között a kovariánsok nagyságszintjében. Miután ezt a korrekciót elvégeztük, a korrigált mintaátlagok összehasonlításával megvizsgálhatjuk a szempontváltozók hatását.[1]

E felhasználási mód olykor ellentmondásos lehet, mivel a kovariánsok használatával sem lehet a minták egyenlőtlenségét teljesen kiküszöbölni. Emellett előfordulhat az is, hogy – a kovariáns és a szempontváltozó közötti kapcsolatból fakadóan – a kovariáns függő változóra kifejtett hatásának eltávolításával a függő változó is jelentős varianciát veszít el, ami az eredmények értelmezhetőségét csökkenti.[3]

A KOVA futtatásának előfeltételei[szerkesztés]

A KOVA használatának a VA-hoz hasonlóan alapvető feltétele a függő változó normális eloszlása és az alminták elméleti szórásának homogenitása (szóráshomogenitás). A KOVA ezeken felül kiegészül azzal a feltétellel is, hogy az egyes almintákban a kapcsolat a kovariáns és a függő változó között hasonló szorosságú kell legyen.[1]

KOVA alkalmazása[szerkesztés]

Multikollinearitás feltételének tesztelése[szerkesztés]

Bár nem előfeltétel, de csökkentheti a modellünk összetettségét, ha a kovariánsok multikollinearitását ellenőrizzük. Abban az esetben, ha egy kovariáns erős kapcsolatot mutat egy másik kovariánssal (0,5 vagy annál nagyobb korreláció esetén), a függő változóra kifejtett hatás nem fog jelentősen eltérni a két kovariáns között. Ebben az esetben érdemes a két kovariáns közül az egyiket eltávolítani a modellből a statisztikai redundancia csökkentésének érdekében.

Szóráshomogenitás ellenőrzése[szerkesztés]

Az alminták elméleti szórásának homogenitására pl. Levene-próbát futtathatunk.

Regressziós egyenesesek egyenlő meredekségének ellenőrzése[szerkesztés]

Ellenőriznünk kell, hogy van-e interakciós hatás a kovariáns és a szempontváltozó között. Amennyiben az interakciós tag a két változó közt szignifikáns, úgy a KOVA modell lefuttatása helytelen lenne. Ehelyett Green és Salkind[4] javaslata szerint érdemes a függő változó almintákban rejlő eltéréseit a szempontváltozó egyes szintjein megállapítani. Egyéb alternatíva lehet regressziós analízis lefuttatása moderátor változóval, ahol a kovariánst és az interakciós tagot független változóként léptetjük be a modellbe. Emellett érdemes lehet mediációs analízist használni annak megállapítására, hogy a kovariáns mennyiben magyarázza a szempontváltozó függő változóra kifejtett hatását.

KOVA lefuttatása[szerkesztés]

Amennyiben a szempontváltozó és kovariáns közötti interakció nem mutatott szignifikáns hatást, lefuttatjuk újból a KOVA modellt az interakciós tag nélkül. Ebben a próbában a korrigált mintaátlagokat és a korrigált hibát használjuk fel a szempontváltozó főhatásának vizsgálatára. A korrigált mintaátlagot a kovariáns függő változóra kifejtett hatásának korrigálásával kapjuk meg.

Utótesztelés[szerkesztés]

Szignifikáns főhatás esetén a szempontváltozó mentén alkotott alminták között olyan szignifikáns eltérés figyelhető meg, ami nem magyarázható más hatásokkal. A VA-ban is használt utótesztek használata szükséges ahhoz, hogy megtaláljuk mely szempontszintek között vannak eltérések. [5]

Statisztikai erővel kapcsolatos megfontolások[szerkesztés]

A KOVA modellbe bevont kovariáns alapvetően növeli a statisztikai erőt, ami a módszer alkalmazásának talán leggyakoribb célja. Azáltal, hogy a függő változó varianciájának egy részét a kovariánssal megmagyarázzuk, a szempontváltozók által megmagyarázott varianciát növeljük. Másrészről viszont a kovariáns bevonása csökkenti a hibatag szabadságfokát eggyel, a kovariánssal összefüggő hibavariancia elvesztése miatt. Ebből kifolyólag ha olyan kovariánst vonunk be a KOVA modellbe, ami a függő változó varianciának csak kis részét magyarázza meg, a statisztikai erőt akár csökkenthetjük is, ami főleg kisebb méretű mintáknál fordulhat elő.[6][7]

Jegyzetek[szerkesztés]

  1. a b c Vargha, András. Többváltozós statisztika dióhéjban: Változó-orientált módszerek. Budapest: Pólya Kiadó (2019). ISBN 978-615-81228-1-8 
  2. Barbara G. Tabachnick – Linda S. Fidell: Using multivariate statistics. 5. ed., Pearson internat. ed., [Nachdr.]. 20. ISBN 978-0-205-45938-4 Hozzáférés: 2023. december 7.  
  3. Miller, Gregory A. (2001. február 1.). „Misunderstanding analysis of covariance.” (angol nyelven). Journal of Abnormal Psychology 110 (1), 40–48. o. DOI:10.1037/0021-843X.110.1.40. ISSN 1939-1846.  
  4. Samuel B. Green – Neil J. Salkind: Using SPSS for Windows and Macintosh: analyzing and understanding data. 6. ed. 2011. ISBN 978-0-205-02040-9 Hozzáférés: 2023. december 7.  
  5. Howell, David C.. Statistical methods for psychology, 7, Belmont, CA: Thomson Wadsworth (2010). ISBN 978-0-495-59784-1 
  6. Tvedt, Valerie Maria (2000). „Some factors that effect (sic) statistical power in ANCOVA: a population study”. Theses Digitization Project.  
  7. Philippas, D. (2014). Analysis of Covariance (ANCOVA). In A. C, Michalos (Ed.). Encyclopedia of Quality of Life and Well-Being Research (pp.157-161). Dordrecht, NL: Springer Netherlands.

Fordítás[szerkesztés]

  • Ez a szócikk részben vagy egészben az Analysis of covariance című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.