Klasszikus tesztelmélet

A Wikipédiából, a szabad enciklopédiából

A klasszikus tesztelmélet a kapcsolt pszichometrikus próbák alapja, amely előrejelzi a pszichológiai vizsgálatok eredményeit, mint például a különböző részek nehézségeit vagy a tesztírók képességeit. Általánosságban a klasszikus tesztelmélet célja, hogy javítson a pszichológiai tesztek megbízhatóságán.

A klasszikus tesztelméletet talán a valósérték-elmélet szinonimájaként is használhatnánk. A klasszikus kifejezés nem csak a modell kronológiai hátterére utal, de ellentétben áll a sokkal gyakoribb pszichometriai elméletekkel.

Valós és hibás értékek[szerkesztés | forrásszöveg szerkesztése]

A klasszikus tesztelmélet feltételezi, hogy minden személy helyes válasszal bír, ami akkor lenne érvényben, ha nem lennének hibák a számításban. Mivel a méréshez használt eszközök nem tökéletesek, a feltételezett eredmény a legtöbb esetben különbözik a valóstól, a személyek eltérő képességei miatt.

               X    =       T        +     E
      megfigyelt érték  valós érték      hiba

Populációs vonatkozás[szerkesztés | forrásszöveg szerkesztése]

Az alábbi számítások bemutatják a felvetéseket, amelyeket a klasszikus tesztelmélet állít az egyén szintjén. Habár az elméletet soha nem használják egyéni teszteredmények analizálására, az elmélet a populációra vonatkozó eredményekre fókuszál. Ezáltal a következő lépés, hogy bemutassunk egy populációs – mintavételi eljárást a klasszikus tesztelmélethez. ha feltételezzük, hogy a személyeket random módon választották ki a populációból, akkor a valós érték is random változó lesz, így egy általánosabb számítást kapunk.

X = T + E

A klasszikus tesztelmélet három változó (X, T és E) kapcsolatával foglalkozik populációs vonatkozásban. Ezen kapcsolat a teszteredmények megbízhatóságáról számol be. A legfontosabb a megbízhatóság fogalma. A megfigyelt érték (X) megbízhatóságát -melyet {\rho^2_{XT}}-vel jelölünk- a valós érték varianciájának \sigma ^2_T, illetve a megfigyelt érték varianciájának \sigma ^2_X hányadosaként definiáljuk:

\rho ^2_{XT}=\frac{\sigma ^2_T}{\sigma ^2_X}

Mivel a megfigyelt érték varianciáját felírhatjuk a valós érték és a hibás érték összegeként, ezért ez ekvivalens a:

{\rho^2_{XT}} = \frac{{\sigma^2_T}}{{\sigma^2_X}} = \frac{{\sigma^2_T}}{{\sigma^2_T}+{\sigma^2_E}}

A teszteredmények megbízhatóbbá válnak, ha a hibás érték csökken, ez fordított esetben is igaz.

Megbízhatóság[szerkesztés | forrásszöveg szerkesztése]

Figyelembe kell vennünk, hogy a megbízhatóság nem állandó paramétere a teszteknek, míg a teszteredmények, melyek az egész populációra vonatkoznak állandóak. Ez amiatt van, hogy a teszteredmények nem egyformán megbízhatóak minden populációban vagy minden egyednél. Például bármely korrelációnál a teszteredmények megbízhatósága csökken a vizsgált tartomány korlátozásával. Például az IQ-teszt eredményeinek megbízhatósága sokkal nagyobb, ha az egész populációt nézzük és kevésbé megbízható, ha csak a főiskolás diákok eredményeit vagy csak a másodévesekét nézzük. Figyelembe kell vennünk, hogy a teszteredmények tökéletesen megbízhatatlanok az egyénre (i) vonatkoztatva, ahogyan azt már előbb említettük, a valós érték változatlan az egyén szintjén, mely arra is utal, hogy a variancia nulla. Tehát a valódi érték varianciájának és a megfigyel érték varianciájának aránya, ennél fogva a megbízhatóság is nulla. A klasszikus tesztelmélet csak a populációs minták szintjén releváns, az egyén szintjén nem.

Az egyik módja a megbízhatóság mérésének, hogy elvégzünk egy úgynevezett párhuzamos tesztet. A párhuzamos teszt alapvető tulajdonsága, hogy megengedi, ugyanaz legyen a valós érték és a megfigyelt érték, mint az eredeti tesztben. Ha a párhuzamos teszt X és X’, akkor:

{\varepsilon}(X_i)={\varepsilon}(X'_i)

és

{\sigma}^2_{E_i}={\sigma}^2_{E'_i}

Ezen feltételek mellett a párhuzamos tesztek közti korreláció egyenlő a megbízhatósággal (lsd. Lord & Novick, 1968, Ch. 2):


{\rho}_{XX'}=
\frac{{\sigma}_{XX'}}{{\sigma}_X{\sigma}_{X'}}=
\frac{ {\sigma}_T^2 }{ {\sigma}_X^2 }=
{\rho}_{XT}^2

A párhuzamos tesztek használata a megbízhatóság mérésére elég nehézkes, mivel a párhuzamos tesztekhez nehéz hozzáférni. Ezt az eljárást gyakorlatban ritkán használják. Ehelyett a kutatók a belső konzisztencia mérését használják, az úgynevezett Cronbach-alfát. A teljes tesztpontszámot az egyéni pontszámok összege alkotja:

X_{i}=\sum_{j=1}^{k}{U_{ij}}

A Cronbach-alfa egyenlő:

 \alpha =\frac{k}{k-1}\left(1-\frac{\sum_{j=1}^{k}{\sigma^{2}_{U_{i}}}}{\sigma^2_{X}}\right)

A teszteredmények megbízhatósága mindig magasabb, mint a Cronbach-alfa értéke ugyanabban a populációban. Így ez az eljárás empirikusan kézenfekvőbb, emellett a kutatók is jobban kedvelik.

Ahogyan már az előbb említettük, a klasszikus tesztelmélet kész, hogy megfelelő definíciót állítson a megbízhatóság fogalmának. Feltételezzük, hogy a megbízhatóság információt ad a teszteredmények általános minőségéről. Az általános elképzelés, hogy a magasabb megbízhatósági érték jobb. A klasszikus tesztelmélet nem határozza meg, hogy mekkorának kell lennie a megbízhatóságnak. Ha az alfának túl magas az értéke, tehát kilenc felett van, felesleges elemeket mutat. A kutatáshoz nyolcas érték ajánlott. Ezek az értékek egyezményen alapulnak.

Források[szerkesztés | forrásszöveg szerkesztése]

  • Allen, M.J., & Yen, W. M. (2002). Introduction to Measurement Theory. Long Grove, IL: Waveland Press.
  • Novick, M.R. (1966) The axioms and principal results of classical test theory Journal of Mathematical Psychology Volume 3, Issue 1, February 1966, Pages 1-18