Welch-próba

A Wikipédiából, a szabad enciklopédiából

A Welch-próba vagy más néven d-próba a statisztikai hipotézisvizsgálatok közül a paraméteres próbák közé tartozik. A próba azt vizsgálja, hogy két külön mintában egy-egy valószínűségi változó átlagai egymástól szignifikánsan különböznek-e.

A próba alkalmazásának feltételei[szerkesztés | forrásszöveg szerkesztése]

a vizsgált valószínűségi változók

A próba nullhipotézise[szerkesztés | forrásszöveg szerkesztése]

Nullhipotézis: a két mintában a két átlag statisztikai szempontból megegyezik.

Alternatív hipotézis: a két mintában a két átlag statisztikai szempontból nem egyezik meg.

A "statisztikai szempontból" kifejezés itt arra utal, hogy az eltérés a két átlag között olyan minimális, hogy pusztán csak a véletlen ingadozásnak tulajdonítható (ekkor a két átlag statisztikai szempontból azonosnak tekinthető), vagy jelentősen nagyobb, mint ami a véletlennel magyarázható (ekkor a két átlag statisztikai szempontból nem tekinthető azonosnak).

Valójában a fenti két hipotézis precíz matematikai megfogalmazása a következő.

  • H0: Az X és Y valószínűségi változók várható értékei megegyeznek, (E(X) = E(Y)).
  • H1: Az X és Y valószínűségi változók várható értékei nem egyeznek meg, (E(X) ≠ E(Y)).

A próbastatisztika[szerkesztés | forrásszöveg szerkesztése]

A Welch-próba próbastatisztikája


t = 
\frac
{\overline x- \overline y}
{\sqrt
{
\frac{s_x^2}{n}
+
\frac{s_y^2}{m}
}
}

ahol

  • \overline x az egyik valószínűségi változó átlaga a mintájában,
  • \overline y a másik valószínűségi változó átlaga a mintájában,
  • sx az egyik valószínűségi változó becsült szórása,
  • sy a másik valószínűségi változó becsült szórása,
  • n az egyik minta elemszáma,
  • m a másik minta elemszáma.

A próba végrehajtásának lépései[szerkesztés | forrásszöveg szerkesztése]

  1. Az t próbastatisztika értékének kiszámítása.
  2. A p szignifikancia szint megválasztása. (Ez a legtöbb vizsgálat esetén 0,05 vagy 0,01.)
  3. A p szignifikancia szinttől függő tp érték kiválasztása a próbának megfelelő táblázatból. A táblázat jelen esetben a t-eloszlás táblázata, mely eloszlásra szoktak úgy is utalni, mint Student-eloszlás, illetve Student-féle t-eloszlás. A táblázat kétdimenziós, a p szignifikancia szint és az f szabadsági fok ismeretében azonnal megkapjuk a táblázatbeli tp értéket. Az f szabadsági fok a Welch-próba esetén az 
\frac{1}{f}=
\frac{1}{n-1}
\left(
\frac
{\frac{s_x^2}{n}}
{\frac{s_x^2}{n}+ \frac{s_y^2}{m}}
\right) ^2
+
\frac{1}{m-1}
\left(
\frac
{\frac{s_y^2}{m}}
{\frac{s_x^2}{n}+ \frac{s_y^2}{m}}
\right) ^2
összefüggés alapján a jobb oldal reciprokaként adódik. (Mivel ezt láthatóan meglehetősen bonyolult számolni, a gyakrolatban helyette sokszor egy – a Megjegyzésekben bemutatott – egyszerűsítéssel élnek.)
  4. A nullhipotézisre vonatkozó döntés meghozása.
    • Ha |t| ≥ tp, akkor a nullhipotézist elvetjük, az alternatív hipotézist tartjuk meg, és az eredményt úgy interpretáljuk, hogy
      a két mintában a valószínűségi változók átlagai szignifikánsan eltérnek egymástól (p szignifikancai szint mellett).
    • Ha |t| < tp, akkor a nullhipotézist megtartjuk, amit úgy interpretálunk, hogy
      a Welch-próba nem mutat ki szignifikáns különbséget a két mintában a valószínűségi változók átlagai között (p szignifikancai szint mellett).

Példa[szerkesztés | forrásszöveg szerkesztése]

A próba matematikai háttere[szerkesztés | forrásszöveg szerkesztése]

A próba matematikai hátterének legfontosabb gondolata, hogy bármely X és Y független, normális eloszlású valószínűségi változóra vett X1, X2, … Xn illetve Y1, Y2, … Xm minták esetén az


\overline X=
\frac{1}{n}
\sum_{i=1}^{n}
X_i,
\qquad
\overline Y=
\frac{1}{m}
\sum_{j=1}^{m}
X_,

valamint az


s_X=
\sqrt
{
\frac
{\sum_{i=1}^n (X_i-\overline X)^2}
{n}
},
\qquad
s_Y=
\sqrt
{
\frac
{\sum_{i=1}^m (Y_i-\overline Y)^2}
{m}
}

jelölésekkel élve megmutatható, hogy a


t = 
\frac
{\overline X- \overline Y}
{\sqrt
{
\frac{s_X}{n}
+
\frac{s_Y}{m}
}
}

valószínűségi változó t-eloszlást követ a fenti képlet alapján számítható f szabadsági fokkal.

Emiatt az f szabadsági fokú t-eloszlás ismeretében bármilyen 1 > p > 0 esetén meg lehet határozni azt az tp értéket, melyre teljesül hogy ha igaz a nullhipotézis, akkor a t próbastatisztika értéke 1-p valószínűséggel jó közelítéssel a (-tp, tp) intervallumba esik.

Megjegyzések[szerkesztés | forrásszöveg szerkesztése]

  • Az f szabadsági fokot az

\frac{1}{f}=
\frac{1}{n-1}
\left(
\frac
{\frac{s_x^2}{n}}
{\frac{s_x^2}{n}+ \frac{s_y^2}{m}}
\right) ^2
+
\frac{1}{m-1}
\left(
\frac
{\frac{s_y^2}{m}}
{\frac{s_x^2}{n}+ \frac{s_y^2}{m}}
\right) ^2
képlet alapján számítani igen bonyolult. Megmutatható azonban, hogy – az fmin = min {n – 1; m – 1} és fmax = n + m + 2 jelölésekkel élve – teljesül, az fminffmax összefüggés, vagyis az f értéke két nagyon könnyen számítható korlát közé szorítható. Ennek felhasználásával az f fáradtságos kiszámítása sokszor elkerülhető.
Mivel fix p mellett a t-eloszlás táblázatának értékei f növelésével nőnek biztos, hogy tmint ptmax, ahol tmin, t p és tmax rendre a p szignifikancia szinthez és fmin, f és fmax szabadsági fokhoz tartozó t-eloszlás táblázatában található értékek. Így |t| ≥ tmax esetén biztos, hogy |t| ≥ tp is teljesül, vagyis a nullhipotézis elvetéséhez elegendő, hogy |t| ≥ tmax teljesüljön. Hasonlóan |t| < tmin esetén biztos, hogy |t| < tp is teljesül, s így a nullhipotézis megtartásához |t| < tmin is elegendő.
  • Egy másik lehetőség az f fáradságos kiszámításának megkerülésére annak a felhasználása, hogy ha m és n elég nagy (általában az m > 40, n > 40 feltételt szokták megadni), akkor a t-táblázat helyett lehet a standard normális eloszlás táblázatát használni ugyanúgy, mint például az egymintás u-próba (vagy egyébként bármely u-próba) esetén. Ezt azért lehet megtenni, mert ilyen magas n és m értékek mellett a t-eloszlás nagyon közel van a normális eloszláshoz (a t-eloszlás a szabadsági fok növelésével aszimptotikusan normális eloszlású).
  • A Welch-próba bizonyos tekintetben a kétmintás u-próba párja. A kétmintás u-próba ugyanezt a nullhipotézist vizsgálja, csak feltétele az szórások értékének előzetes ismerete is, s nem a minták adatai alapján becsli azokat. A próbastatisztika képlete is nagyon hasonló, csak benne az becsült sx és sy szórások helyett az eleve ismert σx és σy szórások szórások szerepelnek. A két próba matematikai háttere is nagyon hasonló.
  • Szintén szoros a kapcsolat a Welch-próba és a kétmintás t-próba között. Ez a két próba is ugyanazt a nullhipotézist teszteli, ugyanolyan adottságok mellett, csak a kétmintás t-próba feltételezi, hogy a két valószínűségi változó szórásai megegyeznek, míg a Welch-próbához nincs szükségünk ilyen feltételezésre. Ennek a két próbának a képlete viszont jelentősen különbözik egymástól.
  • A szakirodalom nem teljesen egységes annak tekintetében, hogy a nullhipotézis elvetéséről vagy megtartásáról szóló döntésben az |t| és tp közötti két egyenlőtlenség közül melyiknél engedi meg az egyenlőséget. Ennek gyakorlati jelentősége nem igazán van, az alkalmazások során nagyon ritkán adódik, hogy a kiszámított próbastatisztika pontosan egybeesen a táblázatbeli értékkel. Ha esetleg mégis így alakul, akkor az eredmény úgy interpretálható, hogy a nullhipotézis elvetése esetén a kockázat pontosan megegyezik a szignifikancia szinttel, s innen a kutató (és a tudós társadalom) szája ízétől függ, hogy ebben inkább a nullhipotézis elvetésének, vagy inkább a nullhipotézis megtartásának zálogát látja.
  • Érdemes megfigyelni az óvatos fogalmazást a nullhipotézis megtartása esetén. Az általunk meghatározott p szignifikancia szint az elsőfajú hiba elkövetésének valószínűségét adja meg. Ha el tudom vetni a nullhipotézist, ekkora kockázatot vállalok arra nézve, hogy esetleg hiba elvetni. Amennyiben viszont nem tudom elvetni a nullhipotézis, akkor elsőfajú hibát biztosan nem fogok elkövetni, ám elkövethetek másodfajú hibát, melynek kockázatáról semmit nem mond a próba. Ez indokolja, hogy ha a nullhipotézist megtartjuk, akkor nem azt mondjuk, hogy nincs szignifikáns különbség a minta átlaga és az előre megadott m érték között, hanem hogy a Welch-próba nem tudott szignifikáns különbséget kimutatni (ami ettől még lehet, hogy van).

Források[szerkesztés | forrásszöveg szerkesztése]

  • Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen.
  • Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest.
  • Michaletzky Gy. – Mogyoródi J. (1995): Matematikai statisztika, Nemzeti Tankönyvkiadó, Budapest.
  • Michelberger P. – Szeidl L. – Várlaki P. (2001): Alkalmazott folyamatstatisztika és idősor-analízis. Typotex Kiadó, Budapest.
  • Vargha A. (2000): Matematikai statisztika pszchológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó, Budapest.