Cochran-tétel

A Wikipédiából, a szabad enciklopédiából

A statisztikában a Cochran-tételt a valószínűség-eloszlásokkal kapcsolatos eredmények igazolására használják a szórásnégyzet analízisnél.[1][2] A tételt William G. Cochran (1909–1980) amerikai-skót statisztikus dolgozta ki.[3]

Állítás[szerkesztés | forrásszöveg szerkesztése]

Tegyük fel, hogy U1, ..., Un független normális eloszlású valószínűségi változók, és felírható a


\sum_{i=1}^n U_i^2=Q_1+\cdots + Q_k

alak, ahol minden Qi, U lineáris kombinációinak négyzetösszegei. Továbbá tegyük fel, hogy


r_1+\cdots +r_k=n

ahol ri, Qi rangja. Cochran tétele azt állítja, hogy Qi-k függetlenek, és minden egyes Qi- khi-négyzet eloszlású, ri szabadságfokkal. Itt Qi rangját úgy kell értelmezni, mint egy B(i) mátrix dimenzióját, Qi négyzetes ábrázolásában:

Q_i=\sum_{j=1}^n\sum_{k=1}^n U_j B_{j,k}^{(i)} U_k .

Kevésbé formálisan, ez a lineáris kombinációk száma, mely tartalmazza a Qi-t meghatározó négyzetek összegét, feltéve, hogy a lineáris kombinációk lineárisan függetlenek.

Példák[szerkesztés | forrásszöveg szerkesztése]

Minta középérték és minta szórásnégyzet[szerkesztés | forrásszöveg szerkesztése]

Ha X1, ..., Xn > független normális eloszlású valószínűségi változók, μ középértékkel, és σ szórással, akkor

U_i = \frac{X_i-\mu}{\sigma}

minden egyes i-e standard normális. Írhatjuk:


\sum U_i^2=\sum\left(\frac{X_i-\overline{X}}{\sigma}\right)^2
+ n\left(\frac{\overline{X}-\mu}{\sigma}\right)^2

(itt az összegzés 1-től n-ig tart, a teljes megfigyelési tartományban) \sigma^2-tel megszorozva:


\sum(X_i-\mu)^2=
\sum(X_i-\overline{X}+\overline{X}-\mu)^2

és kiterjesztve


\sum(X_i-\mu)^2=
\sum(X_i-\overline{X})^2+\sum(\overline{X}-\mu)^2+
2\sum(X_i-\overline{X})(\overline{X}-\mu).

A harmadik tag zéró, mert konstans idővel egyenlő

\sum(\overline{X}-X_i)=0,

a második tag n azonos tag összege. Így:


\sum(X_i-\mu)^2=
\sum(X_i-\overline{X})^2+n(\overline{X}-\mu)^2 ,

és ezért


\sum\left(\frac{X_i-\mu}{\sigma}\right)^2=
\sum\left(\frac{X_i-\overline{X}}{\sigma}\right)^2
+n\left(\frac{\overline{X}-\mu}{\sigma}\right)^2
=Q_1+Q_2.

Q2 rangja 1, Q1 rangja n-1, és így a Cochran-tétel feltételei teljesültek. A Cochran-tétel állítja, hogy Q2 és Q1 függetlenek, khi-négyzet eloszlással, és n-1, és 1 szabadságfokokkal. Ez mutatja, hogy a minta középérték, és a minta szórása függetlenek egymástól.

Ez a Basu-tételből is következik, és ez a tulajdonság a normális eloszlásra jellemző, nincs más eloszlás, ahol a minta középérték, és a minta szórása függetlenek egymástól.

Eloszlások[szerkesztés | forrásszöveg szerkesztése]

Az eloszlásokra szimbolikusan a következők írhatók:


n(\overline{X}-\mu)^2\sim \sigma^2 \chi^2_1,

\sum\left(X_i-\overline{X}\right)^2  \sim \sigma^2 \chi^2_{n-1}.

Mindkét valószínűségi változó arányos az igazi, de ismeretlen σ2 szórásnégyzettel. Így arányuk nem függ σ2-től, és mivel statisztikusan függetlenek, az arányuk eloszlása:


\frac{n\left(\overline{X}-\mu\right)^2}
{\frac{1}{n-1}\sum\left(X_i-\overline{X}\right)^2}\sim \frac{\chi^2_1}{\frac{1}{n-1}\chi^2_{n-1}}
   \sim F_{1,n-1}

ahol F1,n − 1 az F-eloszlás 1 és d n − 1 szabadságfokkal (lásd Student T-eloszlás). Itt a végső lépés, a valószínűségi változó meghatározása, melynek F-eloszlása van.

Szórásnégyzet becslése[szerkesztés | forrásszöveg szerkesztése]


\widehat{\sigma}^2=
\frac{1}{n}\sum\left(
X_i-\overline{X}\right)^2.

Cochran-tétel szerint:


\frac{n\widehat{\sigma}^2}{\sigma^2}\sim\chi^2_{n-1}

és a khi-négyzet eloszlás tulajdonságából következően, a várható \widehat{\sigma}^2 : σ2(n − 1)/n.

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Cochran, W. G: "The distribution of quadratic forms in a normal system, with applications to the analysis of covariance". (hely nélkül): Mathematical Proceedings of the Cambridge Philosophical Society 30 (2). 1934. 
  • Bapat, R. B.: Linear Algebra and Linear Models (Second ed.). (hely nélkül): Springer. 1934. ISBN 9780387988719  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. Bapat, R. B.. Linear Algebra and Linear Models, Second, Springer (2000). ISBN 9780387988719 
  2. http://www.staff.u-szeged.hu/~rajko/oktatas/matstat/index.html
  3. Cochran, W. G. (1934. April). „The distribution of quadratic forms in a normal system, with applications to the analysis of covariance”. Mathematical Proceedings of the Cambridge Philosophical Society 30 (2), 178–191. o. DOI:10.1017/S0305004100016595.