Khí-négyzet eloszlás

A Wikipédiából, a szabad enciklopédiából

A valószínűség-számítás elméletében és a statisztika területén, a k szabadságfokú khí-négyzet eloszlás (más neveken: khi-négyzet, Khi2) k szabadságfokú független normális eloszlás valószínűségi változóinak a négyzete.

Ez az eloszlás a széles körben használatos a valószínűség-eloszlások között, a statisztikai területén, például a hipotézisek ellenőrzésekor, vagy egy konfidencia-intervallum létrehozásakor.[1][2][3][4]

Ha szükséges a khí-négyzet eloszlást megkülönböztetni a nem-centrális khí-négyzet eloszlástól, akkor szokták néha centrális khí-négyzet eloszlásnak is nevezni.

A khí-négyzet eloszlást statisztikák ellenőrzésére használják, az elméleti és a megfigyelt értékek kiértékelésénél, összehasonlításánál. A khí-négyzet eloszlás, a gamma-eloszlás egy speciális esete.

Definíció[szerkesztés | forrásszöveg szerkesztése]

Ha Z1, ..., Zk független, normális eloszlású valószínűségi változók, , akkor a négyzeteik összege,

 Q\ = \sum_{i=1}^k Z_i^2,

a khí-négyzet eloszlás szerint oszlik el, k szabadságfokkal. Ezt a következőképpen is jelölik:

 Q\ \sim\ \chi^2(k)\ \ \text{or}\ \ Q\ \sim\ \chi^2_k.

A khi-négyzet eloszlásnak egy paramétere van, a k, egy pozitív egész, mely a szabadságfok mértéke.

Valószínűség sűrűségfüggvény[szerkesztés | forrásszöveg szerkesztése]

Valószínűség sűrűségfüggvény

A khí-négyzet eloszlás valószínűség sűrűségfüggvénye:


f(x;\,k) =
\begin{cases}
\frac{x^{(k/2)-1} e^{-x/2}}{2^{k/2} \Gamma\left(\frac{k}{2}\right)}, & x \geq 0; \\ 0, & \text{más esetben}.
\end{cases}

ahol Γ(k/2) a gamma-eloszlást jelöli A sűrűségfüggvényének deriválását a khi-négyzet eloszlás valószínűség sűrűségfüggvényének deriválása szócikk tárgyalja.

Kumulatív eloszlás függvény[szerkesztés | forrásszöveg szerkesztése]

A kumulatív eloszlás függvény:

 F(x;\,k) = \frac{\gamma(\frac{k}{2},\,\frac{x}{2})}{\Gamma(\frac{k}{2})} = P\left(\frac{k}{2},\,\frac{x}{2}\right),

Ahol γ(k,z) az inkomplett gamma-függvény, és a P(k,z) a rendezett gamma-függvény . Abban a speciális esetben, amikor k=2, léteik egy egyszerű képlet:

 F(x;\,2) = 1 - e^{-\frac{x}{2}}.

Ennek az eloszlásnak a táblázatai – rendszerint kumulatív formában – számos helyen megtalálhatók, általában statisztikai csomagokban. Egy zárt formájú közelítés található a nem-centrális khí-négyzet eloszlásnál.

Additivitás[szerkesztés | forrásszöveg szerkesztése]

A khí-négyzet eloszlás definíciója szerint a független khí-négyzet változók összege is khí-négyzet eloszlású. Speciálisan, ha {Xi}i=1n független khí-négyzet eloszlású változók {ki}i=1n szabadságfokkal, akkor Y = X1 + ⋯ + Xn is khí-négyzet eloszlásúak k1 + ⋯ + kn szabadságfokkal.

Információ entrópiája[szerkesztés | forrásszöveg szerkesztése]

Az információ entrópiája:

 H = \int_{-\infty}^\infty f(x;\,k)\ln f(x;\,k) \, dx = \frac{k}{2} + \ln\left(2\Gamma\left(\frac{k}{2}\right)\right) + \left(1-\frac{k}{2}\right) \psi\left(\frac{k}{2}\right),

ahol ψ(x) a Digamma-függvény. A khí-négyzet eloszlás az X valószínűségi változó maximális entrópiájú valószínűség eloszlása, ahol E(X)=\nu rögzített, és E(\ln(X))=\psi\left(\frac{1}{2}\right)+\ln(2) is rögzített.[5]

Nem centrális momentumok[szerkesztés | forrásszöveg szerkesztése]

A k szabadságfokú khí-négyzet eloszlás zéró körüli momentumai:[6][7]

 \operatorname{E}(X^m) = k (k+2) (k+4) \cdots (k+2m-2) = 2^m \frac{\Gamma(m+\frac{k}{2})}{\Gamma(\frac{k}{2})}.

Kumulánsok[szerkesztés | forrásszöveg szerkesztése]

A kumulánsok a karakterisztikus függvény logaritmusának egy hatvány sor kiterjesztésével kaphatók:

 \kappa_n = 2^{n-1}(n-1)!\,k

Aszimptotikus tulajdonságok[szerkesztés | forrásszöveg szerkesztése]

A centrális határeloszlás tételéből következően, mivel a khi-négyzet eloszlás független k szabadságfokú valószínűségi változók szummája, véges átlaggal és szórásnégyzettel, konvergál a normális eloszláshoz nagy k értékeknél.

Praktikus okok miatt, k > 50 esetben az eloszlás elég közel áll a normális eloszláshoz, hogy a különbség elhanyagolható lehessen.[8]

Ha X ~ χ²(k), akkor k tart a végtelenhez, a (X-k)/\sqrt{2k} eloszlás pedig a normális eloszlás felé tart. Azonban ez a konvergencia lassú, mivel a ferdeség \sqrt{8/k}, és az eloszlásgörbe meredeksége 12/k. A khí-négyzet eloszlás más függvényei jóval gyorsabban konvergálnak a normális eloszláshoz. Néhány példa:

  • Ha X ~ χ²(k), akkor \scriptstyle\sqrt{2X} közel normálisan eloszlású, \scriptstyle\sqrt{2k-1} középértékkel.
  • Ha X ~ χ²(k), akkor \scriptstyle\sqrt[3]{X/k} közel normálisan eloszlású \scriptstyle 1-2/(9k) középértékkel, és \scriptstyle 2/(9k). szórásnégyzettel[9] Ezt Wilson-Hilferty transzformációnak hívják.

Kapcsolódó eloszlások[szerkesztés | forrásszöveg szerkesztése]

  •  \lim_{k \to \infty}\tfrac{\chi^2_k(x)-\mu_k}{\sigma_k} \xrightarrow{d}\ N(0,1) \, (normális eloszlás)
  •  \chi_k^2 \sim {\chi'}^2_k(0) (Nem-centrális khi-négyzet eloszlás nem-centralitás paraméterrel  \lambda = 0 )
  • Khí-négyzet eloszlás, a Pareto-eloszlás egy transzformációja
  • A T-eloszlás, a khí-négyzet eloszlás egy transzformációja
  • A T-eloszlás származtatható a khi-négyzet eloszlásból, és a normális eloszlásból
  • Nem-centrális T-eloszlás származtatható a khí-négyzet eloszlásból, és a normális eloszlásból

Statisztikailag független egységnyi szórásnégyzetes Gauss-eloszlású változók négyzeteinek szummája, melynek nincs zéró középértéke, a khí-négyzet eloszlás általánosításához vezet, és nem-centrális khi-négyzet eloszlásnak hívják. A khí-négyzet eloszlás természetesen kapcsolódik más eloszlásokhoz, melyeknek a Gauss-eloszláshoz van közük. Például:

  • Y F-eloszlású, Y ~ F(k1,k2) ha \scriptstyle Y = \frac{X_1 / k_1}{X_2 / k_2} ahol X1 ~ χ²(k1), és X2  ~ χ²(k2) statisztikailag független.
  • Ha X khí-négyzet eloszlású, akkor \scriptstyle\sqrt{X} khí-eloszlású.
  • Ha X1  ~  χ2k1 és X2  ~  χ2k2 statisztikailag független, akkor X1 + X2  ~ χ2k1+k2. Ha X1 and X2 nem függetlenek, akkor X1 + X2 nem khi –eloszlású.

Általánosítás[szerkesztés | forrásszöveg szerkesztése]

A khí-négyzet eloszlást a Gaussi k, független, zéró középértékű, egységnyi szórásnégyzetű valószínűségi változók négyzeteinek szummájával kapjuk. Ennek az eloszlásnak az általánosítását úgy kaphatjuk, ha összegezzük más típusú Gaussi valószínűségi változók négyzeteit. A következőkben bemutatunk néhány ilyen eloszlást.

Khí-négyzet eloszlások[szerkesztés | forrásszöveg szerkesztése]

Nem-centrális khí-négyzet eloszlás[szerkesztés | forrásszöveg szerkesztése]

A nem-centrális khí-négyzet eloszlást a független gaussi valószínűségi változók négyzeteinek szummájával kapjuk, melyek egység szórásnégyzettel , és nem zéró középértékkel rendelkeznek.

Általánosított khí-négyzet eloszlás[szerkesztés | forrásszöveg szerkesztése]

Az általánosított khí-négyzet eloszlást a z′Az kvadratikus képletéből kapjuk, ahol z, a zéró középértékű Gaussi vektor, tetszőleges kovariáns mátrixxal, és A egy tetszőleges mátrix.

Gamma-, exponenciális- és kapcsolódó eloszlások[szerkesztés | forrásszöveg szerkesztése]

A X ~ χ²(k) khí-négyzet eloszlás, a gamma-eloszlás egy speciális esete, X ~ Γ(k/2, 2), ahol k egy egész. Mivel az exponenciális eloszlás szintén a Gamma-eloszlás egy speciális esete, ezért X ~ χ²(2), és X ~ Exp(1/2) egy exponenciális eloszlás. Az Erlang-eloszlás szintén a Gamma-eloszlás egy speciális esete, ezért ha X ~ χ²(k) páros k-val, akkor X is Erlang-eloszlású k/2 alakparaméterrel, és ½ skálaparaméterrel.

Alkalmazások[szerkesztés | forrásszöveg szerkesztése]

A khí-négyzet eloszlásnak számos alkalmazása ismert a statisztikában, például a khí-négyzet teszt, vagy a szórásnégyzetek becslése. Felveti a normális eloszlás középérték becslésének a problémáját, és a regressziós vonal meredekségének a becslését, a T-eloszláson keresztül. A szórásnégyet analízis problémájában is van szerepe, az F-eloszlással kapcsolatban, mely két független khí-négyzet valószínűségi változó arányának az eloszlása, mindegyik osztva a megfelelő szabadságfokkal. A következő táblázat olyan eloszlásokat mutat be, melyek neve ‘khí’-vel kezdődik, valamilyen statisztikához kapcsolódik, a Xi ∼ Normal(μi, σ2i), i = 1, ⋯, k, független valószínűségi változókra alapozva:

Név Statisztika
Khí-négyzet eloszlás \sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2
Nem-centrális khí-négyzet eloszlás \sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2
Khí-eloszlás \sqrt{\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2}
nem-centrális khí-eloszlás \sqrt{\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2}

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Wilson, E.B.; Hilferty, M.M: The distribution of chi-squared. 1931. 684–688. o.  
  • Horváth Gézáné: Kvantitatív módszerek I.Fejezetek a valószínűség-számításból. (hely nélkül): PERFEKT ZRT. 2005. ISBN 9789633945902  
  • Jonhson, N.L.; S. Kotz, , N. Balakrishnan: Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). (hely nélkül): John Willey and Sons. 1994. ISBN 0471584959  
  • Maddala, G.S: Limited-Dependent and Qualitative Variables in Econometrics. (hely nélkül): Cambridge University Press. 1983.  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. Sablon:Abramowitz Stegun ref
  2. NIST (2006). Engineering Statistics Handbook - Chi-Squared Distribution
  3. Jonhson, N.L., S. Kotz, , N. Balakrishnan. Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). John Willey and Sons (1994). ISBN 0-471-58495-9 
  4. Mood, Alexander, Franklin A. Graybill, Duane C. Boes. Introduction to the Theory of Statistics (Third Edition, p. 241-246). McGraw-Hill (1974). ISBN 0-07-042864-6 
  5. (2009.) „Maximum entropy autoregressive conditional heteroskedasticity model”. Journal of Econometrics, 219–230. o, Kiadó: Elsevier. Hozzáférés ideje: 2011. június 2.  
  6. Chi-squared distribution, from MathWorld, retrieved Feb. 11, 2009
  7. M. K. Simon, Probability Distributions Involving Gaussian Random Variables, New York: Springer, 2002, eq. (2.35), ISBN 978-0-387-34657-1
  8. Box, Hunter and Hunter. Statistics for experimenters. Wiley 
  9. Wilson, E.B.; Hilferty, M.M. (1931) "The distribution of chi-squared". Proceedings of the National Academy of Sciences, Washington, 17, 684–688.