Centrális határeloszlás-tétel

A Wikipédiából, a szabad enciklopédiából

A centrális határeloszlás-tétel (CHT) azt mondja ki, hogy adott feltételek mellett, elegendően nagy számú és független valószínűségi változó középértéke (várható értéke) jó közelítéssel normális eloszlású, ha a független valószínűségi változók jól meghatározott középértékkel és szórásnégyzettel rendelkeznek.[1]

A centrális határeloszlás-tételnek számos változata van. Az általános formájában, a valószínűségi változók hasonló eloszlásúaknak kell lenniük. Vannak olyan változatok, ahol a normális eloszlás középértékéhez történő konvergencia a nem azonos eloszlást mutató valószínűségi változóknál is előfordul, bizonyos feltételek mellett.

A valószínűségi elméletben a centrális határeloszlás-tétel az úgynevezett gyenge-konvergenciájú halmaz része. Ez arról a tényről szól, hogy sok független és azonos eloszlású valószínűségi változó összege egy atraktor eloszlás kis halmazához közelít. Ha a független és azonos eloszlású valószínűségi változók szórásnégyzete véges, akkor az atraktor eloszlás a normális eloszlás. Ezzel ellentétben, ha a valószínűségi változó négyzetes törvény szerinti elnyúló farok résszel rendelkezik, a szórásnégyzet végtelen, akkor az alfa-stabil eloszlás felé tart, alfa stabilitás paraméterrel, ahogy a változók száma nő.[2]

Klasszikus CHT[szerkesztés | forrásszöveg szerkesztése]

Legyenek X1, ..., Xn egy n elemszámú minta tagjai, egy független és azonos eloszlású valószínűségi változók sorozata, µ várható értékkel és σ2 szórásnégyzettel. Tegyük fel, hogy a minták átlaga:

S_n := \frac{X_1+\cdots+X_n}{n}

A nagy számok törvénye szerint a mintaátlagok majdnem biztosan a µ várható értékhez konvergálnak, ahogy n → ∞. A klasszikus CHT leírja a középérték, µ körüli sztochasztikus fluktuáció méretét és eloszlási formáját a konvergencia során. Pontosabban azt állítja, hogy ahogy n nő, a minta átlaga Sn és annak határértéke (µ) közötti különbség eloszlása, ha megszorozzuk a n tényezővel (azaz n(Sn − µ)), akkor közelít a normális eloszláshoz, 0 középértékkel és σ2 szórásnégyzettel. Ha n elég nagy, akkor Sn eloszlása közel normális eloszlású µ középértékkel és σ2/n szórásnégyzettel. Az elmélet hasznossága az, hogy \sqrt{n}(Sn − µ) közelít a normálishoz, tekintet nélkül az egyedi Xi-k eloszlásának formáitól.

Alkalmazás, példa[szerkesztés | forrásszöveg szerkesztése]

Kockadobás –CHT működése

A mellékelt ábrán látható, hogy a hatoldalú kocka dobásának eloszlása az n növelése függvényében, az eloszlás tart a normális eloszláshoz.

Az USA-ban 1973 és 1978 között vizsgált baleseti halálok eloszlása is tart a normális eloszlás felé a CHT miatt.

Számos esetet publikáltak, ahol a CHT törvénye működik.[3]

Az úgynevezett véletlenszerű bolyongáskor követett útvonalak eloszlásai is tendálnak a normális eloszlás felé[4] Nagy számú pénzérme feldobásakor a ‘fej’ eredmények normális eloszlást mutatnak az összes fejre viszonyítva (vagy írásra). Elektronikus zajok természete is normális eloszlást mutat elegendően nagy számú kísérletnél. Általánosságban is elmondható, hogy minél több mérést végzünk független változókkal egyenlő befolyással (körülmények között), akkor az eloszlás tart a normális eloszlás felé. Számos statisztikai eredmény és számítógépes megoldás mutatja a konvergenciát a centrális határ-eloszlás szerint.[5]

A CHT rövid története[szerkesztés | forrásszöveg szerkesztése]

Az első verzió Abraham de Moivre francia matematikus nevéhez kötődik (1733).[6] A publikációt teljesen elfelejtették, majd 1812-ben a híres francia matematikus Pierre-Simon Laplace vette elő a homályból az elméletet. Az elmélet fontosságát egy orosz matematikus, Alekszandr Mihajlovics Ljapunov ismerte fel 1901-ben, és bizonyította a tétel működését, a valószínűségi elmélet területén. A ’centrális határ-eloszlás’ elnevezést Pólya György használta először egy publikációjában 1920-ban.[7][8] Az elmélet kifejtéséhez számos matematikus, statisztikus járult hozzá (Anders Hald, Augustin Cauchy, Friedrich Bessel, Siméon Denis Poisson, Paul Pierre Lévy, Harald Cramér). Az első bizonyítások Bernstein, Pafnutyij Lvovics Csebisov, Id. Andrej Andrejevics Markov és Alekszandr Mihajlovics Ljapunov neveihez fűződik, 1935 körül.[9][10]. Érdekesség a történetben, hogy Alan Turing disszertációjában (King's College, University of Cambridge) a CHT bizonyítása szerepelt. Ezt a disszertációt sohasem publikálták.[11][12][13]

A CHT bizonyítása[szerkesztés | forrásszöveg szerkesztése]

Az elmélet kiterjesztése[szerkesztés | forrásszöveg szerkesztése]

A klasszikus elmélet bizonyítása[szerkesztés | forrásszöveg szerkesztése]

CHT variánsok[szerkesztés | forrásszöveg szerkesztése]

  • Több dimenziós CHT[16]
  • CHT egymástól nem független változók esetén[17]

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Simonovits András: Válogatott fejezetek a matematika történetéből. (hely nélkül): Typotex Kiadó. 2009. 109–113. o. ISBN 9789632790268  
  • Barany, Imre & Vu, Van: Central limit theorems for Gaussian polytopes. (hely nélkül): The Annals of Probability (Institute of Mathematical Statistics) 35 (4). 2007. 1593–1621. o.  
  • Durrett, Richard: Probability: theory and examples (4th ed.). (hely nélkül): Cambridge University Press. 2004. ISBN 0521765390  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. Rice, John (1995), Mathematical Statistics and Data Analysis (Second ed.), Duxbury Press, ISBN 0-534-20934-3)
  2. Voit, Johannes (2003), The Statistical Mechanics of Financial Markets, Springer-Verlag, p. 124, ISBN 3-540-00978-7
  3. Dinov, Christou & Sanchez (2008)
  4. SOCR CLT Activity wiki
  5. Marasinghe, M., Meeker, W., Cook, D. & Shin, T.S. (1994 August), "Using graphics and simulation to teach statistical concepts", Paper presented at the Annual meeting of the American Statistician Association, Toronto, Canada.
  6. Henk, Tijms (2004), Understanding Probability: Chance Rules in Everyday Life, Cambridge: Cambridge University Press, p. 169, ISBN 0-521-54036-4
  7. Pólya, George (1920), "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem", Mathematische Zeitschrift (in German) 8 (3–4): 171–181, doi:10.1007/BF01206525
  8. Le Cam, Lucien (1986), "The central limit theorem around 1935", Statistical Science 1 (1): 78–91, doi:10.2307/2245503
  9. Le Cam, Lucien (1986), "The central limit theorem around 1935", Statistical Science 1 (1): 78–91, doi:10.2307/2245503
  10. Bernstein, S.N. (1945) On the work of P.L.Chebyshev in Probability Theory, Nauchnoe Nasledie P.L.Chebysheva. Vypusk Pervyi: Matematika. (Russian) [The Scientific Legacy of P. L. Chebyshev. First Part: Mathematics, Edited by S. N. Bernstein.] Academiya Nauk SSSR, Moscow-Leningrad, 174 pp.
  11. Hodges, Andrew (1983) Alan Turing: the enigma. London: Burnett Books., pp. 87-88.
  12. Zabell, S.L. (2005) Symmetry and its discontents: essays on the history of inductive probability, Cambridge University Press. ISBN 0-521-44470-5. (pp. 199 ff.)
  13. Aldrich, John (2009) "England and Continental Probability in the Inter-War Years", Electronic Journ@l for History of Probability and Statistics, vol. 5/2, December 2009. (Section 3)
  14. Billingsley (1995, p.362)
  15. P. Billingsley (1986). Probability and measure (2 ed.). p. 369.
  16. Van der Vaart, A. W. (1998), Asymptotic statistics, New York: Cambridge University Press, ISBN 978-0-521-49603-2, LCCN .V22 1998 QA276 .V22 1998
  17. Johnson, Oliver Thomas (2004) Information theory and the central limit theorem, Imperial College Press, 2004, ISBN 1-86094-473-6. (p. 88)