Valószínűség-eloszlás

A Wikipédiából, a szabad enciklopédiából
(Valószínűségi eloszlás szócikkből átirányítva)

A valószínűség-számítás elméletében, a valószínűség eloszlás, a valószínűség tömeg, a valószínűség sűrűségfüggvény, mind függvények, melyek leírják, hogy egy véletlenszerű változó milyen valószínűséggel vehet fel egy bizonyos értéket. A még pontosabb meghatározáshoz különbséget kell tennünk a diszkrét és a folytonos véletlenszerű (valószínűségi) változók között. Diszkrét esetben minden egyes lehetséges értékhez könnyen hozzárendelhetjük a valószínűséget: ha például egy hat oldalú kockával dobunk, akkor a hat érték előfordulásának a valószínűsége 1/6.

Ezzel szemben, ha a valószínűségi változó folytonos, a valószínűségek csak akkor nem zeró értékűek, ha véges intervallumra vonatkoznak: például, minőség-ellenőrzés esetén megkövetelhetjük, hogy annak a valószínűsége, hogy egy 500 g-os csomag súlya 500 g, és 510 g közé essen, ne legyen kevesebb, mint 98%.

Két kocka diszkrét valószínűségi eloszlása
Normális eloszlás

A kumulatív eloszlásfüggvény annak a valószínűségét adja meg, hogy egy valószínűségi változó nem lehet nagyobb egy adott értéknél: ez a nem-kumulatív eloszlás integrálja.

Tartalomjegyzék

Terminológia [szerkesztés]

Mivel a valószínűség-elméletet számos különböző területen alkalmazzák, a terminológia nem egységes, sőt néha zavaros.

A következő kifejezéseket használják, mind a nem-kumulatív, mind a kumulatív eloszlású függvényeknél:

  • Valószínűség tömeg, Valószínűség tömeg függvény (v.t.f.):diszkrét valószínűségi változókra
  • Kategorikus eloszlás: diszkrét diszkrét valószínűségi változókra

, véges halmazok esetén

  • Valószínűség sűrűség, Valószínűség sűrűségfüggvény (v.s.f.): leginkább folytonos valószínűségi változók esetén.

A következő fogalmak nem teljesen egyértelműek, vonatkozhatnak nem-kumulatív, vagy kumulatív eloszlásokra is, a szerzőtől függően:

  • Valószínűség-eloszlás függvény: folytonos vagy diszkrét, nem-kumulatív, vagy kumulatív
  • Valószínűség-függvény: még inkább homályos, jelentheti a fentieket, vagy bármi mást.

Végül:

  • Valószínűség-eloszlás: vagy azonos a valószínűség-eloszlás függvénnyel, vagy valami alapvetőbb aktuális tömeg-, vagy sűrűségfüggvény.

Alapvető kifejezések:

  • Módusz: leggyakrabban előforduló érték (A módusz a statisztikai középérték mutatók (medián, módusz, számtani átlag, harmonikus átlag, mértani átlag, négyzetes átlag) egyike).
  • Farok: az eloszlások azon része, ahol a legkisebb az eloszlás értéke.

Diszkrét valószínűség-eloszlás [szerkesztés]

Diszkrét eloszlás valószínűség tömeg függvénye

Az ábrán látható tömeg függvényben, az elemi események - {1},{3}, és {7} - valószínűsége 0,2, 0,5, és 0,3. Egy halmaz, mely nem tartalmazza egyik pontot sem, annak a valószínűsége zéró.

Diszkrét eloszlás kumulatív eloszlás függvénye (cef)
Folytonos eloszlás cef-e
Kevert eloszlás folytonos, és diszkrét része

A diszkrét valószínűség-eloszlás valószínűség tömegfüggvénnyel jellemzett valószínűség eloszlás. Így az X valószínűségi változó eloszlása diszkrét, és X-et diszkrét valószínűségi változónak nevezzük, ha

\sum_u \Pr(X=u) = 1

mivel u az összes lehetséges X értéken értelmezhető. Ebből következik, hogy az ilyen változó csak véges, vagy megszámlálhatóan végtelen számértékeket vehet fel.

A legismertebb diszkrét valószínűség-eloszlás, melyet statisztikai modellezésre is használnak, a Poisson-eloszlás, a Bernoulli-eloszlás, a binomiális eloszlás, a geometriai eloszlás, és a negatív binomiális eloszlás.

Ezenfelül a diszkrét egyenletes eloszlást általánosan alkalmazzák számítógép programoknál az egyenletesen kiválasztott véletlenszerű számoknál.

Kumulatív sűrűség [szerkesztés]

A fentieknek megfelelően egy diszkrét valószínűségi változót úgy határozhatunk meg, mint egy valószínűségi változót, melynek kumulatív eloszlásfüggvénye csak diszkontinuitásokkal, ugrásokkal nőhet, vagyis akkor nő, ha magasabb értékre „ugrik”, és konstans az ugrások között. Azok a pontok, ahol az ugrás történik, azok az értékek, melyet a valószínűségi változó felvehet. Az ilyen pontok száma lehet véges vagy számolhatóan végtelen. Az ugrások helyének nem kell topológiailag diszkrétnek lennie; például a kumulatív eloszlásfüggvény ugorhat minden racionális számnál.

Delta-függvény [szerkesztés]

A diszkrét valószínűség-eloszlás gyakran a valószínűség sűrűségfüggvény általánosított formájában jelenik meg, beleértve a Dirac delta függvényt, mely lényegében egységesíti a folytonos és diszkrét eloszlás kezelését. Ez akkor hasznos, amikor olyan valószínűség-eloszlásokkal foglalkozunk, melyek folytonos és diszkrét részeket is tartalmaznak.

Indikátorfüggvény (karakterisztikus függvény) [szerkesztés]

Legyen egy diszkrét valószínűségi változó X, u0, u1…az értékek, melyeket felvehet nem zéró valószínűséggel. Jelöljük:

\Omega_i=\{\omega: X(\omega)=u_i\},\, i=0, 1, 2, \dots

Ezek diszjunkt halmazok, és képlettel (1):

\Pr\left(\bigcup_i \Omega_i\right)=\sum_i \Pr(\Omega_i)=\sum_i\Pr(X=u_i)=1.

Ebből következik, hogy X bármely értéket felvehet, kivéve az u0, u1, ...= zéró eseteket, és így írhatjuk X :

X=\sum_i u_i 1_{\Omega_i}

kivéve a zéró valószínűségű halmazra, ahol 1_A , az A indikátor függvénye.

Folytonos valószínűség-eloszlás [szerkesztés]

A folytonos valószínűség-eloszlást úgy értelmezhetjük, hogy egy olyan valószínűség-eloszlás, melynek van valószínűség-sűrűségfüggvénye.

A matematikusok ezt az eloszlásfajtát, abszolút folytonosnak is hívják, mivel kumulatív eloszlásfüggvénye abszolút folytonos, tekintettel a Lebesgue-mértékre, λ.

Ha X eloszlása folytonos. akkor X-et folytonos valószínűségi változónak hívják. Számos példa létezik folytonos eloszlásokra: normális-, egyenletes-, chi-négyzetes- és más eloszlások.

A folytonos valószínűségi változó folytonos értékeket vehet fel, szemben a diszkrét eloszlással, ahol egy lehetséges megszámolható változókat veheti fel.

Míg a diszkrét eloszlásnál zéró valószínűségű esemény nem lehetséges, nem ez a helyzet a folytonos eloszlásokra.

Ha megmérjük egy tölgyfa levelének hosszát, és az eredmény például 3,5 cm, ennek zéró a valószínűsége, mert megszámolhatatlan sok potenciális érték van 3 és 4 cm között. Minden egyes eredmény zéró valószínűségű, mégis annak a valószínűsége, hogy a 3 és 4 közé essen az eredmény nem zéró.

Ezt a nyilvánvaló paradoxont azzal a ténnyel oldhatjuk fel, hogy annak a valószínűsége, hogy X felvehet egy értéket a végtelen tartományban, mely egy intervallum, nem adhatjuk naívan össze az egyes értékék valószínűségeit.

Formálisan, minden értéknek infinitezimálisan kicsi a valószínűsége, mely statisztikusan ekvivalens a zéróval.

Ha X egy folytonos valószínűségi változó, akkor van valószínűség sűrűség függvénye ƒ(x), és ezért a valószínűsége belesik egy adot intervallumba, ez legyen [a, b] egy integrállal:


    \Pr[a\le X\le b] = \int_a^b f(x) \, dx

Például, X valószínűsége egy adott a-ra = zéró (azaz aXa), mert egy integrál, melynek alsó és felső határai egybe esnek, az mindig zéró. A definíció azt állítja, hogy egy folytonos valószínűség eloszlásnak kell lennie sűrűségének, a kumulatív eloszlás függvénye abszolút folytonos. Ez a követelmény erősebb, mint a folytonos valószínűség eloszlás egyszerű folytonossága, és van egy speciális eloszlás osztály, a szinguláris eloszlások, melyek sem nem folytonosak, sem diszkrétek, és nem ezek keveréke.

Egy példa erre a Cantor-eloszlás.

Ilyen eloszlásokkal azonban, sosem találkozunk a gyakorlatban.

Figyeljük meg a terminológiát: néhány szerző a “folytonos eloszlás”t használja, ezzel jelölve a folytonos eloszlásfüggvényt. Így, definíciójukban benne foglaltatik az (abszolút) folytonos, és a szinguláris eloszlás is.

Egy konvenció szerint, a \,\mu valószínűség eloszlást folytonosnak nevezik, ha a kumulatív eloszlásfüggvénye F(x)=\mu(-\infty,x] folytonos, és ezért a szingleton valószínűség mértéke, minden \,x-re, \mu\{x\}\,=\,0

Egy másik konvenció a folytonos valószínűség eloszlást lefoglalja az abszolút folytonos eloszlásokra.

Ezeket az eloszlásokat a valószínűség sűrűségfüggvény jellemezheti: a nem-negatív Lebesgue integrálható függvény, \,f valós számokon definiált:


F(x) = \mu(-\infty,x] = \int_{-\infty}^x f(t)\,dt.

Diszkrét eloszlások, és néhány folytonos eloszlás (mint például a Cantor-eloszlás), nem ismer ilyen sűrűséget.

Valós értékű valószínűségi változók valószínűség eloszlásai [szerkesztés]

Mivel a valós számsíkon Pr valószínűség eloszlását a valós-értékű valószínűségi változó , X határoza meg egy félig nyitott intervallumban ((-∞, x], a valószínűség eloszlást teljes mértékben a kumulatív eloszlás függvény jellemzi:

 F(x) = \Pr \left[ X \le x \right] \qquad \forall x \in \mathbb{R}.

Néhány tulajdonság [szerkesztés]

  • Két független valószínűségi változó összegének a valószínűség sűrűségfüggvénye, ezen változók sűrűségfüggvényének a konvolúciója.
  • Két független valószínűségi változó különbségének a valószínűség sűrűségfüggvénye, ezen változók sűrűségfüggvényének kereszt-korrelációja.

Véletlenszám-generálás [szerkesztés]

Gyakori probléma statisztikai szimulációknál (Monte Carlo-modell), a pszeudó véletlenszám generálás, mely egy adott módon oszlik el. A legtöbb algoritmus a pszeudó véletlenszám generátor módszeren alapul: ez X számokat generál , melyek egyenletesen oszlanak el az intervallumban [0,1). Ezeket az X számokat átalakítják u(X)-re, melyek kielégítik az adott f(u) eloszlást.

Kolmogorov-definíció [szerkesztés]

A valószínűség elmélet mérés elméletében, egy valószínűségi változót egy mérhető X függvényként definiálnak, a valószínűségi térből (\scriptstyle (\Omega, \mathcal{F}, \operatorname{P}) a mérhető térbe \scriptstyle (\mathcal{X},\mathcal{A}). A valószínűség eloszlás egy átkonvertáló mérés X*P = PX −1 az \scriptstyle (\mathcal{X},\mathcal{A}) térben.

Alkalmazások [szerkesztés]

Egy populációban szinte minden jellemzőt mérnek (emberek magassága, súlya, forgalom, élettartam stb.), és minden mérésnek van belső hibája; fizikában sok folyamat feldolgozása valószínűségi alapon történik, a gázok kinetikus tulajdonságától, a kvantummechanikáig. Valószínűség eloszlás alkalmazásával sokszor jobb eredményeket lehet elérni, mint közvetlen méréskor. Az alkalmazásokra egy specifikus példa, a statisztikai nyelvi modellek, melyeket a természetes nyelvi szövegek statisztikai közelítéseinél használhatják.

Legáltalánosabb valószínűség eloszlások [szerkesztés]

A teljes felsorolást a valószínűség-eloszlások listája tartalmazza. A következőkben a legáltalánosabban használt eloszlásokat említjük meg a kimenetel szempontjából.

Az egyváltozós eloszlások egy érték körül csúcsosodnak. A gyakorlatban, az aktuálisan vizsgált mennyiségek több változóhoz kapcsolódnak, ezen mennyiségek modellezéséhez a keverék eloszlásokat használják.

  • Valós értékű mennyiségek, melyek lineárisan nőnek (például, hiba, offset, stb.)
    • Normális eloszlás (Gauss eloszlás) egy értékre; ez a legáltalánosabban használt eloszlás
  • Valós értékű mennyiségek, melyek exponenciálisan nőnek (például, árak, jövedelmek, népesség, stb.)
    • Log-normális eloszlás egy értékre, melynek logaritmusa normális eloszlású
    • Pareto-eloszlás, egy értékre, melynek logaritmusa exponenciális eloszlású;
  • Valós értékű mennyiségek, melyek feltételezhetően egyenletesen oszlanak el egy tartományban (melyet általában nem ismerünk)
    • Diszkrét egyenletes eloszlás, véges halmazokra (például, egy kockadobás kimenetele)
    • Folytonos egyenletes eloszlás, folytonos eloszlású értékekre
  • Bernoulli próba (igen/nem események, egy adott valószínűséggel)

Alapvető eloszlások [szerkesztés]

Irodalom [szerkesztés]

  • Horváth Gézáné: Kvantitatív módszerek I.Fejezetek a valószínűség-számításból. PERFEKT ZRT. 2005. ISBN 9789633945902
  • Maddala, G.S: Limited-Dependent and Qualitative Variables in Econometrics. Cambridge University Press. 1983.
  • A Look at the Burr and Related Distributions. International Statistical Review 48 (3):. 1980. 337–344. o.
  • Burr, I.W.: Cumulative frequency functions. Annals of Mathematical Statistics,. 1942. 215–232. o.
  • Rodriguez, R.N: A guide to Burr Type XII distributions. Biometrika, 64. 1977. 129–134. o.

Kapcsolódó szócikkek [szerkesztés]

Források [szerkesztés]