Sűrűségfüggvény

A valószínűségszámításban az X valószínűségi változó sűrűségfüggvénye f pontosan akkor, ha az X-nek az F-fel jelölt eloszlásfüggvénye előállítható a következő alakban:

F(x)=\int \limits _{-\infty }^{x}f(t)\,\mathrm {d} t.

Szemben a valószínűségekkel, a sűrűségfüggvények felvehetnek 1-nél nagyobb értéket is. A valószínűségi eloszlások sűrűségfüggvényeken alapuló konstrukciója szempontjából nem a sűrűségfüggvény által felvett érték a fontos, hanem az integrál.

A sűrűségfüggvény általánosítása az általánosított sűrűségfüggvény, ahol is a Lebesgue-mértékre vonatkozó sűrűségfüggvények a valószínűségi sűrűségfüggvények. A továbbiakban sűrűségfüggvényen valószínűségi sűrűségfüggvényt értünk, kivéve ha azt máshogy jelezzük.

Diszkrét esetben az események valószínűsége megkapható a tartalmazott elemi események valószínűségeinek összegzésével. Folytonos esetben azonban ez nem tehető meg, mivel a nullaszor végtelen értéke bármi lehet. Például két ember csak ritkán pont egyforma magas, eltér egymástól egy hajszállal vagy csak néhány atomnyival. A sűrűségfüggvénnyel tetszőleges intervallum valószínűsége meghatározható, így a nullaszor végtelen probléma megkerülhető.

Definíció[szerkesztés]

A sűrűségfüggvény definiálható valószínűségeloszlás alapján, vagy pedig a valószínűségeloszlást lehet levezetni a sűrűségfüggvényből.

Az önálló definícióban szerepel az $f\colon \mathbb {R} \to \mathbb {R}$ tulajdonság, a nemnegativitás, az integrálhatóság és a normáltság, azaz a teljes $\mathbb {R}$ -en vett integrál egy. Ekkor definiálható hozzá

P([a,b]):=\int _{a}^{b}f(x)\,\mathrm {d} x

valószínűségeloszlás.

Megfordítva, levezethető valószínűségi mértékből. Ekkor, ha az $f$ függvényre minden $a\in \mathbb {R}$ esetén

P((-\infty ,a])=\int _{-\infty }^{a}f(x)\,\mathrm {d} x

illetve

P(X\leq a)=\int _{-\infty }^{a}f(x)\,\mathrm {d} x

akkor $f$ sűrűségfüggvény.

Tulajdonságai[szerkesztés]

Létezés[szerkesztés]

Diszkrét eloszlású valószínűségi változóknak nincs sűrűségfüggvénye.
Sűrűségfüggvénye csak folytonos eloszlású valószínűségi változónak lehet.
Még a folytonos eloszlású valószínűségi változók közül sincs mindnek sűrűségfüggvénye, csak egy speciális osztályuknak, az abszolút folytonos valószínűségi változóknak, melyeket pontosan azzal a tulajdonsággal definiálunk, hogy van sűrűségfüggvényük.

Általános tulajdonságok[szerkesztés]

A definícióból nyilvánvalóan látszik, hogy

\int \limits _{-\infty }^{+\infty }f(t)\,dt=1

bármely sűrűségfüggvény esetén. Ám az is megmutatható, hogy egy tetszőleges f mérhető függvény pontosan akkor sűrűségfüggvény (vagyis pontosan akkor található hozzá olyan valószínűségi változó, melynek sűrűségfüggvénye) ha f(x) ≥ 0 majdnem mindenütt és a fenti tulajdonság teljesül rá.

A sűrűségfüggvény ismeretében több, a valószínűségi változóval kapcsolatos esemény valószínűsége megadható. Bármely A Borel-halmaz esetén

\mathbf {P} (X\in A)=\int \limits _{A}f(t)\,dt.

Speciálisan

\mathbf {P} (a\leq X<b)=\int \limits _{a}^{b}f(t)\,dt.

a két definíció egyenértékű.

Kapcsolat az eloszlásfüggvénnyel[szerkesztés]

Ha az $F$ eloszlásfüggvény folytonos, és legfeljebb megszámlálható végtelen pontban nem differenciálható, akkor van sűrűségfüggvénye, és:

F^{\prime }(x)={\frac {\mathrm {d} F(x)}{\mathrm {d} x}}=f(x)

Más jelöléssel, F '(x)=f(x), vagyis az eloszlásfüggvényből egyszerű deriválással kapjuk a sűrűségfüggvényt.

Vannak olyan eloszlások, mint a Cantor-eloszlás, amelyek eloszlásfüggvénye folytonos, és majdnem mindenütt differenciálható, de nincs sűrűségfüggvényük. A folytonos eloszlások eloszlásfüggvénye majdnem mindenütt differenciálható, de a derivált csak az abszolút folytonos részt foglalja magába.

Megfordítva, a sűrűségfüggvényből is kiszámítható az eloszlásfüggvény (abszolút folytonos) része:

F_{X}(x)=\int _{-\infty }^{x}f_{X}(t)\,\mathrm {d} t

F_{P}(x)=\int _{-\infty }^{x}f_{P}(t)\,\mathrm {d} t

ami azonnal következik a definícióból.

Sűrűségfüggvény részintervallumon[szerkesztés]

Ha egy $X$ valószínűségi változó csak egy $I$ részintervallumból vesz fel elemeket, akkor a sűrűségfüggvény választható úgy, hogy az $I$ intervallumon kívül a 0 értéket veszi fel. Erre példa az exponenciális eloszlás, ahol $I=[0,\infty [$ . Egy alternatív lehetőség az értelmezési tartomány leszűkítése, azaz $f\colon I\to \mathbb {R}$ definiálása. Ekkor az eloszlás sűrűségét az $I$ intervallumon adja meg a Lebesgue-mérték szerint.

Nemlineáris transzformáció[szerkesztés]

A nemlineáris $Y=g(X)$ transzformáció esetén

\operatorname {E} (Y)=\operatorname {E} (g(X))=\int _{-\infty }^{\infty }g(x)f(x)\,\mathrm {d} x

.

Konvolúció[szerkesztés]

Abszolút folytonos eloszlás esetén a valószínűségeloszlások konvolúciója visszavezethető a sűrűségfüggvények konvolúciójára. Ha $P,Q$ abszolút folytonos eloszlások az $f_{P}$ és $f_{Q}$ eloszlásfüggvényekkel, akkor : $f_{P*Q}=f_{P}*f_{Q}$ .

Itt $P*Q$ a $P$ és $Q$ konvolúciója, és $f*g$ az $f$ és $g$ konvolúciója. Tehát a konvolúció és a sűrűségfüggvény képzése felcserélhető.

Ez a tulajdonság közvetlenül átvihető független valószínűségi változók összegére. Legyenek $X,Y$ valószínűségi változók az $f_{X}$ és $f_{Y}$ sűrűségfüggvényekkel, ekkor

f_{X+Y}=f_{X}*f_{Y}

.

Tehát az összeg sűrűségfüggvénye megegyezik a tagok sűrűségfüggvényeinek konvolúciójával.

Példák[szerkesztés]

Az exponenciális eloszlás abszolút folytonos eloszlás, sűrűségfüggvénye

f_{\lambda }(x)={\begin{cases}\displaystyle \lambda \mathrm {e} ^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}

ahol $\lambda >0$ valós paraméter. Ha $\lambda >1$ , akkor az $x=0$ helyen 1-nél nagyobb értéket vesz fel. Az, hogy $f_{\lambda }(x)$ sűrűségfüggvény, adódik az exponenciális függvény elemi integrációs szabályából, a nemnegativitás közvetlenül következik a hatványozás szabályaiból, és az integrálhatóság is bizonyítható.

A véges intervallumon egyenletes eloszlásnak is van sűrűségfüggvénye, például a $[0,1]$ intervallumon. Az általa megadott valószínűség

P([a,b])=b-a

, ha

a\leq b

és

a,b\in [0,1]

Az intervallumon kívüli események valószínűsége nulla. Az $f$ sűrűségfüggvény megfelel az

\int _{a}^{b}f(x)\,\mathrm {d} x=P([a,b])=b-a

feltételeknek. Az $f(x)=1$ alkalmas függvény, amit a $[0,1]$ intervallumon kívül nulla folytat az integrálhatóság kedvéért. Ezzel a folytonos egyenletes eloszlás sűrűségfüggvénye:

f(x)={\begin{cases}\displaystyle 1&{\text{ ha }}x\in [0,1]\\0&{\text{ egyébként }}\end{cases}}

Egy másik megfelelő függvény:

f(x)={\begin{cases}\displaystyle 1&{\text{ ha }}x\in (0,1)\\0&{\text{ egyébként }}\end{cases}}

A két függvény egy Lebesgue-nullmértékű halmazon különbözik csak, és mindkettő megfelel a követelményeknek. Mivel egy tetszőleges pontban meg lehet változtatni az értéket, azért egy valószínűségeloszlásnak legalább kontinuum sok sűrűségfüggvénye van. Az integrálok értéke nem változik, tehát a módosított sűrűségfüggvény is sűrűségfüggvény marad.

Megjegyzések a definícióhoz[szerkesztés]

Szigorúan véve a definícióban egy $\lambda$ Lebesgue-mérték szerinti integrál szerepel, amit úgy kellene jelölni, hogy $\mathrm {d} \lambda (x)$ . Többnyire azonban a Riemann-integrál is megfelel, emiatt szoktak a definícióban $\mathrm {d} x$ integrált írni. A különbséget az jelenti, hogy a Riemann-integrálnak nincs mértékelméleti háttere, míg a Lebesgue-integrálnak van.

A német szakirodalom meg is különbözteti a két eljárást. Amiből a valószínűségeloszlást származtatják, az a Wahrscheinlichkeitsdichte, a másik a Verteilungsdichte.^[1]

Létezés és egyértelműség[szerkesztés]

Valószínűségeloszlásból származtatva[szerkesztés]

A valószínűségeloszlással definiált esetben a $P$ valószínűségi mértékből származik a valószínűségeloszlás. A normáltságból következik $P(\mathbb {R} )=1$ . Mivel a valószínűségek nem lehetnek negatívak, a függvény sehol se negatív. a σ-additív tulajdonság következik a majorált konvergencia tételéből, a sűrűségfüggvénnyel mint majoránssal és az

f_{n}:=\sum _{i=1}^{n}f\chi _{A_{i}}

függvénysorozattal, ahol az $A_{i}$ halmazok páronként diszjunktak, és $\chi _{A}$ az $A$ halmaz karakterisztikus függvénye.

Az egyértelműség következik a mérték egyértelműségének tételéből, és a Borel-σ-algebra generátorainak metszetstabil tulajdonságából, ami itt a zárt intervallumok.

A másik definíció alapján[szerkesztés]

A Radon-Nikodým-tétellel belátható, hogy adott valószínűségeloszláshoz létezik sűrűségfüggvény:

Ha

P

valószínűségeloszlás, akkor akkor és csak akkor van sűrűségfüggvénye, ha abszolút folytonos a

\lambda

Lebesgue-mértékre. Ez azt jelenti, hogy ha

\lambda (A)=0

, akkor

P(A)=0

.

Ez nem zárja ki, hogy több sűrűségfüggvény létezik, de mindegyik csak Lebesgue-nullmértékű halmazon különbözik a többitől, azaz majdnem mindenütt egyenlőek.

Emiatt a diszkrét valószínűségeloszlásoknak nincs sűrűségfüggvénye, mivel egy alkalmas $k\in \mathbb {R}$ elemre mindig teljesül, hogy $P(\{k\})>0$ . Ezeknek a ponthalmazoknak azonban a Lebesgue-mértéke nulla, vagyis a diszkrét valószínűségeloszlások nem abszolút folytonosak.

A valószínűségek számítása[szerkesztés]

Alapok[szerkesztés]

Adva legyen az $f$ sűrűségfüggvény, ekkor az $[a,b]$ intervallum valószínűsége

P(X\in [a,b])=\int _{a}^{b}f(x)\,\mathrm {d} x

.

Itt mindegy, hogy az intervallum zárt-e, vagy nyílt, félig nyílt, mivel a folytonos valószínűségi változók esetén egy pont valószínűsége nulla. Formálisan,

\forall x\in \mathbb {R} \colon \,P(X=x)=0

P(a\leq X\leq b)=P(a<X\leq b)=P(a\leq X<b)=P(a<X<b)

Bonyolultabb halmazok esetén az egyes intervallumokon vett integrálokat kell összeadni. Ekkor a képlet

P(X\in A)=\int _{A}f(x)\,\mathrm {d} x

.

Alkalmazható a σ-additivitás is, ami azt jelenti, hogy a $A_{1},A_{2},A_{3}\dotsc$ páronként diszjunkt intervallumok, és

A=\bigcup _{i=1}^{\infty }A_{i}

az összes egyesítése, akkor

P(A)=P\left(\bigcup _{i=1}^{\infty }A_{i}\right)=\sum _{i=1}^{\infty }\int _{a_{i}}^{b_{i}}f(x)\,\mathrm {d} x

.

ahol $A_{i}=(a_{i},b_{i})$ . Ez érvényes véges sok és végtelen számú intervallumra. Diszjunkt intervallumok valószínűsége összeadódik.

Példa[szerkesztés]

Egy callcenterben két hívás között eltelt idő megközelítően exponenciális eloszlású. Legyen ennek paramétere $\lambda$ ! Ekkor a sűrűségfüggvény

f_{\lambda }(x)={\begin{cases}\displaystyle \lambda \mathrm {e} ^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}

.

Az x tengely beosztását a $\lambda$ paraméter határozza meg úgy, hogy $\lambda$ idő alatt várható értékben egy hívás fut be. Annak a valószínűsége, hogy a következő hívás egy és két időegység után következik be:

P(X\in [1,2])=\int _{1}^{2}\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=\left[-\mathrm {e} ^{-\lambda x}\right]_{1}^{2}=-\mathrm {e} ^{-2\lambda }+\mathrm {e} ^{-\lambda }

.

Tegyük fel, hogy egy munkatárs öt időegység hosszú szünetet tart! Annak a valószínűsége, hogy közben nem érkezik hívás, egyenlő azzal a valószínűséggel, hogy a következő hívásig öt vagy több időegység telik el. Ennek valószínűsége

P(X\geq 5)=1-P(X\leq 5)=1-\int _{0}^{5}\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=1-\left[-\mathrm {e} ^{-\lambda x}\right]_{0}^{5}=1-\left(-\mathrm {e} ^{-5\lambda }+1\right)=\mathrm {e} ^{-5\lambda }

Jellemző számadatok meghatározása[szerkesztés]

Egy valószínűségi változó jellemző számadatai közül több is megadható a valószínűségi változó sűrűségfüggvényének segítségével.

Módusz[szerkesztés]

Egy valószínűségeloszlás illetve valószínűségi változó módusza definiálható a sűrűségfüggvénnyel: Ahol a sűrűségfüggvénynek maximuma van, ott van a módusz. Formálisan, $x_{\text{mod}}\in \mathbb {R}$ akkor módusza az $f$ sűrűségfüggvényű valószínűségi változónak, ha az $x_{\text{mod}}$ hely lokális maximumhely.^[2] ez azt jelenti, hogy

van

\varepsilon >0

, hogy

f(x)\leq f(x_{\text{mod}})

minden

x\in (x_{\text{mod}}-\varepsilon ;x_{\text{mod}}+\varepsilon )

helyen.

Egy sűrűségfüggvénynek több lokális maximumhelye is lehet, ekkor az eloszlás bimodális vagy multimodális. Az egyenletes eloszlás esetén minden hely módusz.

Medián[szerkesztés]

A mediánt rendszerint az eloszlásfüggvénnyel és kvantilisekkel definiálják. Abszolút folytonos eloszlás mediánja számítható sűrűségfüggvénnyel: $x_{\text{med}}$ az eloszlás vagy a valószínűségi változó mediánja, ha:

\int _{-\infty }^{x_{\text{med}}}f(x)\,\mathrm {d} x={\frac {1}{2}}

és

\int _{x_{\text{med}}}^{+\infty }f(x)\,\mathrm {d} x={\frac {1}{2}}

Folytonosság miatt $x_{\text{med}}$ mindig létezik, de az egyértelműség nem garantált, például csak két diszjunkt intervallum unióján nullától különböző értékeket felvevő szimmetrikus sűrűségfüggvény esetén.

Várható érték[szerkesztés]

Ha az $X$ valószínűségi változó sűrűségfüggvénye $f_{X}$ , akkor $X$ várható értéke:

\operatorname {E} (X)=\int _{-\infty }^{+\infty }xf_{X}(x)\,\mathrm {d} x

,

ha az integrál konvergens. Ha nem konvergens, akkor a valószínűségi változónak nincs várható értéke.

Szórásnégyzet és szórás[szerkesztés]

Ha az $X$ valószínűségi változó sűrűségfüggvénye $f_{X}$ , és várható értéke $\mu =\operatorname {E} (X)$ , akkor $X$ szórásnégyzete

\operatorname {Var} (X)=\operatorname {E} \left((X-\mu )^{2}\right)=\int _{-\infty }^{+\infty }(x-\mu )^{2}f_{X}(x)\,\mathrm {d} x

.

Vagy az eltolási tétellel:

\operatorname {Var} (X)=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}=\int _{-\infty }^{\infty }x^{2}f_{X}(x)\,\mathrm {d} x-\mu ^{2}

.

Ezek a képletek csak akkor használhatók, ha az integrálok konvergensek. A szórás a szórásnégyzetből számítható gyökvonással, de sokszor elég a szórásnégyzetet használni.

Magasabb momentumok, ferdeség és lapultság[szerkesztés]

A fent leírt nemlineáris transzformáció felhasználásával közvetlenül kiszámíthatók a további momentumok. Így ha az $X$ valószínűségi változó sűrűségfüggvénye $f_{X}$ , akkor:

m_{k}=\int _{-\infty }^{+\infty }x^{k}f_{X}(x)\,\mathrm {d} x

és a k-adik abszolút momentum

M_{k}=\int _{-\infty }^{+\infty }|x|^{k}f_{X}(x)\,\mathrm {d} x

.

Ha $X$ várható értéke $\mu$ , akkor a centrális momentumok:

\mu _{k}=\int _{-\infty }^{+\infty }(x-\mu )^{k}f_{X}(x)\,\mathrm {d} x

és az abszolút centrális momentumok:

{\overline {\mu }}_{k}=\int _{-\infty }^{+\infty }|x-\mu |^{k}f_{X}(x)\,\mathrm {d} x

.

Példa[szerkesztés]

Példaként tekintsük az exponenciális eloszlást:

f_{\lambda }(x)={\begin{cases}\displaystyle \lambda \mathrm {e} ^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}

ahol $\lambda >0$ paraméter!

Az exponenciális eloszlásnak mindig módusza a nulla. A $(-\infty ,0)$ intervallumon a sűrűségfüggvény konstans nulla, és az $[0,+\infty )$ intervallumon szigorúan monoton csökken, így a 0 helyen lokális maximum van. A monotóniából következik, hogy nincs több lokális maximum, a módusz egyértelmű.

A centrális momentumokból meghatározható a ferdeség és a lapultság.

A medián meghatározásához elég a $[0,\infty )$ félegyenesen integrálni, mivel a negatív számokon a függvény értéke konstans nulla:

\int _{0}^{c}\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=\left[-\mathrm {e} ^{-\lambda x}\right]_{0}^{c}=-\mathrm {e} ^{-\lambda c}+1\;{\stackrel {!}{=}}\;{\frac {1}{2}}

.

Rövid számolással

c={\frac {\ln 2}{\lambda }}

.

Ez teljesíti a mediánra vonatkozó második egyenlőséget is, tehát valóban medián.

A várható érték meghatározható parciális integrállal:

\operatorname {E} (X)=\int _{0}^{+\infty }x\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=\left[-xe^{-\lambda x}\right]_{0}^{+\infty }-\int _{0}^{+\infty }-e^{-\lambda x}\,\mathrm {d} x=\left[{\tfrac {1}{-\lambda }}e^{-\lambda x}\right]_{0}^{+\infty }={\frac {1}{\lambda }}

.

A parciális integrál kétszeri alkalmazásával számítható a szórásnégyzet is.

További példák[szerkesztés]

Legyen most az $f(x)$ sűrűségfüggvény $f(x)=3x^{2}$ , ha $x\in [0,1]$ ; $f(x)=0$ ha $x<0$ ; és $f(x)=0$ ha $x>1$ ! Ekkor $f\colon \mathbb {R} \to \mathbb {R}$ valóban sűrűségfüggvény, mivel nemnegatív teljes $\mathbb {R}$ -en, továbbá

\int _{-\infty }^{\infty }f(x)\,\mathrm {d} x=\int _{0}^{1}3x^{2}\,\mathrm {d} x=1

.

Minden $x\in [0,1]$ esetén:

F(x)=\int _{-\infty }^{x}f(t)\,\mathrm {d} t=\int _{0}^{x}3t^{2}\,\mathrm {d} t=x^{3}

Az eloszlásfüggvény

F_{X}(x)={\begin{cases}0&{\text{ ha }}x<0\\x^{3}&{\text{ ha }}0\leq x\leq 1\\1&{\text{ ha }}x>1\end{cases}}

Ha $X$ valószínűségi változó, aminek sűrűségfüggvénye $f$ , akkor például

P\left(X\leq {\tfrac {1}{2}}\right)=F\left({\tfrac {1}{2}}\right)={\tfrac {1}{8}}

.

Az $X$ változó várható értéke

\operatorname {E} (X)=\int _{-\infty }^{\infty }xf(x)\,\mathrm {d} x=\int _{0}^{1}3x^{3}\,\mathrm {d} x={\frac {3}{4}}

.

Többdimenziós sűrűségfüggvény[szerkesztés]

Többdimenziós valószínűségi változókra is definiálható sűrűségfüggvény, ha eloszlásuk abszolút folytonos. Legyen az $X$ valószínűségi vektorváltozó $\mathbb {R} ^{n}$ értékű; ekkor $f\colon \mathbb {R} ^{n}\to [0,\infty )$ az $X$ (Lebesgue-mérték szerinti) sűrűségfüggvénye, ha

P(X\in A)=\int _{A}f(x)\,\mathrm {d} ^{n}x

minden $A\in {\mathcal {B}}(\mathbb {R} ^{n})$ Borel-halmazra.

Speciálisan, az $n$ dimenziós $I=[a_{1},b_{1}]\times \dotsb \times [a_{n},b_{n}]$ intervallumokra, ahol $a_{1}<b_{1},\dotsc ,a_{n}<b_{n}$ valós számok:

P(X\in I)=\int _{a_{n}}^{b_{n}}\dotsi \int _{a_{1}}^{b_{1}}f(x_{1},\dotsc ,x_{n})\ \mathrm {d} x_{1}\dotso \mathrm {d} x_{n}

.

Valószínűségi vektorváltozóknak is definiálható eloszlásfüggvény. Itt $F(x)=P(X\leq x)$ , ahol az egyenlőtlenség komponensenként értendő. Ekkor $F$ az $\mathbb {R} ^{n}$ teret a [0,1] intervallumra képezi úgy, hogy

F(x_{1},\dotsc ,x_{n})=\int _{-\infty }^{x_{n}}\dotsi \int _{-\infty }^{x_{1}}f(t_{1},\dotsc ,t_{n})\ \mathrm {d} t_{1}\dotso \mathrm {d} t_{n}

.

Ha $F$ n-szer folytonosan differenciálható, akkor a sűrűségfüggvény parciális differenciálással megkapható:

f(x_{1},x_{2},\dotsc ,x_{n})={\frac {\partial ^{n}F(x_{1},x_{2},\dotsc ,x_{n})}{\partial x_{1}\dotso \partial x_{n}}}.

Az $X_{i}$ komponensek $f_{i}$ sűrűségfüggvényei a peremeloszlások többi komponens szerinti integrálásával kaphatók.

Továbbá: Ha $X=(X_{1},\dotsc X_{n})$ $\mathbb {R} ^{n}$ értékű sűrűségfüggvényes valószínűségi vektorváltozó, akkor a következők ekvivalensek:

Az $X$ sűrűségfüggvényének alakja $f(x_{1},\dotsc ,x_{n})=f_{1}(x_{1})\cdot \ldots \cdot f_{n}(x_{n})$ , ahol $f_{i}$ az $X_{i}$ sűrűsége.
Az $X_{1},\dotsc ,X_{n}$ valószínűségi változók függetlenek.

Becslés diszkrét adatok alapján[szerkesztés]

Folytonosnak tekintett eloszlásból származó, de diszkréten mért adatok, például testmagasság centiméterben mérve reprezentálhatók gyakorisági sűrűségfüggvényként. Magsűrűségbecslőkkel a sűrűségfüggvény folytonos függvénnyel becsülhető. Az ehhez használt magnak a mérési hibához kell alkalmazkodnia.

Legyen $X_{a}$ approximáló véletlen változó, az $x_{i}$ jellemző mennyiségekkel és $p_{i}$ valószínűségekkel. Az $X_{a}$ diszkrét approximáló valószínűségi változó határátmenete az $X$ folytonos valószínűségi változóba valószínűségi hisztogrammal modellezhető. Ehhez $X$ lehetséges értékeit a $[c_{i-1},c_{i}]$ szakaszokra osztujk fel. Ezek a $\Delta x_{i}$ hosszú intervallumok és a hozzájuk tartozó $x_{i}$ osztályközepek a sűrűségfüggvény approximációját szolgálják, szemléletesen a valószínűségi hisztogrammal, ami az osztályközepekre emelt $p_{i}=f(x_{i})\Delta x_{i}$ téglalapokból áll. Kis $\Delta x_{i}$ esetén $X_{a}$ felfogható a folytonos $X$ valószínűségi változó approximációjaként. Minél rövidebbek a $[c_{i-1},c_{i}]$ szakaszok, annál jobban közelíti $X_{a}$ a folytonos $X$ valószínűségi változót. Az $\Delta x_{i}\rightarrow 0$ határátmenet minden intervallumra a következőhöz vezet:^[3]

a szórásnégyzet esetén

\sum _{i}(x_{i}-\mu )^{2}f(x_{i})\Delta x_{i}\longrightarrow \int _{\mathbb {R} }(x-\mu )^{2}f(x)\,\mathrm {d} x\quad

a várható érték esetén

\sum _{i}x_{i}f(x_{i})\Delta x_{i}\longrightarrow \int _{\mathbb {R} }xf(x)\,\mathrm {d} x

.

A sűrűségfüggvény általánosítása[szerkesztés]

Létezik a matematikai statisztikában a sűrűségfüggvénynek egy általánosítása, az általánosított sűrűségfüggvény, mely a valószínűségi mező egy általánosításán, a statisztikai mezőn értelmezett, s definíciójában olyan mély mértékelméleti eszközöket használ, mint a Radon–Nikodym-derivált. Általánosított sűrűségfüggvénye minden valószínűségi változónak van, s abszolút folytonos esetben a sűrűségfüggvénnyel, míg diszkrét esetben a P függvénnyel azonos.

Jegyzetek[szerkesztés]

↑ Georgii: Stochastik. 2009, S. 19, 24.
↑ A.V. Prokhorov: Mode
↑ L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 262 ff.

Források[szerkesztés]

Bognár J.-né – Mogyoródi J. – Prékopa A. – Rényi A. – Szász D. (2001): Valószínűségszámítási feladatgyűjtemény. Typotex Kiadó, Budapest.
Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen.
Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest.
Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. de Gruyter Lehrbuch, Berlin 2009, ISBN 978-3-11-021526-7.
Norbert Henze: Stochastik für Einsteiger. 7. Auflage. Vieweg Verlag, Wiesbaden 2008, ISBN 978-3-8348-0423-5.
Achim Klenke: Wahrscheinlichkeitstheorie. 2. Auflage. Springer-Verlag, ISBN 978-3-540-76317-8.
Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 12. Auflage. Springer-Verlag, Berlin / Heidelberg 2006, ISBN 978-3-540-32160-6.
N.G. Ushakov: Density of a probability distribution
Weisstein, Eric W.: Probability Density Function (angol nyelven). Wolfram MathWorld

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Wahrscheinlichkeitsdichtefunktion című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Matematikaportál • összefoglaló, színes tartalomajánló lap

[1] Georgii: Stochastik. 2009, S. 19, 24.

[EncycloMath1-2] A.V. Prokhorov: Mode

[3] L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 262 ff.

[1]

[2]

[3]