Variancia

A Wikipédiából, a szabad enciklopédiából

A variancia vagy szórásnégyzet a valószínűség-számításban az eloszlásokat jellemző egyik paraméter.[1]. A szórásnégyzet megmutatja, hogy egy valószínűségi változó milyen mértékben szóródik a várható értéktől (középérték), más szóval mennyire kenődik el. A szórásnégyzet az eloszlások egyik momentuma, gyakran használják ezt a paramétert a sokféle eloszlás megkülönböztetésére, valamint elméleti számításoknál.

A szórást és az abszolút eltérést egyaránt használják eloszlások jellemzésére. A szórás jobban jellemző, mint az abszolút eltérés, valamint együtt a szórásnégyzettel és a kovarianciával alkalmazzák az elméleti statisztikában. Az abszolút eltérés robosztusabb és kevésbé érzékeny a nagy eltérésekre, melyek mérési anomáliákból származnak. A szórásnégyzet a valószínűségi változó változásainak a mértéke, tekintetbe véve az összes lehetséges értéket és annak valószínűségeit.

Definíció[szerkesztés | forrásszöveg szerkesztése]

Ha egy X valószínűségi változó várható értéke (középértéke) μ = E[X], akkor az X szórásnégyzete, az X saját magával vett kovarianciája:


\begin{align}
\operatorname{Var}(X)
&= \operatorname{Cov}(X, X) \\
&= \operatorname{E}\left[(X - \mu) (X - \mu)\right] \\
&= \operatorname{E}\left[(X - \mu)^2 \right].
\end{align}

Azaz a szórásnégyzet a változó és a várható értéke közötti különbség négyzetének várható értéke. A kovariancia megfelelő kifejezéséből kiterjesztve:

\begin{align}
    \operatorname{Var}(X)
      &= \operatorname{Cov}(X, X) \\
      &= \operatorname{E}\left[X X\right] - \operatorname{E}[X] \operatorname{E}[X] \\
      &= \operatorname{E}\left[X^2 \right] - (\operatorname{E}[X])^2.
  \end{align}

A leggyakrabban használt levezetés a várható értékből:


\begin{align}
\operatorname{Var}(X) & = \operatorname{E}(X^2 - 2\,X\,\operatorname{E}(X) + (\operatorname{E}(X))^2) \\
& = \operatorname{E}(X^2) - 2(\operatorname{E}(X))^2 + (\operatorname{E}(X))^2 \\
& =\operatorname{E}(X^2) - (\operatorname{E}(X))^2.
\end{align}

Példa[szerkesztés | forrásszöveg szerkesztése]

Tekintsünk egy hatoldalú szabályos dobókockát. A dobás után a várható érték:

\frac 16(1+2+3+4+5+6)=3.5.

A várható abszolút eltérés (az azonosan valószínű abszolút eltérések várható értéke a középértéktől):

\frac 16(|1-3.5|+|2-3.5|+|3-3.5|+|4-3.5|+|5-3.5|+|6-3.5|)=\frac 16(2.5+1.5+ 0.5+0.5+1.5+2.5)=1.5.

A várható négyzetes eltérés, a szórásnégyzet:

\frac 16 (2.5^2+1.5^2+0.5^2+0.5^2+1.5^2+2.5^2)=17.5/6\approx 2.9.

Folytonos valószínűségi változó esete[szerkesztés | forrásszöveg szerkesztése]

Ha X egy folytonos valószínűségi változó f(x) sűrűségfüggvénnyel, akkor a szórásnégyzet egyenlő a második centrális momentummal:

\operatorname{Var}(X) =\sigma^2 =\int (x-\mu)^2 \, f(x) \, dx\, =\int x^2 \, f(x) \, dx\, - \mu^2

ahol \mu, a várható érték,

\mu = \int x \, f(x) \, dx\,

Az integrál határozott integrál. Ha a folytonos eloszlásnak nincs várható értéke, mint a Cauchy-eloszlás esetében, akkor szórásnégyzete sincs. Több más eloszlásnak sincs szórásnégyzete, ha nem létezik várható értéke.

Diszkrét valószínűségi változó esete[szerkesztés | forrásszöveg szerkesztése]

Ha X egy diszkrét valószínűségi változó, x1 ↦ p1, ..., xn ↦ pn, tömegfüggvénnyel, akkor

\operatorname{Var}(X) = \sum_{i=1}^n (p_i\cdot(x_i - \mu)^2) = \sum_{i=1}^n (p_i\cdot x_i^2) - \mu^2

ahol \mu, a várható érték:

\mu = \sum_{i=1}^n p_i\cdot x_i .

Exponenciális eloszlás[szerkesztés | forrásszöveg szerkesztése]

Az exponenciális eloszlás λ paraméterrel, egy folytonos eloszlás [0,∞) tartományban, a sűrűségfüggvénye:

f(x) = \lambda e^{-\lambda x},\,

a várható érték: μ = λ−1, és így a szórásnégyzet:

\int_0^\infty f(x) (x - \mu)^2\,dx = \int_0^\infty \lambda e^{-\lambda x} (x - \lambda^{-1})^2\,dx = \lambda^{-2}.\,

σ2 = μ2.

Főbb tulajdonságok[szerkesztés | forrásszöveg szerkesztése]

A szórásnégyzet nem lehet negatív:

\operatorname{Var}(X)\ge 0.

Egy állandó változó szórásnégyzete zéró, és ha a szórásnégyzet zéró, akkor 1 valószínűséggel állandó a változó:

P(X=a) = 1\Leftrightarrow \operatorname{Var}(X)= 0.

A szórásnégyzet invariáns a helyparaméter változásaira, ha egy állandót adunk hozzá a változóhoz, a szórásnégyzet nem változik:

\operatorname{Var}(X+a)=\operatorname{Var}(X).

Ha a változót megszorozzuk egy konstanssal, a szórásnégyzet a konstans négyzetével változik.

\operatorname{Var}(aX)=a^2\operatorname{Var}(X).

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Goodman, Leo A: On the exact variance of products. (hely nélkül): Journal of the American Statistical Association. 1960 708–713. o. ISBN 9789632790268  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York