Pareto-eloszlás

A Wikipédiából, a szabad enciklopédiából

A Pareto-eloszlás folytonos, félig végtelen intervallumú eloszlás [0,∞), mely számos szociális, tudományos, geofizikai és biztosítási területen alkalmazható, illetve jellemző az ezeken a területeken tapasztalt jelenségekre. A közgazdaságtan területén kívül időnként Bradford-eloszlásnak nevezik. A Pareto-eloszlás Vilfredo Pareto (1848 – 1923) olasz mérnök, szociológus, közgazdász és filozófusról kapta a nevét.

Alkalmazása[szerkesztés | forrásszöveg szerkesztése]

Pareto eredetileg ezt az eloszlást egy társadalmi jelenségre alkalmazta.

Pareto azt állította, hogy a megtermelt javak közel 80%-a a társadalom 20%-ához kerül a társadalomra jellemző vagyonelosztás során.[1].[2]

Az elméletét a keresetek eloszlására is alkalmazta.

Ezt az elképzelést egyszerűbben az úgynevezett Pareto-elv fejezi ki, vagy más néven a “80-20-as szabály”,mely azt mondja, hogy a lakosság 20%-a befolyásolja a népesség 80%-nak a vagyonát. Megjegyzendő, hogy a 80-20-as szabály csak bizonyos α értékek mellett érvényes. A korabeli angol adatok szerint a lakosság 30%-a rendelkezik a bevételek 70%-val. A valószínűség sűrűségfüggvényen látható, hogy a lakosság tört része, mely személyre vetítve birtokolja a vagyon kis részét, illetve ennek nagy a valószínűsége, majd egyenletesen csökken, ahogy a vagyon nő. (meg kell jegyezni, hogy a Pareto-eloszlás nem nyújt teljesen reális képet az alsó végen).

Az eloszlás nem korlátozódik csak a lakosság vagyoni eloszlására, a következő esetekben is közelítően alkalmazható a Pareto-eloszlás:

  • Települések eloszlása (kevés város, sok falu/kis település) )[3]
  • Internet forgalom eloszlása (sok kicsi fájl, kevesebb nagy fájl)
  • Merevlemezek hibarátája[4]
  • Bose-Einstein-féle sűrűsödés az abszolút zéró közelében
  • Olajmezők eloszlása
  • Meteoritok mérete
  • Homokszemcsék mérete
  • Erdőtüzek eloszlása
  • Meteorológiában:az évenkénti árvizek és nagy csapadékok eloszlása/valószínűsége

Meghatározás[szerkesztés | forrásszöveg szerkesztése]

Valószínűség sűrűség eloszlás
Kumulatív eloszlás függvény

Ha X a Pareto-eloszlás (I. Tip) valószínűségi változója,[5] , akkor annak valószínűsége, hogy X nagyobb, mint x, azaz a túlélési függvény (farok függvénynek is hívják):

\overline{F}(x) = \Pr(X>x) = \begin{cases}
\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & \text{for }x\ge x_\mathrm{m}, \\
1 & \text{for } x < x_\mathrm{m}.
\end{cases}

ahol xm a minimálisan lehetséges (pozitív) értéke X-nek, és α egy pozitív paraméter. Az I. típusú Pareto-eloszlást a xm skálaparaméter, és a α paraméter jellemzi, mely farok indexként is ismert. Abban az esetben, amikor a Pareto-eloszlást a gazdagság eloszlására használják, akkor az α paramétert Pareto-indexnek hívják.

Tulajdonságok[szerkesztés | forrásszöveg szerkesztése]

Kumulatív eloszlás függvény[szerkesztés | forrásszöveg szerkesztése]

A Pareto-eloszlás kumulatív eloszlás függvénye α és xm paraméterekkel:

F_X(x) = \begin{cases}
1-\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & \text{for } x \ge x_\mathrm{m}, \\
0 & \text{for }x < x_\mathrm{m}.
\end{cases}

Ha lineáris koordináta-rendszerben ábrázoljuk, akkor az eloszlás az ismerős J alakú görbét mutatja, mely aszimptotikusan közelít mindkét végén. Log-log koordináta-rendszerben ábrázolva egyenes vonal adódik.

Valószínűség sűrűség függvény[szerkesztés | forrásszöveg szerkesztése]

f_X(x)= \begin{cases} \alpha\,\dfrac{x_\mathrm{m}^\alpha}{x^{\alpha+1}} & \text{for }x \ge x_\mathrm{m}, \\[12pt] 0 & \text{for } x < x_\mathrm{m}. \end{cases}

Momentum és a karakterisztikus függvény[szerkesztés | forrásszöveg szerkesztése]

A Pareto-eloszlást követő valószínűségi változó várható értéke:

E(X)= \begin{cases} \infty & \text{if }\alpha\le 1 \\ \frac{\alpha x_\mathrm{m}}{\alpha-1} & \text{if }\alpha>1 \end{cases}.

A szórásnégyzet:

\mathrm{Var}(X)= \begin{cases} \infty & \text{if }\alpha\in(1,2] \\ \left(\frac{x_\mathrm{m}}{\alpha-1}\right)^2 \frac{\alpha}{\alpha-2} & \text{if }\alpha>2 \end{cases}.

(Ha \alpha\le 1, a szórásnégyzet nem létezik). A momentum:

\mu_n'= \begin{cases} \infty & \text{if }\alpha\le n \\ \frac{\alpha x_\mathrm{m}^n}{\alpha-n} & \text{if }\alpha>n \end{cases}.

A momentum generáló függvény csak nem pozitív értékekre definiálható (t≤0 ):

M\left(t,\alpha,x_\mathrm{m}\right) = E(e^{tX}) = \alpha(-x_\mathrm{m} t)^\alpha\Gamma(-\alpha,-x_\mathrm{m} t)\text{ and }M\left(0,\alpha,x_\mathrm{m}\right)=1.\,

A karakterisztikus függvény:

\varphi(t;\alpha,x_\mathrm{m})=\alpha(-ix_\mathrm{m} t)^\alpha\Gamma(-\alpha,-ix_\mathrm{m} t),
ahol Γ(ax) az inkomplett gamma függvény.


Geometrikus várható érték[szerkesztés | forrásszöveg szerkesztése]

A geometrikus várható érték (G): [6]

 G = x_m \exp( 1 / \alpha )

Harmonikus várható érték[szerkesztés | forrásszöveg szerkesztése]

A harmonikus várható érték (H):[6]

 H = x_m ( 1 + \frac{ 1 }{ \alpha } )

Kapcsolat más eloszlásokkal[szerkesztés | forrásszöveg szerkesztése]

Exponenciális eloszlás[szerkesztés | forrásszöveg szerkesztése]

A Pareto-eloszlás a következő módon kapcsolódik az exponenciális eloszláshoz: Ha X is Pareto-eloszlású minimum xm és index α, paraméterekkel, akkor:

 Y = \log\left(\frac{X}{x_\mathrm{m}}\right)

akkor exponenciális eloszlású α intenzitással.

Hasonlóan, ha Y exponenciális eloszlású α intenzitással, akkor

 x_\mathrm{m} e^Y \,

Pareto-eloszlású, minimum xm és index α paraméterekkel.

Lognormális eloszlás[szerkesztés | forrásszöveg szerkesztése]

A Pareto-eloszlás és a log-normális eloszlás egymásnak alternatív eloszlásai a hasonló tipusú mennyiségek esetén. A kettő közötti kapcsolatra jellemző, hogy mindkét esetben a változók eloszlása exponenciális, más paraméterek mellett.

Zipf-eloszlás[szerkesztés | forrásszöveg szerkesztése]

Míg a Pareto-eloszlás folytonos eloszlás, a Zipf-eloszlást szokták Zéta-eloszlásnak is hívni, és a Pareto-eloszlás diszkrét változatának.

Szimmetrikus Pareto-eloszlás[szerkesztés | forrásszöveg szerkesztése]

A szimmetrikus Pareto-eloszlást a sűrűség függvénnyel definiálhatjuk: [7]

f(x;\alpha,x_\mathrm{m}) = \begin{cases}
(\alpha x_\mathrm{m}^\alpha/2) |x|^{-\alpha-1} & \text{for }|x|>x_\mathrm{m} \\
0 & \text{egyébként}.
\end{cases}

A Pareto-eloszlással hasonló formája van x > x_\mathrm{m} esetben, és az y tengelyre tükörszimmetrikus.

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • M. O. Lorenz: Methods of measuring the concentration of wealth. (hely nélkül): Publications of the American Statistical Association 9 (70). 1905. 209–219. o.  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. Pareto, Vilfredo, Cours d’Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Geneva, 1964, pages 299–345.
  2. For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
  3. Reed, William J., et al. (2004.). „The Double Pareto-Lognormal Distribution – A New Parametric Model for Size Distributions”. Communications in Statistics : Theory and Methods 33 (8), 1733–1753. o, 18 et seq.. o. Sablon:Citeseerx.  
  4. (2010. február 24.) „Understanding latent sector error and how to protect against them”. 8th Usenix Conference on File and Storage Technologies (FAST 2010). Hozzáférés ideje: 2010. szeptember 10. „We experimented with 5 different distributions (Geometric,Weibull, Rayleigh, Pareto, and Lognormal), that are commonly used in the context of system reliability, and evaluated their fit through the total squared differences between the actual and hypothesized frequencies (χ2 statistic). We found consistently across all models that the geometric distribution is a poor fit, while the Pareto distribution provides the best fit.” 
  5. Barry C. Arnold. Pareto Distributions. International Co-operative Publishing House (1983). ISBN 0-89974-012-X 
  6. ^ a b Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
  7. Grabchak, M. & Samorodnitsky, D.: Do Financial Returns Have Finite or Infinite Variance? A Paradox and an Explanation pp. 7–8

További információk[szerkesztés | forrásszöveg szerkesztése]