Log-normális eloszlás

A Wikipédiából, a szabad enciklopédiából

A log-normális eloszlás egy folytonos valószínűség eloszlás, melyre az jellemző, hogy a valószínűségi változó logaritmusa normális eloszlású.

Ha X valószínűségi változó normális eloszlású, akkor Y=exp(X) log-normális eloszlású. Hasonlóképpen, ha Y log-normális eloszlású, akkor X=log(Y) normális eloszlású. A log-normális eloszlású valószínűségi változó csak pozitív valós értéket vehet fel. Ezt az eloszlást Galton-eloszlásnak is szokták hívni, Francis Galton után, továbbá más elnevezések is előfordulnak, mint például: McAlister, Gibrat és Cobb–Douglas.

A változókat log-normálisként modellezik, ha független valószínűségi változók többszörös szorzataként jellemezhetők.(Ezt igazolja a log-tartományra érvényes központi határérték elmélet).

Például, a drót nélküli távközlésben, az árnyékolás, és a lassú fading jelenség okozta jelveszteséget log-normális eloszlásúnak tekintik.

A log-normális eloszlás egy X valószínűségi változóra nézve maximális-entrópia típusú valószínűség eloszlású, ha várható értéke, és szórásnégyzete: \ln(X).[1]

μ és σ[szerkesztés | forrásszöveg szerkesztése]

Sűrűségfüggvény
Kumulatív eloszlás függvény

X valószínűségi változót jellemzi a μ és σ, a várható érték, és a szórás:

 X=e^{\mu+\sigma Z}

ahol Z egy standard normális változó. Az összefüggés igaz függetlenül attól, hogy a függvény logaritmikus vagy exponenciális.

Ha loga(Y) normális eloszlású, akkor logb(Y) is az, bármely pozitív számra. Hasonlóképpen, ha e^X normális eloszlású, akkor e^{log(a)X} is az, ahol a egy pozitív szám, és nem =1. Logaritmikus ábrázolásnál, a μ és σ-t helyparaméternek, illetve skálaparaméternek hívják.

Jellemzők[szerkesztés | forrásszöveg szerkesztése]

Sűrűségfüggvény[szerkesztés | forrásszöveg szerkesztése]

A valószínűség sűrűségfüggvény:

f_X(x;\mu,\sigma) = \frac{1}{x \sigma \sqrt{2 \pi}}\, e^{-\frac{(\ln x - \mu)^2}{2\sigma^2}},\ \ x>0 (Ez a változók cseréjének szabályából következik)

Kumulatív eloszlás függvény[szerkesztés | forrásszöveg szerkesztése]

F_X(x;\mu,\sigma) = \frac12 \operatorname{erfc}\!\left[-\frac{\ln x - \mu}{\sigma\sqrt{2}}\right] = \Phi\bigg(\frac{\ln x - \mu}{\sigma}\bigg),

Ahol erfc a komplementer hibafüggvény, és Φ a standard normális eloszlás kumulatív eloszlás függvénye.

Karakterisztikus függvény[szerkesztés | forrásszöveg szerkesztése]

A karakterisztikus függvény , E[e itX] több megjelenítése is ísmert. Az integrálja konvergál Im(t) ≤ 0. A legegyszerűbb, ha Taylor sorbafejtést alkalmazunk: \varphi(t) = \sum_{n=0}^\infty \frac{(it)^n}{n!}e^{n\mu+n^2\sigma^2/2}. A soros megjelenítés divergál, ha σ2 > 0. Ez azonban elegendő a karakterisztikus függvény kiszámolására pozitív \sigma esetén, amíg a szumma felső határértéke érvényes, n ≤ N, ahol

\max(|t|,|\mu|) \ll N \ll \frac{2}{\sigma^2}\ln\frac{2}{\sigma^2}

éa σ2 < 0.1.

Hely és skála paraméterek[szerkesztés | forrásszöveg szerkesztése]

A hely és skála paraméterek esetén könnyebben használható a mértani középérték, és a geometrikus szórás, mint az számtani középérték és a szórás.

Geometrikus momentumok[szerkesztés | forrásszöveg szerkesztése]

A log-normális eloszlás mértani közepe: e^{\mu}. Mivel a log-normális eloszlás logaritmusa szimmetrikus, és a kvantilisek monoton transzformáción megmaradnak, a mértani közepe (várható értéke) egyenlő a mediánnal. [2] A mértani közép (mg) levezethető az számtani középből (ma):

 m_g = m_ae^{-\tfrac{1}{2}\sigma^2}.

A mértani szórás: e^{\sigma}

Aritmetikai momentumok[szerkesztés | forrásszöveg szerkesztése]

Ha X log-normális eloszlású változó, akkor a várható értéke (E-számtani középérték), szórásnégyzete (Var), és szórása (s.d.):

\begin{align}
 & \operatorname{E}[X] = e^{\mu + \tfrac{1}{2}\sigma^2}, \\
 & \operatorname{Var}[X] = (e^{\sigma^2} - 1) e^{2\mu + \sigma^2} \\
 & \operatorname{s.d.}[X] = \sqrt{\operatorname{Var}[X]} = e^{\mu + \tfrac{1}{2}\sigma^2}\sqrt{e^{\sigma^2} - 1} .
 \end{align}

Ezzel ekvivalens módon, a μ és σ paraméterek megkaphatók, ha a várható érték és a szórásnégyzet ismert: \begin{align}
 \mu &= \ln(\mathrm{E}[X]) - \frac12 \ln\!\left(1 + \frac{\mathrm{Var}[X]}{(\mathrm{E}[X])^2}\right), \\
 \sigma^2 &= \ln\!\left(1 + \frac{\mathrm{Var}[X]}{(\mathrm{E}[X])^2}\right).
 \end{align} Bármely valós vagy komplex számra s, a log-normális X-re:

\operatorname{E}[X^s] = e^{s\mu + \tfrac{1}{2}s^2\sigma^2}.

A log-normális eloszlást nem határozzák meg kizárólagosan a momentumai E[Xk] k ≥ 1 esetre, azaz létezik néhány más eloszlás is hasonló momentumokkal az összes k-ra. Valójában egy nagy eloszlás család létezik hasonló momentumokkal, mint a log-normális eloszlás.

Módusz és medián[szerkesztés | forrásszöveg szerkesztése]

Középérték, medián, módusz, különböző ferdeségek esetén

A módusz a sűrűségfüggvény maximális pontja. Elsősorban megoldja a (ln ƒ)′ = 0 egyenletet:

\mathrm{Mode}[X] = e^{\mu - \sigma^2}.

The medián aza pont, ahol FX = 1/2:

\mathrm{Med}[X] = e^\mu\,.

Szórási tényező[szerkesztés | forrásszöveg szerkesztése]

\sqrt{e^{\sigma^2}\!\!-1}

Egyéb összefüggés[szerkesztés | forrásszöveg szerkesztése]

Egy adathalmaz, mely a log-normális eloszlásból származik, szimmetrikus Lorenz-görbe.[3] A harmonikus (H), mértani (G) és számtani (A) közép (várható érték) kapcsolódik egymáshoz;[4] és ez a kifejezés adja meg az összefüggést:

H = \frac{G^2}{ A} .

A log-normális eloszlások végtelenül oszthatók.

Alkalmazások[szerkesztés | forrásszöveg szerkesztése]

  • Biológia:
    • Élő szövetek méretei (hosszúság, súly, bőrfelület))[5]
    • Inaktív emberi testrészek hosszúság (haj, köröm, fogak)
    • egyes fiziológiás mérések (például : vérnyomás férfi/női populációnál)[6]
  • Hidrológia:[7]
    • Esőzési adatok (extrém értékek)
    • Folyó áradások adatai
  • Gazdaság:
    • A lakosság jövedelme 97–99%-a log-normális eloszlást mutat.[8]
  • Pénzügyek
  • Black-Scholes modell: átváltási ráták, árindexek, tőzsde mutatók [9]
  • Települések:
    • Városok mérete log-normális eloszlású
  • Megbízhatósági analízis:
    • Karbantartási idők meghatározásánál log-normális eloszlást is használnak
  • Drót nélküli kommunikáció:[10]
  • Mechanika:
    • Súrlódási tényezők számítása [11]

Irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Johnson, Norman L.; Kotz, Samuel; Balakrishnan, N: Lognormal Distributions", Continuous univariate distributions. (hely nélkül): New York: John Wiley & Sons. 1994.  
  • Leipnik, Roy B: On Lognormal Random Variables: I – The Characteristic Function", (hely nélkül): Journal of the Australian Mathematical Society Series B, 32. 1991.  

Kapcsolódó szócikkek[szerkesztés | forrásszöveg szerkesztése]

Források[szerkesztés | forrásszöveg szerkesztése]

  1. (2009.) „Maximum entropy autoregressive conditional heteroskedasticity model”. Journal of Econometrics, 219–230. o, Kiadó: Elsevier. Hozzáférés ideje: 2011. június 2.  
  2. Leslie E. Daly, Geoffrey Joseph Bourke (2000) Interpretation and uses of medical statistics Edition: 5. Wiley-Blackwell ISBN 0-632-04763-1, ISBN 978-0-632-04763-5 (page 89)
  3. (2000.) „Describing inequality in plant size or fecundity”. Ecology 81 (4), 1139–1142. o. DOI:[1139:DIIPSO2.0.CO;2 10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2].  
  4. name=Rossman1990>Rossman LA (1990) "Design stream flows based on harmonic means". J Hydraulic Engineering ASCE 116 (7) 946–950
  5. Huxley, Julian S.. Problems of relative growth. London (1932). ISBN 0-486-61114-0. OCLC 476909537 
  6. Makuch, Robert W., D.H. Freeman, M.F. Johnson (1979.). „Justification for the lognormal distribution as a model for blood pressure”. Journal of Chronic Diseases 32 (3), 245–250. o. DOI:(http://www.sciencedirect.com/science/article/pii/0021968179900705 10.1016/0021-9681(79)90070-5. (http://www.sciencedirect.com/science/article/pii/0021968179900705. Hozzáférés ideje: 2012. február 27.  
  7. Ritzema (ed.), H.P.. Frequency and Regression Analysis. Chapter 6 in: Drainage Principles and Applications, Publication 16, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands, 175–224. o (1994). ISBN 90-70754-33-9 
  8. Clementi, F.; Gallegati, M. (2005) "Pareto's law of income distribution: Evidence for Germany, the United Kingdom, and the United States", EconWPA
  9. Black, Fischer and Myron Scholes, "The Pricing of Options and Corporate Liabilities", Journal of Political Economy, Vol. 81, No. 3, (May/June 1973), pp. 637–654.
  10. http://wireless.per.nl/reference/chaptr03/shadow/shadow.htm [halott link]
  11. doi:10.1016/j.ress.2007.09.005
    This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand