„Medián” változatai közötti eltérés

A Wikipédiából, a szabad enciklopédiából
[ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Luckas-bot (vitalap | szerkesztései)
a Bot: következő hozzáadása: io:Mediano
DeniBot (vitalap | szerkesztései)
a kisebb formai javítások
1. sor: 1. sor:
A '''medián''' a [[matematikai statisztika]] egy nevezetes [[középérték]]e. A medián a [[kvantilisek]] közül a legegyszerűbb, vagyis [[statisztika]]i sokaságot kétfelé vágó érték. Ahhoz, hogy mediánt számíthassunk a populáció egy ismérvére vonatkozóan, az ismérvnek legalább számértékű, ordinális [[mérési szint]]űnek kell lennie.
A '''medián''' a [[matematikai statisztika]] egy nevezetes [[középérték]]e. A medián a [[kvantilisek]] közül a legegyszerűbb, vagyis [[statisztika]]i sokaságot kétfelé vágó érték. Ahhoz, hogy mediánt számíthassunk a populáció egy ismérvére vonatkozóan, az ismérvnek legalább számértékű, ordinális [[mérési szint]]űnek kell lennie.


Az ''x'' valószínűségi változó mediánját <math>\tilde{x}</math> vagy <math>\mu_{1/2}(x)\,\!.</math> jelöli.<ref> http://mathworld.wolfram.com/StatisticalMedian.html </ref>
Az ''x'' valószínűségi változó mediánját <math>\tilde{x}</math> vagy <math>\mu_{1/2}(x)\,\!.</math> jelöli.<ref>http://mathworld.wolfram.com/StatisticalMedian.html</ref>


[[Véges]] sok elem (egy véges populáció) '''mediánján''' a következőt értjük:
[[Véges]] sok elem (egy véges populáció) '''mediánján''' a következőt értjük:
* Ha [[Páros és páratlan számok|páratlan]] elemszámú a sokaság, akkor a medián az értékek rendezett sokaságában a középső elem.
* Ha [[Páros és páratlan számok|páratlan]] elemszámú a sokaság, akkor a medián az értékek rendezett sokaságában a középső elem.
* Ha [[Páros és páratlan számok|páros]], akkor a rendezett [[minta]] két középső elemének [[számtani közép|számtani közepe]].
* Ha [[Páros és páratlan számok|páros]], akkor a rendezett [[minta]] két középső elemének [[számtani közép|számtani közepe]].


Érdemes megjegyezni, hogy páros sok tagú populáció mediánját néha úgy definiálják, hogy megadják külön az alsó és a felső mediánt, egyes szerzők szerint pedig a medián [[nem definiálható]] ilyen esetben.
Érdemes megjegyezni, hogy páros sok tagú populáció mediánját néha úgy definiálják, hogy megadják külön az alsó és a felső mediánt, egyes szerzők szerint pedig a medián [[nem definiálható]] ilyen esetben.
14. sor: 14. sor:
::{|
::{|
|1||2||5||4||3||1||4||3||3||4||3||5||1
|1||2||5||4||3||1||4||3||3||4||3||5||1
|}
|}
:A rendezett sokaság:
:A rendezett sokaság:
::{|
::{|
27. sor: 27. sor:
::{|
::{|
|1||4||2||4||2||3||5||3||1||1
|1||4||2||4||2||3||5||3||1||1
|}
|}
:A rendezett sokaság:
:A rendezett sokaság:
::{|
::{|
48. sor: 48. sor:


A medián [[minimáltulajdonság]]a: Ha x-nek létezik várható értéke, akkor az |x-c| várható értéke akkor minimális, ha c=μ (a medián): M(|x-c|)>=M(|x-μ|)
A medián [[minimáltulajdonság]]a: Ha x-nek létezik várható értéke, akkor az |x-c| várható értéke akkor minimális, ha c=μ (a medián): M(|x-c|)>=M(|x-μ|)
==Magasabb dimenzióban==
== Magasabb dimenzióban ==
A több dimenziós statisztikában az
A több dimenziós statisztikában az
:<math>E(\left|X-c\right|)</math>
:<math>E(\left|X-c\right|)</math>


minimalizáló ''c'' vektorát ''centroidnak'' is nevezik,<ref name="Centroid">{{Citation | last1=Carvalho | first1=Luis | last2=Lawrence | first2=Charles | title=Centroid estimation in discrete high-dimensional spaces with applications in biology | doi=10.1073/pnas.0712329105 | year=2008 | journal=Proc Natl Acad Sci U S A | volume=105 | issue=9 | pages=3209-3214}}</ref> ahol <math>E(\left|X-c\right|)</math> egy adott [[norma|normában]] értendő. Ez megfelel az egy dimenziós eset [[abszolútérték-függvény|abszolútértékének]]. A centroid szót azonban más jelentésben is használják.
minimalizáló ''c'' vektorát ''centroidnak'' is nevezik,<ref name="Centroid">{{Citation | last1=Carvalho | first1=Luis | last2=Lawrence | first2=Charles | title=Centroid estimation in discrete high-dimensional spaces with applications in biology | doi=10.1073/pnas.0712329105 | year=2008 | journal=Proc Natl Acad Sci U S A | volume=105 | issue=9 | pages=3209-3214}}</ref> ahol <math>E(\left|X-c\right|)</math> egy adott [[norma|normában]] értendő. Ez megfelel az egy dimenziós eset [[abszolútérték-függvény|abszolútértékének]]. A centroid szót azonban más jelentésben is használják.


Ha a centroidot az eloszlás egy leszűkítésére veszik, akkor ''medioidnak'' hívják. Ez a ponthalmaz származhat például egy másik eloszlásból.
Ha a centroidot az eloszlás egy leszűkítésére veszik, akkor ''medioidnak'' hívják. Ez a ponthalmaz származhat például egy másik eloszlásból.
==Alkalmazása==
== Alkalmazása ==
A kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem [[normális eloszlás]]okat, mint az átlag, vagy a [[várható érték]].
A kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem [[normális eloszlás]]okat, mint az átlag, vagy a [[várható érték]].


63. sor: 63. sor:
A képfeldolgozásban a [[monokróm]] [[bitkép]]eken gyakran látható egy zajféleség, amiben minden pixel a szomszédoktól függetlenül egy adott kis valószínűség szerint lesz fehér, egy hasonlóan kis valószínűséggel lesz fekete, és egy egyhez közeli valószínűséggel változatlan marad. Az efféle [[zaj]] jól csökkenthető az adott pixelből és szomszédjaiból (3 x 3-as négyzet) kapott medián használatával.
A képfeldolgozásban a [[monokróm]] [[bitkép]]eken gyakran látható egy zajféleség, amiben minden pixel a szomszédoktól függetlenül egy adott kis valószínűség szerint lesz fehér, egy hasonlóan kis valószínűséggel lesz fekete, és egy egyhez közeli valószínűséggel változatlan marad. Az efféle [[zaj]] jól csökkenthető az adott pixelből és szomszédjaiból (3 x 3-as négyzet) kapott medián használatával.


==Alternatívái==
== Alternatívái ==
A medián egy alternatívájaként Amartya Sen bevezette a jólléti függvényt a jövedelmek eloszlásának vizsgálatára.
A medián egy alternatívájaként Amartya Sen bevezette a jólléti függvényt a jövedelmek eloszlásának vizsgálatára.
==Általánosítása==
== Általánosítása ==
A medián helyett ''n''-kvantilisek is használhatók, amik az alapsokaságot ''n'' egyenlő részre osztják. A medián a második kvartilis, az ötödik decilis, és az ötvenedik percentilis.
A medián helyett ''n''-kvantilisek is használhatók, amik az alapsokaságot ''n'' egyenlő részre osztják. A medián a második kvartilis, az ötödik decilis, és az ötvenedik percentilis.


Néhány kvantilisnek latin eredetű önálló neve van:
Néhány kvantilisnek latin eredetű önálló neve van:
*3-kvantilisek: tercilisek
* 3-kvantilisek: tercilisek
*4-kvantilisek: kvartilisek
* 4-kvantilisek: kvartilisek
*5-kvantilisek: kvintilisek
* 5-kvantilisek: kvintilisek
*9-kvantilisek: nonilisek
* 9-kvantilisek: nonilisek
*10-kvantilisek: decilisek
* 10-kvantilisek: decilisek
*12-kvantilisek: duodecilisek
* 12-kvantilisek: duodecilisek
*20-kvantilisek: vigintilisek
* 20-kvantilisek: vigintilisek
*100-kvantilisek: percentilisek
* 100-kvantilisek: percentilisek


Általánosabban, az eloszlásfüggvény inverzét nevezik az adott eloszlás kvantilisfüggvényének.
Általánosabban, az eloszlásfüggvény inverzét nevezik az adott eloszlás kvantilisfüggvényének.


==Története==
== Története ==
Gustav Fechner népszerűsítette a medián használatát a formális adatelemzésben, bár korábban Laplace már használta.<ref name="keynesProb">Keynes, John Maynard; ''A Treatise on Probability'' (1921), Pt II Ch XVII §5 (p 201).</ref>
Gustav Fechner népszerűsítette a medián használatát a formális adatelemzésben, bár korábban Laplace már használta.<ref name="keynesProb">Keynes, John Maynard; ''A Treatise on Probability'' (1921), Pt II Ch XVII §5 (p 201).</ref>
== Lásd még ==
== Lásd még ==
89. sor: 89. sor:
{{források}}
{{források}}
* R.J. Serfling. ''Approximation Theorems of Mathematical Statistics''. John Wiley & Sons, 1980.
* R.J. Serfling. ''Approximation Theorems of Mathematical Statistics''. John Wiley & Sons, 1980.
* [http://www.universityofcalifornia.edu/senate/inmemoriam/georgewbrown.htm Brown, George W.] ”On Small-Sample Estimation.” ''The Annals of Mathematical Statistics'', Vol. 18, No. 4 (Dec., 1947), pp. 582&ndash;585.
* [http://www.universityofcalifornia.edu/senate/inmemoriam/georgewbrown.htm Brown, George W.] ”On Small-Sample Estimation.” ''The Annals of Mathematical Statistics'', Vol. 18, No. 4 (Dec., 1947), pp.&nbsp;582–585.
* [[Erich Leo Lehmann|Lehmann, E. L.]] “A General Concept of Unbiasedness” ''The Annals of Mathematical Statistics'', Vol. 22, No. 4 (Dec., 1951), pp. 587&ndash;592.
* [[Erich Leo Lehmann|Lehmann, E. L.]] “A General Concept of Unbiasedness” ''The Annals of Mathematical Statistics'', Vol. 22, No. 4 (Dec., 1951), pp.&nbsp;587–592.
* [[Allan Birnbaum]]. 1961. “A Unified Theory of Estimation, I”, ''The Annals of Mathematical Statistics'', Vol. 32, No. 1 (Mar., 1961), pp. 112&ndash;135
* [[Allan Birnbaum]]. 1961. “A Unified Theory of Estimation, I”, ''The Annals of Mathematical Statistics'', Vol. 32, No. 1 (Mar., 1961), pp.&nbsp;112–135
* van der Vaart, H. R. 1961. “Some Extensions of the Idea of Bias” ''The Annals of Mathematical Statistics'', Vol. 32, No. 2 (Jun., 1961), pp. 436&ndash;447.
* van der Vaart, H. R. 1961. “Some Extensions of the Idea of Bias” ''The Annals of Mathematical Statistics'', Vol. 32, No. 2 (Jun., 1961), pp.&nbsp;436–447.
* {{cite book|title=Parametric Statistical Theory | last1=Pfanzagl | first1=Johann
* {{cite book|title=Parametric Statistical Theory | last1=Pfanzagl | first1=Johann
|authorlink= <!-- Johann Pfanzagl -->
|authorlink= <!-- Johann Pfanzagl -->
|last2=with the assistance of R. Hamböker
|last2=with the assistance of R. Hamböker
|year=1994|
|year=1994|
|publisher=Walter de Gruyter
|publisher=Walter de Gruyter
102. sor: 102. sor:
{{csonk-dátum|csonk-mat|2005 februárjából}}
{{csonk-dátum|csonk-mat|2005 februárjából}}
{{Portál|matematika}}
{{Portál|matematika}}
==Külső linkek==
== Külső linkek ==
*Python-szkript [http://www.umverteilung.de/oei/#GiniHooverTheil a medián kiszámítására]
* Python-szkript [http://www.umverteilung.de/oei/#GiniHooverTheil a medián kiszámítására]
*[http://diegeodaeten.de/least-median-square.html Példa a medián robusztusságának kihasználására]
* [http://diegeodaeten.de/least-median-square.html Példa a medián robusztusságának kihasználására]


<!-->>Valszám>>Matstat-->
<!-->>Valszám>>Matstat-->


{{DEFAULTSORT:Median}}
{{DEFAULTSORT:Median}}

[[Kategória:Középértékek]]
[[Kategória:Középértékek]]
[[Kategória:Valószínűség-számítás]]
[[Kategória:Valószínűség-számítás]]

A lap 2010. augusztus 20., 20:15-kori változata

A medián a matematikai statisztika egy nevezetes középértéke. A medián a kvantilisek közül a legegyszerűbb, vagyis statisztikai sokaságot kétfelé vágó érték. Ahhoz, hogy mediánt számíthassunk a populáció egy ismérvére vonatkozóan, az ismérvnek legalább számértékű, ordinális mérési szintűnek kell lennie.

Az x valószínűségi változó mediánját vagy jelöli.[1]

Véges sok elem (egy véges populáció) mediánján a következőt értjük:

  • Ha páratlan elemszámú a sokaság, akkor a medián az értékek rendezett sokaságában a középső elem.
  • Ha páros, akkor a rendezett minta két középső elemének számtani közepe.

Érdemes megjegyezni, hogy páros sok tagú populáció mediánját néha úgy definiálják, hogy megadják külön az alsó és a felső mediánt, egyes szerzők szerint pedig a medián nem definiálható ilyen esetben.

Példák

  • Páratlan elemszám esetén:
1 2 5 4 3 1 4 3 3 4 3 5 1
A rendezett sokaság:
1 1 1 2 3 3 3 3 4 4 4 5 5
A medián a középső elem:
1 1 1 2 3 3 3 3 4 4 4 5 5
  • Páros elemszám esetén:
1 4 2 4 2 3 5 3 1 1
A rendezett sokaság:
1 1 1 2 2 3 3 4 4 5
A medián a középső elemek számtani közepe: 2,5.

Egyenértékű megfogalmazásai

A medián valamely értékekre vonatkoztatva az az érték, aminél a többinek a fele nagyobb és a fele kisebb (természetesen páros elemszám esetén a számtani közepet kell venni). Például egy népesség életkorának a mediánja az az életkor, aminél a népességnek pont a fele idősebb és pont a fele fiatalabb.

A medián az az x szám, melytől a sokaság elemeinek abszolút eltérés összege a legkisebb:

A valószínűség-számításban:

A medián az az μ érték, ahol az eloszlásfüggvény: 1/2: F(μ)=1/2

Az exponenciális eloszlás mediánja: μ = (ln2)/λ

A medián minimáltulajdonsága: Ha x-nek létezik várható értéke, akkor az |x-c| várható értéke akkor minimális, ha c=μ (a medián): M(|x-c|)>=M(|x-μ|)

Magasabb dimenzióban

A több dimenziós statisztikában az

minimalizáló c vektorát centroidnak is nevezik,[2] ahol egy adott normában értendő. Ez megfelel az egy dimenziós eset abszolútértékének. A centroid szót azonban más jelentésben is használják.

Ha a centroidot az eloszlás egy leszűkítésére veszik, akkor medioidnak hívják. Ez a ponthalmaz származhat például egy másik eloszlásból.

Alkalmazása

A kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem normális eloszlásokat, mint az átlag, vagy a várható érték.

Példa: 10 személy közül egynek 1 000 000 a jövedelme, a többinek 1000. Ekkor az átlagjövedelem 100 900, míg a medián 1000.

A képfeldolgozásban a monokróm bitképeken gyakran látható egy zajféleség, amiben minden pixel a szomszédoktól függetlenül egy adott kis valószínűség szerint lesz fehér, egy hasonlóan kis valószínűséggel lesz fekete, és egy egyhez közeli valószínűséggel változatlan marad. Az efféle zaj jól csökkenthető az adott pixelből és szomszédjaiból (3 x 3-as négyzet) kapott medián használatával.

Alternatívái

A medián egy alternatívájaként Amartya Sen bevezette a jólléti függvényt a jövedelmek eloszlásának vizsgálatára.

Általánosítása

A medián helyett n-kvantilisek is használhatók, amik az alapsokaságot n egyenlő részre osztják. A medián a második kvartilis, az ötödik decilis, és az ötvenedik percentilis.

Néhány kvantilisnek latin eredetű önálló neve van:

  • 3-kvantilisek: tercilisek
  • 4-kvantilisek: kvartilisek
  • 5-kvantilisek: kvintilisek
  • 9-kvantilisek: nonilisek
  • 10-kvantilisek: decilisek
  • 12-kvantilisek: duodecilisek
  • 20-kvantilisek: vigintilisek
  • 100-kvantilisek: percentilisek

Általánosabban, az eloszlásfüggvény inverzét nevezik az adott eloszlás kvantilisfüggvényének.

Története

Gustav Fechner népszerűsítette a medián használatát a formális adatelemzésben, bár korábban Laplace már használta.[3]

Lásd még

Források

  1. http://mathworld.wolfram.com/StatisticalMedian.html
  2. Carvalho, Luis & Lawrence, Charles (2008), "Centroid estimation in discrete high-dimensional spaces with applications in biology", Proc Natl Acad Sci U S A 105 (9): 3209-3214, DOI 10.1073/pnas.0712329105
  3. Keynes, John Maynard; A Treatise on Probability (1921), Pt II Ch XVII §5 (p 201).
  • R.J. Serfling. Approximation Theorems of Mathematical Statistics. John Wiley & Sons, 1980.
  • Brown, George W. ”On Small-Sample Estimation.” The Annals of Mathematical Statistics, Vol. 18, No. 4 (Dec., 1947), pp. 582–585.
  • Lehmann, E. L. “A General Concept of Unbiasedness” The Annals of Mathematical Statistics, Vol. 22, No. 4 (Dec., 1951), pp. 587–592.
  • Allan Birnbaum. 1961. “A Unified Theory of Estimation, I”, The Annals of Mathematical Statistics, Vol. 32, No. 1 (Mar., 1961), pp. 112–135
  • van der Vaart, H. R. 1961. “Some Extensions of the Idea of Bias” The Annals of Mathematical Statistics, Vol. 32, No. 2 (Jun., 1961), pp. 436–447.
  • Parametric Statistical Theory. Walter de Gruyter (1994). ISBN 3-11-01-3863-8  MR1291393

Külső linkek