Konzisztens becslés

A Wikipédiából, a szabad enciklopédiából
A {T1, T2, T3, ...} a θ0 paraméter becsléseinek sorozata, amelynek valódi értéke 4. Ez a becslés konzisztens: a becslések egyre inkább a θ0 valós érték közelében koncentrálódnak; ugyanakkor a becslések torzítottak. A sorozat egy olyan valószínűségi változóhoz konvergál amely 1 valószínűséggel egyenlő θ0-val.

A statisztikában a konzisztens becslés vagy aszimptotikusan konzisztens becslés egy becslés – a θ0 paraméter valós értékének kiszámítására szolgáló szabály –, amelynek az a tulajdonsága, hogy ahogy a felhasznált adatpontok száma korlátlanul növekszik, a kapott becslések sorozatának valószínűségi határértéke (plim) θ0-hoz konvergál. Ez azt jelenti, hogy a becslések eloszlása egyre inkább a becsült paraméter valódi értékéhez közel koncentrálódik, így annak valószínűsége, hogy a becslő tetszőlegesen közel kerül θ0-hoz, egyhez konvergál.

A gyakorlatban ez úgy működik hogy készítünk egy becslést egy rendelkezésre álló n méretű minta alapján, majd elképzeljük, hogy tovább gyűjthetjük az adatokat, és a végtelenségig bővíthetjük a mintát. Ily módon n-nel indexelt becslések sorozatát kapjuk, és a konzisztencia arra vonatkozik, hogy mi történik akkor, ha a minta mérete „a végtelenségig nő”. Ha a becslések sorozata matematikailag kimutathatóan valószínűségében konvergál a valódi θ0 értékhez, akkor konzisztens becslésnek nevezzük; ellenkező esetben a becslést inkonzisztensnek mondják.

Az itt meghatározott konzisztenciát néha gyenge konzisztenciának is nevezik. Ha a valószínűségi konvergenciát majdnem biztos konvergenciával helyettesítjük, akkor a becslés erősen konzisztensnek mondható. A konzisztencia a torzítottsághoz hasonló fogalom, mivel mindkettő azt méri hogy egy becslés mennyire „jó” - azonban két különböző szempontból - fontos hogy egyik tulajdonságból sem következik a másik.

Definíció[szerkesztés]

Formálisan egy becslés T n a θ paraméterre akkor konzisztens, ha valószínűségben konvergál a valódi paraméterhez: [1]

azaz, ha minden ε > 0 esetén

Egy szigorúbb definíció figyelembe veszi azt a tényt, hogy θ értéke valójában ismeretlen, így a valószínűségi konvergenciának meg kell történnie e paraméter minden lehetséges értékére. Tegyük fel, hogy {pθ: θ ∈ Θ } eloszlások egy halmaza (a parametrikus modell ), és Xθ = {X1, X2, … : Xi ~ pθ } egy végtelen minta a p θ eloszlásból. Legyen { T n ( X θ ) } becslések sorozata valamilyen g ( θ ) paraméterhez. Általában a T n egy minta első n megfigyelésén alapul. Ekkor ezt a { T n } sorozatot (gyengén) konzisztensnek mondjuk, ha [2]

Ez a definíció egy g (θ) függvényt használ θ helyett, mivel az embert gyakran érdekli az alapul szolgáló paraméter egy bizonyos függvényének vagy egy részvektorának becslése.

Példák[szerkesztés]

Normál valószínűségi változó mintaátlaga[szerkesztés]

Tegyük fel, hogy van egy {X1, X2, ...} megfigyelési sorozatunk egy normál N (μ, σ2) eloszlásból. A μ első n megfigyelés alapján történő becsléséhez a mintaátlagot használhatjuk: . Ez meghatározza a becslések sorozatát, az n mintamérettel indexelve.

A normális eloszlás tulajdonságaiból ismerjük ennek a statisztikának a mintavételi eloszlását : T n maga normális eloszlású, μ átlaggal és σ 2 / n szórással. Ezzel egyenértékűen sztenderd normál eloszlású:

ahogy n a végtelenhez tart, bármely rögzített ε > 0 számra. Ezért a mintaátlagok T n sorozata konzisztens a sokaság átlagára nézve μ ( a normális eloszlás kumulatív eloszlás függvénye).

A konzisztencia vizsgálata[szerkesztés]

Az aszimptotikus konzisztencia fogalma nagyon közel áll, szinte szinonimája a valószínűségi konvergencia fogalmának. Mint ilyen, bármely tétel, lemma vagy tulajdonság, amely valószínűségi konvergenciát állapít meg, felhasználható a konzisztencia bizonyítására. Számos ilyen eszköz létezik:

  • A konzisztencia közvetlenül a definícióból való bizonyítására használhatjuk a következő egyenlőtlenséget [3]

a h függvény leggyakrabban vagy az abszolút érték (ebben az esetben ez a reláció Markov-egyenlőtlenségként ismert), vagy a négyzet függvény (ekkor ez a Csebisev-egyenlőtlenség ).

  • Egy másik hasznos eredmény a folytonos leképezési tétel : ha T n konzisztens θ-re, és g (·) egy valós értékű függvény amely folytonos a θ pontban, akkor g ( T n ) konzisztens lesz g( θ )-re: [4]
  • Szluckij tétele használható több különböző becslés kombinálására, vagy egy becslés nem véletlenszerű konvergens sorozatával. Ha T n → d α és S n → p β, akkor [5]
  • Ha a T n becslést egy explicit képlettel adjuk meg, akkor a képlet valószínűségi változók összegét fogja használni, és ekkor a nagy számok törvénye használható: { X n } valószínűségi változók sorozatára megfelelő feltételek mellett igaz hogy
  • Ha a T n becslés implicit módon van definiálva, például olyan értékként, amely maximalizál egy bizonyos célfüggvényt (lásd extrémumbecslő), akkor bonyolultabb, sztochasztikus ekvikontinuitást magában foglaló bizonyítást kell használni. [6]

Torzítottság versus konzisztencia[szerkesztés]

Torzítatlan, de nem konzisztens[szerkesztés]

A becslő lehet torzítatlan, de nem konzisztens. Például egy {x1, ..., xn} iid mintához használható a Tn (X) = xn mint az E[x] átlag becslője. Vegyük figyelembe, hogy itt a Tn mintavételi eloszlása megegyezik a mögöttes eloszlással (bármely n esetén, mivel figyelmen kívül hagy minden pontot, kivéve az utolsót), így E[ Tn(X)] = E[x] és torzítatlan, de nem konvergál semmilyen értékhez.

Ha azonban a becslések sorozata torzítatlan és konvergens értékhez, akkor konzisztens, mivel a helyes értékhez kell konvergálnia.

Torzított, de konzisztens[szerkesztés]

Másrészről a becslés lehet torzított, de konzisztens. Például, ha az átlagot a következővel becsüljük meg: akkor ez a becslés torzított, de ahogy , megközelíti a helyes értéket, és így konzisztens.

Fontos példa a minta varianciája és a minta szórása. A Bessel-korrekció nélkül (vagyis a mintaméret helyett a szabadságfokot használjuk normalizálásra), is negatívan torzított, de konzisztens becslés. A korrekcióval a korrigált minta varianciája torzítatlan, míg a korrigált minta szórása továbbra is torzított, de kevésbé, és mindkettő továbbra is konzisztens: a korrekciós tényező 1-hez konvergál a minta méretének növekedésével.

Íme egy másik példa. Legyen becslések sorozata -re:

Láthatjuk, hogy , , és a torzítás nem konvergál nullához.

Jegyzetek[szerkesztés]

  1. Amemiya 1985, Definition 3.4.2.
  2. Lehman & Casella 1998.
  3. Amemiya 1985, equation (3.2.5).
  4. Amemiya 1985.
  5. Amemiya 1985, Theorem 3.2.7.
  6. Newey & McFadden 1994, Chapter 2.

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Consistent estimator című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.