Konzisztens becslés

A statisztikában a konzisztens becslés vagy aszimptotikusan konzisztens becslés egy becslés – a θ₀ paraméter valós értékének kiszámítására szolgáló szabály –, amelynek az a tulajdonsága, hogy ahogy a felhasznált adatpontok száma korlátlanul növekszik, a kapott becslések sorozatának valószínűségi határértéke (plim) θ₀-hoz konvergál. Ez azt jelenti, hogy a becslések eloszlása egyre inkább a becsült paraméter valódi értékéhez közel koncentrálódik, így annak valószínűsége, hogy a becslő tetszőlegesen közel kerül θ₀-hoz, egyhez konvergál.

A gyakorlatban ez úgy működik hogy készítünk egy becslést egy rendelkezésre álló n méretű minta alapján, majd elképzeljük, hogy tovább gyűjthetjük az adatokat, és a végtelenségig bővíthetjük a mintát. Ily módon n-nel indexelt becslések sorozatát kapjuk, és a konzisztencia arra vonatkozik, hogy mi történik akkor, ha a minta mérete „a végtelenségig nő”. Ha a becslések sorozata matematikailag kimutathatóan valószínűségében konvergál a valódi θ₀ értékhez, akkor konzisztens becslésnek nevezzük; ellenkező esetben a becslést inkonzisztensnek mondják.

Az itt meghatározott konzisztenciát néha gyenge konzisztenciának is nevezik. Ha a valószínűségi konvergenciát majdnem biztos konvergenciával helyettesítjük, akkor a becslés erősen konzisztensnek mondható. A konzisztencia a torzítottsághoz hasonló fogalom, mivel mindkettő azt méri hogy egy becslés mennyire „jó” - azonban két különböző szempontból - fontos hogy egyik tulajdonságból sem következik a másik.

Definíció[szerkesztés]

Formálisan egy becslés T _n a θ paraméterre akkor konzisztens, ha valószínűségben konvergál a valódi paraméterhez: ^[1]

{\underset {n\to \infty }{\operatorname {plim} }}\;T_{n}=\theta .

azaz, ha minden ε > 0 esetén

\lim _{n\to \infty }\Pr {\big (}|T_{n}-\theta |>\varepsilon {\big )}=0.

Egy szigorúbb definíció figyelembe veszi azt a tényt, hogy θ értéke valójában ismeretlen, így a valószínűségi konvergenciának meg kell történnie e paraméter minden lehetséges értékére. Tegyük fel, hogy {p_θ: θ ∈ Θ } eloszlások egy halmaza (a parametrikus modell ), és X^θ = {X₁, X₂, … : X_i ~ p_θ } egy végtelen minta a p _θ eloszlásból. Legyen { T _n ( X ^θ ) } becslések sorozata valamilyen g ( θ ) paraméterhez. Általában a T _n egy minta első n megfigyelésén alapul. Ekkor ezt a { T _n } sorozatot (gyengén) konzisztensnek mondjuk, ha ^[2]

{\underset {n\to \infty }{\operatorname {plim} }}\;T_{n}(X^{\theta })=g(\theta ),\ \ {\text{ha}}\ \theta \in \Theta .

Ez a definíció egy g (θ) függvényt használ θ helyett, mivel az embert gyakran érdekli az alapul szolgáló paraméter egy bizonyos függvényének vagy egy részvektorának becslése.

Példák[szerkesztés]

Normál valószínűségi változó mintaátlaga[szerkesztés]

Tegyük fel, hogy van egy {X₁, X₂, ...} megfigyelési sorozatunk egy normál N (μ, σ²) eloszlásból. A μ első n megfigyelés alapján történő becsléséhez a mintaátlagot használhatjuk: $T_{n}={X_{1}+\cdots +X_{n}} \over n$ . Ez meghatározza a becslések sorozatát, az n mintamérettel indexelve.

A normális eloszlás tulajdonságaiból ismerjük ennek a statisztikának a mintavételi eloszlását : T _n maga normális eloszlású, μ átlaggal és σ ² / n szórással. Ezzel egyenértékűen $\scriptstyle (T_{n}-\mu )/(\sigma /{\sqrt {n}})$ sztenderd normál eloszlású:

\Pr \!\left[\,|T_{n}-\mu |\geq \varepsilon \,\right]=\Pr \!\left[{\frac {{\sqrt {n}}\,{\big |}T_{n}-\mu {\big |}}{\sigma }}\geq {\sqrt {n}}\varepsilon /\sigma \right]=2\left(1-\Phi \left({\frac {{\sqrt {n}}\,\varepsilon }{\sigma }}\right)\right)\to 0

ahogy n a végtelenhez tart, bármely rögzített ε > 0 számra. Ezért a mintaátlagok T _n sorozata konzisztens a sokaság átlagára nézve μ ( $\Phi$ a normális eloszlás kumulatív eloszlás függvénye).

A konzisztencia vizsgálata[szerkesztés]

Az aszimptotikus konzisztencia fogalma nagyon közel áll, szinte szinonimája a valószínűségi konvergencia fogalmának. Mint ilyen, bármely tétel, lemma vagy tulajdonság, amely valószínűségi konvergenciát állapít meg, felhasználható a konzisztencia bizonyítására. Számos ilyen eszköz létezik:

A konzisztencia közvetlenül a definícióból való bizonyítására használhatjuk a következő egyenlőtlenséget ^[3]

\Pr \!{\big [}h(T_{n}-\theta )\geq \varepsilon {\big ]}\leq {\frac {\operatorname {E} {\big [}h(T_{n}-\theta ){\big ]}}{h(\varepsilon )}},

a h függvény leggyakrabban vagy az abszolút érték (ebben az esetben ez a reláció Markov-egyenlőtlenségként ismert), vagy a négyzet függvény (ekkor ez a Csebisev-egyenlőtlenség ).

Egy másik hasznos eredmény a folytonos leképezési tétel : ha T _n konzisztens θ-re, és g (·) egy valós értékű függvény amely folytonos a θ pontban, akkor g ( T _n ) konzisztens lesz g( θ )-re: ^[4]

T_{n}\ \xrightarrow {p} \ \theta \ \quad \Rightarrow \quad g(T_{n})\ \xrightarrow {p} \ g(\theta )

Szluckij tétele használható több különböző becslés kombinálására, vagy egy becslés nem véletlenszerű konvergens sorozatával. Ha T _n → ^d α és S _n → ^p β, akkor ^[5]

{\begin{aligned}&T_{n}+S_{n}\ \xrightarrow {d} \ \alpha +\beta ,\\&T_{n}S_{n}\ \xrightarrow {d} \ \alpha \beta ,\\&T_{n}/S_{n}\ \xrightarrow {d} \ \alpha /\beta ,{\text{ provided that }}\beta \neq 0\end{aligned}}

Ha a T _n becslést egy explicit képlettel adjuk meg, akkor a képlet valószínűségi változók összegét fogja használni, és ekkor a nagy számok törvénye használható: { X _n } valószínűségi változók sorozatára megfelelő feltételek mellett igaz hogy

{\frac {1}{n}}\sum _{i=1}^{n}g(X_{i})\ {\xrightarrow {p}}\ \operatorname {E} [\,g(X)\,]

Ha a T _n becslés implicit módon van definiálva, például olyan értékként, amely maximalizál egy bizonyos célfüggvényt (lásd extrémumbecslő), akkor bonyolultabb, sztochasztikus ekvikontinuitást magában foglaló bizonyítást kell használni. ^[6]

Torzítottság versus konzisztencia[szerkesztés]

Torzítatlan, de nem konzisztens[szerkesztés]

A becslő lehet torzítatlan, de nem konzisztens. Például egy {x₁, ..., x_n} iid mintához használható a T_n (X) = x_n mint az E[x] átlag becslője. Vegyük figyelembe, hogy itt a T_n mintavételi eloszlása megegyezik a mögöttes eloszlással (bármely n esetén, mivel figyelmen kívül hagy minden pontot, kivéve az utolsót), így E[ T_n(X)] = E[x] és torzítatlan, de nem konvergál semmilyen értékhez.

Ha azonban a becslések sorozata torzítatlan és konvergens értékhez, akkor konzisztens, mivel a helyes értékhez kell konvergálnia.

Torzított, de konzisztens[szerkesztés]

Másrészről a becslés lehet torzított, de konzisztens. Például, ha az átlagot a következővel becsüljük meg: ${1 \over n}\sum x_{i}+{1 \over n}$ akkor ez a becslés torzított, de ahogy $n\rightarrow \infty$ , megközelíti a helyes értéket, és így konzisztens.

Fontos példa a minta varianciája és a minta szórása. A Bessel-korrekció nélkül (vagyis a mintaméret $n$ helyett a szabadságfokot $n-1$ használjuk normalizálásra), is negatívan torzított, de konzisztens becslés. A korrekcióval a korrigált minta varianciája torzítatlan, míg a korrigált minta szórása továbbra is torzított, de kevésbé, és mindkettő továbbra is konzisztens: a korrekciós tényező 1-hez konvergál a minta méretének növekedésével.

Íme egy másik példa. Legyen $T_{n}$ becslések sorozata $\theta$ -re:

\Pr(T_{n})={\begin{cases}1-1/n,&{\mbox{if }}\,T_{n}=\theta \\1/n,&{\mbox{if }}\,T_{n}=n\delta +\theta \end{cases}}

Láthatjuk, hogy $T_{n}{\xrightarrow {p}}\theta$ , $\operatorname {E} [T_{n}]=\theta +\delta$ , és a torzítás nem konvergál nullához.

Jegyzetek[szerkesztés]

↑ Amemiya 1985, Definition 3.4.2.
↑ Lehman & Casella 1998.
↑ Amemiya 1985, equation (3.2.5).
↑ Amemiya 1985.
↑ Amemiya 1985, Theorem 3.2.7.
↑ Newey & McFadden 1994, Chapter 2.

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Consistent estimator című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

[FOOTNOTEAmemiya1985Definition_3.4.2-1] Amemiya 1985, Definition 3.4.2.

[FOOTNOTELehmanCasella1998-2] Lehman & Casella 1998.

[FOOTNOTEAmemiya1985equation_(3.2.5)-3] Amemiya 1985, equation (3.2.5).

[FOOTNOTEAmemiya1985-4] Amemiya 1985.

[FOOTNOTEAmemiya1985Theorem_3.2.7-5] Amemiya 1985, Theorem 3.2.7.

[FOOTNOTENeweyMcFadden1994Chapter_2-6] Newey & McFadden 1994, Chapter 2.

[1]

[2]

[3]

[4]

[5]

[6]