Regressziószámítás
A statisztikában a regressziószámítás, vagy regresszióanalízis során két vagy több véletlen változó között fennálló kapcsolatot modellezzük. A regressziós modell tulajdonságai alapján megkülönböztethetünk lineáris és nemlineáris regressziót, az adataink alapján pedig idősor, keresztmetszeti, és panel regresszióanalízist.
A feladat[szerkesztés]
A regresszió feladata két vagy több valószínűségi változó közötti
függvénykapcsolat meghatározása.
A változókat reprezentáló (n+1) dimenziós
vektor koordinátáira kapott m számú
mérési adatból meg kell határozni egy, a vizsgált jelenséget leíró, jól kezelhető függvényt:
, amelynek az
helyeken felvett
értékei
- vagy megegyeznek a megfelelő mért értékekkel:
- (interpoláció), - vagy az
eltérések valamilyen minimum-feltételnek eleget tesznek (regresszió).
Az eltérések mértékét többféleképpen lehet megadni. Leggyakrabban a hibaértékek
eltérések :
négyzetösszegének minimumát követeljük meg. (l.: legkisebb négyzetek módszere).
A vizsgált jelenség természete szabja meg a közelítésre alkalmas függvény típusát. Eszerint megkülönböztetünk lineáris és nemlineáris regressziót. A kapcsolt változók száma szerint ugyancsak eltérnek a modellek. Ilyen értelemben beszélünk két-, három- stb. változós regresszióról.
Lineáris regresszió[szerkesztés]
Az általános lineáris modell az
függvény
együtthatóinak meghatározását követeli meg. (Többváltozós lin. regresszió.)
A leggyakoribb kétváltozós lineáris modell a síkon derékszögű koordináta-rendszerben pontokkal ábrázolható adathalmazra
egyenletű egyenes illesztését írja elő. Ezt az egyenest szokás trend-vonalnak, az egyenlet
együtthatóját trendnek (meredekség, tendencia),
konstansát tengelymetszetnek nevezni.
Az együtthatók becslésére alkalmazott eljárások:
- a legkisebb négyzetek módszere (angolul Ordinary Least Squares – OLS)
- az általánosított legkisebb négyzetek módszere (Generalized Least Squares – GLS)
- az általánosított momentumok módszere (Generalized Method of Moments – GMM)
- a legnagyobb valószerűség módszere (Maximum Likelihood estimation – ML).
Nemlineáris regresszió[szerkesztés]
Nemlineáris regressziószámítást akkor alkalmaznak, ha a modell nem lineáris. Az ilyenkor alkalmazható linearizáló módszer abból áll, hogy az eredeti
változók helyett, velük összefüggő, de egymással lineáris kapcsolatban lévő
változókat vezetünk be.
- Például az
formulából az
helyettesítésekkel az
lineáris kapcsolat adódik. Ennek(a,b) együtthatóiból az eredeti formula konstansai adódnak:
.


- (interpoláció),
eltérések valamilyen minimum-feltételnek eleget tesznek (regresszió).

formulából az
helyettesítésekkel az
.