Térstatisztika

A Wikipédiából, a szabad enciklopédiából

A térstatisztika (térségi statisztika) környezetünk tanulmányozásának azon statisztika módszereit foglalja magában, amelyek segítségével kutatásainkat, vizsgálatainkat egy meghatározott térre (térségre) korlátozzuk és a matematikai tértudományok topológia, geometria, vagy földrajztudomány kvantitatív módszereinek segítségével végezzük. A térstatisztika új tudományterület. Általánosságban a matematikai statisztika és valószínűségszámítás analitikus módszereit terjeszti ki a legkülönbözőbb tudományterületekre ahol „tér és út” algoritmusokkal írhatunk le struktúrákat. (klasszikusan ilyenek a csillagászat, geológia stb.). Szűkebb értelemben gyakran használják a geostatisztika szinonimájaként is. A geostatisztika földrajzi, geográfiai, geológiai adatokhoz kapcsolt statisztikai kutatásokat jelenti. Ennek a területek a rendkívül gyors fejlődését a Földrajzi információs rendszerek, (GIS) és a földrajzi információs rendszerekhez kapcsolt adatbázisok hihetetlen gyors térnyerése alapozta meg. E mellett ezer szállal kapcsolódik más műszaki tudományterületekhez is mint a kartográfia, számítógépes alakfelismerés, stb.

A térstatisztika fogalom köre napjainkban még nem kristályosodott ki. A kutatásokban nehéz megkülönböztetni a tér és a terület fogalmát, valamit a kutatások tárgyát képező egységeket. Például a foglalkoztatás területén végzett térstatisztikai kutatásokban a vizsgálati tér lehet a vizsgálatba bevont személyek lakóhelye, de lehet a vizsgálatba bevont személyek munkahelyének a helyszíne is, vagy lehet a vizsgálat tárgya a naponta, vagy hetente ingázók által használt útvonalak is. Bármelyiket válaszuk az közvetlen hatással van a módszerekre, az analízisre és természetesen a vizsgálat eredményére a levonható következtetésekre.[1][2]

A térstatisztika matematikai és statisztikai módszerei kidolgozás alatt vannak ezt nehézzé teszi a vizsgált területek sokrétűsége. A informatikai hátteret biztosító adatbázis kezelő rendszerek, a GIS, és adatbányászat sem rendelkezik még konkrétan térstatisztikai vizsgálatokra kidolgozott speciális megoldásokkal.

Kialakulása[szerkesztés | forrásszöveg szerkesztése]

A térstatisztika a térképészet és a különböző megfigyelések együttes alkalmazásának ötletéből alakult ki. Több tudományág művelőiben felmerült az igény, hogy helyi megfigyeléseiket elhelyezzék a térképen. Biológiai, etológiai, ökológiai, epidemiológiai kutatásokban gyakran használtak és használnak ma is térképi ábrázolást a megfigyeléseik kiterjedésének, változásának vizualizására illetve dokumentálására. Legismertebb dr. John Snow térképe az 1854-es londoni kolera járvány vizsgálatával kapcsolatosan. Dr. Snow térképen rögzítette a megbetegedéseket. A térstatisztika mint a statisztika új területe a 20. század végén alakult önálló területté. Gyökeres változást a földrajzi információs rendszerek (GIS) megjelenése és elterjedése hozott. A geográfiai információs rendszerek modern szoftverekkel és vizsgálati módszerekkel soha nem látott mennyiségű földrajzilag meghatározott statisztikai információ feldolgozását teszik lehetővé. A távérzékelési rendszerek, a távadat-feldolgozás, a alakfelismerési eljárásokkal és a klaszteranalízis módszerei további lehetőségeket biztosítanak. Időközben a számítástudomány fejlődése is az algoritmus-elméletek terén, valamint számítógépes geometria kialakulásával alapvetően megváltoztatta a térképészeti információk kezelhetőségét, egzakt megoldásokat biztosítva, és nem utolsósorban a matematikában is új alapvető eljárások (pl. fraktálok, skála invariancia stb.) jelentek meg.

Módszerek[szerkesztés | forrásszöveg szerkesztése]

Területi adatanalízis[szerkesztés | forrásszöveg szerkesztése]

Egyes települések, régiók térstatisztika vizsgálatainak leggyakrabban használt forrásai népszámlálási adatok mellett sok más adatforást is felhasználhatunk például a választási statisztikákat. A választások gyakorisága aktuálisabb adatállományokat biztosít a népszámlálási adatoknál azonban ezeknél a választási statisztikák felhasználhatóságát alapvetően korlátozzák a legtöbb országban szigorúan szabályozott személyiségi jogok. Sem a népszámlálási adatok, sem a választási statisztikák nagy mennyiségű adata közvetlenül nem biztosít statisztikailag feldolgozható térségi adatokat. A térségi adatok földrajzi lokalizáció lehet egy egy kistérséghez tartozás az uniós NUTS felosztás, de alkalmasint egy-egy postai irányítószám körzete is.[3]

Ahhoz hogy egy térség vizsgálatához megfelelő adatokhoz jussunk faktoranalízist kell a nyers adatokon végezni. A faktoranalízissel a nyers adatok nagy számú változóinak száma redukálható és a korrelációk részben kiszűrhetők. Csak a lényeges változókat lehet a kiértékelésbe bevonni. A faktoranalízist helyesen alkalmazva elérhető, hogy a megfigyelésbe bevont szempontok száma kezelhető legyen, miközben az információ vesztés mértéke még érdemben nem torzítja a kutatási eredményeket.

Másrészt matematikailag a faktorizálást követően kapott egységvektorok ortogonálisak azaz korrelálatlanok. Általában a legnagyobb sajátértékkel rendelkező faktor egyben a legdominánsabb is és a kevésbé fontos faktorok sajátértéke kisebb. A faktoranalízis eredménye nagymértékben függ a megfigyelések mérési távolságától ennek megfelelően kell a feldolgozási eljárást kiválasztani illetve a mérési távolságot definiálni.

Területi autokorreláció[szerkesztés | forrásszöveg szerkesztése]

A térségi autokorreláció a földrajzi térben végzett megfigyelések statisztikai mérésére és azok függőségi mértékének vizsgálatára szolgál. Klasszikus térségi autokorrelációs statisztikai eljárásokat Moran, Geary, és Getis dolgozták ki. Ezek a statisztikai eljárások valamilyen területi súlyozással (súly mátrixszal) dolgoznak. Ez a súly mátrix a szomszédos egységek közötti földrajzi kapcsolatok intenzitását írják le. Mint például a szomszédok közötti távolság, a közös határ hossza, valamilyen egyéb osztályozás.

A klasszikus térségi autokorrelációs statisztika a területi súlyt és a kovarianciát írja le a megfigyelt helyek különböző párjai között. Ha a térségi autokorreláció értéke pozitívabb mint az egy véletlenszerű megfigyelésből következne, az a terület klaszterezettségét jelenti. Ha a térségi autokorreláció értéke szignifikánsan negatívabb az azt jelenti, hogy a szomszédok értékei között nagyobbak a különbözőségek, mint az egy a sakktáblához hasonlítható szabályos minta alapján elvárható.

Területi interpoláció[szerkesztés | forrásszöveg szerkesztése]

A térségi interpoláció módszereinek segítségével a földrajzi térben ismert megfigyelési helyszínek értékeiből következtetünk nem megfigyelt vagy eleve megfigyelhetetlen helyszínek változóira. Az alapeljárás az inverz távolság súlyozásán alapul. Lényege, hogy egy súlyozott átlagértéket rendelünk minden ismert ponthoz, amely azok egymástól való távolságával fordítottan arányos. Ennek a módszernek továbbfejlesztett változata a krigelés. A krigelés különböző változatai a távolságon túl további szisztematikus és véletlenszerű komponenseket is figyelembe vesznek. Segítségével hibabecslésre és egy feltételezett burkológörbe optimális meghatározására is lehetőségünk van, amit illeszthetünk a területi mintáinkhoz.[4]

Területi regresszió[szerkesztés | forrásszöveg szerkesztése]

A térségi regressziós eljárások a regressziószámítás segítségével a területi függőségekre koncentrál. A vizsgálat helyszínt, körzetet, térséget megadhatjuk földrajzi koordinátákkal, vagy egy távolsággal. Az eljárás nem vesz figyelembe az olyan statisztikai problémákat, mint a nem kellően stabil paraméterek, a megbízhatatlan szignifikancia tesztek. Az alkalmazott speciális technikáktól függően a térségi függőség a regressziós modellben mint független és függő változók közötti összefüggések, vagy azoknak a hibafeltételei jelennek meg. A földrajzilag súlyozott regresszió a társadalomtudományi kutatások egyik legelterjedtebb matematikai módszere. [5] [6]

Területi kölcsönhatás-vizsgálat[szerkesztés | forrásszöveg szerkesztése]

A térségi kölcsönhatás-vizsgálat gravitációs modellje a különböző földrajzi helyek közötti áramlásokat (lakosságmozgás, kereskedelmi irányok, információáramlás stb.) igyekszik megbecsülni. Az általa vizsgált faktorok lehetnek az elsődleges mozgatóerők mint például: az ingázók száma egy agglomerációban, célterület vonzó ereje pl. egy város irodaházakkal való ellátottsága, vagy a különböző területek, helységek szomszédsági viszonyai mint például az utazási távolságok, utazási idők stb. A különböző területek topológiai viszonyait vizsgálva gyakran egyedi és ellentmondó faktorokat is figyelembe kell venni.

A kapcsolatok formáinak meghatározást követően az analízisnél a felállított modell paramétereinek, az adatáramlásnak a becslésére, szabványos becslési módszereket használnak mint például legkisebb négyzetek módszere, vagy a maximum likelihood módszer. [7]

Területi klaszterelemzés[szerkesztés | forrásszöveg szerkesztése]

A klaszterelemzés dimenziócsökkentő eljárás, amellyel adattömböket tudunk homogén csoportokba sorolni. Matematikailag a csoportosítás alapját különböző távolság- vagy hasonlóságmértékek képezik. Ezeket a csoportokat nevezzük klasztereknek. A különböző mértékegységekkel mért mutatószámokból adódó torzítóhatás kiküszöbölésére az eljárásban a változók standardizált értékével kell dolgozni, a standardizálás "dimenziótlanítja", azonos jellegűvé alakítja az egyes változókat.[8]

Térségi kutatásokban a klaszterek kialakításában gyakran használt eljárás a központosítás. Ilyenkor az első szinten két-két egymáshoz legközelebb eső pontból alakítunk ki egy-egy klasztert (ez lehet a két pont súlyozott közepe), majd az így kialakított klasztereket önálló pontoknak tekintve folytatjuk az eljárást. Ezt tetszőleges n lépésben folytatjuk. Így egy (n-1) * (n-1) távolságmátrixot kapunk. Az átlagolások mélységének nincs matematikailag indokolt mélysége. Az a kutató elhatározásának függvénye.

Az eljárás legismertebb Magyarországi alkalmazása Beluszky Pál és Sikos T. Tamás 1982-ben végzett kutatásából ismert. [9] Ez a vizsgálat 27 kiinduló kritériumból kiindulva végezte el 3134 magyar település típusba sorolását a térségi klaszterelemzés módszerét használva. Végkövetkeztetésként a szerzők 7 nagyobb magyar falutípust határoztak meg. A két kutató 2007-ben, 25 évvel később, azonos módszerekkel megismételte a kutatását. Az azonos módszerrel megismételt kutatás eredményei rendkívül értékesek. Jól mutatják Magyarország átalakulását a rendszerváltást követő években. [10]

Monte-Carlo módszer[szerkesztés | forrásszöveg szerkesztése]

Az adathiányos környezetben gyakran használt matematikai szimulációs módszer. Lényege, hogy valamilyen hipotézis alapján kidolgozott valószínűség-eloszlásnak megfelelően véletlenszerűen rendelnek a vizsgált területi egységekhez a feltételezett eloszlást követő értékeket. A véletlenszerű hozzárendelést kellő számban ismételve kapott értékek lehetővé teszik a statisztikai elemzéseket. A módszer igen hatásos különböző hálózatok (út, energiaellátás, közútfejlesztés, stb.) tervezésekor, amennyiben a meglévő hálózat eloszlása jól leírható valamilyen eloszlásfüggvénnyel.

Shift-share analízis[szerkesztés | forrásszöveg szerkesztése]

Területi sajátosságok, egyes régiók, társadalmi és/vagy gazdasági súlyának a vizsgálatára kidolgozott módszer. Nem igényel bonyolult matematikai eljárásokat, de számításigényes. Ezért csak a számítógépek elterjedését követően vált népszerűvé. A vizsgálat végzéséhez a vizsgált időintervallum kezdeti és végpontjában szükség van a vizsgát terület (pl. kistérség) és az azt magában foglaló referencia terület (ország) adataira is. Klasszikus közgazdasági megfogalmazásban területi és ágazati bontású adatokra, de demográfiai, településszerkezeti vizsgálatokra is használják.

Geográfiai információs rendszer[szerkesztés | forrásszöveg szerkesztése]

Általánosságban rendelkezésre állnak térségi statisztikai felmérések és kiadványok. Ezeknek a kiadványoknak az adattáblázatai nevezik a térstatisztikában földrajzi adatmátrixoknak. Ma már ezek az adattáblázatok rendkívül nagyok is lehetnek. (pl. A választási statisztikák települések szerinti adatai.) Ezért sok-sok kisebb mátrixot (táblát) magában foglaló relációs adatbázisokról érdemes beszélni. Ezek a relációs adatbázisok alkotják a geográfiai információs rendszereket. Klasszikus esetben egy-egy ilyen földrajzi adatmátrix (tábla) sorai egy-egy települést határoznak meg az oszlopok pedig a településekhez (területi egységekhez) tartozó különböző jellemző értékeket. A sorok és azok összehasonlítása a térszerkezetet, az oszlopok pedig a különböző jelenségek térségi mérésének a kiinduló pontjait határozzák meg. (Pl. a fenti példában ezek lehetnek a leadott szavazatok pártok szerinti értékei). Ezeket felhasználva lehet egzakt matematikai statisztikai módszereket használva összehasonlító vizsgálatokat végezni. Asszociációkat, korrelációt, esetleges együttmozgásokat, vagy elkülönüléseket keresni.

Térstatisztikai kutatások Magyarországon[szerkesztés | forrásszöveg szerkesztése]

MTA Regionális Tudományos Bizottsága[szerkesztés | forrásszöveg szerkesztése]

A Magyar Tudományos Akadémia 1986-ban hozta létre az MTA Regionális Tudományos Bizottságát. Ennek a szervezetnek a feladata a Magyarországi regionális kutatások irányítása, szervezése. A kutatások az MTA Közgazdaság- és Regionális Tudományi Kutatóközpont Regionális Kutatások Intézetében folynak. Az intézetnek 4 területi Tudományos osztálya van Budapesten, Győrött, Békéscsabán és Pécsett. Az MTA Regionális Tudományos Bizottsága 6 a regionális kutatásokhoz kapcsolódó albizottságból ezek egyike a térstatisztika módszerekért felelős a Kutatásmódszertani albizottság ennek elnöke: Nemes-Nagy József.

Magyar Regionális Tudományi Társaság[szerkesztés | forrásszöveg szerkesztése]

A Magyar Regionális Tudományi Társaság alapítását 2002. február 21-én határozták el az MTA Regionális Tudományos Bizottság tagjai. A Magyar Regionális Tudományi Társaság az Európai Regionális Tudományi Társaság (ERSA) magyar tagozata. Egy független civil szervezet, amely a területi kutatással, fejlesztéssel, irányítással foglalkozó szakembereket fogja össze. A szerteágazó regionális kutatások számára fontos a leíró kutatások mellett a tudományos analízishez szükséges statisztikai módszerek, használata és fejlesztése is.

Egyetemek[szerkesztés | forrásszöveg szerkesztése]

A regionális kutatások térstatisztikai módszerek kutatásának és oktatásának központja az ELTE Regionális Földrajzi Tanszéke. Nemes-Nagy József tanszékvezető professzor vezetésével Regionális elemzési módszerek elnevezéssel doktori iskola működik és ezen belül térelméleti és módszertani kutatások folynak. A tanszék oktatási és kutatási területéhez tartoznak a vonzásviszonyok és térkapcsolatok elméleti modellezése és empirikus vizsgálata is.

Jelentősebb térstatisztikai kutatások folynak még a Szent István Egyetem Gazdasági Elemzések Tanszékén Dusek Tamás vezetésével.

Tudományos folyóiratok[szerkesztés | forrásszöveg szerkesztése]

Térstatisztikai tudományos publikációk két magyar tudományos folyóiratban jelennek meg:

  • az MTA KRTK Regionális Kutatások Intézetének 1987-ben alapított, negyedévenként megjelenő Tér és Társadalom tudományos folyóiratában. (Főszerkesztő: Györgyi Barta)
  • a Központi Statisztikai Hivatal kiadásában kéthavonta, minden páratlan hónap végén magyar és tárgyév végén egy alkalommal angol nyelven megjelenő Területi Statisztikában (Főszerkesztő Dr. Szaló Péter)

Jegyzetek[szerkesztés | forrásszöveg szerkesztése]

  1. Nemes-Nagy_1
  2. Nemes-Nagy_2
  3. Nemes-Nagy_2 87. oldal
  4. Bodrog Csenge: Hidrológiai és hidrogeológiai paraméterekre történő térképszerkesztés - krigeléssel. Diplomamunka. ELTE, Térképtudományi Tanszék, 2001
  5. Fábián Zsófia, A földrajzilag súlyozott regresszió módszere és alkalmazhatósági példája. Területstatisztika 2013, 53(1) 5.oldal.
  6. Nemes-Nagy_2 36. oldal
  7. Dr. Kincses Áron – Dr. Tóth Géza, Gravitációs modell alkalmazása a térszerkezet vizsgálatára Területstatisztika 2012, 52(5) 479.oldal.
  8. Nemes-Nagy_2 100. oldal
  9. Beluszky, Pál, Sikos T. Tamás. Magyarország falutípusai.. Budapest: MTA Földrajztudományi Kutatóintézet, 167. o [1982] (1982) 
  10. Beluszky, Pál, Sikos T. Tamás. Változó falvaink (Magyarország falutípusai az ezredfordulón). Budapest: MTA Társadalomkutató Központ, 459. o [1982] (2007) 

Források[szerkesztés | forrásszöveg szerkesztése]