David Marr

A Wikipédiából, a szabad enciklopédiából
David Marr
Született1945. január 19.[1]
Woodford
Elhunyt1980. november 17. (35 évesen)[2]
Cambridge
Állampolgárságabrit
Foglalkozása
Iskolái
KitüntetéseiIJCAI Computers and Thought Award (1979)
Halál okarák
SablonWikidataSegítség

David Courtnay Marr (Woodford, 1945. január 19.Cambridge, 1980. november 17.) brit pszichológus, a komputációs idegtudomány atyja.

Tanulmányait a neves angol bentlakásos iskolában, a Rugbyban kezdte, majd a cambridge-i Trinity College-ban folytatta, ahol matematikából mesterfokozatot szerzett. Ezt követően PhD hallgatóként az idegtudomány szakirodalmát tanulmányozta, majd megírta doktori disszertációját az emlősök agyműködése témában. 1971-ben érdeklődése a látás felé fordult, 1973-tól a Massachusettsi Műegyetem (MIT) mesterséges intelligencia laboratóriumában dolgozott, 1980-ban pszichológia professzorrá nevezték ki. 1978 telén leukémiát diagnosztizáltak a szervezetében, két évvel később, 1980. november 17-én hunyt el a massachusettsi Cambridge-ben.

Az emberi és a számítógépes látásról szóló nagyszabású műve 1982-ben jelent meg Vision: A Computational Investigation into the Human Representation and Processing of Visual Information címmel.

A kognitív folyamatok leírási szintjei[szerkesztés]

A kognitív (megismerő) folyamatok három különböző szinten írhatók le. A komputációs szint a legáltalánosabb, és egyben a legmagasabb szintű leírás, míg a hardver szint a legkonkrétabb, legalacsonyabb szintet jelenti. A leírási szintek alkalmazható természetesen a látásra is.

Komputációs szint[szerkesztés]

A megismerés céljához kapcsolódik. Vizuális észlelés esetében az a cél, hogy a fénymintázat-bemenetet olyan kimenetté alakítsuk, mely információt szolgáltat a külvilág tárgyairól.

Algoritmikus szint[szerkesztés]

A megismerésben lényeges folyamatok részleteivel foglalkozik: mi a bemenet reprezentációja, és mi az átalakítás algoritmusa.

Hardver szint[szerkesztés]

A hardver szint az agy, mely korlátokat szab annak, hogy milyen reprezentációkat és algoritmusokat lehet alkalmazni.

A látás komputációs elmélete[szerkesztés]

Marr szerint a látásban szerepet játszó folyamatok reprezentációk sorozatát hozzák létre. Három fajta reprezentációt különböztetett meg: az első vázlatot, a 2,5 D vázlatot és a 3 D modellt.

Az első vázlat[szerkesztés]

Az első vázlat a vizuális bemenetet a megfigyelő szempontjából írja le. Két változata van: a nyers első vázlat és a teljes első vázlat. A nyers első vázlat a vizuális kép fényintenzitás-változásairól ad információt, míg a teljes első vázlat úgy jön létre, hogy ezt az információt felhasználjuk a tárgyak számának és alakjának azonosításában.

2,5 D vázlat[szerkesztés]

Az első vázlatból a 2,5 D vázlatba való átmenet során olyan információt is figyelembe veszünk, mint az árnyék, a mozgás, a textúra, az alak vagy a binokuláris diszparitás. Emiatt a kép már nem 2 dimenziós, de még nem is teljesen 3 dimenziós – innen ered az átmeneti, 2,5 D vázlat elnevezés. Annak érdekében, hogy a két szemből származó információ megfelelően illeszkedjen, Marr és Poggio az alábbi három szabályt fogalmazta meg:

  1. binokuláris kombinációs szabály: csak akkor lehet összevetni az első vázlat elemeit, ha azok kompatibilisek, például egyforma a színük.
  2. binokuláris kombinációs szabály: minden elem csak egyetlen másik elemhez illeszkedhet.
  3. binokuláris kombinációs szabály: az egymáshoz közeli pontok feltehetően ugyanakkora távolságra vannak a megfigyelőtől, és a diszparitás információ figyelembe veszi a távolságot.

3 D modell[szerkesztés]

A 3 D modell a tárgyak nézőfüggetlen, háromdimenziós leírását adja. Marr és Nishihara három kritériumot írt le a modell reprezentációjához:

  1. Hozzáférhetőség – azt jelenti, hogy milyen könnyen lehet létrehozni a reprezentációt.
  2. Hatókör és egyediség – a hatókör arra utal, hogy a reprezentációt mennyire lehet alkalmazni egy adott kategóriába tartozó tárgyakra; egyediségen pedig azt értjük, hogy egy tárgy minden egyes nézete ugyanazt a reprezentációt hozza létre.
  3. Stabilitás és érzékenység – a reprezentáció magában foglalja a tárgyak közötti hasonlóságot és különbséget is.

Marr és Nishihara szerint a tárgyak leírására szolgáló primitív egységek hengerek, melyek hierarchikusan szerveződnek: a magasabb szintű egységek a tárgy alakjáról, az alacsonyabb szintű egységek pedig a tárgy részleteiről nyújtanak információt.

Irodalom[szerkesztés]

Eysenck, Michael W., & Keane, Mark T. (1997). Kognitív pszichológia. Budapest: Nemzeti Tankönyvkiadó.

Jegyzetek[szerkesztés]

  1. BnF források (francia nyelven)
  2. Representation and recognition of the movements of shapes

További információk[szerkesztés]