„Fogolydilemma” változatai közötti eltérés

A Wikipédiából, a szabad enciklopédiából
[ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
kiegészítés az angol cikk alapján: http://en.wikipedia.org/w/index.php?title=Prisoner%27s_dilemma&oldid=428395178#Generalized_form
36. sor: 36. sor:
Ha lenne lehetőség a másik játékos megbüntetésére, akkor azzal kooperációra lehetne kényszeríteni a másik felet. A fogolydilemma <!--lejjebb tárgyalt -->sorozatos változata pontosan ilyen büntetésre ad módot.
Ha lenne lehetőség a másik játékos megbüntetésére, akkor azzal kooperációra lehetne kényszeríteni a másik felet. A fogolydilemma <!--lejjebb tárgyalt -->sorozatos változata pontosan ilyen büntetésre ad módot.
Az ilyen változatban egy fogoly, ha egy társa ellene vallott, akkor a következő fordulóban megbüntetheti azzal, hogy vallomást tesz ellene.
Az ilyen változatban egy fogoly, ha egy társa ellene vallott, akkor a következő fordulóban megbüntetheti azzal, hogy vallomást tesz ellene.

== Általánosított forma ==
Kiemelhetjük a játék vázát, ha kivesszük a fogházas kerettörténetből. A játék általánosított formáját gyakran alkalmazzák a [[kísérleti közgazdaságtudomány]]ban. A következő szabályokkal megadhatjuk a játék egyik szokásos megfogalmazását.
:Adott két játékos és egy bankár. A játékosoknak két-két kártyája van, az egyik felirata "Kooperáció", a másiké "Defektálás" (ez a játék szokásos terminológiája). Mindkét játékos az egyik kártyáját lefordítva a bankár elé teszi. Mivel a kártyákat lefordítva teszik le, a játékosok nem tudják előre megismerni a másik választását<!-- (although revealing one's move does not affect the dominance analysis[1])-->. A kör végén a bankár felfordítja mindkét kártyát és a kártyáknak megfelelően fizet a játékosoknak.
Tekintsünk két játékost, az egyik legyen "piros", a másik "kék": ha a piros játékos defektál és a kék kooperál, a piros 5 pontot kap<!-- gets the Temptation to Defect payoff of 5 points-->, míg a kék játékos 0 pontot kap<!--receives the Sucker's payoff of 0 points-->. Ha mindketten kooperálnak, akkor a 3-3 pontját kapjnak<!-- they get the Reward for Mutual Cooperation payoff -->, ha mindketten defektálnak, akkor 1-1 ponthoz jutnak<!-- they get the Punishment for Mutual Defection payoff of 1 point -->. A kifizetéseket a lenti táblázat mutatja.

{| class="wikitable"
|+ Példa a fogolydilemma kifizetési mátrixára
|
!scope="col" style="color: #900"|Kooperálás
!scope="col" style="color: #900"|Defektálás
|-
!scope="row" style="color: #009"|Kooperálás
|<span style="color: #009">3</span>, <span style="color: #900">3</span>
|<span style="color: #009">0</span>, <span style="color: #900">5</span>
|-
!scope="row" style="color: #009"|Defektálás
|<span style="color: #009">5</span>, <span style="color: #900">0</span>
|<span style="color: #009">1</span>, <span style="color: #900">1</span>
|}

A "nyer-veszt" terminológiát használva a táblázat a következőképpen néz ki:

{| class="wikitable"
|
!scope="col" style="color: #900"|Kooperálás
!scope="col" style="color: #900"|Defektálás
|-
!scope="row" style="color: #009"|Kooperálás
|<div class="center"><span style="color: #009">nyer</span>-<span style="color: #900">nyer</span>
|<span style="color: #009">többet veszt</span>-<span style="color: #900">többet nyer</span></DIV>
|-
!scope="row" style="color: #009"|Defektálás
|<div class="center"><span style="color: #009">többet nyer</span>-<span style="color: #900">többet veszt</span></DIV>
|<div class="center"><span style="color: #009">veszt</span>-<span style="color: #900">veszt</span></DIV>
|}

Ezek a táblázatok a probléma illusztrálása végett vannak itt. A következő formában általánosíthatók:

{| class="wikitable"
|+ A fogolydilemma kifizetési mátrixának kanonikus alakja
|
!scope="col" style="color: #900"|Kooperáció
!scope="col" style="color: #900"|Defektálás
|-
!scope="row" style="color: #009"|Kooperáció
|<span style="color: #009">R</span>, <span style="color: #900">R</span>
|<span style="color: #009">S</span>, <span style="color: #900">T</span>
|-
!scope="row" style="color: #009"|Defektálás
|<span style="color: #009">T</span>, <span style="color: #900">S</span>
|<span style="color: #009">P</span>, <span style="color: #900">P</span>
|}

<!--Where T stands for Temptation to defect, R for Reward for mutual cooperation, P for Punishment for mutual defection and S for Sucker's payoff. -->Ahhoz, hogy fogolydilemmáról legyen szó, a következő egyenlőtlenségeknek kell fennállnia:
<math>T > R > P > S</math>

Ez a feltétel biztosítja, hogy a játék egyensúlyi kimenete <!-- állapota? equilibrium outcome volt angolul --> a defekció, ugyanakkor a kooperáció a Pareto-hatékony helyzet. A fenti feltétel mellett, ha a játékot ismételten játssza a két játékos, a következő feltételnek is fenn kell állnia:
<math>2 R > T + S</math>

Ez utóbbi kikötés nélkül a teljes kooperáció nem Pareto-hatékony, mivel a játékosok együttesen többet nyernek, ha felváltva kooperálnak és defektálnak<!--ha az egyik kooperál, a másik defektál-->.

Ezeket a szabályokat egy kognitív tudományokkal foglalkozó tudós, [[Douglas Hofstadter]] mutatta ki, és ő adta meg a játék egy tipikus formájának kanonikus leírását<!-- form the formal canonical description of a typical game of prisoner's dilemma.-->

Egy egyszerű speciális eset adódik, ha <math>T+S = P+R</math>.
<!-- A simple special case occurs when the advantage of defection over cooperation is independent of what the co-player does and cost of the co-player's defection is independent of one's own action, i.e. T+S = P+R. -->


== Lásd még ==
== Lásd még ==

A lap 2011. május 11., 16:24-kori változata

Fogolydilemma

A fogolydilemma a nem zéró összegű játékok egy fajtája. A lényege, hogy két, súlyos bűnténnyel gyanúsított fogoly közül vallomást tesz-e az egyik a másik ellen (azaz defektál, mivel a fogolydilemmával foglalkozó anyagokban kooperációnak nem a hatóságokkal való együttműködés, hanem a vallomástétel megtagadása minősül). Akárcsak a többi nem kooperatív játékelméleti problémában, itt is feltételezzük, hogy az egyes játékosok saját nyereségüket tartják szem előtt, tekintet nélkül a másik résztvevő nyereségére.

A fogolydilemmánál a Nash-egyensúly nem vezet mindkét fél számára optimális megoldáshoz, mert ez ebben az esetben azt jelenti, hogy mindkét fogoly vall a másik ellen, még akkor is, ha a kooperációval nagyobb lenne a nyereségük. Bár mindkét fogoly jobban járna, ha kooperálnának, és egyikük sem vallana a másik ellen, mégis mindkettejüknek személyes érdekében áll vallani, akkor is ha korábban kooperációt ígértek egymásnak. Ebben áll a fogolydilemma lényege.

A klasszikus fogolydilemma

A klasszikus fogolydilemma a következő:

Egy súlyos bűntény kapcsán két gyanúsítottat letartóztat a rendőrség. Mivel nem áll rendelkezésre elegendő bizonyíték a vádemeléshez, ezért elkülönítik őket egymástól és mindkettejüknek ugyanazt az ajánlatot teszik. Amennyiben az első fogoly vall és társa hallgat, akkor az előbbi büntetés nélkül elmehet, míg a másik, aki nem vallott, 10 év börtönt kap. Ha az első tagadja meg a vallomást és a második vall, akkor a másodikat fogják elengedni és az első kap 10 évet. Ha egyikük sem vall, akkor egy kisebb bűntényért 6 hónapot kapnak mindketten. Ha mindketten vallanak, mindegyikük 6 évet kap.

Az alábbi táblázattal foglalható össze a játék:

Egyik tagad Egyik vall
Másik tagad Mindketten 6 hónapot kapnak Egyik szabad, másik 10 évet kap
Másik vall Egyik 10 évet kap, másik szabad Mindkettő 6 évet kap

Tegyük fel, hogy mindkét fogoly abszolút önző és egyetlen céljuk saját büntetésük minimalizálása. Egy fogolynak két lehetősége van: hallgatni, azaz kooperálni, vagy egy vallomással elárulni a társat. Mindkét választás eredménye függeni fog attól, mit tesz a másik személy, de egyikük sem tudja, hogyan fog dönteni a másik. Még ha lehetőségük is lenne az összebeszélésre, akkor sem biztosan bízhatnának meg abban, hogy a másik megtartja az ígéretét.

Ha az egyik fogoly arra számít, hogy a másik majd kooperál és hallgat, akkor az optimális stratégia a vallomástétel, hiszen ezzel elérhető az azonnali szabadulás, miközben a másik 10 évet tölt majd a rács mögött. Amennyiben azt feltételezi, hogy a másik vallani fog, akkor is az lesz a legjobb választás, ha ő is vallomást tesz, hiszen így megúszhatja a teljes 10 éves ítéletet, és csak 6 évet kell leülnie, ahogy a másiknak is. Amennyiben persze mindketten kooperálnak és hallgatnak, akkor mindketten kiszabadulhatnának 6 hónap után.

Mindképpen a vallomás lesz a meghatározó stratégia mindkét résztvevő számára. Mindegy, hogyan dönt a másik játékos, a vallomással elkerülhető a rosszabb lehetőség. A foglyok számára sajnálatos módon pont ez fog elvezetni ahhoz a szerencsétlen végkimenetelhez, mikor mindkettő vall és mindkettő súlyos büntetést kap. Ez a fogolydilemma gyökere.

Ha a csoport – azaz a két fogoly közös – érdekeit tekintjük, akkor a helyes stratégia a kooperáció, hiszen ez fogja az összesen letöltött büntetés idejét minimalizálni. Bármely más döntés előnytelenebb lenne, ha a két fogoly együttes érdekeit vizsgáljuk.

Ha lenne lehetőség a másik játékos megbüntetésére, akkor azzal kooperációra lehetne kényszeríteni a másik felet. A fogolydilemma sorozatos változata pontosan ilyen büntetésre ad módot. Az ilyen változatban egy fogoly, ha egy társa ellene vallott, akkor a következő fordulóban megbüntetheti azzal, hogy vallomást tesz ellene.

Általánosított forma

Kiemelhetjük a játék vázát, ha kivesszük a fogházas kerettörténetből. A játék általánosított formáját gyakran alkalmazzák a kísérleti közgazdaságtudományban. A következő szabályokkal megadhatjuk a játék egyik szokásos megfogalmazását.

Adott két játékos és egy bankár. A játékosoknak két-két kártyája van, az egyik felirata "Kooperáció", a másiké "Defektálás" (ez a játék szokásos terminológiája). Mindkét játékos az egyik kártyáját lefordítva a bankár elé teszi. Mivel a kártyákat lefordítva teszik le, a játékosok nem tudják előre megismerni a másik választását. A kör végén a bankár felfordítja mindkét kártyát és a kártyáknak megfelelően fizet a játékosoknak.

Tekintsünk két játékost, az egyik legyen "piros", a másik "kék": ha a piros játékos defektál és a kék kooperál, a piros 5 pontot kap, míg a kék játékos 0 pontot kap. Ha mindketten kooperálnak, akkor a 3-3 pontját kapjnak, ha mindketten defektálnak, akkor 1-1 ponthoz jutnak. A kifizetéseket a lenti táblázat mutatja.

Példa a fogolydilemma kifizetési mátrixára
Kooperálás Defektálás
Kooperálás 3, 3 0, 5
Defektálás 5, 0 1, 1

A "nyer-veszt" terminológiát használva a táblázat a következőképpen néz ki:

Kooperálás Defektálás
Kooperálás
nyer-nyer
többet veszt-többet nyer
Defektálás
többet nyer-többet veszt
veszt-veszt

Ezek a táblázatok a probléma illusztrálása végett vannak itt. A következő formában általánosíthatók:

A fogolydilemma kifizetési mátrixának kanonikus alakja
Kooperáció Defektálás
Kooperáció R, R S, T
Defektálás T, S P, P

Ahhoz, hogy fogolydilemmáról legyen szó, a következő egyenlőtlenségeknek kell fennállnia:

Ez a feltétel biztosítja, hogy a játék egyensúlyi kimenete a defekció, ugyanakkor a kooperáció a Pareto-hatékony helyzet. A fenti feltétel mellett, ha a játékot ismételten játssza a két játékos, a következő feltételnek is fenn kell állnia:

Ez utóbbi kikötés nélkül a teljes kooperáció nem Pareto-hatékony, mivel a játékosok együttesen többet nyernek, ha felváltva kooperálnak és defektálnak.

Ezeket a szabályokat egy kognitív tudományokkal foglalkozó tudós, Douglas Hofstadter mutatta ki, és ő adta meg a játék egy tipikus formájának kanonikus leírását

Egy egyszerű speciális eset adódik, ha .

Lásd még

Külső hivatkozások