Spätná indukcia
Čo je spätná indukcia?Spätná indukcia v teórii hry je iteračný proces zdôvodňovania spätne v čase, od konca problému alebo situácie, na vyriešenie konečnej rozsiahlej formy a postupných hier a odvodenie sledu optimálnych akcií.
Spätná indukcia je vysvetlená
Spätná indukcia sa používa na riešenie hier, pretože John von Neumann a Oskar Morgenstern založili teóriu hier ako akademický predmet, keď v roku 1944 publikovali svoju knihu Teória hier a ekonomické správanie .
V každej fáze hry spätná indukcia určuje optimálnu stratégiu hráča, ktorý urobí posledný ťah v hre. Potom sa určí optimálna akcia nasledujúceho posledného pohybujúceho sa hráča, pričom posledný hráč bude konať podľa daného postupu. Tento proces pokračuje späť, až kým sa neurčí najlepšia akcia pre každý časový bod. V skutočnosti jeden určuje rovnováhu Nash každej podhry pôvodnej hry.
Výsledky odvodené zo spätnej indukcie však často nedokážu predpovedať skutočnú ľudskú hru. Experimentálne štúdie ukázali, že „racionálne“ správanie (ako predpovedá teória hry) sa málokedy prejavuje v skutočnom živote. Iracionálni hráči môžu nakoniec získať vyššie odmeny, než sa predpokladalo pri spätnej indukcii, ako je znázornené v stonožkovej hre.
V hre stonožky dvaja hráči striedavo dostanú šancu vziať väčší podiel na zvyšujúcom sa hrnci peňazí alebo odovzdať banku druhému hráčovi. Výplaty sú usporiadané tak, že ak je banko odovzdané súperovi a súper vezme banku v ďalšom kole, dostane o niečo menej, ako keby banku v tomto kole chytil. Hra končí, akonáhle hráč vezme úkryt, pričom tento hráč získa väčšiu časť a druhý hráč dostane menšiu časť.
Príklad spätnej indukcie
Predpokladajme napríklad, že hráč A ide skôr a musí sa rozhodnúť, či má „vziať“ alebo „prejsť“ skrýšu, ktorá v súčasnosti predstavuje 2 doláre. Ak tak urobí, potom A a B dostanú po 1 $, ale ak A prejde, rozhodnutie o tom, či prijať alebo prejsť, musí teraz urobiť hráč B. Ak to vezme B, dostane $ 3 (tj predchádzajúci vklad 2 $ + 1 $) a A dostane 0 dolárov. Ale ak B prejde, A teraz sa rozhodne, či vziať alebo prejsť, atď. Ak sa obaja hráči vždy rozhodnú zložiť, na konci hry dostanú každý z nich výplatu 100 dolárov.
Zmyslom hry je, že ak A a B spolupracujú a pokračujú až do konca hry, dostanú maximálnu výplatu 100 dolárov za každú. Ak však nedôverujú druhému hráčovi a očakávajú, že ho pri prvej príležitosti „vezmú“, Nashova rovnováha predpovedá, že hráči zaujmú najnižšiu možnú hodnotu (v tomto prípade $ 1).
Nashova rovnováha tejto hry, kde žiadny hráč nemá motiváciu odchýliť sa od zvolenej stratégie po zvážení výberu súpera, navrhuje, aby prvý hráč využil bank v prvom kole hry. V skutočnosti to však robí relatívne málo hráčov. Výsledkom je vyššia návratnosť, než predpokladala analýza rovnováhy.
Riešenie sekvenčných hier pomocou spätnej indukcie
Nižšie je uvedená jednoduchá sekvenčná hra medzi dvoma hráčmi. Štítky s prehrávačom 1 a prehrávačom 2 v nich sú informačnými sadami pre hráčov jedného alebo dvoch. Čísla v zátvorkách na spodnej časti stromu sú výplaty v každom príslušnom bode. Hra je tiež postupná, takže hráč 1 urobí prvé rozhodnutie (vľavo alebo vpravo) a hráč 2 urobí rozhodnutie po hráčovi 1 (hore alebo dole).
postava 1
Spätná indukcia, rovnako ako celá teória hier, využíva predpoklady racionality a maximalizácie, čo znamená, že hráč 2 maximalizuje svoju návratnosť v akejkoľvek danej situácii. V oboch informáciách máme dve možnosti, celkovo štyri. Vylúčením možností, ktoré si hráč 2 nevyberie, môžeme zúžiť náš strom. Týmto spôsobom odvážime riadky, ktoré maximalizujú návratnosť hráča pri danej množine informácií.
Obrázok 2
Po tomto znížení môže hráč 1 maximalizovať svoje výplaty teraz, keď sú voľby hráča 2 známe. Výsledkom je rovnováha zistená spätným vyvolaním hráča 1 zvolením „right“ a Player 2 výberom „up“. Nižšie je uvedené riešenie hry s vyváženou cestou tučným písmom.
Obrázok 3
Napríklad by sa dalo ľahko vytvoriť hru podobnú tej vyššie, pomocou spoločností ako hráčov. Táto hra môže obsahovať scenáre vydania produktu. Ak chce spoločnosť 1 vydať produkt, čo by spoločnosť 2 mohla urobiť v reakcii na predpovedanie predaja tohto nového produktu v rôznych scenároch, môžeme zostaviť hru na predpovedanie toho, ako sa môžu udalosti vyvíjať. Nižšie uvádzame príklad toho, ako by niekto mohol modelovať taká hra.
Obrázok 4
Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.