Hlavná » obchodné » Spätná indukcia

Spätná indukcia

Čo je spätná indukcia?

Spätná indukcia v teórii hry je iteračný proces zdôvodňovania spätne v čase, od konca problému alebo situácie, na vyriešenie konečnej rozsiahlej formy a postupných hier a odvodenie sledu optimálnych akcií.

Spätná indukcia je vysvetlená

Spätná indukcia sa používa na riešenie hier, pretože John von Neumann a Oskar Morgenstern založili teóriu hier ako akademický predmet, keď v roku 1944 publikovali svoju knihu Teória hier a ekonomické správanie .

V každej fáze hry spätná indukcia určuje optimálnu stratégiu hráča, ktorý urobí posledný ťah v hre. Potom sa určí optimálna akcia nasledujúceho posledného pohybujúceho sa hráča, pričom posledný hráč bude konať podľa daného postupu. Tento proces pokračuje späť, až kým sa neurčí najlepšia akcia pre každý časový bod. V skutočnosti jeden určuje rovnováhu Nash každej podhry pôvodnej hry.

Výsledky odvodené zo spätnej indukcie však často nedokážu predpovedať skutočnú ľudskú hru. Experimentálne štúdie ukázali, že „racionálne“ správanie (ako predpovedá teória hry) sa málokedy prejavuje v skutočnom živote. Iracionálni hráči môžu nakoniec získať vyššie odmeny, než sa predpokladalo pri spätnej indukcii, ako je znázornené v stonožkovej hre.

V hre stonožky dvaja hráči striedavo dostanú šancu vziať väčší podiel na zvyšujúcom sa hrnci peňazí alebo odovzdať banku druhému hráčovi. Výplaty sú usporiadané tak, že ak je banko odovzdané súperovi a súper vezme banku v ďalšom kole, dostane o niečo menej, ako keby banku v tomto kole chytil. Hra končí, akonáhle hráč vezme úkryt, pričom tento hráč získa väčšiu časť a druhý hráč dostane menšiu časť.

Príklad spätnej indukcie

Predpokladajme napríklad, že hráč A ide skôr a musí sa rozhodnúť, či má „vziať“ alebo „prejsť“ skrýšu, ktorá v súčasnosti predstavuje 2 doláre. Ak tak urobí, potom A a B dostanú po 1 $, ale ak A prejde, rozhodnutie o tom, či prijať alebo prejsť, musí teraz urobiť hráč B. Ak to vezme B, dostane $ 3 (tj predchádzajúci vklad 2 $ + 1 $) a A dostane 0 dolárov. Ale ak B prejde, A teraz sa rozhodne, či vziať alebo prejsť, atď. Ak sa obaja hráči vždy rozhodnú zložiť, na konci hry dostanú každý z nich výplatu 100 dolárov.

Zmyslom hry je, že ak A a B spolupracujú a pokračujú až do konca hry, dostanú maximálnu výplatu 100 dolárov za každú. Ak však nedôverujú druhému hráčovi a očakávajú, že ho pri prvej príležitosti „vezmú“, Nashova rovnováha predpovedá, že hráči zaujmú najnižšiu možnú hodnotu (v tomto prípade $ 1).

Nashova rovnováha tejto hry, kde žiadny hráč nemá motiváciu odchýliť sa od zvolenej stratégie po zvážení výberu súpera, navrhuje, aby prvý hráč využil bank v prvom kole hry. V skutočnosti to však robí relatívne málo hráčov. Výsledkom je vyššia návratnosť, než predpokladala analýza rovnováhy.

Riešenie sekvenčných hier pomocou spätnej indukcie

Nižšie je uvedená jednoduchá sekvenčná hra medzi dvoma hráčmi. Štítky s prehrávačom 1 a prehrávačom 2 v nich sú informačnými sadami pre hráčov jedného alebo dvoch. Čísla v zátvorkách na spodnej časti stromu sú výplaty v každom príslušnom bode. Hra je tiež postupná, takže hráč 1 urobí prvé rozhodnutie (vľavo alebo vpravo) a hráč 2 urobí rozhodnutie po hráčovi 1 (hore alebo dole).

postava 1

Spätná indukcia, rovnako ako celá teória hier, využíva predpoklady racionality a maximalizácie, čo znamená, že hráč 2 maximalizuje svoju návratnosť v akejkoľvek danej situácii. V oboch informáciách máme dve možnosti, celkovo štyri. Vylúčením možností, ktoré si hráč 2 nevyberie, môžeme zúžiť náš strom. Týmto spôsobom odvážime riadky, ktoré maximalizujú návratnosť hráča pri danej množine informácií.

Obrázok 2

Po tomto znížení môže hráč 1 maximalizovať svoje výplaty teraz, keď sú voľby hráča 2 známe. Výsledkom je rovnováha zistená spätným vyvolaním hráča 1 zvolením „right“ a Player 2 výberom „up“. Nižšie je uvedené riešenie hry s vyváženou cestou tučným písmom.

Obrázok 3

Napríklad by sa dalo ľahko vytvoriť hru podobnú tej vyššie, pomocou spoločností ako hráčov. Táto hra môže obsahovať scenáre vydania produktu. Ak chce spoločnosť 1 vydať produkt, čo by spoločnosť 2 mohla urobiť v reakcii na predpovedanie predaja tohto nového produktu v rôznych scenároch, môžeme zostaviť hru na predpovedanie toho, ako sa môžu udalosti vyvíjať. Nižšie uvádzame príklad toho, ako by niekto mohol modelovať taká hra.

Obrázok 4

Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.

Súvisiace podmienky

Definícia stonožky Hra stonožky v teórii hier zahŕňa dvoch hráčov, ktorí striedavo dostávajú šancu získať väčší podiel na zvyšujúcom sa množstve peňazí. viac Ako funguje teória hier Teória hier je rámec pre modelovanie scenárov, v ktorých medzi hráčmi existuje konflikt záujmov. viac hry s nulovým súčtom Situácia, v ktorej je zisk jednej osoby rovnocenný so stratou inej osoby, takže čistá zmena majetku alebo výhod je nulová. Hra s nulovou sumou môže mať len dvoch hráčov alebo milióny účastníkov. viac Nash Equilibrium Nash Equilibrium je koncept v rámci teórie hier, kde optimálnym výsledkom hry je, že neexistuje motivácia odchýliť sa od pôvodnej stratégie. viac Definícia dilemy cestovateľov Cestovná dilema dokazuje paradox racionality - že nelogické rozhodnutia často vedú k lepšej návratnosti v teórii hier. viac Definícia zhodných halierov Porovnanie halierov je základný príklad teórie hier, ktorý ukazuje, ako sa racionálni rozhodovatelia snažia maximalizovať svoje výhody. ďalšie partnerské odkazy

← Pohľad na Vanguardovu S&P 500 ETF

Identifikovateľné aktívum →

Odporúčaná

Zanechajte Svoj Komentár