Teória a výskum hier. Typy konfliktných situácií. Čo je teória hier

21.09.2019

Pre nepolitického odborníka Bruce Bueno de Mesquita z New York University robí veci prekvapivo presné. Podarilo sa mu predpovedať s presnosťou na niekoľko mesiacov odchod zo svojich postov a Mušarafov obrat. Presne vymenoval nástupcu ajatolláha Chomejního vo funkcii vodcu Iránu 5 rokov pred jeho smrťou. Na otázku, v čom spočíva tajomstvo, odpovedá, že odpoveď nepozná – hra áno. Hra tu znamená matematickú metódu, ktorá bola pôvodne vytvorená na vytváranie a analýzu stratégií rôznych hier, konkrétne teórie hier. V ekonomike sa používa najčastejšie. Hoci pôvodne bol vyvinutý na konštrukciu a analýzu stratégií v hrách používaných na zábavu.

Teória hier je numerický aparát, ktorý umožňuje vypočítať scenár, alebo presnejšie, pravdepodobnosť rôznych scenárov správania sa systému alebo „hry“ riadenej rôznymi faktormi. Tieto faktory zasa určuje množstvo „hráčov“.

Teória hier, ktorá dostala hlavný impulz pre rozvoj v ekonómii, sa teda môže uplatniť v širokej škále oblastí ľudskej činnosti. Je príliš skoro povedať, že tieto programy budú použité na riešenie vojenských konfliktov, ale v budúcnosti je to celkom možné.

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Študenti, postgraduálni študenti, mladí vedci, ktorí pri štúdiu a práci využívajú vedomostnú základňu, vám budú veľmi vďační.

Uverejnené dňa http://www.allbest.ru/

Federálna komunikačná agentúra

Sibírska štátna univerzita telekomunikácií a informatiky

Medziregionálne centrum pre rekvalifikáciu odborníkov

Test

Disciplína: Inštitucionálna ekonómia

Doplnila: Lapina E.N.

Skupina: EBT-52

Možnosť: 4

Novosibirsk, 2016

ÚVOD

Každý človek na svete každý deň vykonáva nejakú činnosť, v niečom sa rozhoduje. Aby človek mohol vykonať akékoľvek kroky, musí premýšľať o ich dôsledkoch, vybrať si najsprávnejšie a najracionálnejšie zo všetkých možných rozhodnutí. Voľba musí byť vykonaná na základe ich vlastných alebo skupinových záujmov v závislosti od toho, komu rozhodnutie patrí (jednotlivec alebo skupina, organizácia ako celok).

Inštitúcie sú vytvorené ľuďmi, aby udržali poriadok a znížili neistotu výmeny. Poskytujú predvídateľnosť ľudského správania. Inštitúcie nám umožňujú šetriť naše myslenie, keďže keď sme sa naučili pravidlá, môžeme sa prispôsobiť vonkajšiemu prostrediu bez toho, aby sme sa ho snažili pochopiť a pochopiť. Petrosyan L.A., Zenkevich N.A., Shevkoplyas E.V.: Teória hier: učebnica. Vydavateľstvo: BHV, 2012.-С.18.

Inštitúcie sú „pravidlá hry“ v spoločnosti, alebo formálnejšie, človekom vytvorené obmedzenia, ktoré organizujú vzťahy medzi ľuďmi. Labsker L.G., Yashchenko N.A.: Teória hier v ekonómii. Workshop s riešením problémov. Návod. Vydavateľstvo: Knorus, 2014.-S.21. Vznikajú inštitúcie, ktoré riešia problémy, ktoré vznikajú pri opakovaných interakciách medzi ľuďmi. Zároveň musia problém nielen vyriešiť, ale aj minimalizovať prostriedky vynaložené na jeho riešenie.

Teória hier je matematická metóda na štúdium optimálnych stratégií v hrách. Hrou sa rozumie proces, v ktorom sú dve alebo viaceré strany zapojené do boja o realizáciu svojich záujmov. Každá zo strán má svoj vlastný cieľ a používa určitú stratégiu, ktorá môže viesť k výhre alebo prehre v závislosti od jej správania a správania ostatných hráčov. Teória hier vám pomáha pri výbere najziskovejších stratégií, pričom zohľadňuje niekoľko faktorov:

1. úvahy o ostatných účastníkoch;

2. zdroje účastníkov;

3. zamýšľané činy účastníkov.

V teórii hier sa predpokladá, že výplatné funkcie a množina stratégií dostupných každému z hráčov sú všeobecne známe, t.j. každý hráč pozná svoju výplatnú funkciu a súbor stratégií, ktoré má k dispozícii, ako aj výplatné funkcie a stratégie všetkých ostatných hráčov a v súlade s týmito informáciami formuje svoje správanie.

Aktuálnosť témy spočíva v širokom spektre aplikácií teórie hier v praxi (biológia, sociológia, matematika, manažment a pod.). Konkrétne v ekonómii v takých momentoch, keď nefungujú teoretické základy teórie výberu v klasickej ekonomickej teórii, napríklad v tom, že spotrebiteľ robí svoju voľbu racionálne, si plne uvedomuje situáciu na tomto trhu a o konkrétny daný produkt.

KAPITOLA 1. TEORETICKÉ ZÁKLADY TEÓRIE HER

1.1 KONCEPCIA TEÓRIE HER

Ako bolo uvedené vyššie, teória hier je oblasť matematiky, ktorá študuje formálne modely na prijímanie optimálnych rozhodnutí v konflikte. Konflikt sa v tomto prípade chápe ako jav, na ktorom sa zúčastňujú rôzne strany, ktoré majú rôzne záujmy a príležitosti na výber akcií, ktoré majú k dispozícii v súlade s týmito záujmami. Každá zo strán má svoj vlastný cieľ a používa nejakú stratégiu, ktorá môže viesť k výhre alebo prehre v závislosti od správania ostatných hráčov. Teória hier vám pomáha pri výbere najlepších stratégií, berúc do úvahy nápady ostatných účastníkov, ich zdroje a možné akcie

Teória hier má svoje korene v neoklasickej ekonómii. Po prvýkrát boli matematické aspekty a aplikácie teórie prezentované v klasickej knihe Johna von Neumanna a Oskara Morgensterna z roku 1944 „Teória hier a ekonomické správanie“.

Hra je zjednodušeným formalizovaným modelom skutočnej konfliktnej situácie. Matematicky formalizácia znamená, že boli vyvinuté určité pravidlá pre konanie strán v priebehu hry: možnosti konania strán; výsledok hry pre túto možnosť; množstvo informácií, ktoré má každá strana o správaní všetkých ostatných strán.

Situácie, v ktorých sa zrážajú záujmy dvoch strán a výsledok akejkoľvek operácie vykonanej jednou zo strán závisí od konania druhej strany, sa nazývajú konfliktné situácie.

Hráč je jednou zo strán v hernej situácii. Stratégiou hráča sú jeho pravidlá konania v každej z možných situácií hry. Dominancia v teórii hier je situácia, v ktorej jedna zo stratégií určitého hráča prináša väčšiu odmenu ako druhá za akékoľvek akcie jeho protivníkov. Protasov I.D. Teória hier a operačný výskum: učebnica. príspevok. - M .: Helios ARV, 2013.-S.121.

Ústredným bodom je rovnováha v koordinačnej hre, ktorú si vyberajú všetci účastníci interakcie na základe spoločných vedomostí, ktoré im pomáhajú koordinovať ich výber. Koncept ústredného bodu zaviedol ekonóm nositeľ Nobelovej ceny za rok 2005 Thomas Schelling v článku z roku 1957, ktorý sa stal treťou kapitolou jeho slávnej knihy Stratégia konfliktu (1960).

Ak pre jedného z hráčov existuje striktne dominantná stratégia, použije ju v ktorejkoľvek z Nashových rovnováh v hre. Ak majú všetci hráči striktne dominantné stratégie, hra má jedinú Nashovu rovnováhu. Táto rovnováha však nemusí byť nevyhnutne Pareto účinná, t.j. nerovnovážne výsledky môžu poskytnúť väčšie zisky pre všetkých hráčov. Väzňova dilema je klasickým príkladom tejto situácie. Nashova rovnováha je súbor stratégií (jedna pre každého hráča), takže žiadny z hráčov nemá motiváciu odchýliť sa od svojej stratégie. Pareto efektívna situácia bude vtedy, ak žiadny z hráčov nedokáže zlepšiť svoju pozíciu bez toho, aby sa druhý hráč nezhoršil.

Treba spomenúť aj Stackelbergovu rovnováhu. Stackelbergova rovnováha je situácia, keď žiadny z hráčov nemôže jednostranne zvýšiť svoju výplatu a rozhodnutia robí najprv jeden hráč a o nich sa dozvie druhý hráč. Na rozdiel od rovnováhy dominantných stratégií a Nashovej rovnováhy tento typ rovnováhy vždy existuje.

Teóriu hier možno interpretovať dvoma spôsobmi: maticovou a grafickou. Nižšie bude znázornená maticová metóda, kde budú zvážené situácie, ktoré vedú k vzniku inštitúcií.

Ako príklad grafického znázornenia uvažujme nasledujúcu situáciu, kde je jedna pastva pre pasúce sa kravy. Teraz si položme otázku: pre koľko kráv, n, by bolo využitie tejto pastviny optimálne? V súlade s princípom hraničnej optimalizácie, ktorý predpokladá rovnicu hraničných nákladov a hraničného príjmu, by mala byť odpoveď, že optimálny počet kráv bude taký, pri ktorom bude hodnota hraničného produktu z pasenia poslednej kravy VМР. vo výške nákladov na jednu kravu, p. V podmienkach súkromného vlastníctva tejto pastviny by bol tento princíp dodržaný, keďže individuálny vlastník by porovnával úžitky a náklady spojené s každou ďalšou kravou a zastavil by sa na tom čísle, Ер, pri ktorom by bola možnosť získať kladné nájomné. z pasúcich sa kráv na pastvine by sa vyčerpal Rp, a teda by sa dosiahlo maximum tohto nájomného (obr. 1). To je zhrnuté v rovnici nižšie, ktorá maximalizuje rozdiel medzi hodnotou celkového produktu, VTP, a celkovými nákladmi, teda hodnotou kravy vynásobenou počtom kráv pri dodržaní princípu marže.

VMP (n *) = c maxn VTP (n) - cn (1)

Obrázok 1. - Graf hodnoty okrajovej a priemernej pastvy kráv

V podmienkach voľného prístupu na pastvu, teda absencie výhradných práv na ňu, však nebude dodržaný marginálny princíp optimalizácie a počet kráv na pastve prekročí optimálnu hodnotu Ер a dosiahne bod o rovnosti hodnoty priemerného produktu z pasenia kravy, VAP a nákladov na kravu. ... Výsledkom bude nový rovnovážny počet kráv v podmienkach voľného prístupu, Ес. V tomto prípade sa kladná renta Rp vytvorená pasením kráv, kým sa ich optimálny počet, Ep, nevynaloží na ďalšie kravy, a po dosiahnutí bodu Ес sa bude rovnať nule v dôsledku akumulácie rovnajúcej sa zápornej renty. v absolútnej hodnote. Toto je zhrnuté v nasledujúcich rovniciach:

VTP (n ") / n" = c? VTP (n ") - cn" = 0;

1.2 RÔZNOSŤ SITUÁCIÍ A OBLASTÍ ĽUDSKÉHO ŽIVOTA, V KTORÝCH JE UPLATNITEĽNÁ TEÓRIA HER

V živote existuje veľa príkladov kolízie opačných strán, ktoré majú podobu konfliktu s dvoma konajúcimi stranami sledujúcimi opačné záujmy.

Takéto situácie vznikajú napríklad pri dôvere. Súlad konania protistrany s očakávaniami sa stáva obzvlášť dôležitým v tých situáciách, keď je riziko rozhodnutí prijatého jednotlivcom určované konaním protistrany. Modely teórie hier sú toho najlepším príkladom: hráčova voľba konkrétnej stratégie závisí od akcií iného hráča. Dôvera spočíva v „očakávaní určitých činov druhých, ktoré ovplyvňujú voľbu jednotlivca, keď jednotlivec musí začať konať skôr, ako sa činy druhých stanú známymi“. Zdôraznime prepojenie transakcií na trhu a dôvery v odosobnenej podobe (dôvera ako norma upravujúca vzťahy medzi jednotlivcami), keďže okruh účastníkov transakcií by sa nemal obmedzovať na osobne známe osoby. Nasledujúci model pomáha zabezpečiť existenciu dôvery v depersonalizovanej forme na realizáciu najjednoduchšej trhovej transakcie pomocou predplatenia (obr. 2).

Obrázok 2

Predpokladajme, že kupujúci je konfrontovaný mnohými predávajúcimi a z predchádzajúcich obchodných skúseností pozná pravdepodobnosť oklamania (1 - p). Vypočítajme takú hodnotu p, aby transakcia prebehla, čiže „zaplatenie zálohy“ je evolučne stabilná stratégia.

EÚ (uskutočniť platbu vopred) = 10p – 5 (1 – p) = 15p – 5,

EÚ (bez platby vopred) = 0,15p - -5> 0, p> 1/3.

Inými slovami, ak je miera dôvery kupujúceho v predajcov nižšia ako 33,3 %, predplatené transakcie sa za daných podmienok stávajú nemožnými. Inými slovami, p = 1/3 je kritická, minimálna požadovaná úroveň dôvery.

Na zovšeobecnenie výsledkov nahrádzame konkrétne hodnoty zisku kupujúceho (10) a straty (--5) symbolmi G a L. Potom, s predchádzajúcou štruktúrou hry, sa obchod uskutoční o

čím vyššia je hodnota straty v pomere k zisku, tým vyššia by mala byť úroveň dôvery medzi stranami transakcie. James Coleman vykreslil závislosť potreby dôvery od podmienok transakcie nasledovne (obr. 3).

Obrázok 3

Vypočítaná minimálna požadovaná úroveň spoľahlivosti je empiricky potvrdená. Teda miera odosobnenej dôvery v krajinách s vyspelou trhovou ekonomikou, meraná odpoveďou na otázku: „Myslíte si na základe vašich osobných skúseností, že ľuďom vo vašom okolí možno dôverovať? “Bolo 94 % v Dánsku 24, 90 – v Nemecku, 88 – vo Veľkej Británii, 84 – vo Francúzsku, 72 – na severe Talianska a 65 % – na juhu. Nízka miera dôvery na juhu Talianska, kde je tradične silná mafia, svedčí. Nie je náhoda, že jeden z výskumníkov mafie, D. Gambetta, vysvetľuje jej vznik kriticky nízkou úrovňou dôvery v južných regiónoch Talianska a následne potrebou náhrady za dôveru, ktorá má podobu intervencie „tretej strany“, ktorej dôverujú obe strany transakcie.

Ďalším pozoruhodným príkladom teórie hier sú zmluvy medzi investorom a štátom o rozvoji ložísk nerastných surovín.

Na ilustráciu tohto príkladu si zoberme zmluvu o kúpe a predaji stoličiek, berúc do úvahy skutočnosť, že prítomnosť zašitých pokladov v nich je otázna. Uvedieme príklad s prihliadnutím na skutočnosť, že v rámci teórie hier sa faktory mimo zámerov zmluvných strán zohľadňujú tak, že sa do hry s dvoma účastníkmi zapojí tretí hráč, „príroda“. (obr. 4).

Obrázok 4

Ako vyplýva z predstavenia hry v rozšírenej podobe, namiesto štyroch výsledkov je ich v hre šesť. A ak problém závislosti výplaty Ostapu od konania operátora javiska nájde svoje riešenie za prítomnosti akejkoľvek nenulovej úrovne dôvery Ostapa, potom problém závislosti výplaty Ostapu na prítomnosti pokladov v stoličkách zostáva nerozpustný, čo mimochodom potvrdzuje záver románu.

1.3 MOŽNÉ STRATÉGIE PRI OPAKOVANÍ HRY

1. Zmiešané stratégie. Keď sa hráči ocitnú v určitej vybranej situácii viackrát, ich interakcia sa výrazne skomplikuje. Môžu si dovoliť kombinovať stratégie, aby maximalizovali celkový zisk. Ukážme si to na modeli opisujúcom vzťah medzi centrálnou bankou (CB) a ekonomickým subjektom v súvislosti s menovou politikou centrálnej banky.

Centrálna banka sa zameriava buď na prísnu menovú politiku, ktorá sa snaží udržať infláciu na pevnej úrovni (p0), alebo na emisie a následne zvýšenie inflácie (p1). Ekonomický subjekt zasa koná na základe svojich inflačných očakávaní re (určuje ceny svojich produktov, rozhoduje o nákupe tovarov a služieb atď.), ktoré môžu byť buď potvrdené, alebo nie potvrdené v dôsledku sledovanej politiky. centrálnou bankou. Ak p1> pe, centrálna banka dostane zisky zo seigniorage a inflačnej dane. Ak pe = p1, stratí centrálna banka v dôsledku zníženia príjmov zo seigniorage aj ekonomické subjekty, ktoré naďalej znášajú bremeno inflačnej dane. Ak je pe = p0, potom sa zachová status quo a nikto neprehrá. Napokon, ak p> p0, tak strácajú iba ekonomické subjekty: výrobcovia – kvôli strate dopytu po neprimerane drahých výrobkoch, spotrebitelia – kvôli vytváraniu neoprávnených zásob.

V navrhovanom modeli s jedinou interakciou nemajú agenti žiadne dominantné stratégie a neexistuje ani Nashova rovnováha. Pri mnohokrát opakovaných interakciách, a práve táto interakcia je typická pre reálne situácie, môžu obaja účastníci použiť jednu aj druhú stratégiu, ktorú majú k dispozícii. Umožňuje striedanie stratégií v určitom poradí hráčom maximalizovať ich užitočnosť, t. j. dosiahnuť Nashovu rovnováhu v zmiešaných stratégiách: výsledok, v ktorom žiadny účastník nemôže zvýšiť svoj zisk jednostrannou zmenou svojej stratégie? Predpokladajme, že centrálna banka vykonáva prísnu menovú politiku s pravdepodobnosťou P1 (v P1 % prípadov) as pravdepodobnosťou (1 - P1) - inflačnú politiku. Keď potom ekonomický subjekt zvolí neinflačné očakávania (pe = p0), centrálna banka môže očakávať zisk rovný

teória herná stratégia

EÚ (CB) = Р1 0+,

1 (1 - P1) = 1 - P1

V prípade inflačných očakávaní bude zisk ekonomického agenta pre centrálnu banku

EU (CB) = P10 + (1 - P1) (- 2) = 2P1 - 2.

Teraz predpokladajme, že ekonomický subjekt má neinflačné očakávania s pravdepodobnosťou P2 (v P2% prípadov) a inflačné očakávania - s pravdepodobnosťou (1 - P2). Očakávaná užitočnosť centrálnej banky teda bude

EU (CB) = P2 (1 - P1) + (1 - P2) (2R1-2) = = ZR2-ZR1 P2 + 2P1 - 2 (obr. 5).

Obrázok 5

Podobné výpočty poskytnú ekonomickému agentovi

EU (e.a.) = P1 (P2-1) + (1 - P1) (- P2-2) = 2P1P2 + P1- P2-2.

Ak tieto výrazy prepíšeme do nasledujúceho tvaru

EU (CB) = Pl (2-3P2) + ZR2-2

EÚ (e.a.) = = P2 (2P1-1) + P1-2,

potom je ľahké to vidieť

zisk centrálnej banky nezávisí od jej vlastnej politiky a ak

odmena ekonomického agenta nezávisí od jeho očakávaní.

Inými slovami, Nashovu rovnováhu v zmiešaných stratégiách bude tvoriť ekonomický subjekt v 2/3 prípadov neinflačných očakávaní a konanie centrálnej banky v polovici prípadov prísnej menovej politiky. Zistená rovnováha je dosiahnuteľná za predpokladu, že ekonomické subjekty budú vytvárať očakávania racionálnym spôsobom, a nie na základe inflačných očakávaní z predchádzajúceho obdobia, očistených o chybu prognózy z predchádzajúceho obdobia8. V dôsledku toho zmeny v politike centrálnej banky ovplyvňujú správanie ekonomických subjektov len do tej miery, do akej sú neočakávané a nepredvídateľné. Stratégia centrálnej banky je v 50 % prípadov tvrdá menová politika av 50 % mierna je najlepším možným spôsobom, ako vytvoriť atmosféru nepredvídateľnosti.

2. Evolučná stabilná stratégia. Evolučne stabilná stratégia je taká stratégia, že ak ju používa väčšina jednotlivcov, žiadna alternatívna stratégia ju nemôže nahradiť mechanizmom prirodzeného výberu, aj keď ten je paretovsky efektívnejší.

Druhom opakujúcich sa hier sú situácie, keď sa jedinec opakovane ocitne v určitej situácii výberu, no jeho protipól nie je stály a v každom období jedinec interaguje s novým protipólom. Pravdepodobnosť, že si protistrana zvolí konkrétnu stratégiu, preto nebude závisieť ani tak od konfigurácie zmiešanej stratégie, ako skôr od preferencií každej z protistrán. Predovšetkým sa predpokladá, že z celkového počtu N potenciálnych protistrán n (n / N %) vždy volí stratégiu A, a m (m / N %) - stratégiu B. To vytvára predpoklady na dosiahnutie nového typu rovnováhy. , evolučne stabilné stratégie. Evolučná stabilná stratégia (ESS) je stratégia, v ktorej ak ju používajú všetci členovia určitej populácie, žiadna alternatívna stratégia ju nemôže nahradiť mechanizmom prirodzeného výberu. Uvažujme ako príklad najjednoduchší variant koordinačného problému: míňanie dvoch áut na úzkej ceste. Predpokladá sa, že v danej lokalite sú ľavostranné a pravostranné dopravné normy rovnaké (resp. jednoducho nie sú vždy dodržané pravidlá cestnej premávky). Auto A ide smerom k niekoľkým autám, s ktorými sa potrebuje rozlúčiť. Ak obe autá idú vľavo, vchádzajúc na ľavú krajnicu v smere jazdy, tak odchádzajú bez problémov. To isté sa stane, ak obe autá odbočia doprava. Keď jedno auto pôjde doprava, druhé doľava a naopak, nebudú sa môcť rozísť (obr. 6).

Obrázok 6

Takže motorista A pozná približné percento motoristov B, ktorí systematicky idú doľava (P), a percento motoristov B, ktorí idú doprava (1 - R). Podmienka, aby sa stratégia „uber doprava“ stala pre motoristu A evolučne stabilnou, je formulovaná nasledovne: EÚ (vpravo)> EÚ (vľavo), príp.

0P + 1 (1 - P)> 1P + 0 (1 - P),

odkiaľ P< 1/2. Таким образом, при превышении доли автомобилистов во встречном потоке, принимающих вправо, уровня 50% эволюционно-стабильной стратегией становится «принять вправо» -- сворачивать на правую обочину при каждом разъезде.

Vo všeobecnosti sú požiadavky na evolučne stabilnú stratégiu napísané nasledovne. Stratégia I, ktorú používajú protistrany s pravdepodobnosťou p, je pre hráča evolučne stabilná vtedy a len vtedy, ak sú splnené nasledujúce podmienky

EÚ (I, p)> EÚ (J, p),

ktorý je identický

pU (I, I) + (l -p) U (I, J)> pU (J, I) + (1 - p) U (J, J) (3)

Z čoho vyplýva:

U (I, I)> U (J, I)

U (I, I) = U (J, I)

U (I, J)> U (J, J),

kde - U (I, I) odmena hráča pri výbere stratégie I, ak si protistrana zvolí stratégiu I; U (J, I) - odmena hráča pri voľbe stratégie J, ak si protistrana zvolí stratégiu I atď.

Obrázok 7

Tieto podmienky môžete znázorniť aj graficky. Odložme na zvislú os očakávanú užitočnosť výberu jednej alebo druhej stratégie a na vodorovnú os podiel jednotlivcov na celkovej populácii hráčov, ktorí si zvolia obe stratégie. Potom dostaneme nasledujúci graf (hodnoty sú prevzaté z modelu prejazdu dvoch áut), znázorneného na obr. 7.

Z obrázku vyplýva, že „ubrať doľava“ aj „zabrať doprava“ majú rovnaké šance stať sa evolučne stabilnou stratégiou, pokiaľ ani jedna z nich nepokryje viac ako polovicu „populácie“ vodičov. Ak stratégia prekročí túto hranicu, postupne, ale nevyhnutne, nahradí inú stratégiu a pokryje celú populáciu vodičov. Faktom je, že ak stratégia prekročí 50 %, pre každého vodiča sa stane ziskovým, aby ju použil pri manévroch, čo následne ešte viac zvyšuje atraktivitu tejto stratégie pre ostatných vodičov. V striktnej forme bude toto vyhlásenie vyzerať takto

dp / dt = G, G "> 0 (4)

Hlavným výsledkom analýzy opakujúcich sa hier je zvýšenie počtu rovnovážnych bodov a na tomto základe riešenie problémov koordinácie, spolupráce, kompatibility a spravodlivosti. Dokonca aj v dileme väzňov vám prechod na opakovanú interakciu umožňuje dosiahnuť optimálny Paretov výsledok („popierať vinu“) bez toho, aby ste prekročili normu racionality a zákaz výmeny informácií medzi hráčmi. Presne toto je význam „všeobecnej vety“: každý výsledok, ktorý vyhovuje jednotlivcovi, sa môže stať rovnovážnym počas prechodu na štruktúru opakovanej hry. V situácii dilemy väzňov môže byť rovnovážnym výsledkom za určitých podmienok jednoduchá stratégia „nerozpoznať“ a mnohé zmiešané stratégie. Spomedzi zmiešaných a evolučných stratégií si všimneme nasledovné: Sýkorka-pre-dve-začnite popretím viny a priznajte vinu len vtedy, ak protistrana priznala vinu v dvoch predchádzajúcich obdobiach za sebou; DOWING je stratégia založená na predpoklade, že protistrana rovnako pravdepodobne použije stratégie „popierať vinu“ a „priznať“ na samom začiatku hry. Ďalej sa podporuje každé popretie viny zo strany protistrany a každé priznanie sa trestá voľbou stratégie „priznania viny“ v nasledujúcom období; TESTER - začnite priznaním viny a ak vinu uzná aj protistrana, tak v ďalšom období vinu popierajte.

ZÁVER

Na záver možno esej zhrnúť o potrebe využitia teórie hier v moderných ekonomických podmienkach.

V kontexte alternatívy (výberu) je veľmi často ťažké rozhodnúť sa a zvoliť tú či onú stratégiu. Operačný výskum umožňuje použiť vhodné matematické metódy na informované rozhodnutie o vhodnosti konkrétnej stratégie. Teória hier, ktorá disponuje arzenálom metód riešenia maticových hier, umožňuje efektívne riešiť tieto problémy viacerými metódami a vybrať z ich súboru najefektívnejšie, ako aj zjednodušiť pôvodné matice hier.

Esej ilustrovala praktickú aplikáciu hlavných stratégií teórie hier a dospela k relevantným záverom, študovala najpoužívanejšie a najčastejšie používané stratégie a základné pojmy.

ZOZNAM POUŽITEJ LITERATÚRY

1. Petrosyan LA, Zenkevich NA, Shevkoplyas EV: Teória hier: učebnica. Vydavateľstvo: BHV, 2012.-212s.

2. Labsker LG, Yashchenko NA: Teória hier v ekonómii. Workshop s riešením problémov. Návod. Vydavateľstvo: Knorus, 2014.-125s.

3. Neilbuff, Dixit: Teória hier. Umenie strategického myslenia v biznise a živote. Vydavateľstvo: Mann, Ivanov a Ferber, 2015 .- 99s.

4. Oleinik A. N. Inštitucionálna ekonómia. Študijný sprievodca, Moskva INFRA-M, 2013.-78s.

5. Protasov I. D. Teória hier a operačný výskum: učebnica. príspevok. - M .: Helios ARV, 2013.-100s.

6. Samarov K.L. Matematika. Študijná príručka pre sekciu "Prvky teórie hier", LLC "Resolventa", 2011.-211s.

7. Shikin E.V. Matematické metódy a modely v manažmente: učebnica. manuál na cvičenie študentov. špecialista. univerzity. - M .: Delo, 2014.-201s.

Uverejnené na Allbest.ru

...

Podobné dokumenty

    Rôzne situácie a oblasti ľudského života, v ktorých je teória hier použiteľná. Potreba využitia teórie hier v moderných ekonomických podmienkach. Dôkaz potreby inštitúcií využívajúcich teóriu hier. Evolučná stabilná stratégia.

    ročníková práca, pridaná 28.11.2013

    Charakteristika podstaty hier – situácií, v ktorých je viacero subjektov, ktoré si uvedomujú, že svojím konaním ovplyvňujú správanie iných subjektov. Ciele teórie hier. Vypracovanie odporúčaní pre racionálne správanie hráčov, určenie optimálnej stratégie.

    prezentácia pridaná 31.03.2011

    Heckscher-Ohlinova teória medzinárodného obchodu. Samuelsonov teorém o vyrovnávaní cien faktorov. Teória „životného cyklu produktu“. Teória Michaela Portera: Teória konkurenčných výhod. Eklektická teória internacionalizácie produkcie služieb.

    test, pridané 05.12.2009

    Makroekonómia. Teória spotreby. Zdôvodnenie teórie. Objektívne a subjektívne faktory spotreby. Keynesiánska teória spotreby. Grafická interpretácia funkcie spotreby. Tvorba dopytu po tovaroch a službách.

    test, pridané 23.06.2007

    Rozpor medzi keynesiánskou a monetaristickou teóriou. Vnútorná stabilita v trhovej ekonomike. Vplyv finančnej politiky a úloha peňazí v ekonomike. Zmeny cien tovarov a služieb. Stanovenie rýchlosti obehu peňazí. Kvantitatívna teória peňazí.

    test, pridané 16.01.2011

    Koncept medzinárodného obchodu. Klasická teória medzinárodného obchodu. Teória komparatívnych výhod. Merkantilistická teória medzinárodného obchodu. Teória absolútnych výhod. Teória Heckscher - Olin - Samuelson. Leontiefova teória.

    abstrakt, pridaný 16.01.2008

    Vznik ekonomickej teórie. Dejiny ekonómie ako vedy. Predmet a metóda ekonomickej teórie. Ekonomická teória je v podstate empirická, teda založená na faktoch reálneho života. Ekonomická teória: funkcie, metódy výskumu.

    semestrálna práca pridaná 16.12.2003

    Rozmanitosť ekonomických teórií domácich a zahraničných vedcov-ekonómov, ktorí sa zrodili v rôznych historických obdobiach, plusy a mínusy jednotlivých teórií. Etapy vývoja ekonomického myslenia človeka. Charakteristiky vývoja ekonomickej teórie.

    test, pridaný 22.12.2009

    Pojem práce, jej podstata a vlastnosti, úloha pri formovaní človeka a miesta v ekonomike. Miesto človeka v modernej ekonomickej teórii. Ekonomické systémy, ich odrody a koordinácia výberu. Predmet a metódy štúdia mikroekonómie.

    prednáškový kurz, pridané 2.10.2009

    Človek ako spotrebiteľ, výrobca, manažér v systéme ekonomických vzťahov. Porovnanie ekonomických, psychologických a sociologických prístupov k štúdiu ľudského správania v ekonomike. Rôzne ľudské modely v ekonomickej teórii.

Vyštudoval som síce fyzikálno-technologickú fakultu, ale teóriu hier ma na univerzite neučili. Ale keďže som v študentských rokoch veľa hrával, najprv preferenčne a potom bridž, teória hier ma zaujala a zvládol som malú učebnicu. A nedávno čitateľ stránky Michail vyriešil problém teórie hier. Keďže som si uvedomil, že úloha mi nebola zadaná hneď, rozhodol som sa osviežiť si v pamäti vedomosti z teórie hier. Predstavujem vám malú knižku - populárnu expozíciu prvkov teórie hier a niektorých metód riešenia maticových hier. Neobsahuje takmer žiadne dôkazy a hlavné body teórie ilustruje na príkladoch. Knihu napísala matematička a popularizátorka vedy Elena Sergeevna Ventzel. Niekoľko generácií sovietskych inžinierov študovalo z jej učebnice „Teória pravdepodobnosti“. Elena Sergejevna tiež napísala niekoľko literárnych diel pod pseudonymom I. Grekov.

Elena Wentzelová. Prvky teórie hier. - M .: Fizmatgiz, 1961 .-- 68 s.

Stiahnite si krátke zhrnutie vo formáte resp

§ 1. Predmet teórie hier. Základné pojmy

Pri riešení množstva praktických úloh (v oblasti ekonomiky, vojenstva a pod.) je potrebné analyzovať situácie, keď existujú dve (alebo viaceré) bojujúce strany sledujúce opačné ciele a výsledok každej akcie jednej strany závisí od toho, aký postup nepriateľ zvolí. Takéto situácie budeme nazývať „konfliktné situácie“.

Existuje množstvo príkladov konfliktných situácií z rôznych oblastí praxe. Každá situácia, ktorá vzniká počas nepriateľstva, patrí ku konfliktným situáciám: každá z bojujúcich strán prijíma všetky dostupné opatrenia, aby zabránila nepriateľovi dosiahnuť úspech. Konfliktné situácie zahŕňajú aj situácie, ktoré vznikajú pri výbere zbraňového systému, spôsobov jeho bojového použitia a vo všeobecnosti pri plánovaní vojenských operácií: každé z rozhodnutí v tejto oblasti by sa malo robiť s ohľadom na také akcie nepriateľa, ktoré sú pre neho najmenej prospešné. nás. Množstvo situácií v oblasti ekonomiky (najmä pri existencii voľnej súťaže) patrí medzi konfliktné situácie; bojujúcimi stranami sú obchodné firmy, priemyselné podniky atď.

Potreba analyzovať takéto situácie dala podnet na vznik špeciálneho matematického aparátu. Teória hier nie je v podstate nič iné ako matematická teória konfliktných situácií. Cieľom teórie je vypracovať odporúčania pre racionálny postup pre každého z protivníkov v priebehu konfliktnej situácie. Každá konfliktná situácia priamo prevzatá z praxe je veľmi zložitá a jej analýze bráni množstvo sprievodných faktorov. Aby bola možná matematická analýza situácie, je potrebné abstrahovať od sekundárnych, náhodných faktorov a vybudovať zjednodušený, formalizovaný model situácie. Tento model budeme nazývať „hra“.

Hra sa od skutočnej konfliktnej situácie líši tým, že prebieha podľa presne stanovených pravidiel. Ľudstvo už dlho používa takéto formalizované modely konfliktných situácií, ktoré sú hrami v prenesenom zmysle slova. Patria sem napríklad šach, dáma, kartové hry atď. Všetky tieto hry majú charakter súťaže prebiehajúcej podľa známych pravidiel a končiacej „víťazstvom“ (ziskom) jedného alebo druhého hráča.

Takéto formálne regulované, umelo organizované hry sú najvhodnejším materiálom na ilustráciu a osvojenie si základných pojmov teórie hier. Terminológia prevzatá z praxe takýchto hier sa používa aj pri analýze iných konfliktných situácií: strany, ktoré sa ich zúčastňujú, sa bežne označujú ako „hráči“ a výsledkom kolízie je „výhra“ jednej zo strán. .

V hre sa môžu zraziť záujmy dvoch alebo viacerých protivníkov; v prvom prípade sa hra nazýva "dvojité", v druhom - "viacnásobné". Účastníci viacerých hier môžu vytvárať koalície – trvalé alebo dočasné. V prítomnosti dvoch stálych koalícií sa viacnásobná hra zmení na pár. Najväčší praktický význam majú párové hry; tu sa obmedzíme na zváženie iba takýchto hier.

Našu prezentáciu elementárnej teórie hier začíname formulovaním niektorých základných pojmov. Budeme uvažovať o štvorhre, ktorej sa zúčastňujú dvaja hráči A a B s opačnými záujmami. „Hrou“ rozumieme udalosť pozostávajúcu zo série akcií strán A a B. Aby bola hra podrobená matematickej analýze, musia byť pravidlá hry presne formulované. „Pravidlami hry“ sa rozumie systém podmienok, ktoré upravujú možné možnosti konania oboch strán, množstvo informácií každej strany o správaní tej druhej, postupnosť striedajúcich sa „ťahov“ (individuálne prijaté rozhodnutia). počas hry), ako aj výsledok alebo výsledok hry, na ktorý sa daná množina pohybuje. Tento výsledok (zisk alebo strata) nie je vždy kvantitatívny, ale zvyčajne je možné ho nastavením určitej mierky merania vyjadriť určitým číslom. Napríklad v šachovej hre môže byť zisku konvenčne priradená hodnota +1, strata –1, remíza 0.

Hra sa nazýva hra s nulovým súčtom, ak jeden hráč vyhrá to, čo druhý stratí, t.j. súčet výhier oboch strán sa rovná nule. V hre s nulovým súčtom sú záujmy hráčov presne opačné. Tu budeme brať do úvahy iba takéto hry.

Keďže v hre s nulovým súčtom sa výplata jedného z hráčov rovná výplate druhého s opačným znamienkom, je zrejmé, že pri analýze takejto hry možno uvažovať o výplate iba jedného z hráčov. Nech je to napríklad hráč A. V nasledujúcom texte budeme stranu A pre pohodlie bežne nazývať „my“ a stranu B – „nepriateľ“.

V tomto prípade bude strana A („my“) vždy považovaná za „víťaznú“ a strana B („súper“) za „prehru“. Táto formálna podmienka zjavne neznamená žiadnu skutočnú výhodu pre prvého hráča; je ľahké vidieť, že je nahradený opačným, ak je výherné znamienko obrátené.

Vývoj hry v čase si predstavíme ako zložený zo série po sebe nasledujúcich etáp alebo „ťahov“. Ťah v teórii hier je výber jednej z možností, ktoré poskytujú pravidlá hry. Pohyby sú rozdelené na osobné a náhodné. Osobný ťah je vedomá voľba jedného z hráčov jedného z možných ťahov v danej situácii a jeho realizácia. Príkladom osobného ťahu je akýkoľvek ťah v šachovej hre. Pri ďalšom ťahu si hráč vedome vyberie jednu z možností, ktoré sú možné pri danom usporiadaní figúrok na šachovnici. Súbor možných možností pre každý osobný ťah je regulovaný pravidlami hry a závisí od súhrnu predchádzajúcich ťahov oboch strán.

Náhodný ťah je výber z množstva možností, ktorý sa neuskutočňuje rozhodnutím hráča, ale nejakým mechanizmom náhodného výberu (hodenie mince, kocky, miešanie a rozdávanie kariet atď.). Napríklad odovzdanie prvej karty jednému z hráčov, ktorý má prednosť, je náhodný ťah s 32 rovnako možnými možnosťami. Aby bola hra matematicky definovaná, pravidlá hry musia uvádzať rozdelenie pravdepodobnosti možných výsledkov pre každý náhodný ťah.

Niektoré hry môžu pozostávať len z náhodných ťahov (tzv. čisto hazardné hry) alebo len z osobných ťahov (šach, dáma). Väčšina kartových hier sú zmiešané hry, t.j. obsahuje náhodné aj osobné pohyby.

Hry sú klasifikované nielen podľa povahy ich ťahov (osobné, náhodné), ale aj podľa povahy a množstva informácií, ktoré má každý hráč k dispozícii o činnosti toho druhého. Špeciálnu triedu hier tvoria takzvané „hry s úplnými informáciami“. Hra s úplnými informáciami je hra, v ktorej každý hráč pri každom osobnom ťahu pozná výsledky všetkých predchádzajúcich ťahov, osobných aj náhodných. Príklady hier s úplnými informáciami zahŕňajú šach, dámu a známu hru „noughts and crosses“.

Väčšina hier praktického významu nepatrí do triedy hier s úplnými informáciami, pretože neistota ohľadom konania nepriateľa je zvyčajne základným prvkom konfliktných situácií.

Jedným zo základných pojmov teórie hier je pojem „stratégia“. Stratégia hráča je súbor pravidiel, ktoré jednoznačne určujú výber pre každý osobný ťah daného hráča v závislosti od situácie, ktorá sa počas hry vyvinula. Zvyčajne rozhodnutie (výber) pre každý osobný ťah robí hráč počas samotnej hry v závislosti od aktuálnej situácie. Teoreticky sa však veci nezmenia, ak si predstavíme, že všetky tieto rozhodnutia robí hráč vopred. Na to by si hráč musel vopred zostaviť zoznam všetkých možných situácií počas hry a poskytnúť pre každú z nich vlastné riešenie. V zásade (ak nie prakticky) je to možné pre každú hru. Ak sa prijme takýto systém rozhodovania, bude to znamenať, že hráč si zvolil určitú stratégiu.

Hráč, ktorý si zvolil stratégiu, sa už nemôže zúčastniť hry osobne, ale nahradiť svoju účasť zoznamom pravidiel, ktoré zaňho uplatní nejaký nezainteresovaný človek (sudca). Stratégiu je možné dať automatu aj vo forme špecifického programu. Počítače dnes takto hrajú šach. Aby mal pojem „stratégia“ zmysel, v hre musia byť osobné ťahy; v hrách pozostávajúcich iba z náhodných ťahov neexistujú žiadne stratégie.

Podľa počtu možných stratégií sa hry delia na „konečné“ a „nekonečné“. Konečná hra je hra, v ktorej má každý hráč len konečný počet stratégií. Posledná hra, v ktorej má hráč A m stratégie a hráč B - n stratégie sa nazýva hra mxn.

Predstavte si mxn hru dvoch hráčov A a B („my“ a „súper“). Naše stratégie budeme označovať A 1, A 2,…, A m stratégie nepriateľa B 1, B 2,…, B n. Nechajte každú stranu zvoliť si špecifickú stratégiu; pre nás to bude A i, pre nepriateľa B j. Ak sa hra skladá len z osobných ťahov, potom výber stratégií A i, B j jednoznačne určuje výsledok hry – naše výhry. Označme to ako ij. Ak hra obsahuje okrem osobných aj náhodné ťahy, potom výplata pre dvojicu stratégií A i, B j je náhodná hodnota, ktorá závisí od výsledkov všetkých náhodných ťahov. V tomto prípade je prirodzeným odhadom očakávaného výnosu jeho priemerná hodnota (matematické očakávanie). Rovnakým znamienkom označíme ako samotnú výplatu (v hre bez náhodných ťahov), tak aj jej priemernú hodnotu (v hre s náhodnými ťahmi).

Dajte nám vedieť hodnoty a ij výnos (alebo priemerný výnos) pre každý pár stratégií. Hodnoty môžu byť zapísané vo forme obdĺžnikovej tabuľky (matice), ktorej riadky zodpovedajú našim stratégiám (Ai) a stĺpce zodpovedajú stratégiám nepriateľa (Bj). Takáto tabuľka sa nazýva výplatná matica alebo jednoducho herná matica. Herná matica mxn je znázornená na obr. 1.

Ryža. 1. Matica mxn

V skratke označíme maticu hry ‖а ij ‖. Pozrime sa na niektoré základné príklady hier.

Príklad 1 Dvaja hráči A a B bez toho, aby sa na seba pozreli, položia mincu obrátene na stôl, znak alebo chvost, ako uznajú za vhodné. Ak si hráči zvolili rovnaké strany (obaja majú erb alebo obaja chvost), hráč A si vezme obe mince; inak ich berie hráč B. Je potrebné hru analyzovať a zostaviť jej maticu. Riešenie. Hra pozostáva len z dvoch ťahov: nášho ťahu a ťahu súpera, oba osobné. Hra nepatrí medzi hry s úplnými informáciami, keďže v momente ťahu hrajúci hráč nevie, čo ten druhý urobil. Keďže každý z hráčov má len jeden osobný ťah, hráčova stratégia je výberom tohto jediného osobného ťahu.

Máme dve stratégie: A 1 - výber erbu a A 2 - výber chvostov; súper má rovnaké dve stratégie: B 1 - erb a B 2 - chvosty. Táto hra je teda hrou 2 × 2. Výhru mince považujme za +1. Matrix hry:

Na príklade tejto hry, hoci je základná, môžete pochopiť niektoré základné myšlienky teórie hier. Predpokladajme najprv, že daná hra sa spustí iba raz. Potom, samozrejme, nemá zmysel hovoriť o akýchkoľvek „stratégiách“ hráčov, ktorí sú rozumnejší ako ostatní. Každý z hráčov s rovnakým dôvodom môže urobiť akékoľvek rozhodnutie. Keď sa však hra opakuje, situácia sa mení.

Povedzme, že sme (hráč A) pre seba zvolili nejakú stratégiu (povedzme A 1) a budeme sa jej držať. Potom podľa výsledkov niekoľkých prvých ťahov nepriateľ uhádne našu stratégiu a odpovie na ňu pre nás najmenej výhodným spôsobom, t.j. vybrať chvosty. Je pre nás jednoznačne nerentabilné používať vždy len jednu stratégiu; aby sme neboli porazení, musíme si niekedy vybrať erb, niekedy - chvosty. Ak však striedame erby a chvosty v určitom poradí (napríklad po jednom), nepriateľ to môže tiež hádať a reagovať na túto stratégiu pre nás najhorším spôsobom. Je zrejmé, že spoľahlivým spôsobom, ako zabezpečiť, aby nepriateľ nepoznal našu stratégiu, je organizovať výber pri každom ťahu, keď to my sami vopred nevieme (to sa dá zabezpečiť napr. hodením mince). Intuitívnym uvažovaním sa teda dostávame k jednému z podstatných pojmov teórie hier – k pojmu „zmiešaná stratégia“, tzn. ako keď sa „čisté“ stratégie – v tomto prípade A 1 a A 2 – náhodne striedajú s určitými frekvenciami. V tomto príklade z úvah o symetrii je vopred jasné, že stratégie A 1 a A 2 by sa mali striedať s rovnakou frekvenciou; v zložitejších hrách nemusí byť riešenie ani zďaleka triviálne.

Príklad 2 Hráči A a B súčasne a nezávisle na sebe zapíšu každé z troch čísel: 1, 2 alebo 3. Ak je súčet napísaných čísel párny, potom B zaplatí A túto sumu v rubľoch; ak je nepárny, tak naopak A túto sumu zaplatí B. Je potrebné analyzovať hru a zostaviť jej maticu.

Riešenie. Hra pozostáva z dvoch ťahov; obe sú osobné. Máme (A) tri stratégie: A 1 - napíšte 1; A 2 - napíšte 2; A 3 - napíšte 3. Súper (B) má rovnaké tri stratégie. Hra je hra 3 × 3:

Je zrejmé, že ako v predchádzajúcom prípade môže nepriateľ na akúkoľvek stratégiu, ktorú si zvolíme, zareagovať pre nás najhorším spôsobom. Ak totiž zvolíme napríklad stratégiu A1, nepriateľ na ňu vždy odpovie stratégiou B2; na stratégii A 2 - podľa stratégie B 3; na stratégii A 3 - podľa stratégie B 2; teda každá voľba určitej stratégie nás nevyhnutne povedie k strate (netreba však zabúdať, že nepriateľ je v rovnako zúfalej situácii). Riešenie tejto hry (t.j. súbor najvýhodnejších stratégií oboch hráčov) bude uvedené v § 5.

Príklad 3 Máme k dispozícii tri druhy zbraní: А 1, А 2, А 3; nepriateľ má tri typy lietadiel: B 1, B 2, B 3. Našou úlohou je zasiahnuť lietadlo; úlohou nepriateľa je udržať ho bez vplyvu. Pri použití výzbroje A 1 sú zasiahnuté lietadlá B 1, B 2, B 3 s pravdepodobnosťou 0,9, 0,4 a 0,2; s výzbrojou A 2 - s pravdepodobnosťou 0,3, 0,6 a 0,8; s výzbrojou A 3 - s pravdepodobnosťou 0,5, 0,7 a 0,2. Je potrebné formulovať situáciu z hľadiska teórie hier.

Riešenie. Situáciu si možno predstaviť ako hru 3 × 3 s dvoma osobnými ťahmi a jedným náhodným. Naším osobným ťahom je výber typu zbrane; osobný ťah nepriateľa - výber lietadla na účasť v bitke. Náhodný pohyb - použitie zbraní; tento ťah môže skončiť porážkou alebo neporazením lietadla. Naša odmena je jedna, ak lietadlo zasiahne, a nula v opačnom prípade. Naše stratégie sú tri možnosti zbraní; nepriateľské stratégie - tri možnosti lietadiel. Priemerná hodnota výplaty pre každú danú dvojicu stratégií nie je nič iné ako pravdepodobnosť zasiahnutia daného lietadla danou zbraňou. Matrix hry:

Cieľom teórie hier je vypracovať odporúčania pre rozumné správanie hráčov v konfliktných situáciách, t.j. určenie „optimálnej stratégie“ pre každú z nich. Optimálna stratégia hráča v teórii hier je stratégia, ktorá pri mnohonásobnom opakovaní hry poskytuje danému hráčovi maximálny možný priemerný zisk (alebo minimálnu možnú priemernú stratu). Pri výbere tejto stratégie je základom uvažovania predpoklad, že nepriateľ je minimálne taký inteligentný ako my a robí všetko preto, aby nám zabránil dosiahnuť náš cieľ.

V teórii hier sú všetky odporúčania vytvorené na základe týchto princípov; preto neberie do úvahy prvky rizika, ktoré sú nevyhnutne prítomné v každej reálnej stratégii, ako aj možné prepočty a chyby každého z hráčov. Teória hier, ako každý matematický model zložitého javu, má svoje obmedzenia. Najdôležitejšie z nich je, že odmena je umelo znížená na jedno jediné číslo. Vo väčšine praktických konfliktných situácií je pri vývoji rozumnej stratégie potrebné vziať do úvahy nie jeden, ale niekoľko číselných parametrov - kritérií úspechu udalosti. Stratégia, ktorá je optimálna pre jedno kritérium, nemusí byť nevyhnutne optimálna pre ostatné. Avšak s vedomím týchto obmedzení, a teda nie slepým dodržiavaním odporúčaní získaných hernými metódami, je stále možné rozumne použiť matematický aparát teórie hier na rozvoj, ak nie práve „optimálnej“, tak aspoň „prijateľnej“ stratégie. .

§ 2. Dolná a horná cena hry. Princíp minimax

Uvažujme hru mxn s maticou ako na obr. 1. Označme písmenom i číslo našej stratégie; písmeno j je číslo súperovej stratégie. Dajme si za úlohu: určiť našu optimálnu stratégiu. Poďme analyzovať každú z našich stratégií postupne, počnúc A1.

Pri výbere stratégie А i by sme mali vždy počítať s tým, že nepriateľ na ňu zareaguje stratégiou В j, pre ktorú je naša odmena а ij minimálna. Definujme si túto hodnotu výplaty, t.j. minimum čísel a ij v i riadok. Označme to α i:

Znamienko min (minimum v j) tu označuje minimum hodnôt tohto parametra pre všetky možné j. Vypíšme čísla α i; vedľa matice napravo ako ďalší stĺpec:

Pri výbere akejkoľvek stratégie A i musíme počítať s tým, že v dôsledku rozumných krokov súpera nezískame viac ako α i. Prirodzene, ak konáme čo najopatrnejšie a počítame s najrozumnejším protivníkom (t. j. vyhýbajúc sa akémukoľvek riziku), mali by sme sa zastaviť pri stratégii, pre ktorú je číslo α i maximum. Označme túto maximálnu hodnotu α:

alebo, berúc do úvahy vzorec (2.1),

Hodnota α sa nazýva nižšia cena hry, inými slovami, maximálna výhra alebo jednoducho maximum. Číslo α leží v určitom riadku matice; stratégia hráča A, ktorá zodpovedá tejto línii, sa nazýva stratégia maximín. Je zrejmé, že ak sa budeme držať stratégie maximin, potom za akékoľvek správanie nepriateľa máme zaručenú odmenu, aspoň nie nižšiu ako α. Preto sa hodnota α nazýva „nižšia cena hry“. Toto je garantované minimum, ktoré si môžeme sami zabezpečiť dodržiavaním najopatrnejšej („zaistnej“) stratégie.

Je zrejmé, že podobná úvaha môže byť vykonaná aj pre súpera B. Keďže nepriateľ má záujem minimalizovať naše výhry, musí sa na každú zo svojich stratégií pozerať z hľadiska maximálneho zisku s touto stratégiou. Preto v spodnej časti matice vypíšeme maximálne hodnoty pre každý stĺpec:

a nájdite minimum β j:

Hodnota β sa nazýva horná cena hry, inými slovami „minimax“. Súperova stratégia zodpovedajúca minimaxovému zisku sa nazýva jeho „minimax stratégia“. Pri dodržaní svojej najopatrnejšej stratégie minimaxu si protivník zaručuje nasledovné: čokoľvek proti nemu urobíme, v každom prípade stratí sumu nie väčšiu ako β. Princíp opatrnosti, ktorý diktuje hráčom výber vhodných stratégií (maximin a minimax), sa v teórii hier a jej aplikáciách často nazýva „princíp minimaxu“. Najopatrnejšie maximálne a minimaxové stratégie hráčov sú niekedy označované všeobecným termínom „minimax stratégie“.

Ako príklady definujeme dolnú a hornú cenu hier a stratégie minimax pre príklady 1, 2 a 3 § 1.

Príklad 1 Príklad 1 § 1 uvádza hru s nasledujúcou maticou:

Keďže hodnoty α i a β j sú konštantné a rovnajú sa –1 a +1, dolná a horná cena hry sú tiež –1 a +1: α = –1, β = +1. Akákoľvek stratégia hráča A je jeho maximom a akákoľvek stratégia hráča B je jeho minimax. Záver je triviálny: dodržaním akejkoľvek zo svojich stratégií môže hráč A zaručiť, že neprehrá viac ako 1; to isté môže zaručiť hráč B.

Príklad 2 Príklad 2 § 1 uvádza hru s maticou:

Nižšia cena hry je α = –3; horná cena hry β = 4. Naša maximálna stratégia je А 1; jeho systematickým uplatňovaním môžeme pevne očakávať, že vyhráme minimálne –3 (prehráme maximálne 3). Súperova minimax stratégia je ktorákoľvek zo stratégií B 1 a B 2; Ich systematickým uplatňovaním môže v každom prípade zaručiť, že nestratí viac ako 4. Ak sa odchýlime od našej maximálnej stratégie (napríklad zvolíme stratégiu A2), protivník nás za to môže „potrestať“ uplatnením stratégie B 3 a zníženie našej výplaty je -5; rovnako aj ústup súpera od jeho minimax stratégie môže zvýšiť jeho stratu na 6.

Príklad 3 Príklad 3 § 1 uvádza hru s maticou:

Nižšia cena hry je α = 0,3; horná hodnota hry β = 0,7. Naša najkonzervatívnejšia (maximálna) stratégia je A 2; s použitím výzbroje А 2 garantujeme, že lietadlo zasiahneme v priemere minimálne 0,3 vo všetkých prípadoch. Najopatrnejšia (minimax) nepriateľská stratégia je B 2; pri použití tohto lietadla si môže byť nepriateľ istý, že bude zasiahnutý maximálne v 0,7 zo všetkých prípadov.

Na poslednom príklade je vhodné demonštrovať jednu dôležitú vlastnosť minimax stratégií – ich nestabilitu. Použime našu najopatrnejšiu (maximin) stratégiu А 2 a nepriateľa - jeho najopatrnejšiu (minimax) stratégiu В 2. Pokiaľ obaja súperi dodržiavajú tieto stratégie, priemerná výplata je 0,6; je to viac ako spodná cena, ale menej ako horná cena hry. Teraz predpokladajme, že protivník sa dozvedel, že používame stratégiu A 2; okamžite na to odpovie stratégiou B 1 a zníži výhru na 0,3. Na druhej strane máme dobrú odpoveď na stratégiu B 1: stratégiu A 1, ktorá nám dáva výhru 0,9 atď.

Pozícia, v ktorej obaja hráči používajú svoje minimax stratégie, je teda nestabilná a môže byť narušená informáciami o stratégii protivníka. Existujú však hry, pre ktoré sú stratégie minimax stabilné. Sú to hry, pri ktorých sa spodná cena rovná hornej: α = β. Ak sa spodná cena hry rovná hornej, tak ich celkovú hodnotu nazývame čistá cena hry (niekedy len cena hry), označíme ju písmenom ν.

Pozrime sa na príklad. Nech je hra 4 × 4 daná maticou:

Nájdite nižšiu cenu hry: α = 0,6. Nájdite hornú cenu hry: β = 0,6. Ukázalo sa, že sú rovnaké, preto má hra čistú cenu rovnajúcu sa α = β = ν = 0,6. Prvok 0,6, zvýraznený v matici výplaty, je minimom v riadku aj maximom v stĺpci. V geometrii sa bod na povrchu, ktorý má podobnú vlastnosť (súčasné minimum pozdĺž jednej súradnice a maximum pozdĺž druhej), nazýva sedlový bod; analogicky sa tento termín používa aj v teórii hier. Prvok matice s touto vlastnosťou sa nazýva sedlový bod matice a o hre sa hovorí, že má sedlový bod.

Sedlový bod zodpovedá dvojici stratégií minimax (v tomto príklade A 3 a B 2). Tieto stratégie sa nazývajú optimálne a ich kombinácia sa nazýva riešenie hry. Riešenie hry má nasledujúcu pozoruhodnú vlastnosť. Ak jeden z hráčov (napríklad A) dodrží svoju optimálnu stratégiu a druhý hráč (B) sa akýmkoľvek spôsobom odchýli od svojej optimálnej stratégie, potom pre hráča, ktorý urobil odchýlku, to nikdy nemôže byť prospešné, ako napr. odchýlka hráča B môže v najlepšom prípade ponechať výhru nezmenenú av najhoršom prípade ju zvýšiť. Naopak, ak B dodržiava svoju optimálnu stratégiu a A sa odchyľuje od svojej vlastnej, potom to v žiadnom prípade nemôže byť pre A prospešné.

Toto tvrdenie možno ľahko overiť na príklade zvažovanej hry so sedlovým bodom. Vidíme, že v prípade hry so sedlovou pointou majú minimax stratégie akúsi „stabilitu“: ak jedna strana dodrží svoju minimax stratégiu, potom môže byť pre druhú len nerentabilné odchýliť sa od tej svojej. Všimnite si, že v tomto prípade žiadne vedomie hráča, že nepriateľ si zvolil svoju optimálnu stratégiu, nemôže zmeniť správanie samotného hráča: ak nechce konať proti vlastným záujmom, musí sa držať svojej optimálnej stratégie. Dvojica optimálnych stratégií v sedlovej hre je takpovediac „rovnovážna poloha“: akákoľvek odchýlka od optimálnej stratégie vedie vychyľujúceho sa hráča k nepriaznivým dôsledkom a núti ho vrátiť sa do pôvodnej polohy.

Pre každú hru so sedlovým bodom teda existuje riešenie definujúce pár optimálnych stratégií pre obe strany, ktoré má nasledujúce vlastnosti.

1) Ak obe strany dodržia svoje optimálne stratégie, potom sa priemerný výnos rovná čistej cene hry ν, čo je súčasne jej dolná a horná cena.

2) Ak jedna zo strán dodrží svoju optimálnu stratégiu a druhá sa odchýli od svojej, potom z toho môže odkláňajúca sa strana iba stratiť a v žiadnom prípade nemôže zvýšiť svoj zisk.

Trieda hier so sedlovou špičkou je veľmi zaujímavá z teoretického aj praktického hľadiska. V teórii hier je dokázané, že najmä každá hra s úplnými informáciami má sedlový bod, a teda každá takáto hra má riešenie, t.j. existuje pár optimálnych stratégií oboch strán, ktoré poskytujú priemernú výplatu rovnajúcu sa cene hry. Ak hra s úplnými informáciami pozostáva len z osobných ťahov, potom keď každá strana použije svoju optimálnu stratégiu, musí to vždy skončiť úplne jednoznačným výsledkom, konkrétne výhrou, ktorá sa presne rovná cene hry.

Ako príklad hry s úplnými informáciami si predstavte známu hru skladanie mincí na okrúhly stôl. Dvaja hráči striedavo kladú rovnaké mince na okrúhly stôl, pričom zakaždým si vyberú ľubovoľnú polohu stredu mince; prekrývanie mincí nie je povolené. Vyhráva hráč, ktorý vloží poslednú mincu (keď už nie je miesto pre ostatných). Je zrejmé, že výsledok tejto hry je vždy vopred dohodnutý a existuje dobre definovaná stratégia, ktorá zaisťuje spoľahlivé víťazstvo pre hráča, ktorý vloží mincu ako prvý. Totižto musí prvýkrát položiť mincu do stredu stola a potom reagovať symetrickým ťahom na každý súperov ťah. V tomto prípade sa druhý hráč môže správať, ako chce, bez toho, aby zmenil vopred stanovený výsledok hry. Preto má táto hra zmysel len pre hráčov, ktorí nepoznajú optimálnu stratégiu. Podobne je to aj so šachom a inými hrami s úplnými informáciami; ktorákoľvek z týchto hier má sedlový bod a riešenie, ktoré každému z hráčov naznačuje jeho optimálnu stratégiu; riešenie šachovej hry sa nenašlo len preto, že počet kombinácií možných ťahov v šachu je príliš veľký na to, aby sa dala zostrojiť platobná matica a nájsť v nej sedlový bod.

§ 3. Čisté a zmiešané stratégie. Riešenie hry v zmiešaných stratégiách

Hry so sedlovým bodom sú medzi konečnými hrami praktického významu pomerne zriedkavé; typickejší je prípad, keď sa spodná a horná cena hry líši. Analýzou matíc takýchto hier sme dospeli k záveru, že ak má každý hráč na výber jedinú stratégiu, potom, počítajúc s primerane konajúcim protivníkom, by mal byť tento výber určený princípom minimax. Pri dodržaní našej maximálnej stratégie za akékoľvek správanie protivníka si vedome garantujeme odmenu rovnajúcu sa nižšej cene hry α. Vynára sa prirodzená otázka: je možné si zaručiť priemerný výnos väčší ako α, ak nepoužijeme jednu „čistú“ stratégiu, ale náhodne vystriedame niekoľko stratégií? Takéto kombinované stratégie, spočívajúce v aplikácii niekoľkých čistých stratégií striedajúcich sa podľa náhodného zákona s určitým pomerom frekvencií, sa v teórii hier nazývajú zmiešané stratégie.

Je zrejmé, že každá čistá stratégia je špeciálnym prípadom zmiešanej stratégie, v ktorej sú všetky stratégie okrem jednej aplikované s nulovými frekvenciami a táto - s frekvenciou 1. Ukazuje sa, že aplikovaním nielen čistej, ale aj zmiešané stratégie, možno získať pre každé konečné riešenie hry, t.j. dvojica (všeobecne zmiešaných) stratégií tak, že keď ich aplikujú obaja hráči, výplata sa bude rovnať cene hry a pri akejkoľvek jednostrannej odchýlke od optimálnej stratégie sa výplata môže zmeniť len smerom, ktorý je pre ňu nevýhodný. deviant.

Vyššie uvedené tvrdenie tvorí obsah takzvanej hlavnej vety teórie hier. Túto vetu prvýkrát dokázal von Neumann v roku 1928. Známe dôkazy tejto vety sú pomerne komplikované; preto uvádzame len jeho formuláciu.

Každá koncová hra má aspoň jedno riešenie (prípadne v oblasti zmiešaných stratégií).

Zisk vyplývajúci z rozhodnutia sa nazýva cena hry. Hlavná veta naznačuje, že každá konečná hra má svoju cenu. Je zrejmé, že cena hry ν vždy leží medzi nižšou cenou hry α a hornou cenou hry β:

(3.1) α ≤ ν ≤ β

Skutočne, α je maximálna zaručená odmena, ktorú môžeme sami poskytnúť iba pomocou našich čistých stratégií. Keďže zmiešané stratégie zahŕňajú, ako špeciálny prípad, všetky čisté, potom, ak pripustíme okrem čistých aj zmiešané stratégie, v žiadnom prípade nezhoršujeme naše schopnosti; teda ν ≥ α. Podobne, vzhľadom na schopnosti súpera, ukážeme, že ν ≤ β, čo implikuje preukázanú nerovnosť (3.1).

Uveďme špeciálny zápis pre zmiešané stratégie. Ak napríklad naša zmiešaná stratégia spočíva v aplikácii stratégií A 1, A 2, A 3 s frekvenciami p 1, p 2, p 3 a p 1 + p 2 + p 3 = 1, túto stratégiu označíme

Podobne bude zmiešaná stratégia nepriateľa označená:

kde q 1, q 2, q 3 sú frekvencie, pri ktorých sa miešajú stratégie B1, B2, B3; q 1 + q 2 + q 3 = 1.

Predpokladajme, že sme našli riešenie hry pozostávajúce z dvoch optimálnych zmiešaných stratégií S A *, S B *. Vo všeobecnosti nie všetky čisté stratégie dostupné danému hráčovi sú zahrnuté v jeho optimálnej zmiešanej stratégii, ale iba niektoré. Stratégie zahrnuté v optimálnej zmiešanej stratégii hráča budeme nazývať jeho „užitočné“ stratégie. Ukazuje sa, že riešenie hry má ešte jednu pozoruhodnú vlastnosť: ak jeden z hráčov dodrží svoju optimálnu zmiešanú stratégiu SA * (SB *), potom výplata zostáva nezmenená a rovná sa cene hry ν, bez ohľadu na čo robí druhý hráč, pokiaľ neprekročí jeho „užitočné“ stratégie. Môže napríklad použiť ktorúkoľvek zo svojich „užitočných“ stratégií v čistej forme a môže ich aj namiešať v akomkoľvek pomere.

§ 4. Elementárne metódy riešenia hier. Hry 2X2 a 2Xn

Ak hra mxn nemá sedlový bod, potom je hľadanie riešenia vo všeobecnosti dosť náročná úloha, najmä pre veľké m a n. Niekedy sa táto úloha dá zjednodušiť tak, že sa najprv zníži počet stratégií vymazaním niektorých nepotrebných. Nadmerné stratégie sú a) duplicitné ab) zjavne nerentabilné. Zoberme si napríklad hru s maticou:

Je ľahké sa uistiť, že stratégia A 3 presne opakuje („duplikuje“) stratégiu A 1, preto je možné ktorúkoľvek z týchto dvoch stratégií vymazať. Ďalej pri porovnaní riadkov A 1 a A 2 vidíme, že každý prvok v riadku A2 je menší (alebo rovný) zodpovedajúcemu prvku v riadku A 1. Je zrejmé, že by sme nikdy nemali používať stratégiu A2, je zámerne nerentabilná. Vymazaním A 3 a A 2 dostaneme maticu do jednoduchšej podoby. Ďalej poznamenávame, že stratégia B 3 je zjavne nerentabilná pre protivníka; jej odstránením dostaneme maticu do konečnej podoby:

Hra 4 × 4 sa teda zredukuje na hru 2 × 3 odstránením duplicitných a zjavne nevýhodných stratégií.

Postup pri zmazaní duplicitných a zjavne nevýhodných stratégií by mal vždy predchádzať rozhodnutiu hry. Najjednoduchšie prípady konečných hier, ktoré sa dajú vždy vyriešiť elementárnymi metódami, sú hry 2 × 2 a 2xn.

Zvážte hru 2 × 2 s maticou:

Môžu tu nastať dva prípady: 1) zver má sedlový hrot; 2) hra nemá sedlový bod. V prvom prípade je riešenie zrejmé: ide o dvojicu stratégií, ktoré sa pretínajú v sedlovom bode. Mimochodom, všimnite si, že v hre 2 × 2 prítomnosť sedlového bodu vždy zodpovedá existencii zámerne nevýhodných stratégií, ktoré by sa mali v predbežnej analýze vypustiť.

Nech neexistuje sedlový bod, a preto sa spodná cena hry nerovná hornej: α ≠ β. Je potrebné nájsť optimálnu zmiešanú stratégiu hráča A:

Vyznačuje sa tou vlastnosťou, že nech sú kroky súpera akékoľvek (pokiaľ neprekročí hranice svojich „užitočných“ stratégií), výplata sa bude rovnať cene hry ν. V hre 2 × 2 sú obe nepriateľské stratégie „užitočné“, inak by hra mala čisto strategické riešenie (seddle point). To znamená, že ak sa budeme držať našej optimálnej stratégie (4.1), tak protivník môže použiť ktorúkoľvek zo svojich čistých stratégií B 1, B 2 bez toho, aby sa zmenil priemerný výnos ν. Máme teda dve rovnice:

z čoho, ak vezmeme do úvahy, že p 1 + p 2 = 1, dostaneme:

Hodnotu hry ν nájdeme dosadením hodnôt p 1, p 2 do ktorejkoľvek z rovníc (4.2).

Ak je známa cena hry, potom určiť optimálnu stratégiu súpera

stačí jedna rovnica, napr.

preto, ak vezmeme do úvahy, že q 1 + q 2 = 1, máme:

Príklad 1 Nájdite riešenie hry 2 × 2 uvažovanej v príklade 1 § 1 s maticou:

Hra nemá sedlový bod (α = –1; β = +1), a preto riešenie musí ležať v doméne zmiešaných stratégií:

Musíte nájsť p 1, p 2, q 1 a q 2. Pre p 1 máme rovnicu

1 * p 1 + (–1) (1 – p 1) = (–1) p 1 + 1 (1 – p 1)

pričom p 1 = 1/2, p 2 = 1/2.

Podobne zistíme: q 1 = 1/2, q 2 = 1/2, ν = 0.

V dôsledku toho je optimálnou stratégiou pre každého z hráčov náhodne striedať obe ich čisté stratégie, pričom každú z nich používa rovnako často; v tomto prípade sa priemerná odmena bude rovnať nule.

Výsledný záver bol dostatočne jasný vopred. V ďalšom príklade sa pozrieme na zložitejšiu hru, ktorej riešenie nie je až také samozrejmé. Príklad je základným príkladom hier známych ako „podvádzanie“ alebo „klamanie“. V praxi sa v konfliktných situáciách často využívajú rôzne spôsoby zavádzania nepriateľa (dezinformácie, umiestňovanie falošných cieľov a pod.). Tento príklad je napriek svojej jednoduchosti celkom poučný.

Príklad 2 Hra je nasledovná. Existujú dve karty: eso a dvojka. Hráč A náhodne vyžrebuje jeden z nich; B nevidí, ktorú kartu vytiahol. Ak A vytiahne eso, vyhlási: „Mám eso“ a požaduje od súpera 1 rubeľ. Ak A vzal dvojku, môže buď A 1) povedať „Mám eso“ a požadovať od súpera 1 rubeľ, alebo A 2) priznať, že má dvojku a zaplatiť súperovi 1 rubeľ.

Nepriateľ, ak mu dobrovoľne zaplatí 1 rubeľ, ho môže len prijať. Ak sa od neho požaduje 1 rubeľ, potom môže buď B 1) veriť hráčovi A, že má eso a dať mu 1 rubeľ, alebo B 2) požadovať šek, aby sa uistil, že vyhlásenie A. skontrolujte, že sa ukáže, že A skutočne má eso, B musí zaplatiť A 2 ruble. Ak sa ukáže, že A podvádza a má dvojku, hráč A zaplatí hráčovi B 2 ruble. Je potrebné analyzovať hru a nájsť optimálnu stratégiu pre každého z hráčov.

Riešenie. Hra má pomerne zložitú štruktúru; pozostáva z jedného povinného náhodného ťahu – výber jednej z dvoch kariet hráčom A – a dvoch osobných ťahov, ktoré sa však nemusia nevyhnutne uskutočniť. V skutočnosti, ak A vytiahne eso, neurobí žiadny osobný krok: má len jednu príležitosť - požadovať 1 rubeľ, čo aj robí. V tomto prípade sa osobný ťah - veriť alebo neveriť (tj zaplatiť alebo nezaplatiť 1 rubeľ) - prevedie na hráča B. Ak A ako výsledok prvého náhodného ťahu dostane dvojku, potom dostane osobný pohyb: zaplaťte 1 rubeľ alebo sa pokúste oklamať nepriateľa a vyžiadajte si 1 rubeľ (v skratke: „neklamať“ alebo „klamať“). Ak si A vyberie prvého, potom B musí prijať iba 1 rubeľ; ak si A vybral druhú možnosť, potom hráč B dostane osobný ťah: veriť alebo neveriť A (to znamená zaplatiť A 1 rubeľ alebo požadovať overenie).

Stratégie každého z hráčov sú pravidlá, ktoré naznačujú, ako by mal hráč konať, keď dostane osobný ťah. Je zrejmé, že A má len dve stratégie: A 1 – podvádzať, A 2 – nepodvádzať. B má tiež dve stratégie: B 1 - veriť, B 2 - neveriť. Zostavme hernú maticu. Aby sme to dosiahli, vypočítajme priemerný výnos pre každú kombináciu stratégií.

1. A 1 B 1 (A klame, B verí). Ak A dostane eso (pravdepodobnosť je ½, potom nedostane osobný ťah; požaduje 1 rubeľ a hráč B mu uverí; zisk A v rubľoch je 1. Ak A dostane dvojku (pravdepodobnosť tohto je tiež ½), podľa svojej stratégie podvádza a požaduje 1 rubeľ; verí mu a platí; odmena A sa tiež rovná 1. Priemerná odmena: a 11 = ½ * 1 + ½ * 1 = 1.

2. A 1 B 2 (A klame, B neverí). Ak A dostane eso, nemá žiadny osobný ťah; vyžaduje 1 rubeľ; Podľa svojej stratégie neverí a v dôsledku šeku zaplatí 2 ruble (zisk A je +2). Ak A dostane dvojku, podľa svojej stratégie požaduje 1 rubeľ; B podľa svojho neverí; v dôsledku toho A zaplatí 2 ruble (zisk A je –2). Priemerná odmena je: a 12 = ½ * (+ 2) + ½ * (- 2) = 0.

3. A 2 B 1 (A neklame, B verí). Ak A vytiahne eso, požaduje 1 rubeľ; B podľa svojej stratégie platí; zisk A je +1. Ak A vytiahne dvojku, zaplatí 1 rubeľ podľa svojej stratégie; B zostáva len akceptovať (zisk A je –1). Priemerná odmena je: a 21 = ½ * (+ 1) + ½ * (- 1) = 0.

4. A 2 B 2 (A neklame, B neverí). Ak A vytiahne eso, požaduje 1 rubeľ; B skontroluje a v dôsledku kontroly zaplatí 2 ruble (výhra je +2). Ak A vyberie dvojku, zaplatí 1 rubeľ; Zostáva len prijať (výplata je 1). Priemerný výnos je: a 22 = ½ * (+ 2) + ½ * (- 1) = ½.

Vytvárame hernú maticu:

Matrica nemá sedlový bod. Spodná cena hry je α = 0, horná cena hry je β = ½. Poďme nájsť riešenie hry na poli zmiešaných stratégií. Použitím vzorca (4.3) dostaneme:

tie. Hráč A musí použiť svoju prvú stratégiu (cheat) v jednej tretine všetkých prípadov a druhú (nie cheat) v dvoch tretinách. V tomto prípade vyhrá v priemere cenu hry ν = 1/3.

Hodnota ν = 1/3 naznačuje, že za týchto podmienok je hra výhodná pre A a nepriaznivá pre B. Pomocou svojej optimálnej stratégie si A môže vždy zabezpečiť kladný priemerný zisk. Všimnite si, že ak by A použil svoju najopatrnejšiu (maximinálnu) stratégiu (v tomto prípade obe stratégie A 1 a A 2 sú maximami), mal by priemerný výnos rovný nule. Použitie zmiešanej stratégie teda dáva A možnosť realizovať svoju výhodu oproti B, ktorá vzniká pri daných pravidlách hry.

Definujme optimálnu stratégiu B. Máme: q 1 * 1 + q 2 * 0 = 1/3, q 1 = 1/3, q 2 = 2/3. Kde

t.j. hráč B musí dôverovať A v jednej tretine všetkých prípadov a zaplatiť mu 1 rubeľ bez kontroly a v dvoch tretinách prípadov - skontrolovať. Potom v priemere stratí 1/3 za každý zápas. Ak by použil svoju minimax čistú stratégiu B 2 (neverte), prehral by v priemere 1/2 za každú hru.

Riešenie hry 2 × 2 možno podať jednoduchou geometrickou interpretáciou. Nech existuje hra 2 × 2 s maticou

Zoberte rez úsečkou s dĺžkou 1 (obr. 4.1). Ľavý koniec rezu (bod s x = 0) bude predstavovať stratégiu A 1; pravý koniec úseku (x = 1) - stratégia A 2. Nakreslime dve kolmice na os x cez body А 1 a А 2: os ja– ja a os II – II... Na osi ja– ja výhry za stratégiu A 1 odložíme; na osi II – II-vyhráva so stratégiou A2. Zvážte súperovu stratégiu B 1; dáva dva body na osiach ja– ja a II – II so súradnicami 11 a 21, v tomto poradí. Prenesme cez tieto body priamku B 1 B 1. Je zrejmé, že ak so stratégiou nepriateľa B 1 použijeme zmiešanú stratégiu

potom našu priemernú výplatu, ktorá sa v tomto prípade rovná a 11 p 1 + a 21 p 2, predstavuje bod M na priamke B 1 B 1; os tohto bodu sa rovná p 2. Priamka В 1 В 1, ktorá predstavuje výnos v prípade stratégie В 1, sa bude bežne nazývať „stratégia В 1“.

Je zrejmé, že stratégia B2 môže byť zostavená presne rovnakým spôsobom (obr. 4.2).

Musíme nájsť optimálnu stratégiu S A *, teda takú, pre ktorú by sa minimálna odmena (za akékoľvek správanie B) zmenila na maximálnu. Aby sme to dosiahli, zostrojíme dolnú hranicu výplaty pre stratégie B 1, B 2, t.j. prerušovaná čiara B 1 NB 2 vyznačená na obr. 4.2 hrubou čiarou. Táto spodná hranica bude vyjadrovať minimálnu odmenu hráča A za ktorúkoľvek z jeho zmiešaných stratégií; bod N, pri ktorom tento minimálny zisk dosiahne maximum, určuje rozhodnutie a cenu hry. Je ľahké overiť, že ordináta bodu N je cena hry ν a jej os je rovná p 2 - frekvencia aplikácie stratégie A 2 v optimálnej zmiešanej stratégii S A *.

V našom prípade bolo rozhodnutie hry určené priesečníkom stratégií. Nebude to však vždy tak; na obr. 4.3 je znázornený prípad, keď napriek prítomnosti prieniku stratégií riešenie dáva obom hráčom čisté stratégie (A 2 a B 2) a cena hry ν = a 22. V tomto prípade má matica sedlový bod a stratégia A 1 je zjavne nerentabilná, pretože pre akúkoľvek čistú stratégiu protivníka dáva menší zisk ako A2.

V prípade, že protivník má zámerne nepriaznivú stratégiu, geometrická interpretácia má podobu znázornenú na obr. 4.4.

V tomto prípade sa spodná hranica výplaty zhoduje so stratégiou B 1, stratégia B 2 je pre súpera zjavne nerentabilná.

Geometrická interpretácia umožňuje vizualizovať aj spodnú a hornú cenu hry (obr. 4.5).

Pre ilustráciu zostrojíme geometrické interpretácie hier 2 × 2 uvažovaných v príkladoch 1 a 2 (obr. 4.6 a 4.7).

Presvedčili sme sa, že každá hra 2 × 2 sa dá vyriešiť elementárnymi trikmi. Akákoľvek hra 2xn sa dá vyriešiť úplne rovnakým spôsobom. kde máme len dve stratégie a nepriateľ má ľubovoľný počet.

Predpokladajme, že máme dve stratégie: А 1, А 2 a nepriateľa - n stratégií: В 1, В 2, ..., В n. Je daná matica ‖a ij ‖; pozostáva z dvoch riadkov a n stĺpcov. Podobne ako v prípade dvoch stratégií dávame problému geometrickú interpretáciu; n stratégií protivníka predstavuje n rovných čiar (obr. 4.8). Postavíme spodnú hranicu výhry (prerušovaná čiara B 1 MNB 2) a nájdeme na nej bod N s maximálnou ordinátou. Tento bod poskytuje riešenie hry (stratégiu ) ordináta bodu N sa rovná cene hry ν a osa x sa rovná frekvencii p 2 stratégie A 2.

V tomto prípade sa optimálna stratégia súpera získa použitím zmesi dvoch „užitočných“ stratégií: B 2 a B 4, ktoré sa pretínajú v bode N. Stratégia B 3 je zjavne nerentabilná a stratégia B 1 je pre optimálnu stratégiu SA nerentabilná. *. Ak sa A bude držať svojej optimálnej stratégie, potom sa zisk nezmení, bez ohľadu na to, ktorú z jeho „užitočných“ stratégií B použije, zmení sa však, ak B prejde na stratégie B 1 alebo B 3. V teórii hier je dokázané, že každá konečná hra mxn má riešenie, v ktorom počet „užitočných“ stratégií ani jednej strany nepresahuje najmenšie z dvoch čísel m a n. Z toho najmä vyplýva, že hra 2xm má vždy riešenie, na ktorom sa na žiadnej strane podieľajú maximálne dve „užitočné“ stratégie.

Pomocou geometrickej interpretácie je možné poskytnúť jednoduchý spôsob, ako vyriešiť akúkoľvek hru 2xm. Priamo z nákresu nájdeme dvojicu „užitočných“ stratégií protivníka B j a B k, pretínajúcich sa v bode N (ak sa v bode N pretínajú viac ako dve stratégie, berieme ľubovoľné dve z nich). Vieme, že ak hráč A dodržiava svoju optimálnu stratégiu, potom výplata nezávisí od pomeru, v akom aplikuje B na svoje „užitočné“ stratégie, preto,

Z týchto rovníc a podmienky p 2 = 1 - p 1 zistíme p1, p2 a cenu hry ν. Keď poznáte cenu hry, môžete okamžite určiť optimálnu stratégiu hráč B. Na tento účel je napríklad vyriešená rovnica: qja 1 j + qka 1 k = ν, kde qj + qk = 1. V prípade, že máme m stratégií a nepriateľ má len dve, samozrejme, problém sa rieši úplne podobným spôsobom; stačí si všimnúť, že zmenou znamienka výhry na opačné možno hráča A zmeniť z „výhry“ na „prehru“. Hru môžete vyriešiť bez zmeny výherného znaku; potom sa problém rieši priamo pre B, ale zostrojí sa nie spodná, ale horná výplata (obr. 4.9). Na hranici sa hľadá bod N s minimálnou ordinátou, čo je cena hry ν.

Zvážte a vyriešte niekoľko príkladov hier 2 × 2 a 2xm, čo sú zjednodušené príklady hier, ktoré majú praktický význam.

Príklad 3 Strana A pošle dva bombardéry do nepriateľskej oblasti B ja a II; ja letí vpredu, II- vzadu. Jeden z bombardérov - vopred sa nevie, ktorý - musí niesť bombu, druhý slúži ako sprievod. V priestore nepriateľa na bombardéry útočí bočná stíhačka B. Bombardéry sú vyzbrojené kanónmi s rôznou rýchlosťou streľby. Ak stíhačka zaútočí na zadný bombardér II, potom naň strieľajú len delá tohto bombardéra; ak zaútočí na predný bombardér, tak naňho strieľajú delá oboch bombardérov. Pravdepodobnosť zasiahnutia bojovníka je v prvom prípade 0,3, v druhom 0,7.

Ak nie je stíhačka zostrelená obrannou bombardovacou paľbou, potom zasiahne cieľ podľa vlastného výberu s pravdepodobnosťou 0,6. Úlohou bombardérov je doniesť bombu k cieľu; úlohou bojovníka je tomu zabrániť, t.j. zostreliť nosný bombardér. Je potrebné zvoliť optimálne stratégie strán:

a) pre stranu A: ktorý bombardér by sa mal použiť ako nosič?

b) pre stranu B: na ktorý bombardér zaútočiť?

Riešenie. Máme jednoduchý prípad hry 2 × 2; výhra - pravdepodobnosť neporazenia dopravcu. Naše stratégie: A 1 - nosič - bombardér ja; 2 - nosič - bombardér II... Nepriateľské stratégie: B 1 - bombardér je napadnutý ja; B 2 - útoky bombardérov II... Zostavme si maticu hry, t.j. nájdite priemerný výnos pre každú kombináciu stratégií.

1.A 1 B 1 (nosič ja, je napadnutý ja). Nosič nebude zasiahnutý, ak bombardéry zostrelia stíhačku, alebo nezostrelia, ale nezasiahne svoj cieľ: a 11 = 0,7 + 0,3 * 0,4 = 0,82.

2.A2B1 (nosič II, je napadnutý ja). a 21 = 1

3.A 1 B 2 (nosič ja, je napadnutý II). A12 = 1

4.A2B2 (nosič II, je napadnutý II). A22 = 0,3 + 0,7 x 0,4 = 0,58

Matica hry má tvar:

Najnižšia cena hry je 0,82; najvyššia cena 1. Matrix nemá sedlový hrot; hľadáme riešenie v oblasti zmiešaných stratégií. Máme:

p 1 * 0,82 + p 2 * 1 = ν

p1*1 + p2* 0,58 = ν

p1 = 0,7; p2 = 0,3

Naša optimálna stratégia je teda ako dopravca si treba častejšie vyberať ja, ako II... Cena hry je ν = 0,874. Pri poznaní ν určíme q 1 a q 2 - frekvencie stratégií B 1 a B 2 v optimálnej stratégii protivníka S B *. Máme: q 1 * 0,82 + q 2 * 1 = 0,874 a q 2 = 1 - q 1, odkiaľ q 1 = 0,7; q 2 = 0,3, čiže optimálna stratégia súpera je .

Príklad 4 Strana A útočí na objekt, strana B ho bráni. Strana A má dve roviny; strana B má tri protilietadlové delá. Každé lietadlo nesie silnú ničivú zbraň; aby bol objekt zasiahnutý, stačí, aby k nemu prerazilo aspoň jedno lietadlo. Lietadlo strany A si môže zvoliť ktorýkoľvek z troch smerov priblíženia sa k zariadeniu: ja, II, III(obr. 4.10). Nepriateľ (strana B) môže umiestniť ktorúkoľvek zo svojich zbraní v ľubovoľnom smere; zároveň každá zbraň strieľa iba oblasť priestoru súvisiacu s daným smerom a nestrieľa susedné smery. Každá zbraň môže strieľať len na jedno lietadlo; vystrelené lietadlo je zasiahnuté s pravdepodobnosťou 1. Strana A nevie, kde sa nachádzajú zbrane; strana B nevie, odkiaľ budú prilietať lietadlá. Úlohou strany A je zasiahnuť predmet; úlohou strany B je zabrániť jeho porážke. Nájdite riešenie hry.

Riešenie. Ide o hru 2 × 3. Odmena je pravdepodobnosť zasiahnutia objektu. Naše možné stratégie sú: A 1 – vyslať jedno lietadlo naraz v dvoch rôznych smeroch. A 2 - pošlite obe lietadlá rovnakým smerom. Nepriateľské stratégie: B 1 - položte jednu zbraň v každom smere; V 2 - dajte dve pištole v jednom smere a jednu v druhom; V 3 - dajte všetky tri pištole rovnakým smerom. Poskladáme maticu hry.

1. А 1 В 1 (lietadlá lietajú rôznymi smermi; delá sú umiestnené po jednom). Je zrejmé, že v tomto prípade ani jedna rovina neprerazí k objektu: a 11 = 0.

2. А 2 В 1 (lietadlá letia spolu rovnakým smerom; delá sú umiestnené po jednom). Je zrejmé, že v tomto prípade jedno lietadlo preletí k objektu bez streľby: a 21 = 1.

3. А 1 В 2 (lietadlá lietajú jedno po druhom; nepriateľ bráni dva smery a tretí necháva nechránený). Pravdepodobnosť, že aspoň jedna rovina prerazí k objektu, sa rovná pravdepodobnosti, že jedna z nich zvolí nechránený smer: a 12 = 2/3.

4. А 2 В 2 (lietadlá letia spolu jedným smerom; nepriateľ sa bráni jedným smerom dvoma delami a jedným jedným, teda vlastne bráni jeden smer a dve necháva nechránené). Pravdepodobnosť, že aspoň jedna rovina prerazí k objektu, sa rovná pravdepodobnosti, že si dvojica rovin zvolí skutočne nechránený smer: a 22 = 2/3.

5. A 1 B 3 (lietadlá lietajú po jednom; nepriateľ bráni iba jedným smerom tromi delami): a 13 = 1.

6. А 2 В 3 (obe lietadlá letia spolu; nepriateľ bráni iba jedným smerom s tromi delami). Aby bol objekt zasiahnutý, lietadlo musí zvoliť nechránený smer: a 23 = 2/3.

Matrix hry:

Matica ukazuje, že stratégia В 3 je zjavne nevýhodná v porovnaní s В 2 (toto sa dalo vyriešiť vopred). Stratégia vyčiarknutia V hre 3 sa hra zredukuje na hru 2 × 2:

Matica má sedlový bod: spodná cena hry sa 2/3 zhoduje s hornou. Zároveň podotýkame, že pre nás (A) je stratégia A 1 zjavne nerentabilná. Záver: obe strany A aj B by mali vždy používať svoje čisté stratégie A 2 a B 2, t.j. musíme poslať lietadlá po 2, pričom náhodne vyberieme smer, ktorým sa dvojica posiela; protivník musí umiestniť svoje zbrane nasledujúcim spôsobom: dve v jednom smere, jeden v druhom, pričom výber týchto smerov musí byť tiež náhodný (tu, ako vidíme, už "čisté stratégie" zahŕňajú prvok náhody) . Aplikovaním týchto optimálnych stratégií vždy dostaneme konštantnú priemernú výplatu 2/3 (t. j. objekt bude zasiahnutý s 2/3 pravdepodobnosťou). Všimnite si, že nájdené riešenie hry nie je jediné; okrem riešenia v čistých stratégiách existuje celý úsek zmiešaných stratégií hráča A, ktoré sú optimálne, od p 1 = 0 po p 1 = 1/3 (obr. 4.11).

Je ľahké napríklad priamo vidieť, že rovnaký priemerný výnos 2/3 dosiahneme, ak použijeme naše stratégie A1 a A2 v pomere 1/3 a 2/3.

Príklad 5. Podmienky sú rovnaké ako v predchádzajúcom príklade, ale sú pre nás možné štyri smery útoku a nepriateľ má štyri zbrane.

Riešenie. Stále máme dve možné stratégie: A 1 - poslať lietadlá po jednom, A 2 - poslať dve lietadlá spolu. Nepriateľ má päť možných stratégií: B 1 - položte jednu zbraň v každom smere; V 2 - dajte dve pištole v dvoch rôznych smeroch; V 3 - dajte dve pištole v jednom smere a jednu po druhej na ďalšie dve; Na 4 umiestnite tri pištole v jednom smere a jednu v druhom; Na 5 - dajte všetky štyri pištole rovnakým smerom. Stratégie B 4, B 5 budú vopred vyradené ako zjavne nerentabilné. Podobne ako v predchádzajúcom príklade zostavíme hernú maticu:

Spodná cena hry je 1/2, horná 3/4. Matrica nemá sedlový bod; riešenie spočíva v oblasti zmiešaných stratégií. Pomocou geometrickej interpretácie (obr. 4.12) vyčleňme „užitočné“ stratégie nepriateľa: B 1 a B 2.

Frekvencie p 1 a p 2 sú určené z rovníc: p 1 * 0 + (1 - p 1) * 1 = ν a p 1 * 5/6 + (1 - p 1) * 1/2 = ν; odkiaľ p 1 = 3/8; p2 = 5/8; ν = 5/8, t.j. naša optimálna stratégia je ... Jeho použitím si garantujeme priemernú výhru 5/8. Keď poznáme cenu hry ν = 5/8, nájdeme frekvencie q 1 a q 2 súperových „užitočných“ stratégií: q 1 * 0 + (1 - q 1) * 5/6 = 5/8, q 1 = ¼, q2 = ¾. Optimálna stratégia nepriateľa by bola: .

Príklad 6. Strana A má dve stratégie A 1 a A 2, strana B má štyri B 1, B 2, B 3 a B 4. Matica hry má tvar:

Nájdite riešenie hry.

Riešenie. Najnižšia cena hry je 3; hore 4. Geometrický výklad (obr. 4.13) ukazuje, že B 1 a B 2 alebo B 2 a B 4 sú užitočné stratégie:

Hráč A má nekonečne veľa optimálnych zmiešaných stratégií: v optimálnej stratégii sa p 1 môže meniť od 1/5 do 4/5. Cena hry ν = 4. Hráč B má čistú optimálnu stratégiu B 2.

§ 5. Všeobecné metódy riešenia konečných hier

Doteraz sme uvažovali len o najelementárnejších hrách typu 2xn, ktoré možno veľmi jednoducho vyriešiť a umožňujú pohodlný a intuitívny geometrický výklad. Vo všeobecnom prípade je vyriešenie hry mxn pomerne zložitý problém a zložitosť problému a množstvo výpočtov potrebných na jeho vyriešenie dramaticky narastá s rastúcim m a n. Tieto ťažkosti však nie sú zásadného charakteru a sú spojené len s veľmi veľkým objemom výpočtov, ktoré sa v niektorých prípadoch môžu ukázať ako prakticky neuskutočniteľné. Základný aspekt metódy hľadania riešenia zostáva rovnaký pre všetky m.

Ilustrujme si to na príklade hry 3xn. Dajme tomu geometrický výklad – už priestorový. Naše tri stratégie A 1, A 2 a A 3 budú znázornené tromi bodmi na rovine ahoj; prvý leží na začiatku (obr. 5.1), druhý a tretí - na osiach Oh a OU vo vzdialenosti 1 od začiatku.

Osi sa vedú cez body A 1, A 2 a A 3 jaja, IIII a IIIIII kolmo na rovinu ahoj... Na osi jaja zisky sú uložené so stratégiou A 1 na osiach IIII a IIIIII- výhry so stratégiami A 2, A 3. Každá stratégia nepriateľa B j je znázornená rovinou odrezanou na osiach jaja, IIII a IIIIII segmenty rovnajúce sa výnosom pre zodpovedajúce stratégie A 1, A 2 a A 3 a stratégiu B j. Po zostrojení všetkých nepriateľských stratégií dostaneme rodinu rovín nad trojuholníkom A 1, A 2 a A 3 (obr. 5.2). Pre túto rodinu môžete tiež zostrojiť spodnú hranicu odmeny, ako sme to urobili v prípade 2xn, a nájsť na tejto hranici bod N s maximálnou výškou nad rovinou ahoj... Táto výška bude cenou hry ν.

Frekvencie p 1, p 2, p 3 stratégií A 1, A 2 a A 3 v optimálnej stratégii SA * budú určené súradnicami (x, y) bodu N, a to: p 2 = x, p 3 = y, p1 = 1 - p2 - p3. Takáto geometrická konštrukcia ani pre prípad 3xn však nie je jednoduchá na realizáciu a vyžaduje veľa času a úsilia fantázie. Vo všeobecnom prípade hry sa prenesie do m-rozmerného priestoru a stratí všetku jasnosť, hoci použitie geometrickej terminológie môže byť v mnohých prípadoch užitočné. Pri riešení mxn hier je v praxi vhodnejšie použiť nie geometrické analógie, ale výpočtové analytické metódy, najmä preto, že tieto metódy sú jediné vhodné na riešenie problému na počítačoch.

Všetky tieto metódy sa v podstate obmedzujú na vyriešenie problému postupnými pokusmi, ale zoradenie postupnosti pokusov vám umožňuje zostaviť algoritmus, ktorý vedie k riešeniu najhospodárnejším spôsobom. Tu sa v krátkosti zastavíme pri jednej výpočtovej metóde riešenia mxn hier – takzvanej metóde „lineárneho programovania“. Na tento účel najprv uvedieme všeobecné vyhlásenie o probléme hľadania riešenia hry mxn. Nech je daná hra mxn s m stratégiami A 1, A 2,…, A m hráča A a n stratégiami B 1, B 2,…, B n hráča B a je daná výplatná matica ‖a i j ‖. Vyžaduje sa nájsť riešenie hry, t.j. dve optimálne zmiešané stratégie hráčov A a B

kde p1 + p2 + ... + p m = 1; q 1 + q 2 +… + q n = 1 (niektoré čísla pi a q j sa môžu rovnať nule).

Naša optimálna stratégia S A * by nám mala poskytnúť odmenu nie nižšiu ako ν pre akékoľvek správanie súpera a výplatu rovnú ν pre jeho optimálne správanie (stratégia S B *). Podobne stratégia S B * musí poskytnúť súperovi stratu, ktorá nepresiahne ν pri žiadnom našom správaní a rovnú ν pre naše optimálne správanie (stratégia S A *).

Hodnota ceny hry ν nám v tomto prípade nie je známa; budeme predpokladať, že sa rovná nejakému kladnému číslu. Veriac tomu, neporušujeme všeobecnosť uvažovania; pre ν> 0 zjavne postačuje, aby všetky prvky matice ‖a i j ‖ boli nezáporné. To sa dá vždy dosiahnuť pridaním dostatočne veľkej kladnej hodnoty k prvkom ‖a i j ‖ L; pričom cena hry sa zvýši o L a rozhodnutie sa nezmení.

Predpokladajme, že sme zvolili našu optimálnu stratégiu S A *. Potom bude naša priemerná odmena s protivníkovou stratégiou Bj: a j = p 1 a 1j + p 2 a 2j +… + p m a mj. Naša optimálna stratégia S A * má tú vlastnosť, že za akékoľvek správanie protivníka poskytuje odmenu nie menšiu ako ν; preto žiadne z čísel a j nemôže byť menšie ako ν. Dostávame niekoľko podmienok:

Nerovnice (5.1) delíme kladnou hodnotou ν a značíme

Potom je možné do formulára zapísať podmienky (5.1).

kde ξ 1, ξ 2,…, ξ m sú nezáporné čísla. Keďže р 1 + p 2 +… + p m = 1, potom veličiny ξ 1, ξ 2,…, ξ m spĺňajú podmienku

(5.3) ξ 1 + ξ 2 +… + ξ m = 1 / ν.

Chceme, aby naše zaručené výhry boli čo najväčšie; samozrejme, v tomto prípade má pravá strana rovnosti (5.3) minimálnu hodnotu. Problém hľadania riešenia hry sa teda redukuje na nasledujúci matematický problém: určte nezáporné hodnoty ξ 1, ξ 2,…, ξ m spĺňajúce podmienky (5.2) tak, aby ich súčet Φ = ξ 1 + ξ 2 +… + ξ m bola minimálna.

Zvyčajne sa pri riešení problémov spojených s hľadaním extrémnych hodnôt (maxima a minimá) funkcia diferencuje a derivácie sa rovnajú nule. Takáto technika je však v tomto prípade zbytočná, pretože funkcia Φ, ktorú je potrebné zredukovať na minimum, je lineárna a jej derivácie vzhľadom na všetky argumenty sú rovné jednote, t.j. nikde nezmiznúť. V dôsledku toho je maximum funkcie dosiahnuté niekde na hranici variačného rozsahu argumentov, ktorý je určený požiadavkou nezápornosti argumentov a podmienok (5.2). Metóda zisťovania extrémnych hodnôt pomocou diferenciácie je tiež nevhodná v prípadoch, keď je pre riešenie hry určená maximálna spodná (alebo minimum hornej) hranice výplaty, ako sme to urobili napríklad pri riešení 2xn. hry. Spodná hranica sa v skutočnosti skladá z úsekov priamok a maximum sa nedosiahne v bode, kde sa derivácia rovná nule (takýto bod vôbec neexistuje), ale na hranici intervalu alebo v bode priesečníka priamych úsekov.

Na riešenie takýchto problémov, ktoré sú v praxi celkom bežné, bol v matematike vyvinutý špeciálny lineárny programovací aparát. Problém lineárneho programovania je položený nasledovne. Je daná sústava lineárnych rovníc:

Je potrebné nájsť nezáporné hodnoty veličín ξ 1, ξ 2,…, ξ m vyhovujúce podmienkam (5.4) a zároveň minimalizovať danú homogénnu lineárnu funkciu veličín ξ 1, ξ 2,…, ξ. m (lineárna forma): Φ = c 1 ξ 1 + c 2 ξ 2 +… + cm ξ m

Je ľahké overiť, že vyššie uvedený problém teórie hier je špeciálnym prípadom úlohy lineárneho programovania pre c 1 = c 2 =… = cm = 1. Na prvý pohľad sa môže zdať, že podmienky (5.2) nie sú ekvivalentné podmienky (5.4), keďže namiesto znamienka rovnosti obsahujú znamienka nerovnosti. Znakov nerovností sa však dá ľahko zbaviť zavedením nových fiktívnych nezáporných premenných z 1, z 2,…, z n a zápisom podmienok (5.2) v tvare:

Tvar Φ, ktorý je potrebné minimalizovať, je Φ = ξ 1 + ξ 2 +… + ξ m. Lineárny programovací aparát umožňuje vybrať hodnoty ξ 1, ξ 2,…, ξ m, ktoré spĺňajú uvedené požiadavky, pomocou relatívne malého počtu sekvenčných vzoriek. Pre väčšiu názornosť si tu demonštrujeme využitie tohto zariadenia priamo na materiáli riešenia konkrétnych hier.

Príklad 1 Je potrebné nájsť riešenie hry 3 × 3 uvedenej v príklade 2 § 1 s maticou:

Aby bolo všetko a ij nezáporné, pridáme ku všetkým prvkom matice L = 5. Získame maticu:

V tomto prípade sa cena hry zvýši o 5 a rozhodnutie sa nezmení.

Definujme optimálnu stratégiu S A *. Podmienky (5.2) majú tvar:

kde ξ 1 = p 1 / ν, ξ 2 = p 2 / ν, ξ 3 = p 3 / ν. Aby sme sa zbavili znakov nerovnosti, zavedieme fiktívne premenné z 1, z 2, z 3; podmienky (5.6) budú napísané v tvare:

Lineárna forma Φ má tvar: Φ = ξ 1 + ξ 2 + ξ 3 a mala by byť čo najmenšia. Ak sú všetky tri stratégie B „užitočné“, potom všetky tri fiktívne premenné z 1, z 2, z 3 zmiznú (to znamená, že pre každú stratégiu B j sa dosiahne odmena rovnajúca sa cene hry ν). Stále však nemáme dôvod tvrdiť, že všetky tri stratégie sú „užitočné“. Aby sme si to overili, pokúsime sa vyjadriť tvar Φ pomocou fiktívnych premenných z 1, z 2, z 3 a uvidíme, či môžeme dosiahnuť, za predpokladu, že sa rovnajú nule, minimum tvaru. Na tento účel riešime rovnice (5.7) vzhľadom na premenné ξ 1, ξ 2, ξ 3 (tj vyjadrujeme ξ 1, ξ 2, ξ 3 pomocou fiktívnych premenných z 1, z 2, z 3) :

Sčítaním ξ 1, ξ 2, ξ 3 dostaneme: Φ = 1/5 + z 1/20 + z 2/10 + z 3/20. Tu sú koeficienty pre všetky z kladné; preto každé zvýšenie z 1, z 2, z 3 nad nulu môže viesť len k zvýšeniu tvaru Φ a chceme, aby bolo minimálne. Preto hodnoty z 1, z 2, z 3, vďaka ktorým je tvar Φ minimálny, sú z 1 = z 2 = z 3 = 0. Minimálna hodnota tvaru Φ je teda: 1 / ν = 1 /5, odkiaľ je cena hry ν = 5. Dosadením nulových hodnôt z 1, z 2, z 3 do vzorcov (5.8) zistíme: ξ 1 = 1/20, ξ 2 = 1/10, ξ 3 = 1/20 alebo ich vynásobením ν, p 1 = 1/4, p 2 = 1/2, p 3 = 1/4. Preto bola nájdená optimálna stratégia A: , t.j. mali by sme napísať číslo 1 v jednej štvrtine všetkých prípadov, 2 v polovici prípadov a 3 vo zvyšnej štvrtine prípadov.

Pri znalosti ceny hry ν = 5 je možné nájsť optimálnu stratégiu súpera pomocou už známych metód. ... Aby sme to dosiahli, použijeme naše ľubovoľné dve „užitočné“ stratégie (napríklad A 2 a A 3) a napíšeme rovnice:

9q 1 + 11 (1-q2-q 1) = 5,

odkiaľ q 1 = q3 = 1/4; q2 = 1/2. Optimálna stratégia nepriateľa bude rovnaká ako naša: ... Teraz sa vráťme k pôvodnej (nie prerobenej) hre. K tomu je potrebné iba odpočítať hodnotu L = 5 od ceny hry ν = 5, pripočítanú k prvkom matice. Dostaneme cenu pôvodnej hry v 0 = 0. Optimálne stratégie oboch strán teda poskytujú priemerný výnos rovný nule; hra je rovnako výhodná alebo nevýhodná pre obe strany.

Príklad 2Športový klub A má tri možnosti zloženia družstva A 1, A 2 a A 3. Klub B - aj v troch variantoch B 1, B 2 a B 3. Pri žiadosti o účasť v súťaži ani jeden z klubov nevie, akú zostavu si súper vyberie. Pravdepodobnosti výhry klubu A v rôznych zostavách, zhruba známe zo skúseností z minulých stretnutí, sú dané maticou:

Zistite, ako často by mali kluby hrať každý tím proti sebe, aby dosiahli najvyšší priemerný počet víťazstiev.

Riešenie. Nižšia cena hry je 0,4; horná 0,6; hľadáme riešenie v oblasti zmiešaných stratégií. Aby sme sa nezaoberali zlomkami, vynásobíme všetky prvky matice 10; v tomto prípade sa cena hry zvýši 10-krát a rozhodnutie sa nezmení. Dostaneme maticu:

Podmienky (5.5) majú tvar:

a minimálna podmienka Φ = ξ 1 + ξ 2 + ξ 3 = min.

Skontrolujte, či sú všetky tri súperove stratégie „užitočné“. Ako hypotézu najprv predpokladáme, že fiktívne premenné z 1, z 2, z 3 sa rovnajú nule a pre overenie riešime rovnice (5.10) pre ξ 1, ξ 2, ξ 3:

(5.12) 136Φ = 30 + 13z 1 + 18z 2 - 51z 3

Vzorec (5.12) ukazuje, že zvýšenie premenných z 1 a z 2 v porovnaní s ich predpokladanou hodnotou nula môže len zvýšiť Φ, zatiaľ čo zvýšenie z 3 môže znížiť Φ. Zvýšenie z 3 sa však musí vykonať opatrne, aby sa hodnoty ξ 1, ξ 2, ξ 3 v závislosti od z 3 v tomto prípade nestali zápornými. Preto na pravej strane rovnosti (5.11) nastavíme hodnoty z 1 a z 2 na nulu a hodnotu z 3 budeme zvyšovať na prípustné medze (až do niektorej z hodnôt ξ 1, ξ 2, ξ 3 zmizne). Z druhej rovnosti v (5.11) je vidieť, že zvýšenie z 3 je pre hodnotu ξ 2 „bezpečné“ – od tejto sa len zvyšuje. Čo sa týka veličín ξ 1 a ξ 3, tu je zvýšenie z 3 možné len do určitej hranice. Množstvo ξ 1 zaniká pri z 3 = 10/23; množstvo ξ 3 zaniká skôr, už pri z 3 = 1/4. Preto, keď z 3 dáme jeho maximálnu prípustnú hodnotu z 3 = 1/4, v tomto prípade vynulujeme hodnotu ξ 3.

Aby sme skontrolovali, či sa tvar Φ stane minimom pri z 1 = 0, z 2 = 0, ξ 3 = 0, vyjadríme zostávajúce (nenulové) premenné pomocou údajne nulových z 1, z 2, ξ 3. Riešením rovníc (5.10) vzhľadom na ξ 1, ξ 2 a z 3 dostaneme:

(5.13) 32Φ = 7 + Зz 1 + 4z 2 + ξ 3

Zo vzorca (5.13) je zrejmé, že akékoľvek zvýšenie z 1, z 2, ξ 3 nad ich predpokladané nulové hodnoty môže len zväčšiť tvar Φ. Preto sa našlo riešenie hry; je určená hodnotami z 1 = z 2 = ξ 3 = 0, odkiaľ ξ 1 = 1/32, ξ 2 = 3/16, z 3 = 1/4. Dosadením do vzorca (5.13) zistíme cenu hry ν: 32Φ = 7 = 32 / ν; v = 32/7. Naša optimálna stratégia: ... „Užitočné“ stratégie (kompozície A 1 a A 2) by sa mali aplikovať pri frekvenciách 1/7 a 6/7; zloženie A 3 - nikdy neaplikujte.

Ak chcete nájsť optimálnu stratégiu protivníka, vo všeobecnom prípade môžete urobiť nasledovné: zmeniť znamienko odmeny na opačné, pridať konštantnú hodnotu L k prvkom matice, aby boli nezáporné, a vyriešiť problém pre protivníka rovnakým spôsobom, ako sme ho vyriešili pre seba. Fakt, že už poznáme cenu hry ν, však problém trochu zjednodušuje. Navyše v tomto konkrétnom prípade je úloha ešte zjednodušená tým, že na riešení sa podieľajú len dve „užitočné“ stratégie protivníka B 1 a B 2, keďže hodnota z 3 sa nerovná nule, a preto so stratégiou B 3 sa cena hry nedosiahne ... Výberom akejkoľvek „užitočnej“ stratégie hráča A, napríklad A 1, možno nájsť frekvencie q 1 a q 2. Aby sme to dosiahli, napíšeme rovnicu 8q 1 + 2 (1 - q 1) = 32/7, odkiaľ q 1 = 3/7, q 2 = 4/7; optimálna stratégia nepriateľa bude: , t.j. nepriateľ by nemal použiť kompozíciu B 3 a kompozície B 1 a B2 by mali byť použité s frekvenciami 3/7 a 4/7.

Ak sa vrátime k pôvodnej matici, určíme skutočnú hodnotu hry ν 0 = 32/7: 10 = 0,457. To znamená, že pri veľkom počte stretnutí bude počet víťazstiev klubu A 0,457 zo všetkých stretnutí.

§ 6. Približné metódy riešenia hier

Často pri praktických problémoch nie je potrebné hľadať presné riešenie hry; stačí nájsť približné riešenie, ktoré dáva priemernú výplatu blízko cene hry. Približnú znalosť hodnoty hry ν možno poskytnúť jednoduchým rozborom matice a určením spodnej (α) a hornej (β) ceny hry. Ak sú α a β blízko, nie je prakticky potrebné hľadať presné riešenie, ale postačí zvoliť čisté minimaxové stratégie. V prípadoch, keď α a β nie sú blízko, je možné získať praktické riešenie pomocou numerických metód riešenia hier, z ktorých stručne vyzdvihneme metódu iterácie.

Myšlienka metódy iterácie je nasledovná. Odohráva sa „myšlienkový experiment“, v ktorom súperi A a B používajú svoje stratégie proti sebe. Experiment pozostáva zo sekvencie elementárnych hier, z ktorých každá má maticu danej hry. Začína to tým, že my (hráč A) si ľubovoľne vyberieme jednu zo svojich stratégií, napríklad A i. Nepriateľ na to odpovedá svojou stratégiou B j, ktorá je pre nás najmenej výhodná, t.j. znižuje výnos pre stratégiu A i na minimum. Na tento krok reagujeme našou stratégiou А k, ktorá dáva maximálnu priemernú výplatu, keď súper používa stratégiu B j. Ďalej - opäť obrat nepriateľa. Na našu dvojicu ťahov A i a A k odpovedá svojou stratégiou B j, ktorá nám dáva najmenšiu priemernú výplatu pre tieto dve stratégie (A i, Ak) atď. V každom kroku iteračného procesu každý hráč reaguje na akýkoľvek ťah druhého hráča svojou vlastnou stratégiou, ktorá je optimálna vzhľadom na všetky jeho predchádzajúce ťahy, čo sa považuje za nejaký druh zmiešanej stratégie, v ktorej sú čisté stratégie prezentované v pomeroch zodpovedajúcich frekvenciu ich aplikácie.

Táto metóda je akoby modelom skutočného praktického „tréningu“ hráčov, kedy si každý cez skúsenosť sonduje správanie súpera a snaží sa na to reagovať tak, aby to bolo pre neho prospešné. Ak toto napodobňovanie procesu učenia pokračuje dostatočne dlho, potom sa priemerná odmena za jeden pár ťahov (základná hra) bude prikláňať k cene hry a frekvencie p 1 ... p m; q 1 ... q n, s ktorými sa stratégie hráčov v tejto rally stretávajú, sa priblížia k frekvenciám, ktoré určujú optimálne stratégie. Výpočty ukazujú, že konvergencia metódy je veľmi pomalá, čo však nie je prekážkou pre vysokorýchlostné počítacie stroje.

Ukážme si aplikáciu iteračnej metódy na príklade hry 3 × 3 vyriešenej v príklade 2 predchádzajúcej časti. Hra je daná maticou:

Tabuľka 6.1 zobrazuje prvých 18 krokov iteračného procesu. Prvý stĺpec obsahuje číslo základnej hry (dvojica ťahov) n; v druhom - čísle i zvolená stratégia hráča A; v ďalších troch - "akumulované výhry" pre prvého n hry s nepriateľskými stratégiami B 1, B 2, B 3. Najmenšia z týchto hodnôt je podčiarknutá. Nasleduje číslo j stratégiu zvolenú nepriateľom a podľa toho aj akumulovaný zisk za n hry pre stratégie A 1, A 2, A 3 týchto hodnôt, maximum je zhora podčiarknuté. Podčiarknuté hodnoty určujú výber stratégie odozvy druhého hráča. Nasledujúce grafy postupne zobrazujú: minimálnu priemernú výplatu ν, ktorá sa rovná minimálnej akumulovanej výplate vydelená počtom hier n; maximálna priemerná výhra sa rovná maximálnej akumulovanej výhre vydelená n a ich aritmetický priemer ν * = (ν +) / 2. Pri zvyšovaní n všetky tri veličiny ν, a ν * sa budú blížiť cene hry ν, ale hodnota ν * sa k nej, prirodzene, priblíži pomerne rýchlejšie.

Tabuľka 6.1.

Ako vidíte na príklade, konvergencia iterácií je veľmi pomalá, no napriek tomu aj takýto malý výpočet umožňuje nájsť približnú hodnotu ceny hry a odhaliť rozšírenosť „užitočných“ stratégií. Pri použití počítacích strojov sa hodnota metódy výrazne zvyšuje. Výhodou iteračnej metódy na riešenie hier je, že objem a zložitosť výpočtov rastie relatívne slabo so zvyšujúcim sa počtom stratégií. m a n.

§ 7. Metódy riešenia niektorých nekonečných hier

Nekonečná hra je hra, v ktorej má aspoň jedna strana nekonečné množstvo stratégií. Všeobecné metódy riešenia takýchto hier ešte nie sú dostatočne vyvinuté. Pre prax však môžu byť zaujímavé niektoré špeciálne prípady, ktoré pripúšťajú pomerne jednoduché riešenie. Zoberme si hru dvoch protivníkov A a B, z ktorých každý má nekonečný (nespočetný) súbor stratégií; tieto stratégie pre hráča A zodpovedajú rôznym hodnotám neustále sa meniaceho parametra NS a pre parameter В pri... V tomto prípade je hra namiesto matice ‖a ij definovaná nejakou funkciou dvoch plynule sa meniacich argumentov a (x, y), ktorú budeme nazývať výplatná funkcia (všimnite si, že samotná funkcia a (x, y) nemusí byť súvislé). Funkcia Win a (x, y) môže byť geometricky reprezentovaná nejakou plochou a (x, y) v oblasti meniacich sa argumentov (x, y)(obr. 7.1)

Analýza výplatnej funkcie a (x, y) sa vykonáva podobne ako analýza platobnej matice. Najprv sa zistí nižšia cena hry α; na to je určená pre každého NS minimálna funkcia a (x, y) pre všetkých pri:, potom sa pre všetkých vyhľadá maximum z týchto hodnôt NS(maximálne):

Horná cena hry (minimax) sa určuje rovnakým spôsobom:

Zvážte prípad, keď α = β. Keďže hodnota hry ν je vždy medzi α a β, ich celková hodnota je ν. Rovnosť α = β znamená, že povrch a (x, y) má sedlový bod, teda bod so súradnicami x 0, y 0, v ktorom a (x, y) je zároveň minimálny in pri a maximálne NS(obr. 7.2).

Význam a (x, y) v tomto bode je cena hry ν: ν = a (x 0, y 0). Prítomnosť sedlového bodu znamená, že táto nekonečná hra má čisto strategické riešenie; x 0, y 0 predstavujú optimálne čisté stratégie A a B. Vo všeobecnom prípade, keď α ≠ β, môže mať hra riešenie len v oblasti zmiešaných stratégií (možno nie jediné). Zmiešaná stratégia pre nekonečné hry existuje určité rozdelenie pravdepodobnosti pre stratégie NS a pri považované za náhodné premenné. Toto rozdelenie môže byť spojité a určené hustotami f 1 (NS) a f 2 (y); môžu byť diskrétne a potom optimálne stratégie pozostávajú zo súboru samostatných čistých stratégií vybraných s určitými nenulovými pravdepodobnosťami.

V prípade, že nekonečná hra nemá sedlový bod, možno poskytnúť vizuálnu geometrickú interpretáciu spodnej a hornej ceny hry. Predstavte si nekonečnú hru s výplatnou funkciou a (x, y) a stratégií x, y kontinuálne vypĺňanie segmentov čiary (x 1, x 2) a (y 1, y 2)... Ak chcete určiť nižšiu cenu hry α, musíte sa „pozrieť“ na povrch a (x, y) od osi pri, t.j. premietnuť ho do roviny xOa(obr. 7.3). Získame určitý obrazec ohraničený zo strán priamkami x = x 1 a x = x 2 a zhora a zdola krivkami KB a K N. Nižšia cena hry α, samozrejme, nie je nič iné ako maximálna ordináta krivky K N.

Podobne, ak chcete nájsť hornú cenu hry β, musíte sa „pozrieť“ na povrch a (x, y) od osi NS(projekt od povrchu k rovine áno) a nájdite minimálnu ordinátu hornej hranice K v projekcii (obr. 7.4).

Zvážte dva základné príklady nekonečných hier.

Príklad 1 Každý z hráčov A a B má nespočetné množstvo možných stratégií NS a pri a 0 < x < 1; 0 ≤ y ≤ 1. Výplatná funkcia pre a je daná výrazom a (x, y) - (x - y) 2. Nájdite riešenie hry.

Riešenie, Plocha a (x, y) je parabolický valec (obr. 7.5) a nemá sedlový bod. Určite nižšiu cenu hry; každému zrejmé NS; teda = 0. Stanovme si hornú cenu hry. Aby sme to dosiahli, nájdeme pre fix pri

V tomto prípade sa maximum dosiahne vždy na hranici intervalu (pri x = 0 alebo x = 1), t.j. rovná sa hodnotám y 2; (1 - y) 2, ktorá je väčšia. Nakreslíme si grafy týchto funkcií (obr. 7.6), t.j. povrchová projekcia a (x, y) v lietadle áno... Hrubá čiara na obr. 7.6 ukazuje funkciu. Je zrejmé, že jeho minimálna hodnota sa dosiahne pri y = 1/2 a rovná sa 1/4. Preto je horná cena hry β = 1/4. V tomto prípade sa horná cena hry zhoduje s cenou hry ν. Skutočne, hráč A môže použiť zmiešanú stratégiu S A = , v ktorom sú extrémne hodnoty x = 0 a x = 1 zahrnuté s rovnakými frekvenciami; potom pre akúkoľvek stratégiu hráča B bude priemerný zisk hráča A rovný: ½ y 2 + ½ (1 - y) 2. Je ľahké overiť, že toto množstvo pre akékoľvek hodnoty pri medzi 0 a 1 má hodnotu nie menšiu ako ¼: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Takže hráč A, využívajúci túto zmiešanú stratégiu, si môže zaručiť výplatu rovnajúcu sa hornej cene hry; keďže cena hry nemôže byť vyššia ako horná cena, potom je táto stratégia S A optimálna: S A = S A *.

Zostáva nájsť optimálnu stratégiu hráča B. Je zrejmé, že ak sa cena hry ν rovná hornej cene hry β, potom optimálna stratégia hráča B bude vždy jeho čistá minimax stratégia, ktorá mu zaručí horná cena hry. V tomto prípade je takáto stratégia y 0 = ½. Pri tejto stratégii, bez ohľadu na to, čo hráč A urobí, jeho výplata nebude väčšia ako ¼. Vyplýva to zo zjavnej nerovnosti (x - 1) 2 = x (x -1) + ¼ ≤ ¼

Príklad 2 Strana A ("my") strieľa na nepriateľské lietadlo B. Aby sa nepriateľ vyhol ostreľovaniu, môže manévrovať s určitým preťažením pri, ku ktorému môže podľa svojho uváženia priradiť hodnoty pri= 0 (priamy pohyb) do pri = primax(let v kruhu maximálneho zakrivenia). Predpokladáme primax merná jednotka, t.j. dať primax= 1. V boji proti nepriateľovi môžeme použiť zameriavacie zariadenia založené na tej či onej hypotéze o pohybe cieľa počas letu strely. Preťaženie NS v tomto hypotetickom manévri možno predpokladať, že sa rovná akejkoľvek hodnote od 0 do 1. Našou úlohou je zasiahnuť nepriateľa; úlohou nepriateľa je zostať nedotknutý. Pravdepodobnosť poškodenia údajov NS a pri je približne vyjadrená vzorcom: a (x, y) = , kde pri- preťaženie používané nepriateľom; x - preťaženie zohľadnené v pohľade. Je potrebné určiť optimálne stratégie oboch strán.

Riešenie. Je zrejmé, že riešenie hry sa nezmení, ak nastavíme p = 1. Výplatná funkcia a (x, y) znázornené povrchom znázorneným na obr. 7.7.

Toto je valcová plocha, ktorej tvoriace priamky sú rovnobežné s osou súradnicového uhla ahoj a rez rovinou kolmou na tvoriacu čiaru je krivka typu krivky normálneho rozdelenia. Pomocou geometrickej interpretácie dolných a horných cien hry navrhovanej vyššie zistíme β = 1 (obr. 7.8) a (obr. 7.9). Hra nemá sedlový hrot; riešenie treba hľadať v oblasti zmiešaných stratégií. Problém je trochu podobný problému v predchádzajúcom príklade. Naozaj, za malé hodnoty k funkcia sa správa ako funkcia - (x - y) 2, a riešenie hry získame, ak sa pri riešení predchádzajúceho príkladu obrátia úlohy hráčov A a B; tie. našou optimálnou stratégiou bude čistá stratégia x = 1/2 a optimálnou stratégiou protivníka SB = bude aplikovať extrémne stratégie y = 0 a y = 1 s rovnakými frekvenciami. To znamená, že vo všetkých prípadoch musíme použite zameriavač navrhnutý na preťaženie x = 1/2 a nepriateľ by v polovici všetkých prípadov nemal použiť manéver a v polovici - maximálny možný manéver.

Ryža. 7.8 Obr. 7.9.

Je ľahké dokázať, že toto riešenie bude platné pre hodnoty k ≤ 2. Priemerná odmena pre súperovu stratégiu S B = a pre našu stratégiu NS vyjadrené funkciou , ktorá pre hodnoty k ≤ 2 má jedno maximum pri х = 1/2, čo sa rovná nižšej cene hry α. Následne aplikácia stratégie S B garantuje súperovi stratu nepresahujúcu α, z čoho je zrejmé, že α – nižšia cena hry – je cenou hry ν.

Pre k> 2 má funkcia a (x) dve maximá (obr. 7.10), umiestnené symetricky vzhľadom na x = 1/2 v bodoch x 0 a 1 - x 0 a hodnota x 0 závisí od k .

Je zrejmé, že pre k= 2 x 0 = 1 - x 0 = 1/2; pri zvyšovaní k body x 0 a 1 - x 0 sa od seba vzdialia, čím sa priblížia k extrémnym bodom (0 a 1). Preto rozhodnutie hry bude závisieť od k. Stanovme pre k konkrétnu hodnotu, napríklad k = 3, a nájdeme riešenie hry; na to definujeme úsečku x 0 maxima krivky a (x). Ak sa rovná nule derivácie funkcie a (x), napíšeme rovnicu na určenie x 0:

Táto rovnica má tri korene: x = 1/2 (kde sa dosiahne minimum) a x 0, 1 - x 0, kde sa dosiahne maximum. Pri numerickom riešení rovnice nájdeme približne x 0 ≈ 0,07; 1 - x 0 ≈ 0,93.

Dokážme, že riešením hry je v tomto prípade nasledujúca dvojica stratégií:

S našou stratégiou a stratégiou nepriateľa pri priemerná odmena je

Nájdite minimum 1 (y) na 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Pri nastavení y = 1/2 dostaneme

ktorý je väčší ako 1 (0); preto cena hry nie je nižšia ako 1 (0):

Teraz povedzme, že protivník používa stratégiu S B * a my používame stratégiu x. Potom bude priemerná odmena

Ale x 0 sme zvolili presne tak, aby pri x = x 0 bolo dosiahnuté maximum vyjadrenia (7.2); teda,

tie. súper pomocou stratégie S B * môže zabrániť strate väčšej ako 0,530; preto ν = 0,530 je cena hry a stratégie S A * a S B * poskytujú riešenie. To znamená, že mieridlá s x = 0,07 a x = 0,93 musíme používať s rovnakou frekvenciou a nepriateľ nesmie manévrovať s rovnakou frekvenciou a manévrovať s maximálnym preťažením.

Všimnite si, že výplata ν = 0,530 je výrazne vyššia ako nižšia cena hry , ktoré by sme si mohli poskytnúť sami aplikáciou našej maximálnej stratégie x 0 = 1/2.

Jedným z praktických spôsobov riešenia nekonečných hier je priblížiť ich konečným. V tomto prípade je celá škála možných stratégií pre každého hráča konvenčne kombinovaná do jednej stratégie. Takto sa dá samozrejme získať len približné riešenie hry, no vo väčšine prípadov nie je potrebné presné riešenie.

Treba si však uvedomiť, že pri aplikácii tejto techniky sa môžu objaviť riešenia v oblasti zmiešaných stratégií aj v prípadoch, keď je riešenie pôvodnej nekonečnej hry možné v čistých stratégiách, t.j. keď má nekonečná hra sedlovú pointu. Ak sa redukciou nekonečnej hry na konečnú získa zmiešané riešenie, ktoré zahŕňa len dve susediace „užitočné“ stratégie, potom má zmysel pokúsiť sa medzi nimi aplikovať strednú čistú stratégiu pôvodnej nekonečnej hry.

Na záver poznamenávame, že nekonečné hry, na rozdiel od konečných, nemusia mať riešenie. Uveďme príklad nekonečnej hry, ktorá nemá riešenie. Dvaja hráči pomenujú každého ľubovoľným celým číslom. Ten, kto zavolal na vyššie číslo, dostane od druhého 1 rubeľ. Ak obaja volajú na rovnaké číslo, hra končí remízou. Hra zjavne nemôže mať riešenie. Existujú však triedy nekonečných hier, pre ktoré určite existuje riešenie.

Použitie matematických metód, medzi ktoré patrí aj teória hier, pri analýze ekonomických procesov umožňuje identifikovať také trendy, vzťahy, ktoré zostávajú skryté pri použití iných metód.

V ekonomickej realite sú na každom kroku situácie, kedy sa jednotlivci, firmy či celé krajiny snažia v boji o prvenstvo obchádzať. Takýmito situáciami sa zaoberá odvetvie ekonomickej analýzy nazývané „teória hier“.

"Teória hier študuje spôsob, akým si dvaja alebo viacerí hráči vyberajú jednotlivé akcie alebo celé stratégie. Názov tejto teórie je trochu abstraktný, keďže sa spája s hraním šachu a bridžu alebo vedením vojen. V skutočnosti sú závery tzv. Táto teória hier bola vyvinutá rodákom z Maďarska, brilantným matematikom Johnom von Neumannom (1903-1957) Táto teória je relatívne mladá matematická disciplína.

Neskôr bola teória hier doplnená o vývoj ako Nashova rovnováha (pomenovaná po matematikovi Johnovi Nashovi). Nashova rovnováha nastáva, keď žiadny z hráčov nemôže zlepšiť svoju pozíciu, ak ich súperi nezmenia svoje stratégie. Stratégia každého hráča je najlepšou odpoveďou na súperovu stratégiu. Niekedy sa Nashova rovnováha nazýva aj nekooperatívna rovnováha, pretože účastníci sa rozhodujú bez toho, aby medzi sebou uzatvárali akékoľvek dohody a bez toho, aby brali do úvahy akékoľvek iné úvahy (záujmy spoločnosti alebo záujmy iných strán), s výnimkou ich vlastný prospech.

Rovnováha dokonale konkurenčného trhu je aj Nashova rovnováha, alebo nekooperatívna rovnováha, v ktorej sa každá firma a každý spotrebiteľ rozhoduje na základe už existujúcich cien ako nezávislých od svojej vôle. Už vieme, že keď sa každá firma snaží maximalizovať zisk a každý spotrebiteľ je užitočná, rovnováha nastáva, keď sa ceny rovnajú hraničným nákladom a zisky sú nulové. "Mamaeva LN Inštitucionálna ekonómia: Kurz prednášok - M .: Vydavateľská a obchodná spoločnosť" Dashkov a K ", 2012. - 200 s.

Pripomeňme si koncept „neviditeľnej ruky“ Adama Smitha: „Presadzovaním vlastných záujmov prispieva (jednotlivec) často k prosperite spoločnosti väčšou mierou, ako keby o ňu vedome usiloval“ Smith A. Research on povaha a príčiny bohatstva národov // Antológia ekonomických klasikov ... - M.: Ekonov-Klyuch, 19931. Paradoxom „neviditeľnej ruky“ je, že hoci každý pôsobí ako nezávislá sila, nakoniec víťazom zostáva spoločnosť. Konkurenčná rovnováha je zároveň aj Nashovou rovnováhou v tom zmysle, že nikto nemá dôvod meniť svoju stratégiu, ak všetci ostatní dodržiavajú tú svoju. V úplne konkurenčnej ekonomike je nekooperatívne správanie nákladovo efektívne z hľadiska záujmov spoločnosti.

Naopak, keď sa členovia určitej skupiny rozhodnú spolupracovať a spoločne dospejú k monopolnej cene, bude takéto správanie škodlivé pre ekonomickú efektívnosť. Štát je nútený vytvárať protimonopolnú legislatívu, a tým rozumeť tým, ktorí sa snažia nafúknuť ceny a rozdeliť trh. Nejednotnosť v správaní však nie je vždy nákladovo efektívna. Rivalita medzi firmami vedie k nízkym cenám a konkurencieschopným objemom výroby. „Neviditeľná ruka“ má takmer magický účinok na dokonale konkurenčné trhy: k efektívnej alokácii zdrojov dochádza v dôsledku konania jednotlivcov, ktorí sa snažia maximalizovať zisk.

V mnohých prípadoch však nespolupracujúce správanie vedie k ekonomickej neefektívnosti alebo dokonca predstavuje hrozbu pre spoločnosť (napríklad preteky v zbrojení). Nespolupracujúce správanie zo strany USA aj ZSSR prinútilo obe strany investovať obrovské množstvo peňazí do vojenskej oblasti a viedlo k vytvoreniu arzenálu takmer 100 000 jadrových hlavíc. Existuje tiež obava, že nadmerná dostupnosť zbraní v Amerike by mohla spustiť akési vnútorné preteky v zbrojení. Niektorí ľudia sa zbrojia proti ostatným – a tieto „rasové preteky“ môžu pokračovať donekonečna. Tu vstupuje do hry úplne „viditeľná ruka“, ktorá riadi túto deštruktívnu súťaž a nemá nič spoločné s „neviditeľnou rukou“ Adama Smitha. Ďalším dôležitým ekonomickým príkladom je „hra so znečistením“ (životného prostredia). Tu budú predmetom našej pozornosti také vedľajšie účinky ako znečistenie. Ak by sa firmy nikdy nikoho nepýtali, čo majú robiť, radšej by vytvárali znečistenie, ako by inštalovali drahé čističe. Ak by sa nejaká firma z ušľachtilých pohnútok rozhodla znížiť škodlivé emisie, potom by sa zvýšili náklady a následne aj ceny jej produktov a dopyt by klesol. Je dosť možné, že táto firma by jednoducho skrachovala. Firmy žijúce v brutálnom svete prirodzeného výberu sa skôr rozhodnú zostať v Nashovej rovnováhe. Žiadna firma nemôže zvýšiť zisk znížením znečistenia.

V smrteľnej ekonomickej hre bude každá nekontrolovaná oceliarska firma maximalizujúca zisk produkovať znečistenie vody a ovzdušia. Ak sa firma pokúsi vyčistiť svoje emisie, bude nútená zvýšiť ceny a utrpí straty. Nekooperatívne správanie vytvorí Nashovu rovnováhu v prostredí s vysokými emisiami. Vláda môže podniknúť kroky na zmenu rovnováhy. V tejto polohe bude znečistenie zanedbateľné, zisky zostanú rovnaké. Mamaeva L.N. Inštitucionálna ekonomika: Kurz prednášok - M .: Vydavateľská a obchodná spoločnosť "Dashkov and K", 2012. - 203 s.

Znečisťovacie hry sú jedným z prípadov, kedy mechanizmus pôsobenia „neviditeľnej ruky“ nefunguje. Toto je situácia, keď je Nashova rovnováha neúčinná. Niekedy sa tieto nekontrolovateľné hry stanú hrozivými a vláda môže zasiahnuť. Zavedením systému pokút a emisných kvót môže vláda prinútiť firmy, aby zvolili výsledok s nízkym znečistením. Firmy zarábajú úplne rovnako ako predtým, s veľkými emisiami, no svet sa stáva o niečo čistejším.

Teória hier platí aj pre makroekonomickú politiku. Ekonómovia a politici v Spojených štátoch často nadávajú na súčasnú menovú a fiškálnu politiku: deficit federálneho rozpočtu je príliš veľký a znižuje národné úspory, zatiaľ čo menová politika vytvára úrokové sadzby, ktoré obmedzujú investície. Navyše, tento „fiškálny a monetárny syndróm“ je rysom makroekonomického prostredia už viac ako desať rokov. Prečo je Amerika taká vytrvalá v presadzovaní oboch typov politík, hoci ani jedna z nich nie je žiaduca?

Možno sa pokúsiť vysvetliť tento syndróm z hľadiska teórie hier. V modernej ekonómii sa stalo zvykom oddeľovať tieto druhy politiky. Centrálna banka Ameriky – Federálny rezervný systém – určuje menovú politiku nezávisle od vlády stanovením úrokových sadzieb. Fiškálnu politiku, dane a výdavky má na starosti zákonodarná a výkonná moc. Každá z týchto politík má však iné ciele. Cieľom centrálnej banky je obmedziť rast peňažnej zásoby a udržať nízku infláciu.

Arthur Berne, odborník na ekonomické cykly a bývalý šéf Federálneho rezervného systému, napísal: „Úradníci centrálnych bánk majú tendenciu držať ceny pod kontrolou, podľa tradície, možno prostredníctvom osobného skladu. súkromné ​​finančné kruhy“. Orgány zodpovedné za fiškálnu politiku sa viac zaoberajú otázkami, ako je plná zamestnanosť, vlastná popularita, udržiavanie nízkych daní a blížiace sa voľby.

Tvorcovia fiškálnej politiky preferujú čo najnižšiu nezamestnanosť, vyššie vládne výdavky spojené s nižšími daňami a nestarajú sa o infláciu a súkromné ​​investície.

V hre o peniaze a rozpočet vedie kooperatívna stratégia k miernej inflácii a nezamestnanosti spolu s veľkým objemom investícií, ktoré stimulujú ekonomický rast. Túžba po znížení nezamestnanosti a implementácii sociálnych programov však vedie vedenie krajiny k tomu, aby sa uchýlilo k zvyšovaniu rozpočtového deficitu, zatiaľ čo averzia voči inflácii núti centrálnu banku zvyšovať úrokové sadzby. Nekooperatívna rovnováha znamená najmenšiu možnú investíciu.

Vyberajú si „veľký rozpočtový deficit“. Na druhej strane sa centrálna banka snaží znižovať infláciu, neovplyvňujú ju odbory a lobistické skupiny a volí „vysoké úroky“. Výsledkom je nekooperatívna rovnováha s miernou infláciou a nezamestnanosťou, ale nízkymi investíciami.

Je možné, že práve vďaka „fiškálnej hre“ prezident Clinton predložil ekonomický program na zníženie rozpočtového deficitu, zníženie úrokových sadzieb a rozšírenie investícií.

Existujú rôzne spôsoby, ako opísať hry. Jedným z nich je, že sa zvažujú všetky možné stratégie hráčov a určujú sa platby, ktoré zodpovedajú akejkoľvek možnej kombinácii stratégií hráčov. Takto opísaná hra sa nazýva tzv hrať v normálnej forme.

Normálna forma hry pre dvoch hráčov pozostáva z dvoch platobných matíc, ktoré ukazujú, koľko každý hráč dostane za ktorúkoľvek z možných dvojíc stratégií. Obvykle sú tieto matice vyjadrené vo forme jednej matice, ktorá je tzv bimatrix. Prvky bimatice sú dvojice čísel, z ktorých prvé určuje výšku odmeny prvého hráča a druhé výšku odmeny druhého hráča. Prvý hráč (štát) si vyberie jednu z m stratégií, pričom každá stratégia zodpovedá riadku matice I (i = 1,…, m). Druhý hráč (podnikateľ) si vyberie jednu z n stratégií, pričom každá stratégia zodpovedá stĺpcu matice j (j = 1,…, n). Dvojica čísel na priesečníku riadku a stĺpca, ktoré zodpovedajú stratégiám zvoleným hráčmi, ukazuje výšku výhier pre každú z nich. Vo všeobecnosti, ak hráč I zvolí stratégiu i a hráč II je stratégia j, potom výplaty prvého a druhého hráča sú v tomto poradí a (i = 1,…, m; j = 1,…, n), kde m, n je počet konečných stratégií hráči I a II. Predpokladá sa, že každý z hráčov pozná všetky prvky výplatnej bimatice. V tomto prípade sa ich stratégia nazýva definitívna a má konečný počet možností.

Ak hráč nepozná žiadne varianty súperových stratégií (maticové prvky), potom sa hra nazýva neurčitá a môže mať nekonečné množstvo variantov (stratégií).

Existujú aj iné triedy hier, kde hráči vyhrávajú a prehrávajú súčasne.

Antagonistické hry dvoch osôb spojené s tým, že jeden z hráčov vyhrá presne toľko, koľko druhý prehrá. V takýchto hrách sú záujmy jej hráčov priamo protikladné.

Ako príklad si predstavte hru zahŕňajúcu dvoch hráčov, z ktorých každý má dve stratégie. Výhry každého z hráčov určujú tieto pravidlá: ak si obaja hráči zvolia stratégie s rovnakými číslami (hráč I -, hráč II -), vyhrá prvý hráč a druhý prehrá (štát zvyšuje dane - podnikanie platí, tj zisk štátu určuje stratu podnikania); ak si obaja hráči zvolia rôzne stratégie (hráč I - і 1 hráč II - j 2 prvý prehrá a druhý vyhrá (štát zvyšuje dane z podnikania - podniky sa im vyhýbajú; prehra štátu je ziskom z podnikania).

Teória hier je teória matematických modelov takých javov, v ktorých majú účastníci („hráči“) rôzne záujmy a majú viac-menej slobodne zvolené cesty (stratégie) na dosiahnutie svojich cieľov. Vo väčšine prác o teórii hier sa predpokladá, že záujmy účastníkov hry sú kvantifikovateľné a sú skutočnými funkciami situácií, t.j. súbor stratégií, ktoré získate, keď si každý hráč vyberie niektoré zo svojich stratégií. Na získanie výsledkov je potrebné zvážiť určité triedy hier, ktoré sa vyznačujú určitými obmedzujúcimi predpokladmi. Takéto obmedzenia možno uložiť niekoľkými spôsobmi.

Dá sa rozlíšiť viaceré spôsoby (spôsoby) ukladania obmedzení.

1. Obmedzenia možností vzájomných vzťahov hráčov. Najjednoduchší prípad je, keď sú hráči úplne odpojení a nemôžu si navzájom vedome pomáhať či zasahovať jednaním alebo nečinnosťou, informáciami alebo dezinformáciami. Tento stav nevyhnutne nastáva vtedy, keď sa hry zúčastňujú iba dvaja hráči (štát a biznis), ktorí majú diametrálne odlišné záujmy: zvýšenie zisku jedného z nich znamená zníženie zisku druhého a navyše o rovnakú sumu za predpokladu, že zisky oboch hráčov sú vyjadrené v rovnakých merných jednotkách. Bez toho, aby sme porušili všeobecnosť, môžeme považovať celkový zisk oboch hráčov za rovný nule a považovať zisk jedného z nich za stratu druhého.

Tieto hry sa nazývajú antagonistické (alebo hry s nulovým súčtom, alebo hry s nulovým počtom dvoch osôb). Predpokladajú, že medzi hráčmi nemôžu existovať žiadne vzťahy, žiadne kompromisy, výmena informácií a iných zdrojov zo samotnej podstaty vecí, v podstate hry, pretože každá správa prijatá hráčom o zámeroch druhého môže len zvýšiť odmena prvého hráča a tým zvýšenie prehry so svojím súperom.

Dospeli sme teda k záveru, že v antagonistických hrách nemusia mať hráči priame vzťahy a zároveň byť vo vzťahu k sebe v stave hry (opozície).

2. Obmedzenia alebo zjednodušenie predpokladov týkajúcich sa súboru stratégií hráča. V najjednoduchšom prípade sú tieto množiny stratégií konečné, čo eliminuje situácie spojené s možnými zhodami (konvergenciami) v množinách stratégií, eliminuje potrebu zavádzania akejkoľvek technológie na množiny.

Hry, v ktorých sú množiny stratégií každého z hráčov konečné, sa nazývajú koncové hry.

3. Návrhy na vnútornú štruktúru každej stratégie, tzn. o jeho obsahu. Napríklad za stratégie možno považovať funkcie času (kontinuálne alebo diskrétne), ktorých hodnotami sú akcie hráča vo vhodnom okamihu. Tieto a podobné hry sa zvyčajne nazývajú dynamické (pozičné) hry.

Obmedzeniami stratégií hráčov môžu byť aj ich objektívne funkcie, t.j. určenie cieľov, ku ktorým smeruje tá či oná stratégia. Dá sa predpokladať, že obmedzenia stratégie súvisia aj so spôsobmi dosiahnutia týchto cieľov v určitých časových intervaloch, napríklad so snahou podnikateľa dosiahnuť zníženie objemu povinných predajov devízových príjmov v najbližšom období. tri mesiace (alebo jeden rok). Ak neexistujú žiadne predpoklady o povahe stratégií, potom sa považujú za nejaký abstraktný súbor. Hry tohto druhu v najjednoduchšej formulácii otázky sa nazývajú hry v normálnej forme.

Finálne antagonistické hry v normálnej forme sú tzv matice. Tento názov je vysvetlený možnosťou nasledujúceho výkladu hier tohto typu. Stratégie prvého hráča (hráč I - štát) budeme chápať ako riadky nejakej matice a stratégie druhého hráča (hráč II - biznis) - ako jej stĺpce. Pre stručnosť, stratégiou hráčov nie sú samotné riadky alebo stĺpce matice, ale ich čísla. Potom sú situáciami hry bunky tejto matice, ktoré stoja na priesečníkoch každého riadku s každým zo stĺpcov. Po vyplnení týchto buniek-situácií číslami popisujúcimi výplaty hráča I v týchto situáciách dokončíme úlohu hry. Výsledná matica je tzv výplatná matica hry, alebo matica hry. Kvôli antagonizmu maticovej hry je výplata hráča II v každej situácii úplne určená výplatou hráča I v tejto situácii, pričom sa od neho líši iba znamienkom. Preto nie sú potrebné žiadne ďalšie pokyny týkajúce sa výplatnej funkcie hráča II v maticovej hre.

Matica s m riadkami a n stĺpcami sa nazýva matica (m * n) a hra s touto maticou je hra (m * n).

Proces (m * n) - hry s maticou možno znázorniť takto:

Hráč I určuje číslo riadku i a hráč II určuje číslo stĺpca j, po ktorom prvý hráč dostane od svojho súpera súčet

Cieľom hráča I v maticovej hre je získať maximálnu výplatu, cieľom hráča II je poskytnúť hráčovi I minimálnu výplatu.

Nechajte hráča I (štát) zvoliť niektoré zo svojich stratégií i. Potom v horšom prípade dostane výplatu min. V teórii hier sa predpokladá, že hráči sú opatrní a rátajú s tým, že vývoj udalostí je pre nich najmenej priaznivý.

K takémuto stavu, ktorý je najmenej priaznivý pre hráča I, môže dôjsť napríklad v prípade, keď sa stratégia i stane známou hráčovi II (obchod). V očakávaní takejto možnosti si hráč I musí zvoliť stratégiu tak, aby maximalizoval tento minimálny zisk:

min = max min (I)

Hodnota na pravej strane rovnosti je garantovaná výplata hráča I. Hráč II (podnikanie) musí zvoliť takú stratégiu, aby

max = min max (II)

Hodnota na pravej strane rovnosti je odmena hráča I, o ktorú viac nemôže dostať správnym konaním súpera.

Skutočná výplata hráča I musí byť pri rozumných krokoch partnerov v intervale medzi hodnotami výplaty v prvom a druhom prípade. Ak sú tieto hodnoty rovnaké, potom je výplata hráča I presne definované číslo, nazývajú sa samotné hry celkom určite. Výplata hráča I sa nazýva hodnota hry a rovná sa prvku matice.

Hráči môžu mať ďalšie príležitosti - výber stratégií náhodne a nezávisle od seba (stratégie zodpovedajú riadkom a stĺpcom matice). Volá sa náhodný výber stratégií hráča zmiešaná krajinaštítky tohto hráča. V (m * n) - hre sú zmiešané stratégie hráča I určené množinami pravdepodobností: X = (, ...), s ktorými si tento hráč vyberá svoje počiatočné, čisté stratégie.

Teória maticových hier je založená na Neumannovej vete o aktívnych stratégiách: „Ak jeden z hráčov dodrží svoju optimálnu stratégiu, potom výhra zostáva nezmenená a rovná sa cene hry bez ohľadu na to, čo robí druhý hráč, ak nepokračuje. za hranice svojich aktívnych stratégií (t. j. ktorúkoľvek z nich používa v čistej forme alebo ich mieša v akomkoľvek pomere „Neumann J. Príspevky k teórii hier. 1995 .. - 155 s.). Poznač si to aktívny je čistá stratégia hráča zaradená do jeho optimálnej zmiešanej stratégie s nenulovou pravdepodobnosťou.

Hlavným cieľom hry je nájsť optimálnu stratégiu pre oboch hráčov, ak nie s maximálnym ziskom pre jedného z nich, tak s minimálnou stratou pre oboch. Metóda hľadania optimálnych stratégií často dáva viac, ako je potrebné na praktické účely. V maticovej hre nie je potrebné, aby hráč poznal všetky svoje optimálne štruktúry, pretože všetky sú vzájomne zameniteľné a pre úspešnú hru hráč potrebuje poznať iba jednu z nich. Preto je vo vzťahu k matrixovým hrám aktuálna otázka hľadania aspoň jednej optimálnej stratégie pre každého z hráčov.

Hlavná veta o maticových hrách uvádza existenciu herných hodnôt a optimálne zmiešané stratégie pre oboch hráčov. Optimálna stratégia nemusí byť jednorazová. Toto je veľmi dôležitý záver z teórie hier.

Subjekt hrajúci maticovú hru sa vyznačuje tým nasledujúci kvalita:

maticové prvky vykladané ako hotovostné platby a podľa toho aj ich výhry a stratiť hodnotené v peňažné forma;

každý z hráčov aplikuje funkciu na tieto prvky užitočnosť;

v hre sa každý hráč správa tak, ako keby užitočná funkcia jeho súpera mala na maticu presne rovnaký vplyv, t.j. každý sa pozerá na hru „so svojím zvonice“.

Títo predpoklady vedú k hrám s nulovým súčtom, v ktorých medzi sebou vznikajú vzťahy spolupráce, vyjednávania a iných typov interakcií hráčov ako predtým hry, a v jeho procese. Mamaeva L.N. Inštitucionálna ekonomika: Kurz prednášok - M .: Vydavateľská a obchodná spoločnosť "Dashkov and K", 2012. - 210 - 211s.

Zovšeobecnenie teórie hier do nej zahrnúť iní analytické schopnosti, vedie k zaujímavé, ale dosť ťažké úlohy. Pri rozvoji teórie hier je potrebné aplikovať funkciu užitočnosti nielen na peňažné výsledky, ale aj na sumy s očakávaným budúcnosti výsledky. Títo predpoklady sú kontroverzné, ale existujú. V tomto prípade vychádzame z predpokladu, že tento predpoklad o podobná operáciapodobizeň so správaním hráči v určité situácie rozhodovania a pripúšťa možnosť, že spôsob hranie hry tento hráč závisí od stavu jeho kapitálu počas ich vedenie hry.

Zvážte to v nasledujúcom texte príklad. Nechať byť prvý hráč na začiatku hry G má veľké x dolárov. Potom jeho hlavné mesto na konci hry budú sa rovná + x, kde sú skutočné výhry, ktoré získa z hry. Užitočnosť, ktorú pripisuje takýmto výsledok, sa rovná f (+ x), kde f je funkcia užitočnosti.

Týchto niekoľko príkladov ilustruje len zlomok z obrovského množstva výsledkov, ktoré je možné získať pomocou teórie hier. Táto časť ekonomickej teórie je mimoriadne užitočným (pre ekonómov a iných sociálnych vedcov) nástrojom na analýzu situácií, v ktorých je malý počet ľudí dobre informovaný a snažia sa navzájom prekabátiť na trhoch, v politike alebo vo vojenských operáciách.

Predslov

Účelom tohto článku je oboznámiť čitateľa so základnými pojmami teórie hier. Z článku sa čitateľ dozvie, čo je teória hier, zváži stručnú históriu teórie hier, zoznámi sa s hlavnými ustanoveniami teórie hier vrátane hlavných typov hier a foriem ich prezentácie. Článok sa bude dotýkať klasického problému a základného problému teórie hier. Záverečná časť článku je venovaná úvahám o problémoch aplikácie teórie hier pri rozhodovaní v manažmente a praktickej aplikácii teórie hier v manažmente.

Úvod.

21 storočia. Vek informácií, rýchlo sa rozvíjajúce informačné technológie, inovácie a technologické inovácie. Ale prečo práve informačný vek? Prečo zohrávajú informácie kľúčovú úlohu takmer vo všetkých procesoch prebiehajúcich v spoločnosti? Všetko je veľmi jednoduché. Informácie nám poskytujú neoceniteľný čas a v niektorých prípadoch aj príležitosť predbehnúť ho. Koniec koncov, pre nikoho nie je tajomstvom, že v živote musíte často riešiť úlohy, v ktorých je potrebné rozhodovať sa v podmienkach neistoty, bez informácií o reakciách na vaše činy, to znamená, že situácie vznikajú v ktoré dve (alebo viaceré) strany sledujú rôzne ciele a výsledky akéhokoľvek konania každej zo strán závisia od aktivít partnera. Takéto situácie vznikajú každý deň. Napríklad pri hraní šachu, dámy, domina a podobne. Napriek tomu, že hry majú prevažne zábavný charakter, svojou povahou sa týkajú konfliktných situácií, v ktorých je konflikt už zakotvený v cieli hry – vyhrať jedného z partnerov. Výsledok ťahu každého hráča zároveň závisí od odvetného ťahu súpera. V ekonomike sa konfliktné situácie vyskytujú veľmi často a majú rôzny charakter a ich počet je taký veľký, že nie je možné spočítať všetky konfliktné situácie, ktoré na trhu nastanú aspoň za jeden deň. Medzi konfliktné situácie v ekonomike patrí napríklad vzťah medzi dodávateľom a spotrebiteľom, kupujúcim a predávajúcim, bankou a klientom. Vo všetkých vyššie uvedených príkladoch je konfliktná situácia generovaná rozdielom v záujmoch partnerov a túžbou každého z nich robiť optimálne rozhodnutia, ktoré v čo najväčšej miere realizujú stanovené ciele. Každý zároveň musí rátať nielen s vlastnými cieľmi, ale aj s cieľmi partnera a brať do úvahy vopred neznáme rozhodnutia, ktoré títo partneri urobia. Na kompetentné riešenie problémov v konfliktných situáciách sú potrebné vedecky podložené metódy. Takéto metódy vyvinula matematická teória konfliktných situácií, ktorá je tzv herná teória.

Čo je teória hier?

Teória hier je komplexný multidimenzionálny koncept, takže sa zdá nemožné poskytnúť interpretáciu teórie hier iba pomocou jednej definície. Zvážte tri prístupy k definovaniu teórie hier.

1. Teória hier je matematická metóda na štúdium optimálnych stratégií v hrách. Hrou sa rozumie proces, v ktorom sú dve alebo viaceré strany zapojené do boja o realizáciu svojich záujmov. Každá zo strán má svoj vlastný cieľ a používa nejakú stratégiu, ktorá môže viesť k výhre alebo prehre v závislosti od správania ostatných hráčov. Teória hier vám pomáha pri výbere najlepších stratégií, berúc do úvahy vnímanie ostatných účastníkov, ich zdroje a možné akcie.

2. Teória hier je odvetvím aplikovanej matematiky, presnejšie operačného výskumu. Najčastejšie sa metódy teórie hier využívajú v ekonómii, o niečo menej často v iných spoločenských vedách – sociológii, politológii, psychológii, etike a pod. Od 70. rokov 20. storočia ho prijali biológovia na štúdium správania zvierat a teóriu evolúcie. Teória hier je veľmi dôležitá pre umelú inteligenciu a kybernetiku.

3.Jedna z najdôležitejších premenných, od ktorej závisí úspech organizácie – konkurencieschopnosť. Je zrejmé, že schopnosť predvídať konanie konkurentov je výhodou pre každú organizáciu. Teória hier je metóda modelovania hodnotenia dopadu prijatého rozhodnutia na konkurentov.

História teórie hier

Optimálne riešenia alebo stratégie v matematickom modelovaní boli navrhované už v 18. storočí. O problémoch výroby a cenotvorby v oligopole, ktoré sa neskôr stali učebnicovými príkladmi teórie hier, sa uvažovalo v 19. storočí. A. Cournot a J. Bertrand. Na začiatku XX storočia. E. Lasker, E. Cermelo, E. Borel predložili myšlienku matematickej teórie konfliktu záujmov.

Matematická teória hier má svoj pôvod v neoklasickej ekonómii. Po prvýkrát boli matematické aspekty a aplikácie teórie prezentované v klasickej knihe Johna von Neumanna a Oskara Morgensterna z roku 1944 „Teória hier a ekonomické správanie“.

John Nash po absolvovaní Carnegie Polytechnic s dvoma titulmi – bakalárskym a magisterským – vstúpil na Princetonskú univerzitu, kde navštevoval prednášky Johna von Neumanna. Vo svojich spisoch Nash rozvinul princípy „manažérskej dynamiky“. Prvé koncepty teórie hier analyzovali antagonistické hry, keď sú na ich úkor porazení a víťazi. Nash vyvíja metódy analýzy, v ktorých všetci účastníci buď vyhrajú, alebo zlyhajú. Tieto situácie sa nazývajú „Nashova rovnováha“, alebo „nekooperatívna rovnováha“, v situácii, keď strany využívajú optimálnu stratégiu, ktorá vedie k vytvoreniu stabilnej rovnováhy. Pre hráčov je výhodné udržiavať túto rovnováhu, pretože akákoľvek zmena zhorší ich situáciu. Tieto Nashove práce významne prispeli k rozvoju teórie hier, boli revidované matematické nástroje ekonomického modelovania. John Nash ukazuje, že klasický prístup A. Smitha k súťaži, keď je každý sám za seba, nie je optimálny. Stratégie sú optimálnejšie, keď sa každý snaží robiť lepšie pre seba, robiť lepšie pre ostatných. V roku 1949 napísal John Nash dizertačnú prácu o teórii hier, o 45 rokov neskôr dostal Nobelovu cenu za ekonómiu.

Hoci teória hier pôvodne skúmala ekonomické modely až do 50. rokov 20. storočia, zostala formálnou teóriou v rámci matematiky. Ale od 50. rokov 20. storočia. Začali sa pokusy aplikovať metódy teórie hier nielen v ekonómii, ale aj v biológii, kybernetike, technike a antropológii. Počas druhej svetovej vojny a bezprostredne po nej sa o teóriu hier vážne začala zaujímať armáda, ktorá ju považovala za výkonný aparát na výskum strategických rozhodnutí.

1960 - 1970 záujem o teóriu hier upadá, napriek významným matematickým výsledkom, ktoré sa v tom čase dosiahli. Od polovice 80. rokov 20. storočia. začína aktívne praktické využívanie teórie hier najmä v ekonomike a manažmente. Za posledných 20-30 rokov význam a záujem o teóriu hier výrazne vzrástol, niektoré oblasti modernej ekonomickej teórie nie je možné objasniť bez aplikácie teórie hier.

Hlavným príspevkom k aplikácii teórie hier bola práca Thomasa Schellinga, nositeľa Nobelovej ceny za ekonómiu za rok 2005, „Stratégia konfliktu“. T. Schelling skúma rôzne „stratégie“ správania sa strán konfliktu. Tieto stratégie sa zhodujú s taktikou zvládania konfliktov a princípmi analýzy konfliktov pri zvládaní konfliktov a pri zvládaní konfliktov v organizácii.

Základy teórie hier

Zoznámime sa so základnými pojmami teórie hier. Matematický model konfliktnej situácie je tzv hra, strany konfliktu - hráčov... Ak chcete opísať hru, musíte najprv identifikovať jej účastníkov (hráčov). Táto podmienka je ľahko splnená, pokiaľ ide o bežné hry, ako je šach atď. Iná situácia je pri „trhových hrách“. Nie vždy je tu jednoduché rozpoznať všetkých hráčov, t.j. súčasných alebo potenciálnych konkurentov. Prax ukazuje, že nie je potrebné identifikovať všetkých hráčov, je potrebné nájsť tých najdôležitejších. Hry zvyčajne pokrývajú niekoľko období, počas ktorých hráči vykonávajú po sebe nasledujúce alebo simultánne akcie. Volí sa výber a realizácia jednej z akcií stanovených v pravidlách pohybovať sa hráč. Pohyby môžu byť osobné alebo náhodné. Osobný ťah je vedomá voľba hráča jednej z možných akcií (napríklad ťah v šachovej hre). Náhodný pohyb je náhodne vybraná akcia (napríklad výber karty zo zamiešaného balíčka). Akcie môžu súvisieť s cenami, objemom predaja, nákladmi na výskum a vývoj atď. Obdobia, počas ktorých hráči robia svoje ťahy, sa nazývajú etapy hry. V konečnom dôsledku rozhodujú ťahy zvolené v každej fáze "platby"(zisk alebo strata) každého hráča, čo môže byť vyjadrené v materiálnych hodnotách alebo peniazoch. Ďalším konceptom tejto teórie je hráčova stratégia. Stratégia hráč je súbor pravidiel, ktoré určujú výber jeho akcie pre každý osobný ťah v závislosti od situácie. Zvyčajne si hráč počas hry pri každom osobnom ťahu vyberá v závislosti od konkrétnej situácie. V zásade je však možné, že všetky rozhodnutia robí hráč vopred (v reakcii na akúkoľvek situáciu, ktorá nastane). To znamená, že hráč si zvolil určitú stratégiu, ktorú je možné nastaviť vo forme zoznamu pravidiel alebo programu. (Takto môžete hrať hru s počítačom). Inými slovami, pod stratégiou sa rozumejú možné akcie, ktoré umožňujú hráčovi v každej fáze hry vybrať si z určitého počtu alternatívnych možností taký ťah, ktorý sa mu javí ako „najlepšia reakcia“ na akcie ostatných hráčov. V súvislosti s koncepciou stratégie je potrebné poznamenať, že hráč určuje svoje konanie nielen pre štádiá, ktoré konkrétna hra skutočne dosiahla, ale aj pre všetky situácie, vrátane tých, ktoré v priebehu tejto hry nemusia nastať. Hra sa volá parná miestnosť ak sa na ňom zúčastňujú dvaja hráči a viacnásobný ak je počet hráčov viac ako dvaja. Pre každú formalizovanú hru sú zavedené pravidlá, t.j. systém podmienok, ktorý určuje: 1) možnosti konania hráčov; 2) množstvo informácií, ktoré má každý hráč o správaní partnerov; 3) zisk, ku ktorému vedie každý súbor akcií. Typicky možno zisk (alebo stratu) kvantifikovať; napríklad stratu môžete odhadnúť ako nulu, zisk ako jedna a remízu ako ½. Hra sa nazýva hra s nulovým súčtom alebo antagonistická, ak sa zisk jedného z hráčov rovná strate druhého, tj na splnenie úlohy hry stačí uviesť hodnotu jedného z hráčov. ich. Ak označíme a- výhry jedného z hráčov, b- odmena toho druhého, potom za hru s nulovým súčtom b = -а, preto stačí zvážiť napr a. Hra sa volá konečný, ak má každý hráč konečný počet stratégií a nekonečné- inak. Komu rozhodnúť hru, alebo nájsť riešenie hry, treba zvoliť stratégiu pre každého hráča, ktorá spĺňa podmienku optimálnosť, tie. jeden z hráčov musí dostať maximálna výhra keď druhý dodrží svoju stratégiu. Zároveň musí mať druhý hráč minimálna strata ak sa prvý bude držať svojej stratégie. Takéto stratégie sa volajú optimálne... Optimálne stratégie musia tiež spĺňať podmienku udržateľnosť, to znamená, že pre ktoréhokoľvek z hráčov by malo byť nerentabilné opustiť svoju stratégiu v tejto hre. Ak sa hra opakuje mnohokrát, hráči nemusia mať záujem vyhrať a prehrať v každej konkrétnej hre, ale priemerný zisk (strata) vo všetkých stranách. Účel teória hier je určiť optimálnu stratégie pre každého hráča... Pri výbere optimálnej stratégie je prirodzené predpokladať, že obaja hráči sa správajú z hľadiska svojich záujmov rozumne.

Družstevné a nespolupracujúce

Hra sa nazýva kooperatívna, príp koalícia ak hráči môžu vytvárať skupiny, preberajú na seba určité záväzky voči ostatným hráčom a koordinujú ich akcie. To sa líši od nekooperatívnych hier, v ktorých je každý povinný hrať sám za seba. Rekreačné hry sú zriedkavo kooperatívne, ale takéto mechanizmy nie sú v každodennom živote nezvyčajné.

Často sa predpokladá, že kooperatívne hry sa líšia práve v schopnosti hráčov medzi sebou komunikovať. Vo všeobecnosti to nie je pravda. Sú hry, kde je komunikácia povolená, ale hráči sledujú osobné ciele a naopak.

Spomedzi dvoch typov hier, nekooperatívne hry popisujú situácie veľmi podrobne a prinášajú presnejšie výsledky. Družstvá berú do úvahy proces hry ako celok.

Hybridné hry zahŕňajú prvky kooperatívnych a nekooperatívnych hier. Hráči môžu napríklad vytvárať skupiny, ale hra sa bude hrať v nekooperatívnom štýle. To znamená, že každý hráč bude presadzovať záujmy svojej skupiny a zároveň sa bude snažiť dosiahnuť osobný zisk.

Symetrické a asymetrické

Asymetrická hra

Hra bude symetrická, keď budú zodpovedajúce stratégie hráčov rovnaké, to znamená, že budú mať rovnaké platby. Inými slovami, ak si hráči môžu meniť miesta a ich výhry za rovnaké ťahy sa nezmenia. Mnohé zo skúmaných hier pre dvoch hráčov sú symetrické. Predovšetkým sú to: „Dilema väzňa“, „Lov na jeleňa“. V príklade vpravo sa hra na prvý pohľad môže zdať symetrická vďaka podobným stratégiám, ale nie je to tak – napokon, výplata druhého hráča s profilmi stratégie (A, A) a (B, B) bude väčšia. než ten prvý.

Nulový súčet a nenulový súčet

Hry s nulovým súčtom sú špeciálnym druhom hier s pevným súčtom, teda také, v ktorých hráči nemôžu zvýšiť alebo znížiť dostupné zdroje alebo fond hry. V tomto prípade sa súčet všetkých výhier rovná súčtu všetkých prehier pri akomkoľvek ťahu. Pozrite sa doprava – čísla predstavujú platby hráčom – a ich súčet v každej bunke je nula. Príkladmi takýchto hier sú poker, kde jeden vyhráva všetky stávky ostatných; reverz, kde sú zachytené súperove figúrky; alebo banálne krádežou.

Mnohé hry, ktoré študovali matematici, vrátane už spomínanej „Dilema väzňa“, sú iného druhu: hry s nenulovým súčtom zisk jedného hráča nemusí nutne znamenať stratu druhého a naopak. Výsledok takejto hry môže byť menší alebo väčší ako nula. Takéto hry je možné previesť na nulový súčet - to sa robí zavedením fiktívny hráč, ktorá si „privlastňuje“ prebytok alebo dopĺňa nedostatok financií.

Ďalšia hra s nenulovým súčtom je obchodu kde má prospech každý člen. Patrí sem aj dáma a šach; v posledných dvoch môže hráč zmeniť svoju obyčajnú figúrku na silnejšiu, čím získa výhodu. Vo všetkých týchto prípadoch sa množstvo hry zvyšuje. Známy príklad, kde klesá, je vojna.

Paralelné a sekvenčné

V paralelných hrách sa hráči pohybujú súčasne, alebo si prinajmenšom neuvedomujú výber ostatných, kým všetky neurobia svoj pohyb. V sekvenčných, príp dynamický V hrách môžu účastníci robiť pohyby vo vopred určenom alebo náhodnom poradí, no zároveň dostávajú nejaké informácie o predchádzajúcich akciách ostatných. Táto informácia môže byť dokonca nie celkom úplné, hráč môže napríklad zistiť, že jeho súper z jeho desiatich stratégií rozhodne si nevybral po piate, keďže sa nič nedozvedel o iných.

Rozdiely v prezentácii paralelných a sekvenčných hier boli diskutované vyššie. Prvé sú zvyčajne prezentované v normálnej forme a druhé v rozsiahlej forme.

S úplnými alebo neúplnými informáciami

Hry s úplnými informáciami tvoria dôležitú podmnožinu sekvenčných hier. V takejto hre účastníci poznajú všetky ťahy urobené do aktuálneho momentu, ako aj možné stratégie protivníkov, čo im umožňuje do určitej miery predvídať ďalší vývoj hry. V paralelných hrách nie sú k dispozícii úplné informácie, pretože nepoznajú aktuálne ťahy súperov. Väčšina hier študovaných v matematike má neúplné informácie. Napríklad všetka "soľ" Dilemy väzňa spočíva v jeho neúplnosti.

Príklady hier s úplnými informáciami: šach, dáma a iné.

Pojem úplné informácie sa často zamieňa s niečím podobným - perfektné informácie... Tým druhým stačí len znalosť všetkých stratégií dostupných protivníkom, znalosť všetkých ich ťahov nie je potrebná.

Hry s nekonečným počtom krokov

Hry z reálneho sveta alebo hry študované v ekonómii majú tendenciu vydržať finálny počet ťahov. Matematika nie je taká obmedzená a najmä teória množín sa zaoberá hrami, ktoré môžu pokračovať donekonečna. Navyše, víťaz a jeho výhry nie sú určené až do konca všetkých ťahov.

Problém, ktorý v tomto prípade zvyčajne nastáva, nie je nájsť optimálne riešenie, ale nájsť aspoň víťaznú stratégiu.

Diskrétne a nepretržité hry

Väčšina študovaných hier diskrétne: majú konečný počet hráčov, ťahov, udalostí, výsledkov atď. Tieto komponenty však možno rozšíriť na množinu reálnych čísel. Hry, ktoré obsahujú tieto prvky, sa často označujú ako diferenciálne hry. Sú spojené s nejakou hmotnou mierkou (zvyčajne časovou mierkou), hoci udalosti, ktoré sa v nich vyskytujú, môžu mať diskrétny charakter. Diferenciálne hry nachádzajú svoje uplatnenie v strojárstve a technike, fyzike.

Metahry

Ide o hry, ktorých výsledkom je súbor pravidiel pre inú hru (tzv cieľ alebo herný predmet). Účelom metahier je zvýšiť užitočnosť vytvoreného súboru pravidiel.

Forma prezentácie hry

V teórii hier spolu s klasifikáciou hier zohráva obrovskú úlohu forma prezentácie hier. Zvyčajne sa rozlišuje normálna alebo maticová forma a rozšírená forma, špecifikovaná vo forme stromu. Tieto formy pre jednoduchú hru sú znázornené na obr. 1a a 1b.

Na nadviazanie prvého spojenia so sférou kontroly možno hru opísať nasledovne. Dve továrne vyrábajúce homogénne produkty stoja pred voľbou. V jednom prípade sa môžu presadiť na trhu stanovením vysokej ceny, ktorá im zabezpečí priemerný kartelový zisk P K. Pri vstupe do tvrdej konkurencie obaja získajú zisk P W. Ak jeden z konkurentov stanoví vysokú cenu a druhý nízku cenu, potom druhý dosiahne monopolný zisk PM, zatiaľ čo druhý utrpí straty PG. Podobná situácia môže nastať napríklad vtedy, keď obe firmy musia oznámiť svoju cenu, ktorú nie je možné následne upraviť.

Pri absencii prísnych podmienok je výhodné pre oba podniky stanoviť nízku cenu. Stratégia „nízkej ceny“ je dominantná pre každú firmu: bez ohľadu na to, akú cenu si konkurenčná firma vyberie, vždy je lepšie stanoviť nízku cenu. V tomto prípade však firmy stoja pred dilemou, keďže zisk P K (ktorý je u oboch hráčov vyšší ako zisk P W) nedosahujú.

Strategická kombinácia „nízke ceny / nízke ceny“ s príslušnými platbami je Nashova rovnováha, v ktorej nie je pre žiadneho z hráčov výhodné samostatne sa odchyľovať od zvolenej stratégie. Tento koncept rovnováhy je zásadný pri riešení strategických situácií, no za určitých okolností si stále vyžaduje zlepšenie.

Čo sa týka uvedenej dilemy, jej riešenie závisí najmä od originality ťahov hráčov. Ak má podnik schopnosť revidovať svoje strategické premenné (v tomto prípade cenu), potom možno nájsť kooperatívne riešenie problému aj bez prísnej dohody medzi hráčmi. Intuícia velí, že pri viacnásobnom kontakte hráčov existujú možnosti na dosiahnutie prijateľnej „náhrady“. Za určitých okolností je teda nevhodné usilovať sa o krátkodobé vysoké zisky prostredníctvom cenového dumpingu, ak v budúcnosti môže dôjsť k „cenovej vojne“.

Ako už bolo uvedené, obe figúrky charakterizujú rovnakú hru. Stvárnenie hry v normálnej forme normálne odráža „synchronicitu“. Neznamená to však „súčasnosť“ udalostí, ale naznačuje, že výber stratégie zo strany hráča prebieha v podmienkach nevedomosti o voľbe stratégie zo strany súpera. V rozšírenej forme je táto situácia vyjadrená cez oválny priestor (informačné pole). Bez tohto priestoru naberá herná situácia iný charakter: najprv by sa mal rozhodnúť jeden hráč a druhý by to mohol urobiť po ňom.

Klasický problém v teórii hier

Zvážte klasický problém v teórii hier. Lov na jeleňa je kooperatívna symetrická hra z teórie hier, ktorá popisuje konflikt medzi vlastným záujmom a verejným záujmom. Hru prvýkrát opísal Jean-Jacques Rousseau v roku 1755:

„Ak ulovili jeleňa, potom každý pochopil, že na to musí zostať na svojom stanovišti; ak sa však zajac priblížil k niektorému z poľovníkov, nebolo pochýb o tom, že tento poľovník ho bez výčitiek svedomia prenasleduje. a keď predbehol korisť, veľmi málo bude nariekať, že takto pripravil svojich druhov o korisť."

Lov jeleňov je klasickým príkladom úlohy poskytovať verejné blaho, keď je človek v pokušení podľahnúť vlastným záujmom. Mal by lovec zostať so svojimi kamarátmi a staviť na menej priaznivú príležitosť doručiť veľkú korisť celému kmeňu, alebo opustiť svojich spolubojovníkov a zveriť sa spoľahlivejšiemu prípadu, ktorý sľubuje vlastnú zajačiu rodinu?

Základný problém v teórii hier

Zvážte základný problém v teórii hier nazývaný väzňova dilema.

Väzňova dilema je základným problémom teórie hier, že hráči nebudú vždy navzájom spolupracovať, aj keď je to v ich najlepšom záujme. Predpokladá sa, že hráč („väzeň“) maximalizuje svoj vlastný zisk bez toho, aby sa staral o prospech ostatných. Jadro problému sformulovali Meryl Flood a Melvin Drescher v roku 1950. Názov dilemy dal matematik Albert Tucker.

V dileme väzňa, zrada prísne dominuje nad spoluprácou, takže jedinou možnou rovnováhou je zrada oboch zúčastnených. Jednoducho povedané, bez ohľadu na to, čo urobí druhý hráč, každý vyhrá viac, ak zradí. Keďže zrada je v každej situácii výhodnejšia ako spolupráca, všetci racionálni hráči si vyberú zradu.

Pri oddelenom racionálnom správaní sa účastníci spoločne dospejú k iracionálnemu rozhodnutiu: ak obaja zradia, dostanú celkovo menší zisk, ako keby spolupracovali (jediná rovnováha v tejto hre nevedie k Pareto-optimálne riešenie, t.j. riešenie, ktoré nemožno zlepšiť bez zhoršenia polohy ostatných prvkov.). Toto je dilema.

V opakujúcej sa väzňovej dileme sa hra odohráva prerušovane a každý hráč môže „potrestať“ toho druhého za to, že nespolupracoval skôr. V takejto hre sa spolupráca môže stať rovnováhou a podnet na zradu môže prevážiť hrozba trestu.

Klasická väzňova dilema

Vo všetkých súdnych systémoch je trest za banditizmus (páchanie trestných činov ako súčasť organizovanej skupiny) oveľa tvrdší ako za rovnaké trestné činy spáchané osamote (odtiaľ alternatívny názov – „banditská dilema“).

Klasická formulácia väzňovej dilemy je:

Dvoch zločincov, A a B, chytili približne v rovnakom čase pri podobných trestných činoch. Existuje dôvod domnievať sa, že konali v tajnej dohode, a polícia, ktorá ich od seba izoluje, im ponúka to isté: ak jeden svedčí proti druhému a on mlčí, potom je prvý prepustený, aby pomáhal pri vyšetrovaní, a druhý dostane maximálny trest odňatia slobody (10 rokov) (20 rokov). Ak obaja mlčia, ich čin podlieha miernejšiemu článku a sú odsúdení na 6 mesiacov (1 rok). Ak obaja svedčia proti sebe, dostanú minimálnu lehotu (každý 2 roky) (5 rokov). Každý väzeň si vyberie, či bude mlčať alebo bude svedčiť proti tomu druhému. Ani jeden z nich však presne nevie, čo ten druhý urobí. Čo sa stane?

Hra môže byť znázornená vo forme nasledujúcej tabuľky:

Dilema nastáva, ak predpokladáme, že obom záleží len na minimalizácii ich vlastných trestov odňatia slobody.

Uveďme odôvodnenie jedného z väzňov. Ak partner mlčí, je lepšie ho zradiť a byť prepustený (inak - šesť mesiacov väzenia). Ak partner svedčí, potom je lepšie svedčiť aj proti nemu, aby ste dostali 2 roky (inak - 10 rokov). Stratégia „svedka“ striktne dominuje nad stratégiou „mlčať“. Podobne k rovnakému záveru prichádza aj ďalší väzeň.

Z pohľadu skupiny (týchto dvoch väzňov) je najlepšie vzájomne spolupracovať, mlčať a dostať každý šesť mesiacov, pretože sa tým zníži celková dĺžka trestu odňatia slobody. Akékoľvek iné riešenie bude menej prospešné.

Generalizovaná forma

  1. Hra má dvoch hráčov a bankára. Každý hráč drží 2 karty: jedna hovorí „spolupracovať“, druhá hovorí „zradiť“ (toto je štandardná terminológia hry). Každý hráč položí jednu kartu lícom nadol pred bankára (to znamená, že nikto nepozná rozhodnutie toho druhého, hoci znalosť jeho rozhodnutia neovplyvňuje analýzu dominancie). Bankár otvorí karty a rozdá výhru.
  2. Ak sa obaja rozhodnú „spolupracovať“, dostanú obaja C... Ak sa jeden rozhodne „zradiť“, druhý „spolupracovať“ – ten prvý dostane D, druhý s... Ak sa obaja rozhodli "zradiť" - obaja dostanú d.
  3. Hodnoty premenných C, D, c, d môžu mať ľubovoľné znamienko (vo vyššie uvedenom príklade je všetko menšie alebo rovné 0). Nerovnosť D> C> d> c musí byť dodržaná, aby hra reprezentovala väzňovu dilemu (DZ).
  4. Ak sa hra opakuje, teda hrá sa viac ako 1x za sebou, celkový zisk z kooperácie musí byť väčší ako celkový zisk v situácii, keď jeden zradí a druhý nie, teda 2C> D. + c.

Tieto pravidlá zaviedol Douglas Hofstadter a tvoria kanonický popis typickej väzňovej dilemy.

Podobná, ale iná hra

Hofstadter navrhol, aby ľudia ľahšie pochopili úlohy ako úlohu väzňa s dilemou, keď sú prezentované ako samostatná hra alebo obchodný proces. Jedným príkladom je „ výmena uzavretých vriec»:

Dvaja ľudia sa stretnú a vymenia si uzavreté tašky, uvedomujúc si, že v jednej sú peniaze a v druhej tovar. Každý hráč môže rešpektovať dohodu a vložiť do tašky to, na čom sa dohodli, alebo podviesť partnera tým, že dá prázdnu tašku.

V tejto hre bude podvádzanie vždy najlepším riešením, čo tiež znamená, že racionálni hráči to nikdy nebudú hrať a že nebude existovať trh pre uzavreté tašky.

Aplikácia teórie hier na rozhodnutia strategického manažmentu

Príklady zahŕňajú rozhodnutia o presadzovaní zásadovej cenovej politiky, vstupe na nové trhy, spolupráci a spoločných podnikoch, identifikácii lídrov a výkonných umelcov v oblasti inovácií, vertikálnej integrácie atď. Teória hier môže byť v zásade použitá pre všetky druhy rozhodnutí, pokiaľ iní aktéri ovplyvňujú ich prijatie. Títo jednotlivci alebo hráči nemusia byť konkurentmi na trhu; môžu to byť subdodávatelia, vedúci klienti, zamestnanci organizácií, ale aj kolegovia z práce.

Nástroje teórie hier sú užitočné najmä vtedy, keď medzi účastníkmi procesu existujú dôležité závislosti. v oblasti platieb... Situácia s možnými konkurentmi je znázornená na obr. 2.

 Kvadranty 1 a 2 charakterizujú situáciu, keď reakcia konkurentov výrazne neovplyvní platby firmy. Stáva sa to vtedy, keď súťažiaci nemá motiváciu (pole 1 ) alebo príležitosť (pole 2 ) odraziť. Preto nie je potrebná podrobná analýza stratégie motivovaného konania konkurentov.

Z toho vyplýva podobný záver, aj keď z iného dôvodu a pre situáciu reflektovanú kvadrantom 3 ... Tu môže mať reakcia konkurenta významný vplyv na firmu, ale keďže jej vlastné konanie nemôže výrazne ovplyvniť platby konkurenta, netreba sa jej reakcie báť. Príkladom sú rozhodnutia vstúpiť do medzery na trhu: za určitých okolností veľkí konkurenti nemajú dôvod na takéto rozhodnutie malej firmy reagovať.

Iba situácia zobrazená v kvadrante 4 (možnosť recipročných krokov trhových partnerov), vyžaduje využitie ustanovení teórie hier. Sú tu však reflektované len nevyhnutné, ale nedostatočné podmienky na opodstatnenie aplikácie základov teórie hier na boj s konkurentmi. Sú situácie, keď jedna stratégia určite ovládne všetky ostatné, bez ohľadu na to, čo si konkurent vezme. Ak si vezmeme napríklad trh s drogami, potom je často dôležité, aby firma ako prvá oznámila nový produkt na trhu: zisk „priekopníka“ sa ukázal byť taký významný, že všetci ostatní „hráči“ “potrebujú len rýchlejšie zintenzívniť svoje inovácie.

 Triviálnym príkladom „dominantnej stratégie“ z hľadiska teórie hier je rozhodnutie týkajúce sa prienik na nový trh. Zoberme si podnik, ktorý pôsobí ako monopolista na nejakom trhu (napríklad IBM na trhu s osobnými počítačmi na začiatku 80. rokov). Ďalší podnik, pôsobiaci napríklad na trhu periférnych zariadení pre počítače, uvažuje nad otázkou prieniku na trh osobných počítačov s prechodom na výrobu. Externá spoločnosť sa môže rozhodnúť vstúpiť alebo nevstúpiť na trh. Monopolná spoločnosť môže reagovať agresívne alebo priateľsky na objavenie sa nového konkurenta. Oba podniky vstupujú do dvojfázovej hry, v ktorej prvý krok urobí externá spoločnosť. Herná situácia s vyznačením platieb je znázornená vo forme stromu na obr.3.

 Rovnaká herná situácia môže byť prezentovaná v normálnej forme (obr. 4).

Sú tu označené dva stavy – „vstup/priateľská reakcia“ a „nevstup/agresívna reakcia“. Je zrejmé, že druhá rovnováha je neudržateľná. Z rozšíreného formulára vyplýva, že pre už etablovanú spoločnosť na trhu je nepraktické agresívne reagovať na vznik nového konkurenta: v prípade agresívneho správania dostane súčasný monopolista 1 (výplatu), v prípade priateľského správania , 3. Vonkajšia spoločnosť tiež vie, že nie je rozumné, aby monopolista inicioval akcie na jej vytlačenie, a preto sa rozhodne vstúpiť na trh. Cudzia spoločnosť neutrpí hroziace straty vo výške (-1).

Takáto racionálna rovnováha je charakteristická pre „čiastočne vylepšenú“ hru, ktorá zámerne vylučuje absurdné ťahy. V praxi sa takéto rovnovážne stavy v zásade dajú nájsť celkom ľahko. Rovnovážne konfigurácie je možné identifikovať pomocou špeciálneho algoritmu z oblasti operačného výskumu pre akúkoľvek konečnú hru. Osoba, ktorá rozhoduje, postupuje nasledovne: najprv sa vyberie „najlepší“ ťah v poslednej fáze hry, potom sa vyberie „najlepší“ ťah v predchádzajúcej fáze, pričom sa zohľadní výber v poslednej fáze. a tak ďalej, kým sa nedosiahne počiatočný uzol stromu hry.

Ako môžu spoločnosti profitovať z analýzy teórie hier? Známy je napríklad konflikt záujmov medzi IBM a Telexom. V súvislosti s ohlásením prípravných plánov jej vstupu na trh sa uskutočnilo „krízové“ stretnutie vedenia IBM, na ktorom sa analyzovali opatrenia smerujúce k tomu, aby nový konkurent upustil od zámeru vstúpiť na nový trh. Telex sa o týchto udalostiach zrejme dozvedel. Analýza založená na teórii hier ukázala, že vysoké náklady na hrozby IBM sú neprimerané. To ukazuje, že pre spoločnosti je užitočné zvážiť možné reakcie svojich herných partnerov. Izolované obchodné kalkulácie, dokonca založené na teórii rozhodovania, majú často, ako v opísanej situácii, obmedzený charakter. Cudzí podnik si teda mohol zvoliť kurz „nevstupu“, ak by ju predbežná analýza presvedčila, že prienik na trh by vyvolal agresívnu reakciu monopolistu. V tomto prípade je v súlade s kritériom očakávanej hodnoty rozumné zvoliť „nevstupový“ ťah s pravdepodobnosťou agresívnej odozvy 0,5.

 Ďalší príklad súvisí s rivalitou medzi firmami v oblasti technologické prvenstvo. Počiatočná situácia je, keď podnik 1 mala predtým technologickú prevahu, ale teraz má menej finančných zdrojov na výskum a vývoj ako jej konkurent. Oba podniky sa musia rozhodnúť, či sa pokúsia pomocou veľkých investícií dosiahnuť dominantné postavenie na svetovom trhu v príslušnej technologickej oblasti. Ak obaja konkurenti investujú veľké finančné prostriedky do podnikania, potom sú vyhliadky na úspech podniku 1 bude lepšie, aj keď si to vyžiada veľké finančné náklady (ako napr. podnik 2 ). Na obr. 5 túto situáciu predstavujú platby so zápornými hodnotami.

Pre podnik 1 najlepšie by bolo, keby podnik 2 opustená súťaž. Jeho dávka by potom bola 3 (platby). S najväčšou pravdepodobnosťou podnik 2 by vyhral súperenie, keď podnik 1 akceptoval by obmedzený investičný program a podnik 2 - širší. Táto poloha sa odráža v pravom hornom kvadrante matice.

Analýza situácie ukazuje, že rovnováha nastáva pri vysokých nákladoch na výskum a vývoj podniku. 2 a nízke podniky 1 ... V akomkoľvek inom scenári má jeden z konkurentov dôvod odchýliť sa od strategickej kombinácie: napríklad pre podnik 1 znížený rozpočet je výhodnejší, ak spoločnosť 2 odmieta sa zúčastniť súperenia; zároveň podnik 2 je známe, že pri nízkych nákladoch pre konkurenta je pre neho výhodné investovať do výskumu a vývoja.

Podnik s technologickým náskokom môže použiť teóriu hier na analýzu situácie, aby nakoniec dosiahol optimálny výsledok. Pomocou určitého signálu by mala ukázať, že je pripravená realizovať veľké výdavky na výskum a vývoj. Ak takýto signál nie je prijatý, potom pre podnik 2 je jasné, že podnik 1 zvolí možnosť s nízkymi nákladmi.

Spoľahlivosť signálu musí byť doložená záväzkom podniku. V tomto prípade môže ísť o rozhodnutie podniku 1 o nákupe nových laboratórií alebo nábore ďalších výskumných pracovníkov.

Z hľadiska teórie hier sa takéto záväzky rovnajú zmene priebehu hry: situáciu simultánneho rozhodovania nahrádza situácia postupných ťahov. Spoločnosť 1 pevne preukazuje zámer ísť do veľkých nákladov podniku 2 zaregistruje tento krok a už nemá dôvod sa do súperenia zapájať. Nová rovnováha vzniká zosúladením „neúčasti podniku 2 „a“ vysoké náklady na výskum a vývoj podniku 1 ".

 Medzi známe oblasti aplikácie metód teórie hier patrí cenová stratégia, vytváranie spoločných podnikov, načasovanie vývoja nového produktu.

Významným príspevkom k využívaniu teórie hier je experimentálna práca... Mnohé teoretické výpočty sú vypracované v laboratórnych podmienkach a získané výsledky slúžia ako podnet pre odborníkov z praxe. Teoreticky sa zistilo, za akých podmienok je vhodné, aby dvaja sebeckí partneri spolupracovali a dosiahli pre seba tie najlepšie výsledky.

Tieto znalosti možno využiť v podnikovej praxi na pomoc dvom firmám dosiahnuť víťaznú situáciu. Dnes vyškolení konzultanti rýchlo a jednoznačne identifikujú príležitosti, ktoré môžu podniky využiť na uzatváranie stabilných a dlhodobých kontraktov so zákazníkmi, subdodávateľmi, vývojovými partnermi a podobne.

Problémy praktickej aplikácie v manažmente

Samozrejme, treba poukázať aj na existenciu určitých limitov aplikácie analytických nástrojov teórie hier. V nasledujúcich prípadoch sa môže použiť len pod podmienkou dodatočných informácií.

Najprv, ide o prípad, keď majú podniky odlišné predstavy o hre, ktorej sa zúčastňujú, alebo keď nie sú dostatočne informované o svojich schopnostiach. Napríklad môžu existovať nejasné informácie o platbách konkurenta (štruktúra nákladov). Ak sa nie príliš zložité informácie vyznačujú neúplnosťou, potom je možné operovať porovnávaním takýchto prípadov s prihliadnutím na určité rozdiely.

po druhé, teóriu hier je ťažké aplikovať na mnohé rovnovážne situácie. Tento problém môže nastať aj pri jednoduchých hrách so súčasným výberom strategických rozhodnutí.

po tretie, ak je situácia pri prijímaní strategických rozhodnutí veľmi ťažká, hráči si často nemôžu vybrať tie najlepšie možnosti. Je ľahké si predstaviť zložitejšiu situáciu prenikania na trh, ako je tá, o ktorej sme hovorili vyššie. Napríklad niekoľko podnikov môže vstúpiť na trh v rôznom čase alebo reakcia podnikov, ktoré už na ňom pôsobia, môže byť ťažšia ako byť agresívny alebo priateľský.

Experimentálne bolo dokázané, že keď sa hra rozšíri na desať a viac fáz, hráči už nie sú schopní používať vhodné algoritmy a pokračovať v hre s rovnovážnymi stratégiami.

Teória hier sa nepoužíva veľmi často. Bohužiaľ, situácie v reálnom svete sú často veľmi zložité a menia sa tak rýchlo, že nie je možné presne predpovedať, ako budú konkurenti reagovať na zmeny v taktike firmy. Napriek tomu je teória hier užitočná, keď je potrebné určiť najdôležitejšie a vyžadujúce zváženie faktorov v konkurenčnej rozhodovacej situácii. Tieto informácie sú dôležité, pretože umožňujú manažmentu vziať do úvahy ďalšie premenné alebo faktory, ktoré môžu ovplyvniť situáciu, a tým zvýšiť efektivitu rozhodnutia.

Na záver treba zdôrazniť, že teória hier je veľmi komplexná oblasť vedomostí. Pri odvolávaní sa naň je potrebné dodržiavať určitú opatrnosť a jasne poznať hranice použitia. Príliš jednoduché interpretácie, ktoré si firma osvojí sama alebo s pomocou konzultantov, sú plné skrytých nebezpečenstiev. Vzhľadom na svoju zložitosť sa analýza teórie hier a konzultácie odporúča len pre kritické problémové oblasti. Skúsenosti firiem ukazujú, že pri jednorazových, zásadne dôležitých plánovacích strategických rozhodnutiach, vrátane prípravy veľkých dohôd o spolupráci, sa uprednostňuje použitie vhodných nástrojov.

Bibliografia

1. Teória hier a ekonomické správanie, von Neumann J., Morgenstern O., Vydavateľstvo Nauka, 1970

2. Petrosyan L.A., Zenkevich N.A., Semina E.A. Teória hier: Učebnica. návod na vysoké kožušinové čižmy - M .: Vyššie. škola, Dom knihy "Univerzita", 1998

3. Dubina I. N. Základy teórie ekonomických hier: učebnica.- M .: KNORUS, 2010

4. Archív časopisu "Problémy teórie a praxe manažmentu", Rainer Felker

5. Teória hier v riadení organizačných systémov. 2. vydanie., Gubko M.V., Novikov D.A. 2005


- J. J. Rousseau. Diskurz o pôvode a základoch nerovnosti medzi ľuďmi // Traktáty / Per. z francúzštiny A. Khajutina - Moskva: Nauka, 1969 .-- S. 75.