Puro at pinaghalong mga diskarte. Puro laro ng diskarte

bahay / Quarreling

Kabilang sa mga hangganan na laro ng praktikal na kahalagahan, ang mga laro na may isang punong punong ay medyo bihirang; mas karaniwang ang kaso "kapag ang mga mas mababa at itaas na presyo ay naiiba. Sinusuri ang mga matris ng naturang mga laro, natapos namin na kung ang bawat manlalaro ay bibigyan ng isang pagpipilian

isa - ang tanging diskarte., kung gayon, ang pagbibilang sa isang makatwirang kumikilos na kalaban, ang pagpili na ito ay dapat matukoy ng prinsipyong minimax. Ang pagsunod sa aming pinakamataas na diskarte, para sa anumang pag-uugali ng kalaban, tiyak na ginagarantiyahan namin ang aming sarili na isang panalo na katumbas ng mas mababang presyo ng laro a. Ang isang likas na tanong ay lumitaw: posible bang ginagarantiyahan ang iyong sarili ng isang average na pakinabang, mas malaki kaysa sa isang, kung gumagamit ka ng hindi isang solong "dalisay" na diskarte, ngunit kahalili sapalaran maraming mga diskarte?

Ang nasabing pinagsamang diskarte, na binubuo sa aplikasyon ng maraming mga dalisay na diskarte na pumipalit ayon sa isang random na batas na may isang tiyak na ratio ng dalas, ay tinatawag na halo-halong mga diskarte sa teorya ng laro

Malinaw, ang bawat dalisay na diskarte ay isang espesyal na kaso ng isang halo, kung saan ang lahat ng mga diskarte, maliban sa isa, ay inilalapat na may mga dalas na zero, at ang isang ito - na may dalas ng 1.

Ito ay lumiliko na, gamit hindi lamang puro, kundi pati na rin halo-halong mga diskarte, posible na makakuha ng isang solusyon para sa bawat may hangganan na laro, iyon ay, isang pares ng mga tulad nito (sa pangkalahatang kaso, halo-halong) mga diskarte tulad na kung ang parehong mga manlalaro ay ilalapat ang mga ito, ang kabayaran ay magiging katumbas ng presyo ng laro, at para sa anumang isang panig na paglihis mula sa pinakamainam na diskarte, ang pagbabayad ay maaari lamang magbago patungo sa, nakakapinsala para sa mga nakalihis.

Ang pahayag na ito ay ang nilalaman ng tinatawag na pangunahing teorema ng teorya ng laro. Ang teorem na ito ay unang napatunayan ni von Neumann noong 1928. Ang kilalang mga patunay ng teorema ay medyo kumplikado; samakatuwid, ipinapakita lamang namin ang pagbabalangkas.

Ang bawat laro sa pagtatapos ay may hindi bababa sa isang solusyon (marahil sa lugar ng mga halo-halong mga diskarte).

Ang nakuha na resulta mula sa isang desisyon ay tinatawag na gastos ng laro. Ang pangunahing teorema ay nagpapahiwatig na ang bawat hangganan ng laro ay may presyo. Malinaw, ang presyo ng laro v ay palaging namamalagi sa pagitan ng mas mababang presyo ng laro at sa itaas na presyo ng laro:

Sa katunayan, mayroong pinakamataas na garantisadong panalo na maaari nating ibigay ang ating sarili gamit lamang ang aming purong mga diskarte. Dahil kasama ang halo-halong mga diskarte, bilang isang espesyal na kaso, lahat ng dalisay, kung gayon, pinapayagan, bilang karagdagan sa dalisay, halo-halong din

ang mga diskarte, kami, sa anumang kaso, ay hindi pinalala ang aming mga kakayahan; kaya,

Katulad nito, isinasaalang-alang ang mga kakayahan ng kalaban, ipapakita namin iyon

kung saan sumusunod ang napatunayan na hindi pagkakapareho (3.1).

Ipaalam sa amin ipakilala ang isang espesyal na notasyon para sa halo-halong mga diskarte. Kung, halimbawa, ang aming halo-halong diskarte ay binubuo sa aplikasyon ng mga diskarte sa AL, na may mga dalas na isasailalim namin ang diskarte na ito

Katulad nito, ang halo-halong diskarte ng kaaway ay isasaad ng:

saan ang mga dalas kung saan ang mga diskarte ay halo-halong

Ipagpalagay na natagpuan namin ang isang solusyon sa laro na binubuo ng dalawang pinakamainam na halo-halong mga diskarte S, S. Sa pangkalahatang kaso, hindi lahat ng mga dalisay na diskarte na magagamit sa isang ibinigay na manlalaro ay kasama sa kanyang pinakamainam na halo-halong diskarte, ngunit ilan lamang. Tatawagin namin ang mga diskarte na kasama sa pinakamainam na halo-halong diskarte ng player ng kanyang "kapaki-pakinabang" na mga diskarte.

Ito ay lumiliko na ang solusyon sa laro ay may isa pa kamangha-manghang pag-aari: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte 5 (5). pagkatapos ay ang payoff ay nananatiling hindi nagbabago at katumbas ng presyo ng laro v, anuman ang ginagawa ng ibang player, kung siya. hindi lamang lalampas ang kanilang mga "kapaki-pakinabang" na mga diskarte. Halimbawa, maaari niyang gamitin ang alinman sa kanyang mga "kapaki-pakinabang" na mga diskarte sa kanilang purong anyo, at maaari ring paghaluin ang mga ito sa anumang proporsyon.

Patunayan natin sa pahayag na ito. Hayaan ay may isang solusyon sa laro. Upang maging tiyak, ipapalagay namin na ang pinakamainam na halo-halong diskarte ay binubuo ng isang halo ng tatlo

Ang mga diskarte na "Useful", ayon sa pagkakabanggit, ay binubuo ng isang halo ng tatlong "kapaki-pakinabang" na mga diskarte

bukod dito, nakasaad na kung sumunod tayo sa diskarte sa S, kung gayon ang kaaway ay maaaring mag-apply ng mga diskarte sa anumang mga sukat, at ang pakinabang ay mananatiling hindi nagbabago at magiging pantay lamang sa presyo ng laro

Bagaman nagtapos ako mula sa Faculty ng Physics at Teknolohiya, hindi ako itinuro sa teorya ng laro sa unibersidad. Ngunit dahil nakapasok ako mga taon ng mag-aaral Naglaro ako ng maraming, una sa kagustuhan, at pagkatapos ay sa tulay, teorya ng laro na interesado sa akin, at pinagkadalubhasaan ko ang isang maliit na aklat-aralin. At kamakailan lamang ang mambabasa ng site na si Mikhail ay nalutas ang isang problema sa teorya ng laro. Napagtanto na ang gawain ay hindi ibinigay sa akin kaagad, nagpasya akong i-refresh ang aking kaalaman sa teorya ng laro. Nag-aalok ako sa iyo ng isang maliit na libro - isang tanyag na paglalantad ng mga elemento ng teorya ng laro at ilang mga paraan upang malutas ang mga laro ng matrix. Naglalaman ito ng halos walang katibayan at inilalarawan ang mga pangunahing punto ng teorya na may mga halimbawa. Ang libro ay isinulat ng matematika at popularizer ng agham na si Elena Sergeevna Ventzel. Maraming henerasyon ng mga inhinyero ng Sobyet ang nag-aral mula sa kanyang aklat-aralin na "Teorya ng Probabilidad". Nagsulat din si Elena Sergeevna akdang pampanitikan sa ilalim ng pseudonym ng I. Grekov.

Elena Wentzel. Mga Sangkap ng teorya ng laro. - M .: Fizmatgiz, 1961 .-- 68 p.

Pag-download maikling buod sa format o

§ 1. Ang paksa ng teorya ng laro. Mga pangunahing konsepto

Kapag nalutas ang isang bilang ng mga praktikal na problema (sa larangan ng ekonomiya, mga gawain sa militar, atbp.), Kinakailangan upang pag-aralan ang mga sitwasyon kung saan mayroong dalawa (o higit pa) na nakikipagdigma sa mga partido na hinahabol ang kabaligtaran na mga layunin, at ang resulta ng bawat aksyon ng isa sa mga partido ay nakasalalay sa kung anong kurso ng kilos pipiliin ng kalaban. Tatawagin natin ang mga ganitong sitwasyon na "mga sitwasyong salungatan".

Maraming mga halimbawa ng mga sitwasyon ng salungatan mula sa iba't ibang mga lugar ng pagsasanay. Anumang sitwasyon na lumitaw sa kurso ng poot ay kabilang sa mga sitwasyon ng salungatan: bawat isa sa mga partidong lumalaban ay tumatagal ng lahat ng mga hakbang na magagamit upang maiwasan ang kalaban na makamit ang tagumpay. Kasama rin sa mga salungat na sitwasyon ang mga sitwasyon na lumitaw kapag pumipili ng isang sistema ng sandata, mga pamamaraan ng paggamit nito sa labanan at, sa pangkalahatan, kapag pinaplano ang mga operasyon ng militar: ang bawat isa sa mga pagpapasya sa lugar na ito ay dapat gawin nang may pananaw sa mga aksyon ng kaaway na hindi gaanong kapaki-pakinabang sa atin. Ang isang bilang ng mga sitwasyon sa larangan ng ekonomiya (lalo na sa pagkakaroon ng libreng kumpetisyon) ay kabilang sa mga sitwasyong salungatan; ang mga kumpanya ng pangangalakal ay kumikilos bilang mga partido na lumalaban, pang-industriya na negosyo atbp.

Ang pangangailangan upang pag-aralan ang gayong mga sitwasyon ay nagbigay ng isang espesyal na patakaran ng matematika. Ang teorya ng Laro ay mahalagang higit pa sa isang teoryang matematika ng mga sitwasyong salungatan. Ang layunin ng teorya ay upang makabuo ng mga rekomendasyon para sa isang nakapangangatwiran na kurso ng pagkilos para sa bawat isa sa mga kalaban sa kurso ng isang sitwasyon ng tunggalian. Ang bawat sitwasyon ng salungatan na direktang kinuha mula sa kasanayan ay napaka kumplikado, at ang pagsusuri nito ay kumplikado sa pamamagitan ng pagkakaroon ng maraming mga kadahilanan na dumadalo. Upang maging posible ang isang pagsusuri sa matematika ng sitwasyon, kinakailangan upang umiwas mula sa pangalawa, nagkataon na mga kadahilanan at bumuo ng isang pinasimple, pormal na modelo ng sitwasyon. Tatawagan namin ang modelong ito na "laro".

Ang laro ay naiiba mula sa isang totoong sitwasyon ng tunggalian na isinasagawa ayon sa mahusay na tinukoy na mga patakaran. Ang sangkatauhan ay matagal nang gumagamit ng nasabing pormal na mga modelo ng mga sitwasyon ng tunggalian, na mga laro sa literal na kahulugan ng salita. Kasama sa mga halimbawa ang chess, checker, card game, atbp. Ang lahat ng mga larong ito ay may katangian ng isang pagpapatuloy ng kumpetisyon ayon sa kilalang mga patakaran at nagtatapos sa isang "tagumpay" (pakinabang) ng isa o ibang manlalaro.

Ang nasabing pormal na regulated, artipisyal na inayos na laro ay kumakatawan sa karamihan angkop na materyal upang mailarawan at makabisado ang mga pangunahing konsepto ng teorya ng laro. Ang terminolohiya na hiniram mula sa pagsasagawa ng mga naturang laro ay ginagamit din sa pagsusuri ng iba pang mga sitwasyon ng salungatan: ang mga partido na nakikilahok sa kanila ay nakatawag sa "mga manlalaro", at ang resulta ng banggaan ay ang "panalo" ng isa sa mga partido.

Ang mga interes ng dalawa o higit pang mga kalaban ay maaaring bumangga sa laro; sa unang kaso, ang laro ay tinatawag na "doble", sa pangalawa - "maramihang". Ang mga kalahok sa maraming laro ay maaaring makabuo ng mga koalisyon - permanenteng o pansamantala. Sa pagkakaroon ng dalawang permanenteng koalisyon, ang maraming laro ay nagiging isang pares. Ang mga pares ng laro ay ang pinakadakilang praktikal na kahalagahan; narito, nililimitahan natin ang ating sarili sa pagsasaalang-alang lamang sa mga larong ito.

Sinisimulan namin ang aming pagtatanghal ng teoryang pang-elementarya ng laro sa pagbabalangkas ng ilang mga pangunahing konsepto. Isaalang-alang natin ang isang dobleng laro kung saan ang dalawang manlalaro A at B na may kabaligtaran na interes ay lumahok. Sa pamamagitan ng "laro" ay nangangahulugang isang kaganapan na binubuo ng isang serye ng mga aksyon ng mga panig A at B. Upang ang laro ay isailalim sa matematika na pagsusuri, ang mga patakaran ng laro ay dapat na tumpak na nabalangkas. Sa pamamagitan ng "mga patakaran ng laro" ay sinadya ang sistema ng mga kondisyon na umayos ng mga posibleng pagpipilian para sa mga aksyon ng magkabilang panig, ang dami ng impormasyon sa bawat panig tungkol sa pag-uugali ng iba pa, ang pagkakasunud-sunod ng paghahalili "gumagalaw" (mga indibidwal na desisyon na ginawa sa panahon ng laro), pati na rin ang resulta o kinalabasan ng laro kung saan ang ibinigay hanay ng mga gumagalaw. Ang resulta (pakinabang o pagkawala) ay hindi palaging may isang dami ng expression, ngunit ito ay karaniwang posible, sa pamamagitan ng pagtatakda ng isang tiyak na sukat ng pagsukat, upang maipahayag ito sa pamamagitan ng isang tiyak na bilang. Halimbawa, sa isang larong chess, ang pakinabang ay maaaring itinalaga ng nakatalaga na halaga +1, pagkawala –1, iguhit 0.

Ang isang laro ay tinatawag na laro na zero-sum kung ang isang manlalaro ay nanalo kung ano ang nawala sa iba, i.e. ang kabuuan ng mga panalo ng parehong partido ay zero. Sa isang laro na zero-sum, ang mga interes ng mga manlalaro ay eksaktong kabaligtaran. Narito isasaalang-alang lamang ang mga larong ito.

Dahil sa isang laro na zero-sum, ang kabayaran ng isa sa mga manlalaro ay katumbas ng kabayaran ng kapwa kasama kabaligtaran sign, kung gayon, malinaw naman, kapag sinusuri ang tulad ng isang laro, maaari isaalang-alang ng isa ang kabayaran ng isa lamang sa mga manlalaro. Hayaan ito, halimbawa, player A. Sa kung ano ang sumusunod, para sa kaginhawahan, kami ay mag-konsyerto na tawagan ang bahagi na "kami", at sa gilid B - "kaaway".

Sa kasong ito, ang panig A ("kami") ay palaging isasaalang-alang bilang "pagpanalo", at panig B ("kalaban") bilang "pagkatalo". Ang pormal na kondisyon na ito ay malinaw na hindi nagpapahiwatig ng anumang tunay na kalamangan para sa unang manlalaro; madaling makita na pinalitan ito ng kabaligtaran kung ang nanalong palatandaan ay baligtad.

Isipin natin ang pag-unlad ng laro sa oras bilang binubuo ng isang serye ng sunud-sunod na yugto o "gumagalaw". Ang isang ilipat sa teorya ng laro ay ang pagpili ng isa sa mga pagpipilian na ibinigay ng mga patakaran ng laro. Ang mga galaw ay nahahati sa personal at random. Ang isang personal na paglipat ay isang malay na pagpipilian ng isa sa mga manlalaro ng isa sa mga posibleng paglipat sa isang naibigay na sitwasyon at pagpapatupad nito. Ang isang halimbawa ng isang personal na paglipat ay ang anumang paglipat sa isang laro ng chess. Ang pagsasagawa ng susunod na paglipat, ang player ay gumagawa ng isang malay-tao na pagpipilian ng isa sa mga pagpipilian na posible sa isang naibigay na pagsasaayos ng mga piraso sa board. Ang hanay ng mga posibleng pagpipilian para sa bawat personal na paglipat ay kinokontrol ng mga patakaran ng laro at nakasalalay sa kabuuan ng nakaraang mga gumagalaw ng magkabilang panig.

Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, na isinasagawa hindi sa desisyon ng player, ngunit sa pamamagitan ng ilang mekanismo ng random na pagpili (pagkahagis ng isang barya, isang dice, shuffling at pakikipag-ugnay sa mga kard, atbp.). Halimbawa, ang pagbibigay ng unang card sa isa sa mga manlalaro ng kagustuhan ay isang random na paglipat na may 32 pantay na posibleng mga pagpipilian. Para sa laro na matukoy sa matematika, dapat ipahiwatig ng mga patakaran ng laro ang posibilidad na pamamahagi ng mga posibleng kinalabasan para sa bawat random na paglipat.

Ang ilang mga laro ay maaari lamang binubuo ng mga random na gumagalaw (tinatawag na purong pagsusugal) o mga personal na gumagalaw lamang (chess, checker). Karamihan mga laro ng card nabibilang sa mga laro halo-halong uri, i.e. naglalaman ng parehong mga random at personal na galaw.

Ang mga laro ay inuri hindi lamang sa likas na katangian ng kanilang mga gumagalaw (personal, random), kundi pati na rin sa likas na katangian at dami ng impormasyon na magagamit sa bawat manlalaro tungkol sa mga aksyon ng isa pa. Ang isang espesyal na klase ng mga laro ay binubuo ng tinatawag na "mga laro kasama kumpletong impormasyon". Ang isang laro na may kumpletong impormasyon ay isang laro kung saan ang bawat manlalaro, sa bawat personal na paglipat, ay nakakaalam ng mga resulta ng lahat ng nakaraang mga gumagalaw, parehong personal at random. Ang mga halimbawa ng mga laro na may kumpletong impormasyon ay kasama ang chess, checker, at ang kilalang laro ng "noughts at crosses".

Karamihan sa mga laro ng praktikal na kahalagahan ay hindi kabilang sa klase ng mga laro na may kumpletong impormasyon, dahil ang kawalan ng katiyakan tungkol sa mga aksyon ng kaaway ay karaniwang isang mahalagang elemento ng mga sitwasyong salungatan.

Isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto ng "diskarte". Ang diskarte ng isang manlalaro ay isang hanay ng mga patakaran na natatanging matukoy ang pagpipilian para sa bawat personal na paglipat ng isang naibigay na manlalaro, depende sa sitwasyon na binuo sa panahon ng laro. Karaniwan ang desisyon (pagpipilian) para sa bawat personal na paglipat ay ginawa ng player sa kurso ng laro mismo, depende sa kasalukuyang sitwasyon. Gayunpaman, ayon sa teorya, hindi mababago ang mga bagay kung iisipin natin na ang lahat ng mga pagpapasyang ito ay ginawa ng player nang maaga. Upang gawin ito, ang player ay kailangang mag-compile nang maaga ang isang listahan ng lahat ng mga posibleng sitwasyon sa panahon ng laro at magbigay ng kanyang sariling solusyon para sa bawat isa sa kanila. Sa prinsipyo (kung hindi praktikal) posible ito para sa anumang laro. Kung ang naturang sistema ng desisyon ay pinagtibay, nangangahulugan ito na pinili ng player ang isang tiyak na diskarte.

Ang isang manlalaro na pumili ng isang diskarte ay hindi na maaaring makilahok sa laro nang personal, ngunit palitan ang kanyang pakikilahok sa isang listahan ng mga panuntunan na ilalapat para sa kanya ng ilang hindi interesado (hukom). Ang diskarte ay maaari ring ibigay sa automaton sa anyo ng isang tiyak na programa. Ito ay kung paano naglalaro ng chess ang mga computer ngayon. Para sa konsepto ng "diskarte" upang magkaroon ng kahulugan, dapat may mga personal na gumagalaw sa laro; walang mga diskarte sa mga laro na binubuo lamang ng mga random na gumagalaw.

Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa "may hangganan" at "walang katapusang". Ang isang hangganan na laro ay isang laro kung saan ang bawat manlalaro ay may isang hangganan na bilang lamang ng mga diskarte. Ang panghuling laro kung saan mayroon ang manlalaro A m mga diskarte, at player B - n ang mga diskarte ay tinatawag na mxn game.

Isaalang-alang ang isang mxn laro ng dalawang manlalaro A at B ("kami" at "kalaban"). Itinutukoy namin ang aming mga diskarte A 1, A 2, ..., A m ang mga diskarte ng kaaway B 1, B 2, ..., B n. Hayaang pumili ang bawat panig ng isang tukoy na diskarte; para sa amin ito ay magiging A i, para sa kalaban B j. Kung ang laro ay binubuo lamang ng mga personal na galaw, pagkatapos ang pagpili ng mga diskarte A i, B j natatanging tinutukoy ang kinalabasan ng laro - ang aming mga panalo. Ipakilala natin ito bilang isang ij. Kung naglalaman ang laro, bilang karagdagan sa personal, random na gumagalaw, pagkatapos ang kabayaran para sa isang pares ng mga estratehiya A i, B j ay isang random na halaga na nakasalalay sa mga kinalabasan ng lahat ng mga random na gumagalaw. Sa kasong ito, ang isang natural na pagtatantya ng inaasahang pagbabayad ay ang average na halaga nito ( inaasahang halaga). Kami ay magpapahiwatig sa pamamagitan ng parehong pag-sign pareho ang payoff mismo (sa isang laro nang walang random na gumagalaw) at ang average na halaga nito (sa isang laro na may mga random na gumagalaw).

Ipaalam sa amin ang mga halaga ng isang ij payoff (o average payoff) para sa bawat pares ng mga diskarte. Ang mga halaga ay maaaring isulat sa anyo ng isang hugis-parihaba na talahanayan (matrix), ang mga hilera na tumutugma sa aming mga diskarte (A i), at ang mga haligi na tumutugma sa mga diskarte ng kaaway (B j). Ang nasabing talahanayan ay tinatawag na payoff matrix o simpleng laro matrix. Ang laro matrix mxn ay ipinapakita sa Fig. 1.

Larawan: 1. Matrix mxn

Sa madaling sabi ay ipapahiwatig natin ang matrix ng laro ‖а ij ‖. Tingnan natin ang ilang pangunahing mga halimbawa ng mga laro.

Halimbawa 1. Ang dalawang manlalaro A at B, nang hindi tumitingin sa bawat isa, naglalagay ng barya na baligtad sa mesa, sagisag o mga buntot, ayon sa kanilang pagpapasya. Kung ang mga manlalaro ay napili ng magkatulad na panig (ang parehong may isang coat ng braso o pareho ay may mga buntot), kung gayon ang player A ay kukuha ng parehong mga barya; kung hindi man sila ay kinuha ng manlalaro B. Kinakailangan upang pag-aralan ang laro at isulat ang matrix nito. Desisyon. Ang laro ay binubuo lamang ng dalawang gumagalaw: ang aming paglipat at ang paglipat ng kalaban, parehong personal. Ang laro ay hindi nabibilang sa mga laro na may kumpletong impormasyon, dahil sa sandaling ito ang turn ng player na gumaganap ay hindi alam kung ano ang nagawa ng iba. Dahil ang bawat isa sa mga manlalaro ay may iisang personal na paglipat, ang diskarte ng player ay isang pagpipilian sa iisang personal na paglipat na ito.

Mayroon kaming dalawang mga diskarte: A 1 - upang pumili ng isang amerikana ng braso at A 2 - upang pumili ng mga buntot; ang kalaban ay may parehong dalawang estratehiya: B 1 - amerikana ng mga bisig at B 2 - buntot. Kaya, ang larong ito ay isang 2 × 2 na laro. Isaalang-alang natin ang mga panalo ng isang barya bilang +1. Game Matrix:

Sa pamamagitan ng halimbawa ng larong ito, elementarya ito, maaari mong maunawaan ang ilang mahahalagang ideya ng teorya ng laro. Ipagpalagay muna na ang ibinigay na laro ay isinasagawa nang isang beses lamang. Pagkatapos, malinaw naman, walang saysay na pag-usapan ang tungkol sa anumang "mga diskarte" ng mga manlalaro na mas makatwiran kaysa sa iba. Ang bawat isa sa mga manlalaro na may parehong dahilan ay maaaring gumawa ng anumang desisyon. Gayunpaman, kapag ang laro ay paulit-ulit, nagbabago ang sitwasyon.

Sa katunayan, sabihin natin na kami (player A) ay pumili ng ilang diskarte para sa ating sarili (sabihin, A 1) at dumikit dito. Pagkatapos, batay sa mga resulta ng unang ilang mga gumagalaw, hulaan ng kalaban ang aming diskarte at tutugon ito sa hindi bababa sa kapaki-pakinabang na paraan para sa amin, i.e. pumili ng mga buntot. Malinaw na hindi kapaki-pakinabang para sa amin na palaging gumamit ng anumang isang diskarte; upang maiwasan ang pagkawala, dapat nating piliin ang paminsan-minsang bisig, kung minsan - mga buntot. Gayunpaman, kung kami ay pumalit ng mga coats ng armas at buntot sa isang tiyak na pagkakasunod-sunod (halimbawa, pagkatapos ng isa), maaari ring hulaan ito ng kaaway at tumugon sa diskarte na ito sa pinakamasamang paraan para sa amin. Malinaw, isang maaasahang paraan upang matiyak na hindi alam ng kaaway ang aming diskarte ay upang ayusin ang pagpili sa bawat galaw kapag hindi natin alam ito nang maaga (maaari itong matiyak, halimbawa, sa pamamagitan ng paghuhugas ng isang barya). Sa gayon, ginagamit namin ang intuitive na pangangatuwiran upang lapitan ang isa sa mga mahahalagang konsepto ng teorya ng laro - ang konsepto ng "halo-halong diskarte", ibig sabihin. tulad ng mga "purong" mga diskarte - sa kasong ito A 1 at A 2 - kahaliling random na may ilang mga frequency. Sa halimbawang ito, mula sa mga pagsasaalang-alang ng simetrya, malinaw nang maaga na ang mga diskarte ng A 1 at A 2 ay dapat na kahaliling may parehong dalas; sa mas kumplikadong mga laro, ang solusyon ay maaaring malayo sa walang kwenta.

Halimbawa 2. Ang mga manlalaro A at B nang sabay-sabay at nakapag-iisa sa bawat isa ay sumulat ng bawat isa sa tatlong mga numero: 1, 2, o 3. Kung ang kabuuan ng mga nakasulat na numero ay kahit na, babayaran ng B ang A ng halagang ito sa rubles; kung kakaiba, kung gayon, sa kabaligtaran, Isang babayaran ang halagang ito sa B. Kinakailangan upang pag-aralan ang laro at iguhit ang matrix nito.

Desisyon. Ang laro ay binubuo ng dalawang gumagalaw; kapwa ay personal. Kami (A) ay may tatlong estratehiya: A 1 - isulat 1; At 2 - isulat 2; At 3 - isulat 3. Ang kalaban (B) ay may parehong tatlong diskarte. Ang laro ay isang 3 × 3 na laro:

Malinaw, tulad ng sa nakaraang kaso, ang kaaway ay maaaring tumugon sa pinakamasama paraan para sa amin sa anumang diskarte na pinili natin. Sa katunayan, kung pipiliin natin, halimbawa, diskarte A1, ang kaaway ay palaging tutugon dito na may diskarte B2; sa diskarte A 2 - sa pamamagitan ng diskarte B 3; para sa diskarte А 3 - diskarte В 2; sa gayon, ang anumang pagpili ng isang tiyak na diskarte ay hindi maiiwasang hahantong sa atin sa isang pagkawala (gayunpaman, hindi natin dapat kalimutan na ang kaaway ay nasa parehong kakila-kilabot na sitwasyon). Ang solusyon ng larong ito (i.e., ang hanay ng mga pinaka-kapaki-pakinabang na mga diskarte ng parehong mga manlalaro) ay ibibigay sa § 5.

Halimbawa 3.Mayroon kaming tatlong uri ng mga armas sa aming itapon: А 1, А 2, А 3; ang kaaway ay may tatlong uri ng sasakyang panghimpapawid: B 1, B 2, B 3. Ang aming gawain ay pindutin ang eroplano; tungkulin ng kaaway na panatilihin siyang hindi maapektuhan. Kapag gumagamit ng armament A 1, ang mga sasakyang panghimpapawid B 1, B 2, B 3 ay tinamaan, ayon sa pagkakabanggit, na may mga posibilidad na 0.9, 0.4 at 0.2; may armament A 2 - na may mga posibilidad na 0.3, 0.6 at 0.8; na may isang 3 armament - na may mga posibilidad na 0.5, 0.7 at 0.2. Kinakailangan upang mabalangkas ang sitwasyon sa mga tuntunin ng teorya ng laro.

Desisyon. Ang sitwasyon ay maaaring isipin bilang isang 3 × 3 na laro na may dalawang personal na gumagalaw at isang random na paglipat. Ang aming personal na paglipat ay ang pagpili ng uri ng armas; personal na paglipat ng kaaway - ang pagpili ng isang sasakyang panghimpapawid upang lumahok sa labanan. Random na paglipat - ang paggamit ng mga armas; ang hakbang na ito ay maaaring magtapos sa pagkatalo o hindi pagkatalo ng sasakyang panghimpapawid. Ang aming kabayaran ay isa kung ang eroplano ay tinamaan at zero kung hindi man. Ang aming mga diskarte ay tatlong pagpipilian sa armas; mga diskarte ng kaaway - tatlong mga pagpipilian sa sasakyang panghimpapawid. Ang average na halaga ng kabayaran para sa bawat naibigay na pares ng mga diskarte ay hindi hihigit sa posibilidad ng paghagupit ng isang naibigay na sasakyang panghimpapawid na may isang sandata. Game Matrix:

Ang layunin ng teorya ng laro ay upang magbigay ng mga rekomendasyon para sa makatuwirang pag-uugali mga manlalaro sa mga sitwasyong salungatan, i.e. pagpapasiya ng "pinakamainam na diskarte" para sa bawat isa sa kanila. Ang pinakamainam na diskarte ng isang manlalaro sa teorya ng laro ay isang diskarte na, na may maraming mga pag-uulit ng laro, ay nagbibigay ng isang naibigay na player na may pinakamataas na posibleng average na pakinabang (o ang pinakamababang posibleng average loss). Sa pagpili ng diskarte na ito, ang batayan ng pangangatuwiran ay ang pag-aakala na ang kaaway ay hindi bababa sa matalinong tulad ng ating sarili, at ginagawa ang lahat upang maiwasan ang makamit natin ang ating layunin.

Sa teorya ng laro, ang lahat ng mga rekomendasyon ay ginawa batay sa mga prinsipyong ito; samakatuwid, hindi isinasaalang-alang ang mga elemento ng peligro na hindi maiiwasang naroroon sa bawat tunay na diskarte, pati na rin ang posibleng maling pagkakamali at pagkakamali ng bawat isa sa mga manlalaro. Teorya ng Laro, tulad ng anuman matematikal na modelo ang kumplikadong kababalaghan ay may mga limitasyon nito. Ang pinakamahalaga sa kanila ay ang pakinabang ay artipisyal na nabawasan sa isa isahan... Sa karamihan ng mga praktikal na sitwasyon ng salungatan, kapag nagkakaroon ng isang makatwirang diskarte, dapat isaalang-alang ng isa hindi isa, ngunit maraming mga bilang ng mga parameter - ang pamantayan para sa tagumpay ng kaganapan. Ang isang diskarte na pinakamainam sa isang criterion ay hindi kinakailangan optimal sa iba. Gayunpaman, sa pagkaalam ng mga limitasyong ito at samakatuwid ay hindi bulag na sumunod sa mga rekomendasyon na nakuha ng mga pamamaraan ng laro, maaari pa ring gamitin ng isang makatwirang gamit ang matematika apparatus ng teorya ng laro upang mabuo, kung hindi eksaktong "optimal", kung gayon, hindi bababa sa, "katanggap-tanggap" na diskarte.

§ 2. Ang mas mababa at itaas na presyo ng laro. Ang prinsipyong minimax

Isaalang-alang ang isang mxn na laro na may isang matris tulad ng sa Fig. 1. Ipakilala natin sa pamamagitan ng liham i ang bilang ng aming diskarte; ang sulat j ay ang bilang ng diskarte ng kalaban. Itakda natin ang ating sarili ang gawain: upang matukoy ang aming pinakamainam na diskarte. Suriin natin ang bawat isa sa aming mga diskarte nang sunud-sunod, na nagsisimula sa A 1.

Ang pagpili ng estratehiya, dapat nating palaging umaasa sa katotohanan na tutugon ito ng kaaway sa diskarte na kung saan ang aming kabayaran at ij ay minimal. Tukuyin natin ang halagang ito ng payoff, i.e. ang minimum ng mga numero ng ij in akolinya. Ipinapahiwatig namin ito sa pamamagitan ng α i:

Dito, ang min sign (minimum sa j) ay nagpapahiwatig ng minimum ng mga halaga ng parameter na ito para sa lahat ng posibleng j. Isulat natin ang mga numero α i; sa tabi ng matris sa kanan bilang isang dagdag na haligi:

Ang pagpili ng anumang diskarte A i, dapat tayong umasa sa katotohanan na bilang isang resulta ng makatuwirang mga aksyon ng kalaban ay hindi tayo mananalo ng higit sa α i. Naturally, kumikilos nang maingat at umaasa sa pinaka makatwirang kalaban (i pag-iwas sa anumang peligro), dapat nating ituon ang diskarte kung saan ang bilang ng α i ay ang maximum. Ipaila sa amin ang maximum na halaga ng α:

o, isinasaalang-alang ang formula (2.1),

Ang halaga ng α ay tinatawag na mas mababang presyo ng laro, sa madaling salita, ang pinakamataas na panalo o simpleng maximin. Ang bilang α ay namamalagi sa isang tiyak na linya ng matrix; ang diskarte ng player A na tumutugma sa linyang ito ay tinatawag na pinakamataas na diskarte. Malinaw, kung sumunod tayo sa pinakamataas na diskarte, kung gayon para sa anumang pag-uugali ng kalaban kami ay ginagarantiyahan na isang kabayaran, hindi bababa sa α. Samakatuwid, ang halaga ng α ay tinatawag na "mas mababang presyo ng laro". Ito ang garantisadong minimum na maaari nating ibigay ang ating sarili sa pamamagitan ng pagsunod sa pinaka maingat ("reinsurance") na diskarte.

Malinaw, ang isang katulad na pangangatwiran ay maaaring maisagawa para sa kalaban B. Dahil ang kaaway ay interesado na mabawasan ang aming mga panalo, dapat niyang tingnan ang bawat isa sa kanyang mga diskarte mula sa punto ng view maximum na panalo gamit ang diskarte na ito. Samakatuwid, sa ilalim ng matrix, isusulat namin ang maximum na mga halaga para sa bawat haligi:

at hanapin ang minimum ng of j:

Ang halaga β ay tinatawag na itaas na presyo ng laro, sa madaling salita, ang "minimax". Ang diskarte ng kalaban na naaayon sa pakinabang na minimax ay tinatawag na kanyang "minimax strategies". Ang pagsunod sa kanyang pinaka-maingat na diskarte sa minimax, ginagarantiyahan ng kalaban sa kanyang sarili ang mga sumusunod: anuman ang ginagawa natin laban sa kanya, siya ay sa anumang kaso mawalan ng isang halaga na hindi hihigit sa β. Ang prinsipyo ng pag-iingat, na nagdidikta sa pagpili ng naaangkop na mga diskarte (maximin at minimax) para sa mga manlalaro, ay madalas na tinatawag na "minimax na prinsipyo" sa teorya ng laro at mga aplikasyon nito. Ang pinaka-maingat na maximin at minimax na mga diskarte ng mga manlalaro ay minarkahan minsan isang pangkalahatang term "Mga diskarte sa Minimax".

Bilang mga halimbawa, tinukoy namin ang mas mababa at itaas na mga presyo ng laro at mga diskarte sa minimax para sa mga halimbawa 1, 2, at 3 ng § 1.

Halimbawa 1.Halimbawa 1 § 1 ay nagbibigay ng isang laro sa mga sumusunod na matris:

Dahil ang mga halaga ng α i at β j ay pare-pareho at katumbas ng -1 at +1, ayon sa pagkakabanggit, ang mas mababa at itaas na mga presyo ng laro ay din -1 at +1: α \u003d –1, β \u003d +1. Ang anumang diskarte ng player A ay ang kanyang pinakamataas, at ang anumang diskarte ng player B ay ang kanyang minimax na diskarte. Ang konklusyon ay walang halaga: sa pamamagitan ng pag-stick sa alinman sa kanyang mga diskarte, ang manlalaro A ay magagarantiyahan na siya ay mawawala ng hindi hihigit sa 1; ang parehong ay maaaring garantisado ng player B.

Halimbawa 2. Halimbawa 2 § 1 ay nagbibigay ng isang laro na may isang matris:

Ang mas mababang presyo ng laro ay α \u003d –3; ang itaas na presyo ng laro β \u003d 4. Ang aming pinakamataas na diskarte ay А 1; sa pamamagitan ng paglalapat nito nang sistematiko, matatag nating maaasahan na manalo ng hindi bababa sa –3 (mawala sa halos 3). Ang diskarte ng kalaban ng kalaban ay alinman sa mga diskarte B 1 at B 2; sa paglalapat ng mga ito nang sistematikong, siya, sa anumang kaso, ay magagarantiyahan na mawawala siya ng higit sa 4. Kung lumihis tayo sa aming pinakamataas na diskarte (halimbawa, pumili ng diskarte A2), ang kalaban ay maaaring "parusahan" sa amin para sa pamamagitan ng paglalapat ng diskarte B 3 at pagbabawas ang aming panalo ay to -5; gayon din, ang pag-atras ng kaaway mula sa kanyang diskarte sa minimax ay maaaring dagdagan ang kanyang pagkawala sa 6.

Halimbawa 3.Halimbawa 3 § 1 ay nagbibigay ng isang laro na may isang matris:

Ang mas mababang presyo ng laro ay α \u003d 0.3; ang itaas na halaga ng laro β \u003d 0.7. Ang aming pinaka-konserbatibo (maximin) na diskarte ay A 2; gamit ang А 2 armament, ginagarantiyahan namin na tatamaan kami ng sasakyang panghimpapawid nang hindi bababa sa 0.3 sa lahat ng mga kaso. Ang pinaka maingat (minimax) na diskarte ng kaaway ay B 2; gamit ang sasakyang panghimpapawid na ito, ang kaaway ay maaaring maging sigurado na siya ay maabot sa higit sa 0.7 sa lahat ng mga kaso

Ang huling halimbawa ay maginhawa upang ipakita ang isa mahalagang pag-aari mga estratehiyang minimax - ang kanilang kawalang katatagan. Gumamit tayo ng aming pinaka-maingat (maximin) na diskarte А 2, at ang kaaway - ang kanyang pinaka-maingat (minimax) na diskarte В 2. Hangga't ang parehong mga kalaban ay sumunod sa mga diskarte na ito, ang average na kabayaran ay 0.6; ito ay higit pa sa mas mababa, ngunit mas mababa sa itaas na presyo ng laro. Ngayon sabihin natin na natutunan ng kaaway na gumagamit kami ng diskarte A 2; agad niya itong tutugon kasama ang diskarte B 1 at bawasan ang pakinabang sa 0.3. Kaugnay nito, mayroon kaming isang mahusay na sagot sa diskarte B 1: diskarte A 1, na nagbibigay sa amin ng isang panalo ng 0.9, at iba pa.

Kaya, ang posisyon kung saan ginagamit ng parehong mga manlalaro ang kanilang mga diskarte sa minimax ay hindi matatag at maaaring lumabag sa impormasyong natanggap tungkol sa diskarte ng kalaban. Gayunpaman, may ilang mga laro kung saan ang mga diskarte sa minimax ay matatag. Ito ang mga laro kung saan ang mas mababang presyo ay katumbas ng pang-itaas: α \u003d β. Kung ang mas mababang presyo ng laro ay katumbas sa itaas, kung gayon ang kanilang kabuuang halaga ay tinatawag na net na presyo ng laro (kung minsan lamang ang presyo ng laro), ihahatid namin ito sa pamamagitan ng sulat the.

Tingnan natin ang isang halimbawa. Hayaan ang isang laro na 4 × 4 na bibigyan ng matrix:

Hahanapin natin ang mas mababang presyo ng laro: α \u003d 0.6. Hahanapin ang tuktok na presyo ng laro: β \u003d 0.6. Sila ay naging pareho, samakatuwid, ang laro ay may net na presyo na katumbas ng α \u003d β \u003d ν \u003d 0.6. Elemento 0.6, na naka-highlight sa payoff matrix, ay pareho ang minimum sa hilera nito at maximum sa haligi nito. Sa geometry, isang punto sa isang ibabaw na may katulad na pag-aari (isang sabay-sabay na minimum kasama ang isang coordinate at isang maximum na kasama ng iba pa) ay tinatawag na isang saddle point; sa pamamagitan ng pagkakatulad, ang term na ito ay ginagamit din sa teorya ng laro. Ang isang elemento ng isang matrix na may ari-arian na ito ay tinatawag na isang saddle point ng matrix, at ang isang laro ay sinasabing mayroong saddle point.

Ang point saddle ay tumutugma sa isang pares ng mga diskarte sa minimax (sa halimbawa na ito, A 3 at B 2). Ang mga diskarte na ito ay tinatawag na optimal, at ang kanilang kumbinasyon ay tinatawag na solusyon sa laro. Ang solusyon ng laro ay may mga sumusunod na kamangha-manghang pag-aari. Kung ang isa sa mga manlalaro (halimbawa, A) ay sumunod sa kanyang pinakamainam na diskarte, at ang iba pang manlalaro (B) ay lumihis mula sa kanyang pinakamainam na diskarte sa anumang paraan, kung gayon para sa player na gumawa ng isang paglihis hindi ito maaaring maging kapaki-pakinabang, tulad ng isang paglihis ng player B maaari sa pinakamahusay iwanan ang mga panalo na hindi nagbabago, at sa pinakamasamang kaso - dagdagan ito. Sa kabilang banda, kung ang B ay sumunod sa pinakamainam na diskarte nito, at ang A ay lumihis mula sa sarili nitong, kung gayon hindi ito maaaring maging kapaki-pakinabang sa A.

Ang pahayag na ito ay madaling ma-verify sa pamamagitan ng halimbawa ng laro na may point saddle na isinasaalang-alang. Nakikita namin na sa kaso ng isang laro na may isang saddle point, ang mga diskarte sa minimax ay may isang uri ng "katatagan": kung ang isang panig ay sumunod sa diskarteng minimax nito, kung gayon maaari lamang itong hindi kapaki-pakinabang para sa iba pang lumihis mula sa sarili nitong. Tandaan na sa kasong ito, ang kaalaman ng anumang manlalaro na pinili ng kaaway ang kanyang pinakamainam na diskarte ay hindi maaaring baguhin ang sariling pag-uugali ng manlalaro: kung hindi niya nais na kumilos laban sa kanyang sariling interes, dapat niyang sumunod sa kanyang pinakamainam na diskarte. Ang isang pares ng mga pinakamainam na diskarte sa larong punong-punong ay, tulad nito, isang "posisyon ng balanse": ang anumang paglihis mula sa pinakamainam na diskarte ay humahantong sa paglihis ng manlalaro sa hindi kanais-nais na mga kahihinatnan, pinilit siyang bumalik sa kanyang orihinal na posisyon.

Kaya, para sa bawat laro na may isang saddle point, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na mga diskarte para sa magkabilang panig at may mga sumusunod na katangian.

1) Kung ang parehong mga partido ay sumunod sa kanilang pinakamainam na diskarte, kung gayon ang average na kabayaran ay katumbas ng net presyo ng laro ν, na kung saan ay sabay-sabay na mas mababa at itaas na presyo.

2) Kung ang isa sa mga partido ay sumunod sa pinakamainam na diskarte nito, at ang iba pang mga lihis mula sa sarili nito, kung gayon ang lihis na bahagi ay maaaring mawala lamang mula dito at sa anumang kaso ay hindi maaaring madagdagan ang pakinabang.

Ang klase ng mga laro na may isang punong punong-puno ay may malaking interes kapwa mula sa isang panteorya at praktikal na punto ng pagtingin. Sa teorya ng laro, napatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may puntong punla, at, samakatuwid, ang bawat naturang laro ay may solusyon, i.e. mayroong isang pares ng pinakamainam na diskarte ng magkabilang panig, na nagbibigay ng isang average na kabayaran na katumbas ng presyo ng laro. Kung ang isang laro na may kumpletong impormasyon ay binubuo lamang ng mga personal na galaw, pagkatapos kapag ang bawat panig ay nalalapat ang pinakamainam na diskarte, dapat itong palaging magtatapos sa isang tiyak na kalalabasan, samakatuwid, isang panalo na eksaktong katumbas ng presyo ng laro.

Bilang isang halimbawa ng isang laro na may kumpletong impormasyon, ibinibigay namin sikat na laro gamit ang pag-stack ng mga barya bilog na mesa... Ang dalawang manlalaro ay kahaliling naglalagay ng magkaparehong mga barya sa talahanayan ng pag-ikot, sa bawat oras na pumili ng isang di-makatwirang posisyon sa gitna ng barya; Ang pag-overlay ng mga barya ay hindi pinapayagan. Ang player na naglalagay ng huling barya ay nanalo (kapag walang silid para sa iba). Malinaw, ang kinalabasan ng larong ito ay palaging isang konklusyon ng foregone, at mayroong isang mahusay na natukoy na diskarte na nagsisiguro sa isang maaasahang panalo para sa player na naglalagay muna ng barya. Lalo na, kailangan muna niyang maglagay ng barya sa gitna ng mesa, at pagkatapos ay tumugon na may simetriko na paglipat sa galaw ng bawat kalaban. Sa kasong ito, ang pangalawang manlalaro ay maaaring kumilos habang nais niya nang hindi binabago ang paunang natukoy na resulta ng laro. Samakatuwid, ang larong ito ay may katuturan lamang para sa mga manlalaro na hindi alam ang pinakamainam na diskarte. Ang sitwasyon ay katulad ng chess at iba pang mga laro na may kumpletong impormasyon; alinman sa mga larong ito ay may puntong punla at isang solusyon na nagpapahiwatig sa bawat manlalaro ng kanyang pinakamainam na diskarte; ang solusyon ng larong chess ay hindi lamang natagpuan dahil ang bilang ng mga kumbinasyon ng mga posibleng gumagalaw sa chess ay napakalaki upang makagawa ng isang matrikula sa pagbabayad at makahanap ng isang saddle point sa loob nito.

§ 3. Puro at halo-halong mga diskarte. Solusyon ng laro sa halo-halong mga diskarte

Ang mga laro ng saddle point ay medyo bihira sa mga may hangganan na laro ng praktikal na kahalagahan; ang isang mas karaniwang kaso ay kapag ang mas mababa at itaas na mga presyo ng laro ay naiiba. Sinusuri ang mga matrice ng naturang mga laro, natapos namin na kung ang bawat manlalaro ay bibigyan ng pagpipilian ng isang solong diskarte, kung gayon, ang pagbibilang sa isang makatwirang kumikilos na kalaban, ang pagpili na ito ay dapat matukoy ng minimax na prinsipyo. Ang pagsunod sa aming pinakamataas na diskarte, para sa anumang pag-uugali ng kalaban, alam namin na ginagarantiyahan ang aming sarili ng isang pakinabang na katumbas ng mas mababang presyo ng laro α. Ang isang likas na tanong ay lumitaw: posible bang garantiya ang sarili ng isang average na kabayaran na mas malaki kaysa sa α, kung hindi namin ginagamit ang isang solong "dalisay" na diskarte, ngunit sapalarang kahaliling ilang mga diskarte? Ang nasabing pinagsamang mga diskarte, na binubuo sa application ng maraming mga dalisay na diskarte, alternating ayon sa isang random na batas na may isang tiyak na ratio ng dalas, ay tinatawag na halo-halong mga diskarte sa teorya ng laro.

Malinaw na, ang bawat dalisay na diskarte ay isang espesyal na kaso ng isang halo-halong isa, kung saan ang lahat ng mga diskarte, maliban sa isa, ay inilalapat na may mga dalas na zero, at ang isang ito - na may dalas ng 1. Ito ay lumilitaw na, ang pag-aaplay hindi lamang puro, ngunit din halo-halong mga diskarte, maaaring makuha ang bawat isa para sa bawat wakas na laro solusyon, i.e. isang pares ng mga tulad nito (sa pangkalahatang kaso, halo-halong) mga estratehiya na kapag ang parehong mga manlalaro ay nag-aaplay sa kanila, ang kabayaran ay magiging katumbas ng presyo ng laro, at para sa anumang isang panig na paglihis mula sa pinakamainam na diskarte, ang payoff ay maaari lamang magbago sa direksyon na hindi kanais-nais para sa mga lumihis.

Ang bawat laro sa pagtatapos ay may hindi bababa sa isang solusyon (marahil sa lugar ng mga halo-halong mga diskarte).

Ang nakuha na resulta mula sa isang desisyon ay tinatawag na gastos ng laro. Ang pangunahing teorema ay nagpapahiwatig na ang bawat hangganan ng laro ay may presyo. Malinaw, ang presyo ng laro ν palaging namamalagi sa pagitan ng mas mababang presyo ng laro α at ang pinakamataas na presyo ng laro:

(3.1) α ≤ ν ≤ β

Sa katunayan, ang α ang pinakamataas na garantisadong kabayaran na maaari nating mai-secure para sa ating sarili gamit lamang ang aming dalisay na mga diskarte. Dahil kasama ang halo-halong mga diskarte, bilang isang espesyal na kaso, lahat ng mga dalisay, kung gayon, pag-amin, bilang karagdagan sa mga purong mga, din na halo-halong mga diskarte, kami, sa anumang kaso, ay hindi pinalala ang aming mga kakayahan; samakatuwid, ν ≥ α. Katulad nito, isinasaalang-alang ang mga kakayahan ng kalaban, ipinakita namin na ν ≤ β, na nagpapahiwatig ng napatunayan na hindi pagkakapantay-pantay (3.1).

Ipaalam sa amin ipakilala ang isang espesyal na notasyon para sa halo-halong mga diskarte. Kung, halimbawa, ang aming halo-halong diskarte ay binubuo sa paglalapat ng mga estratehiya A 1, A 2, A 3 na may mga frequency p 1, p 2, p 3, at p 1 + p 2 + p 3 \u003d 1, ipakikilala natin ang diskarte na ito

Katulad nito, ang halo-halong diskarte ng kaaway ay isasaad ng:

kung saan ang q 1, q 2, q 3 ay ang mga dalas kung saan ang mga diskarte sa B 1, B 2, B 3 ay halo-halong; q 1 + q 2 + q 3 \u003d 1.

Ipagpalagay na natagpuan namin ang isang solusyon sa laro na binubuo ng dalawang pinakamainam na halo-halong mga diskarte S A *, S B *. Sa pangkalahatang kaso, hindi lahat ng mga purong diskarte na magagamit sa isang naibigay na manlalaro ay kasama sa kanyang pinakamainam na halo-halong diskarte, ngunit ilan lamang. Tatawagin namin ang mga diskarte na kasama sa pinakamainam na halo-halong diskarte ng player ng kanyang "kapaki-pakinabang" na mga diskarte. Ito ay lumiliko na ang solusyon sa laro ay may isa pang kamangha-manghang pag-aari: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte SA * (SB *), kung gayon ang kabayaran ay mananatiling hindi nagbabago at katumbas ng presyo ng laro ν, anuman ang ginagawa ng ibang manlalaro, maliban kung siya lampas sa mga "kapaki-pakinabang" na mga diskarte nito. Halimbawa, siya ay maaaring gumamit ng alinman sa kanyang mga "kapaki-pakinabang" na mga diskarte sa dalisay na anyo, at maaari ring ihalo ang mga ito sa anumang proporsyon.

§ 4. Pang-elemental na pamamaraan para sa paglutas ng mga laro. Mga Laro 2x2 at 2xn

Kung ang laro mxn ay walang isang saddle point, kung gayon ang paghahanap ng isang solusyon sa pangkalahatan ay isang mahirap na gawain, lalo na para sa malalaking m at n. Minsan ang gawaing ito ay maaaring gawing simple sa pamamagitan ng unang pagbabawas ng bilang ng mga diskarte sa pamamagitan ng pagtanggal ng ilang kalabisan. Ang labis na mga diskarte ay isang) doble at b) malinaw na hindi kapaki-pakinabang. Isaalang-alang, halimbawa, isang laro na may isang matris:

Hindi mahirap tiyakin na ang estratehiya exactly 3 eksaktong inuulit ("mga duplicate") na diskarte А 1, samakatuwid, maaaring matanggal ang alinman sa dalawang mga diskarte na ito. Karagdagan, ang paghahambing ng mga linya A 1 at A 2, nakikita namin na ang bawat elemento ng linya A2 ay mas mababa (o katumbas) sa kaukulang elemento ng linya A 1. Malinaw, hindi namin dapat gamitin ang diskarte ng A2, malinaw na hindi ito kapaki-pakinabang. Sa pamamagitan ng pagtanggal ng A 3 at A 2, dinadala namin ang matris sa higit pa simpleng isip... Dagdag pa, napapansin natin na ang diskarte sa B 3 ay malinaw na hindi kapaki-pakinabang para sa kaaway; Tinatanggal ito, dinala namin ang matrix sa pangwakas na form nito:

Kaya, ang 4 × 4 na laro ay nabawasan sa isang 2 × 3 na laro sa pamamagitan ng pagtanggal ng dobleng at malinaw na hindi kanais-nais na mga diskarte.

Ang pamamaraan para sa pagtanggal ng dobleng at malinaw na hindi kanais-nais na mga diskarte ay dapat palaging unahan ang desisyon ng laro. Ang pinakasimpleng mga kaso ng mga may hangganan na laro na laging malulutas sa mga pangunahing paraan ay 2 × 2 at 2xn na laro.

Isaalang-alang ang isang 2 × 2 na laro na may isang matris:

Maaaring maganap ang dalawang kaso dito: 1) ang laro ay may punong punong-abala; 2) ang laro ay walang point saddle. Sa unang kaso, ang solusyon ay halata: ito ay isang pares ng mga estratehiya na bumalandra sa isang punla. Sa pamamagitan ng paraan, tandaan na sa isang 2 × 2 na laro, ang pagkakaroon ng isang punong punso ay palaging tumutugma sa pagkakaroon ng sadyang hindi sinasadyang mga diskarte, na dapat tanggalin sa paunang pagsusuri.

Hayaan walang point saddle at, samakatuwid, ang mas mababang presyo ng laro ay hindi katumbas sa itaas na: α ≠ β. Kinakailangan upang mahanap ang pinakamainam na halo-halong diskarte ng player A:

Nakikilala sa pamamagitan ng pag-aari na ang anumang pagkilos ng kalaban ay maaaring maging (maliban kung lalampas niya ang mga limitasyon ng kanyang "kapaki-pakinabang" na mga diskarte), ang kabayaran ay magiging katumbas ng presyo ng laro ν. Sa isang 2 × 2 na laro, ang parehong mga diskarte ng kaaway ay "kapaki-pakinabang", kung hindi, ang laro ay magkakaroon ng isang purong diskarte sa diskarte (point saddle). Nangangahulugan ito na kung sumunod tayo sa aming pinakamainam na diskarte (4.1), kung gayon ang kaaway ay maaaring gumamit ng alinman sa kanyang mga purong estratehiya B 1, B 2 nang hindi binabago ang average na kabayaran ν. Samakatuwid mayroon kaming dalawang mga equation:

mula kung saan, isinasaalang-alang na p 1 + p 2 \u003d 1, nakukuha namin:

Nahanap namin ang halaga ng laro ν sa pamamagitan ng paghahalili ng mga halaga p 1, p 2 sa alinman sa mga equation (4.2).

Kung ang presyo ng laro ay kilala, pagkatapos upang matukoy ang pinakamainam na diskarte ng kalaban

sapat ang isang equation, halimbawa:

kung saan, isinasaalang-alang na q 1 + q 2 \u003d 1, mayroon kaming:

Halimbawa 1. Hahanapin natin ang solusyon ng larong 2 × 2 na isinasaalang-alang sa Halimbawa 1 § 1, kasama ang matrix:

Ang laro ay walang isang saddle point (α \u003d –1; β \u003d +1), at, samakatuwid, ang solusyon ay dapat magsinungaling sa domain ng halo-halong mga diskarte:

Kailangan mong maghanap ng p 1, p 2, q 1 at q 2. Para sa p 1 mayroon kaming equation

1 * p 1 + (–1) (1 - p 1) \u003d (–1) p 1 + 1 (1 - p 1)

kung saan p 1 \u003d 1/2, p 2 \u003d 1/2.

Katulad nito, nahanap namin: q 1 \u003d 1/2, q 2 \u003d 1/2, ν \u003d 0.

Dahil dito, ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro ay sapalarang palitan ang pareho ng kanilang mga dalisay na diskarte, gamit ang bawat isa sa mga ito nang pantay na madalas; ang average na kabayaran ay magiging zero.

Ang resulta ng konklusyon ay malinaw na malinaw nang maaga. Sa susunod na halimbawa, titingnan natin ang higit pa mahirap na laro, ang solusyon kung saan hindi halata. Ang halimbawa ay isang hindi magandang halimbawa ng mga laro na kilala bilang "pagdaraya" o "pagdaraya" na mga laro. Sa pagsasagawa, sa mga sitwasyon ng salungatan, madalas silang ginagamit iba't ibang paraan nakaliligaw sa kaaway (maling impormasyon, paglalagay ng maling target, atbp.). Ang halimbawa, sa kabila ng pagiging simple nito, sa halip ay pagtuturo.

Halimbawa 2. Ang laro ay ang mga sumusunod. Mayroong dalawang kard: isang alas at isang deuce. Ang Player A ay kumukuha ng isa sa mga ito nang random; Hindi nakikita ni B kung aling card ang kinuha niya. Kung ang A ay kumuha ng isangce, sinabi niya: "Mayroon akong isang ace," at hinihiling mula sa kalaban 1 ruble. Kung ang A ay gumawa ng isang deuce, maaari niyang alinman sa A 1) sabihin na "Mayroon akong isang ace" at humiling ng 1 ruble mula sa kalaban, o A 2) aminin na mayroon siyang isang deuce at bayaran ang kalaban 1 ruble.

Ang kaaway, kung kusang siya ay binayaran ng 1 ruble, tatanggapin lamang ito. Kung ang 1 ruble ay hinihiling sa kanya, kung gayon maaari niyang alinman sa B 1) maniwala player A na siya ay mayroong isangce at bigyan siya ng 1 ruble, o B 2) humiling ng isang tseke upang matiyak na ang pahayag na A. Kung bilang isang resulta suriin ito na ang A ay talagang may ace, ang B ay dapat magbayad ng A 2 rubles. Kung lumiliko na ang A ay ang pagdaraya at mayroon siyang isang deuce, ang isang player ay nagbabayad ng player B 2 rubles. Kinakailangan upang pag-aralan ang laro at hanapin ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro.

Desisyon. Ang laro ay may medyo kumplikadong istraktura; ito ay binubuo ng isang sapilitan sapalarang paglipat - napili ng player A ng isa sa dalawang kard - at dalawang personal na gumagalaw, na, gayunpaman, ay hindi kinakailangang maganap. Sa katunayan, kung kinuha ni A ang isang ace, kung gayon hindi siya gumawa ng anumang personal na paglipat: bibigyan lamang siya ng isang pagpipilian - upang humiling ng 1 ruble, na ginagawa niya. Sa kasong ito, isang personal na paglipat - upang maniwala o hindi maniniwala (magbabayad o hindi magbabayad ng 1 ruble) - ay inilipat sa player B. Kung ang A bilang isang resulta ng unang random na paglipat ay natanggap ng dalawa, pagkatapos siya ay bibigyan ng isang personal na paglipat: magbayad ng 1 ruble o subukang manloko kaaway at hinihiling ang 1 ruble (sa madaling salita: "huwag linlangin" o "linlangin"). Kung pipiliin ng una ang A, kailangan lamang tanggapin ng B ang 1 ruble; kung pinili ni A ang huli, kung gayon ang player B ay bibigyan ng isang personal na paglipat: maniwala o hindi maniwala A (iyon ay, bayaran ang A 1 ruble o pag-verify ng demand).

Ang mga diskarte ng bawat isa sa mga manlalaro ay mga patakaran na nagpapahiwatig kung paano dapat kumilos ang player kapag siya ay bibigyan ng isang personal na galaw. Malinaw, ang A ay may lamang dalawang mga diskarte: A 1 - upang lokohin, A 2 - hindi manloko. Mayroon ding dalawang diskarte si B: B 1 - upang maniwala, B 2 - hindi maniniwala. Gawing itayo ang laro matrix. Upang gawin ito, kinakalkula namin ang average na bayad para sa bawat kumbinasyon ng mga diskarte.

1. A 1 B 1 (Isang nanlinlang, naniniwala si B). Kung ang A ay tumanggap ng isang ace (ang posibilidad na ito ay ½, kung gayon hindi siya bibigyan ng isang personal na paglipat; hinihiling niya ang 1 ruble, at naniniwala ang manlalaro B; 1. Ang nakuha ng isang rubles ay 1. Kung ang A ay nakatanggap ng dalawa (ang posibilidad ng ito ay din ½), siya ay nagsisi ayon sa kanyang diskarte at nangangailangan ng 1 ruble; Naniniwala sa kanya at nagbabayad; ang kabayaran A ay katumbas din ng 1. Average na kabayaran: isang 11 \u003d ½ * 1 + ½ * 1 \u003d 1.

2. A 1 B 2 (Isang panlilinlang, hindi naniniwala si B). Kung ang A ay nakakakuha ng isang ace, wala siyang personal na galaw; nangangailangan siya ng 1 ruble; Ayon sa kanyang diskarte, hindi siya naniniwala at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang nakuha ng A ay +2). Kung ang A ay tumanggap ng dalawa, siya, ayon sa kanyang diskarte, ay humihiling ng 1 ruble; B, ayon sa kanyang sarili, ay hindi naniniwala; bilang isang resulta, Isang babayaran ang 2 rubles (Ang nakuha ng A ay -2). Ang average na kabayaran ay: isang 12 \u003d ½ * (+ 2) + ½ * (- 2) \u003d 0.

3. A 2 B 1 (A ay hindi linlangin, naniniwala si B). Kung ang A ay kumuha ng isang ace, hinihiling niya ang 1 ruble; B, ayon sa kanyang diskarte, ay nagbabayad; ang pakinabang ng A ay +1. Kung kinuha ni A ang isang deuce, nagbabayad siya ng 1 ruble ayon sa kanyang diskarte; Dapat lamang tanggapin ng B (ang pakinabang ng A ay -1). Ang average na kabayaran ay: isang 21 \u003d ½ * (+ 1) + ½ * (- 1) \u003d 0.

4. A 2 B 2 (A ay hindi linlangin, hindi naniniwala si B). Kung ang A ay kumuha ng isang ace, hinihiling niya ang 1 ruble; Mga tseke ng B at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang panalo ay +2). Kung kinuha ni A ang isang deuce, nagbabayad siya ng 1 ruble; Ang natitira ay tatanggapin (ang bayad ay 1). Ang average na kabayaran ay: isang 22 \u003d ½ * (+ 2) + ½ * (- 1) \u003d ½.

Binuo namin ang laro matrix:

Ang matrix ay walang saddle point. Ang mas mababang presyo ng laro ay α \u003d 0, ang pinakamataas na presyo ng laro ay β \u003d ½. Hahanapin ang isang solusyon sa laro sa larangan ng magkakaibang mga diskarte. Paglalapat ng formula (4.3), nakukuha namin:

mga. Dapat gamitin ng Player A ang kanyang unang diskarte (impostor) sa isang third ng lahat ng mga kaso, at ang pangalawa (hindi manloko) sa dalawang third. Sa kasong ito, mananalo siya sa average na presyo ng laro ν \u003d 1/3.

Ang halaga ν \u003d 1/3 ay nagpapahiwatig na sa ilalim ng mga kundisyong ito ang laro ay kapaki-pakinabang para sa A at hindi kanais-nais para sa B. Gamit ang kanyang pinakamainam na diskarte, Ang A ay palaging maaaring magbigay ng kanyang sarili ng isang positibong average na kabayaran. Tandaan na kung ginamit ni A ang kanyang pinaka-maingat (maximin) na diskarte (sa kasong ito, ang parehong mga diskarte na A 1 at A 2 ay maximin), magkakaroon siya ng isang average na kabayaran na katumbas ng zero. Kaya, ang paggamit ng isang halo-halong diskarte ay nagbibigay sa Isang pagkakataon na mapagtanto ang kanyang kalamangan sa B, na lumitaw sa ilalim ng ibinigay na mga patakaran ng laro.

Tukuyin natin ang pinakamainam na diskarte B. Mayroon kaming: q 1 * 1 + q 2 * 0 \u003d 1/3, q 1 \u003d 1/3, q 2 \u003d 2/3. Mula saan

i.e. dapat magtiwala ang player B A sa isang third ng lahat ng mga kaso at bayaran siya ng 1 ruble nang hindi sinuri, at sa dalawang katlo ng mga kaso - suriin. Pagkatapos ay siya, sa average, mawalan ng 1/3 para sa bawat laro. Kung ginamit niya ang kanyang minimax purong diskarte B 2 (huwag naniniwala), mawawala siya sa average na 1/2 para sa bawat laro.

Ang solusyon sa larong 2 × 2 ay maaaring mabigyan ng isang simpleng geometric na interpretasyon. Hayaan mayroong isang 2 × 2 na laro kasama ang matrix

Kumuha tayo ng isang seksyon ng abscissa axis na may haba na 1 (Larawan 4.1). Ang kaliwang dulo ng seksyon (ang punto kasama ang abscissa x \u003d 0) ay kumakatawan sa diskarte A 1; ang kanang dulo ng seksyon (x \u003d 1) - diskarte A 2. Gumuhit tayo ng dalawang patayo sa axis ng abscissa sa pamamagitan ng mga punto А 1 at А 2: axis Ako-Ako at axis II - II... Sa axis Ako-Ako ipagpaliban namin ang mga panalo para sa diskarte A 1; sa axis II - II - panalo para sa diskarte A 2. Isaalang-alang ang diskarte ng kalaban B 1; nagbibigay ito ng dalawang puntos sa mga axes Ako-Ako at II - II na may ordinasyon ng isang 11 at 21, ayon sa pagkakabanggit. Gumuhit ng isang tuwid na linya B 1 B 1 sa pamamagitan ng mga puntong ito. Malinaw, kung mag-aplay kami ng isang halo-halong diskarte para sa diskarte ng kaaway B 1

pagkatapos ang aming average na kabayaran, na pantay sa kasong ito sa isang 11 p 1 + a 21 p 2, ay kinakatawan ng point M sa linya B 1 B 1; ang abscissa sa puntong ito ay pantay sa p 2. Ang tuwid na linya В 1 В 1, na kumakatawan sa kabayaran para sa diskarte В 1, ay tinatawag na conventionally "diskarte В 1".

Malinaw, ang diskarte sa B2 ay maaaring itayo nang eksakto sa parehong paraan (Larawan 4.2).

Kailangan nating hanapin ang pinakamainam na diskarte S A *, iyon ay, kung saan ang minimum na pagbabayad (para sa anumang pag-uugali ng B) ay magiging isang maximum. Upang gawin ito, bubuo tayo ng mas mababang gapos ng kabayaran para sa mga diskarte B 1, B 2, i.e. sirang linya B 1 NB 2 na minarkahan sa Fig. 4.2 na may isang matapang na linya. Ang mas mababang gapos na ito ay magpapahayag ng minimum na pagbabayad ng player A para sa alinman sa kanyang mga halo-halong mga diskarte; ang puntong N kung saan ang pinakamababang pakinabang na ito ay umaabot sa pinakamataas na tinutukoy ang pasya at ang presyo ng laro. Madaling i-verify na ang ordinate ng point N ay ang presyo ng laro ν, at ang abscissa nito ay katumbas ng p 2 - ang dalas ng aplikasyon ng diskarte A 2 sa pinakamainam na halo-halong diskarte S A *.

Sa aming kaso, ang desisyon ng laro ay tinutukoy ng punto ng intersection ng mga diskarte. Gayunpaman, hindi ito palaging magiging kaso; sa fig. Ipinakita ng 4.3 ang kaso kung, sa kabila ng pagkakaroon ng isang intersection ng mga diskarte, ang solusyon ay nagbibigay para sa parehong mga manlalaro ng purong estratehiya (A 2 at B 2), at ang presyo ng laro ν \u003d a 22. Sa kasong ito, ang matrix ay may saddle point, at ang diskarte sa A 1 ay malinaw na hindi kapaki-pakinabang, mula pa para sa anumang dalisay na diskarte ng kalaban, nagbibigay ito ng mas kaunting pakinabang kaysa sa A2.

Sa kaso kapag ang kalaban ay may isang hindi kilalang diskarte na hindi kanais-nais, ang geometric na interpretasyon ay may form na ipinakita sa Fig. 4.4.

Sa kasong ito, ang mas mababang gapos ng payoff ay nagkakasabay sa diskarte B 1, ang diskarte B 2 ay malinaw na hindi nakakasama para sa kalaban.

Ang geometric na interpretasyon ay ginagawang posible upang mailarawan din ang mas mababa at itaas na presyo ng laro (Fig. 4.5).

Para sa paglalarawan, nagtatayo kami ng mga geometric na interpretasyon ng 2 × 2 na mga laro na isinasaalang-alang sa mga halimbawa 1 at 2 (Larawan 4.6 at 4.7).

Tiniyak namin na ang anumang 2 × 2 na laro ay maaaring malutas gamit ang mga simpleng pamamaraan. Ang anumang laro ng 2xn ay maaaring malutas nang eksakto sa parehong paraan. kung saan mayroon lamang kaming dalawang mga diskarte, at ang kaaway ay may isang di-makatwirang bilang.

Ipagpalagay na mayroon tayong dalawang mga diskarte: A 1, A 2, at ang mga diskarte ng kaaway: B 1, B 2, ..., B n. Ang matris ‖a ij ‖ ay ibinigay; binubuo ito ng dalawang hilera at n haligi. Katulad sa kaso ng dalawang estratehiya, binibigyan namin ang problema ng isang geometric na interpretasyon; n mga diskarte ng kalaban ay kinakatawan ng n tuwid na mga linya (Larawan. 4.8). Binuo namin ang mas mababang hangganan ng panalo (sirang linya B 1 MNB 2) at matatagpuan sa puntong ito ng N na may pinakamataas na ordinate. Ang puntong ito ay nagbibigay ng solusyon sa laro (diskarte ) ang ordinate ng point N ay katumbas ng presyo ng laro ν, at ang abscissa ay katumbas ng dalas ng p 2 ng diskarte A 2.

Sa kasong ito, ang pinakamainam na diskarte ng kalaban ay nakuha sa pamamagitan ng paggamit ng isang halo ng dalawang "kapaki-pakinabang" na diskarte: B 2 at B 4, ang intersecting sa point N. Diskarte B 3 ay malinaw na hindi kapaki-pakinabang, at ang diskarte B 1 ay hindi kapaki-pakinabang para sa pinakamainam na diskarte S A *. Kung ang A ay nananatili sa kanyang pinakamainam na diskarte, kung gayon ang pagbabayad ay hindi magbabago, alinman sa kanyang "kapaki-pakinabang" na mga diskarte na ginagamit ng B, gayunpaman, magbabago ito kung ang B ay lumilipat sa mga diskarte B 1 o B 3. Sa teorya ng laro, napatunayan na ang anumang hangganan na laro mxn ay may isang solusyon kung saan ang bilang ng mga "kapaki-pakinabang" na mga diskarte ng magkabilang panig ay hindi lalampas sa hindi bababa sa dalawang mga numero m at n. Sa partikular, sumusunod sa ito na ang laro 2xm ay palaging may isang solusyon kung saan hindi hihigit sa dalawang "kapaki-pakinabang" na mga diskarte ang lumahok sa magkabilang panig.

Gamit ang isang geometric na interpretasyon, ang isa ay maaaring magbigay ng isang madaling paraan upang malutas ang anumang 2xm na laro. Direkta mula sa pagguhit, nakatagpo kami ng isang pares ng "kapaki-pakinabang" na mga diskarte ng kalaban B j at B k na intersect sa point N (kung higit sa dalawang mga diskarte na intersect sa point N, kukuha kami ng alinman sa dalawa). Alam namin na kung manlalaro Ang sumunod sa kanyang pinakamainam na diskarte, kung gayon ang kabayaran ay hindi nakasalalay sa proporsyon kung saan inilalapat niya ang B sa kanyang "kapaki-pakinabang" na mga diskarte, samakatuwid,

Mula sa mga equation na ito at ang kondisyon p 2 \u003d 1 - p 1, nahanap namin ang p1, p2 at ang presyo ng laro ν. Alam ang presyo ng laro, maaari mong agad na matukoy ang pinakamainam na diskarte player B. Para dito, halimbawa, ang equation ay nalulutas: qja 1 j + qka 1 k \u003d ν, kung saan ang qj + qk \u003d 1. Sa kaso kung mayroon tayong mga diskarte sa m, at ang kaaway ay may dalawa lamang, malinaw naman, ang problema ay nalutas sa isang ganap na katulad na paraan ; sapat na upang tandaan na sa pamamagitan ng pagpapalit ng tanda ng panalo sa kabaligtaran, maaaring iikot ng isa ang player A mula sa "panalong" hanggang sa "pagkatalo". Maaari mong malutas ang laro nang hindi binabago ang nanalong sign; pagkatapos ang problema ay lutasin nang direkta para sa B, ngunit hindi mas mababa, ngunit ang isang itaas na kabayaran ay itinayo (Fig. 4.9). Sa hangganan, isang point N na may pinakamababang ordinate ay hinahangad, na kung saan ay ang presyo ng laro ν.

Isaalang-alang at lutasin ang ilang mga halimbawa ng 2 × 2 at 2xm na mga laro, na pinasimple na mga halimbawa ng mga laro na praktikal na kahalagahan.

Halimbawa 3.Ang Side A ay nagpapadala ng dalawang bomba sa lugar ng kaaway B Ako at II; Ako lilipad sa harap, II - sa likod. Ang isa sa mga bombero - hindi ito kilala nang una kung alin ang dapat - dalhin ang bomba, ang iba pang kumikilos bilang isang escort. Sa lugar ng kalaban, ang mga bombero ay inaatake ng isang manlalaban sa panig B. Ang mga bombero ay armado ng mga kanyon ng iba't ibang mga rate ng sunog. Kung ang manlalaban ay umaatake sa likuran ng bomba II, pagkatapos lamang ang mga kanyon ng bomber na ito ay sumunog sa ito; kung inaatake niya ang front bomber, pagkatapos ang mga kanyon ng parehong mga bombero ay sumunog sa kanya. Ang posibilidad ng paghagupit ng isang manlalaban sa unang kaso ay 0.3, sa pangalawang 0.7.

Kung ang manlalaban ay hindi binaril sa pamamagitan ng nagtatanggol na bomba ng bomba, pagkatapos ay tinamaan ang target ng pagpili nito na may posibilidad na 0.6. Ang gawain ng mga bomba ay ang dalhin ang bomba sa target; ang gawain ng manlalaban ay upang maiwasan ito, i.e. pagbaril down ng isang bomber ng bapor. Kinakailangan na piliin ang pinakamainam na diskarte ng mga partido:

a) para sa panig A: alin sa bomba ang dapat gamitin bilang isang carrier?

b) para sa panig B: alin ang bomba na atake?

Desisyon. Mayroon kaming isang simpleng kaso ng isang 2 × 2 na laro; posibilidad na manalo hindi pagkatalo ng carrier. Ang aming mga diskarte: Isang 1 - carrier - bomber Ako; Isang 2 - carrier - bomba II... Mga diskarte sa Kaaway: B 1 - atake sa bombero Ako; B 2 - pag-atake ng bomba II... Isulat natin ang matrix ng laro, i.e. hanapin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1.A 1 B 1 (carrier Ako, ay inaatake Ako). Ang carrier ay hindi maabot kung ang mga bombero ay bumaril sa manlalaban, o hindi bumaril, ngunit hindi ito matamaan sa target nito: isang 11 \u003d 0.7 + 0.3 * 0.4 \u003d 0.82.

2.A 2 B 1 (carrier II, ay inaatake Ako). isang 21 \u003d 1

3.A 1 B 2 (carrier Ako, ay inaatake II). Isang 12 \u003d 1

4.A 2 B 2 (carrier II, ay inaatake II). Isang 22 \u003d 0.3 + 0.7 * 0.4 \u003d 0.58

Ang laro matrix ay may form:

Ang ibabang presyo ng laro ay 0.82; nangungunang presyo 1. Ang Matrix ay walang point saddle; naghahanap kami ng isang solusyon sa larangan ng halo-halong mga diskarte. Meron kami:

p 1 * 0.82 + p 2 * 1 \u003d ν

p 1 * 1 + p 2 * 0.58 \u003d ν

p 1 \u003d 0.7; p 2 \u003d 0.3

Ang aming pinakamainam na diskarte ay, iyon ay, bilang isang tagadala, kailangan mong pumili nang mas madalas Akokaysa II... Ang presyo ng laro ay ν \u003d 0.874. Alam ang ν, tinutukoy namin ang q 1 at q 2 - ang mga dalas ng mga diskarte B 1 at B 2 sa pinakamainam na diskarte ng kalaban S B *. Mayroon kaming: q 1 * 0.82 + q 2 * 1 \u003d 0.874 at q 2 \u003d 1 - q 1, kung saan ang q 1 \u003d 0.7; q 2 \u003d 0.3, i.e. ang pinakamabuting diskarte ng kalaban ay .

Halimbawa 4.Ang Side A ay umaatake sa object, ipinagtatanggol ito ng side B. Ang Side A ay may dalawang eroplano; ang panig B ay may tatlong anti-sasakyang panghimpapawid na baril. Ang bawat sasakyang panghimpapawid ay nagdadala ng isang malakas na mapanirang armas; para sa isang bagay na matumbok, sapat na para sa kahit isang eroplano upang masira ito. Side Isang sasakyang panghimpapawid ay maaaring pumili ng alinman sa tatlong direksyon upang makalapit sa pasilidad: Ako, II, III (Larawan 4.10). Ang kaaway (side B) ay maaaring maglagay ng alinman sa kanyang mga baril sa anumang direksyon; nang sabay-sabay, ang bawat armas ay tumutukoy lamang sa lugar ng puwang na may kaugnayan direksyon na ito, at hindi kukunan ng mga kalapit na direksyon. Ang bawat baril ay maaari lamang sunog sa isang sasakyang panghimpapawid; ang fired eroplano ay tinamaan ng posibilidad 1. Hindi alam ng Side A kung saan matatagpuan ang mga baril; hindi alam ng gilid B kung saan nagmula ang mga eroplano. Ang gawain ng Side A ay ang pindutin ang bagay; ang gawain ng panig B ay upang maiwasan ang kanyang pagkatalo. Maghanap ng isang solusyon sa laro.

Desisyon. Ang laro ay isang 2 × 3 na laro. Ang kabayaran ay ang posibilidad ng paghagupit sa bagay. Ang aming posibleng mga diskarte ay: A 1 - magpadala ng isang eroplano nang sabay-sabay sa dalawang magkakaibang direksyon. At 2 - ipadala ang parehong mga eroplano sa parehong direksyon. Mga diskarte sa Kaaway: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - maglagay ng dalawang baril sa isang direksyon at ang isa sa iba pang; Sa 3 - ilagay ang lahat ng tatlong baril sa parehong direksyon. Nag-compose kami ng game matrix.

1.A 1 B 1 (sumakay ang mga eroplano magkakaibang direksyon; ang mga baril ay inilalagay nang paisa-isa). Malinaw, sa kasong ito, hindi isang solong eroplano ang sasabog sa bagay: isang 11 \u003d 0.

2. В 2 В 1 (ang mga eroplano ay lumipad nang magkasama sa parehong direksyon; ang mga baril ay inilalagay nang paisa-isa). Malinaw, sa kasong ito, ang isang eroplano ay ipapasa sa bagay nang hindi nagpaputok: isang 21 \u003d 1.

3. А 1 В 2 (ang mga eroplano ay lumipad nang paisa-isa; tinatanggol ng kaaway ang dalawang direksyon at iniwan ang ikatlong hindi protektado). Ang posibilidad na hindi bababa sa isang eroplano ay sasabog sa bagay ay katumbas ng posibilidad na ang isa sa kanila ay pumili ng isang hindi protektadong direksyon: isang 12 \u003d 2/3.

4. В 2 В 2 (ang mga eroplano ay lumipad nang magkasama sa isang direksyon; ipinagtatanggol ng kaaway ang isang direksyon na may dalawang baril at isa sa isa, iyon ay, sa katunayan, ipinagtatanggol niya ang isang direksyon at iniwan ang dalawang hindi protektado). Ang posibilidad na hindi bababa sa isang eroplano ay sasabog sa bagay ay katumbas ng posibilidad ng isang pares ng mga eroplano na pumili ng isang talagang hindi protektadong direksyon: isang 22 \u003d 2/3.

5. Isang 1 B 3 (ang mga eroplano ay lumipad nang paisa-isa; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong baril): isang 13 \u003d 1.

6. В 2 В 3 (ang parehong mga eroplano ay lumipad nang sama-sama; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong baril). Para maabot ang bagay, dapat pumili ang sasakyang panghimpapawid ng isang hindi protektadong direksyon: isang 23 \u003d 2/3.

Game Matrix:

Ipinakita ng matris na ang diskarte В 3 ay malinaw na hindi nakakasama sa paghahambing sa В 2 (ito ay maaaring malutas nang maaga). Diskarte sa pagtawid Sa 3, ang laro ay nabawasan sa isang 2 × 2 na laro:

Ang matrix ay may isang saddle point: ang pinakamababang presyo ng laro 2/3 ay nagkakasabay sa tuktok. Sa parehong oras, tandaan namin na para sa amin (A) diskarte A 1 ay malinaw na hindi kapaki-pakinabang. Konklusyon: ang magkabilang panig A at B ay dapat palaging gumamit ng kanilang mga dalisay na diskarte A 2 at B 2, i.e. kailangan naming magpadala ng mga eroplano sa 2, nang pumili nang random sa direksyon kung saan ipinadala ang pares; dapat ilagay ng kaaway ang mga sandata sa sumusunod na paraan: dalawa sa isang direksyon, ang isa sa iba pa, at ang pagpili ng mga direksyon na ito ay dapat ding gawin nang sapalaran (dito, tulad ng nakikita natin, na "mga dalisay na estratehiya" ay nagsasama ng isang elemento ng pagkakataon). Ang paglalapat ng mga pinakamainam na diskarte na ito, palaging makakakuha kami ng isang palaging average na kabayaran ng 2/3 (i.e. ang bagay ay tatama sa isang posibilidad na 2/3). Tandaan na ang nahanap na solusyon sa laro ay hindi lamang ang isa; bukod sa desisyon sa malinis na mga diskarte, mayroong isang buong seksyon ng halo-halong mga diskarte ng player A, na pinakamainam, mula p 1 \u003d 0 hanggang p 1 \u003d 1/3 (Larawan 4.11).

Madali, halimbawa, upang mapatunayan nang direkta na ang parehong average na kabayaran ng 2/3 ay makuha kung ilalapat namin ang aming mga diskarte A1 at A2 sa mga proporsyon ng 1/3 at 2/3.

Halimbawa 5. Ang mga kondisyon ay katulad ng sa nakaraang halimbawa, ngunit apat na direksyon ng pag-atake ang posible para sa amin, at ang kaaway ay may apat na sandata.

Desisyon.Mayroon pa kaming dalawang posibleng mga diskarte: A 1 - magpadala ng mga eroplano nang paisa-isa, A 2 - magpadala ng dalawang eroplano. Ang kaaway ay may limang posibleng mga diskarte: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - maglagay ng dalawang baril sa dalawang magkakaibang direksyon; Sa 3 - maglagay ng dalawang baril sa isang direksyon at isa-isa - sa kabilang dalawa; Sa 4, ilagay ang tatlong baril sa isang direksyon at ang isa sa iba pang; Sa 5 - ilagay ang lahat ng apat na baril sa parehong direksyon. Mga istratehiya B 4, B 5 ay itinapon nang maaga bilang malinaw na hindi kapaki-pakinabang. Nangangatuwiran nang katulad sa nakaraang halimbawa, itinatayo namin ang laro matrix:

Ang ibaba ng presyo ng laro ay 1/2, ang tuktok ay 3/4. Ang matrix ay walang saddle point; ang solusyon ay namamalagi sa lugar ng halo-halong mga diskarte. Gamit ang interpretasyong geometric (Fig. 4.12), ipaalam natin sa labas ang mga "kapaki-pakinabang" na diskarte ng kaaway: B 1 at B 2.

Ang mga dalas p 1 at p 2 ay natutukoy mula sa mga equation: p 1 * 0 + (1 - p 1) * 1 \u003d ν at p 1 * 5/6 + (1 - p 1) * 1/2 \u003d ν; kung saan p 1 \u003d 3/8; p 2 \u003d 5/8; ν \u003d 5/8, i.e. ang aming pinakamainam na diskarte ay ... Sa pamamagitan nito, ginagarantiyahan namin ang aming sarili ng isang average na panalo ng 5/8. Alam ang presyo ng laro ν \u003d 5/8, nakita namin ang mga frequency q 1 at q 2 ng mga kapaki-pakinabang na diskarte ng kalaban: q 1 * 0 + (1 - q 1) * 5/6 \u003d 5/8, q 1 \u003d ¼, q 2 \u003d ¾. Ang pinakamainam na diskarte ng kaaway ay: .

Halimbawa 6. Ang Side A ay may dalawang estratehiya A 1 at A 2, ang panig B ay mayroong apat na B 1, B 2, B 3 at B 4. Ang laro matrix ay may form:

Maghanap ng isang solusyon sa laro.

Desisyon. Mas mababang presyo ng laro 3; nangungunang 4. Ang interpretasyong geometric (Larawan 4.13) ay nagpapakita na ang mga kapaki-pakinabang na diskarte ng player B ay B 1 at B 2 o B 2 at B 4:

Ang Player A ay walang hanggan maraming pinakamainam na halo-halong mga diskarte: sa pinakamainam na diskarte, ang p 1 ay maaaring mag-iba mula 1/5 hanggang 4/5. Ang presyo ng laro ν \u003d 4. Player B ay may purong optimal diskarte B 2.

§ 5. Pangkalahatang pamamaraan para sa paglutas ng mga hangganan na laro

Sa ngayon, isinasaalang-alang lamang namin ang karamihan sa mga pangunahing laro ng 2xn na uri, na maaaring madaling malutas at payagan ang isang maginhawa at madaling maunawaan na geometric na interpretasyon. Sa pangkalahatang kaso, ang paglutas ng laro mxn ay isang medyo mahirap na problema, at ang pagiging kumplikado ng problema at ang halaga ng mga pagkalkula na kinakailangan upang malutas ito nang madagdagan sa pagtaas ng m at n. Gayunpaman, ang mga paghihirap na ito ay hindi isang pangunahing likas na katangian at nauugnay lamang sa isang napakalaking dami ng mga kalkulasyon, na sa ilang mga kaso ay maaaring maging praktikal na hindi praktikal. Ang pangunahing aspeto ng pamamaraan para sa paghahanap ng isang solusyon ay nananatiling pareho para sa anumang m.

Ipailarawan natin ito sa halimbawa ng larong 3xn. Bigyan natin ito ng isang interpretasyong geometriko - mayroon na isang spatial. Ang aming tatlong mga diskarte na A 1, A 2 at A 3 ay kinakatawan ng tatlong puntos sa eroplano hoy; ang mga unang namamalagi sa pinagmulan (Fig.5.1), ang pangalawa at pangatlo - sa mga ehe Oh at OU sa mga distansya ng 1 mula sa simula.

Ang Axes ay iguguhit sa pamamagitan ng mga punto A 1, A 2 at A 3 Ako – Ako, II – II at III – IIIpatayo sa eroplano hoy... Sa axis Ako – Ako ang mga nakuha ay idineposito gamit ang diskarte A 1 sa mga ehe II – II at III – III - Mga panalo na may mga diskarte A 2, A 3. Ang bawat diskarte ng kalaban B j ay inilalarawan ng isang eroplano na pinutol sa mga palakol Ako – Ako, II – II at III – III mga segment na katumbas ng mga payoff para sa kaukulang mga diskarte A 1, A 2 at A 3 at diskarte B j. Ang pagkakaroon ng gayon naitayo ang lahat ng mga diskarte ng kaaway, nakakakuha kami ng isang pamilya ng mga eroplano sa tatsulok na A 1, A 2 at A 3 (Larawan 5.2). Para sa pamilyang ito, maaari ka ring magtayo ng isang mas mababang hangganan ng payoff, tulad ng ginawa namin sa kaso ng 2xn, at matagpuan sa hangganan na ito ng N na may pinakamataas na taas sa itaas ng eroplano hoy... Ang taas na ito ay ang gastos ng laro ν.

Ang mga dalas p 1, p 2, p 3 ng mga diskarte A 1, A 2 at A 3 sa pinakamainam na diskarte SA * ay matutukoy ng mga coordinate (x, y) ng point N, lalo: p 2 \u003d x, p 3 \u003d y, p 1 \u003d 1 - p 2 - p 3. Gayunpaman, tulad ng isang geometric na konstruksyon, kahit na para sa 3xn case, ay hindi madaling ipatupad at nangangailangan ng maraming oras at pagsisikap ng imahinasyon. Sa pangkalahatang kaso ng laro, gayunpaman, inililipat ito sa isang puwang ng m-dimensional at nawawala ang lahat ng kaliwanagan, bagaman ang paggamit ng geometric terminology sa isang bilang ng mga kaso ay maaaring maging kapaki-pakinabang. Kapag ang paglutas ng mga laro ng mxn, sa pagsasagawa, mas maginhawa na hindi gumamit ng mga geometriko na pagkakatulad, ngunit ang mga pamamaraan sa pagsusuri ng computational, lalo na dahil ang mga pamamaraan na ito ay ang tanging angkop para sa paglutas ng isang problema sa mga computer.

Ang lahat ng mga pamamaraan na ito ay mahalagang kumulo sa paglutas ng isang problema sa pamamagitan ng sunud-sunod na mga pagsubok, ngunit ang pag-order ng pagkakasunud-sunod ng mga pagsubok ay nagpapahintulot sa iyo na bumuo ng isang algorithm na humahantong sa isang solusyon sa pinaka matipid. Dito ay maikli naming tatahan ang isang paraan ng computational para sa paglutas ng mga laro ng mxn - ang tinatawag na "linear programming" na pamamaraan. Para sa mga ito, nagbibigay muna kami ng isang pangkalahatang pahayag ng problema ng paghahanap ng isang solusyon sa laro mxn. Hayaan ang isang laro mxn na may mga estratehiya A 1, A 2, ..., A m ng player A at n mga diskarte B 1, B 2, ..., B n ng player B ay bibigyan ng isang payoff matrix ‖a i j ‖ ay ibinigay. Kinakailangan upang maghanap ng solusyon sa laro, i.e. dalawang pinakamainam na halo-halong mga diskarte ng mga manlalaro A at B

kung saan p 1 + p 2 + ... + p m \u003d 1; q 1 + q 2 + ... + q n \u003d 1 (ang ilan sa mga bilang p i at q j ay maaaring katumbas ng zero).

Ang aming pinakamainam na diskarte S A * ay dapat magbigay sa amin ng isang kabayaran na hindi bababa sa ν para sa anumang pag-uugali ng kalaban, at isang kabayaran na katumbas ng ν para sa kanyang pinakamainam na pag-uugali (diskarte S B *). Katulad nito, ang diskarte na S B * ay dapat magbigay ng kalaban sa isang pagkawala na hindi lalampas sa ν para sa alinman sa aming pag-uugali at katumbas ng ν para sa aming pinakamainam na pag-uugali (diskarte S A *).

Sa kasong ito, ang halaga ng presyo ng laro ν ay hindi alam sa amin; ipapalagay natin na pantay ito sa ilan positibong bilang... Sa paniniwala nito, hindi namin nilalabag ang pangkalahatang pangangatuwiran; para sa 0\u003e 0, malinaw na sapat na ang lahat ng mga elemento ng matrix ‖a i j ‖ maging hindi negatibo. Ito ay palaging makakamit sa pamamagitan ng pagdaragdag sa mga elemento ‖a i j ‖ isang sapat na malaking positibong halaga L; habang ang presyo ng laro ay tataas ng Lat ang desisyon ay hindi magbabago.

Ipagpalagay na pinili namin ang aming pinakamainam na diskarte S A *. Pagkatapos ang aming average na kabayaran sa diskarte ng kalaban B j ay: a j \u003d p 1 a 1j + p 2 a 2j + ... + p m a mj. Ang aming pinakamainam na diskarte S A * ay may pag-aari na, para sa anumang pag-uugali ng kalaban, nagbibigay ito ng kabayaran na hindi bababa sa ν; samakatuwid, ang alinman sa mga bilang ng isang j ay hindi maaaring mas mababa sa ν. Nakakuha kami ng isang bilang ng mga kondisyon:

Hinahati namin ang mga hindi pagkakapareho (5.1) sa pamamagitan ng isang positibong halaga ν at magpahiwatig

Pagkatapos ang mga kondisyon (5.1) ay maaaring isulat sa form

kung saan ξ 1, ξ 2,…, ξ m ay mga di-negatibong numero. Dahil ang р 1 + p 2 + ... + p m \u003d 1, kung gayon ang dami ng ξ 1, ξ 2, ..., ay masiyahan ang kundisyon

(5.3) ξ 1 + ξ 2 + ... + ξ m \u003d 1 / ν.

Nais naming gawin ang aming garantisadong panalo hangga't maaari hangga't maaari; malinaw naman, habang tamang bahagi pagkakapantay-pantay (5.3) ay tumatagal ng isang minimum na halaga. Sa gayon, ang problema sa paghahanap ng isang solusyon sa laro ay nabawasan sa sumusunod na problema sa matematika: matukoy ang mga nonnegative na mga halaga ξ 1, ξ 2, ..., ξ m kasiya-siyang mga kondisyon (5.2) upang ang kanilang kabuuan Φ \u003d ξ 1 + ξ 2 + ... + ξ m ay minimal.

Karaniwan, kapag ang paglutas ng mga problema na nauugnay sa paghahanap ng matinding halaga (maxima at minima), ang pag-andar ay naiiba at ang mga derivatives ay pantay-pantay sa zero. Ngunit ang gayong pamamaraan ay walang silbi sa kasong ito, dahil ang pag-andar Φ, na kailangang mabawasan sa isang minimum, ay linear, at ang mga derivatives na may paggalang sa lahat ng mga argumento ay pantay sa pagkakaisa, i.e. huwag mawala kahit saan. Dahil dito, ang maximum ng pag-andar ay naabot sa isang lugar sa hangganan ng pagkakaiba-iba ng mga argumento, na natutukoy sa pamamagitan ng kahilingan ng hindi negatibiti ng mga argumento at kundisyon (5.2). Ang pamamaraan ng paghahanap ng matinding halaga sa pamamagitan ng pagkita ng kaibhan ay hindi angkop din sa mga kasong iyon kapag ang maximum ng mas mababang (o pinakamaliit sa itaas) na limitasyon ng kabayaran ay tinutukoy para sa paglutas ng laro, tulad namin, halimbawa, ay ginawa sa paglutas ng mga laro ng 2xn. Sa katunayan, ang mas mababang hangganan ay binubuo ng mga seksyon ng mga tuwid na linya, at ang maximum ay naabot hindi sa punto kung saan ang derivative ay zero (walang ganoong punto sa lahat), ngunit sa hangganan ng agwat o sa punto ng intersection ng tuwid na mga seksyon.

Upang malutas ang gayong mga problema, na karaniwang pangkaraniwan, ang isang espesyal na linear programming apparatus ay binuo sa matematika. Ang problemang pag-programming ng linear ay nakuha tulad ng mga sumusunod. Ang isang sistema ng mga linear na equation ay ibinigay:

Kinakailangan na makahanap ng mga di-katuturang mga halaga ng dami ξ 1, ξ 2, ..., ξ m kasiya-siyang mga kondisyon (5.4) at sa parehong oras na binawasan ang isang naibigay na homogenous linear function ng dami ng dami 1, ξ 2, ..., ξ m (linear form): Φ \u003d c 1 ξ 1 + c 2 ξ 2 + ... + cm ξ m

Madaling i-verify na ang problema sa itaas ng teorya ng laro ay isang espesyal na kaso ng isang linear na problema sa programming para sa c 1 \u003d c 2 \u003d ... \u003d c m \u003d 1. Sa unang sulyap, maaaring mukhang ang mga kondisyon (5.2) ay hindi katumbas ng mga kondisyon (5.4), dahil sa halip na pantay na mga palatandaan na naglalaman sila ng mga palatandaan na hindi pagkakapantay-pantay. Gayunpaman, madaling mapupuksa ang mga palatandaan ng hindi pagkakapareho sa pamamagitan ng pagpapakilala ng mga bagong kathang-isip na hindi negatibong variable na z 1, z 2, ..., z n at mga kondisyon ng pagsulat (5.2) sa anyo:

Ang form na maaaring mabawasan sa isang minimum ay Φ \u003d ξ 1 + ξ 2 + ... + ξ m. Ang linear programming apparatus ay posible upang piliin ang mga halaga ξ 1,, 2, ..., ξ m na nakakatugon sa ipinahayag na mga kinakailangan sa pamamagitan ng isang medyo maliit na bilang ng mga sunud-sunod na mga sample. Para sa higit na kalinawan, narito ipapakita namin ang paggamit ng aparatong ito nang direkta sa materyal ng paglutas ng mga tukoy na laro.

Halimbawa 1. Kinakailangan upang maghanap ng solusyon sa larong 3 × 3 na ibinigay sa Halimbawa 2 § 1, kasama ang matrix:

Upang gawin ang lahat ng ij non-negatibo, idagdag sa lahat ng mga elemento ng matrix L \u003d 5. Nakukuha namin ang matrix:

Sa kasong ito, ang presyo ng laro ay tataas ng 5, at ang desisyon ay hindi magbabago.

Ipaalam sa amin na tukuyin ang pinakamainam na diskarte S A *. Ang mga kondisyon (5.2) ay may form:

kung saan ξ 1 \u003d p 1 / ν, ξ 2 \u003d p 2 / ν, ξ 3 \u003d p 3 / ν. Upang mapupuksa ang mga palatandaan ng hindi pagkakapantay-pantay, ipinakilala namin ang mga variable ng dummy z 1, z 2, z 3; ang mga kondisyon (5.6) ay isusulat sa anyo:

Ang linear form Φ ay may form: Φ \u003d ξ 1 + ξ 2 + ξ 3 at dapat gawin bilang maliit hangga't maaari. Kung ang lahat ng tatlong mga diskarte B ay "kapaki-pakinabang", pagkatapos ang lahat ng tatlong mga variable na dummy z 1, z 2, z 3 mawala (ibig sabihin, isang kabayaran na katumbas ng presyo ng laro ν ay makakamit para sa bawat diskarte B j). Ngunit wala pa rin tayong dahilan upang sabihin na ang lahat ng tatlong mga diskarte ay "kapaki-pakinabang". Upang suriin ito, susubukan naming ipahiwatig ang form Φ sa mga tuntunin ng mga variable na dummy z 1, z 2, z 3 at tingnan kung makakamit natin ang minimum ng form sa pamamagitan ng pagtatakda ng mga ito na pantay sa zero. Upang gawin ito, malulutas namin ang mga equation (5.7) na may paggalang sa mga variable ables 1, ξ 2, ξ 3 (i.e., ipinahayag namin ang ξ 1, 2, 2, 3 sa mga tuntunin ng mga dummy variable na z 1, z 2, z 3):

Pagdaragdag ng ξ 1, ξ 2, ξ 3, nakukuha namin: Φ \u003d 1/5 + z 1/20 + z 2/10 + z 3/20. Narito ang mga coefficient para sa lahat ng z ay positibo; samakatuwid, ang anumang pagtaas sa z 1, z 2, z 3 sa itaas ng zero ay maaari lamang humantong sa isang pagtaas sa form Φ, at nais naming ito ay minimal. Samakatuwid, ang mga halaga z 1, z 2, z 3 na gumagawa ng form Φ sa isang minimum ay z 1 \u003d z 2 \u003d z 3 \u003d 0. Samakatuwid, ang pinakamababang halaga ng form Φ ay: 1 / ν \u003d 1/5, kung saan ang presyo ng laro ν \u003d 5. Pagsusulat ng zero na halaga ng z 1, z 2, z 3 sa mga formula (5.8), nahanap namin: ξ 1 \u003d 1/20, ξ 2 \u003d 1/10, ξ 3 \u003d 1/20, o, pinarami ang mga ito ng ν, p 1 \u003d 1/4, p 2 \u003d 1/2, p 3 \u003d 1/4. Kaya, ang pinakamainam na diskarte A ay matatagpuan: , i.e. dapat nating isulat ang numero 1 sa isang quarter ng lahat ng mga kaso, 2 sa kalahati ng mga kaso at 3 sa natitirang quarter ng mga kaso.

Alam ang presyo ng laro ν \u003d 5, posible upang mahanap ang pinakamainam na diskarte ng kalaban gamit ang mga kilalang pamamaraan ... Upang gawin ito, gagamitin namin ang aming dalawang dalawang "kapaki-pakinabang" na mga diskarte (halimbawa, A 2 at A 3) at isulat ang mga equation:

9q 1 + 11 (1-q 2 -q 1) \u003d 5,

kung saan q 1 \u003d q3 \u003d 1/4; q 2 \u003d 1/2. Ang pinakamainam na diskarte ng kaaway ay magiging pareho sa atin: ... Ngayon bumalik tayo sa orihinal na (hindi na-convert) na laro. Upang gawin ito, kinakailangan lamang na ibawas ang halaga L \u003d 5 na idinagdag sa mga elemento ng matrix mula sa presyo ng laro ν \u003d 5. Nakukuha namin ang presyo ng orihinal na laro v 0 \u003d 0. Samakatuwid, ang pinakamainam na mga diskarte ng parehong partido ay nagbibigay ng isang average na kabayaran na katumbas ng zero; ang laro ay pantay na kapaki-pakinabang o hindi kapahamakan para sa parehong partido.

Halimbawa 2. Ang Sports Club A ay may tatlong pagpipilian para sa komposisyon ng pangkat A 1, A 2 at A 3. Club B - din sa tatlong pagpipilian B 1, B 2 at B 3. Kapag nagsumite ng isang aplikasyon upang lumahok sa kumpetisyon, wala sa mga club ang nakakaalam kung aling mga pulutong ang pipiliin ng kalaban. Ang mga posibilidad ng club Ang isang panalong sa ilalim ng iba't ibang mga lineup, na halos kilala mula sa karanasan ng mga nakaraang mga pagpupulong, ay ibinibigay ng matrix:

Alamin kung gaano kadalas ang mga club ay dapat i-play ang bawat koponan laban sa bawat isa upang makamit ang pinakamataas na average na bilang ng mga tagumpay.

Desisyon. Ang mas mababang presyo ng laro ay 0.4; nangungunang 0.6; naghahanap kami ng isang solusyon sa larangan ng halo-halong mga diskarte. Upang hindi makitungo sa mga praksiyon, pinarami namin ang lahat ng mga elemento ng matrix sa pamamagitan ng 10; sa kasong ito, ang presyo ng laro ay tataas ng 10 beses, at ang desisyon ay hindi magbabago. Nakukuha namin ang matris:

Ang mga kondisyon (5.5) ay may form:

at ang minimum na kondisyon Φ \u003d ξ 1 + ξ 2 + ξ 3 \u003d min.

Suriin kung ang lahat ng tatlong mga diskarte ng kalaban ay "kapaki-pakinabang". Bilang isang hipotesis, ipinapalagay muna natin na ang mga dummy variable na z 1, z 2, z 3 ay katumbas ng zero, at para sa pagpapatunay na nalutas namin ang mga equation (5.10) para sa 1, 2, 2, 3:

(5.12) 136Φ \u003d 30 + 13z 1 + 18z 2 - 51z 3

Ipinapakita ng Formula (5.12) na ang isang pagtaas sa mga variable z 1 at z 2 kumpara sa kanilang ipinapalagay na halaga ng zero ay maaari lamang dagdagan Φ, habang ang isang pagtaas sa z 3 ay maaaring bumaba Φ. Gayunpaman, ang pagtaas sa z 3 ay dapat gawin nang maingat upang ang mga halaga ng ξ 1, ξ 2, ξ 3, depende sa z 3, ay hindi maging negatibo sa kasong ito. Samakatuwid, sa kanang bahagi ng mga pagkakapantay-pantay (5.11), itinakda namin ang mga halaga ng z 1 at z 2 na katumbas ng zero, at tataas namin ang halaga z 3 sa mga pinapayagan na mga limitasyon (hanggang sa anuman sa mga halaga ng ξ 1, ξ 2, ξ 3 na mawawala). Mula sa pangalawang pagkakapantay-pantay sa (5.11) makikita na ang isang pagtaas sa z 3 ay "ligtas" para sa halaga ξ 2 - tataas lamang ito. Tulad ng para sa dami ng ξ 1 at ξ 3, narito ang isang pagtaas sa z 3 ay posible lamang hanggang sa isang tiyak na limitasyon. Ang dami ξ 1 ay nawawala sa z 3 \u003d 10/23; ang dami ξ 3 ay mawawala nang mas maaga, na nasa z 3 \u003d 1/4. Samakatuwid, ang pagbibigay sa z 3 ng pinakamataas na pinahihintulutang halaga z 3 \u003d 1/4, gagawin namin sa kasong ito zero ang halaga ng ξ 3.

Upang suriin kung ang form Φ ay nagiging isang minimum sa z 1 \u003d 0, z 2 \u003d 0, ξ 3 \u003d 0, ipinahayag namin ang mga natitirang (non-zero) variable sa mga tuntunin ng sinasabing zero z 1, z 2,. 3. Ang paglutas ng mga equation (5.10) na may kaugnayan sa ξ 1, ξ 2 at z 3, nakukuha namin:

(5.13) 32Φ \u003d 7 + Зz 1 + 4z 2 + ξ 3

Mula sa formula (5.13) makikita na ang anumang pagtaas sa z 1, z 2, ξ 3 sa itaas ng kanilang ipinapalagay na mga halaga ng zero ay maaari lamang dagdagan ang form Φ. Samakatuwid, ang solusyon sa laro ay natagpuan; ito ay tinutukoy ng mga halaga z 1 \u003d z 2 \u003d ξ 3 \u003d 0, kung saan ξ 1 \u003d 1/32, ξ 2 \u003d 3/16, z 3 \u003d 1/4. Pagsusulit sa formula (5.13), nahanap namin ang presyo ng laro ν: 32Φ \u003d 7 \u003d 32 / ν; ν \u003d 32/7. Ang aming pinakamainam na diskarte: ... Ang mga "kapaki-pakinabang" na mga diskarte (mga komposisyon A 1 at A 2) ay dapat mailapat sa mga frequency 1/7 at 6/7; komposisyon A 3 - hindi nalalapat.

Upang mahanap ang pinakamainam na diskarte ng kalaban, sa pangkalahatang kaso, magagawa mo ang sumusunod: baguhin ang tanda ng payoff sa kabaligtaran, magdagdag ng isang palaging halaga L sa mga elemento ng matrix upang gawin silang hindi negatibo, at lutasin ang problema para sa kalaban sa parehong paraan tulad ng paglutas namin para sa ating sarili. Gayunpaman, ang katotohanan na alam na natin ang presyo ng laro ν medyo pinapadali ang problema. Bukod dito, sa ito tiyak na kaso ang gawain ay higit na pinasimple ng katotohanan na dalawa lamang ang "kapaki-pakinabang" na mga diskarte ng kalaban, B 1 at B 2, ay lumahok sa solusyon, dahil ang halaga ng z 3 ay hindi zero, at, samakatuwid, sa diskarte B 3, ang presyo ng laro ay hindi naabot. Ang pagpili ng anumang "kapaki-pakinabang" na diskarte ng player A, halimbawa A 1, ang isang tao ay maaaring makahanap ng mga frequency q 1 at q 2. Para sa mga ito isusulat namin ang equation 8q 1 + 2 (1 - q 1) \u003d 32/7, kung saan ang q 1 \u003d 3/7, q 2 \u003d 4/7; ang pinakamainam na diskarte ng kaaway ay: , i.e. ang kaaway ay hindi dapat gumamit ng komposisyon B 3, at ang mga komposisyon B 1 at B2 ay dapat gamitin gamit ang mga frequency 3/7 at 4/7.

Pagbabalik sa orihinal na matris, tinutukoy namin ang totoong halaga ng laro ν 0 \u003d 32/7: 10 \u003d 0.457. Nangangahulugan ito na para sa malaking numero mga pulong Ang bilang ng mga tagumpay para sa Club A ay 0.457 sa lahat ng mga pagpupulong.

§ 6. Tinatayang mga pamamaraan para sa paglutas ng mga laro

Kadalasan, sa mga praktikal na problema, hindi na kailangang makahanap ng eksaktong solusyon sa laro; sapat na upang makahanap ng isang tinatayang solusyon na nagbibigay ng isang average na bayad na malapit sa presyo ng laro. Ang isang tinatayang kaalaman sa halaga ng laro ν ay maaaring makuha mula sa isang simpleng pagsusuri ng matrix at ang pagpapasiya ng mas mababang (α) at \u200b\u200bitaas (β) na mga presyo ng laro. Kung malapit ang α at β, halos hindi na kailangang maghanap para sa isang eksaktong solusyon, ngunit magiging sapat na upang pumili ng mga dalisay na diskarte sa minimax. Sa mga kaso kung saan ang α at β ay hindi malapit, makakakuha kami ng isang praktikal na solusyon gamit ang mga de-numerong pamamaraan para sa paglutas ng mga laro, mula sa kung saan namin maikli ang pag-highlight ng paraan ng pag-ulit.

Ang ideya sa likod ng pamamaraan ng pag-iiba ay ang mga sumusunod. Ang isang "naisip na eksperimento" ay nilalaro kung saan ginagamit ng mga kalaban A at B ang kanilang mga diskarte laban sa bawat isa. Ang eksperimento ay binubuo ng isang pagkakasunud-sunod ng mga elementong laro, ang bawat isa ay mayroong matrix ng isang naibigay na laro. Nagsisimula ito sa katotohanan na kami (player A) ay pumili ng isang arbitraryo na isa sa aming mga diskarte, halimbawa A i. Tumugon ang kaaway dito sa kanyang diskarte B j, na hindi bababa sa kapaki-pakinabang para sa atin, i.e. lumiliko ang kabayaran para sa diskarte A i sa isang minimum. Tumugon kami sa paglipat na ito gamit ang aming diskarte А k, na nagbibigay ng maximum na average na kabayaran kapag ang kalaban ay gumagamit ng diskarte B j. Karagdagan - ang pagliko ng kaaway muli. Tumugon siya sa aming pares ng mga gumagalaw A i at A k sa kanyang diskarte B j, na nagbibigay sa amin ng pinakamaliit na average na kabayaran para sa dalawang diskarte na ito (A i, A k), at iba pa. Sa bawat hakbang ng proseso ng pag-iiba, ang bawat manlalaro ay tumugon sa anumang paglipat ng iba pang manlalaro na may kanyang diskarte na pinakamainam na kamag-anak sa lahat ng kanyang nakaraang mga paggalaw, na itinuturing bilang ilang uri ng halo-halong diskarte, kung saan ang mga dalisay na estratehiya ay iniharap sa mga proporsyon na naaayon sa dalas ng kanilang aplikasyon.

Ang pamamaraang ito ay, tulad nito, isang modelo ng tunay na praktikal na "pagsasanay" ng mga manlalaro, kapag ang bawat isa sa kanila ay sumusuri sa pag-uugali ng kalaban sa pamamagitan ng karanasan at sinusubukan upang tumugon dito sa paraang kapaki-pakinabang para sa kanyang sarili. Kung ang imitasyong ito sa proseso ng pag-aaral ay patuloy na matagal, kung gayon ang average na kabayaran sa bawat isang pares ng mga gumagalaw (elementarya) ay may posibilidad na ang presyo ng laro, at ang mga frequency p 1 ... p m; q 1 ... q n, na kinakaharap ng mga diskarte ng mga manlalaro sa rally na ito, ay lalapit sa mga dalas na matukoy ang pinakamainam na mga diskarte. Ang mga pagkalkula ay nagpapakita na ang pag-uugnay ng pamamaraan ay napakabagal, ngunit hindi ito isang balakid para sa mga makina ng pagkalkula ng high-speed.

Isalarawan natin ang aplikasyon ng pamamaga ng pamamaga gamit ang halimbawa ng larong 3 × 3 na lutasin sa Halimbawa 2 ng nakaraang seksyon. Ang laro ay ibinigay ng matrix:

Ipinapakita ng talahanayan 6.1 ang unang 18 mga hakbang ng proseso ng iterative. Ang unang haligi ay naglalaman ng bilang ng elementong laro (isang pares ng mga gumagalaw) n; sa pangalawa - bilang ako ang napiling diskarte ng player A; sa susunod na tatlo - "naipon na panalo" para sa una n mga laro na may mga diskarte sa kaaway B 1, B 2, B 3. Ang pinakamaliit sa mga halagang ito ay may salungguhit. Susunod na darating ang bilang j ang diskarte na pinili ng kaaway, at, nang naaayon, ang naipon na pakinabang para sa n mga laro na may mga diskarte A 1, A 2, A 3 ng mga halagang ito, ang maximum ay may salungguhit mula sa itaas. Ang mga may salungguhit na halaga ay tumutukoy sa pagpili ng diskarte sa pagtugon ng iba pang player. Ang sumusunod na mga graph sunud-sunod na nagpapakita: ang minimum na average na payoff ν, katumbas ng minimum na naipon na kabayaran na nahahati sa bilang ng mga laro n; maximum na average winnings na katumbas ng maximum na naipon na panalo na hinati ng n, at ang kanilang aritmetika ay nangangahulugan na ν * \u003d (ν +) / 2. Kapag tumataas n lahat ng tatlong dami ng ν, at ν * ay lalapit sa presyo ng laro ν, ngunit ang halaga ν * ay natural na lapitan ito nang medyo mas mabilis.

Talahanayan 6.1.

Tulad ng nakikita mo mula sa halimbawa, ang pagsasama-sama ng mga iterasyon ay napakabagal, ngunit gayunpaman, kahit na ang isang maliit na pagkalkula ay posible upang makahanap ng isang tinatayang halaga ng presyo ng laro at ihayag ang paglaganap ng mga "kapaki-pakinabang" na mga diskarte. Kapag gumagamit ng mga pagkalkula ng mga makina, ang halaga ng pamamaraan ay tumaas nang malaki. Ang bentahe ng pamamaga ng iterative para sa paglutas ng mga laro ay ang dami at pagiging kumplikado ng mga pagkalkula ay nadaragdagan nang mahina habang tumataas ang bilang ng mga diskarte. m at n.

§ 7. Mga pamamaraan para sa paglutas ng ilang mga walang katapusang laro

Ang isang walang katapusang laro ay isang laro kung saan hindi bababa sa isang panig ay may isang walang katapusang bilang ng mga diskarte. Ang mga pangkalahatang pamamaraan para sa paglutas ng nasabing mga laro ay hindi pa sapat na binuo. Gayunpaman, para sa pagsasanay, ang ilang mga espesyal na kaso ay maaaring maging interesado, na umamin sa isang medyo simpleng solusyon. Isaalang-alang ang laro ng dalawang kalaban A at B, ang bawat isa ay mayroong isang walang hanggan (hindi mabilang) na hanay ng mga diskarte; ang mga diskarte na ito para sa manlalaro A tumutugma sa magkakaibang kahulugan patuloy na pagbabago ng parameter x, at para sa В - parameter sa... Sa kasong ito, sa halip na matris ‖a ij ‖, ang laro ay tinukoy ng ilang pag-andar ng dalawang patuloy na magkakaibang mga argumento isang (x, y), na tatawagin namin ang payoff function (tandaan na ang pagpapaandar mismo isang (x, y) hindi kailangang maging tuluy-tuloy). Win function isang (x, y) maaaring kinakatawan geometrically ng ilang mga ibabaw isang (x, y) sa lugar ng pagbabago ng mga argumento (x, y) (fig. 7.1)

Pagtatasa ng payoff function isang (x, y) ay ginanap sa katulad na pagsusuri ng pagbabayad ng matrix. Una, ang mas mababang presyo ng laro α ay matatagpuan; para dito natutukoy para sa bawat isa x minimum na pag-andar isang (x, y) para sa lahat sa:, pagkatapos ay ang maximum ng mga halagang ito ay hinanap para sa lahat x (maximin):

Ang itaas na presyo ng laro (minimax) ay natutukoy sa parehong paraan:

Isaalang-alang ang kaso kapag α \u003d β. Dahil ang presyo ng laro ν ay palaging sa pagitan ng α at β, ang kanilang kabuuang halaga ay ν. Ang pagkakapantay-pantay α \u003d β ay nangangahulugang ang ibabaw isang (x, y) ay may isang saddle point, i.e., isang punto sa mga coordinate x 0, y 0, kung saan isang (x, y) sabay-sabay minimal sa sa at maximum x (fig. 7.2).

Halaga isang (x, y) sa puntong ito ay ang presyo ng laro ν: ν \u003d isang (x 0, y 0). Ang pagkakaroon ng isang punong puntong nangangahulugan na ang walang katapusang larong ito ay may purong solusyon sa diskarte; x 0, y 0 kumakatawan sa pinakamainam na dalisay na estratehiya A at B. Sa pangkalahatang kaso, kapag α ≠ β, ang laro ay maaaring magkaroon ng solusyon lamang sa larangan ng pinaghalong mga diskarte (marahil hindi lamang ang isa). Ang halo-halong diskarte para sa walang katapusang mga laro mayroong ilang posibilidad na pamamahagi para sa mga diskarte x at saitinuturing bilang random variable. Ang pamamahagi na ito ay maaaring maging tuluy-tuloy at natutukoy ng mga density f 1 (x) at f 2 (y); maaaring maging discrete, kung saan ang pinakamainam na mga diskarte ay binubuo ng isang hanay ng mga hiwalay na dalisay na diskarte na pinili kasama ng ilang mga nonzero probabilidad.

Sa kaso kung saan ang walang katapusang laro ay walang saddle point, maaaring mabigyan ng isang visual na geometric na interpretasyon ng mas mababa at itaas na mga presyo ng laro. Isaalang-alang ang isang walang hanggan laro na may isang payoff function isang (x, y)at mga diskarte x, ypagpupuno ng patuloy na mga segment ng linya (x 1, x 2) at (y 1, y 2)... Upang matukoy ang mas mababang presyo ng laro α, kailangan mong "tumingin" sa ibabaw isang (x, y) mula sa axis sa, i.e. isulong ito sa isang eroplano xOa (fig. 7.3). Nakakakuha kami ng isang tiyak na pigura na nakatali mula sa mga gilid ng mga tuwid na linya x \u003d x 1 at x \u003d x 2, at mula sa itaas at ibaba ng mga kurbada K B at K N. Ang mas mababang presyo ng laro α, malinaw naman, ay walang higit pa sa maximum na ordenansa ng curve K N.

Katulad nito, upang mahanap ang itaas na presyo ng laro β, ang isa ay dapat na "tumingin" sa ibabaw isang (x, y) mula sa axis x (ibabaw ng proyekto papunta sa eroplano yoa) at hanapin ang minimum na ordinate ng itaas na hangganan K Sa projection (Fig, 7.4).

Isaalang-alang ang dalawang pangunahing halimbawa ng mga walang katapusang laro.

Halimbawa 1. Ang mga manlalaro A at B bawat isa ay may isang hindi mabilang na hanay ng mga posibleng diskarte xat sa, at 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Ang pagpapaandar ng payoff para sa isang ay ibinigay sa pamamagitan ng expression a (x, y) - (x - y) 2. Maghanap ng isang solusyon sa laro.

Ang solusyon, ang Surface a (x, y) ay isang parabolic cylinder (Fig. 7.5) at walang point sad. Alamin ang mas mababang presyo ng laro; halata sa lahat x; samakatuwid \u003d 0. Tukuyin natin ang itaas na presyo ng laro. Para sa mga ito, nakita namin para sa isang nakapirming sa

Sa kasong ito, ang maximum ay palaging naabot sa hangganan ng agwat (sa x \u003d 0 o x \u003d 1), i.e. ito ay katumbas ng mga halaga sa 2; (1 - y) 2, na kung saan ay mas malaki. Iguhit natin ang mga graph ng mga pagpapaandar na ito (Fig. 7.6), i.e. projection sa ibabaw isang (x, y) sa eroplano yoa... Ang naka-bold na linya sa Fig. Ipinapakita ng 7.6 ang pag-andar. Malinaw, ang pinakamababang halaga nito ay naabot sa y \u003d 1/2 at katumbas ng 1/4. Samakatuwid, ang pinakamataas na presyo ng laro ay β \u003d 1/4. Sa kasong ito, ang pang-itaas na presyo ng laro ay nagkakasabay sa presyo ng laro ν. Sa katunayan, ang player A ay maaaring mag-aplay ng isang halo-halong diskarte S A \u003d , kung saan ang mga matinding halaga x \u003d 0 at x \u003d 1 ay pumasok sa magkatulad na mga dalas; pagkatapos para sa anumang diskarte ng manlalaro B ang average na pagbabayad ng player A ay magiging katumbas ng: ½y 2 + ½ (1 - y) 2. Madaling i-verify na ang halagang ito para sa anumang mga halaga sa sa pagitan ng 0 at 1 ay may halaga na hindi mas mababa sa ¼: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Kaya, ang player A sa pamamagitan ng paggamit ng halo-halong diskarte na ito ay maaaring garantiya sa kanyang sarili ng isang kabayaran na katumbas ng itaas na presyo ng laro; dahil ang presyo ng laro ay hindi maaaring higit pa sa itaas na presyo, kung gayon ang diskarte na ito S Isang optimal: S A \u003d S A *.

Ito ay nananatiling upang mahanap ang pinakamainam na diskarte ng player B. Malinaw, kung ang presyo ng laro ν ay katumbas ng pinakamataas na presyo ng laro β, kung gayon ang pinakamainam na diskarte ng player B ay palaging ang kanyang dalisay na diskarte sa minimax, na ginagarantiyahan sa kanya ang itaas na presyo ng laro. Sa kasong ito, ang ganitong diskarte ay y 0 \u003d ½. Sa katunayan, sa diskarte na ito, kahit na ano ang gawin ng player A, ang kanyang kabayaran ay hindi magiging mas malaki kaysa sa ¼. Sinusundan ito mula sa halata na hindi pagkakapareho (x - ½) 2 \u003d x (x –1) + ¼ ≤ ¼

Halimbawa 2. Ang Side A ("kami") ay nagpaputok sa sasakyang panghimpapawid ng kaaway B. Upang maiwasan ang pag-shelling, ang kaaway ay maaaring mapaglalangan ng ilang labis na karga sa, kung saan siya, sa kanyang pagpapasya, ay maaaring maglakip ng mga halaga mula sa sa \u003d 0 (tuwid na paggalaw) sa sa = sa max (paglipad sa isang bilog na pinakamataas na kurbada). Ipinapalagay namin sa max yunit ng pagsukat, i.e. ilagay sa max \u003d 1. Sa paglaban sa kaaway, maaari naming gamitin ang mga aparato ng paningin batay sa isa o isa pang hypothesis tungkol sa paggalaw ng target sa panahon ng paglipad ng projectile. Sobrang karga x sa ganitong pagmamaniobra ng hypothetical, maaari itong ipagpalagay na maging pantay sa anumang halaga mula 0 hanggang 1. Ang aming gawain ay pindutin ang kaaway; ang gawain ng kaaway ay upang manatiling hindi maapektuhan. Ang posibilidad ng hit ng data x at sa ay tinatayang ipinahayag ng pormula: a (x, y) \u003d , Saan sa - Sobra na inilapat ng kaaway; x - labis na karga, isinasaalang-alang sa paningin. Kinakailangan upang matukoy ang pinakamainam na diskarte ng parehong partido.

Desisyon. Malinaw, ang solusyon ng laro ay hindi nagbabago kung nagtakda tayo ng p \u003d 1. Ang pagpapaandar ng payoff isang (x, y) na inilalarawan ng ibabaw na ipinakita sa Fig. 7.7.

Ito ay isang cylindrical na ibabaw na ang mga generatrice ay kahanay sa bisector ng anggulo ng coordinate hoy, at ang seksyon ng isang eroplano na patayo sa generatrix ay isang curve ng uri ng isang normal na curve ng pamamahagi. Gamit ang geometric na interpretasyon ng mas mababa at itaas na mga presyo ng laro na iminungkahi sa itaas, nahanap namin ang β \u003d 1 (Larawan 7.8) at (Larawan 7.9). Ang laro ay walang point saddle; ang solusyon ay dapat hinahangad sa lugar ng mga halo-halong mga diskarte. Ang problema ay medyo katulad ng problema sa nakaraang halimbawa. Sa katunayan, para sa maliit na halaga k ang function ay kumikilos tulad ng isang function - (x - y) 2, at malulutas ang laro kung ang mga tungkulin ng mga manlalaro A at B ay nabago sa solusyon ng nakaraang halimbawa; mga. ang aming pinakamainam na diskarte ay ang dalisay na diskarte x \u003d 1/2, at ang pinakamainam na diskarte ng kalaban SB \u003d ay ilalapat ang matinding diskarte y \u003d 0 at y \u003d 1 na may parehong mga frequency.Ito ay nangangahulugan na sa lahat ng mga kaso dapat nating gamitin ang crosshair, dinisenyo para sa isang labis na karga x \u003d 1/2, at ang kaaway ay hindi dapat gumamit ng isang mapaglalangan sa kalahati ng lahat ng mga kaso, at sa kalahati - ang maximum na posibleng maneuver.

Fig. 7.8 Fig. 7.9.

Madaling patunayan na ang solusyon na ito ay magiging wasto para sa mga halaga k ≤ 2. Sa katunayan, ang average na kabayaran para sa diskarte ng kalaban S B \u003d at para sa aming diskarte x ipinahayag ng pagpapaandar , na para sa mga halaga k ≤ 2 ay may isang maximum sa х \u003d 1/2, katumbas ng mas mababang presyo ng laro α. Samakatuwid, ang application ng diskarte S B ginagarantiyahan ang kalaban ng isang pagkawala na hindi lalampas sa α, kung saan malinaw na ang α - ang mas mababang presyo ng laro - ay ang presyo ng laro ν.

Para sa k\u003e 2, ang pagpapaandar ng isang (x) ay may dalawang maxima (Fig. 7.10), na matatagpuan symmetrically na may paggalang sa x \u003d 1/2 sa mga puntong x 0 at 1 - x 0, at ang halaga ng x 0 ay nakasalalay sa k.

Malinaw, para sa k \u003d 2 x 0 \u003d 1 - x 0 \u003d ½; kapag tumataas k puntos x 0 at 1 - x 0 na lumipat, papalapit sa mga matinding puntos (0 at 1). Samakatuwid, ang desisyon ng laro ay depende sa k. Itakda natin ang isang tukoy na halaga para sa k, halimbawa k \u003d 3, at makahanap ng solusyon sa laro; para dito tinukoy namin ang abscissa x 0 ng maximum ng curve a (x). Paghahambing sa zero ang derivative ng function a (x), nagsusulat kami ng isang equation upang matukoy ang x 0:

Ang equation na ito ay may tatlong mga ugat: x \u003d 1/2 (kung saan naabot ang minimum) at x 0, 1 - x 0, kung saan naabot ang maximum. Paglutas ng equation nang ayon sa bilang, nahanap namin ang humigit-kumulang na x 0 ≈ 0.07; 1 - x 0 ≈ 0.93.

Patunayan natin na ang solusyon sa laro sa kasong ito ay ang mga sumusunod na pares ng mga diskarte:

Sa aming diskarte at diskarte ng kalaban sa ang average payoff ay

Hanapin ang minimum ng isang 1 (y) sa 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Pagtatakda ng y \u003d 1/2, nakukuha namin

na higit pa sa isang 1 (0); samakatuwid, ang presyo ng laro ay hindi mas mababa sa isang 1 (0):

Ngayon sabihin natin na ginagamit ng kalaban ang estratehiya S B *, at ginagamit namin ang diskarte x. Pagkatapos ang average payoff ay

Ngunit pinili namin ang x 0 tumpak upang sa x \u003d x 0 ang maximum ng pagpapahayag (7.2) ay naabot; kaya,

mga. ang kalaban, gamit ang diskarte na S B *, ay maaaring maiwasan ang pagkawala ng mas malaki kaysa sa 0.530; samakatuwid, ang ν \u003d 0.530 ay ang presyo ng laro, at ang mga diskarte na S A * at S B * ay nagbibigay ng solusyon. Nangangahulugan ito na dapat nating gamitin ang mga tanawin na may x \u003d 0.07 at x \u003d 0.93 na may parehong dalas, at ang kaaway ay hindi dapat mapaglalangan na may parehong dalas at mapaglalangan na may maximum na labis na karga.

Tandaan na ang payoff ν \u003d 0.530 ay kapansin-pansin na mas malaki kaysa sa mas mababang presyo ng laro , na maibigay namin sa aming sarili sa pamamagitan ng paglalapat ng aming pinakamataas na diskarte x 0 \u003d 1/2.

Isa sa praktikal na paraan ang paglutas ng mga walang katapusang laro ay ang kanilang tinatayang pagbawas sa mga hangganan. Sa kasong ito, ang isang buong hanay ng mga posibleng mga diskarte para sa bawat manlalaro ay kombinasyon ng kombinasyon sa isang diskarte. Sa ganitong paraan, siyempre, isang tinatayang solusyon lamang sa laro ang maaaring makuha, ngunit sa karamihan ng mga kaso ay hindi kinakailangan ang isang eksaktong solusyon.

Gayunpaman, dapat tandaan na kapag inilalapat ang diskarteng ito, ang mga solusyon sa larangan ng halo-halong mga diskarte ay maaaring lumitaw kahit na sa mga kaso kung ang solusyon ng orihinal na walang hanggan na laro ay posible sa mga dalisay na estratehiya, i.e. kapag ang walang hanggan laro ay may puntong punla. Kung, sa pamamagitan ng pagbabawas ng isang walang hanggan na laro sa isang may hangganan, nakuha ang isang halo-halong solusyon, na kasama ang dalawang katabing "kapaki-pakinabang" na mga diskarte, pagkatapos ay makatuwiran na subukan na mag-aplay ng isang namamagitan na dalisay na diskarte ng orihinal na walang katapusan na laro sa pagitan nila.

Sa konklusyon, napapansin natin na ang walang katapusan na mga laro, hindi katulad ng mga hangganan, ay maaaring walang solusyon. Bigyan tayo ng isang halimbawa ng isang walang katapusang laro na walang solusyon. Dalawang mga manlalaro ang pinangalanan ang bawat integer. Pinangalanan higit pa natatanggap mula sa iba pang 1 ruble. Kung ang parehong tumawag ng parehong numero, ang laro ay nagtatapos sa isang mabubunot. Ang laro ay malinaw na walang solusyon. Gayunpaman, may mga klase ng mga walang hanggan na laro kung saan tiyak na umiiral ang isang solusyon.

Ang halo-halong diskarte SA ng manlalaro A ay ang aplikasyon ng mga purong diskarte A1, A2, ..., Am na may mga probabilidad p1, p2, ..., pi, ..., pm at ang kabuuan ng mga probabilidad ay katumbas ng 1: Ang pinaghalong mga diskarte ng player A ay nakasulat sa anyo ng isang matris o bilang isang string SA \u003d (p1, p2, ..., pi, ..., pm) Katulad nito, ang halo-halong mga diskarte ng player B ay ipinapahiwatig ng :, o, SB \u003d (q1, q2, ..., qi, ..., qn ), kung saan ang kabuuan ng mga posibilidad ng paglitaw ng mga estratehiya ay katumbas ng 1: Ang mga dalisay na estratehiya ay maaaring isaalang-alang ng isang espesyal na kaso ng mga halo-halong at bibigyan ng isang string kung saan ang 1 ay tumutugma sa isang purong diskarte. Batay sa prinsipyong minimax, ang pinakamainam na solusyon (o solusyon) ng laro ay natutukoy: ito ay isang pares ng mga pinakamainam na diskarte S * A, S * B sa pangkalahatang kaso, halo-halong, pagkakaroon sumusunod na pag-aari: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na diskarte, kung gayon hindi ito maaaring maging kapaki-pakinabang para sa iba pang lumihis mula sa kanyang sarili. Ang payoff na naaayon sa pinakamainam na solusyon ay tinatawag na gastos ng laro v. Ang presyo ng laro ay nasiyahan sa hindi pagkakapareho:? ? v? ? (3.5) saan? at? - ibaba at nangungunang mga presyo mga laro. Ang sumusunod na pangunahing teorema ng teorya ng laro ay totoo - teorema ni Neumann. Ang bawat laro sa pagtatapos ay may hindi bababa sa isang pinakamainam na solusyon, marahil kasama ng mga halo-halong mga diskarte. Hayaan ang S * A \u003d (p * 1, p * 2, ..., p * i, ..., p * m) at S * B \u003d (q * 1, q * 2, ..., q * ako, ..., q * n) ay isang pares ng mga pinakamainam na diskarte. Kung ang isang dalisay na diskarte ay kasama sa pinakamainam na halo-halong diskarte na may isang probabilidad na nonzero, pagkatapos ito ay tinatawag na aktibo. Ang teorya sa mga aktibong estratehiya ay may bisa: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte, kung gayon ang kabayaran ay nananatiling hindi nagbabago at katumbas ng presyo ng laro v, kung ang pangalawang manlalaro ay hindi lalampas sa mga limitasyon ng kanyang aktibong mga diskarte. Ang teorema na ito ay napakahusay na praktikal na kahalagahan - nagbibigay ito ng mga tukoy na modelo para sa paghahanap ng pinakamainam na mga diskarte sa kawalan ng isang punong saddle. Isaalang-alang ang isang 2 × 2 na laro, na kung saan ay ang pinakasimpleng kaso ng isang may hangganang laro. Kung ang ganitong laro ay may isang saddle point, kung gayon ang pinakamainam na solusyon ay isang pares ng mga dalisay na diskarte na naaayon sa puntong ito. Ang isang laro nang walang saddle point, alinsunod sa pangunahing teorya ng teorya ng laro, ang isang pinakamainam na solusyon ay umiiral at natutukoy ng isang pares ng mga halo-halong mga diskarte S * A \u003d (p * 1, p * 2) at S * B \u003d (q * 1, q * 2) ... Upang mahanap ang mga ito, gagamitin namin ang teorama sa mga aktibong diskarte. Kung ang manlalaro ay sumunod sa kanyang pinakamainam na diskarte S "A, kung gayon ang kanyang average na kabayaran ay magiging katumbas ng presyo ng laro v, kahit na ano ang aktibong estratehiya ng gumagamit ng B. Para sa isang 2 × 2 na laro, ang anumang dalisay na diskarte ng kalaban ay aktibo kung walang point saddle. Ang bayad ng player A (pagkawala ng player B) - random na halaga, ang pag-asa sa matematika (ibig sabihin) na kung saan ay ang presyo ng laro. Samakatuwid, ang average na kabayaran ng manlalaro А (pinakamainam na diskarte) ay magiging katumbas sa v para sa kapwa sa 1st at 2nd strategies ng kalaban. Hayaan ang laro na ibigay ng payoff matrix.Ang average na kabayaran ng player A kung gumagamit siya ng pinakamainam na halo-halong diskarte, at ang player B ay gumagamit ng purong diskarte B1 (tumutugma ito sa 1st haligi ng payoff matrix P), ay katumbas ng presyo ng laro v: a11 p * 1 + a21 p * 2 \u003d v. Ang Player A ay makakakuha ng parehong average na kabayaran kung ang ika-2 na manlalaro ay nalalapat ang diskarte B2, i.e. a12 p * 1 + a22 p * 2 \u003d v. Isinasaalang-alang na ang p * 1 + p * 2 \u003d 1, nakakakuha kami ng isang sistema ng mga equation para sa pagtukoy ng pinakamainam na diskarte S "A at ang presyo ng laro v: (3.6) Ang paglutas ng sistemang ito, nakuha namin ang pinakamainam na diskarte (3.7) at ang presyo ng laro (3.8) Paglalapat ng teorema tungkol sa aktibong mga diskarte sa paghahanap ng SB * - ang pinakamainam na diskarte ng player B, nakuha namin na para sa anumang dalisay na diskarte ng player A (A1 o A2), ang average na pagkawala ng player B ay katumbas ng presyo ng laro v, i.e. (3.9) Kung gayon ang pinakamainam na diskarte ay natutukoy ng mga formula: (3.10) )

"Malinis" na mga diskarte

Kami ay pamilyar sa mga jambs. Gayunpaman, ano ang mangyayari kung ang mga jambs ay tinanggal mula sa kadena ng anumang diskarte? Makakakuha kami ng isang "malinis na diskarte". Ang mga purong estratehiya ay ang nasa kadena ng mga aksyon na kung saan, mula sa pinakadulo ugat hanggang sa produktibong bahagi, walang mabisang mga sub-estratehiya (jambs), at ito ay madalas na maipapatunayan lamang sa pagkakaroon ng lahat ng mga link sa isip.

Siyempre, mula sa punto ng view ng lahat ng posibleng mga resulta ng paglalapat ng diskarte, mahirap para sa amin na pag-usapan ang pinaka-pinaka-epektibo, dahil maaaring hindi lang tayo magkaroon ng isang tiyak na karanasan, at samakatuwid ay may ilang mga intermediate na estratehiya, ngunit mula sa aming karanasan na ang diskarte ay dapat na kasing epektibo hangga't maaari.

Ang konsepto ng mga dalisay na estratehiya ay isa rin sa mga pangunahing susi sa mga materyales na ito, kaya bibigyan ako ng isang halimbawa:

Gabi na. Nagmamadali kang umuwi sa lugar ng iyong tahanan. Tumatakbo ang gatas. Lumilipad na lumipas ang "kahina-hinalang uri ng ilan, maraming" naririnig mo sa iyong address "Hoy, ikaw, [pinutol ng censorship]. Huwag pumunta dito, ang ulo ay niyebe! "

Ano ang gagawin mo? Maaaring magkaroon ng maraming mga pagpipilian. Ang isang tao ay pupunta upang pag-uri-uriin ang mga bagay, ang isang tao ay matakot at mapabilis ang kanilang tulin, ang isang tao ay sumigaw ng isang bagay sa likod. Gayunpaman, pag-isipan natin kung ano ang purong diskarte ng pag-uugali sa kasong ito?

Isang estranghero ang sumisigaw ng isang bagay sa iyo sa kalye. Mayroon kang sariling negosyo, kung saan ka talaga pupunta. Ang paghusga sa pamamagitan ng teksto, ang mga positibong benepisyo para sa iyo mula sa pakikipag-usap sa taong ito ay malamang na hindi. Ang lohikal na konklusyon: mahinahon magpatuloy tungkol sa iyong negosyo. Inilalagay ko ang iyong pansin sa katotohanan na ito ay "kalmado", walang anino negatibong emosyon, ngunit may isang malusog na kawalang-interes sa nangyayari. Gaano karaming mga tao na gawin iyon? Akala ko ang labis na minorya. Bakit?

Sapagkat ang karamihan sa mga tao ay may isang buong layer ng hindi malay na mga diskarte na nakatali sa mas mababang mga layer upang mapanatili ang sarili, lalo na, ito ay maaaring: "Laging tumugon sa kalokohan na may kalokohan", "Kung may nagsabi ng mga bastos na bagay, dapat tayong tumakbo", "Kung may isang tao ay bastos - kailangan mong punan ang kanyang mukha "," Kung ang isang tao ay bastos, pagkatapos ay mayroong panganib ", at ang katulad sa iba't ibang mga pagkakaiba-iba. Siyempre, hindi lahat ay kukuha ng ilang uri ng aktibong aksyon, ngunit emosyonal na makakaapekto ito sa halos lahat. At ito ay isang cant.

Ang mga purong estratehiya ay palaging emosyonal o positibo, at ito ay likas sa iyong utak, kailangan mo lamang itong gamitin.

Maaari kang magbasa ng kaunti tungkol sa mga purong estratehiya sa mga tala na "Bakit ang mga purong diskarte?" at House, Hopkins, atbp.

Mula sa aklat na Mga Estratehiya ng henyo. Albert Einstein may akda na si Dilts Robert

Mga Estratehiya 1. Kahulugan ng salitang "diskarte": a) Nagmula sa salitang Greek na "estratehiko", nangangahulugang: "pinuno ng militar", "science, art of warfare", "sining ng pamumuno ng panlipunang, pampulitikang pakikibaka." B) Isang detalyadong plano para sa pagkamit ng isang layunin o kumikita

Mula sa librong Strategies of Geniuses (Aristotle Sherlock Holmes Walt Disney Wolfgang Amadeus Mozart) may akda na si Dilts Robert

Mula sa librong Alam mo bang mag-aral nang mabuti ?! Kapaki-pakinabang na libro para sa mga nag-iingat na mag-aaral ang may-akda na Karpov Alexey

Mga istatistika Ang iyong pag-aaral ay pupunta sa isang ganap na magkakaibang antas ng kalidad kung sa tingin mo at pumili ng isang diskarte ng pagkilos.Astratehiya ang pangkalahatang plano. Ito ang pangkalahatang linya na ibinigay totoong mga kondisyon... Ito ang mga layunin, mga deadline, isinasaalang-alang ang hindi pagkakatatag at pagkakaiba-iba ... Ito ang mismong pakiramdam ng pulso

Mula sa librong Estratehiya ng Isip at Tagumpay may akda Antipov Anatoly

Mula sa librong Emotional Intelligence ni Goleman Daniel

Coefficient pag-unlad ng kaisipan at emosyonal na pag-iisip: Ang mga purong uri ng IQ at emosyonal na katalinuhan ay hindi tutol, ngunit sa halip hiwalay na mga kompetensya. Pinagsasama namin ang lahat ng katalinuhan na may katalinuhan ng karanasan; mga taong may mataas

Mula sa isang libro ng 12 paniniwala ng Kristiyano na maaaring magawa kang mabaliw ni Townsend John

Tamang mga hangarin o Purong Mga Kaisipan Ang tamang hangarin ay isang desisyon na gawin ang tamang bagay. Pumipili tayo ng isang mabuting gawa na nakalulugod sa Diyos, kadalasan nang hindi iniisip kung gusto ba nating gawin ito. Ginagawa lang namin ito at iyon na. Maraming mangangaral ng ebanghelista

Mula sa aklat na Paparating sa Buhay: Isang Koleksyon may akda hindi kilalang may-akda

Si Rudolf Ivanovich ABEL: "TANGGAP NA AS DZERZHINSKY SAID:" CLEAN HANDS, COLD HEAD AND HOT HEART ... "Si Rudolf Ivanovich Abel ay nakatuon ng higit sa tatlumpung taon upang gumana sa katalinuhan ng Sobyet. Siya ay iginawad sa Order ni Lenin, dalawang Orden ng Red Banner, ang Order of Labor

Mula sa libro Homo sapiens 2.0 [Homo sapiens 2.0 http://hs2.me] ni Sapiens Homo

Diskarte

Mula sa librong Homo Sapiens 2.0 ni Sapiens 2.0 Homo

"Malinis" na mga diskarte Kami ay pamilyar sa mga jambs. Gayunpaman, ano ang mangyayari kung ang mga jambs ay tinanggal mula sa kadena ng anumang diskarte? Makakakuha kami ng isang "malinis na diskarte". Ang mga purong diskarte ay ang mga nasa kadena ng mga aksyon kung saan, mula sa pinakadulo ugat hanggang sa epektibong bahagi, ay wala.

Mula sa aklat na Start. Punch takot sa mukha, itigil ang pagiging "normal" at gumawa ng isang bagay na sulit may-akda na si Aykaff John

Mula sa librong Man bilang isang hayop may akda Nikonov Alexander Petrovich

Mga Estratehiya Pangkalahatang konsepto ng mga estratehiya Sa prinsipyo, nauunawaan ng lahat ang isang antas o kung ano ang isang diskarte. Ang pagkakaroon ng isang tiyak na hanay ng kaalaman na nakuha bilang isang resulta ng pagkakaroon at karanasan sa pagproseso, nagtatayo kami ng ilang mga modelo ng pag-uugali.Astratehiya ay isang modelo para sa pagkamit ng isang layunin.

Mula sa librong Lumiko ang Iyong Paggawa ng memorya sa Buong Kapangyarihan ni Elloway Tracy

Bakit Malinis na mga Diskarte? Ang bahagi ng leon ng materyal sa proyektong ito ay patuloy na tumuturo sa punto na kinakailangan na gumamit ng mga dalisay na estratehiya para sa muling pagsulat at siguraduhin na maghanap ng isang jamb batay sa kanila. Ang sandaling ito ay hindi halata sa unang tingin at

Mula sa librong Introvert in an Extroverted World may akda Romantseva Elizaveta

Mula sa libro ng may-akda

Mga Estratehiya Mga diskarte sa computer ay nangangailangan ng player upang mag-focus, planuhin ang kanilang mga aksyon at malutas ang iba't ibang mga problema. Ipinapahiwatig ng kamakailang pananaliksik na ang mga diskarte ay maaaring mapagbuti ang mga kasanayan ng nagbibigay-malay ng mga manlalaro ng lahat ng edad. Ayon kay

Mula sa libro ng may-akda

Mga purong uri Mayroong isang konsepto - "puro uri ng sikolohikal". Sa totoo lang, mayroong isang konsepto, ngunit walang praktikal na mga bagay, samakatuwid nga, ang mga tao ay angkop na angkop sa konseptong ito. Walang mga purebred introverts at hindi malabo extroverts. Bukod dito, sumang-ayon kami sa iyo

Ang pagpili ng isang manlalaro ng isang aksyon ay tinatawag lumipat... May mga galaw personal (sinasadya ng player na ito o desisyon na iyon) at random (ang kinalabasan ng laro ay hindi nakasalalay sa kalooban ng player). Ang hanay ng mga patakaran na tumutukoy kung aling ilipat ang kailangang gawin ng manlalaro ay tinatawag diskarte... Ang mga diskarte ay malinis (di-random na mga pagpapasya ng mga manlalaro) at magkakahalo (ang diskarte ay maaaring isaalang-alang bilang isang random variable).

Puntong malungkot

SA teorya ng laro S. t. ( elemento ng pamana) ang pinakamalaking elemento ng haligi mga laro matrice, na kung saan ay sabay-sabay na pinakamaliit na elemento ng kaukulang hilera (sa laro ng dalawang taong may zero sum). Sa puntong ito, samakatuwid, ang pinakamataas sa isang manlalaro ay katumbas ng minimax ng iba pa; S. t May isang punto punto ng balanse.

Minimax teorem

Ang diskarte na naaayon sa minimax ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ang pagpili ng pinaka "maingat" na maximin at minimax na mga diskarte ay tinatawag prinsipyo ng minimax... Ang prinsipyong ito ay sumusunod mula sa makatuwirang pag-aakalang hangarin ng bawat manlalaro upang makamit ang isang layunin na katapat ng kalaban.

Pinipili ng manlalaro ang kanyang mga aksyon, sa pag-aakalang ang kalaban ay kikilos sa isang hindi kanais-nais na pamamaraan, i.e. susubukan na "makasama".

Pagkawala ng pag-andar

Pagkawala ng pag-andar - isang function na sa teorya mga desisyon sa istatistika kinikilala ang pagkawala dahil sa hindi magandang pagpapasya batay sa sinusunod na data. Kung ang problema sa pagtantya ng parameter ng signal laban sa background ng ingay ay nalulutas, kung gayon ang pagkawala ng function ay isang sukatan ng pagkakaiba sa pagitan ng totoong kahulugan ang tinantyang parameter at pagtatantya ng parameter

Diskarte sa Pinakamahusay na Mixed Player ay isang kumpletong hanay ng mga aplikasyon ng kanyang dalisay na mga diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kondisyon na may ibinigay na mga posibilidad.

Ang halo-halong diskarte ng manlalaro ay isang kumpletong hanay ng aplikasyon ng kanyang dalisay na mga diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kondisyon na may ibinigay na mga posibilidad.

1. Kung ang lahat ng mga elemento ng isang hilera ay hindi mas malaki kaysa sa mga kaukulang elemento ng ibang hilera, kung gayon ang orihinal na hilera ay maaaring matanggal mula sa matrix ng pagbabayad. Gayundin para sa mga haligi.

2. Ang gastos ng laro ay natatangi.

Dok: sabihin natin na mayroong 2 mga presyo ng laro v at, na naabot sa isang pares at, ayon sa pagkakabanggit, kung gayon

3. Kung ang parehong numero ay idinagdag sa lahat ng mga elemento ng payoff matrix, kung gayon ang pinakamainam na halo-halong mga diskarte ay hindi magbabago, at ang presyo ng laro ay tataas ng bilang na ito.

Dok:
saan

4. Kung ang lahat ng mga elemento ng payoff matrix ay pinarami ng parehong numero ng nonzero, ang presyo ng laro ay paparami ng bilang na ito, at ang pinakamainam na mga diskarte ay hindi magbabago.

Choice ng Editor