Dalisay at pinaghalo diskarte. Puro mga laro sa diskarte

pangunahing / Quarreling

Kabilang sa mga walang hanggan na mga laro ng praktikal na kahalagahan, ang mga laro na may isang saddle point ay medyo bihira; mas tipikal ang kaso "kapag ang mas mababa at mataas na presyo ay magkakaiba. Sinusuri ang mga matrice ng naturang mga laro, napagpasyahan namin na kung ang bawat manlalaro ay bibigyan ng pagpipilian

isa - ang tanging diskarte., Kung gayon, pagbibilang sa isang makatwirang kumikilos na kalaban, ang pagpipiliang ito ay dapat na matukoy ng prinsipyo ng minimum. Sumusunod sa aming pinakamataas na diskarte, para sa anumang pag-uugali ng kaaway, sinasadya naming ginagarantiyahan ang aming sarili ng isang panalo na katumbas ng mas mababang presyo ng laro a. Lumitaw ang isang natural na katanungan: posible bang garantiya ang iyong sarili ng average na makakuha, mas malaki kaysa sa, kung hindi ka gumagamit ng isang solong "dalisay" na diskarte, ngunit kahalili sapalaran maraming diskarte?

Ang nasabing pinagsamang mga diskarte, na binubuo sa paglalapat ng maraming mga dalisay na diskarte alternating ayon sa isang random na batas na may isang tiyak na ratio ng dalas, ay tinatawag na magkahalong mga diskarte sa teorya ng laro.

Malinaw na, ang bawat dalisay na diskarte ay isang espesyal na kaso ng isang halo-halong isa, kung saan ang lahat ng mga diskarte, maliban sa isa, ay inilapat na may mga zero frequency, at ang isang ito - na may dalas na 1.

Ito ay lumabas na ang paggamit ng hindi lamang dalisay, ngunit din magkahalong diskarte, posible na makakuha ng isang solusyon para sa bawat may hangganang laro, ibig sabihin, isang pares ng naturang (pangkalahatang halo) na mga diskarte tulad na kapag ang parehong mga manlalaro ay inilalapat ang mga ito, ang kabayaran ay katumbas ng presyo ng laro, at para sa anumang panig na paglihis mula sa ang pinakamainam na diskarte, ang kabayaran ay maaari lamang magbago patungo, hindi pinahihintulutan para sa nalihis.

Ang pahayag sa itaas ay bumubuo sa nilalaman ng tinaguriang pangunahing teorya ng teorya ng laro. Ang teoryang ito ay unang napatunayan ni von Neumann noong 1928. Ang mga kilalang patunay ng teorama ay medyo kumplikado; samakatuwid, ipinapakita lamang namin ang pagbabalangkas nito.

Ang bawat end game ay mayroong kahit isang solusyon (posibleng sa lugar ng magkahalong diskarte).

Ang nakuha na nagreresulta mula sa isang desisyon ay tinatawag na gastos ng laro. Ipinapahiwatig ng pangunahing teorama na ang bawat may takda na laro ay may presyo. Malinaw na, ang presyo ng laro v ay laging namamalagi sa pagitan ng mas mababang presyo ng laro at ng mas mataas na presyo ng laro:

Sa katunayan, mayroong pinakamataas na garantisadong mga panalo na maaari naming ibigay ang aming sarili gamit ang aming purong diskarte lamang. Dahil ang halo-halong mga diskarte ay kasama, bilang isang espesyal na kaso, lahat ng dalisay, pagkatapos, pinapayagan, bilang karagdagan sa dalisay, halo-halong din

mga diskarte, tayo, sa anumang kaso, ay hindi nagpapalala ng aming mga kakayahan; Dahil dito,

Katulad nito, isinasaalang-alang ang mga kakayahan ng kalaban, ipapakita namin iyon

kung saan sumusunod ang napatunayan na hindi pagkakapantay-pantay (3.1).

Ipaalam sa amin ang isang espesyal na notasyon para sa magkahalong mga diskarte. Kung, halimbawa, ang aming halo-halong diskarte ay binubuo sa paglalapat ng mga diskarte sa AL, na may mga dalas na frequency ay isasaad namin ang diskarteng ito

Katulad nito, ang magkahalong diskarte ng kalaban ay maiuugnay sa pamamagitan ng:

nasaan ang mga dalas kung saan magkahalong mga diskarte

Ipagpalagay na nakakita kami ng isang solusyon sa larong binubuo ng dalawang pinakamainam na halo-halong diskarte S, S. Sa pangkalahatang kaso, hindi lahat ng mga purong diskarte na magagamit sa isang naibigay na manlalaro ay kasama sa kanyang pinakamainam na halo-halong diskarte, ngunit ilan lamang. Tatawagan namin ang mga diskarte na kasama sa pinakamainam na halo-halong diskarte ng manlalaro ng kanyang "kapaki-pakinabang" na mga diskarte.

Lumalabas na ang solusyon sa laro ay may isa pa kamangha-manghang pag-aari: kung ang isa sa mga manlalaro ay sumusunod sa kanyang pinakamainam na halo-halong diskarte 5 (5). pagkatapos ang kabayaran ay mananatiling hindi nagbabago at katumbas ng presyo ng larong v, anuman ang ginagawa ng ibang manlalaro, kung siya ay. huwag lamang lumampas sa kanilang "kapaki-pakinabang" na mga diskarte. Halimbawa, siya ay maaaring gumamit ng anuman sa kanyang "kapaki-pakinabang" na mga diskarte sa purong anyo, at maaari ring ihalo ang mga ito sa anumang proporsyon.

Patunayan natin ang pahayag na ito. Hayaan mayroong isang solusyon sa laro. Upang maging tiyak, ipalagay namin na ang pinakamainam na halo-halong diskarte ay binubuo ng isang halo ng tatlo

Ang mga "kapaki-pakinabang" na diskarte, ayon sa pagkakabanggit, ay binubuo ng isang halo ng tatlong mga "kapaki-pakinabang" na diskarte

bukod dito, iginiit na kung susundin natin ang diskarte sa S, kung gayon ang kaaway ay maaaring maglapat ng mga diskarte sa anumang proporsyon, at ang kita ay mananatiling hindi nababago at magiging pantay pa rin sa presyo ng laro

Bagaman nagtapos ako mula sa Faculty of Physics and Technology, hindi ako tinuro sa teorya ng laro sa pamantasan. Pero dahil papasok na ako taon ng mag-aaral Naglaro ako ng marami, una sa kagustuhan, at pagkatapos ay sa tulay, interesado ako sa teorya ng laro, at pinagkadalubhasaan ko ang isang maliit na aklat. At kamakailan lamang ay nalutas ng mambabasa ng site na Mikhail ang problema ng teorya ng laro. Napagtanto na ang gawain ay hindi ibinigay sa akin kaagad, nagpasya akong i-refresh ang aking kaalaman sa teorya ng laro sa aking memorya. Ipinakita ko sa iyo ang isang maliit na libro - isang tanyag na paglalahad ng mga elemento ng teorya ng laro at ilang mga pamamaraan ng paglutas ng mga larong matrix. Naglalaman ito ng halos walang katibayan at naglalarawan ng mga pangunahing punto ng teorya na may mga halimbawa. Ang libro ay isinulat ng dalub-agbilang at matematiko ng agham na si Elena Sergeevna Ventzel. Maraming henerasyon ng mga inhinyero ng Soviet ang nag-aral mula sa kanyang aklat na "Theory of Probability". Maraming naisulat din si Elena Sergeevna mga akdang pampanitikan sa ilalim ng sagisag na pangalan ng I. Grekov.

Elena Wentzel. Mga elemento ng teorya ng laro. - M.: Fizmatgiz, 1961 .-- 68 p.

Mag-download maikling buod sa format o

§ 1. Ang paksa ng teorya ng laro. Pangunahing konsepto

Kapag nalulutas ang isang bilang ng mga praktikal na problema (sa larangan ng ekonomiya, mga gawain sa militar, atbp.), Kinakailangan upang pag-aralan ang mga sitwasyon kung saan mayroong dalawa (o higit pa) na nakikipaglaban na mga partido na naghabol sa magkabilang mga layunin, at ang resulta ng bawat kaganapan ng isa sa ang mga partido ay nakasalalay sa kung anong kurso ng pagkilos ang pipiliin ng kaaway. Tatawagan namin ang mga nasabing sitwasyon na "sitwasyon ng pagkakasalungatan".

Mayroong maraming mga halimbawa ng mga sitwasyon ng salungatan mula sa iba't ibang mga lugar ng pagsasanay. Anumang sitwasyon na nagmumula sa kurso ng mga poot ay kabilang sa mga sitwasyon ng salungatan: ang bawat isa sa mga nakikipaglaban na partido ay kumukuha ng lahat ng mga hakbang na magagamit dito upang maiwasang makamit ng kalaban ang tagumpay. Ang mga sitwasyon ng hindi pagkakasundo ay nagsasama rin ng mga sitwasyong lumitaw kapag pumipili ng isang sistema ng sandata, mga pamamaraan ng paggamit nito sa pakikipaglaban at, sa pangkalahatan, kapag nagpaplano ng mga pagpapatakbo ng militar: ang bawat isa sa mga pagpapasya sa lugar na ito ay dapat gawin na may pagtingin sa mga aksyon ng kaaway na hindi gaanong kapaki-pakinabang tayo Ang isang bilang ng mga sitwasyon sa larangan ng ekonomiya (lalo na sa pagkakaroon ng malayang kumpetisyon) ay nabibilang sa mga sitwasyon ng salungatan; ang mga firm firm ay kumikilos bilang mga nakikipaglaban na partido, pang-industriya na negosyo atbp.

Ang pangangailangan na pag-aralan ang mga nasabing sitwasyon ay nagbigay ng isang espesyal na aparatong matematika. Ang teorya ng laro ay mahalagang hindi hihigit sa isang teorya ng matematika ng mga sitwasyon ng salungatan. Ang layunin ng teorya ay upang makabuo ng mga rekomendasyon para sa isang makatuwiran kurso ng aksyon para sa bawat isa sa mga kalaban sa kurso ng isang sitwasyon ng kontrahan. Ang bawat sitwasyon ng hidwaan na direktang kinuha mula sa pagsasanay ay napakahirap, at ang pag-aaral nito ay hadlangan ng pagkakaroon ng maraming mga kadahilanan na dumadalo. Upang gawing posible ang isang matematikal na pagtatasa ng sitwasyon, kinakailangang mag-abstract mula sa pangalawa, hindi sinasadyang mga kadahilanan at bumuo ng isang pinasimple, gawing pormal na modelo ng sitwasyon. Tatawagan namin ang modelong ito na "laro".

Ang laro ay naiiba mula sa isang tunay na sitwasyon ng hidwaan na ito ay isinasagawa ayon sa mahusay na natukoy na mga patakaran. Ang sangkatauhan ay matagal nang gumagamit ng naturang pormal na mga modelo ng mga sitwasyon ng kontrahan, na mga laro sa literal na kahulugan ng salita. Kasama sa mga halimbawa ang chess, checkers, card games, atbp. Ang lahat ng mga larong ito ay may katangian ng isang kumpetisyon na nagpapatuloy ayon sa mga kilalang panuntunan at nagtatapos sa isang "tagumpay" (makakuha) ng isa o ibang manlalaro.

Ang nasabing pormal na kinokontrol, artipisyal na organisadong mga laro ay kumakatawan sa pinaka angkop na materyal upang ilarawan at makabisado ang pangunahing mga konsepto ng teorya ng laro. Ang terminolohiya na hiniram mula sa pagsasagawa ng naturang mga laro ay ginagamit din sa pagtatasa ng iba pang mga sitwasyon ng salungatan: ang mga partido na nakikilahok sa kanila ay ayon sa kombensyon na tinukoy bilang "mga manlalaro", at ang resulta ng banggaan ay ang "panalo" ng isa sa mga partido .

Sa laro, ang mga interes ng dalawa o higit pang mga kalaban ay maaaring magkabanggaan; sa unang kaso, ang laro ay tinatawag na "doble", sa pangalawa - "maraming". Ang mga kalahok sa isang maramihang mga laro ay maaaring bumuo ng mga koalisyon - permanente o pansamantala. Sa pagkakaroon ng dalawang permanenteng koalisyon, ang maramihang mga laro ay nagiging isang pares. Ang mga pares na laro ay ang pinaka dakilang praktikal na kahalagahan; dito natin pipigilan ang ating sarili na isaalang-alang lamang ang mga nasabing laro.

Sinimulan namin ang aming pagtatanghal ng teoryang elementarya ng laro sa pagbubuo ng ilang pangunahing mga konsepto. Isasaalang-alang namin ang isang doble na laro kung saan lumahok ang dalawang manlalaro A at B na may kabaligtaran na interes. Sa pamamagitan ng "laro" nangangahulugan kami ng isang kaganapan na binubuo ng isang serye ng mga aksyon ng panig A at B. Upang ang laro ay mapailalim sa pagsusuri sa matematika, ang mga patakaran ng laro ay dapat na tumpak na binubuo. Sa pamamagitan ng "mga patakaran ng laro" ibig sabihin namin ang sistema ng mga kundisyon na kinokontrol ang mga posibleng pagpipilian para sa mga aksyon ng magkabilang panig, ang dami ng impormasyon na mayroon ang bawat panig tungkol sa pag-uugali ng iba pa, ang pagkakasunud-sunod ng mga alternatibong "paggalaw" (indibidwal na mga desisyon na ginawa sa panahon ng laro), pati na rin ang resulta o kinalabasan ng laro kung saan ang ibinigay na hanay ng mga gumagalaw. Ang resulta na ito (makakuha o pagkawala) ay hindi laging may isang dami ng pagpapahayag, ngunit kadalasan, sa pamamagitan ng pagtatakda ng isang tiyak na sukat ng pagsukat, maaari itong ipahayag ng isang tiyak na numero. Halimbawa, sa isang laro ng chess, ang pagkakakuha ay maaaring maitalaga ng pagtatalaga ng halagang +1, pagkawala –1, pagguhit ng 0.

Ang isang laro ay tinawag na isang zero-sum game kung ang isang manlalaro ay nanalo kung ano ang natalo ng iba pa, ibig sabihin ang kabuuan ng mga panalo ng parehong partido ay katumbas ng zero. Sa isang zero-sum game, ang interes ng mga manlalaro ay eksaktong kabaligtaran. Dito lamang isasaalang-alang namin ang mga nasabing laro.

Dahil sa isang zero-sum game, ang kabayaran ng isa sa mga manlalaro ay katumbas ng kabayaran ng iba pang kasama kabaligtaran na palatandaan, kung gayon, malinaw naman, kapag pinag-aaralan ang gayong laro, maaaring isaalang-alang ng isa ang kabayaran ng isa lamang sa mga manlalaro. Hayaan ito, halimbawa, manlalaro A. Sa kung ano ang sumusunod, para sa kaginhawaan, tatawagin namin ayon sa kombensyon ang panig A na "kami", at panig na B - "kalaban".

Sa kasong ito, ang panig A ("kami") ay laging isasaalang-alang bilang "panalo", at ang panig B ("kalaban") bilang "pagkatalo". Ang pormal na kondisyong ito ay malinaw naman ay hindi nagpapahiwatig ng anumang tunay na kalamangan para sa unang manlalaro; madaling makita na pinalitan ito ng kabaligtaran kung ang panalong nag-sign ay baligtad.

Isasaisip namin ang pagbuo ng laro sa oras na binubuo ng isang serye ng sunud-sunod na yugto o "gumagalaw". Ang isang paglipat sa teorya ng laro ay ang pagpipilian ng isa sa mga pagpipilian na ibinigay ng mga patakaran ng laro. Ang mga galaw ay nahahati sa personal at random. Ang isang personal na paglipat ay isang may malay na pagpipilian ng isa sa mga manlalaro ng isa sa mga posibleng galaw sa isang naibigay na sitwasyon at pagpapatupad nito. Ang isang halimbawa ng isang personal na paglipat ay ang anumang paglipat sa isang laro ng chess. Ginagawa ang susunod na paglipat, ang manlalaro ay gumagawa ng isang may malay na pagpipilian ng isa sa mga pagpipilian na posible na may isang naibigay na pag-aayos ng mga piraso sa pisara. Ang hanay ng mga posibleng pagpipilian para sa bawat personal na paglipat ay kinokontrol ng mga patakaran ng laro at nakasalalay sa kabuuan ng mga nakaraang paggalaw ng magkabilang panig.

Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, natupad hindi sa pamamagitan ng desisyon ng manlalaro, ngunit sa pamamagitan ng ilang mga mekanismo ng random na pagpipilian (pagkahagis ng isang barya, isang dice, shuffling at deal cards, atbp.). Halimbawa, ang pagbibigay ng unang card sa isa sa mga manlalaro na ginusto ay isang random na paglipat na may 32 pantay na posibleng mga pagpipilian. Para sa laro na maaaring matukoy sa matematika, ang mga patakaran ng laro ay dapat na ipahiwatig ang pamamahagi ng posibilidad ng mga posibleng resulta para sa bawat random na paglipat.

Ang ilang mga laro ay maaari lamang binubuo ng mga random na paglipat (ang tinaguriang pulos pagsusugal) o mga personal na galaw lamang (chess, checkers). Karamihan mga laro sa kard nabibilang sa mga laro halo-halong uri, ibig sabihin naglalaman ng kapwa mga random at personal na galaw.

Ang mga laro ay inuri hindi lamang sa likas na katangian ng kanilang mga galaw (personal, random), kundi pati na rin ng likas na katangian at dami ng impormasyong magagamit sa bawat manlalaro hinggil sa mga pagkilos ng iba. Ang isang espesyal na klase ng mga laro ay binubuo ng tinaguriang "mga laro kasama kumpletong impormasyon". Ang isang laro na may kumpletong impormasyon ay isang laro kung saan alam ng bawat manlalaro sa bawat personal na paglipat ang mga resulta ng lahat ng mga nakaraang paggalaw, parehong personal at random. Ang mga halimbawa ng mga larong may kumpletong impormasyon ay may kasamang chess, mga pamato, at ang kilalang laro ng "mga kalungkutan at mga krus".

Karamihan sa mga laro na may praktikal na kahalagahan ay hindi nabibilang sa klase ng mga laro na may kumpletong impormasyon, dahil ang kawalan ng katiyakan tungkol sa mga aksyon ng kaaway ay karaniwang isang mahalagang elemento ng mga sitwasyon ng kontrahan.

Isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto ng "diskarte". Ang diskarte ng manlalaro ay isang hanay ng mga patakaran na natatanging matukoy ang pagpipilian para sa bawat personal na paglipat ng isang naibigay na manlalaro, depende sa sitwasyon na nabuo sa kurso ng laro. Karaniwan, ang desisyon (pagpipilian) para sa bawat personal na paglipat ay ginagawa ng manlalaro sa panahon ng laro mismo, depende sa tukoy na sitwasyon na nabuo. Gayunpaman, sa teoretikal, ang mga bagay ay hindi magbabago kung naiisip natin na ang lahat ng mga pasyang ito ay isinasagawa na ng manlalaro nang maaga. Upang magawa ito, kailangang i-compile nang maaga ng manlalaro ang isang listahan ng lahat ng mga sitwasyong posible sa panahon ng laro at magbigay ng kanyang sariling solusyon para sa bawat isa sa kanila. Sa prinsipyo (kung hindi praktikal) posible ito para sa anumang laro. Kung ang naturang sistema ng pagpapasya ay pinagtibay, nangangahulugan ito na ang manlalaro ay pumili ng isang tiyak na diskarte.

Ang isang manlalaro na pumili ng isang diskarte ay hindi na makikilahok sa laro nang personal, ngunit palitan ang kanyang pakikilahok sa isang listahan ng mga patakaran na ilalapat para sa kanya ng isang hindi interesadong tao (hukom). Ang diskarte ay maaari ding ibigay sa automaton sa anyo ng isang tukoy na programa. Ganito naglalaro ng chess ang mga computer ngayon. Para sa konsepto ng "diskarte" upang magkaroon ng kahulugan, dapat mayroong mga personal na paglipat sa laro; sa mga larong binubuo lamang ng mga random na galaw, wala ang mga diskarte.

Nakasalalay sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa "may hangganan" at "walang katapusang". Ang isang may hangganang laro ay isang laro kung saan ang bawat manlalaro ay may isang may hangganan na bilang ng mga diskarte. Ang pangwakas na laro kung saan mayroon ang manlalaro A m mga diskarte, at player B - n ang diskarte ay tinatawag na mxn game.

Isaalang-alang ang laro ng mxn ng dalawang manlalaro A at B ("kami" at "kalaban"). Isasaad namin ang aming mga diskarte A 1, A 2, ..., A m ng diskarte ng kaaway B 1, B 2,…, B n. Hayaan ang bawat panig na pumili ng isang tukoy na diskarte; para sa atin ito ay magiging A i, para sa kalaban B j. Kung ang laro ay binubuo lamang ng mga personal na paglipat, kung gayon ang pagpili ng mga diskarte A i, B j natatanging tumutukoy sa kinalabasan ng laro - ang aming mga panalo. Ipaalam natin ito bilang isang ij. Kung naglalaman ang laro, bilang karagdagan sa personal, mga random na paglipat, pagkatapos ay ang kabayaran para sa isang pares ng mga diskarte A i, B j ay isang random na halaga na nakasalalay sa mga kinalabasan ng lahat ng mga random na paggalaw. Sa kasong ito, isang natural na pagtatantya ng inaasahang kabayaran ay ang average na halaga nito ( inaasahang halaga). Ipapahiwatig namin sa pamamagitan ng parehong pag-sign kapwa ang pagbabayad mismo (sa isang laro nang walang random na paglipat) at ang average na halaga (sa isang laro na may mga random na paggalaw).

Ipaalam sa amin ang mga halagang isang ij payoff (o average na kabayaran) para sa bawat pares ng mga diskarte. Ang mga halaga ay maaaring nakasulat sa anyo ng isang hugis-parihaba na talahanayan (matrix), ang mga hilera na tumutugma sa aming mga diskarte (A i), at ang mga haligi ay tumutugma sa mga diskarte ng kaaway (B j). Ang nasabing isang talahanayan ay tinatawag na payoff matrix o simpleng laro matrix. Ang game matrix mxn ay ipinapakita sa Fig. isa

Bigas 1. Matrix mxn

Sa madaling sabi, isasaad namin ang matrix ng laro ‖а ij ‖. Tingnan natin ang ilang mga halimbawa ng elementarya ng mga laro.

Halimbawa 1. Dalawang manlalaro A at B, nang walang pagtingin sa bawat isa, maglagay ng isang barya na baligtad sa mesa, sagisag o mga buntot, ayon sa kanilang paghuhusga. Kung ang mga manlalaro ay pumili ng magkatulad na panig (parehong may coat of arm o pareho ay may buntot), pagkatapos ang manlalaro A ay kukuha ng parehong mga barya; kung hindi man sila ay kinuha ng manlalaro B. Kinakailangan na pag-aralan ang laro at buuin ang matrix nito. Solusyon Ang laro ay binubuo lamang ng dalawang mga galaw: ang aming paglipat at paglipat ng kalaban, parehong personal. Ang laro ay hindi kabilang sa mga laro na may kumpletong impormasyon, dahil sa oras ng pagliko ng player na gumaganap ay hindi nito alam kung ano ang nagawa ng iba. Dahil ang bawat isa sa mga manlalaro ay may isang personal na paglipat lamang, ang diskarte ng manlalaro ay isang pagpipilian sa solong personal na paglipat na ito.

Mayroon kaming dalawang mga diskarte: Isang 1 - upang pumili ng isang amerikana at A 2 - upang pumili ng mga buntot; ang kalaban ay may parehong dalawang diskarte: B 1 - coat of arm at B 2 - tails. Kaya, ang larong ito ay isang 2 × 2 na laro. Isaalang-alang natin ang mga panalo ng isang barya bilang +1. Game Matrix:

Sa pamamagitan ng halimbawa ng larong ito, tulad ng elementarya, maaari mong maunawaan ang ilang mahahalagang ideya ng teorya ng laro. Ipagpalagay muna na ang naibigay na laro ay naisagawa lamang nang isang beses. Pagkatapos, malinaw naman, walang katuturan na pag-usapan ang anumang "mga diskarte" ng mga manlalaro na mas makatuwiran kaysa sa iba. Ang bawat isa sa mga manlalaro na may parehong dahilan ay maaaring gumawa ng anumang desisyon. Gayunpaman, kapag naulit ang laro, nagbabago ang sitwasyon.

Sa katunayan, sabihin natin na tayo (manlalaro A) ay pumili ng ilang diskarte para sa ating sarili (sabihin, A 1) at mananatili dito. Pagkatapos, batay sa mga resulta ng unang ilang mga paggalaw, hulaan ng kaaway ang aming diskarte at tutugon dito sa hindi gaanong kapaki-pakinabang na paraan para sa amin, ibig sabihin pumili ng mga buntot. Malinaw na hindi kapaki-pakinabang para sa amin na laging gamitin ang anumang isang diskarte; upang hindi mapunta sa pagkawala ng panig, dapat nating piliin minsan ang amerikana, minsan - mga buntot. Gayunpaman, kung papalitan namin ang mga coats ng braso at buntot sa isang tiyak na pagkakasunud-sunod (halimbawa, pagkatapos ng isa), maaari ring hulaan ng kaaway ang tungkol dito at tumugon sa diskarteng ito sa pinakamasamang paraan para sa amin. Malinaw na, isang maaasahang paraan upang matiyak na hindi alam ng kaaway ang aming diskarte ay upang ayusin ang pagpipilian sa bawat galaw, kung tayo mismo ay hindi alam nang maaga (maaari itong matiyak, halimbawa, sa pamamagitan ng paghuhugas ng isang barya). Kaya, sa pamamagitan ng intuitive na pangangatuwiran nakarating kami sa isa sa mga mahahalagang konsepto ng teorya ng laro - sa konsepto ng "halo-halong diskarte", ibig sabihin. tulad ng kapag "dalisay" na mga diskarte - sa kasong ito A 1 at A 2 - kahalili nang sapalaran sa ilang mga dalas. Sa halimbawang ito, mula sa pagsasaalang-alang ng mahusay na proporsyon, malinaw na maaga na ang mga diskarte A 1 at A 2 ay dapat na kahalili sa parehong dalas; sa mas kumplikadong mga laro, ang solusyon ay maaaring malayo sa walang halaga.

Halimbawa 2. Mga manlalaro A at B nang sabay-sabay at nang nakapag-iisa sa bawat isa ay isulat ang bawat isa sa tatlong mga numero: 1, 2 o 3. Kung ang kabuuan ng mga nakasulat na numero ay pantay, pagkatapos ay babayaran ng B ang halagang ito sa rubles; kung ito ay kakaiba, kung gayon, sa kabaligtaran, binabayaran ng A ang halagang ito sa B. Kinakailangan na suriin ang laro at iguhit ang matrix nito.

Solusyon Ang laro ay binubuo ng dalawang galaw; pareho ang personal. Mayroon kaming tatlong mga diskarte (A): A 1 - sumulat ng 1; At 2 - isulat ang 2; At 3 - isulat 3. Ang kalaban (B) ay may parehong tatlong diskarte. Ang laro ay isang 3 × 3 na laro:

Malinaw na, tulad ng sa dating kaso, ang kaaway ay maaaring tumugon sa pinakamasamang paraan para sa amin sa anumang diskarte na pinili namin. Sa katunayan, kung pipiliin natin, halimbawa, diskarte A1, palaging tutugon ang kaaway dito sa diskarte B2; sa diskarte A 2 - ayon sa diskarte B 3; sa diskarte A 3 - ayon sa diskarte B 2; sa gayon, ang anumang pagpipilian ng isang tiyak na diskarte ay hindi maiiwasang magdala sa atin sa isang pagkawala (hindi kinakailangan, gayunpaman, upang kalimutan na ang kaaway ay nasa parehong nakababahalang sitwasyon). Ang solusyon ng larong ito (ibig sabihin, ang hanay ng mga pinaka-pakinabang na diskarte ng parehong mga manlalaro) ay ibibigay sa § 5.

Halimbawa 3. Mayroon kaming tatlong uri ng sandata na magagamit namin: А 1, А 2, А 3; ang kaaway ay mayroong tatlong uri ng sasakyang panghimpapawid: B 1, B 2, B 3. Ang aming gawain ay upang maabot ang eroplano; ang gawain ng kalaban ay panatilihin siyang hindi naaapektuhan. Kapag gumagamit ng armament A 1, sasakyang panghimpapawid B 1, B 2, B 3 ay sinaktan, ayon sa pagkakabanggit, na may posibilidad na 0.9, 0.4 at 0.2; na may sandata A 2 - na may mga posibilidad na 0.3, 0.6 at 0.8; na may A 3 armament - na may posibilidad na 0.5, 0.7 at 0.2. Kinakailangan na bumalangkas ng sitwasyon sa mga tuntunin ng teorya ng laro.

Solusyon Maaaring isipin ang sitwasyon bilang isang 3 × 3 na laro na may dalawang personal na galaw at isang random na isa. Ang aming personal na paglipat ay ang pagpipilian ng uri ng sandata; personal na paglipat ng kaaway - ang pagpipilian ng sasakyang panghimpapawid para sa pakikilahok sa labanan. Random na paglipat - ang paggamit ng sandata; ang hakbang na ito ay maaaring magtapos sa pagkatalo o di-pagkatalo ng sasakyang panghimpapawid. Ang aming kabayaran ay iisa kung ang eroplano ay na-hit at zero kung hindi man. Ang aming mga diskarte ay tatlong mga pagpipilian sa sandata; mga diskarte ng kaaway - tatlong mga pagpipilian sa sasakyang panghimpapawid. Ang average na halaga ng kabayaran para sa bawat naibigay na pares ng mga diskarte ay walang hihigit sa posibilidad na tamaan ang isang naibigay na sasakyang panghimpapawid sa isang ibinigay na sandata. Game Matrix:

Ang layunin ng teorya ng laro ay upang magbigay ng mga rekomendasyon para sa makatuwirang pag-uugali mga manlalaro sa sitwasyon ng pagkakasalungatan, ibig sabihin pagpapasiya ng "pinakamainam na diskarte" para sa bawat isa sa kanila. Ang pinakamainam na diskarte ng isang manlalaro sa teorya ng laro ay isang diskarte na, kapag ang laro ay paulit-ulit nang maraming beses, nagbibigay ng isang naibigay na manlalaro na may maximum na posibleng average gain (o ang minimum na posibleng average loss). Sa pagpili ng diskarteng ito, ang batayan ng pangangatuwiran ay ang palagay na ang kaaway ay hindi gaanong kasing talino tulad ng ating sarili, at ginagawa ang lahat upang maiwasang makamit ang ating layunin.

Sa teorya ng laro, ang lahat ng mga rekomendasyon ay ginawa batay sa mga prinsipyong ito; samakatuwid, hindi ito isinasaalang-alang ang mga elemento ng peligro na hindi maiwasang naroroon sa bawat totoong diskarte, pati na rin ang mga posibleng pagkalkula at pagkakamali ng bawat isa sa mga manlalaro. Teorya ng laro, tulad ng anumang matematikal na modelo ang kumplikadong kababalaghan ay may sariling mga limitasyon. Ang pinakamahalaga sa kanila ay ang nakuha ay artipisyal na nabawasan sa isa isahan... Sa karamihan ng mga praktikal na sitwasyon ng salungatan, kapag bumubuo ng isang makatwirang diskarte, kinakailangang isaalang-alang hindi isa, ngunit maraming mga parameter ng bilang - ang pamantayan para sa tagumpay ng kaganapan. Ang isang diskarte na pinakamainam sa isang pamantayan ay hindi kinakailangang pinakamainam sa iba. Gayunpaman, ang pagkakaroon ng kamalayan sa mga limitasyong ito at samakatuwid ay hindi bulag na sumunod sa mga rekomendasyong nakuha ng mga pamamaraan ng laro, maaari pa ring makatuwirang gamitin ang isang aparatong matematika ng teorya ng laro upang paunlarin, kung hindi eksaktong "pinakamainam", kung gayon, kahit papaano, "katanggap-tanggap" na diskarte .

§ 2. Ang mas mababa at mataas na presyo ng laro. Ang prinsipyo ng minimax

Isaalang-alang ang isang mxn game na may isang matrix tulad ng sa Fig. 1. Tukuyin natin sa pamamagitan ng letrang i ang bilang ng aming diskarte; ang letrang j ang bilang ng diskarte ng kalaban. Itakda natin ang ating sarili sa gawain: upang matukoy ang aming pinakamainam na diskarte. Pag-aralan nating sunud-sunod ang bawat isa sa ating mga diskarte, nagsisimula sa A 1.

Pagpili ng diskarte А i, dapat nating palaging umasa sa katotohanan na ang kaaway ay tutugon dito gamit ang diskarte na j kung saan ang aming kabayaran ay isang maliit. Tukuyin natin ang halagang ito ng kabayaran, ibig sabihin ang minimum ng mga bilang na isang ij in ako ika linya Ipaalam natin ito sa pamamagitan ng α i:

Dito, ang min sign (minimum sa j) ay nangangahulugan ng minimum ng mga halaga ng parameter na ito para sa lahat ng posibleng j. Isulat natin ang mga bilang α i; sa tabi ng matrix sa kanan bilang isang labis na haligi:

Pagpili ng anumang diskarte A, kailangan nating umasa sa katotohanan na bilang isang resulta ng mga makatuwirang aksyon ng kalaban hindi kami mananalo ng higit sa α i. Naturally, kumikilos nang mas maingat at umaasa sa pinaka makatwirang kalaban (ibig sabihin, pag-iwas sa anumang peligro), dapat tayong huminto sa diskarte kung saan ang bilang α i ang maximum. Tukuyin natin ang maximum na halagang ito α:

o, isinasaalang-alang ang formula ng account (2.1),

Ang halagang α ay tinatawag na mas mababang presyo ng laro, sa madaling salita, ang maximin na panalo o simpleng ang maximin. Ang bilang α ay namamalagi sa isang tiyak na linya ng matrix; ang diskarte ng manlalaro A na tumutugma sa linyang ito ay tinatawag na maximin na diskarte. Malinaw na, kung sumunod tayo sa maximin na diskarte, kung gayon para sa anumang pag-uugali ng kaaway ay ginagarantiyahan namin ang isang pagbabayad, hindi bababa sa hindi mas mababa sa α. Samakatuwid, ang halaga ng α ay tinatawag na "mas mababang presyo ng laro". Ito ang garantisadong minimum na maaari naming ibigay ang aming sarili sa pamamagitan ng pagsunod sa pinaka maingat ("muling pagsiguro") na diskarte.

Malinaw na, ang isang katulad na pangangatuwiran ay maaaring isagawa para sa kalaban B. Dahil ang kaaway ay interesado na i-minimize ang aming mga panalo, dapat niyang tingnan ang bawat isa sa kanyang mga diskarte mula sa pananaw maximum na panalo sa diskarteng ito. Samakatuwid, sa ilalim ng matrix, isusulat namin ang maximum na mga halaga para sa bawat haligi:

at hanapin ang minimum na β j:

Ang halagang β ay tinawag na pinakamataas na presyo ng laro, sa madaling salita, ang "minimax". Ang diskarte ng kalaban na naaayon sa pakinabang ng minimax ay tinatawag na kanyang "diskarte sa minimax". Sumusunod sa kanyang pinaka maingat na diskarte sa minimax, ginagarantiyahan ng kalaban sa kanyang sarili ang mga sumusunod: kahit anong gawin natin laban sa kanya, siya sa anumang kaso ay mawawalan ng halagang hindi hihigit sa β. Ang prinsipyo ng pag-iingat, na nagdidikta ng pagpili ng mga naaangkop na diskarte (maximin at minimax) para sa mga manlalaro, ay madalas na tinatawag na "prinsipyo ng minimax" sa teorya ng laro at mga aplikasyon nito. Ang pinaka-maingat na maximin at minimax na mga diskarte ng mga manlalaro ay minsang naila pangkalahatang term"Mga diskarte sa Minimax".

Bilang mga halimbawa, tinutukoy namin ang mas mababa at itaas na mga presyo ng laro at mga diskarte ng minimum na halimbawa para sa mga halimbawa 1, 2, at 3 ng § 1.

Halimbawa 1. Ang halimbawa 1 § 1 ay nagbibigay ng isang laro na may sumusunod na matrix:

Dahil ang mga halagang α i at β j ay pare-pareho at katumbas ng –1 at +1, ayon sa pagkakabanggit, ang mas mababa at itaas na mga presyo ng laro ay din –1 at +1: α = –1, β = +1. Anumang diskarte ng manlalaro A ay ang kanyang maximin, at anumang diskarte ng manlalaro B ang kanyang diskarte sa minimax. Ang konklusyon ay walang halaga: sa pamamagitan ng pagdikit sa alinman sa kanyang mga diskarte, ang manlalaro A ay maaaring ginagarantiyahan na siya ay natalo ng hindi hihigit sa 1; ang pareho ay maaaring ginagarantiyahan ng player B.

Halimbawa 2. Halimbawa 2 § 1 ay nagbibigay ng isang laro na may isang matrix:

Ang mas mababang presyo ng laro ay α = –3; ang pinakamataas na presyo ng laro β = 4. Ang aming maximin na diskarte ay А 1; sa pamamagitan ng sistematikong paglalapat nito, mahigpit nating maaasahan na manalo ng hindi bababa sa –3 (talo ng hindi bababa sa 3). Ang diskarte ng minimax ng kalaban ay alinman sa mga diskarte B 1 at B 2; sistematikong inilalapat ang mga ito, sa anumang kaso, maaaring magagarantiyahan na mawawalan siya ng hindi hihigit sa 4. Kung lumihis tayo mula sa aming pinakamataas na diskarte (halimbawa, pumili ng diskarte A2), ang "kalaban ay maaaring" parusahan "tayo para dito sa pamamagitan ng paglalapat ng diskarte B 3 at ang pagbawas ng ating panalo ay hanggang -5; Gayundin, ang pag-atras ng kalaban mula sa kanyang diskarte sa minimax ay maaaring dagdagan ang kanyang pagkawala sa 6.

Halimbawa 3. Halimbawa 3 § 1 ay nagbibigay ng isang laro na may isang matrix:

Ang mas mababang presyo ng laro ay α = 0.3; ang pinakamataas na halaga ng laro β = 0.7. Ang aming pinaka-konserbatibo (maximin) na diskarte ay A 2; gamit ang А 2 armament, ginagarantiyahan namin na tatama ang sasakyang panghimpapawid sa average ng hindi bababa sa 0.3 sa lahat ng mga kaso. Ang pinaka maingat (minimax) na diskarte ng kaaway ay B 2; gamit ang sasakyang panghimpapawid na ito, makasisiguro ang kaaway na siya ay tatamaan sa hindi hihigit sa 0.7 sa lahat ng mga kaso.

Ang huling halimbawa ay maginhawa upang ipakita ang isa mahalagang pag-aari mga diskarte sa minimax - ang kanilang kawalang-tatag. Ipagpalagay na ginagamit namin ang aming pinaka-maingat (maximin) na diskarte A 2, at ginagamit ng kalaban ang kanyang pinaka-maingat (minimax) na diskarte B2. Hangga't ang parehong kalaban ay sumusunod sa mga diskarteng ito, ang average na kabayaran ay 0.6; ito ay higit pa sa mas mababang isa, ngunit mas mababa sa mas mataas na presyo ng laro. Ipagpalagay natin ngayon na natutunan ng kalaban na gumagamit tayo ng diskarte A 2; agad niyang tutugon dito gamit ang diskarte B 1 at bawasan ang mga panalo sa 0.3. Kaugnay nito, mayroon kaming magandang sagot sa diskarte B 1: diskarte A 1, na nagbibigay sa amin ng isang kabayaran na 0.9, at iba pa.

Samakatuwid, ang posisyon kung saan ang parehong mga manlalaro ay gumagamit ng kanilang mga diskarte sa minimax ay hindi matatag at maaaring malabag ng impormasyong natanggap tungkol sa diskarte ng kalaban. Gayunpaman, may ilang mga laro kung saan matatag ang mga diskarte sa minimax. Ito ang mga laro kung saan ang mas mababang presyo ay katumbas ng itaas: α = β. Kung ang mas mababang presyo ng laro ay katumbas ng nasa itaas, kung gayon ang kanilang kabuuang halaga ay tinatawag na net na presyo ng laro (minsan ang presyo lamang ng laro), isasaad namin ito sa titik na ν.

Tingnan natin ang isang halimbawa. Hayaan ang isang 4 × 4 na laro na ibibigay ng matrix:

Hanapin natin ang mas mababang presyo ng laro: α = 0.6. Hanapin natin ang pinakamataas na presyo ng laro: β = 0.6. Pareho silang naging, samakatuwid, ang laro ay mayroong netong presyo na katumbas ng α = β = ν = 0.6. Ang Elemento 0.6, na naka-highlight sa payoff matrix, ay parehong minimum sa hilera nito at maximum sa haligi nito. Sa geometry, ang isang punto sa isang ibabaw na may katulad na pag-aari (isang sabay-sabay na minimum kasama ang isang coordinate at isang maximum kasama ang isa pa) ay tinatawag na isang saddle point; sa pamamagitan ng pagkakatulad, ang term na ito ay ginagamit din sa teorya ng laro. Ang isang elemento ng isang matrix na may ganitong pag-aari ay tinatawag na isang saddle point ng matrix, at ang isang laro ay sinasabing mayroong isang saddle point.

Ang punto ng siyahan ay tumutugma sa isang pares ng mga diskarte sa minimax (sa halimbawang ito, A 3 at B 2). Ang mga diskarte na ito ay tinatawag na pinakamainam, at ang kanilang kombinasyon ay tinatawag na solusyon sa laro. Ang solusyon ng laro ay may mga sumusunod na kamangha-manghang pag-aari. Kung ang isa sa mga manlalaro (halimbawa, A) ay sumusunod sa kanyang pinakamainam na diskarte, at ang iba pang manlalaro (B) ay lumihis mula sa kanyang pinakamainam na diskarte sa anumang paraan, kung gayon para sa manlalaro na gumawa ng paglihis, hindi ito maaaring maging kapaki-pakinabang, tulad ng paglihis ng manlalaro B ay maaaring pinakamahusay na iwanan ang mga panalo na hindi nagbago, at sa pinakamasamang kaso, dagdagan ito. Sa kabaligtaran, kung ang B ay sumunod sa pinakamainam na diskarte nito, at ang A ay lumihis mula sa sarili nitong, sa gayon ay hindi maaaring maging kapaki-pakinabang ito para sa A

Ang pahayag na ito ay maaaring madaling ma-verify sa pamamagitan ng halimbawa ng laro na may isang saddle point na isinasaalang-alang. Nakita namin na sa kaso ng isang laro na may isang saddle point, ang mga diskarte sa minimax ay may isang uri ng "katatagan": kung ang isang panig ay sumunod sa diskarte ng minimax nito, kung gayon maaari lamang itong maging hindi kapaki-pakinabang para sa iba pang lumihis mula sa sarili nitong. Tandaan na sa kasong ito, ang kaalaman ng sinumang manlalaro na pinili ng kaaway ang kanyang pinakamainam na diskarte ay hindi maaaring baguhin ang sariling pag-uugali ng manlalaro: kung ayaw niyang kumilos laban sa kanyang sariling interes, dapat siyang sumunod sa kanyang pinakamainam na diskarte. Ang isang pares ng pinakamainam na diskarte sa isang laro ng saddle point ay, tulad ng, isang "posisyon ng balanse": ang anumang paglihis mula sa pinakamainam na diskarte ay humahantong sa lumihis na manlalaro sa hindi kanais-nais na mga kahihinatnan, pinipilit siyang bumalik sa kanyang orihinal na posisyon.

Kaya, para sa bawat laro ng saddle point, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na diskarte para sa magkabilang panig, na may mga sumusunod na katangian.

1) Kung ang parehong partido ay sumunod sa kanilang pinakamainam na mga diskarte, kung gayon ang average na kabayaran ay katumbas ng netong presyo ng laro ν, na sabay na mas mababa at mas mataas na presyo.

2) Kung ang isa sa mga partido ay sumusunod sa pinakamainam na diskarte, at ang iba ay lumihis mula sa sarili nitong, pagkatapos ay ang lihis na panig ay maaari lamang mawala mula dito at sa anumang kaso ay maaaring dagdagan ang pakinabang nito.

Ang klase ng mga laro na may isang punto ng siyahan ay may malaking interes mula sa parehong teoretikal at praktikal na pananaw. Sa teorya ng laro, napatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may isang saddle point, at, samakatuwid, ang bawat gayong laro ay may solusyon, ibig sabihin. mayroong isang pares ng pinakamainam na diskarte ng magkabilang panig, na nagbibigay ng isang average na kabayaran na katumbas ng presyo ng laro. Kung ang isang laro na may kumpletong impormasyon ay binubuo lamang ng mga personal na paglipat, pagkatapos kapag ang bawat panig ay naglalapat ng pinakamainam na diskarte, dapat itong laging magtapos sa isang ganap na tiyak na kinalabasan, lalo, isang panalo na eksaktong katumbas ng presyo ng laro.

Bilang isang halimbawa ng isang laro na may kumpletong impormasyon, nagbibigay kami sikat na laro na may stacking coins bilog na mesa... Dalawang manlalaro na halili na naglalagay ng magkatulad na mga barya sa bilog na mesa, sa tuwing pumipili ng isang di-makatwirang posisyon ng gitna ng barya; Hindi pinapayagan ang magkakapatong na mga barya. Ang manlalaro na naglalagay ng huling barya ay nanalo (kapag walang puwang para sa iba). Malinaw na, ang kinalabasan ng larong ito ay palaging isang pangwakas na konklusyon, at mayroong isang mahusay na natukoy na diskarte na tinitiyak ang isang maaasahang panalo para sa manlalaro na inuuna ang barya. Pangalanan, dapat siyang maglagay ng barya sa gitna ng talahanayan sa kauna-unahang pagkakataon, at pagkatapos ay tumugon sa isang simetriko na paglipat sa paglipat ng bawat kalaban. Sa kasong ito, ang ikalawang manlalaro ay maaaring kumilos ayon sa gusto niya nang hindi binabago ang paunang natukoy na resulta ng laro. Samakatuwid, ang larong ito ay may katuturan lamang para sa mga manlalaro na hindi alam ang pinakamainam na diskarte. Ang sitwasyon ay katulad sa chess at iba pang mga laro na may kumpletong impormasyon; anuman sa mga larong ito ay may isang saddle point at isang solusyon na nagpapahiwatig sa bawat isa sa mga manlalaro ng kanyang pinakamainam na diskarte; ang solusyon ng larong chess ay hindi lamang natagpuan dahil ang bilang ng mga kumbinasyon ng mga posibleng paglipat sa chess ay masyadong malaki upang makapagtayo ng isang matrix sa pagbabayad at makahanap ng isang saddle point dito.

§ 3. Dalisay at magkahalong diskarte. Solusyon ng laro sa magkahalong diskarte

Kabilang sa mga walang hanggan na mga laro ng praktikal na kahalagahan, ang mga laro na may isang saddle point ay medyo bihira; mas tipikal ang kaso kapag ang ilalim at nangungunang mga presyo ng laro ay magkakaiba. Pag-aralan ang mga matrice ng naturang mga laro, napagpasyahan namin na kung ang bawat manlalaro ay bibigyan ng pagpipilian ng isang solong diskarte, kung gayon, pagbibilang sa isang makatuwirang kumikilos na kalaban, ang pagpipiliang ito ay dapat na matukoy ng prinsipyo ng minimum. Sumusunod sa aming pinakamataas na diskarte, para sa anumang pag-uugali ng kalaban, sinasadya naming ginagarantiyahan ang aming sarili ng isang kabayaran na katumbas ng mas mababang presyo ng laro α. Lumilitaw ang isang natural na katanungan: posible bang garantiyahan ang sarili ng isang average na kabayaran na mas malaki kaysa sa α, kung gagamit tayo ng hindi isang solong "dalisay" na diskarte, ngunit sapalarang alternatibong maraming mga diskarte? Ang nasabing pinagsamang mga diskarte, na binubuo sa paglalapat ng maraming mga dalisay na diskarte alternating ayon sa isang random na batas na may isang tiyak na ratio ng dalas, ay tinatawag na magkahalong mga diskarte sa teorya ng laro.

Malinaw na, ang bawat dalisay na diskarte ay isang espesyal na kaso ng isang halo-halong isa, kung saan ang lahat ng mga diskarte, maliban sa isa, ay inilalapat na may mga zero frequency, at ang isang ito - na may dalas na 1. Lumalabas na, naglalapat hindi lamang dalisay, kundi pati na rin magkahalong mga diskarte, maaaring makakuha ng isa para sa bawat wakas na solusyon sa laro, ibig sabihin isang pares ng (pangkalahatang magkakahalo) na mga diskarte tulad na kapag inilapat ng parehong mga manlalaro ang mga ito, ang kabayaran ay katumbas ng presyo ng laro, at para sa anumang panig na paglihis mula sa pinakamainam na diskarte, ang pagbabayad ay maaari lamang magbago sa isang direksyon na hindi kanais-nais para sa ang lihis.

Ang pahayag sa itaas ay bumubuo sa nilalaman ng tinaguriang pangunahing teorya ng teorya ng laro. Ang teoryang ito ay unang napatunayan ni von Neumann noong 1928. Ang mga kilalang patunay ng teorama ay medyo kumplikado; samakatuwid, ipinapakita lamang namin ang pagbabalangkas nito.

Ang bawat end game ay mayroong kahit isang solusyon (posibleng sa lugar ng magkahalong diskarte).

Ang nakuha na nagreresulta mula sa isang desisyon ay tinatawag na gastos ng laro. Ipinapahiwatig ng pangunahing teorama na ang bawat may takda na laro ay may presyo. Malinaw na, ang presyo ng laro ν laging namamalagi sa pagitan ng mas mababang presyo ng laro α at ng mas mataas na presyo ng laro β:

(3.1) α ≤ ν ≤ β

Sa katunayan, ang α ay ang maximum na garantisadong kabayaran na maibibigay namin sa ating sarili na ginagamit lamang ang aming mga dalisay na diskarte. Dahil ang mga halo-halong diskarte ay kasama, bilang isang partikular na kaso, lahat ng mga dalisay, pagkatapos, na pinapayagan, bilang karagdagan sa mga dalisay, ay magkakahalo din ng mga diskarte, kami, sa anumang kaso, ay hindi pinapalala ang aming mga kakayahan; samakatuwid, ν ≥ α. Katulad nito, isinasaalang-alang ang mga kakayahan ng kalaban, ipinapakita namin ang ν ≤ β, na nagpapahiwatig ng pinatunayan na hindi pagkakapantay-pantay (3.1).

Ipaalam sa amin ang isang espesyal na notasyon para sa magkahalong mga diskarte. Kung, halimbawa, ang aming halo-halong diskarte ay binubuo sa paglalapat ng mga diskarte A 1, A 2, A 3 na may mga frequency p 1, p 2, p 3, at p 1 + p 2 + p 3 = 1, isasaad namin ang diskarteng ito

Katulad nito, ang magkahalong diskarte ng kalaban ay maiuugnay sa pamamagitan ng:

kung saan ang q 1, q 2, q 3 ay ang mga frequency na kung saan ang mga diskarte B 1, B 2, B 3 ay halo-halong; q 1 + q 2 + q 3 = 1.

Ipagpalagay na nakakita kami ng isang solusyon sa laro, na binubuo ng dalawang pinakamainam na halo-halong diskarte S A *, S B *. Sa pangkalahatang kaso, hindi lahat ng mga purong diskarte na magagamit sa isang naibigay na manlalaro ay kasama sa kanyang pinakamainam na halo-halong diskarte, ngunit ilan lamang. Tatawagan namin ang mga diskarte na kasama sa pinakamainam na halo-halong diskarte ng manlalaro ng kanyang "kapaki-pakinabang" na mga diskarte. Ito ay lumabas na ang solusyon sa laro ay may isa pang kamangha-manghang pag-aari: kung ang isa sa mga manlalaro ay sumusunod sa kanyang pinakamainam na halo-halong diskarte SA * (SB *), kung gayon ang bayad ay mananatiling hindi nagbabago at katumbas ng presyo ng laro ν, anuman ang kung ano ang ginagawa ng ibang manlalaro, maliban kung lumampas siya sa mga "kapaki-pakinabang" na diskarte. Halimbawa, siya ay maaaring gumamit ng anuman sa kanyang "kapaki-pakinabang" na mga diskarte sa purong anyo, at maaari ring ihalo ang mga ito sa anumang proporsyon.

§ 4. Elementary na pamamaraan para sa paglutas ng mga laro. Mga Laro 2x2 at 2xn

Kung ang laro mxn ay walang isang saddle point, pagkatapos ang paghahanap ng isang solusyon sa pangkalahatan ay isang mahirap na gawain, lalo na para sa malaking m at n. Minsan ang gawaing ito ay maaaring gawing simple sa pamamagitan ng pagbawas muna ng bilang ng mga diskarte sa pamamagitan ng pagtanggal ng ilang hindi kinakailangan. Ang labis na diskarte ay a) duplicate at b) halatang hindi kapaki-pakinabang. Isaalang-alang, halimbawa, ang isang laro na may matrix:

Madali upang matiyak na ang diskarte А 3 eksaktong inuulit ("duplicate") na diskarte 1 1, samakatuwid, ang alinman sa dalawang diskarte na ito ay maaaring matanggal. Dagdag dito, ang paghahambing ng mga linya A 1 at A 2, nakikita natin na ang bawat elemento ng linya A2 ay mas mababa (o katumbas ng) katumbas na elemento ng linya A 1. Malinaw na, hindi natin dapat gamitin ang diskarte sa A2, sadyang hindi ito kapaki-pakinabang. Sa pamamagitan ng pagtanggal ng A 3 at A 2, dinala namin ang matrix sa higit pa simpleng isip... Dagdag dito, tandaan namin na ang diskarte B 3 ay malinaw na hindi kapaki-pakinabang para sa kalaban; tinatanggal ito, dinadala namin ang matrix sa huling form:

Kaya, ang 4 × 4 na laro ay nabawasan sa isang 2 × 3 na laro sa pamamagitan ng pag-aalis ng duplicate at halatang hindi magandang diskarte.

Ang pamamaraan para sa pagtanggal ng duplicate at malinaw naman na hindi kanais-nais na mga diskarte ay dapat palaging nauuna ang desisyon ng laro. Ang pinakasimpleng mga kaso ng may wakas na mga laro, na laging malulutas ng mga pamamaraan sa elementarya, ay mga larong 2 × 2 at 2xn.

Isaalang-alang ang isang 2 × 2 laro na may isang matrix:

Dalawang kaso ang maaaring maganap dito: 1) ang laro ay may isang saddle point; 2) ang laro ay walang saddle point. Sa unang kaso, malinaw ang solusyon: ito ay isang pares ng mga diskarte na lumusot sa isang saddle point. Sa pamamagitan ng paraan, tandaan na sa isang 2 × 2 laro, ang pagkakaroon ng isang saddle point ay laging tumutugma sa pagkakaroon ng sadyang hindi magandang diskarte, na dapat na tinanggal sa paunang pagtatasa.

Huwag hayaang may punto ng siyahan at, samakatuwid, ang mas mababang presyo ng laro ay hindi katumbas ng itaas: α ≠ β. Kinakailangan upang mahanap ang pinakamainam na halo-halong diskarte ng manlalaro A:

Ito ay nakikilala sa pamamagitan ng pag-aari na anuman ang mga pagkilos ng kalaban (maliban kung lumampas siya sa mga limitasyon ng kanyang "kapaki-pakinabang" na mga diskarte), ang kabayaran ay katumbas ng presyo ng laro ν. Sa isang 2 × 2 na laro, ang parehong mga diskarte ng kaaway ay "kapaki-pakinabang", kung hindi man ang laro ay magkakaroon ng isang dalisay na solusyon sa diskarte (saddle point). Nangangahulugan ito na kung susundin namin ang aming pinakamainam na diskarte (4.1), kung gayon ang kaaway ay maaaring gumamit ng anuman sa kanyang mga dalisay na diskarte B 1, B 2 nang hindi binabago ang average na kabayaran ν. Samakatuwid mayroon kaming dalawang mga equation:

mula sa kung saan, isinasaalang-alang ang p 1 + p 2 = 1, nakukuha namin:

Nahanap namin ang halaga ng laro ν sa pamamagitan ng pagpapalit ng mga halagang p 1, p 2 sa alinman sa mga equation (4.2).

Kung ang presyo ng laro ay kilala, pagkatapos ay upang matukoy ang pinakamainam na diskarte ng kalaban

sapat ang isang equation, halimbawa:

kung saan, isinasaalang-alang ang q 1 + q 2 = 1, mayroon kaming:

Halimbawa 1. Hahanapin natin ang solusyon ng larong 2 × 2 na isinasaalang-alang sa Halimbawa 1 § 1, kasama ang matrix:

Ang laro ay walang saddle point (α = –1; β = +1), at, samakatuwid, ang solusyon ay dapat na nakasalalay sa domain ng magkahalong diskarte:

Kailangan mong hanapin ang p 1, p 2, q 1 at q 2. Para sa p 1 mayroon kaming equation

1 * p 1 + (–1) (1 - p 1) = (–1) p 1 + 1 (1 - p 1)

saan p 1 = 1/2, p 2 = 1/2.

Katulad nito, nakita namin: q 1 = 1/2, q 2 = 1/2, ν = 0.

Dahil dito, ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro ay ang sapalarang kahalili pareho sa kanilang purong diskarte, gamit ang bawat isa sa kanila nang pantay madalas; sa kasong ito, ang average na kabayaran ay magiging katumbas ng zero.

Ang nagresultang konklusyon ay sapat na malinaw nang maaga. Sa susunod na halimbawa, titingnan pa natin ang higit pa mahirap na laro, ang solusyon kung saan ay hindi masyadong halata. Ang halimbawa ay isang panimulang halimbawa ng mga larong kilala bilang "pagdaraya" o "pagdaraya" na mga laro. Sa pagsasagawa, sa mga sitwasyon ng hidwaan, madalas silang ginagamit iba't ibang paraan mapanlinlang ang kaaway (maling impormasyon, paglalagay ng maling mga target, atbp.). Ang halimbawa, sa kabila ng pagiging simple nito, ay medyo nakapagtuturo.

Halimbawa 2. Ang laro ay ang mga sumusunod. Mayroong dalawang kard: isang alas at isang deuce. Ginaguhit ng Player A ang isa sa kanila nang sapalaran; Hindi nakikita ni B kung aling kard ang kinuha niya. Kung naglabas si A ng isang alas, ipinahayag niya: "Mayroon akong alas," at hinihiling mula sa kalaban na 1 ruble. Kung ang A ay kumuha ng isang deuce, pagkatapos ay maaari niyang alinman sa A 1) sabihin na "Mayroon akong alas" at humiling ng 1 ruble mula sa kalaban, o A 2) aminin na mayroon siyang isang deuce at bayaran ang kalaban na 1 ruble.

Ang kaaway, kung kusang-loob siyang binayaran ng 1 ruble, maaari lamang itong tanggapin. Kung ang 1 ruble ay hinihingi sa kanya, pagkatapos ay maaari niyang alinman sa B 1) maniwala sa manlalaro A na mayroon siyang alas at bigyan siya ng 1 ruble, o B 2) humiling ng isang tseke upang matiyak na ang pahayag na A. suriin ay lumabas na Ang A ay talagang may alas, si B ay dapat magbayad ng A 2 rubles. Kung lumalabas na ang A ay nanloloko at mayroon siyang isang deuce, ang manlalaro A ay nagbabayad ng manlalaro B 2 rubles. Kinakailangan upang suriin ang laro at hanapin ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro.

Solusyon Ang laro ay may isang medyo kumplikadong istraktura; binubuo ito ng isang ipinag-uutos na random na paglipat - ang pagpipilian ng manlalaro A ng isa sa dalawang kard - at dalawang personal na paglipat, na, gayunpaman, ay hindi kinakailangang maganap. Sa katunayan, kung ang A ay kumuha ng isang alas, kung gayon hindi siya gumagawa ng anumang personal na paglipat: bibigyan lamang siya ng isang pagkakataon - na humingi ng 1 ruble, na ginagawa niya. Sa kasong ito, ang isang personal na paglipat - maniwala o hindi maniwala (ibig sabihin magbayad o hindi magbayad ng 1 ruble) - ay inililipat sa manlalaro B. Kung ang A bilang isang resulta ng unang random na paglipat na natanggap ng dalawa, pagkatapos ay bibigyan siya ng isang personal ilipat: magbayad ng 1 ruble o subukang lokohin ang kalaban at humiling ng 1 ruble (sa madaling salita: "huwag linlangin" o "linlangin"). Kung pipiliin ng A ang una, kung gayon ang B ay dapat lamang tanggapin ang 1 ruble; kung pinili ng A ang huli, pagkatapos ang manlalaro B ay bibigyan ng isang personal na paglipat: maniwala o hindi maniwala sa A (iyon ay, magbayad ng A 1 ruble o humiling ng pag-verify).

Ang mga diskarte ng bawat isa sa mga manlalaro ay mga patakaran na nagpapahiwatig kung paano dapat kumilos ang manlalaro kapag binigyan siya ng isang personal na paglipat. Malinaw na, ang A ay may dalawang diskarte lamang: A 1 - upang manloko, A 2 - hindi manloko. Ang B ay mayroon ding dalawang mga diskarte: B 1 - upang maniwala, B 2 - hindi maniwala. Bumuo tayo ng game matrix. Upang magawa ito, kalkulahin natin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1. A 1 B 1 (A daya, naniniwala si B). Kung ang A ay nakatanggap ng isang alas (ang posibilidad na ito ay ½, kung gayon hindi siya bibigyan ng isang personal na paglipat; hinihingi niya ang 1 ruble, at naniniwala ang manlalaro na B sa kanya; Ang nakuha ni A sa rubles ay 1. Kung ang A ay nakatanggap ng dalawa (ang posibilidad na ito ay din ½), ayon sa kanyang diskarte, nanloko at humihingi siya ng 1 ruble; Naniniwala sa kanya at nagbabayad; ang bayad ay A ay katumbas din ng 1. Average na kabayaran: isang 11 = ½ * 1 + ½ * 1 = 1.

2. A 1 B 2 (A daya, B ay hindi naniniwala). Kung ang A ay nakakakuha ng alas, wala siyang personal na paglipat; nangangailangan siya ng 1 ruble; Ayon sa kanyang diskarte, hindi siya naniniwala at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang nakuha ng A ay +2). Kung ang A ay nakakakuha ng isang deuce, ayon sa kanyang diskarte, hinihingi niya ang 1 ruble; Ang B, ayon sa kanyang sarili, ay hindi naniniwala; bilang isang resulta, nagbabayad ang A ng 2 rubles (ang nakuha ni A ay –2). Ang average na kabayaran ay: isang 12 = ½ * (+ 2) + ½ * (- 2) = 0.

3. A 2 B 1 (A ay hindi manlilinlang, naniniwala si B). Kung ang A ay naglalabas ng isang alas, hinihingi niya ang 1 ruble; Ang B, alinsunod sa kanyang diskarte, ay nagbabayad; ang nakuha ng A ay +1. Kung naglabas si A ng isang deuce, nagbabayad siya ng 1 ruble alinsunod sa kanyang diskarte; Ang natitira lamang para sa B ay ang tanggapin (ang nakuha ng A ay –1). Ang average na kabayaran ay: isang 21 = ½ * (+ 1) + ½ * (- 1) = 0.

4. A 2 B 2 (A ay hindi manlinlang, B ay hindi naniniwala). Kung ang A ay naglalabas ng isang alas, hinihingi niya ang 1 ruble; Ang mga tseke ng B at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang panalo ay +2). Kung ang A ay naglalabas ng isang deuce, nagbabayad siya ng 1 ruble; Ang natitira lamang ay ang tanggapin (ang kabayaran ay 1). Ang average na kabayaran ay: isang 22 = ½ * (+ 2) + ½ * (- 1) = ½.

Binubuo namin ang game matrix:

Ang matrix ay walang saddle point. Ang mas mababang presyo ng laro ay α = 0, ang pinakamataas na presyo ng laro ay β = ½. Maghanap tayo ng isang solusyon sa laro sa larangan ng halo-halong mga diskarte. Paglalapat ng formula (4.3), nakukuha namin ang:

mga yan Dapat gamitin ng manlalaro A ang kanyang unang diskarte (impostor) sa isang katlo ng lahat ng mga kaso, at ang pangalawa (hindi cheat) sa dalawang thirds. Sa kasong ito, mananalo siya sa average ng presyo ng laro ν = 1/3.

Ang halagang ν = 1/3 ay nagpapahiwatig na sa ilalim ng mga kundisyong ito ang laro ay kapaki-pakinabang para sa A at hindi kanais-nais para sa B. Gamit ang kanyang pinakamainam na diskarte, A ay maaaring palaging magbigay sa kanyang sarili ng isang positibong average na kabayaran. Tandaan na kung ginamit ni A ang kanyang pinaka maingat (maximin) na diskarte (sa kasong ito, ang parehong mga diskarte A 1 at A 2 ay maximin), magkakaroon siya ng average na kabayaran na katumbas ng zero. Kaya, ang paggamit ng isang halo-halong diskarte ay nagbibigay sa A ng pagkakataong mapagtanto ang kanyang kalamangan sa paglipas ng B, na lumitaw sa ilalim ng ibinigay na mga patakaran ng laro.

Tukuyin natin ang pinakamainam na diskarte B. Mayroon kaming: q 1 * 1 + q 2 * 0 = 1/3, q 1 = 1/3, q 2 = 2/3. Kung saan

ibig sabihin ang manlalaro B ay dapat magtiwala sa A sa isang katlo ng lahat ng mga kaso at bayaran siya ng 1 ruble nang hindi sinusuri, at sa dalawang katlo ng mga kaso - suriin. Pagkatapos siya, sa average, mawawala ang 1/3 para sa bawat laro. Kung ginamit niya ang kanyang minimax purong diskarte B 2 (huwag maniwala), matatalo siya sa average na 1/2 para sa bawat laro.

Ang solusyon sa larong 2 × 2 ay maaaring bigyan ng isang simpleng interpretasyong geometriko. Hayaan mayroong isang 2 × 2 laro na may matrix

Kumuha ng isang seksyon ng axis ng abscissa na may haba na 1 (Larawan 4.1). Ang kaliwang dulo ng seksyon (ang punto na may abscissa x = 0) ay kumakatawan sa diskarte A 1; ang kanang dulo ng seksyon (x = 1) - diskarte A 2. Gumuhit tayo ng dalawang patayo sa axis ng abscissa sa pamamagitan ng mga puntos 1 at 2 2: axis Ako–Ako at axis II - II... Sa axis Ako–Ako ipagpaliban namin ang mga panalo para sa diskarteng A 1; sa axis II - II-Wins na may diskarte A 2. Isaalang-alang ang diskarte ng kalaban B 1; nagbibigay ito ng dalawang puntos sa mga palakol Ako–Ako at II - II na may ordinates isang 11 at isang 21, ayon sa pagkakabanggit. Gumuhit tayo ng isang tuwid na linya B 1 B 1 sa pamamagitan ng mga puntong ito. Malinaw na, kung ilalapat natin ang halo-halong diskarte para sa diskarte ng kaaway B 1

pagkatapos ang aming average na kabayaran, pantay sa kasong ito sa isang 11 p 1 + a 21 p 2, ay kinakatawan ng isang punto M sa linya B 1 B 1; ang abscissa ng puntong ito ay katumbas ng p 2. Ang tuwid na linya ng 1 1 1, na kumakatawan sa kabayaran sa kaso ng diskarte 1, ay tinatawag na "diskarte 1".

Malinaw na, ang diskarte na B2 ay maaaring maitayo nang eksakto sa parehong paraan (Larawan 4.2).

Kailangan nating hanapin ang pinakamainam na diskarte S A *, iyon ay, isa kung saan ang minimum na kabayaran (para sa anumang pag-uugali ng B) ay magiging isang maximum. Upang magawa ito, nagtatayo kami ng isang mas mababang obligasyon sa kabayaran para sa mga diskarte na B 1, B 2, i. sirang linya B 1 NB 2 na minarkahan sa Fig. 4.2 na may isang naka-bold na linya. Ang mas mababang hangganan na ito ay ipahayag ang minimum na kabayaran ng manlalaro A para sa alinman sa kanyang magkahalong diskarte; ang puntong N, kung saan ang minimum na nakuha na ito ay umabot sa maximum nito, tumutukoy sa desisyon at sa presyo ng laro. Madaling ma-verify na ang ordinate ng point N ay ang presyo ng laro ν, at ang abscissa nito ay katumbas ng p 2 - ang dalas ng aplikasyon ng diskarte A 2 sa pinakamainam na halo-halong diskarte S A *.

Sa aming kaso, ang desisyon ng laro ay natutukoy ng intersection point ng mga diskarte. Gayunpaman, hindi ito palaging magiging kaso; sa igos Ipinapakita ng 4.3 ang kaso kung kailan, sa kabila ng pagkakaroon ng intersection ng mga diskarte, ang solusyon ay nagbibigay para sa parehong mga manlalaro ng purong diskarte (A 2 at B 2), at ang presyo ng laro ν = a 22. Sa kasong ito, ang matrix ay may isang saddle point, at ang diskarte A 1 ay malinaw na hindi kapaki-pakinabang, mula noon para sa anumang purong diskarte ng kalaban, nagbibigay ito ng mas kaunting pakinabang kaysa sa A2.

Sa kaso kung ang kalaban ay may sadyang hindi kanais-nais na diskarte, ang interpretasyong geometriko ay may form na ipinakita sa Fig. 4.4.

Sa kasong ito, ang mas mababang hangganan ng kabayaran ay kasabay ng diskarteng B 1, ang diskarte na B 2 ay halatang hindi kapaki-pakinabang para sa kalaban.

Ginawang posible ng interpretasyon ng geometriko na mailarawan din ang mas mababa at mataas na mga presyo ng laro (Larawan 4.5).

Upang ilarawan, nagtatayo kami ng mga geometric na interpretasyon ng mga larong 2 × 2 na isinasaalang-alang sa mga halimbawa 1 at 2 (Larawan 4.6 at 4.7).

Natiyak namin na ang anumang 2 × 2 na laro ay malulutas ng mga trick sa elementarya. Ang anumang 2xn na laro ay maaaring malutas sa eksaktong katulad na paraan. kung saan mayroon lamang kaming dalawang mga diskarte, at ang kaaway ay may isang di-makatwirang numero.

Ipagpalagay na mayroon kaming dalawang mga diskarte: А 1, А 2, at mga istratehiya ng kaaway - n: 1, 2 2, ..., n. Ang matrix ‖a ij ‖ ay ibinigay; binubuo ito ng dalawang mga hilera at n haligi. Katulad din sa kaso ng dalawang diskarte, binibigyan namin ang problema ng isang geometric na interpretasyon; ang mga diskarte ng kalaban ay kinakatawan ng mga tuwid na linya (Larawan 4.8). Binubuo namin ang mas mababang hangganan ng mga panalo (sirang linya B 1 MNB 2) at hahanapin dito ang puntong N na may pinakamataas na ordinate. Ang puntong ito ay nagbibigay ng solusyon sa laro (diskarte ) ang ordenado ng puntong N ay katumbas ng presyo ng larong ν, at ang abscissa ay katumbas ng dalas p 2 ng diskarte A 2.

Sa kasong ito, ang pinakamainam na diskarte ng kalaban ay nakuha sa pamamagitan ng paggamit ng isang halo ng dalawang "kapaki-pakinabang" na diskarte: B 2 at B 4, intersecting sa point N. Ang diskarte B 3 ay malinaw na hindi kapaki-pakinabang, at ang diskarte B 1 ay hindi kapaki-pakinabang para sa pinakamainam na diskarte SA *. Kung ang A ay nananatili sa kanyang pinakamainam na diskarte, kung gayon ang pagbabayad ay hindi magbabago, alinman sa kanyang mga "kapaki-pakinabang" na diskarte na ginagamit ng B, gayunpaman, magbabago ito kung ang B ay lumipat sa mga diskarte B 1 o B 3. Sa teorya ng laro, napatunayan na ang anumang may wakas na laro na mxn ay may isang solusyon kung saan ang bilang ng mga "kapaki-pakinabang" na diskarte ng magkabilang panig ay hindi lalampas sa hindi bababa sa dalawang numero m at n. Sa partikular, sumusunod ito mula sa palaging ang laro 2xm ay may solusyon kung saan hindi hihigit sa dalawang "kapaki-pakinabang" na diskarte ang lumahok sa magkabilang panig.

Gamit ang isang interpretasyong geometriko, maaaring magbigay ang isang madaling paraan upang malutas ang anumang 2xm na laro. Direkta mula sa pagguhit, nakakahanap kami ng isang pares ng "kapaki-pakinabang" na mga diskarte ng kalaban B j at B k, intersecting sa point N (kung higit sa dalawang diskarte ang lumusot sa point N, kumuha kami ng alinman sa dalawa). Alam namin na kung ang manlalaro A ay sumusunod sa kanyang pinakamainam na diskarte, kung gayon ang pagbabayad ay hindi nakasalalay sa proporsyon kung saan inilalapat niya ang B sa kanyang "kapaki-pakinabang" na mga diskarte, samakatuwid,

Mula sa mga equation na ito at sa kundisyon p 2 = 1 - p 1, nakita namin ang p1, p2 at ang presyo ng laro ν. Alam ang presyo ng laro, maaari mong agad na matukoy ang pinakamainam na diskarte Para dito, halimbawa, nalulutas ang sumusunod na equation: qja 1 j + qka 1 k = ν, kung saan qj + qk = 1. Sa kaso kung mayroon tayong mga diskarte, at ang kaaway ay mayroon lamang dalawa, malinaw naman, ang problema ay nalutas sa isang ganap na katulad na paraan; sapat na pansinin na sa pamamagitan ng pagbabago ng palatandaan ng panalo sa kabaligtaran, maaaring gawing isa ang manlalaro A mula sa "panalo" hanggang "pagkatalo". Maaari mong malutas ang laro nang hindi binabago ang nanalong tanda; pagkatapos ang problema ay malulutas nang direkta para sa B, ngunit hindi mas mababa, ngunit ang itaas na kabayaran ay itinayo (Larawan 4.9). Sa hangganan, isang point N na may minimum na ordinate ang hinahanap, na ang presyo ng laro ν.

Isaalang-alang at lutasin ang maraming mga halimbawa ng mga laro na 2 × 2 at 2xm, na pinasimple na mga halimbawa ng mga laro na may praktikal na kahalagahan.

Halimbawa 3. Nagpadala ang Side A ng dalawang bomba sa lugar ng kalaban B Ako at II; Ako lilipad sa harap, II- sa likod. Ang isa sa mga bomba - hindi alam nang maaga kung alin - dapat magdala ng bomba, ang iba pa ay nagsisilbing isang escort. Sa lugar ng kalaban, ang mga bomba ay inaatake ng isang mandirigmang B. Ang mga bomba ay armado ng mga kanyon ng iba't ibang mga rate ng sunog. Kung inaatake ng manlalaban ang likurang bombero II, pagkatapos ay ang mga kanyon lamang ng bomba na ito ang sumunog dito; kung inaatake niya ang harap na bomba, pagkatapos ay pinaputukan siya ng mga kanyon ng parehong mga bomba. Ang posibilidad ng pagpindot ng isang manlalaban sa unang kaso ay 0.3, sa pangalawang 0.7.

Kung ang manlalaban ay hindi kinunan ng defensive bombardment fire, hinahampas nito ang target na pinili nito na may posibilidad na 0.6. Ang gawain ng mga bomba ay upang dalhin ang bomba sa target; ang gawain ng manlalaban ay upang maiwasan ito, i. pagbaril ng isang bomba ng carrier. Kinakailangan na piliin ang pinakamainam na mga diskarte ng mga partido:

a) para sa panig A: aling bombero ang dapat gamitin bilang isang carrier?

b) para sa panig B: alin ang bomba na aatake?

Solusyon Mayroon kaming isang simpleng kaso ng isang 2 × 2 laro; panalo-posibilidad hindi pagkatalo ng carrier. Ang aming mga diskarte: Isang 1 - carrier - bomber Ako; Isang 2 - carrier - bombero II... Mga diskarte ng kaaway: B 1 - ang bomba ay inaatake Ako; B 2 - atake ng bomba II... Isulat natin ang game matrix, ibig sabihin hanapin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1.A 1 B 1 (carrier Ako, ay inaatake Ako). Ang carrier ay hindi maaabot kung ang mga bomba ay shoot down ang manlalaban, o huwag shoot down, ngunit hindi ito pindutin ang target nito: isang 11 = 0.7 + 0.3 * 0.4 = 0.82.

2.A 2 B 1 (carrier II, ay inaatake Ako). isang 21 = 1

3.A 1 B 2 (carrier Ako, ay inaatake II). Isang 12 = 1

4.A 2 B 2 (carrier II, ay inaatake II). 22 = 0.3 + 0.7 * 0.4 = 0.58

Ang game matrix ay mayroong form:

Ang ilalim na presyo ng laro ay 0.82; nangungunang presyo 1. Ang Matrix ay walang saddle point; naghahanap kami ng isang solusyon sa larangan ng magkahalong diskarte. Meron kami:

p 1 * 0.82 + p 2 * 1 = ν

p 1 * 1 + p 2 * 0.58 = ν

p 1 = 0.7; p 2 = 0.3

Ang aming pinakamainam na diskarte ay, iyon ay, bilang isang carrier, kailangan mong pumili ng mas madalas Ako, paano II... Ang presyo ng laro ay ν = 0.874. Alam ν, natutukoy namin ang q 1 at q 2 - ang mga frequency ng mga diskarte B 1 at B 2 sa pinakamainam na diskarte ng kalaban S B *. Mayroon kaming: q 1 * 0.82 + q 2 * 1 = 0.874 at q 2 = 1 - q 1, saan mula q 1 = 0.7; q 2 = 0.3, ibig sabihin, ang pinakamainam na diskarte ng kalaban ay .

Halimbawa 4. Inaatake ng Side A ang bagay, ipinagtatanggol ito ng panig B. Ang panig A ay may dalawang eroplano; Ang panig B ay may tatlong mga baril laban sa sasakyang panghimpapawid. Ang bawat sasakyang panghimpapawid ay nagdadala ng isang malakas na nakasisirang armas; upang ma-hit ang bagay, sapat na para sa kahit isang eroplano ang lumusot dito. Ang panig ng sasakyang panghimpapawid ay maaaring pumili ng alinman sa tatlong mga direksyon upang lumapit sa pasilidad: Ako, II, III(fig. 4.10). Ang kaaway (panig B) ay maaaring maglagay ng anuman sa kanyang mga baril sa anumang direksyon; sa kasong ito, ang bawat sandata ay nag-shoot lamang ng lugar ng puwang na may kaugnayan direksyon na ito, at hindi kinukunan ang mga kalapit na direksyon. Ang bawat baril ay maaari lamang magpaputok sa isang sasakyang panghimpapawid; ang fired eroplano ay hit ng posibilidad 1. Hindi alam ng Side A kung saan matatagpuan ang mga baril; hindi alam ng panig B kung saan magmula ang mga eroplano. Ang gawain ng Side A ay upang maabot ang bagay; ang gawain ng panig B ay upang maiwasan ang kanyang pagkatalo. Maghanap ng solusyon sa laro.

Solusyon Ang laro ay isang 2 × 3 na laro. Ang kabayaran ay ang posibilidad na maabot ang bagay. Ang aming mga posibleng diskarte ay: Isang 1 - magpadala ng isang eroplano nang paisa-isa sa dalawang magkakaibang direksyon. At 2 - ipadala ang parehong mga eroplano sa parehong direksyon. Mga diskarte ng kaaway: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - ilagay ang dalawang baril sa isang direksyon at isa sa kabilang direksyon; Sa 3 - ilagay ang lahat ng tatlong mga baril sa parehong direksyon. Binubuo namin ang matrix ng laro.

1.A 1 B 1 (lumilipad ang mga eroplano magkakaibang direksyon; isa-isang inilalagay ang mga baril). Malinaw na, sa kasong ito, hindi isang solong eroplano ang makakalusot sa object: isang 11 = 0.

2. А 2 В 1 (ang mga eroplano ay sabay na lumilipad sa parehong direksyon; ang mga baril ay inilalagay isa-isa). Malinaw na, sa kasong ito, isang sasakyang panghimpapawid ang pumasa sa bagay nang hindi nagpaputok: isang 21 = 1.

3. А 1 2 2 (ang mga eroplano ay lumilipad nang paisa-isa; ipinagtatanggol ng kaaway ang dalawang direksyon at iniiwan ang pangatlong walang proteksyon). Ang posibilidad na hindi bababa sa isang eroplano ang masira sa bagay ay katumbas ng posibilidad na ang isa sa kanila ay pipili ng isang hindi protektadong direksyon: isang 12 = 2/3.

4. А 2 В 2 (ang mga eroplano ay sabay na lumilipad sa isang direksyon; ipinagtatanggol ng kaaway ang isang direksyon gamit ang dalawang baril at ang isa ay may isa, iyon ay, talagang ipinagtatanggol ang isang direksyon at iniiwan ang dalawang walang proteksyon). Ang posibilidad na hindi bababa sa isang eroplano ang masira sa bagay ay katumbas ng posibilidad ng isang pares ng mga eroplano na pumili ng isang talagang hindi protektadong direksyon: isang 22 = 2/3.

5. A 1 B 3 (ang mga eroplano ay lumilipad nang paisa-isa; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong baril): a 13 = 1.

6. А 2 В 3 (ang parehong mga eroplano ay lumipad na magkasama; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong mga baril). Para sa bagay na ma-hit, ang sasakyang panghimpapawid ay dapat pumili ng isang hindi protektadong direksyon: isang 23 = 2/3.

Game Matrix:

Ipinapakita ng matrix na ang diskarte sa 3 ay malinaw naman na hindi maganda kung ihahambing sa 2 (maaaring malutas ito nang maaga). Nakakatawag diskarte sa 3, ang laro ay nabawasan sa isang 2 × 2 na laro:

Ang matrix ay may isang saddle point: ang ilalim na presyo ng larong 2/3 ay tumutugma sa nangungunang isa. Sa parehong oras, tandaan namin na para sa amin (A) na diskarte A 1 ay halatang hindi kapaki-pakinabang. Konklusyon: ang magkabilang panig A at B ay dapat palaging gumamit ng kanilang purong diskarte A 2 at B 2, ibig sabihin kailangan naming magpadala ng mga eroplano ng 2, pagpili nang sapalaran ang direksyon kung saan ipinadala ang pares; dapat ilagay ng kalaban ang kanyang mga sandata sa sumusunod na paraan: dalawa sa isang direksyon, isa sa isa pa, at ang pagpili ng mga tagubiling ito ay dapat ding gawin nang sapalaran (dito, tulad ng nakikita natin, na may "dalisay na diskarte" kasama ang isang elemento ng pagkakataon) . Ang paglalapat ng mga pinakamainam na diskarte na ito, palagi kaming makakakuha ng isang pare-pareho ang average na kabayaran na 2/3 (ibig sabihin, ang bagay ay tatamaan ng isang 2/3 na posibilidad). Tandaan na ang nahanap na solusyon sa laro ay hindi lamang ang isa; bukod sa desisyon sa malinis na diskarte, mayroong isang buong seksyon ng halo-halong mga diskarte ng manlalaro A, na kung saan ay pinakamainam, mula p 1 = 0 hanggang p 1 = 1/3 (Larawan 4.11).

Madali, halimbawa, upang makita nang direkta na ang parehong average na kabayaran ng 2/3 ay makukuha kung ilalapat namin ang aming mga diskarte A1 at A2 sa mga proporsyon ng 1/3 at 2/3.

Halimbawa 5. Ang mga kundisyon ay pareho sa naunang halimbawa, ngunit ang apat na direksyon ng pag-atake ay posible para sa amin, at ang kaaway ay mayroong apat na sandata.

Solusyon Mayroon pa kaming dalawang posibleng diskarte: Isang 1 - magpadala ng mga eroplano nang paisa-isa, Isang 2 - magkakasamang magpadala ng dalawang mga eroplano. Ang kaaway ay may limang posibleng diskarte: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - ilagay ang dalawang baril sa dalawang magkakaibang direksyon; Sa 3 - ilagay ang dalawang baril sa isang direksyon at isa-isa sa isa pang dalawa; Sa 4, ilagay ang tatlong baril sa isang direksyon at ang isa sa kabilang direksyon; Sa 5 - ilagay ang lahat ng apat na baril sa parehong direksyon. Ang mga istratehiyang B 4, B 5 ay itatapon nang maaga bilang halatang hindi kapaki-pakinabang. Nangangatuwiran nang katulad sa naunang halimbawa, binubuo namin ang game matrix:

Ang mas mababang presyo ng laro ay 1/2, ang nasa itaas ay 3/4. Ang matrix ay walang saddle point; ang solusyon ay nakasalalay sa lugar ng magkahalong diskarte. Gamit ang interpretasyong geometriko (Larawan 4.12), isama natin ang mga "kapaki-pakinabang" na diskarte ng kaaway: B 1 at B 2.

Ang mga frequency p 1 at p 2 ay natutukoy mula sa mga equation: p 1 * 0 + (1 - p 1) * 1 = ν at p 1 * 5/6 + (1 - p 1) * 1/2 = ν; saan p 1 = 3/8; p 2 = 5/8; ν = 5/8, ibig sabihin ang aming pinakamainam na diskarte ay ... Gamit ito, ginagarantiyahan namin ang aming sarili ng average na mga panalo na 5/8. Alam ang presyo ng laro ν = 5/8, nakita namin ang mga frequency q 1 at q 2 ng mga "kapaki-pakinabang" na diskarte ng kalaban: q 1 * 0 + (1 - q 1) * 5/6 = 5/8, q 1 = ¼, q 2 = ¾. Ang pinakamainam na diskarte ng kalaban ay: .

Halimbawa 6. Ang panig A ay may dalawang diskarte A 1 at A 2, ang gilid B ay may apat na B 1, B 2, B 3 at B 4. Ang game matrix ay mayroong form:

Maghanap ng solusyon sa laro.

Solusyon Mas mababang presyo ng laro 3; tuktok 4. Ang interpretasyong geometriko (fig 4.13) ay nagpapakita na ang B 1 at B 2 o B 2 at B 4 ay kapaki-pakinabang na diskarte:

Ang Player A ay walang hanggan maraming pinakamainam na halo-halong mga diskarte: sa pinakamainam na diskarte, ang p 1 ay maaaring mag-iba mula 1/5 hanggang 4/5. Ang presyo ng laro ν = 4. Ang Player B ay may dalisay na pinakamainam na diskarte B 2.

§ 5. Pangkalahatang mga pamamaraan para sa paglutas ng may wakas na mga laro

Sa ngayon, isinasaalang-alang lamang namin ang mga pinaka-elementong laro ng uri ng 2xn, na maaaring madaling malulutas at payagan ang isang maginhawa at madaling maunawaan na interpretasyon ng geometriko. Sa pangkalahatang kaso, ang paglutas ng laro na mxn ay isang mahirap na problema, at ang pagiging kumplikado ng problema at ang dami ng kinakailangang pagkalkula upang malutas ito ay tumataas nang malaki sa pagtaas ng m at n. Gayunpaman, ang mga paghihirap na ito ay hindi isang pangunahing katangian at nauugnay lamang sa isang napakalaking dami ng mga kalkulasyon, na sa ilang mga kaso ay maaaring maging praktikal na hindi praktikal. Ang pangunahing aspeto ng pamamaraan para sa paghahanap ng solusyon ay mananatiling pareho para sa anumang m.

Ilarawan natin ito sa halimbawa ng larong 3xn. Bigyan natin ito ng isang interpretasyong geometriko - isa na sa spatial. Ang aming tatlong estratehiya A 1, A 2 at A 3 ay ilalarawan ng tatlong puntos sa eroplano hoy; ang una ay namamalagi sa pinagmulan (Larawan.5.1), ang pangalawa at pangatlo - sa mga palakol Oh at OU sa layo na 1 mula sa simula.

Ang mga palakol ay iginuhit sa pamamagitan ng mga puntong A 1, A 2 at A 3 AkoAko, IIII at IIIIII patayo sa eroplano hoy... Sa axis AkoAko ang mga nadagdag ay idineposito sa diskarteng A 1 sa mga palakol IIII at IIIIII- Mga panalo na may mga diskarte A 2, A 3. Ang bawat diskarte ng kaaway na B j ay inilalarawan ng isang eroplano na pinuputol sa mga palakol AkoAko, IIII at IIIIII mga segment na katumbas ng mga kabayaran para sa mga kaukulang diskarte A 1, A 2 at A 3 at diskarte B j. Sa gayon itinayo ang lahat ng mga diskarte ng kaaway, nakakakuha kami ng isang pamilya ng mga eroplano sa tatsulok na A 1, A 2 at A 3 (Larawan 5.2). Para sa pamilyang ito, maaari ka ring bumuo ng isang mas mababang hangganan ng pagbabayad, tulad ng ginawa namin sa 2xn case, at hanapin sa hangganan na ito point N na may pinakamataas na taas sa itaas ng eroplano hoy... Ang taas na ito ang magiging gastos ng laro ν.

Ang mga frequency p 1, p 2, p 3 ng mga diskarte A 1, A 2 at A 3 sa pinakamainam na diskarte SA * ay matutukoy ng mga coordinate (x, y) ng point N, katulad ng: p 2 = x, p 3 = y, p 1 = 1 - p 2 - p 3. Gayunpaman, tulad ng isang geometric na konstruksyon, kahit na para sa 3xn case, ay hindi madaling ipatupad at nangangailangan ng maraming oras at pagsisikap ng imahinasyon. Sa pangkalahatang kaso ng isang laro, inililipat ito sa isang m-dimensional na puwang at nawawala ang lahat ng kalinawan, bagaman ang paggamit ng geometric terminology sa isang bilang ng mga kaso ay maaaring maging kapaki-pakinabang. Kapag nilulutas ang mga laro sa mxn, sa pagsasagawa mas madaling gamitin ang hindi mga geometric na pagkakatulad, ngunit ang mga pamamaraang analytical ng computational, lalo na't ang mga pamamaraang ito ang tanging angkop para sa paglutas ng isang problema sa mga computer.

Ang lahat ng mga pamamaraang ito ay mahalagang pakuluan sa paglutas ng isang problema sa pamamagitan ng sunud-sunod na mga pagsubok, ngunit ang pag-order ng pagkakasunud-sunod ng mga pagsubok ay nagbibigay-daan sa iyo upang bumuo ng isang algorithm na hahantong sa isang solusyon sa pinaka-matipid na paraan. Dito ay magtutuon kami ng saglit sa isang pamamaraang computational para sa paglutas ng mga laro sa mxn - ang tinaguriang "linear program" na pamamaraan. Para sa mga ito, unang nagbibigay kami ng isang pangkalahatang pahayag ng problema ng paghahanap ng isang solusyon sa laro mxn. Hayaan ang isang laro na mxn na may mga diskarte sa m A 1, A 2,…, Isang m ng manlalaro A at mga diskarte na B 1, B 2,…, B n ng manlalaro B ay bibigyan at isang pagbabayad matrix ‖a i j ‖ ay ibinigay. Kinakailangan upang makahanap ng isang solusyon sa laro, ibig sabihin dalawang pinakamainam na halo-halong diskarte ng mga manlalaro A at B

kung saan ang p 1 + p 2 + ... + p m = 1; q 1 + q 2 +… + q n = 1 (ang ilan sa mga bilang na p i at q j ay maaaring katumbas ng zero).

Ang aming pinakamainam na diskarte na S A * ay dapat magbigay sa amin ng isang kabayaran na hindi mas mababa sa ν para sa anumang pag-uugali ng kalaban, at isang pagbabayad na katumbas ng ν para sa kanyang pinakamainam na pag-uugali (diskarte S B *). Katulad nito, ang diskarte na S B * ay dapat magbigay sa kalaban ng isang pagkawala na hindi hihigit sa ν para sa anumang pag-uugali at katumbas ng ν para sa aming pinakamainam na pag-uugali (diskarte S A *).

Ang halaga ng presyo ng laro ν sa kasong ito ay hindi namin alam; ipalagay natin na ito ay katumbas ng ilan positibong numero... Sa paniniwalang ito, hindi namin nilalabag ang pangkalahatang pangangatuwiran; para sa ν> 0, halatang sapat na ang lahat ng mga elemento ng matrix ‖a i j ‖ maging hindi nauugnay. Ito ay maaaring laging makamit sa pamamagitan ng pagdaragdag sa mga elemento ‖a i j ‖ isang sapat na malaking positibong halaga L; habang ang presyo ng laro ay tataas ng L at ang desisyon ay hindi magbabago.

Ipagpalagay na pinili namin ang aming pinakamainam na diskarte S A *. Pagkatapos ang aming average na kabayaran sa diskarte ng kalaban B j ay magiging: a j = p 1 a 1j + p 2 a 2j +… + p m a mj. Ang aming pinakamainam na diskarte sa S A * ay may pag-aari na, para sa anumang pag-uugali ng kalaban, nagbibigay ito ng kabayaran na hindi kukulangin sa ν; samakatuwid, ang alinman sa mga bilang na isang j ay hindi maaaring mas mababa sa ν. Nakukuha namin ang isang bilang ng mga kundisyon:

Hinahati namin ang mga hindi pagkakapantay-pantay (5.1) ng isang positibong halaga ν at ipahiwatig

Pagkatapos ang mga kundisyon (5.1) ay maaaring nakasulat sa form

kung saan ang ξ 1, ξ 2,…, ξ m ay mga hindi negatibong numero. Dahil р 1 + p 2 +… + p m = 1, kung gayon ang dami ξ 1, ξ 2,…, masiyahan ang kondisyon

(5.3) ξ 1 + ξ 2 +… + ξ m = 1 / ν.

Nais naming gawin ang aming mga garantisadong panalo hangga't maaari hangga't maaari; malinaw naman, at the same time tamang bahagi pagkakapantay-pantay (5.3) tumatagal ng isang minimum na halaga. Kaya, ang problema ng paghahanap ng isang solusyon sa laro ay nabawasan sa sumusunod na problema sa matematika: tukuyin ang mga hindi nabibilang na halaga ξ 1, ξ 2,…, satisf m kasiya-siyang mga kondisyon (5.2) upang ang kanilang kabuuan Φ = ξ 1 + ξ 2 +… + ξ m ay minimal.

Karaniwan, kapag ang paglutas ng mga problema na nauugnay sa paghahanap ng matinding halaga (maxima at minima), ang pagpapaandar ay naiiba at ang mga derivatives ay ipinapantay sa zero. Ngunit ang gayong pamamaraan ay walang silbi sa kasong ito, dahil ang pagpapaandar Φ, na kailangang mabawasan sa isang minimum, ay linear, at ang mga derivatives nito patungkol sa lahat ng mga argumento ay katumbas ng pagkakaisa, i. huwag maglaho kahit saan. Dahil dito, ang maximum ng pagpapaandar ay naabot sa isang lugar sa hangganan ng saklaw ng pagkakaiba-iba ng mga argumento, na tinutukoy ng kinakailangan ng hindi negatibiti ng mga argumento at kundisyon (5.2). Ang pamamaraan ng paghanap ng matinding halaga sa pamamagitan ng pagkita ng kaibhan ay hindi angkop din sa mga kaso kung ang maximum ng mas mababa (o minimum ng itaas) na limitasyon sa pagbabayad ay natutukoy para sa paglutas ng laro, tulad ng ginawa namin, halimbawa, kapag nilulutas ang 2xn mga laro. Sa katunayan, ang mas mababang hangganan ay binubuo ng mga seksyon ng mga tuwid na linya, at ang maximum ay naabot hindi sa punto kung saan ang derivative ay katumbas ng zero (walang ganoong punto sa lahat), ngunit sa hangganan ng agwat o sa puntong ng interseksyon ng mga tuwid na seksyon.

Upang malutas ang mga naturang problema, na kung saan ay karaniwang sa pagsasanay, isang espesyal na linear na patakaran ng pamahalaan programa ay binuo sa matematika. Ang linear na problema sa pagprograma ay nakalagay bilang mga sumusunod. Ang isang sistema ng mga linear equation ay ibinibigay:

Kinakailangan upang makahanap ng mga hindi nagkakahalagang halaga ng mga dami ξ 1, ξ 2,…, ξ m kasiya-siyang kondisyon (5.4) at sabay na pinapaliit ang ibinigay na homogenous na linear function ng mga dami ξ 1, ξ 2,…, ξ m (linear form): Φ = c 1 ξ 1 + c 2 ξ 2 +… + cm ξ m

Madaling mapatunayan na ang problema sa itaas ng teorya ng laro ay isang espesyal na kaso ng isang problema sa linear na programa para sa c 1 = c 2 = ... = cm = 1. Sa unang tingin, maaaring ang mga kondisyon (5.2) ay hindi katumbas ng mga kundisyon (5.4), dahil sa halip na pantay na mga palatandaan naglalaman sila ng mga palatandaan ng hindi pagkakapantay-pantay. Gayunpaman, madaling mapupuksa ang mga palatandaan ng hindi pagkakapantay-pantay sa pamamagitan ng pagpapakilala ng mga bagong kathang-isip na di-negatibong mga variable na z 1, z 2,…, z n at mga kundisyon sa pagsulat (5.2) sa form:

Ang form Φ na kailangang i-minimize ay Φ = ξ 1 + ξ 2 + ... + ξ m. Ginagawang posible ng linear na patakaran ng programa na piliin ang mga halagang ξ 1, ξ 2,…, ξ m na nakakatugon sa mga nakasaad na kinakailangan sa pamamagitan ng isang maliit na bilang ng mga sunud-sunod na sample. Para sa higit na kalinawan, ipapakita namin dito ang paggamit ng aparatong ito nang direkta sa materyal ng paglutas ng mga partikular na laro.

Halimbawa 1. Kinakailangan upang makahanap ng isang solusyon sa larong 3 × 3 na ibinigay sa Halimbawa 2 § 1 na may matrix:

Upang gawing hindi negatibo ang lahat ng isang ij, idinagdag namin ang lahat ng mga elemento ng matrix L = 5. Nakukuha namin ang matrix:

Sa kasong ito, tataas ang presyo ng laro ng 5, at hindi magbabago ang desisyon.

Tukuyin natin ang pinakamainam na diskarte S A *. Mga Kundisyon (5.2) ay may form:

kung saan ξ 1 = p 1 / ν, ξ 2 = p 2 / ν, ξ 3 = p 3 / ν. Upang matanggal ang mga palatandaan ng hindi pagkakapantay-pantay, ipinakikilala namin ang mga variable ng dummy z 1, z 2, z 3; ang mga kundisyon (5.6) ay isusulat sa form:

Ang linear form na Φ ay mayroong form: Φ = ξ 1 + ξ 2 + ξ 3 at dapat gawin nang maliit hangga't maaari. Kung ang lahat ng tatlong mga diskarte B ay "kapaki-pakinabang", pagkatapos lahat ng tatlong mga variable na dummy z 1, z 2, z 3 ay nawala (ibig sabihin, isang kabayaran na katumbas ng presyo ng laro ν ay makakamit para sa bawat diskarte B j). Ngunit wala pa rin kaming dahilan upang sabihin na ang lahat ng tatlong mga diskarte ay "kapaki-pakinabang". Upang suriin ito, susubukan naming ipahayag ang form Φ sa mga tuntunin ng mga variable ng dummy z 1, z 2, z 3 at tingnan kung makakamit natin, sa pag-aakalang ang mga ito ay katumbas ng zero, ang minimum ng form. Upang magawa ito, nilulutas namin ang mga equation (5.7) na patungkol sa mga variable ξ 1, ξ 2, ξ 3 (ibig sabihin, ipinahahayag namin ang ξ 1, ξ 2, ξ 3 sa mga tuntunin ng dummy variable na z 1, z 2, z 3 ):

Ang pagdaragdag ng ξ 1, ξ 2, ξ 3, nakukuha natin ang: Φ = 1/5 + z 1/20 + z 2/10 + z 3/20. Narito ang mga coefficients para sa lahat ng z ay positibo; samakatuwid, ang anumang pagtaas sa z 1, z 2, z 3 sa itaas ng zero ay maaari lamang humantong sa isang pagtaas sa form Φ, at nais naming ito ay maging minimal. Samakatuwid, ang mga halagang z 1, z 2, z 3 na gumagawa ng form na Φ sa isang minimum ay z 1 = z 2 = z 3 = 0. Samakatuwid, ang minimum na halaga ng form Φ ay: 1 / ν = 1 / 5, saan nagmula ang presyo ng larong ν = 5. Ang pagpapalit ng zero na halaga z 1, z 2, z 3 sa mga pormula (5.8), matatagpuan natin ang: ξ 1 = 1/20, ξ 2 = 1/10, ξ 3 = 1/20, o, pagpaparami ng mga ito ng ν, p 1 = 1/4, p 2 = 1/2, p 3 = 1/4. Kaya, ang pinakamainam na diskarte A ay natagpuan: , ibig sabihin dapat nating isulat ang bilang 1 sa isang isang-kapat ng lahat ng mga kaso, 2 sa kalahati ng mga kaso, at 3 sa natitirang quarter ng mga kaso.

Alam ang presyo ng laro ν = 5, posible na makahanap ng pinakamainam na diskarte ng kalaban gamit ang mga kilalang pamamaraan ... Upang magawa ito, gagamitin namin ang aming anumang dalawang "kapaki-pakinabang" na diskarte (halimbawa, A 2 at A 3) at isulat ang mga equation:

9q 1 + 11 (1-q 2 -q 1) = 5,

saan galing q 1 = q3 = 1/4; q 2 = 1/2. Ang pinakamainam na diskarte ng kalaban ay magiging kapareho ng atin: ... Bumalik tayo ngayon sa orihinal na (hindi nabago) na laro. Upang magawa ito, kinakailangan lamang na ibawas ang halagang L = 5 mula sa presyo ng larong ν = 5, idinagdag sa mga elemento ng matrix. Nakukuha namin ang presyo ng orihinal na laro v 0 = 0. Samakatuwid, ang pinakamainam na mga diskarte ng parehong partido ay nagbibigay ng isang average na kabayaran na katumbas ng zero; ang laro ay pantay na kapaki-pakinabang o hindi maganda para sa parehong partido.

Halimbawa 2. Ang Sports Club A ay may tatlong mga pagpipilian para sa komposisyon ng koponan A 1, A 2 at A 3. Club B - nasa tatlong variant din B 1, B 2 at B 3. Kapag nag-aaplay upang lumahok sa kumpetisyon, wala sa mga club ang nakakaalam kung aling lineup ang pipiliin ng kalaban. Ang mga posibilidad ng club Isang panalong sa ilalim ng iba't ibang mga lineup, na halos kilala mula sa karanasan ng mga nakaraang pagpupulong, ay ibinibigay ng matrix:

Alamin kung gaano kadalas dapat maglaro ang mga club ng bawat iskwad laban sa bawat isa upang makamit ang pinakamataas na average na bilang ng mga tagumpay.

Solusyon Ang mas mababang presyo ng laro ay 0.4; nangungunang 0.6; naghahanap kami ng isang solusyon sa larangan ng magkahalong diskarte. Upang hindi makitungo sa mga praksyon, pinarami namin ang lahat ng mga elemento ng matrix ng 10; sa kasong ito, ang presyo ng laro ay tataas ng 10 beses, at ang desisyon ay hindi magbabago. Nakukuha namin ang matrix:

Mga Kundisyon (5.5) ay may form:

at ang minimum na kundisyon Φ = ξ 1 + ξ 2 + ξ 3 = min.

Suriin kung ang lahat ng tatlong mga diskarte ng kalaban ay "kapaki-pakinabang". Bilang isang teorya, unang ipinapalagay namin na ang mga variable ng dummy z 1, z 2, z 3 ay katumbas ng zero, at para sa pagpapatunay ay nalulutas namin ang mga equation (5.10) para sa ξ 1, ξ 2, ξ 3:

(5.12) 136Φ = 30 + 13z 1 + 18z 2 - 51z 3

Ipinapakita ng Formula (5.12) na ang isang pagtaas sa mga variable na z 1 at z 2 sa paghahambing sa kanilang ipinapalagay na halaga ng zero ay maaari lamang dagdagan Φ, habang ang isang pagtaas sa z 3 ay maaaring bawasan Φ. Gayunpaman, ang pagtaas sa z 3 ay dapat gawin nang maingat upang ang mga halagang ξ 1, ξ 2, ξ 3, depende sa z 3, ay hindi maging negatibo sa kasong ito. Samakatuwid, sa kanang bahagi ng mga pagkakapantay-pantay (5.11), inilalagay namin ang mga halagang z 1 at z 2 na katumbas ng zero, at tataasan namin ang halagang z 3 sa mga tinatanggap na limitasyon (hanggang sa alinman sa mga halagang 1, ξ 2, ξ 3 nawawala). Mula sa pangalawang pagkakapantay-pantay sa (5.11) makikita na ang pagtaas sa z 3 ay "ligtas" para sa halagang ξ 2 - tataas lamang ito mula rito. Tulad ng para sa mga dami na ξ 1 at ξ 3, dito ang pagtaas ng z 3 ay posible hanggang sa isang tiyak na limitasyon lamang. Ang dami ξ 1 ay nawawala sa z 3 = 10/23; ang dami ξ 3 nawala nang mas maaga, nasa z 3 = 1/4. Samakatuwid, na binibigyan ang z 3 ng maximum na pinapayagan na halagang z 3 = 1/4, sa kasong ito ay zero ang halagang ξ 3.

Upang suriin kung ang form Φ ay nagiging isang minimum sa z 1 = 0, z 2 = 0, ξ 3 = 0, ipinapahayag namin ang natitirang mga (nonzero) variable sa mga tuntunin ng sinasabing zero z 1, z 2, ξ 3. Ang paglutas ng mga equation (5.10) na patungkol sa ξ 1, ξ 2 at z 3, nakukuha namin:

(5.13) 32Φ = 7 + Зz 1 + 4z 2 + ξ 3

Ito ay nakikita mula sa pormula (5.13) na ang anumang pagtaas sa z 1, z 2, ξ 3 sa kanilang ipinapalagay na zero halaga ay maaari lamang dagdagan ang hugis ng. Samakatuwid, ang solusyon sa laro ay natagpuan; natutukoy ito ng mga halagang z 1 = z 2 = ξ 3 = 0, kung saan ξ 1 = 1/32, ξ 2 = 3/16, z 3 = 1/4. Pagpalit sa formula (5.13), nakita namin ang presyo ng laro ν: 32Φ = 7 = 32 / ν; ν = 32/7. Ang aming pinakamainam na diskarte: ... Ang mga diskarte na "Kapaki-pakinabang" (mga komposisyon A 1 at A 2) ay dapat na ilapat sa mga frequency na 1/7 at 6/7; komposisyon A 3 - hindi kailanman nalalapat.

Upang hanapin ang pinakamainam na diskarte ng kalaban, sa pangkalahatang kaso, maaari mong gawin ang mga sumusunod: baguhin ang tanda ng bayad sa kabaligtaran, magdagdag ng isang pare-pareho na halaga L sa mga elemento ng matrix upang gawin silang hindi negatibo, at malutas ang problema para sa kalaban sa katulad na paraan sa paglutas nito para sa ating sarili. Gayunpaman, ang katotohanan na alam na natin ang presyo ng laro ν medyo pinapasimple ang problema. Bukod dito, sa ito tiyak na kaso Ang gawain ay karagdagang pinasimple ng katotohanan na dalawang "kapaki-pakinabang" na diskarte lamang ng kalaban, B 1 at B 2, lumahok sa solusyon, dahil ang halaga ng z 3 ay hindi zero, at, samakatuwid, na may diskarte B 3, ang presyo ng laro ay hindi naabot. Pagpili ng anumang "kapaki-pakinabang" na diskarte ng manlalaro A, halimbawa ng A 1, mahahanap ng isa ang mga frequency q 1 at q 2. Upang magawa ito, nagsusulat kami ng equation na 8q 1 + 2 (1 - q 1) = 32/7, saan nanggaling ang q 1 = 3/7, q 2 = 4/7; ang pinakamainam na diskarte ng kalaban ay: , ibig sabihin ang kaaway ay hindi dapat gumamit ng komposisyon B 3, at ang mga komposisyon B 1 at B2 ay dapat gamitin sa mga dalas ng 3/7 at 4/7.

Bumabalik sa orihinal na matrix, natutukoy namin ang totoong halaga ng laro ν 0 = 32/7: 10 = 0.457. Nangangahulugan ito na para sa isang malaking bilang pagpupulong Ang bilang ng mga tagumpay para sa Club A ay magiging 0.457 ng lahat ng mga pagpupulong.

§ 6. Tinatayang mga pamamaraan para sa paglutas ng mga laro

Kadalasan, sa mga praktikal na problema, hindi na kailangang makahanap ng eksaktong solusyon sa laro; sapat na ito upang makahanap ng isang tinatayang solusyon na nagbibigay ng isang average na kabayaran malapit sa presyo ng laro. Ang isang tinatayang kaalaman sa halaga ng laro ν ay maaaring ibigay sa pamamagitan ng isang simpleng pagtatasa ng matrix at ang pagpapasiya ng mas mababang (α) at ​​itaas (β) na mga presyo ng laro. Kung ang α at β ay malapit, halos hindi na kailangang maghanap para sa isang eksaktong solusyon, ngunit sapat na upang pumili ng purong mga diskarte sa minimax. Sa mga kaso kung saan ang α at β ay hindi malapit, ang isa ay makakakuha ng isang praktikal na solusyon gamit ang mga pamamaraang numerikal para sa paglutas ng mga laro, kung saan maikling na-highlight namin ang pamamaraan ng pag-ulit.

Ang ideya sa likod ng pamamaraan ng pag-ulit ay ang mga sumusunod. Ang isang "naisip na eksperimento" ay nilalaro kung saan ang kalaban A at B ay gumagamit ng kanilang mga diskarte laban sa bawat isa. Ang eksperimento ay binubuo ng isang pagkakasunud-sunod ng mga elementong laro, na ang bawat isa ay may isang matrix ng isang naibigay na laro. Nagsisimula ito sa katotohanang kami (manlalaro A) ay pumili ng di-makatwirang isa sa aming mga diskarte, halimbawa, A i. Tumutugon dito ang kaaway sa kanyang diskarte na B j, na kung saan ay ang hindi gaanong kapaki-pakinabang para sa atin, i. binabago ang kabayaran para sa diskarte A i sa isang minimum. Tumugon kami sa paglipat na ito sa aming diskarte А k, na nagbibigay ng maximum na average na kabayaran kapag ang kalaban ay gumagamit ng diskarte B j. Dagdag dito - ang ulit ng kaaway. Tumugon siya sa aming pares ng mga gumagalaw na A i at A k sa kanyang diskarte na B j, na nagbibigay sa amin ng pinakamaliit na average na kabayaran para sa dalawang diskarte na ito (A i, A k), at iba pa. Sa bawat hakbang ng umuulit na proseso, ang bawat manlalaro ay tumutugon sa anumang paglipat ng iba pang manlalaro gamit ang kanyang sariling diskarte na pinakamainam na kamag-anak sa lahat ng kanyang nakaraang paggalaw, na isinasaalang-alang bilang isang uri ng halo-halong diskarte, kung saan ang mga dalisay na diskarte ay ipinakita sa mga proporsyon na naaayon sa ang dalas ng kanilang aplikasyon.

Ang pamamaraang ito ay, tulad ng, isang modelo ng totoong praktikal na "pagsasanay" ng mga manlalaro, kapag ang bawat isa sa kanila ay nagsisiyasat sa pamamagitan ng karanasan sa paraan ng pag-uugali ng kalaban at sinusubukan na tumugon dito sa paraang kapaki-pakinabang para sa kanyang sarili. Kung ang tulad ng isang panggagaya sa proseso ng pag-aaral ay nagpatuloy para sa isang mahabang sapat na oras, pagkatapos ang average na kabayaran sa bawat isang pares ng mga paglipat (elementong laro) ay may posibilidad na ang presyo ng laro, at ang mga frequency p 1 ... p m; q 1 ... q n, na natutugunan ng mga diskarte ng mga manlalaro sa rally na ito, lalapit sa mga frequency na tumutukoy sa pinakamainam na diskarte. Ipinapakita ng mga pagkalkula na ang tagpo ng pamamaraan ay napakabagal, ngunit hindi ito hadlang para sa mga makina ng pagkalkula ng bilis.

Ilarawan natin ang aplikasyon ng umuulit na pamamaraan gamit ang halimbawa ng larong 3 × 3 na nalutas sa Halimbawa 2 ng nakaraang seksyon. Ang laro ay ibinigay ng matrix:

Ipinapakita ng Talahanayan 6.1 ang unang 18 mga hakbang ng paulit-ulit na proseso. Naglalaman ang unang haligi ng bilang ng laro sa elementarya (isang pares ng mga galaw) n; sa pangalawang - numero ako ang napiling diskarte ng manlalaro A; sa susunod na tatlo - "naipon na mga panalo" para sa una n mga laro na may mga diskarte sa kaaway B 1, B 2, B 3. Ang pinakamaliit sa mga halagang ito ay may salungguhit. Susunod ay ang numero j ang diskarte na pinili ng kaaway, at, nang naaayon, ang naipon na nakuha para sa n mga laro na may mga diskarte A 1, A 2, A 3 ng mga halagang ito, ang maximum ay may salungguhit mula sa itaas. Natutukoy ng mga may salungguhit na halaga ang pagpipilian ng diskarte sa pagtugon ng iba pang manlalaro. Ang mga sumusunod na graph ay sunud-sunod na nagpapakita: ang minimum na average na kabayaran ν, katumbas ng minimum na naipon na kabayaran na hinati sa bilang ng mga laro n; maximum na average na panalo na katumbas ng maximum na naipon na mga panalo na hinati sa n, at ang ibig sabihin ng kanilang arithmetic na ν * = (ν +) / 2. Kapag dumarami n lahat ng tatlong dami ν, at ν * ay lalapit sa presyo ng larong ν, ngunit ang halagang ν *, natural, ay lalapit ito sa medyo mabilis.

Talahanayan 6.1.

Tulad ng nakikita mo mula sa halimbawa, ang tagpo ng mga pag-ulit ay napakabagal, ngunit pa rin, kahit na ang isang maliit na pagkalkula ay ginagawang posible upang makahanap ng isang tinatayang halaga ng presyo ng laro at ihayag ang pagkalat ng mga "kapaki-pakinabang" na diskarte. Kapag gumagamit ng mga makina ng pagkalkula, ang halaga ng pamamaraan ay tataas nang malaki. Ang bentahe ng umuulit na pamamaraan para sa paglutas ng mga laro ay ang dami at pagiging kumplikado ng mga pagkalkula na medyo mahina habang tumataas ang bilang ng mga diskarte. m at n.

§ 7. Mga pamamaraan para sa paglutas ng ilang mga walang katapusang laro

Ang isang walang katapusang laro ay isang laro kung saan hindi bababa sa isang panig ang may isang walang katapusang bilang ng mga diskarte. Ang mga pangkalahatang pamamaraan para sa paglutas ng mga nasabing laro ay hindi pa nabubuo. Gayunpaman, para sa pagsasanay, ang ilang mga espesyal na kaso ay maaaring maging interesado, na aminin ang isang medyo simpleng solusyon. Isaalang-alang ang laro ng dalawang kalaban A at B, na ang bawat isa ay may isang walang hanggan (hindi mabilang) na hanay ng mga diskarte; ang mga diskarte para sa manlalaro A ay tumutugma sa magkakaibang kahulugan patuloy na pagbabago ng parameter NS, at para sa parameter - sa... Sa kasong ito, sa halip na ang matrix ‖ isang ij, ang laro ay tinukoy ng ilang pagpapaandar ng dalawa na patuloy na magkakaibang mga argumento a (x, y), na tatawagin natin ang pagpapaandar na pagpapaandar (tandaan na ang pagpapaandar mismo a (x, y) ay hindi dapat magpapatuloy). Manalo ng pagpapaandar a (x, y) maaaring kinatawan ng geometrically ng ilang mga ibabaw a (x, y) sa lugar ng pagbabago ng mga argumento (x, y)(fig. 7.1)

Pagsusuri ng pagpapaandar na kabayaran a (x, y) ay ginaganap na katulad sa pagtatasa ng matrix sa pagbabayad. Una, ang mas mababang presyo ng laro α ay matatagpuan; para dito natutukoy ito para sa bawat isa NS minimum na pag-andar a (x, y) para sa lahat sa:, pagkatapos ang maximum ng mga halagang ito ay hinanap para sa lahat NS(maximin):

Ang pinakamataas na presyo ng laro (minimax) ay natutukoy sa parehong paraan:

Isaalang-alang ang kaso kung kailan α = β. Dahil ang halaga ng laro ν ay laging nasa pagitan ng α at β, ang kanilang kabuuang halaga ay ν. Ang pagkakapantay-pantay α = β ay nangangahulugang ang ibabaw a (x, y) ay may isang saddle point, ibig sabihin, isang punto na may mga coordinate x 0, y 0, kung saan a (x, y) ay sa parehong oras minimal sa sa at maximum NS(fig. 7.2).

Kahulugan a (x, y) sa puntong ito ang presyo ng laro ν: ν = a (x 0, y 0). Ang pagkakaroon ng isang saddle point ay nangangahulugang ang walang katapusang larong ito ay may dalisay na solusyon sa diskarte; x 0, y 0 kumakatawan sa pinakamainam na purong diskarte A at B. Sa pangkalahatang kaso, kapag α ≠ β, ang laro ay maaaring magkaroon ng isang solusyon lamang sa larangan ng halo-halong mga diskarte (marahil hindi lamang ang isa). Halo-halong diskarte para sa walang katapusang mga laro mayroong ilang pamamahagi ng posibilidad para sa mga diskarte NS at sa isinasaalang-alang bilang mga random variable. Ang pamamahagi na ito ay maaaring maging tuloy-tuloy at natutukoy ng mga density f 1 (NS) at f 2 (y); maaaring maging discrete, at pagkatapos ay ang pinakamainam na mga diskarte ay binubuo ng isang hanay ng magkakahiwalay na dalisay na diskarte na pinili na may ilang mga posibilidad na hindi nonzero.

Sa kaso kung ang isang walang katapusang laro ay walang saddle point, maaaring bigyan ng isang visual na geometric na interpretasyon ng mas mababa at itaas na mga presyo ng laro. Isaalang-alang ang isang walang katapusang laro na may pagpapaandar na kabayaran a (x, y) at mga diskarte x, y patuloy na pinupuno ang mga segment ng linya (x 1, x 2) at (y 1, y 2)... Upang matukoy ang mas mababang presyo ng laro α, kailangan mong "tumingin" sa ibabaw a (x, y) mula sa axis sa, ibig sabihin proyekto ito sa isang eroplano xOa(fig. 7.3). Nakukuha namin ang isang tiyak na pigura na nakagapos mula sa mga gilid ng mga tuwid na linya x = x 1 at x = x 2, at mula sa itaas at sa ibaba ng mga kurba KB at K N. Ang mas mababang presyo ng laro α, malinaw naman, ay walang hihigit sa ang maximum na ordinate ng curve K N.

Katulad nito, upang mahanap ang pinakamataas na presyo ng laro β, dapat na "tumingin" ang isang tao sa ibabaw a (x, y) mula sa axis NS(ibabaw ng eroplano ang proyekto yoa) at hanapin ang minimum na ordenate ng itaas na hangganan ng K Sa projection (Larawan, 7.4).

Isaalang-alang ang dalawang halimbawa ng elementarya ng walang katapusang mga laro.

Halimbawa 1. Ang mga manlalaro A at B bawat isa ay may isang hindi mabilang na hanay ng mga posibleng diskarte NS at sa, at 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Ang pagpapaandar na bayad para sa a ay ibinibigay ng ekspresyong a (x, y) - (x - y) 2. Maghanap ng solusyon sa laro.

Solusyon, Ibabaw ng isang (x, y) ay isang parabolic silindro (Larawan 7.5) at walang saddle point. Tukuyin ang mas mababang presyo ng laro; halata sa lahat NS; samakatuwid = 0. Tukuyin natin ang tuktok na presyo ng laro. Upang gawin ito, nahanap namin para sa isang nakapirming sa

Sa kasong ito, ang maximum ay laging naabot sa hangganan ng agwat (sa x = 0 o x = 1), ibig sabihin katumbas ito ng mga halagang y 2; (1 - y) 2, na mas malaki. Iguhit natin ang mga graph ng mga pagpapaandar na ito (Larawan 7.6), ibig sabihin paglabas ng proyekto a (x, y) sa eroplano yoa... Ang naka-bold na linya sa Fig. Ipinapakita ng 7.6 ang pagpapaandar. Malinaw na, ang pinakamababang halaga nito ay naabot sa y = 1/2 at katumbas ng 1/4. Samakatuwid, ang pinakamataas na presyo ng laro ay β = 1/4. Sa kasong ito, ang mas mataas na presyo ng laro ay tumutugma sa presyo ng laro ν. Sa katunayan, ang manlalaro A ay maaaring maglapat ng isang halo-halong diskarte S A = , kung saan ang matinding halaga na x = 0 at x = 1 ay kasama kasama ang parehong mga frequency; pagkatapos para sa anumang diskarte ng manlalaro B ang average na kabayaran ng manlalaro A ay magiging katumbas ng: ½y 2 + ½ (1 - y) 2. Madaling mapatunayan na ang dami na ito para sa anumang mga halaga sa sa pagitan ng 0 at 1 ay may halagang hindi kukulangin sa ¼: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Sa gayon, ang manlalaro A, gamit ang halong diskarte na ito, ay maaaring magagarantiyahan ang kanyang sarili ng isang kabayaran na katumbas ng mas mataas na presyo ng laro; dahil ang presyo ng laro ay hindi maaaring maging higit sa mataas na presyo, pagkatapos diskarte na ito S Isang pinakamainam: S A = S A *.

Ito ay mananatili upang mahanap ang pinakamainam na diskarte ng manlalaro B. Malinaw na, kung ang presyo ng laro ν ay katumbas ng mas mataas na presyo ng laro then, kung gayon ang pinakamainam na diskarte ng manlalaro B ay palaging magiging kanyang purong diskarte sa minimax, na ginagarantiyahan sa kanya ang mataas na presyo ng laro. Sa kasong ito, ang gayong diskarte ay y 0 = ½. Sa katunayan, sa diskarteng ito, anuman ang gawin ng manlalaro A, ang kanyang kabayaran ay hindi hihigit sa ¼. Sumusunod ito mula sa halatang hindi pagkakapantay-pantay (x - ½) 2 = x (x –1) + ¼ ≤ ¼

Halimbawa 2. Ang Side A ("kami") ay nagpapaputok sa sasakyang panghimpapawid ng kaaway B. Upang makaiwas sa pagbabaril, maaaring magpagalaw ang kaaway ng ilang labis na karga sa, kung saan siya, sa kanyang paghuhusga, ay maaaring maglakip ng mga halaga mula sa sa= 0 (tuwid na paggalaw) sa sa = samax(paglipad sa isang bilog ng maximum na kurbada). Ipinapalagay namin samax yunit ng pagsukat, ibig sabihin ilagay samax= 1. Sa paglaban sa kalaban, maaari tayong gumamit ng mga aparato sa paningin batay sa isa o iba pang teorya tungkol sa paggalaw ng target sa panahon ng paglipad ng projectile. Labis na karga NS sa manipulasyong ito na mapagpapalagay, maaari itong ipagpalagay na katumbas ng anumang halaga mula 0 hanggang 1. Ang aming gawain ay upang maabot ang kalaban; ang gawain ng kalaban ay manatiling hindi apektado. Posibilidad ng pinsala para sa data NS at sa ay tinatayang ipinahayag ng pormula: a (x, y) = , kung saan sa- labis na karga na ginamit ng kaaway; x - labis na karga na accounted para sa paningin. Kinakailangan upang matukoy ang pinakamainam na mga diskarte ng parehong partido.

Solusyon Malinaw na, ang solusyon ng laro ay hindi nagbabago kung itinakda namin ang p = 1. Ang pagpapaandar na bayad a (x, y) itinatanghal ng ibabaw na ipinakita sa Fig. 7.7.

Ito ay isang silindro na ibabaw na ang mga generator ay kahanay sa bisector ng anggulo ng coordinate hoy, at ang seksyon ng isang eroplano na patayo sa generatrix ay isang kurba ng uri ng isang normal na curve ng pamamahagi. Gamit ang interpretasyong geometriko ng mas mababa at mataas na mga presyo ng larong iminungkahi sa itaas, nakita namin ang β = 1 (Larawan 7.8) at (Larawan 7.9). Ang laro ay walang saddle point; ang solusyon ay dapat hanapin sa lugar ng magkahalong diskarte. Ang problema ay medyo katulad ng problema sa nakaraang halimbawa. Sa katunayan, para sa maliit na halaga k ang pag-andar ay kumikilos tulad ng isang pagpapaandar - (x - y) 2, at ang solusyon ng laro ay makukuha kung ang mga tungkulin ng mga manlalaro A at B ay binago sa solusyon ng naunang halimbawa; mga yan ang aming pinakamainam na diskarte ay ang purong diskarte x = 1/2, at ang pinakamainam na diskarte ng kalaban SB = ay ilapat ang matinding mga diskarte y = 0 at y = 1 na may parehong mga frequency. Nangangahulugan ito na sa lahat ng mga kaso kailangan nating gamitin ang crosshair, na idinisenyo para sa isang overload x = 1/2, at ang kaaway ay hindi dapat gumamit ng isang maneuver sa kalahati ng lahat ng mga kaso, at sa kalahati - ang maximum na posibleng maniobra.

Bigas 7.8 Fig. 7.9.

Madaling patunayan na ang solusyon na ito ay magiging wasto para sa mga halagang k ≤ 2. Sa katunayan, ang average na kabayaran para sa diskarte ng kalaban S B = at para sa aming diskarte NS na ipinahayag ng pagpapaandar , na para sa mga halagang k ≤ 2 ay may isang maximum na х = 1/2, na katumbas ng mas mababang presyo ng laro α. Dahil dito, ang paglalapat ng diskarte na S B ay ginagarantiyahan ang kalaban ng isang pagkawala na hindi hihigit sa α, kung saan malinaw na ang α - ang mas mababang presyo ng laro - ay ang presyo ng laro ν.

Para sa k> 2, ang pagpapaandar a (x) ay may dalawang maxima (Larawan 7.10), na matatagpuan nang simetriko patungkol sa x = 1/2 sa mga puntong x 0 at 1 - x 0, at ang halaga ng x 0 ay nakasalalay sa k .

Malinaw naman, para sa k= 2 x 0 = 1 - x 0 = ½; kapag dumarami k puntos x 0 at 1 - x 0 gumalaw, papalapit sa matinding mga puntos (0 at 1). Samakatuwid, ang desisyon ng laro ay depende sa k. Magtakda tayo ng isang tukoy na halaga para sa k, halimbawa, k = 3, at maghanap ng solusyon sa laro; para dito tinutukoy namin ang abscissa x 0 ng maximum ng curve a (x). Katumbas sa zero ng hango ng pagpapaandar a (x), isinusulat namin ang equation upang matukoy ang x 0:

Ang equation na ito ay may tatlong mga ugat: x = 1/2 (kung saan naabot ang minimum) at x 0, 1 - x 0, kung saan naabot ang maximum. Paglutas ng equation ayon sa bilang, mahahanap namin ang tinatayang x 0 ≈ 0.07; 1 - x 0 ≈ 0.93.

Patunayan natin na ang solusyon sa laro sa kasong ito ay ang sumusunod na pares ng mga diskarte:

Sa aming diskarte at diskarte ng kaaway sa ang average na kabayaran ay

Hanapin ang minimum na 1 (y) sa 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Ang pagtatakda ng y = 1/2, nakukuha natin

na higit sa 1 (0); samakatuwid, ang presyo ng laro ay hindi mas mababa sa isang 1 (0):

Ngayon sabihin natin na ang kalaban ay gumagamit ng diskarte na S B *, at ginagamit namin ang diskarte x. Pagkatapos ang average na kabayaran ay magiging

Ngunit pinili namin ang x 0 eksakto upang sa x = x 0 ang maximum ng expression (7.2) ay naabot; Dahil dito,

mga yan ang kalaban, gamit ang diskarte na S B *, ay maaaring maiwasan ang pagkawala na higit sa 0.530; samakatuwid, ν = 0.530 ang presyo ng laro, at ang mga istratehiyang S A * at S B * ay nagbibigay ng solusyon. Nangangahulugan ito na dapat kaming gumamit ng mga pasyalan na may x = 0.07 at x = 0.93 na may parehong dalas, at ang kaaway ay hindi dapat maneuver na may parehong dalas at maneuver na may maximum na labis na karga.

Tandaan na ang kabayaran ν = 0.530 ay kapansin-pansin na mas malaki kaysa sa mas mababang presyo ng laro , na maibibigay namin sa aming sarili sa pamamagitan ng paglalapat ng aming maximin na diskarte x 0 = 1/2.

Isa sa praktikal na paraan ang paglutas ng walang katapusang mga laro ay ang kanilang tinatayang pagbawas sa mga may hangganan. Sa kasong ito, ang isang buong saklaw ng mga posibleng diskarte para sa bawat manlalaro ay magkakasama na pinagsama sa isang diskarte. Sa ganitong paraan, syempre, isang tinatayang solusyon lamang sa laro ang maaaring makuha, ngunit sa karamihan ng mga kaso ang isang eksaktong solusyon ay hindi kinakailangan.

Gayunpaman, dapat tandaan na kapag inilalapat ang diskarteng ito, ang mga solusyon sa larangan ng halo-halong mga diskarte ay maaaring lumitaw kahit na sa mga kaso kung posible ang solusyon ng orihinal na walang katapusang laro sa mga purong diskarte, ibig sabihin kapag ang walang katapusang laro ay may isang saddle point. Kung, sa pamamagitan ng pagbawas ng isang walang katapusang laro sa isang may hangganan, isang halo-halong solusyon ang nakuha, na nagsasama lamang ng dalawang katabing "kapaki-pakinabang" na mga diskarte, pagkatapos ay makatuwiran upang subukang mag-apply ng isang pantay na dalisay na diskarte ng orihinal na walang katapusang laro sa pagitan nila.

Bilang pagtatapos, tandaan namin na ang walang katapusang mga laro, hindi katulad ng mga may hangganan, ay maaaring walang solusyon. Magbigay tayo ng isang halimbawa ng isang walang katapusang laro na walang solusyon. Dalawang manlalaro ang nagpapangalan sa bawat integer. Pinangalanan higit pa natatanggap mula sa iba pang 1 ruble. Kung kapwa tumawag sa parehong numero, ang laro ay nagtatapos sa isang draw. Malinaw na walang solusyon ang laro. Gayunpaman, may mga klase ng walang katapusang mga laro kung saan isang solusyon ang tiyak na umiiral.

Ang halo-halong diskarte SA ng manlalaro A ay ang aplikasyon ng purong mga diskarte A1, A2, ..., Am na may mga posibilidad na p1, p2, ..., pi, ..., pm at ang kabuuan ng mga posibilidad na katumbas ng 1: Ang mga halo-halong diskarte ng manlalaro A ay nakasulat sa anyo ng isang matrix o bilang isang string SA = (p1, p2, ..., pi, ..., pm) Katulad nito, ang magkahalong mga diskarte ng manlalaro B ay tinukoy ng :, o , SB = (q1, q2, ..., qi, ..., qn), kung saan ang kabuuan ng mga posibilidad ng paglitaw ng mga diskarte ay katumbas ng 1: Ang mga dalisay na diskarte ay maaaring isaalang-alang na isang espesyal na kaso ng mga halo-halong at ibinigay sa pamamagitan ng isang string kung saan ang 1 ay tumutugma sa isang purong diskarte. Batay sa prinsipyo ng minimax, natutukoy ang pinakamainam na solusyon (o solusyon) ng laro: ito ay isang pares ng pinakamainam na diskarte na S * A, S * B sa pangkalahatang kaso, halo-halong, pagkakaroon ng sumusunod na pag-aari: kung ang isa sa mga manlalaro ay sumusunod sa kanyang pinakamainam na diskarte, kung gayon ang iba ay hindi maaaring kumita mula sa paglihis mula sa kanyang sarili. Ang kabayaran na naaayon sa pinakamainam na solusyon ay tinatawag na gastos ng larong v. Ang presyo ng laro ay nasiyahan ang hindi pagkakapantay-pantay :? ? v? ? (3.5) saan? at? - ilalim at nangungunang mga presyo mga laro. Ang sumusunod na pangunahing teorya ng teorya ng laro ay totoo - teorama ni Neumann. Ang bawat end game ay mayroong hindi bababa sa isang pinakamainam na solusyon, posibleng kabilang sa magkahalong diskarte. Hayaan ang S * A = (p * 1, p * 2, ..., p * i, ..., p * m) at S * B = (q * 1, q * 2, ..., q * Ang i, ..., q * n) ay isang pares ng pinakamainam na diskarte. Kung ang isang dalisay na diskarte ay kasama sa pinakamainam na halo-halong diskarte na may posibilidad na nonzero, kung gayon ito ay tinatawag na aktibo. Ang teorama sa mga aktibong diskarte ay may bisa: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte, kung gayon ang bayad ay mananatiling hindi nagbabago at katumbas ng presyo ng laro v, kung ang pangalawang manlalaro ay hindi lalampas sa mga limitasyon ng kanyang mga aktibong diskarte. Ang teoryang ito ay may dakilang praktikal na kahalagahan - nagbibigay ito ng mga tukoy na modelo para sa paghahanap ng pinakamainam na mga diskarte sa kawalan ng isang saddle point. Isaalang-alang ang isang 2 × 2 na laro, na kung saan ay ang pinakasimpleng kaso ng isang may wakas na laro. Kung ang naturang laro ay may isang saddle point, kung gayon ang pinakamainam na solusyon ay isang pares ng purong mga diskarte na naaayon sa puntong ito. Ang isang laro na walang saddle point, alinsunod sa pangunahing teorya ng teorya ng laro, umiiral ang isang pinakamainam na solusyon at natutukoy ng isang pares ng magkakahalong diskarte S * A = (p * 1, p * 2) at S * B = (q * 1, q * 2) ... Upang hanapin ang mga ito, gagamitin namin ang teorama sa mga aktibong diskarte. Kung ang manlalaro A ay sumusunod sa kanyang pinakamainam na diskarte na S "A, kung gayon ang kanyang average na kabayaran ay magiging katumbas ng presyo ng laro v, anuman ang aktibong diskarte na ginagamit ng manlalaro B. Para sa isang 2 × 2 na laro, ang anumang purong diskarte ng kalaban ay aktibo kung walang punto ng siyahan. Ang kabayaran ng manlalaro A (pagkawala ng manlalaro B) - random na halaga, ang inaasahan sa matematika (average na halaga) na kung saan ay ang presyo ng laro. Samakatuwid, ang average na kabayaran ng manlalaro A (pinakamainam na diskarte) ay magiging katumbas ng v para sa parehong ika-1 at ika-2 na diskarte ng kalaban. Hayaan ang laro na ibigay ng payoff matrix. Ang average na kabayaran ng manlalaro A kung gumagamit siya ng pinakamainam na halo-halong diskarte, at ginagamit ng manlalaro B ang purong diskarte na B1 (tumutugma ito sa ika-1 haligi ng payoff matrix P), ay katumbas ng presyo ng laro v: a11 p * 1 + a21 p * 2 = v. Ang Player A ay nakakakuha ng parehong average na kabayaran kung ang ika-2 manlalaro ay naglalapat ng diskarte B2, ibig sabihin a12 p * 1 + a22 p * 2 = v. Isinasaalang-alang ang p * 1 + p * 2 = 1, nakakakuha kami ng isang sistema ng mga equation para sa pagtukoy ng pinakamainam na diskarte S "A at ang presyo ng laro v: (3.6) Ang paglutas sa sistemang ito, nakukuha namin ang pinakamainam na diskarte (3.7 ) at ang presyo ng laro (3.8). aktibong mga diskarte kapag naghahanap ng SB * - ang pinakamainam na diskarte ng player B, nalaman namin na para sa anumang purong diskarte ng manlalaro A (A1 o A2), ang average na pagkawala ng manlalaro B ay katumbas ng ang presyo ng laro v, ibig sabihin (3.9) Pagkatapos ang pinakamainam na diskarte ay natutukoy ng mga formula: (3.10)

Mga diskarte na "malinis"

Pamilyar na kami sa mga jamb. Gayunpaman, ano ang mangyayari kung ang mga jambs ay tinanggal mula sa kadena ng anumang diskarte? Makakakuha tayo ng isang "malinis na diskarte". Ang mga dalisay na diskarte ay ang mga nasa kadena ng mga aksyon kung saan, mula sa pinaka ugat hanggang sa produktibong bahagi, walang mga hindi mabisang sub-diskarte (jambs), at madalas itong mapapatunayan lamang ng pagkakaroon ng lahat ng mga link sa isip.

Siyempre, mula sa pananaw ng lahat ng posibleng mga kinalabasan ng paglalapat ng diskarte, mahirap para sa amin na pag-usapan ang tungkol sa pinaka-pinaka-epektibo, dahil maaari lamang kaming walang isang tiyak na karanasan, at samakatuwid ang ilang mga intermediate na diskarte, ngunit ito ay mula sa aming karanasan na ang diskarte ay dapat na mabisa hangga't maaari.

Ang konsepto ng purong mga diskarte ay isa rin sa mga pangunahing sa mga materyal na ito, kaya magbibigay ako ng isang halimbawa:

Gabi na Nagmamadali kang umuwi sa lugar ng iyong tahanan. Tumatakbo ang gatas. Lumilipas ang nakaraang "kahina-hinalang uri ng ilan, maraming" naririnig mo sa iyong address na "Hoy, ikaw, [pinutol ng censorship]. Huwag pumunta dito, ang niyebe ay ang ulo! "

Ano ang gagawin mo? Maaaring maraming mga pagpipilian. Ang isang tao ay pupunta upang ayusin ang mga bagay, ang isang tao ay matatakot at magpapabilis ng kanilang tulin, may sumisigaw ng isang bagay. Gayunpaman, pag-isipan natin kung ano ang purong diskarte ng pag-uugali sa kasong ito?

Ang isang estranghero ay may sinisigaw sa iyo sa kalye. Mayroon kang sariling negosyo, kung saan ka talaga pupunta. Sa paghusga sa teksto, ang mga positibong benepisyo para sa iyo mula sa pakikipag-usap sa taong ito ay malamang na hindi. Ang lohikal na konklusyon: mahinahon na magpatuloy tungkol sa iyong negosyo. Inilapit ko ang iyong pansin sa katotohanan na ito ay "kalmado", nang walang anino negatibong damdamin, ngunit may isang malusog na pagwawalang bahala sa kung ano ang nangyayari. Ilan ang gagawa nito? Ipagpalagay ko ang napakalaki na minorya. Bakit?

Dahil ang karamihan sa mga tao ay may isang buong layer ng mga diskarte sa hindi malay na nakatali sa mas mababang mga layer sa pangangalaga sa sarili, lalo na, ang mga ito ay maaaring: "Palaging tumugon sa kabastusan na may kabastusan", "Kung may nagsabi ng mga hindi magandang bagay, kailangan mong patakbuhin", "Kung may isang taong bastos - kailangan mong punan ang kanyang mukha", "Kung ang isang tao ay bastos, pagkatapos ay mayroong isang panganib", at mga katulad nito sa iba't ibang mga pagkakaiba-iba. Siyempre, hindi lahat ay magsasagawa ng isang uri ng aktibong aksyon, ngunit sa emosyonal na nakakaapekto ito sa halos lahat. At ito ay isang cant.

Ang mga dalisay na diskarte ay laging walang kinalaman sa emosyon o positibo, at likas ito sa iyong utak, kailangan mo lang itong gamitin.

Maaari mong basahin nang kaunti ang tungkol sa purong mga diskarte sa mga tala na "Bakit puro diskarte?" at House, Hopkins, Etc ..

Mula sa librong Istratehiya ng mga henyo. Albert Einstein ang may akda na si Dilts Robert

Mga Estratehiya 1. Kahulugan ng term na "diskarte": a) Nagmula sa salitang Griyego na "stratehiya", nangangahulugang: "pinuno ng militar", "agham, sining ng pakikidigma", "sining ng pamumuno ng panlipunang, pakikibakang pampulitika."

Mula sa librong Strategies of Geniuses (Aristotle Sherlock Holmes Walt Disney Wolfgang Amadeus Mozart) ang may akda na si Dilts Robert

Mula sa librong Marunong ka bang mag-aral ng mabuti?! Kapaki-pakinabang na libro para sa mga estudyanteng pabaya ang may-akda na si Karpov Alexey

STRATEGIYA Ang iyong pag-aaral ay mapupunta sa isang ganap na magkakaibang antas ng kalidad kung sa tingin mo at pumili ng isang diskarte ng pagkilos. Ang diskarte ay ang pangkalahatang plano. Ito ang ibinigay na pangkalahatang linya totoong kondisyon... Ito ang mga layunin, deadline, isinasaalang-alang ang hindi mahuhulaan at pagkakaiba-iba ... Ito ang napaka-pakiramdam ng pulso

Mula sa librong Diskarte ng Isip at Tagumpay may-akda Antipov Anatoly

Mula sa librong Emotional Intelligence ni Goleman Daniel

Coefficient pag-unlad ng kaisipan at emosyonal na talino: ang mga purong uri ng IQ at pang-emosyonal na katalinuhan ay hindi tutol, ngunit sa halip magkahiwalay na mga kakayahan. Lahat tayo ay nagsasama ng talino sa talas ng karanasan; mga taong may mataas

Mula sa isang libro ng 12 mga paniniwalang Kristiyano na maaaring mabaliw ka ni Townsend John

Tamang Mga Layunin o Purong Kaisipan Ang tamang hangarin ay isang pagpapasya na gawin ang tama. Pinipili namin ang isang mabuting gawa na nakalulugod sa Diyos, kadalasan nang hindi iniisip kung talagang nais nating gawin ito. Ginagawa lang natin ito at iyon na. Maraming mga mangangaral ng ebanghelikal

Mula sa librong Coming into Life: A Collection may-akda hindi kilala ang may akda

Rudolf Ivanovich ABEL: "TANDAAN KUNG SABI SA DZERZHINSKY NA SABI:" MALINAW NA KAMAY, MAHANGING PUNO AT MABUTING PUSO ... "Si Rudolf Ivanovich Abel ay nagtalaga ng higit sa tatlumpung taon upang magtrabaho sa intelihensiya ng Soviet. Ginawaran siya ng Order of Lenin, dalawang Order ng Red Banner, ang Order of Labor

Mula sa libro Homo sapiens 2.0 [Homo sapiens 2.0 http://hs2.me] ni Sapiens Homo

Estratehiya

Mula sa librong Homo Sapiens 2.0 ni Sapiens 2.0 Homo

Mga diskarte na "Malinis" pamilyar na tayo sa mga jamb. Gayunpaman, ano ang mangyayari kung ang mga jambs ay tinanggal mula sa kadena ng anumang diskarte? Makakakuha tayo ng isang "malinis na diskarte". Ang mga purong diskarte ay ang mga nasa kadena ng mga aksyon kung saan, mula sa pinaka ugat hanggang sa mabisang bahagi, ay wala.

Mula sa librong Start. Lagyan ng takot ang mukha, itigil ang pagiging "normal" at gumawa ng isang bagay na sulit may-akda Aykaff John

Mula sa librong Man bilang isang hayop may-akda Nikonov Alexander Petrovich

Mga Istratehiya Pangkalahatang konsepto ng mga diskarte Sa prinsipyo, naiintindihan ng bawat isa sa isang degree o iba pa kung ano ang isang diskarte. Ang pagkakaroon ng isang tiyak na hanay ng kaalaman na nakuha bilang isang resulta ng pagkakaroon at karanasan sa pagproseso, bumubuo kami ng ilang mga modelo ng pag-uugali. Ang Diskarte ay isang modelo para makamit ang isang layunin.

Mula sa librong Gawin ang Iyong Paggawa ng Memorya Sa Buong Kapangyarihan ni Elloway Tracy

Bakit Malinis na Estratehiya? Ang pagbabahagi ng leon ng materyal sa proyektong ito ay patuloy na nagpapahiwatig na kinakailangan na gumamit ng purong mga diskarte para sa muling pagsusulat at siguraduhing maghanap ng isang jamb batay sa mga ito. Ang sandaling ito ay hindi halata sa unang tingin at

Mula sa librong Introvert in an Extroverted World may-akda Romantseva Elizaveta

Mula sa aklat ng may akda

Mula sa aklat ng may akda

Mga Istratehiya Ang mga diskarte sa computer ay nangangailangan ng manlalaro na ituon, planuhin ang kanilang mga aksyon at malutas ang iba`t ibang mga problema. Kamakailang pananaliksik ay nagpapahiwatig na ang mga diskarte ay maaaring mapabuti ang nagbibigay-malay kasanayan ng mga manlalaro ng lahat ng edad. Ayon kay

Mula sa aklat ng may akda

Purong mga uri Mayroong tulad ng isang konsepto - "dalisay sikolohikal na uri". Sa totoo lang, mayroong isang konsepto, ngunit halos walang mga bagay, iyon ay, ang mga tao na perpektong naaangkop sa konseptong ito. Walang mga puro na introvert at hindi siguradong mga extroverter. Bukod dito, sumang-ayon kami sa iyo

Ang pagpipilian ng isang aksyon ng manlalaro ay tinawag gumalaw... May galaw pansarili(ang manlalaro ay sadyang gumawa nito o sa pagpapasyang iyon) at sapalaran(ang kinalabasan ng laro ay hindi nakasalalay sa kalooban ng manlalaro). Ang hanay ng mga patakaran na tumutukoy kung aling paglipat ang kailangang gawin ng manlalaro ay tinawag diskarte... Ang mga diskarte ay malinis(mga di-random na desisyon ng mga manlalaro) at magkakahalo(ang diskarte ay maaaring isaalang-alang bilang isang random variable).

Saddle point

SA teorya ng laro S. t. ( elemento ng saddle) ay ang pinakamalaking elemento ng haligi laro matrices, na sabay-sabay ang pinakamaliit na elemento ng kaukulang hilera (sa zero-sum na laro ng dalawang tao). Sa puntong ito, samakatuwid, ang maximin ng isang manlalaro ay katumbas ng pinakamaliit na iba pa; S. t. Mayroong isang punto punto ng balanse.

Minimax theorem

Ang diskarte na naaayon sa minimax ay tinawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ng pagpili ng pinaka "maingat" na mga diskarte sa maximin at minimax ay tinawag prinsipyo ng minimax... Ang prinsipyong ito ay sumusunod mula sa makatuwirang palagay na hinahangad ng bawat manlalaro na makamit ang isang layunin na kabaligtaran ng kalaban.

Pinipili ng manlalaro ang kanyang mga aksyon, ipinapalagay na ang kalaban ay kikilos sa isang hindi kanais-nais na paraan, ibig sabihin susubukan na "saktan".

Pag-andar ng pagkawala

Pag-andar ng pagkawala- isang pagpapaandar na, sa teorya mga pagpapasya sa istatistika nailalarawan ang pagkawala ng hindi magandang paggawa ng desisyon batay sa napapansin na data. Kung ang problema sa pagtantya ng parameter ng signal laban sa background ng ingay ay nalulutas, kung gayon ang pag-andar ng pagkawala ay isang sukatan ng pagkakaiba sa pagitan ng totoong kahulugan ang tinantyang parameter at ang pagtatantya ng parameter

Pinakamainam na Diskarte sa Mixed Player ay isang kumpletong hanay ng mga aplikasyon ng mga purong diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kundisyon na may naibigay na posibilidad.

Ang halo-halong diskarte ng manlalaro ay isang kumpletong hanay ng pag-apply ng kanyang purong diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kundisyon na may ibinigay na mga posibilidad.

1. Kung ang lahat ng mga elemento ng isang hilera ay hindi mas malaki kaysa sa mga kaukulang elemento ng isa pang hilera, kung gayon ang orihinal na hilera ay maaaring matanggal mula sa matrix ng pagbabayad. Gayundin para sa mga haligi.

2. Ang gastos ng laro ay natatangi.

Doc: sabihin nating mayroong 2 presyo ng laro v at, na naabot sa isang pares at, ayon sa pagkakabanggit, pagkatapos

3. Kung ang parehong numero ay naidagdag sa lahat ng mga elemento ng payoff matrix, kung gayon ang pinakamainam na halo-halong mga diskarte ay hindi magbabago, at ang presyo ng laro ay tataas ng numerong ito.

Doc:
, saan

4. Kung ang lahat ng mga elemento ng payoff matrix ay pinarami ng parehong numero na nonzero, ang presyo ng laro ay maparami ng bilang na ito, at ang mga pinakamainam na diskarte ay hindi magbabago.

© 2021 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pagtatalo