Puro laro ng diskarte. Elena Wentzel

bahay / Quarreling

halo-halong diskarte sa laro ng teorya

Hinahalong mga diskarte

Kung walang point saddle sa isang laro ng matrix sa purong mga diskarte, pagkatapos ay matatagpuan ang itaas at mas mababang mga presyo ng laro. Ipinakita nila na ang player 1 ay hindi makakatanggap ng isang panalo na lumampas sa itaas na presyo ng laro at ang manlalaro na 1 ay garantisadong isang panalo na hindi mas mababa sa mas mababang presyo ng laro.

Ang halo-halong diskarte ng isang manlalaro ay isang kumpletong hanay ng kanyang purong mga diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kondisyon na may ibinigay na mga posibilidad. Isa-isahin natin kung ano ang sinabi at ilista ang mga kundisyon ng paggamit halo-halong mga diskarte:

  • * maglaro nang walang isang saddle point;
  • * Ang mga manlalaro ay gumagamit ng isang random na pinaghalong purong estratehiya na may ibinigay na mga posibilidad;
  • * ang laro ay paulit-ulit na maraming beses sa mga katulad na kondisyon;
  • * Sa bawat isa sa mga gumagalaw, walang manlalaro ang nalaman tungkol sa pagpili ng diskarte ng ibang manlalaro;
  • * Pinapayagan ang averaging ng mga resulta ng laro.

Ang sumusunod na notasyon para sa halo-halong mga diskarte ay ginagamit.

Para sa player 1, isang halo-halong diskarte na binubuo sa application ng mga dalisay na estratehiya A 1, A 2, ..., A m sa kaukulang mga probabilidad p 1, p 2, ..., p m.

Para sa player 2

q j ang posibilidad ng paglalapat ng dalisay na diskarte B j.

Sa kaso kapag р i \u003d 1, para sa player 1 mayroon kaming purong diskarte

Ang mga dalisay na estratehiya ng manlalaro ay ang tanging posibleng hindi magkatulad na mga kaganapan. Sa isang laro ng matrix, alam ang matrix A (nalalapat ito sa parehong player 1 at player 2), maaari itong matukoy ibinigay na mga vectors at ang average na kabayaran ( inaasahang halaga epekto) ng player 1:

kung saan at mga vectors;

p i at q ako ay mga sangkap ng mga vectors.

Sa pamamagitan ng paglalapat ng kanyang halo-halong mga diskarte, ang player 1 ay naglalayong i-maximize ang kanyang average na kabayaran, at player 2 - upang madala ang epekto sa pinakamababang posibleng halaga. Ang Player 1 ay naghahanap upang makamit

Nakamit ng Player 2 ang kundisyon

Ipinapahiwatig din namin ang mga vectors na naaayon sa pinakamainam na halo-halong mga diskarte ng mga manlalaro 1 at 2, i.e. tulad vectors at kung saan ang pagkakapantay-pantay

Ang presyo ng laro ay ang average na pagbabayad ng player 1 kapag ang parehong mga manlalaro ay gumagamit ng halo-halong mga diskarte. Samakatuwid, ang solusyon sa laro ng matrix ay:

  • - pinakamainam na halo-halong diskarte ng player 1;
  • - pinakamainam na halo-halong diskarte ng player 2;

Presyo ng laro.

Ang halo-halong mga diskarte ay magiging pinakamainam (at) kung sila ay bumubuo ng isang saddle point para sa pagpapaandar i.e.

Mayroong pangunahing teorem para sa mga laro sa matematika.

Para sa isang laro ng matrix na may anumang matrix A, ang dami

umiiral at pantay-pantay sa bawat isa: \u003d \u003d.

Dapat pansinin na kapag pumipili ng pinakamainam na mga diskarte, ang player 1 ay palaging ginagarantiyahan ng isang average na kabayaran, hindi mas mababa sa presyo ng laro, para sa anumang nakapirming diskarte ng player 2 (at, sa kabilang banda, para sa player 2). Ang mga aktibong diskarte ng mga manlalaro 1 at 2 ay tinatawag na mga diskarte na bahagi ng pinakamainam na halo-halong mga diskarte ng kaukulang mga manlalaro na may mga probabilidad na nonzero. Nangangahulugan ito na ang komposisyon ng pinakamainam na halo-halong mga diskarte ng mga manlalaro ay maaaring hindi kasama ang lahat ng kanilang mga nakatukoy na mga diskarte sa priori.

Ang paglutas ng laro ay nangangahulugang paghahanap ng presyo ng laro at ang pinakamainam na mga diskarte. Sinisimulan namin ang pagsasaalang-alang ng mga pamamaraan para sa paghahanap ng pinakamainam na halo-halong mga diskarte para sa mga laro ng matrix ang pinakasimpleng laro, na inilarawan ng matris 22. Ang mga laro na may punong punla ay hindi isasaalang-alang sa espesyal. Kung nakuha ang isang saddle point, nangangahulugan ito na may mga hindi kasiya-siyang diskarte na dapat iwanan. Sa kawalan ng isang saddle point, maaaring makuha ang dalawang pinakamainam na halo-halong mga diskarte. Tulad ng nabanggit, ang mga halo-halong mga diskarte na ito ay nakasulat na tulad nito:

Nangangahulugan ito na mayroong isang matrikula sa pagbabayad

isang 11 p 1 + a 21 p 2 \u003d; (1.16)

isang 12 p 1 + a 22 p 2 \u003d; (1.17)

p 1 + p 2 \u003d 1. (1.18)

isang 11 p 1 + a 21 (1 - p 1) \u003d a 12 p 1 + a 22 (1 - p 1); (1.19)

isang 11 p 1 + a 21 - isang 21 p 1 \u003d a 12 p 1 + a 22 - isang 22 p 1, (1.20)

kung saan nakukuha namin ang pinakamainam na mga halaga at:

Alam at, nahanap namin:

Ang pagkalkula, natagpuan namin at:

isang 11 q 1 + a 12 q 2 \u003d; q 1 + q 2 \u003d 1; (1.24)

isang 11 q 1 + a 12 (1 - q 1) \u003d. (1.25)

para sa isang 11 a 12. (1.26)

Malutas ang problema, dahil ang mga vectors at ang presyo ng laro ay matatagpuan. Ang pagkakaroon ng isang matris ng mga pagbabayad A, maaari mong malutas ang problema sa grapiko. Sa pamamaraang ito, ang algorithm ng solusyon ay napaka-simple (Fig. 2.1).

  • 1. Ang isang segment ng haba ng yunit ay naka-plot sa axis ng abscissa.
  • 2. Ang ordinate ay ang mga panalo para sa diskarte A 1.
  • 3. Sa isang linya na kahanay sa ordinate axis, sa puntong 1, ang mga panalo ay idineposito gamit ang diskarte ng 2.
  • 4. Ang mga dulo ng mga segment ay itinalaga para sa isang 11 -b 11, isang 12 -b 21, isang 22 -b 22, isang 21 -b 12 at dalawang tuwid na linya b 11 b 12 at b 21 b 22 ay iguguhit.
  • 5. Natutukoy ang pagkakasunud-sunod ng punto ng intersection. Ito ay pantay. Ang abscissa ng point c ay katumbas ng p 2 (p 1 \u003d 1 - p 2).

Larawan: 1.1.

Ang pamamaraang ito ay may medyo malawak na lugar ng aplikasyon. Ito ay batay sa karaniwang ari-arian mga laro mn, na nangangahulugang sa anumang laro mn, ang bawat manlalaro ay may isang pinakamainam na halo-halong diskarte kung saan ang bilang ng mga dalisay na estratehiya ay halos min (m, n). Mula sa pag-aari na ito, ang isa ay maaaring makakuha ng isang kilalang kinahinatnan: sa anumang laro 2n at m2, ang bawat pinakamainam na diskarte ay naglalaman ng hindi hihigit sa dalawang aktibong diskarte. Nangangahulugan ito na ang anumang laro 2n at m2 ay maaaring mabawasan sa laro 22. Dahil dito, ang mga laro 2n at m2 ay maaaring malutas nang grapiko. Kung ang matris ng isang may hangganan na laro ay may sukat mn, kung saan ang m\u003e 2 at n\u003e 2, kung gayon ang linear na programa ay ginagamit upang matukoy ang pinakamainam na halo-halong mga diskarte.

5. Ang teorya ng mga GAMES AT STATISTICAL SOLUSYON

5.1. Larong Zero-sum matrix

Ang modeling pang-ekonomiya at matematika ay isinasagawa sa mga sumusunod na kondisyon:

Mga katiyakan;

Mga Kawalang-katiyakan.

Pagmomodelo sa mga kondisyon ng katiyakan Ipinapalagay ang pagkakaroon ng lahat ng kinakailangang paunang data ng normatibong (pagmomolde ng matrix, pagpaplano ng network at pamamahala).

Pagmomodelo nanganganib ay isinasagawa nang walang pag-aalinlangan na kawalan ng katiyakan, kapag ang mga halaga ng ilang paunang data ay sapalaran at ang mga batas sa pamamahagi ng posibilidad para sa mga random na variable na ito ay kilala (pagtatasa ng regression, queuing theory).

Pagmomodelo sa kawalan ng katiyakan mga sulat kumpletong kawalan ilang kinakailangang data para sa (teorya ng laro).

Mga modelo ng matematika para sa paggawa ng pinakamainam na pagpapasya sa mga sitwasyong salungatan ay itinayo sa mga kondisyon ng kawalan ng katiyakan.

Sa teorya ng laro, ginagamit ang mga sumusunod na pangunahing konsepto:

Diskarte;

Function ng pagwagi.

Sa pamamagitan ng kurso tatawagin namin ang pagpipilian at pagpapatupad ng player ng isa sa mga pagkilos na ibinigay para sa mga patakaran ng laro.

Diskarte ay isang teknolohiya para sa pagpili ng isang kurso ng pagkilos sa bawat paglipat, depende sa kasalukuyang sitwasyon.

Win function nagsisilbi upang matukoy ang halaga ng pagbabayad ng pagkawala ng manlalaro sa nagwagi.

Sa isang laro ng matris, ang payoff function ay kinakatawan bilang pagbabayad ng matrix :

saan ang halaga ng pagbabayad sa player I, na pumili ng paglipat, mula sa player II, na pumili ng paglipat.

Sa ganoong laro ng pares, ang mga halaga ng mga pagpapaandar ng payoff ng parehong mga manlalaro sa bawat sitwasyon ay pantay sa laki at kabaligtaran sa pag-sign, i.e. at ang larong ito ay tinawag zero kabuuan .

Ang proseso ng "paglalaro ng laro ng matrix" ay kinakatawan bilang mga sumusunod:

Nakatakda ang pagbabayad ng matrix;

Ang Player I, nang nakapag-iisa ng player II, ay pipili ng isa sa mga hilera ng matrix na ito, halimbawa, ang th;

Ang Player II, anuman ang player ko, ay pipili ng isa sa mga haligi ng matrix na ito, halimbawa, - th;

Ang elemento ng matrix ay tumutukoy kung magkano ang player na matatanggap ko mula sa player II. Siyempre, kung, kung gayon dumating na tungkol sa aktwal na pagkawala ng player I.

Ang isang laro ng paragonong antagonistic na may payoff matrix ay tatawaging isang laro.

Halimbawa

Isaalang-alang ang isang laro.

Itakda ang pagbabayad ng matrix:

.

Hayaan ang player ko, nang nakapag-iisa ng player II, piliin ang ika-3 hilera ng matrix na ito, at player II, anuman ang player ko, piliin ang ika-2 na haligi ng matris na ito:

Pagkatapos player ay makakatanggap ako ng 9 na mga yunit mula sa player II.

5.2. Optimum na malinis na diskarte sa isang laro ng matris

Diskarte sa pinakamabuting kalagayan ay isang diskarte ng player na tulad ko na hindi niya binabawasan ang kanyang kabayaran para sa anumang pagpili ng diskarte sa pamamagitan ng player II, at isang diskarte ng player II tulad na hindi niya nadagdagan ang kanyang pagkawala para sa anumang pagpili ng diskarte sa pamamagitan ng player I.

Ang pagpili ng ika-hilera ng payoff matrix bilang isang paglipat, tinitiyak ng manlalaro ang kanyang sarili na isang kabayaran ng hindi bababa sa halaga sa pinakamasamang kaso, kapag sinusubukan ng player II na mabawasan ang halagang ito. Samakatuwid, pipiliin ng player ang tulad ng isang hilera na magbibigay sa kanya maximum na panalo:

.

Sa tingin ng Player II sa isang katulad na paraan at tiyak na mai-secure ang kanyang sarili ng isang minimal na pagkawala:

.

Ang hindi pagkakapantay-pantay ay palaging totoo:

Ang dami ay tinatawag mura mga laro .

Ang dami ay tinatawag nangungunang presyo ng laro .

Ang mga diskarte sa pinakamabuting kalagayan ay tinatawag malinis kung masiyahan nila ang pagkakapantay-pantay:

,

.

Ang dami ay tinatawag purong presyo ng laro , kung ang .

Mga pinakamabuting kalagayan na purong diskarte at form point saddle pagbabayad ng matrix.

Para sa punong saddle, ang mga sumusunod na kondisyon ay natutugunan:

iyon ay, ang elemento ay ang pinakamaliit sa hilera at ang pinakamalaking sa haligi.

Kaya, kung ang payoff matrix ay mayroon point saddle pagkatapos ay maaari mong mahanap pinakamainam na malinis na diskarte mga manlalaro.

Ang dalisay na diskarte ng manlalaro ay maaaring ako ay kinakatawan ng isang inayos na hanay ng mga numero (isang vector) kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa ika-apat na lugar, na kung saan ay katumbas ng isa.

Ang dalisay na diskarte ng player II ay maaaring kinakatawan ng isang iniutos na hanay ng mga numero (isang vector), kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa ika-apat na lugar, na katumbas ng isa.

Halimbawa

.

Sa pamamagitan ng pagpili ng anumang hilera ng payoff matrix bilang kanyang paglipat, tinitiyak ng manlalaro ang kanyang sarili na isang pinakamasamang kaso na pagbabayad ng hindi bababa sa halaga sa haligi na ipinahiwatig ng:

Samakatuwid, pipiliin ng manlalaro ang ika-2 hilera ng payoff matrix, na nagbibigay sa kanya ng maximum na kabayaran kahit ano ang paglipat ng player II, na susubukan na mabawasan ang halagang ito:

Iniisip ng Player II ang parehong paraan at pinipili ang 1st haligi bilang kanyang paglipat:

Kaya, mayroong isang saddle point ng pagbabayad ng matrix:

naaayon sa pinakamainam na purong diskarte para sa player I at para sa player II, kung saan player ay hindi ko binabawasan ang kanyang pakinabang para sa anumang pagbabago sa diskarte sa pamamagitan ng player II at player II ay hindi nadaragdagan ang kanyang pagkawala para sa anumang pagbabago sa diskarte ng player I.

5.3. Pinakamabuting halo-halong diskarte sa isang laro ng matris

Kung ang payoff matrix ay walang saddle point, kung gayon hindi makatwiran para sa sinumang manlalaro na gumamit ng isang dalisay na diskarte. Ito ay mas kapaki-pakinabang na gamitin "probabilistic mixtures" purong mga diskarte. Pagkatapos, ang halo-halong mga diskarte ay natutukoy bilang pinakamainam.

Hinahalong diskarte ng isang player ay nailalarawan sa pamamagitan ng posibilidad ng pamamahagi ng isang random na kaganapan na binubuo sa isang pagpipilian ng player ng isang ilipat.

Ang halo-halong diskarte ng player ko ay tulad ng isang iniutos na hanay ng mga numero (vector) na nasiyahan sa dalawang kundisyon:

1) para sa, i.e., ang posibilidad ng pagpili ng bawat hilera ng matrix ng pagbabayad ay hindi negatibo;

2), i.e., ang pagpili ng bawat isa sa mga hilera ng pagbabayad ng matrix sa pinagsama-samang kumakatawan buong pangkat mga kaganapan.

Ang halo-halong diskarte ng Player II ay magiging isang order na hanay ng mga numero (vector) na nasiyahan ang mga kondisyon:

Halaga ng pagbabayad sa player ko, na pumili ng isang halo-halong diskarte

mula sa player II na pumili ng isang halo-halong diskarte

,

kumakatawan sa average

.

Optimum tinatawag na halo-halong mga diskarte

at ,

kung para sa anumang mga di-makatarungang halo-halong mga diskarte at ang kondisyon ay nasiyahan:

iyon ay, sa ilalim ng pinakamainam na halo-halong diskarte, ang kabayaran ng player na ako ang pinakamalaki, at ang pagkawala ng player II ay ang pinakamaliit.

Kung walang point saddle sa payoff matrix, kung gayon

,

i.e., mayroong isang positibong pagkakaiba ( hindi pinapamahalang pagkakaiba )

- ³ 0,

at ang mga manlalaro ay kailangang maghanap ng karagdagang mga pagkakataon upang kumpiyansa na makakuha ng isang mas malaking bahagi ng pagkakaiba sa kanilang pabor.

Halimbawa

Isaalang-alang ang isang laro na ibinigay ng isang payoff matrix:

.

Alamin kung mayroong isang saddle point:

, .

Ito ay lumiliko na walang saddle point sa payoff matrix at ang hindi pinapamahalang pagkakaiba ay katumbas ng:

.

5.4. Paghahanap ng pinakamainam na halo-halong mga diskarte

para sa mga laro 2 × 2

Ang pagpapasiya ng pinakamainam na halo-halong mga diskarte para sa payoff matrix ng sukat ay isinasagawa sa pamamagitan ng pamamaraan ng paghahanap ng mga pinakamabuting kalagayan na mga puntos ng isang function ng dalawang variable.

Hayaan ang posibilidad ng player na pinili ko ang unang hilera ng pagbabayad ng matrix

ay pantay. Pagkatapos ang posibilidad ng pagpili ng pangalawang hilera ay.

Hayaan ang posibilidad ng pagpili ng player II na pumili ng unang haligi ay katumbas ng. Pagkatapos ang posibilidad ng pagpili ng pangalawang haligi ay.

Ang halaga ng pagbabayad sa player I sa pamamagitan ng player II ay katumbas ng:

Ang matinding halaga ng pakinabang ng player ko at ang pagkawala ng player II ay tumutugma sa mga kondisyon:

;

.

Kaya, ang pinakamainam na halo-halong mga diskarte ng mga manlalaro I at II ay ayon sa pagkakabanggit:

5.5. Geometric solution ng mga laro 2 ×n

Sa pagtaas ng sukat ng payoff matrix mula sa, hindi na posible na mabawasan ang pagpapasiya ng pinakamainam na halo-halong mga diskarte sa paghahanap ng pinakamabuting kalagayan ng isang function ng dalawang variable. Gayunpaman, ibinigay na ang isa sa mga manlalaro ay may dalawang mga diskarte lamang, maaaring magamit ang isang geometric solution.

Ang mga pangunahing yugto ng paghahanap ng isang solusyon sa laro ay ang mga sumusunod.

Ipakilala natin ang isang coordinate system sa eroplano. Gumuhit ng isang segment sa axis. Gumuhit ng mga patayo mula sa kaliwa at kanang mga dulo ng segment na ito.


Ang kaliwa at kanang dulo ng yunit ng seksyon ay tumutugma sa dalawang mga diskarte at magagamit para sa manlalaro I. Sa mga iginuhit na mga patayo ay ipagpaliban natin ang mga panalo ng manlalaro na ito. Halimbawa, para sa isang matrikula sa pagbabayad


ang nasabing payoff ng player ko kapag pumipili ng isang diskarte ay magiging at, at kapag pumipili ng isang diskarte ay magiging at.

Ipaalam sa amin na kumonekta sa pamamagitan ng mga tuwid na mga linya ng mga payoff point ng player na naaayon sa mga diskarte ng player II. Pagkatapos ang nabuo na sirang linya, na naghahawak ng graph mula sa ibaba, tinukoy ang mas mababang hangganan ng kabayaran ng manlalaro I.



Hanapin ang pinakamainam na halo-halong diskarte ng player ko

,

na tumutugma sa puntong nasa ibabang hangganan ng kabayaran ng manlalaro ko sa maximum na ordinate.

Tandaan na sa halimbawa na isinasaalang-alang, ang paggamit lamang ng dalawang mga diskarte at naaayon sa mga tuwid na linya na pumapasok sa nahanap na punto sa mas mababang hangganan ng kabayaran ng manlalaro I, ang player II ay maaaring mapigilan ang player na ako mula sa pagtanggap ng isang mas malaking bayad.

Kaya, ang laro ay nabawasan sa isang laro at ang pinakamainam na halo-halong diskarte ng player II sa halimbawang ito ay

,

kung saan ang posibilidad ay pareho sa laro:

5.6. Solusyon ng Larom× n

Kung ang isang laro ng matrix ay walang solusyon sa mga dalisay na estratehiya (i.e., walang point saddle) at, dahil sa malaking sukat ng payoff matrix, ay hindi malulutas ng grapiko, kung gayon upang makakuha ng isang solusyon, gamitin linear na paraan ng pagprograma .

Hayaan ang sukat ng payoff ng sukat:

.

Hanapin ang mga probabilidad , kung aling manlalaro ang dapat kong piliin ang kanyang mga gumagalaw para sa halo-halong diskarte na ito upang matiyak sa kanya ang isang pakinabang ng hindi bababa sa isang halaga, anuman ang pagpili ng mga gumagalaw sa pamamagitan ng player II.

Para sa bawat galaw na pinili ng player II, ang kabayaran ng player na ako ay tinutukoy ng mga dependencies:

Hatiin natin ang magkabilang panig ng hindi pagkakapareho sa pamamagitan ng at ipakilala ang bagong notasyon:

Pagkakapantay-pantay

Dadalhin ang form:

Dahil naglalayong ang player na i-maximize ang kabayaran, dapat na mabawasan ang gantimpala. Pagkatapos ang liham na problema sa programming para sa player na kukuha ko ng form:

may mga paghihigpit

Katulad nito, ang problema para sa player II ay itinayo bilang isang dalawahan:

may mga paghihigpit

Ang paglutas ng mga problema gamit ang simpleng pamamaraan, nakukuha namin:

,

5.7. Mga Tampok ng paglutas ng mga laro ng matrix

Bago lutasin ang problema sa paghahanap ng pinakamainam na mga diskarte, dapat suriin ang dalawang kundisyon:

Posible bang gawing simple ang matrix ng pagbabayad;

Mayroon bang point saddle ang pagbabayad.

Isaalang-alang natin ang posibilidad ng gawing simple ang matrix ng pagbabayad:

Dahil sa ang katunayan na player na hinahangad ko upang makakuha pinakamalaking panalo, pagkatapos ay maaari mong i-cross out ang linya mula sa matrix ng pagbabayad, dahil hindi niya gagamitin ang paglipat na ito kung ang sumusunod na kaugnayan ay nasiyahan sa anumang iba pang linya:

Katulad nito, ang pagsusumikap para sa pinakamaliit na pagkawala, ang player II ay hindi pipiliin ang haligi ng ith sa pay matrix bilang isang paglipat, at ang haligi na ito ay maaaring ma-cross kung ang sumusunod na ugnayan ay may hawak ng anumang iba pang haligi:

Karamihan simpleng solusyon ang laro ay ang pagkakaroon ng pinasimple na matrix ng pagbabayad ng isang punong punong nakakatugon sa sumusunod na kondisyon (sa pamamagitan ng kahulugan):

Halimbawa

Ibinibigay ang isang matrikula sa pagbabayad:

.

Pagpapasimple ng matrix ng pagbabayad:

Puno ng lungkot:

5.8. Nakikipaglaro sa kalikasan

Kabaligtaran sa mga problema ng teorya ng laro sa mga problema ng teorya mga desisyon sa istatistika ang isang hindi tiyak na sitwasyon ay walang pagkontra ng antagonistic na salungatan at nakasalalay sa layunin ng katotohanan, na karaniwang tinatawag "kalikasan" .

Sa mga laro ng matrix na may likas na katangian, ang player II ay nilalaro ng isang hanay ng mga hindi tiyak na mga kadahilanan na nakakaapekto sa kahusayan ng mga pagpapasya.

Ang mga laro ng matrix na may likas na katangian ay naiiba sa mga ordinaryong laro ng matrix lamang, na kapag pumipili ng isang pinakamainam na diskarte sa pamamagitan ng player ko, hindi na posible na gabayan ng katotohanan na ang player II ay susubukan na mabawasan ang kanyang pagkawala. Samakatuwid, kasama ang pagbabayad ng matrix, peligro ng matris :

saan ang halaga ng panganib ng player ko kapag gumagamit ng paglipat sa ilalim ng mga kondisyon na katumbas ng pagkakaiba sa pagitan ng kabayaran na tatanggap ng manlalaro kung alam niya na ang kondisyon ay maitatag, i.e. , at ang mga panalo na matatanggap niya, hindi alam kung pumipili ng isang paglipat na maitatag ang kundisyon.

Sa gayon, ang payoff matrix ay hindi mabago na-convert sa isang panganib na matrix, habang ang reverse conversion ay hindi maliwanag.

Halimbawa

Payoff matrix:

.

Panganib na Matrix:

Maaari dalawang pahayag sa problema tungkol sa pagpili ng isang solusyon sa isang laro ng matrix na may likas na katangian :

Pag-maximize ng mga panalo;

Ang pag-minimize ng panganib.

Ang problema sa paggawa ng desisyon ay maaaring magawa para sa isa sa dalawang kundisyon:

- nanganganib kung ang pag-andar ng pamamahagi ng posibilidad ng pamamahagi ng mga diskarte ng kalikasan ay kilala, halimbawa, ang random na halaga ng paglitaw ng bawat isa sa ipinapalagay na tiyak na mga sitwasyon sa ekonomiya;

- sa kawalan ng katiyakan kung hindi alam ang gayong isang posibilidad ng pamamahagi ng posibilidad.

5.9. Paglutas ng mga problema ng teorya ng mga desisyon sa istatistika

nanganganib

Kapag nagpapasya sa ilalim ng mga kondisyon ng peligro, player alam ko ang mga posibilidad ang simula ng mga estado ng kalikasan.

Kung gayon kinakailangan para sa player na pipiliin ko ang diskarte kung saan ang average na halaga ng mga panalo, kinuha bawat linya, maximum :

.

Kapag nalutas ang problemang ito sa isang panganib na matrix, nakukuha namin ang parehong solusyon na naaayon sa pinakamababang average na panganib :

.

5.10. Paglutas ng mga problema ng teorya ng mga desisyon sa istatistika

sa kawalan ng katiyakan

Kapag nagpapasya sa ilalim ng mga kondisyon ng kawalan ng katiyakan, maaari mong gamitin ang sumusunod pamantayan :

Wald's Maximin criterion;

Ang criterion kaunting panganib Sevija;

Ang criterion para sa pesimism ay ang optimismo ni Hurwitz;

Ang prinsipyo ni Laplace ng hindi sapat na batayan.

Isaalang-alang ang maximin test ni Wald .

Ang laro na may kalikasan ay nilalaro bilang isang makatwirang agresibo na kalaban, i.e., isang pamamaraan ng muling pagsiguro ay isinasagawa mula sa posisyon ng matinding pesimismo para sa matrikula sa pagbabayad:

.

Isaalang-alang Ang minimum na criterion ng pag-save ng pag-save .

Isang diskarte na katulad sa nauna mula sa posisyon ng matinding pesimismo para sa panganib na matrix:

.

Isaalang-alang criterion ng pesimism - optimismo ng Hurwitz .

Inaalok ang isang pagkakataon na hindi gagabay sa alinman sa matinding pesimismo o matinding pag-optimize:

kung saan ang antas ng pesimismo;

sa - matinding pag-optimize,

sa - matinding pesimismo.

Isaalang-alang Ang prinsipyo ni Laplace ng hindi sapat na batayan .

Ito ay pinaniniwalaan na ang lahat ng mga estado ng kalikasan ay pantay na malamang:

,

.

Mga konklusyon sa ikalimang seksyon

Ang dalawang manlalaro ay lumahok sa laro ng matrix at ang payoff function, na nagsisilbi upang matukoy ang halaga ng pagbabayad ng pagkawala ng manlalaro sa nagwagi, ay kinakatawan sa anyo ng isang payoff matrix. Napagkasunduan namin na player ang pipili ng isa sa mga hilera ng payoff matrix bilang isang paglipat, at pipiliin ng player II ang isa sa mga haligi nito. Pagkatapos, sa intersection ng napiling hilera at haligi ng matrix na ito, mayroong numerical na halaga ng pagbabayad sa player I mula sa player II (kung ang halagang ito ay positibo, kung gayon ang manlalaro ay talagang nanalo ako, at kung negatibo, pagkatapos manlalaro II mahalagang nanalo).

Kung mayroong isang saddle point sa payoff matrix, kung gayon ang mga manlalaro ay may pinakamainam na purong estratehiya, iyon ay, upang manalo, ang bawat isa sa kanila ay dapat ulitin ang kanyang isang pinakamabuting paglipat. Kung walang point saddle, kung gayon ang bawat isa sa kanila ay dapat gumamit ng pinakamainam na halo-halong diskarte upang manalo, iyon ay, gumamit ng isang halo ng mga galaw, bawat isa ay dapat gumanap nang may pinakamainam na posibilidad.

Ang paghahanap para sa pinakamainam na halo-halong mga diskarte para sa 2 × 2 na laro ay isinasagawa sa pamamagitan ng pagkalkula ng pinakamainam na posibilidad na gumagamit ng mga kilalang formula. Sa pamamagitan ng geometric solution Para sa 2 × n laro, ang kahulugan ng pinakamainam na halo-halong mga diskarte sa mga ito ay nabawasan sa paghahanap ng pinakamainam na halo-halong mga diskarte para sa 2 × 2 na mga laro. Upang malutas ang mga laro ng m × n, ginagamit ang isang linear na paraan ng programming upang mahanap ang pinakamainam na halo-halong mga diskarte sa kanila.

Ang ilang mga matrice ng pagbabayad ay nagpahiram sa kanilang sarili sa pagpapasimple, bilang isang resulta kung saan ang kanilang sukat ay nabawasan sa pamamagitan ng pag-alis ng mga hilera at haligi na naaayon sa hindi nakakagambalang mga galaw.

Kung ang player II ay isang hanay ng mga hindi tiyak na mga kadahilanan na nakasalalay sa layunin ng katotohanan at walang pagkakaroon ng antagonistic na salungatan sa pagkakasalungatan, kung gayon ang ganitong laro ay tinatawag na isang laro na may likas na katangian, at ang mga problema ng teorya ng mga statistic na desisyon ay ginagamit upang malutas ito. Pagkatapos, kasama ang payoff matrix, ipinakilala ang isang panganib na matrix at dalawang pahayag ng problema ng pagpili ng isang solusyon sa laro ng matrix na may kalikasan ay posible: pag-maximize ang kabayaran at pag-minimize ng panganib.

Ang solusyon ng mga problema sa teorya ng mga statistic decision sa ilalim ng mga kondisyon ng peligro ay nagpapakita na ipinapayong para sa player na piliin ko ang diskarte kung saan ang average na halaga (pag-asa sa matematika) ng payoff na kinuha sa hilera ng payoff matrix ay pinakamataas, o (na magkatulad) ang average na halaga (pag-asa sa matematika) ng peligro kinuha ng hilera ng panganib matrix ay minimal. Kapag nagpapasya sa ilalim ng mga kondisyon ng kawalan ng katiyakan, gamitin ang mga sumusunod na pamantayan: Ang pinakamaraming kriterya ni Wald, ang minimal na criterion ng panganib ni Sevidge, ang kritika ng pessimism-optimism ni Hurwitz, ang prinsipyo ni Laplace na hindi sapat na batayan.

Mga tanong sa pagsubok sa sarili

Paano tinukoy ang mga pangunahing konsepto ng teorya ng laro: ilipat, diskarte at payoff function?

Kumusta ang pagpapaandar ng payoff sa isang laro ng matrix?

Bakit ang isang laro ng matrix ay tinatawag na zero sum?

Paano kinakatawan ang proseso ng paglalaro ng laro ng matrix?

Anong laro ang tinatawag na isang m × n game?

Ano ang pinakamainam na diskarte sa laro ng matrix?

Ano ang pinakamainam na diskarte para sa isang laro ng matrix na tinatawag na puro?

Ano ang ibig sabihin ng saddle point ng payoff matrix?

Ano ang pinakamainam na diskarte para sa isang laro ng matrix na tinatawag na halo?

Paano lumilitaw ang halo-halong diskarte ng manlalaro?

Ano ang halaga ng pagbabayad sa Player I mula sa Player II, na pumili ng halo-halong mga diskarte?

Anong mga halo-halong diskarte ang tinatawag na pinakamainam?

Ano ang ibig sabihin ng hindi pinapamahaging pagkakaiba?

Anong pamamaraan ang ginamit upang mahanap ang pinakamainam na halo-halong mga diskarte para sa 2 × 2 na mga laro?

Paano natagpuan ang pinakamainam na halo-halong mga diskarte para sa 2 × n na mga laro?

Ano ang pamamaraan na ginagamit upang mahanap ang pinakamainam na halo-halong mga diskarte para sa mga laro ng m × n?

Ano ang mga tampok ng paglutas ng mga laro ng matrix?

Ano ang kahulugan ng pagiging simple ng pagbabayad ng matrix at sa ilalim ng anong mga kundisyon maaari itong gawin?

Aling laro ng matrix ang mas madaling malutas kapag ang payoff matrix ay mayroon o walang isang saddle point?

Ano ang mga problema ng teorya ng laro na nauugnay sa mga problema ng teorya ng mga desisyon sa istatistika?

Paano Nagbago ang Matrix ng Pagbabayad sa isang Panganib na Matrix?

Ano ang dalawang pahayag ng problema ng pagpili ng mga solusyon na posible sa isang laro ng matrix na may likas na katangian?

Para sa anong dalawang kundisyon ang maaaring maitakda ang mga problema sa paggawa ng desisyon sa isang laro ng matris na may likas na katangian?

Anong diskarte ang kinakailangan para sa player na pipiliin ko kapag nalutas ang problema ng teorya ng mga desisyon sa istatistika sa ilalim ng mga kondisyon ng peligro?

Anong pamantayan ng desisyon ang maaaring magamit sa paglutas ng mga problema ng teorya ng mga desisyon sa istatistika sa ilalim ng kawalan ng katiyakan?

Mga halimbawa ng paglutas ng problema

1. Ipinapakita ng matrikula sa pagbabayad ang halaga ng kita ng negosyo kapag nagbebenta ito iba't ibang uri mga produkto (haligi) depende sa matatag na demand (mga hilera). Kinakailangan upang matukoy ang pinakamainam na diskarte ng negosyo para sa paggawa ng mga produkto ng iba't ibang uri at kaukulang maximum (sa average) na kita mula sa kanilang pagbebenta.

Ipinapahiwatig namin ang ibinigay na matris sa pamamagitan ng at ipinakilala ang mga variable. Gumagamit din kami ng isang matrix (vector). Pagkatapos at, i.e.

Ang kabaligtaran matrix ay kinakalkula:

Ang mga halaga ay matatagpuan:

.

Ang mga posibilidad ay kinakalkula:

Ang average na kita mula sa mga benta ay tinutukoy:

.

Ang Firm "Pharmacist" ay isang tagagawa ng mga gamot at biomedical na produkto sa rehiyon. Ito ay kilala na ang demand na rurok para sa ilang mga gamot ay bumagsak tag-araw (mga gamot ng pangkat ng cardiovascular, analgesics), para sa iba - para sa mga taglagas at tagsibol na panahon (anti-nakakahawang, antitussive).

Mga gastos para sa 1 conv. mga yunit Ang mga produkto para sa Setyembre-Oktubre ay: para sa unang pangkat (mga cardiovascular na gamot at analgesics) - 20 rubles; sa pangalawang pangkat (anti-nakakahawang, gamot na antitussive) - 15 rubles.

Ayon sa mga obserbasyon para sa marami mga nakaraang taon ang serbisyo sa pagmemerkado ng kumpanya ay natagpuan na maaari itong mapagtanto sa loob ng dalawang buwan na isinasaalang-alang sa mainit-init na panahon 3050 conv. mga yunit mga produkto ng unang pangkat at 1100 conv. mga yunit mga produkto ng pangalawang pangkat; sa malamig na panahon - 1525 conv. mga yunit mga produkto ng unang pangkat at 3690 conv. mga yunit ang pangalawang pangkat.

Kaugnay ng mga posibleng pagbabago sa panahon, ang gawain ay nakatakda - upang matukoy ang diskarte ng kumpanya sa paggawa ng mga produkto na nagbibigay ng maximum na kita mula sa mga benta sa isang presyo ng benta na 40 rubles. para sa 1 conv. mga yunit mga produkto ng unang pangkat at 30 rubles. - ang pangalawang pangkat.

DESISYON. Ang firm ay may dalawang diskarte:

Ang panahon ay magiging mainit-init sa taong ito;

Malamig ang panahon.

Kung ang kumpanya ay nagpatibay ng isang diskarte at sa katotohanan magkakaroon ng mainit-init na panahon (diskarte sa kalikasan), kung gayon ang output (3050 maginoo na yunit ng unang pangkat ng mga gamot at 1100 mga maginoo na yunit ng pangalawang pangkat) ay ganap na ibebenta at ang kita ay magiging

3050 × (40-20) + 1100 × (30-15) \u003d 77500 p.

Sa malamig na panahon (diskarte sa kalikasan), ang mga gamot ng pangalawang pangkat ay ibebenta nang buo, at ang unang pangkat lamang sa halagang 1525 conv. mga yunit at ang ilan sa mga gamot ay mananatiling hindi natanto. Ang kita ay

1525 × (40-20) + 1100 × (30-15) -20 × () \u003d 16500 p.

Katulad nito, kung ang form ay nagpatibay ng isang diskarte at ang panahon ay talagang malamig, kung gayon ang magiging kita

1525 × (40-20) + 3690 × (30-15) \u003d 85850 p.

Sa mainit-init na panahon, ang kita ay

1525 × (40-20) + 1100 × (30-15) - () × 15 \u003d 8150 p.

Isinasaalang-alang ang firm at ang panahon bilang dalawang manlalaro, nakakakuha kami ng matrix ng pagbabayad

,

Ang presyo ng laro ay namamalagi sa saklaw

Makikita mula sa matrix ng pagbabayad na, sa ilalim ng lahat ng mga kondisyon, ang kita ng kompanya ay hindi bababa sa 16,500 rubles, ngunit kung ang mga kondisyon ng panahon ay nag-tutugma sa napiling diskarte, kung gayon ang kita ng kompanya ay maaaring maging 77,500 rubles.

Maghanap ng isang solusyon sa laro.

Ipagpalagay natin ang posibilidad ng diskarte ng firm na inilalapat ng, diskarte sa pamamagitan ng, at. Malutas ang laro sa graphically sa pamamagitan ng pamamaraan, nakukuha namin , habang ang presyo ng laro ay p.

Ang pinakamainam na plano sa paggawa ng gamot ay

Kaya, ipinapayong para sa kumpanya na makagawa noong Setyembre at Oktubre 2379 conv. mga yunit gamot ng unang pangkat at 2239.6 conv. mga yunit gamot sa pangalawang pangkat, pagkatapos sa anumang panahon ay makakatanggap siya ng kita ng hindi bababa sa 46986 rubles.

Sa mga kondisyon ng kawalan ng katiyakan, kung hindi posible para sa isang firm na gumamit ng isang halo-halong diskarte (mga kontrata sa iba pang mga organisasyon), ginagamit namin ang mga sumusunod na pamantayan upang matukoy ang pinakamainam na diskarte ng firm:

Walde criterion:

Hurwitz criterion: para sa pagpapaliwanag, tatanggapin namin, pagkatapos para sa diskarte ng firm

para sa diskarte

ipinapayong para sa firm na gumamit ng isang diskarte.

Criterion ng pag-save. Ang pinakamataas na elemento sa unang haligi ay 77500, sa pangalawang haligi ito ay 85850.

Ang mga elemento ng panganib matrix ay matatagpuan mula sa expression

,

kung saan ,,

Ang panganib matrix ay may form

,

ipinapayong gamitin ang diskarte o.

Samakatuwid, akma para sa firm na mag-apply ng diskarte o.

Tandaan na ang bawat isa sa mga itinuturing na pamantayan ay hindi makikilala bilang ganap na kasiya-siya para sa panghuling pagpipilian Gayunpaman, ang kanilang mga pinagsamang pagsusuri ay nagbibigay-daan sa iyo upang mas malinaw na kumakatawan sa mga kahihinatnan ng paggawa ng ilang mga desisyon sa pamamahala.

Sa isang kilalang pamamahagi ng mga probabilidad ng iba't ibang mga estado ng kalikasan, ang pagpapasya sa pagpapasya ay ang pinakamataas na pag-asa sa matematika ng isang kabayaran.

Ipaalam ito sa problema sa pagsasaalang-alang na ang mga posibilidad ng mainit at malamig na panahon ay pantay at pantay sa 0.5, kung gayon ang pinakamainam na diskarte ng kumpanya ay natutukoy tulad ng sumusunod:

Maipapayo para sa isang firm na gumamit ng isang diskarte o.

Mga takdang aralin sa sarili

1. Ang isang negosyo ay maaaring makagawa ng tatlong uri ng mga produkto (A, B at C), habang tumatanggap ng kita na nakasalalay sa hinihingi. Ang kahilingan, sa turn, ay maaaring tumagal ng isa sa apat na estado (I, II, III at IV). Sa mga sumusunod na matris, ang mga elemento ay sumasalamin sa kita na matatanggap ng negosyo kapag gumagawa ng ika-isang produkto at ang pang-estado ng demand:

Sa pangkalahatan, V * ≠ V * - walang point saddle. Walang optimal na solusyon sa dalisay na mga diskarte. Gayunpaman, kung palawakin namin ang konsepto ng dalisay na diskarte sa pamamagitan ng pagpapakilala ng konsepto ng isang halo-halong diskarte, pagkatapos posible na ipatupad ang isang algorithm para sa paghahanap ng pinakamainam na solusyon sa isang hindi kumpletong tinukoy na problema sa laro. Sa ganitong sitwasyon, iminungkahi na gumamit ng isang statistical (probabilistic) na diskarte sa paghahanap ng pinakamainam na solusyon sa isang laro ng antagonistic. Para sa bawat manlalaro, kasama ang isang naibigay na hanay ng mga diskarte na posible para sa kanya, isang hindi kilalang vector ng mga probabilidad (kamag-anak na mga frequency) ay ipinakilala kung saan ang isa o ibang diskarte ay dapat mailapat.

Ipinapahiwatig namin ang vector ng mga probabilidad (kamag-anak na mga frequency) sa pagpili ng ibinigay na mga diskarte ng player A tulad ng sumusunod:
P \u003d (p 1, p 2, ..., p m),
kung saan p i ≥ 0, p 1 + p 2 + ... + p m \u003d 1. Ang halaga p i ay tinatawag na posibilidad (dalas ng kamag-anak) ng paglalapat ng diskarte A i.

Katulad nito, para sa player B, isang hindi kilalang vector ng mga probabilidad (kamag-anak na mga frequency) ay ipinakilala tulad ng sumusunod:
Q \u003d (q 1, q 2, ..., q n),
kung saan q j ≥ 0, q 1 + q 2 + ... + q n \u003d 1. Ang dami q j ay tinatawag na posibilidad (dalas ng kamag-anak) ng paglalapat ng diskarte B j. Ang set (kumbinasyon) ng mga purong estratehiya A 1, A 2, ... A m at B 1, B 2, ... B n kasama ang mga vectors ng mga posibilidad na pumili ng bawat isa sa kanila ay tinatawag na halo-halong mga diskarte.

Ang pangunahing teorem sa teorya ng mga may hangganan na antagonistic na laro ay Teorema ni Von Neumann: bawat natapos na laro ng matris kahit na, isang pinakamainam na solusyon, marahil sa mga halo-halong diskarte.
Sinusundan ito mula sa teorema na ang isang hindi kumpletong tinukoy na laro ay may hindi bababa sa isang pinakamainam na solusyon sa magkakaibang mga diskarte. Sa ganitong mga laro, ang solusyon ay isang pares ng pinakamainam na halo-halong mga diskarte na P * at Q *, tulad ng kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na diskarte, kung gayon hindi kumikita para sa ibang player na lumihis mula sa kanyang pinakamainam na diskarte.
Ang average na kabayaran ng player A ay natutukoy ng pag-asa sa matematika:

Kung ang probabilidad (kamag-anak na dalas) ng pag-apply ng isang diskarte ay nonzero, kung gayon ang isang diskarte ay tinatawag aktibo.

Ang mga diskarte na P *, Q * ay tinawag pinakamainam na halo-halong mga diskarte kung M A (P, Q *) ≤ M A (P *, Q *) ≤ M A (P *, Q) (1)
Sa kasong ito, tinawag ang M A (P *, Q *) sa isang gastos laro at sinasabing V (V * ≤ V ≤ V *). Ang una sa mga hindi pagkakapantay-pantay (1) ay nangangahulugang paglihis ng player A mula sa kanyang pinakamainam na halo-halong diskarteibinigay na player B sumunod sa kanyang pinakamainam na halo-halong diskarte, humahantong sa isang pagbawas sa average na bayad player A. Ang pangalawa ng mga hindi pagkakapareho ay nangangahulugan na ang paglihis ng player B mula sa kanyang pinakamainam na halo-halong diskarte ibinigay na player Ang isang sumunod sa kanyang pinakamainam na halo-halong diskarte, humahantong sa isang pagtaas sa average na pagkawala ng player B.

Sa pangkalahatan, ang mga naturang gawain ay matagumpay na malutas sa calculator na ito.

Isang halimbawa.

4 7 2
7 3 2
2 1 8

1. Suriin kung ang pagbabayad ng matrix ay may punong punla... Kung oo, pagkatapos ay isusulat namin ang solusyon ng laro sa dalisay na mga diskarte.

Ipinapalagay namin na player ang pipiliin ang kanyang diskarte upang makuha ang kanyang pinakamataas na bayad, at pipiliin ng player II ang kanyang diskarte upang mabawasan ang kabayaran ng manlalaro I.

Mga Manlalaro B 1 B 2 B 3 a \u003d min (A i)
Isang 1 4 7 2 2
Isang 2 7 3 2 2
Isang 3 2 1 8 1
b \u003d max (B i) 7 7 8

Hanapin ang garantisadong payoff na tinutukoy ng mas mababang presyo ng laro ng isang \u003d max (a i) \u003d 2, na nagpapahiwatig ng maximum na dalisay na diskarte A 1.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d 7. Alin ang nagpapahiwatig ng kawalan ng isang saddle point, dahil ang isang ≠ b, kung gayon ang presyo ng laro ay nasa hanay 2 ≤ y ≤ 7. Hanapin ang solusyon sa laro sa halo-halong mga diskarte. Ipinaliwanag ito sa pamamagitan ng katotohanan na ang mga manlalaro ay hindi maipahayag ang kanilang mga dalisay na diskarte sa kaaway: dapat nilang itago ang kanilang mga aksyon. Maaaring malutas ang laro sa pamamagitan ng pagpapaalam sa mga manlalaro na pumili ng kanilang mga diskarte sapalaran (paghaluin ang mga purong estratehiya).

2. Sinusuri ang payout matrix para sa nangingibabaw na mga hilera at nangingibabaw na mga haligi.
Walang mga nangingibabaw na hilera at nangingibabaw na mga haligi sa payoff matrix.

3. Hanapin ang solusyon sa laro sa halo-halong mga diskarte.
Isulat natin ang sistema ng mga equation.
Para sa player ko
4p 1 + 7p 2 + 2p 3 \u003d y
7p 1 + 3p 2 + p 3 \u003d y
2p 1 + 2p 2 + 8p 3 \u003d y
p 1 + p 2 + p 3 \u003d 1

Para sa player II
4q 1 + 7q 2 + 2q 3 \u003d y
7q 1 + 3q 2 + 2q 3 \u003d y
2q 1 + q 2 + 8q 3 \u003d y
q 1 + q 2 + q 3 \u003d 1

Ang paglutas ng mga sistemang ito sa pamamagitan ng paraan ng Gauss, nakita namin:

y \u003d 4 1/34
p 1 \u003d 29/68 (posibilidad ng paggamit ng 1st diskarte).
p 2 \u003d 4/17 (ang posibilidad ng pag-apply ng 2nd diskarte).
p 3 \u003d 23/68 (ang posibilidad ng paglalapat ng ika-3 diskarte).

Pinakamabuting halo-halong diskarte ng player I: P \u003d (29/68; 4/17; 23/68)
q 1 \u003d 6/17 (ang posibilidad ng paggamit ng 1st diskarte).
q 2 \u003d 9/34 (ang posibilidad ng pag-apply ng 2nd diskarte).
q 3 \u003d 13/34 (ang posibilidad ng paggamit ng ika-3 diskarte).

Optimum na halo-halong diskarte ng player II: Q \u003d (6/17; 9/34; 13/34)
Presyo ng laro: y \u003d 4 1/34

Kung ang laro ay walang isang saddle point, pagkatapos ang mga paghihirap ay lumitaw sa pagtukoy ng halaga ng laro at ang pinakamainam na diskarte ng mga manlalaro. Isaalang-alang, halimbawa, isang laro:

Sa larong ito at. Samakatuwid, ang unang manlalaro ay maaaring garantiya sa kanyang sarili na isang panalo ng 4, at ang pangalawa ay maaaring limitahan ang kanyang pagkawala 5. Ang lugar sa pagitan ng at ay, tulad ng, isang gumuhit at bawat manlalaro ay maaaring subukan upang mapagbuti ang kanyang resulta sa gastos ng lugar na ito. Ano ang dapat na pinakamainam na diskarte ng mga manlalaro sa kasong ito?

Kung ang bawat isa sa mga manlalaro ay nalalapat ang mga diskarte (s) na minarkahan ng isang asterisk, kung gayon ang pakinabang ng unang manlalaro at pagkawala ng pangalawa ay magiging 5. Ito ay hindi kasiya-siya para sa pangalawang manlalaro, dahil ang unang nanalo nang higit pa kaysa sa makakaya niya sa kanyang sarili. Gayunpaman, kung ang pangalawang manlalaro ay ibunyag sa ilang paraan ang hangarin ng unang manlalaro tungkol sa hangarin na gamitin ang diskarte, kung gayon maaari niyang ilapat ang diskarte at bawasan ang pakinabang ng una hanggang 4. Ngunit, kung ang unang manlalaro ay isiniwalat ang hangarin ng pangalawang manlalaro na gamitin ang diskarte, pagkatapos ay gumagamit ng diskarte, dadagdagan niya ang kanyang pakinabang sa 6 Kaya, ang isang sitwasyon ay lumitaw kung ang bawat manlalaro ay dapat na lihim na diskarte na gagamitin niya. Gayunpaman, paano mo ito gagawin? Pagkatapos ng lahat, kung ang laro ay nilalaro ng maraming beses at ang pangalawang manlalaro ay gumagamit ng diskarte sa lahat ng oras, kung gayon ang unang manlalaro ay malapit nang malaman ang intensyon ng pangalawa at, na inilapat ang diskarte, ay magkakaroon ng karagdagang bayad. Malinaw, ang pangalawang manlalaro ay dapat baguhin ang diskarte sa bawat bagong laro, ngunit dapat niyang gawin ito sa paraang hindi una hulaan ng una kung aling diskarte ang gagamitin niya sa bawat kaso.

Para sa random na mekanismo ng pagpili, ang mga panalo at pagkalugi ng mga manlalaro ay random variable... Ang resulta ng laro sa kasong ito ay maaaring tinantya ng average na pagkawala ng pangalawang player. Balikan natin ang halimbawa. Kaya, kung ang pangalawang manlalaro ay gumagamit ng diskarte at sapalarang may posibilidad na 0.5; 0.5, pagkatapos sa diskarte ng unang manlalaro, ang average na halaga ng kanyang pagkawala ay:

at sa diskarte ng unang manlalaro

Samakatuwid, ang pangalawang manlalaro ay maaaring limitahan ang kanyang average na pagkawala sa 4.5 anuman ang diskarte na ginamit ng unang manlalaro.

Kaya, sa isang bilang ng mga kaso lumiliko na hindi na magbalangkas ng isang diskarte nang maaga, ngunit upang pumili ng isa o sa isa nang random, gamit ang ilang mekanismo ng random na pagpipilian. Ang diskarte batay sa random na pagpili ay tinatawag halo-halong diskarte, sa kaibahan sa mga balangkas na nakabalangkas, na tinawag purong mga diskarte.

Bigyan tayo ng mas mahigpit na kahulugan ng puro at halo-halong mga diskarte.



Hayaan na magkaroon ng isang laro na walang punong punla:

Ipaalam sa amin na dalhin ang dalas ng paggamit ng dalisay na diskarte ng unang manlalaro sa pamamagitan ng, (ang posibilidad ng paggamit ng i-th na diskarte). Katulad nito, ipinapahiwatig namin ang dalas ng paggamit ng dalisay na diskarte ng pangalawang manlalaro sa pamamagitan ng, (ang posibilidad ng paggamit ng diskarte ng j-th) Mayroong purong solusyon ng diskarte para sa larong punong-punong. Para sa isang laro na walang punung-punong point, mayroong isang solusyon sa halo-halong mga diskarte, iyon ay, kapag ang pagpili ng diskarte ay batay sa mga posibilidad. Pagkatapos

Maraming purong 1st diskarte ng manlalaro;

Maraming mga halo-halong mga diskarte ng 1st player;

Maraming purong 2nd estratehiya ng manlalaro;

Maraming halo-halong mga diskarte sa 2nd player.

Isaalang-alang ang isang halimbawa: magkaroon tayo ng isang laro

Ang pangalawang manlalaro ang pipili ng posibilidad ... Tantiyahin natin ang average na pagkawala ng pangalawang player kapag inilalapat niya ang mga diskarte at, nang naaayon.

Makikilala sa pagitan ng dalisay at halo-halong mga diskarte. Malinis na diskarte
unang manlalaro (purong diskarte
ng pangalawang manlalaro) ay ang posibleng paglipat ng una (pangalawa) player, na pinili ng kanya na may posibilidad na katumbas ng 1.

Kung ang unang manlalaro ay may mga diskarte sa m, at ang pangalawa ay may mga diskarte, kung gayon para sa anumang pares ng mga diskarte ng una at pangalawang mga manlalaro na mga estratehiya ay maaaring kinakatawan bilang mga vectors ng yunit. Halimbawa, para sa isang pares ng mga diskarte
,
ang mga purong estratehiya ng una at pangalawang manlalaro ay isusulat bilang:
,
... Para sa isang pares ng mga diskarte ,ang mga purong estratehiya ay maaaring isulat bilang:

,

.

Teorya: Sa isang laro ng matrix, ang mas mababang presyo ng net laro ay hindi lalampas sa itaas na presyo ng net game, i.e.
.

Kahulugan:Kung para sa mga purong diskarte ,mga manlalaro A at B, ayon sa pagkakabanggit, ang pagkakapantay-pantay
, pagkatapos ay isang pares ng mga purong diskarte ( ,) ay tinatawag na saddle point ng laro ng matrix, ang elemento ng matris sa intersection ng i-th hilera at ang j-th na haligi ay ang elemento ng saddle ng pagbabayad ng matrix, at ang bilang
- ang net presyo ng laro.

Halimbawa: Hanapin ang mas mababa at itaas na mga presyo ng net, alamin ang pagkakaroon ng mga punong puntos ng larong matrix

.

Tukuyin natin ang mas mababa at itaas na mga presyo ng net sa laro:,
.

Sa kasong ito, mayroon kaming isang point saddle (A 1; B 2), at ang elemento ng saddle ay 5. Ang elementong ito ay ang pinakamaliit sa 1st row at ang pinakamalaking sa 2nd column. Ang paglihis ng player A mula sa pinakamataas na diskarte ng A 1 ay humantong sa isang pagbawas sa kanyang pakinabang, at ang paglihis ng player B mula sa minimax na diskarte ng B 2 ay humantong sa isang pagtaas sa kanyang pagkawala. Sa madaling salita, kung ang isang laro ng matrix ay may elemento ng saddle, kung gayon ang pinakamahusay na mga diskarte para sa mga manlalaro ay ang kanilang mga diskarte sa minimax. At ang mga dalisay na diskarte na ito, na bumubuo ng isang saddle point at pumili ng isang saddle element na 12 \u003d 5 sa laro matrix, ay pinakamainam na purong diskarte at mga manlalaro A at B.

Kung ang laro ng matrix ay walang isang saddle point, kung gayon ang solusyon ng laro ay nagiging mahirap. Sa mga larong ito
... Ang paggamit ng mga diskarte sa minimax sa naturang mga laro ay humantong sa katotohanan na para sa bawat isa sa mga manlalaro ang kabayaran ay hindi lalampas , at ang pagkawala ay hindi mas mababa ... Para sa bawat manlalaro, ang tanong ay lumitaw ng pagtaas ng mga panalo (pagbawas sa pagkawala). Ang solusyon ay natagpuan gamit ang halo-halong mga diskarte.

Kahulugan:Ang halo-halong diskarte ng una (pangalawa) player ay isang vector
saan
at
(
saan
at
).

Ang vector p (q) ay nagpapahiwatig ng posibilidad ng unang manlalaro na nag-aaplay ng i-th pure na diskarte (ang j-th purong diskarte ng pangalawang manlalaro).

Dahil pinili ng mga manlalaro ang kanilang mga dalisay na diskarte nang sapalaran at malaya sa bawat isa, ang laro ay may isang random na character at ang halaga ng panalo (pagkawala) ay nagiging random. Sa kasong ito, ang average na halaga ng pakinabang (pagkawala) - ang pag-asa sa matematika - ay isang function ng halo-halong mga diskarte p, q:

.

Kahulugan:Ang function f (p, q) ay tinatawag na payoff function ng laro kasama ang matrix
.

Kahulugan:Diskarte
,
ay tinatawag na optimal kung para sa mga di-makatwirang diskarte
,
nasiyahan ang kondisyon

Ang paggamit ng pinakamainam na halo-halong mga diskarte sa laro ay nagbibigay ng unang manlalaro ng isang kabayaran na hindi bababa sa kapag gumagamit siya ng anumang iba pang diskarte p; ang pangalawang manlalaro ay may pagkawala, hindi hihigit sa kung gumagamit siya ng anumang iba pang diskarte q.

Ang kumbinasyon ng mga pinakamainam na diskarte at mga presyo ng laro ay bumubuo sa solusyon ng laro.

© 2020 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway