Mga larong puro diskarte. Elena Ventzel

bahay / Nag-aaway

pinaghalong diskarte sa laro ng teorya

Pinaghalong diskarte

Kung ang isang matrix na laro ay walang saddle point sa mga purong diskarte, makikita ang mataas at mas mababang presyo ng laro. Ipinakikita nila na ang manlalaro 1 ay hindi makakatanggap ng kabayarang mas malaki kaysa sa pinakamataas na presyo ng laro, at ang manlalaro 1 ay ginagarantiyahan ng isang kabayaran na hindi bababa sa pinakamababang presyo ng laro.

Ang pinaghalong diskarte ng isang manlalaro ay isang kumpletong hanay ng kanyang mga purong diskarte kapag ang laro ay inulit ng maraming beses sa ilalim ng parehong mga kundisyon na may ibinigay na mga probabilidad. Ibuod natin ang nasabi at ilista ang mga kondisyon ng paggamit pinaghalong estratehiya:

  • * larong walang saddle point;
  • * Gumagamit ang mga manlalaro ng random na pinaghalong mga purong diskarte na may ibinigay na probabilidad;
  • * Ang laro ay paulit-ulit ng maraming beses sa ilalim ng katulad na mga kondisyon;
  • * sa bawat galaw, walang manlalaro ang nakakaalam tungkol sa pagpili ng diskarte ng ibang manlalaro;
  • * pinapayagan ang pag-average ng mga resulta ng laro.

Ang mga sumusunod na pagtatalaga para sa magkahalong estratehiya ay ginagamit.

Para sa manlalaro 1, ang pinaghalong diskarte ay binubuo sa paggamit ng mga purong diskarte A 1, A 2, ..., A t na may katumbas na probabilities p 1, p 2, ..., p t.

Para sa manlalaro 2

q j ay ang posibilidad ng paggamit ng purong diskarte B j .

Sa kaso kapag p i = 1, para sa player 1 mayroon kaming isang purong diskarte

Ang mga purong diskarte ng manlalaro ay ang tanging posibleng hindi magkatugma na mga kaganapan. Sa isang matrix game, alam ang matrix A (ito ay naaangkop sa parehong player 1 at player 2), matutukoy natin kung kailan binigay na mga vector at average na panalo ( inaasahang halaga epekto) manlalaro 1:

kung saan at mga vectors;

Ang p i at q i ay mga bahagi ng mga vector.

Sa pamamagitan ng paglalapat ng kanilang mga pinaghalong diskarte, ang manlalaro 1 ay naglalayong i-maximize ang kanyang average na kabayaran, at ang manlalaro 2 ay naglalayong bawasan ang epektong ito sa pinakamababang posibleng halaga. Ang Manlalaro 1 ay nagsisikap na maabot

Tinitiyak ng Manlalaro 2 na natutugunan ang kundisyon

Tukuyin din natin ang mga vector na naaayon sa pinakamainam na pinaghalong diskarte ng mga manlalaro 1 at 2, i.e. tulad ng mga vector at kung saan ang pagkakapantay-pantay ay masisiyahan

Ang halaga ng laro ay ang average na kabayaran ng player 1 kapag ang parehong mga manlalaro ay gumagamit ng magkahalong diskarte. Samakatuwid, ang solusyon sa larong matrix ay:

  • - pinakamainam na pinaghalong diskarte ng player 1;
  • - pinakamainam na pinaghalong diskarte para sa player 2;

Presyo ng laro.

Magiging pinakamainam ang mga pinaghalong diskarte (at) kung bubuo sila ng saddle point para sa function, i.e.

Mayroong pangunahing teorama para sa mga larong matematikal.

Para sa isang matrix na laro na may anumang matrix A ng magnitude

umiiral at pantay-pantay sa isa't isa: = = .

Dapat tandaan na kapag pumipili ng pinakamainam na diskarte, ang manlalaro 1 ay palaging magagarantiyahan ng average na kabayaran, hindi bababa sa presyo ng laro, para sa anumang nakapirming diskarte ng player 2 (at, vice versa, para sa player 2). Ang mga aktibong diskarte ng mga manlalaro 1 at 2 ay mga diskarte na bahagi ng pinakamainam na pinaghalong diskarte ng mga katumbas na manlalaro na may probabilidad maliban sa zero. Nangangahulugan ito na ang pinakamainam na pinaghalong diskarte ng mga manlalaro ay maaaring hindi kasama ang lahat ng kanilang mga priori na ibinigay na diskarte.

Ang paglutas ng laro ay nangangahulugang paghahanap ng presyo ng laro at pinakamainam na diskarte. Simulan natin ang pagsasaalang-alang ng mga pamamaraan para sa paghahanap ng pinakamainam na pinaghalong diskarte para sa mga larong matrix ang pinakasimpleng laro, na inilarawan ng matrix 22. Ang mga larong may saddle point ay hindi partikular na isasaalang-alang. Kung nakakuha ng saddle point, nangangahulugan ito na may mga hindi kapaki-pakinabang na diskarte na dapat iwanan. Sa kawalan ng saddle point, dalawang pinakamainam na pinaghalong diskarte ang maaaring makuha. Gaya ng nabanggit na, ang mga pinaghalong estratehiyang ito ay nakasulat tulad ng sumusunod:

Ibig sabihin, mayroong payment matrix

a 11 p 1 + a 21 p 2 = ; (1.16)

a 12 p 1 + a 22 p 2 = ; (1.17)

p 1 + p 2 = 1. (1.18)

a 11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

a 11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1 , (1.20)

kung saan nakukuha namin ang pinakamainam na halaga:

Alam at, nalaman natin:

Nang makalkula, nakita namin:

a 11 q 1 + a 12 q 2 = ; q 1 + q 2 = 1; (1.24)

a 11 q 1 + a 12 (1 - q 1) = . (1.25)

sa isang 11 a 12 . (1.26)

Ang problema ay nalutas, dahil ang mga vectors at ang presyo ng laro ay natagpuan. Ang pagkakaroon ng payment matrix A, maaari mong lutasin ang problema sa graphical na paraan. Sa pamamaraang ito, ang algorithm ng solusyon ay napaka-simple (Larawan 2.1).

  • 1. Ang isang segment ng haba ng yunit ay naka-plot sa kahabaan ng abscissa axis.
  • 2. Ang y-axis ay nagpapakita ng mga panalo para sa diskarte A 1 .
  • 3. Sa isang linya parallel sa ordinate axis, sa punto 1, ang mga panalo para sa diskarte a 2 ay naka-plot.
  • 4. Ang mga dulo ng mga segment ay itinalaga para sa isang 11 -b 11, a 12 -b 21, a 22 -b 22, a 21 -b 12 at dalawang tuwid na linya ay iginuhit b 11 b 12 at b 21 b 22.
  • 5. Natutukoy ang ordinate ng punto ng intersection. Siya ay pantay. Ang abscissa ng point c ay katumbas ng p 2 (p 1 = 1 - p 2).

kanin. 1.1.

Ang pamamaraang ito ay may medyo malawak na lugar ng aplikasyon. Ito ay batay sa pangkalahatang pag-aari mga larong TP, na binubuo sa katotohanan na sa anumang laro TP ang bawat manlalaro ay may pinakamainam na pinaghalong diskarte kung saan ang bilang ng mga purong diskarte ay hindi hihigit sa min(m, n). Mula sa property na ito makakakuha tayo ng kilalang corollary: sa anumang larong 2n at m2, ang bawat pinakamainam na diskarte ay naglalaman ng hindi hihigit sa dalawang aktibong diskarte. Nangangahulugan ito na ang anumang laro 2n at m2 ay maaaring bawasan sa laro 22. Dahil dito, ang mga laro 2n at m2 ay maaaring lutasin nang grapiko. Kung ang finite game matrix ay may dimensyon na mn, kung saan ang m > 2 at n > 2, ang linear programming ay ginagamit upang matukoy ang pinakamainam na pinaghalong estratehiya.

5. TEORYA NG MGA LARO AT MGA ISTATISTIKONG DESISYON

5.1. Larong Zero-sum matrix

Ang pagmomodelo ng ekonomiya at matematika ay isinasagawa sa ilalim ng mga sumusunod na kondisyon:

Katiyakan;

Kawalang-katiyakan.

Pagmomodelo sa mga kondisyon ng katiyakan Ipinapalagay ang pagkakaroon ng lahat ng paunang data ng regulasyon na kinakailangan para dito (pagmomodelo ng matrix, pagpaplano ng network at pamamahala).

Pagmomodelo nanganganib Isinasagawa sa ilalim ng stochastic uncertainty, kapag ang mga halaga ng ilang paunang data ay random at ang mga batas ng probability distribution ng mga random variable na ito ay kilala (regression analysis, queuing theory).

Pagmomodelo sa mga kondisyon ng kawalan ng katiyakan tumutugma kumpletong kawalan ilang data na kailangan para dito (teorya ng laro).

Mga modelo ng matematika para sa paggawa ng pinakamainam na mga desisyon sa mga sitwasyon ng salungatan ay binuo sa ilalim ng mga kondisyon ng kawalan ng katiyakan.

Ang teorya ng laro ay gumagana sa mga sumusunod na pangunahing konsepto:

Diskarte;

Win function.

Gumagalaw na tatawagin namin ang pagpili at pagpapatupad ng manlalaro ng isa sa mga aksyon na ibinigay para sa mga patakaran ng laro.

Diskarte - ito ay isang teknolohiya para sa pagpili ng opsyon sa pagkilos sa bawat galaw, depende sa kasalukuyang sitwasyon.

Win function nagsisilbi upang matukoy ang halaga ng pagbabayad mula sa natalong manlalaro hanggang sa nanalo.

Sa isang matrix game, ang payoff function ay kinakatawan bilang matrix ng pagbabayad :

saan ang halaga ng bayad sa player I, na pumili ng paglipat, mula sa player II, na pumili ng paglipat.

Sa tulad ng isang ipinares na laro, ang mga halaga ng mga function ng kabayaran ng parehong mga manlalaro sa bawat sitwasyon ay pantay sa halaga at kabaligtaran sa sign, i.e. at ang larong ito ay tinatawag zero sum .

Ang proseso ng "paglalaro ng matrix game" ay kinakatawan bilang mga sumusunod:

Nakatakda ang payment matrix;

Ang manlalaro I, anuman ang manlalaro II, ay pipili ng isa sa mga hilera ng matrix na ito, halimbawa, -th;

Ang Manlalaro II, anuman ang manlalaro I, ay pipili ng isa sa mga hanay ng matrix na ito, halimbawa, - ika;

Tinutukoy ng elemento ng matrix kung gaano karaming player ang matatanggap ko mula sa player II. Siyempre, kung , pagkatapos pinag-uusapan natin tungkol sa aktwal na pagkawala ng player I.

Tatawagin namin ang isang antagonistic na ipinares na laro na may payoff matrix na isang laro.

Halimbawa

Isaalang-alang natin ang laro.

Nakatakda ang payment matrix:

.

Hayaang piliin ng player I, nang hiwalay sa player II, ang ika-3 hilera ng matrix na ito, at ang player II, nang hiwalay sa player I, na piliin ang ika-2 column ng matrix na ito:

Pagkatapos ang player I ay makakatanggap ng 9 units mula sa player II.

5.2. Pinakamainam na purong diskarte sa isang matrix na laro

Pinakamainam na diskarte ay tinatawag na diskarte ng manlalaro I kung saan hindi niya babawasan ang kanyang mga panalo para sa anumang pagpipilian ng diskarte ng manlalaro II, at tulad ng isang diskarte ng manlalaro II kung saan hindi niya tataas ang kanyang pagkatalo para sa anumang pagpipilian ng diskarte ng manlalaro I.

Sa pamamagitan ng pagpili sa ika-row ng payoff matrix bilang isang hakbang, tinitiyak ng player I na mananalo siya ng hindi bababa sa halaga sa pinakamasamang kaso, kapag sinubukan ng manlalaro II na bawasan ang halagang ito. Samakatuwid, ang player na pipiliin ko ang ika-row na magbibigay sa kanya maximum na panalo:

.

Ang Player II ay nakikipagtalo nang katulad at tiyak na masisiguro ang kaunting pagkawala:

.

Ang hindi pagkakapantay-pantay ay palaging totoo:

Ang dami ay tinatawag Mas mababang presyo mga laro .

Ang dami ay tinatawag pinakamataas na presyo ng laro .

Ang mga pinakamainam na estratehiya ay tinatawag malinis , kung ang pagkakapantay-pantay ay para sa kanila:

,

.

Ang dami ay tinatawag sa dalisay na presyo ng laro , Kung .

Ang pinakamainam na purong estratehiya ay nabuo saddle point matrix ng pagbabayad.

Para sa isang saddle point ang mga sumusunod na kondisyon ay natutugunan:

ibig sabihin, ang elemento ang pinakamaliit sa row at pinakamalaki sa column.

Kaya, kung ang payoff matrix ay may saddle point , pagkatapos ay mahahanap mo pinakamainam na purong estratehiya mga manlalaro.

Ang purong diskarte ng player na I ay maaaring katawanin ng isang nakaayos na hanay ng mga numero (vector), kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa -th na lugar, na katumbas ng isa.

Ang purong diskarte ng Player II ay maaaring katawanin ng isang nakaayos na hanay ng mga numero (isang vector) kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa -th na lugar, na katumbas ng isa.

Halimbawa

.

Sa pamamagitan ng pagpili ng anumang hilera ng payoff matrix bilang isang paglipat, tinitiyak ng manlalaro na sa pinakamasamang kaso ang mga panalo ay hindi bababa sa halaga sa column na minarkahan:

Samakatuwid, pipiliin ng player I ang ika-2 hilera ng payment matrix, na nagbibigay sa kanya ng pinakamataas na panalo anuman ang galaw ng player II, na susubukan na bawasan ang halagang ito:

Parehong dahilan ang Player II at pinipili ang 1st column bilang kanyang paglipat:

Kaya, mayroong isang saddle point ng payment matrix:

naaayon sa pinakamainam na purong diskarte para sa manlalaro I at para sa manlalaro II, kung saan ang manlalaro ay hindi babawasan ang kanyang mga panalo para sa anumang pagbabago sa diskarte ng manlalaro II at ang manlalaro II ay hindi tataas ang kanyang pagkatalo para sa anumang pagbabago sa diskarte ng manlalaro I.

5.3. Pinakamainam na pinaghalong diskarte sa isang matrix na laro

Kung ang payoff matrix ay walang saddle point, hindi makatwiran para sa sinumang manlalaro na gumamit ng isang purong diskarte. Ito ay mas kumikita sa paggamit "mga pinaghalong probabilidad" puro diskarte. Pagkatapos, ang mga pinaghalong estratehiya ay makikilala bilang pinakamainam.

Pinaghalong diskarte ang isang manlalaro ay nailalarawan sa pamamagitan ng pamamahagi ng posibilidad ng isang random na kaganapan na binubuo sa pagpili ng isang paglipat ng manlalaro na ito.

Ang pinaghalong diskarte ng player I ay tulad ng isang ordered set ng mga numero (vector) na nakakatugon sa dalawang kundisyon:

1) para sa , ibig sabihin, ang posibilidad na piliin ang bawat hilera ng matrix ng pagbabayad ay hindi negatibo;

2) , ibig sabihin, ang pagpili ng bawat isa sa mga hilera ng payment matrix ay sama-samang kumakatawan buong grupo mga pangyayari.

Ang pinaghalong diskarte ng Player II ay isang nakaayos na hanay ng mga numero (vector) na tumutugon sa mga kundisyon:

Halaga ng bayad sa player I, na pumili ng magkahalong diskarte

mula sa manlalaro II, na pumili ng magkahalong diskarte

,

kumakatawan sa average na halaga

.

Pinakamainam tinatawag na mixed strategies

At ,

kung para sa anumang di-makatwirang pinaghalong diskarte at ang sumusunod na kondisyon ay nasiyahan:

ibig sabihin, na may pinakamainam na pinaghalong diskarte, ang nakuha ng player I ang pinakamalaki, at ang pagkatalo ng player II ay ang pinakamaliit.

Kung walang saddle point sa payment matrix, kung gayon

,

ibig sabihin, may positibong pagkakaiba ( hindi inilalaang pagkakaiba )

- ³ 0,

at ang mga manlalaro ay kailangang maghanap ng karagdagang mga pagkakataon upang kumpiyansa na makatanggap ng mas malaking bahagi ng pagkakaibang ito sa kanilang pabor.

Halimbawa

Isaalang-alang ang laro na tinukoy ng payoff matrix:

.

Alamin natin kung mayroong saddle point:

, .

Lumalabas na walang saddle point sa payment matrix at ang hindi naibahaging pagkakaiba ay katumbas ng:

.

5.4. Paghahanap ng pinakamainam na pinaghalong estratehiya

para sa mga laro 2x2

Ang pagpapasiya ng pinakamainam na pinaghalong diskarte para sa isang payment matrix ng mga dimensyon ay isinasagawa sa pamamagitan ng paghahanap ng pinakamainam na punto ng isang function ng dalawang variable.

Hayaan ang posibilidad ng player na pipiliin ko ang unang hilera ng payment matrix

katumbas ng . Kung gayon ang posibilidad ng pagpili ng pangalawang hilera ay katumbas ng .

Hayaan ang posibilidad ng pagpili ng manlalaro II sa unang hanay ay katumbas ng . Kung gayon ang posibilidad ng pagpili ng pangalawang hanay ay katumbas ng .

Ang halaga ng pagbabayad sa manlalaro I ng manlalaro II ay katumbas ng:

Ang matinding halaga ng nakuha ng player I at pagkatalo ng player II ay tumutugma sa mga sumusunod na kundisyon:

;

.

Kaya, ang pinakamainam na pinaghalong diskarte ng mga manlalaro I at II ay ayon sa pagkakabanggit ay katumbas ng:

5.5. Geometric na solusyon ng mga laro 2×n

Habang tumataas ang dimensyon ng matrix ng pagbabayad mula hanggang, hindi na posibleng bawasan ang pagtukoy ng pinakamainam na pinaghalong mga diskarte sa paghahanap ng pinakamainam ng isang function ng dalawang variable. Gayunpaman, dahil ang isa sa mga manlalaro ay may dalawang diskarte lamang, isang geometric na solusyon ang maaaring gamitin.

Ang mga pangunahing yugto ng paghahanap ng solusyon sa laro ay ang mga sumusunod.

Ipakilala natin ang isang coordinate system sa eroplano. I-plot natin ang segment sa axis. Gumuhit kami ng mga patayo mula sa kaliwa at kanang dulo ng segment na ito.


Ang kaliwa at kanang dulo ng segment ng unit ay tumutugma sa dalawang diskarte at magagamit ng manlalaro I. Ilalagay namin ang mga panalo ng manlalarong ito sa mga iginuhit na perpendicular. Halimbawa, para sa matrix ng pagbabayad


tulad ng mga kabayaran ng player I kapag pumipili ng isang diskarte ay magiging at , at kapag pumipili ng isang diskarte sila ay magiging at .

Ikonekta natin sa pamamagitan ng mga straight line segment ang mga winning point ng player I, na naaayon sa mga diskarte ng player II. Pagkatapos, ang nabuong putol na linya, na nililimitahan ang graph mula sa ibaba, ay tumutukoy sa mas mababang limitasyon ng kabayaran ng manlalaro I.



Paghahanap ng pinakamainam na pinaghalong diskarte ng player I

,

na tumutugma sa punto sa lower bound ng kabayaran ng player I na may pinakamataas na ordinate.

Bigyang-pansin natin ang katotohanan na sa halimbawang isinasaalang-alang, gamit lamang ang dalawang diskarte at , na tumutugma sa mga tuwid na linya na nagsasalubong sa natagpuang punto sa ibabang hangganan ng kabayaran ng manlalaro I, maaaring pigilan ng manlalaro II ang manlalaro I na makakuha ng mas malaking kabayaran.

Kaya, ang laro ay nabawasan sa isang laro at ang pinakamainam na pinaghalong diskarte ng manlalaro II sa halimbawang isinasaalang-alang ay magiging

,

kung saan ang posibilidad ay pareho sa laro:

5.6. Paglutas ng larom× n

Kung ang isang larong matrix ay walang solusyon sa mga purong estratehiya (ibig sabihin, walang saddle point) at, dahil sa malaking dimensyon ng payoff matrix, ay hindi malulutas nang graphical, pagkatapos ay upang makakuha ng solusyon, gumamit ng paraan ng linear programming .

Hayaang magbigay ng isang payment matrix ng dimensyon:

.

Kailangang maghanap ng mga probabilidad , kung sinong manlalaro ang dapat kong piliin ang kanyang mga galaw upang ang pinaghalong diskarteng ito ay ginagarantiyahan siya ng isang panalo na hindi bababa sa halaga anuman ang pagpili ng mga galaw ng manlalaro II.

Para sa bawat paglipat na pinili ng manlalaro II, ang kabayaran ng manlalaro I ay tinutukoy ng mga dependency:

Hatiin natin ang magkabilang panig ng mga hindi pagkakapantay-pantay at ipakilala ang mga bagong notasyon:

Pagkakapantay-pantay

Kukunin ang form:

Dahil ang player I ay naglalayong i-maximize ang kabayaran, ang kabaligtaran ay dapat mabawasan. Pagkatapos ang problema sa linear programming para sa player ay kukunin ko ang form:

sa ilalim ng mga paghihigpit

Ang problema para sa manlalaro II ay itinayo nang katulad ng dalawahan:

sa ilalim ng mga paghihigpit

Ang paglutas ng mga problema gamit ang simplex na paraan, nakukuha namin:

,

5.7. Mga tampok ng paglutas ng mga laro ng matrix

Bago malutas ang problema ng paghahanap ng pinakamainam na mga diskarte, dalawang kondisyon ang dapat suriin:

Posible bang gawing simple ang matrix ng pagbabayad;

May saddle point ba ang payment matrix?

Isaalang-alang natin ang posibilidad na gawing simple ang payment matrix:

Dahil sa katotohanan na ang player na hinahanap ko upang makuha pinakamalaking panalo, pagkatapos ay maaaring tanggalin ang ika- hilera mula sa matrix ng pagbabayad, dahil hindi niya kailanman gagamitin ang paglipat na ito kung ang sumusunod na kaugnayan ay nasiyahan sa anumang iba pang hilera:

Katulad nito, ang pagsusumikap para sa pinakamaliit na pagkatalo, hindi pipiliin ng manlalaro II ang -th column sa payoff matrix bilang isang paglipat, at ang column na ito ay maaaring i-cross out kung ang sumusunod na kaugnayan ay nasiyahan sa anumang iba pang -th column:

Karamihan simpleng solusyon Ang laro ay ang presensya sa pinasimpleng payment matrix ng isang saddle point, na nakakatugon sa sumusunod na kundisyon (ayon sa kahulugan):

Halimbawa

Ang matrix ng pagbabayad ay ibinigay:

.

Pagpapasimple ng payment matrix:

Pagkakaroon ng saddle point:

5.8. Naglalaro sa kalikasan

Hindi tulad ng mga problema sa teorya ng laro sa mga problema ng teorya mga solusyon sa istatistika ang isang hindi tiyak na sitwasyon ay walang isang magkasalungat na konotasyon at nakasalalay sa layunin na katotohanan, na karaniwang tinatawag "kalikasan" .

Sa mga larong matrix na may kalikasan, ang manlalaro II ay isang hanay ng mga hindi tiyak na salik na nakakaimpluwensya sa pagiging epektibo ng mga desisyong ginawa.

Ang mga laro ng matrix na may kalikasan ay naiiba sa mga ordinaryong laro ng matrix dahil kapag pumipili ng pinakamainam na diskarte para sa manlalaro I, hindi na posible na umasa sa katotohanan na ang manlalaro II ay magsusumikap na mabawasan ang kanyang pagkatalo. Samakatuwid, kasama ang matrix ng pagbabayad, ipinakilala namin risk matrix :

kung saan ang halaga ng panganib ng player I kapag gumagamit ng isang paglipat sa mga kondisyon, katumbas ng pagkakaiba sa pagitan ng kabayaran na matatanggap ng manlalaro na iyon kung alam niya na ang kondisyon ay maitatag, i.e. , at ang mga panalo na matatanggap niya, hindi alam kapag pumipili ng isang paglipat na ang kondisyon ay maitatag.

Kaya, ang payment matrix ay kakaibang binago sa isang risk matrix, ngunit ang kabaligtaran na pagbabago ay hindi maliwanag.

Halimbawa

Panalong matrix:

.

Risk matrix:

Maaari dalawang pahayag ng problema tungkol sa pagpili ng solusyon sa isang larong matrix kasama ang kalikasan :

Pag-maximize ng mga panalo;

Pagbabawas ng panganib.

Ang problema sa paggawa ng desisyon ay maaaring iharap sa isa sa dalawang kundisyon:

- nanganganib , kapag ang probability distribution function ng mga estratehiya ng kalikasan ay kilala, halimbawa, ang random variable ng paglitaw ng bawat isa sa mga inaasahang partikular na sitwasyong pang-ekonomiya;

- sa mga kondisyon ng kawalan ng katiyakan , kapag hindi alam ang ganitong probability distribution function.

5.9. Paglutas ng mga problema sa statistical decision theory

nanganganib

Kapag gumagawa ng mga desisyon sa ilalim ng mga kondisyon ng peligro, alam ng manlalaro ang mga probabilidad ang simula ng mga estado ng kalikasan.

Pagkatapos ito ay ipinapayong para sa player I na pumili ng diskarte kung saan ang average na halaga ng panalong kinuha ng linya ay maximum :

.

Kapag nilulutas ang problemang ito sa isang risk matrix, nakukuha namin ang parehong solusyon, na katumbas pinakamababang average na panganib :

.

5.10. Paglutas ng mga problema sa statistical decision theory

sa mga kondisyon ng kawalan ng katiyakan

Kapag gumagawa ng mga desisyon sa ilalim ng mga kondisyon ng kawalan ng katiyakan, maaari mong gamitin ang sumusunod pamantayan :

Pinakamataas na pamantayan ng Wald;

pamantayan minimal na panganib Savage;

Ang pamantayan ni Hurwitz ng pesimismo - optimismo;

Ang prinsipyo ni Laplace ng hindi sapat na dahilan.

Isaalang-alang natin maximin Wald test .

Ang larong may kalikasan ay nilalaro bilang may makatwirang agresibong kalaban, ibig sabihin, ang isang reinsurance approach ay kinuha mula sa posisyon ng matinding pessimism para sa payment matrix:

.

Isaalang-alang natin Ang pinakamababang pamantayan sa panganib ng Savage .

Isang diskarte na katulad ng nauna mula sa posisyon ng matinding pesimismo para sa risk matrix:

.

Isaalang-alang natin Hurwitz criterion ng pesimismo - optimismo .

Ang pagkakataon ay inaalok na hindi magabayan ng alinman sa matinding pesimismo o matinding optimismo:

nasaan ang antas ng pesimismo;

sa - matinding optimismo,

sa - matinding pesimismo.

Isaalang-alang natin Ang prinsipyo ni Laplace ng hindi sapat na dahilan .

Ipinapalagay na ang lahat ng mga estado ng kalikasan ay pantay na posibilidad:

,

.

Mga konklusyon sa ikalimang seksyon

Sa isang matrix na laro, dalawang manlalaro ang lumahok at ang payoff function, na nagsisilbi upang matukoy ang halaga ng pagbabayad mula sa natalong manlalaro hanggang sa nanalong manlalaro, ay kinakatawan sa anyo ng isang payment matrix. Napagkasunduan na ang player I ay pipili ng isa sa mga row ng payment matrix bilang isang paglipat, at ang player II ay pipili ng isa sa mga column nito. Pagkatapos, sa intersection ng mga napiling row at column ng matrix na ito ay mayroong numerical na halaga ng pagbabayad sa player I mula sa player II (kung positibo ang value na ito, kung gayon ang player ay talagang nanalo ako, at kung ito ay negatibo, kung gayon ang player II ay mahalagang nanalo).

Kung mayroong isang saddle point sa payoff matrix, kung gayon ang mga manlalaro ay may pinakamainam na purong diskarte, ibig sabihin, upang manalo, ang bawat isa sa kanila ay dapat ulitin ang kanyang isang pinakamainam na hakbang. Kung walang saddle point, kung gayon upang manalo, ang bawat isa sa kanila ay dapat gumamit ng pinakamainam na halo-halong diskarte, iyon ay, gumamit ng isang halo ng mga gumagalaw, ang bawat isa ay dapat gawin nang may pinakamainam na posibilidad.

Ang paghahanap ng pinakamainam na pinaghalong diskarte para sa 2x2 na laro ay ginagawa sa pamamagitan ng pagkalkula ng pinakamainam na probabilidad gamit ang mga kilalang formula. Sa pamamagitan ng paggamit geometric na solusyon ng 2×n na laro, ang pagtukoy sa pinakamainam na pinaghalong diskarte sa mga ito ay bumababa sa paghahanap ng pinakamainam na pinaghalong diskarte para sa 2×2 na laro. Upang malutas ang m×n na mga laro, ang linear programming method ay ginagamit upang mahanap ang pinakamainam na pinaghalong estratehiya sa mga ito.

Ang ilang mga matrice ng pagbabayad ay maaaring gawing simple, bilang isang resulta kung saan ang kanilang dimensyon ay nababawasan sa pamamagitan ng pag-alis ng mga hilera at column na naaayon sa mga hindi inaasahang paggalaw.

Kung ang manlalaro II ay isang hanay ng mga hindi tiyak na mga kadahilanan na nakasalalay sa layunin na katotohanan at walang mga antagonistic na salungatan, kung gayon ang naturang laro ay tinatawag na isang laro na may kalikasan, at ang mga problema mula sa teorya ng mga desisyon sa istatistika ay ginagamit upang malutas ito. Pagkatapos, kasama ang matrix ng pagbabayad, ang isang risk matrix ay ipinakilala at ang dalawang pormulasyon ng problema sa pagpili ng isang solusyon sa isang matrix na laro na may kalikasan ay posible: pag-maximize ng pakinabang at pagliit ng panganib.

Ang paglutas ng mga problema ng teorya ng mga desisyon sa istatistika sa ilalim ng mga kondisyon ng peligro ay nagpapakita na ipinapayong piliin ng manlalaro I ang diskarte kung saan ang average na halaga (pang-matematika na inaasahan) ng mga panalo, na kinuha mula sa isang hilera ng matrix ng pagbabayad, ay pinakamataas, o (kung saan ay ang parehong bagay) ang average na halaga (pang-matematika na inaasahan) ng panganib , na kinuha ng hilera ng risk matrix, ay minimal. Kapag gumagawa ng mga desisyon sa ilalim ng mga kondisyon ng kawalan ng katiyakan ginagamit nila sumusunod na pamantayan: Ang maximin criterion ni Wald, ang minimum na pamantayan ng panganib ng Savage, ang pessimism-optimism criterion ni Hurwitz, ang prinsipyo ni Laplace ng hindi sapat na dahilan.

Mga tanong sa pagsusulit sa sarili

Paano tinukoy ang mga pangunahing konsepto ng teorya ng laro: paglipat, diskarte at paggana ng kabayaran?

Ano ang payoff function na kinakatawan sa isang matrix game?

Bakit tinatawag na zero-sum ang larong matrix?

Ano ang proseso ng paglalaro ng matrix game?

Anong laro ang tinatawag na larong m×n?

Anong diskarte sa laro ng matrix ang tinatawag na pinakamainam?

Ano ang pinakamainam na diskarte para sa isang larong matrix na tinatawag na pure?

Ano ang ibig sabihin ng saddle point ng payment matrix?

Ano ang pinakamainam na diskarte para sa isang matrix game na tinatawag na mixed?

Ano ang hitsura ng pinaghalong diskarte ng isang manlalaro?

Ano ang halaga ng kabayaran sa manlalaro I mula sa manlalaro II na pumili ng magkahalong diskarte?

Anong mga pinaghalong estratehiya ang tinatawag na pinakamainam?

Ano ang ibig sabihin ng undistributed difference?

Anong paraan ang ginagamit upang makahanap ng pinakamainam na pinaghalong diskarte para sa 2x2 na laro?

Paano nahanap ang pinakamainam na pinaghalong estratehiya para sa 2×n na laro?

Anong paraan ang ginagamit upang makahanap ng pinakamainam na pinaghalong estratehiya para sa m×n na laro?

Ano ang mga tampok ng paglutas ng mga laro ng matrix?

Ano ang ibig sabihin ng pagpapasimple ng payment matrix at sa ilalim ng anong mga kundisyon ito maipapatupad?

Aling matrix game ang mas madaling lutasin kapag ang payoff matrix ay mayroon o walang saddle point?

Anong mga problema sa teorya ng laro ang nauugnay sa mga problema sa teorya ng desisyon sa istatistika?

Paano isinasalin ang payment matrix sa isang risk matrix?

Anong dalawang pormulasyon ng problema sa pagpili ng mga solusyon ang posible sa isang larong matrix na may kalikasan?

Para sa anong dalawang kundisyon ang maaaring idulot ng mga problema sa paggawa ng desisyon sa isang larong matrix na may kalikasan?

Anong diskarte ang angkop para piliin ng manlalaro I kapag nilulutas ang isang problema sa teorya ng desisyon sa istatistika sa ilalim ng mga kondisyon ng peligro?

Anong pamantayan sa paggawa ng desisyon ang maaaring gamitin sa paglutas ng mga problema sa teorya ng desisyon sa istatistika sa ilalim ng mga kondisyon ng kawalan ng katiyakan?

Mga halimbawa ng paglutas ng problema

1. Ang payment matrix ay nagpapahiwatig ng halaga ng kita ng negosyo kapag ito ay nagbebenta iba't ibang uri mga produkto (mga hanay) depende sa itinatag na pangangailangan (mga hilera). Kinakailangan upang matukoy ang pinakamainam na diskarte ng negosyo para sa paggawa ng iba't ibang uri ng mga produkto at ang kaukulang maximum (sa average) na kita mula sa kanilang mga benta.

Ipaalam sa amin tukuyin ang ibinigay na matrix sa pamamagitan ng at ipakilala ang mga variable. Gagamitin din natin ang matrix (vector). Pagkatapos at , ibig sabihin.

Ang inverse matrix ay kinakalkula:

Ang mga halaga ay matatagpuan:

.

Kinakalkula ang mga probabilidad:

Ang average na kita sa pagbebenta ay tinutukoy:

.

2. Ang kumpanya ng Pharmacist ay isang tagagawa ng mga gamot at biomedical na produkto sa rehiyon. Ito ay kilala na ang peak demand para sa ilang mga gamot ay nangyayari sa panahon panahon ng tag-init(mga cardiovascular na gamot, analgesics), para sa iba - para sa taglagas at tagsibol (anti-infectious, antitussive).

Mga gastos sa bawat 1 karaniwang yunit mga yunit ang mga produkto para sa Setyembre-Oktubre ay: para sa unang grupo (mga cardiovascular na gamot at analgesics) - 20 rubles; para sa pangalawang grupo (anti-infectious, antitussive na gamot) - 15 rubles.

Ayon sa mga obserbasyon sa ilang mga nakaraang taon Itinatag ng serbisyo sa marketing ng kumpanya na maaari itong magbenta ng 3050 conventional units sa loob ng dalawang buwang isinasaalang-alang sa mainit na kondisyon ng panahon. mga yunit mga produkto ng unang pangkat at 1100 maginoo na yunit. mga yunit mga produkto ng pangalawang pangkat; sa malamig na kondisyon ng panahon - 1525 arb. mga yunit mga produkto ng unang pangkat at 3690 maginoo na mga yunit. mga yunit pangalawang pangkat.

Kaugnay ng mga posibleng pagbabago sa lagay ng panahon, ang gawain ay nakatakda upang matukoy ang diskarte sa produksyon ng produkto ng kumpanya na nagsisiguro ng pinakamataas na kita sa benta sa isang presyo ng pagbebenta na 40 rubles. para sa 1 karaniwang yunit mga yunit mga produkto ng unang pangkat at 30 kuskusin. - pangalawang pangkat.

SOLUSYON. Ang kumpanya ay may dalawang diskarte:

Magiging mainit ang panahon ngayong taon;

Magiging malamig ang panahon.

Kung ang kumpanya ay nagpatibay ng diskarte at sa katotohanan ay mayroong mainit na panahon (diskarte sa kalikasan), kung gayon ang mga produktong gawa (3050 karaniwang mga yunit ng mga gamot ng unang pangkat at 1100 karaniwang mga yunit ng pangalawang pangkat) ay ganap na ibebenta at ang kita ay magiging

3050×(40-20)+1100×(30-15)=77500 rub.

Sa malamig na kondisyon ng panahon (diskarte ng kalikasan), ang mga gamot ng pangalawang grupo ay ibebenta nang buo, at ang unang grupo ay sa halagang 1525 na mga karaniwang yunit. mga yunit at ang ilan sa mga gamot ay mananatiling hindi nabebenta. Ang kita ay magiging

1525×(40-20)+1100×(30-15)-20×()=16500 rub.

Gayundin, kung ang form ay nagpatibay ng diskarte at ang panahon ay talagang malamig, kung gayon ang kita ay magiging

1525×(40-20)+3690×(30-15)=85850 kuskusin.

Sa mainit na panahon, magiging kita

1525×(40-20)+1100×(30-15)-() ×15=8150 rub.

Isinasaalang-alang ang kumpanya at ang lagay ng panahon bilang dalawang manlalaro, nakukuha namin ang payment matrix

,

Ang presyo ng laro ay nasa hanay

Mula sa matrix ng pagbabayad ay malinaw na sa ilalim ng lahat ng mga kondisyon ang kita ng kumpanya ay hindi bababa sa 16,500 rubles, ngunit kung ang mga kondisyon ng panahon ay nag-tutugma sa napiling diskarte, kung gayon ang kita ng kumpanya ay maaaring 77,500 rubles.

Maghanap tayo ng solusyon sa laro.

Ipahiwatig natin ang posibilidad ng isang kompanya na gumagamit ng isang diskarte sa pamamagitan ng , at isang diskarte sa pamamagitan ng , at . Ang paglutas ng laro sa graphically, nakukuha namin , habang ang presyo ng laro ay p.

Ang pinakamainam na plano para sa paggawa ng mga gamot ay

Kaya, ito ay ipinapayong para sa kumpanya na gumawa ng 2379 conventional units sa panahon ng Setyembre at Oktubre. mga yunit gamot ng unang pangkat at 2239.6 na mga karaniwang yunit. mga yunit gamot ng pangalawang grupo, pagkatapos ay sa anumang panahon ay makakatanggap siya ng kita na hindi bababa sa 46,986 rubles.

Sa mga kondisyon ng kawalan ng katiyakan, kung hindi posible para sa isang kumpanya na gumamit ng isang halo-halong diskarte (mga kasunduan sa iba pang mga organisasyon), ginagamit namin ang sumusunod na pamantayan upang matukoy ang pinakamainam na diskarte ng kumpanya:

Pamantayan ni Walde:

Hurwitz criterion: para sa katiyakan tinatanggap namin , pagkatapos ay para sa diskarte ng kumpanya

para sa diskarte

Maipapayo para sa isang kumpanya na gumamit ng isang diskarte.

Savage criterion. Ang maximum na elemento sa unang column ay 77500, sa pangalawang column - 85850.

Ang mga elemento ng risk matrix ay matatagpuan mula sa expression

,

saan , ,

Mukhang ang risk matrix

,

Maipapayo na gamitin ang o diskarte.

Samakatuwid, ipinapayong gamitin ng kumpanya ang o diskarte.

Tandaan na ang bawat isa sa mga pamantayang isinasaalang-alang ay hindi maaaring ituring na ganap na kasiya-siya para sa panghuling pagpipilian mga desisyon, ngunit ang kanilang pinagsamang pagsusuri ay nagpapahintulot sa amin na mas malinaw na isipin ang mga kahihinatnan ng paggawa ng ilang mga desisyon sa pamamahala.

Dahil sa kilalang distribusyon ng probabilidad ng iba't ibang estado ng kalikasan, ang kriterya ng desisyon ay ang pinakamataas na inaasahan sa matematika na manalo.

Ipaalam ito sa problemang isinasaalang-alang na ang mga probabilidad ng mainit at malamig na panahon ay pantay at katumbas ng 0.5, kung gayon ang pinakamainam na diskarte ng kumpanya ay tinutukoy bilang mga sumusunod:

Maipapayo na gamitin ng kumpanya ang o diskarte.

Mga gawain para sa malayang gawain

1. Ang isang negosyo ay maaaring gumawa ng tatlong uri ng mga produkto (A, B at C), habang tumatanggap ng tubo depende sa demand. Ang demand, sa turn, ay maaaring tumagal ng isa sa apat na estado (I, II, III at IV). Sa sumusunod na matrix, ang mga elemento ay nagpapakilala sa kita na matatanggap ng negosyo kapag inilabas ang -th na produkto at ang -th state of demand:

Sa pangkalahatan, V * ≠ V * - walang saddle point. Wala ring pinakamainam na solusyon sa mga purong estratehiya. Gayunpaman, kung palawakin natin ang konsepto ng purong diskarte sa pamamagitan ng pagpapakilala ng konsepto ng pinaghalong diskarte, posible na ipatupad ang isang algorithm para sa paghahanap ng pinakamainam na solusyon sa isang hindi mahusay na tinukoy na problema sa laro. Sa ganoong sitwasyon, iminungkahi na gumamit ng istatistikal (probabilistic) na diskarte sa paghahanap ng pinakamainam na solusyon sa zero-sum game. Para sa bawat manlalaro, kasama ang isang ibinigay na hanay ng mga diskarte na posible para sa kanya, isang hindi kilalang vector ng mga probabilities (relative frequency) kung saan ang isa o ibang diskarte ay dapat ilapat ay ipinakilala.

Tukuyin natin ang vector ng mga probabilities (relative frequency) ng pagpili ng mga ibinigay na diskarte ng player A tulad ng sumusunod:
P = (p 1, p 2,…, p m),
kung saan ang p i ≥ 0, p 1 + p 2 +…+ p m = 1. Ang halaga ng p i ay tinatawag na probabilidad (relative frequency) ng paggamit ng diskarte A i.

Katulad nito, para sa player B, isang hindi kilalang vector ng mga probabilities (relative frequency) ay ipinakilala at may form na:
Q = (q 1, q 2,…, q n),
kung saan q j ≥ 0, q 1 + q 2 +…+ q n = 1. Ang halaga q j ay tinatawag na probabilidad (relative frequency) ng paggamit ng diskarte B j. Ang set (kombinasyon) ng mga purong estratehiya A 1, A 2, …A m at B 1, B 2, …B n kasama ng mga vectors ng probabilities ng pagpili sa bawat isa sa kanila ay tinatawag pinaghalong estratehiya.

Ang pangunahing theorem sa teorya ng finite zero-sum na laro ay Ang teorama ni von Neumann: bawat may hangganan na laro ng matrix ay mayroon, kahit na, isang pinakamainam na solusyon, posibleng kasama ng mga pinaghalong diskarte.
Mula sa theorem na ito ay sumusunod na ang isang hindi mahusay na tinukoy na laro ay may hindi bababa sa isang pinakamainam na solusyon sa magkahalong estratehiya. Sa ganitong mga laro, ang solusyon ay magiging isang pares ng pinakamainam na pinaghalong estratehiya P * at Q *, na kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na diskarte, kung gayon ito ay hindi kumikita para sa ibang manlalaro na lumihis mula sa kanyang pinakamainam na diskarte.
Ang average na kabayaran ng player A ay tinutukoy ng matematikal na inaasahan:

Kung ang posibilidad (kamag-anak na dalas) ng paggamit ng isang diskarte ay iba sa zero, kung gayon ang isang diskarte ay tinatawag na aktibo.

Ang mga estratehiya P*, Q* ay tinatawag pinakamainam na halo-halong mga estratehiya kung M A (P, Q *) ≤ M A (P *, Q *) ≤ MA (P *, Q) (1)
Sa kasong ito M A (P * , Q *) ay tinatawag sa halaga mga laro at tinutukoy ng V (V * ≤ V ≤ V *). Ang una sa mga hindi pagkakapantay-pantay (1) ay nangangahulugan na ang paglihis ng manlalaro A mula sa kanyang pinakamainam na pinaghalong diskarte sa kondisyon na ang manlalaro B ay nananatili sa kanyang pinakamainam na pinaghalong diskarte, humahantong sa pagbaba sa average na panalo manlalaro A. Ang pangalawa sa mga hindi pagkakapantay-pantay ay nangangahulugan na ang paglihis ng manlalaro B mula sa kanyang pinakamainam na pinaghalong diskarte sa kondisyon na ang manlalaro A ay nananatili sa kanyang pinakamainam na pinaghalong diskarte, humahantong sa pagtaas ng average na pagkawala ng player B.

Sa pangkalahatan, ang mga naturang problema ay maaaring matagumpay na malulutas ng calculator na ito.

Halimbawa.

4 7 2
7 3 2
2 1 8

1. Suriin kung ang payment matrix ay may saddle point. Kung oo, pagkatapos ay isusulat namin ang solusyon sa laro sa mga purong estratehiya.

Ipinapalagay namin na pinipili ng player I ang kanyang diskarte sa paraang mapakinabangan ang kanyang kabayaran, at pinipili ng manlalaro II ang kanyang diskarte sa paraang mabawasan ang kabayaran ng player I.

Mga manlalaro B 1 B 2 B 3 a = min(A i)
A 1 4 7 2 2
A 2 7 3 2 2
A 3 2 1 8 1
b = max(B i) 7 7 8

Nakita namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng laro a = max(a i) = 2, na nagsasaad ng pinakamataas na purong diskarte A 1 .
Ang pinakamataas na presyo ng laro ay b = min(b j) = 7. Na nagpapahiwatig ng kawalan ng saddle point, dahil a ≠ b, kung gayon ang presyo ng laro ay nasa hanay na 2 ≤ y ≤ 7. Nakahanap kami ng solusyon sa laro sa magkahalong diskarte. Ito ay ipinaliwanag sa pamamagitan ng katotohanan na ang mga manlalaro ay hindi maaaring ipahayag ang kanilang mga purong diskarte sa kaaway: dapat nilang itago ang kanilang mga aksyon. Ang laro ay maaaring malutas sa pamamagitan ng pagpayag sa mga manlalaro na pumili ng kanilang mga diskarte nang random(maghalo ng mga purong diskarte).

2. Suriin ang payment matrix para sa mga dominanteng row at dominanteng column.
Walang nangingibabaw na row o dominanteng column sa payment matrix.

3. Humanap ng solusyon sa laro sa magkahalong estratehiya.
Isulat natin ang isang sistema ng mga equation.
Para sa player I
4p 1 +7p 2 +2p 3 = y
7p 1 +3p 2 +p 3 = y
2p 1 +2p 2 +8p 3 = y
p 1 +p 2 +p 3 = 1

Para sa Manlalaro II
4q 1 +7q 2 +2q 3 = y
7q 1 +3q 2 +2q 3 = y
2q 1 +q 2 +8q 3 = y
q 1 + q 2 + q 3 = 1

Ang paglutas ng mga sistemang ito gamit ang Gauss method, makikita natin ang:

y = 4 1 / 34
p 1 = 29 / 68 (probability ng paggamit ng 1st strategy).
p 2 = 4 / 17 (probability ng paggamit ng 2nd strategy).
p 3 = 23 / 68 (probability ng paggamit ng 3rd strategy).

Pinakamainam na pinaghalong diskarte ng manlalaro I: P = (29/68; 4/17; 23/68)
q 1 = 6 / 17 (probability ng paggamit ng 1st strategy).
q 2 = 9 / 34 (probability ng paggamit ng 2nd strategy).
q 3 = 13 / 34 (probability ng paggamit ng 3rd strategy).

Ang pinakamainam na pinaghalong diskarte ng Player II: Q = (6 / 17; 9 / 34; 13 / 34)
Presyo ng laro: y = 4 1 / 34

Kung ang laro ay walang saddle point, ang mga paghihirap ay lumitaw sa pagtukoy ng presyo ng laro at ang pinakamainam na diskarte ng mga manlalaro. Isaalang-alang, halimbawa, ang laro:

Sa larong ito at. Samakatuwid, ang unang manlalaro ay magagarantiyahan ang kanyang sarili ng isang panalo na katumbas ng 4, at ang pangalawa ay maaaring limitahan ang kanyang pagkatalo sa 5. Ang lugar sa pagitan ng at ay, kumbaga, isang draw at ang bawat manlalaro ay maaaring subukang mapabuti ang kanyang resulta sa gastos nito. lugar. Ano ang dapat na pinakamainam na diskarte ng mga manlalaro sa kasong ito?

Kung ang bawat manlalaro ay gumagamit ng diskarte na may markang asterisk (at ), ang mga panalo ng unang manlalaro at ang pagkawala ng pangalawa ay magiging katumbas ng 5. Ito ay hindi kanais-nais para sa pangalawang manlalaro, dahil ang una ay nanalo nang higit pa kaysa sa maaari nitong garantiya. mismo. Gayunpaman, kung ang pangalawang manlalaro sa anumang paraan ay nagpapakita ng intensyon ng unang manlalaro na gamitin ang diskarte, maaari niyang ilapat ang diskarte at bawasan ang kabayaran ng unang manlalaro sa 4. Gayunpaman, kung ang unang manlalaro ay nagpahayag ng intensyon ng pangalawang manlalaro na gamitin ang diskarte, kung gayon, gamit ang diskarte, tataas niya ang kanyang kabayaran sa 6 Kaya, isang sitwasyon ang lumitaw kung saan ang bawat manlalaro ay dapat panatilihing lihim ang diskarte na kanyang gagamitin. Gayunpaman, paano ito gagawin? Pagkatapos ng lahat, kung ang laro ay nilalaro ng maraming beses at ang pangalawang manlalaro ay palaging gumagamit ng diskarte, pagkatapos ay ang unang manlalaro ay malapit nang malaman ang plano ng pangalawang manlalaro at, kapag inilapat ang diskarte, ay magkakaroon ng karagdagang panalo. Malinaw, dapat baguhin ng pangalawang manlalaro ang diskarte sa bawat bagong laro, ngunit dapat niyang gawin ito sa paraang hindi mahulaan ng unang manlalaro kung aling diskarte ang gagamitin niya sa bawat kaso.

Para sa isang random na mekanismo ng pagpili, ang mga panalo at pagkatalo ng mga manlalaro ay magiging mga random na variable. Ang resulta ng laro sa kasong ito ay maaaring matantya ng average na pagkawala ng pangalawang manlalaro. Bumalik tayo sa halimbawa. Kaya, kung ang pangalawang manlalaro ay gumagamit ng isang diskarte at random na may probabilidad na 0.5; 0.5, pagkatapos ay sa diskarte ng unang manlalaro ang average na halaga ng kanyang pagkatalo ay magiging:

at sa unang diskarte ng manlalaro

Samakatuwid, maaaring limitahan ng pangalawang manlalaro ang kanyang average na pagkatalo sa 4.5 anuman ang diskarte na ginamit ng unang manlalaro.

Kaya, sa ilang mga kaso lumalabas na maipapayo na huwag magbalangkas ng isang diskarte nang maaga, ngunit upang pumili ng isa o isa pa nang random, gamit ang ilang uri ng random na mekanismo ng pagpili. Ang isang diskarte batay sa random na pagpili ay tinatawag pinaghalong diskarte, sa kaibahan sa mga inilaan na estratehiya, na tinatawag na puro diskarte.

Magbigay tayo ng mas mahigpit na kahulugan ng dalisay at magkahalong estratehiya.



Hayaang magkaroon ng laro na walang saddle point:

Tukuyin natin ang dalas ng paggamit ng purong diskarte ng unang manlalaro sa pamamagitan ng , (ang posibilidad ng paggamit ng i-th na diskarte). Katulad nito, tukuyin natin ang dalas ng paggamit ng purong diskarte ng pangalawang manlalaro sa pamamagitan ng , (ang posibilidad ng paggamit ng j-th na diskarte). Para sa larong may saddle point, mayroong solusyon sa mga purong diskarte. Para sa isang laro na walang saddle point, mayroong isang solusyon sa halo-halong mga diskarte, iyon ay, kapag ang pagpili ng diskarte ay batay sa mga probabilities. Pagkatapos

Maraming purong diskarte sa 1st player;

Maraming pinaghalong diskarte sa 1st player;

Maraming purong diskarte sa 2nd player;

Maraming pinaghalong diskarte sa 2nd player.

Isaalang-alang natin ang isang halimbawa: magkaroon ng isang laro

Pinipili ng pangalawang manlalaro ang posibilidad . Tantyahin natin ang average na pagkawala ng pangalawang manlalaro kapag gumamit siya ng mga diskarte at, ayon sa pagkakabanggit.

May puro at halo-halong diskarte. Purong diskarte
unang manlalaro (purong diskarte
pangalawang manlalaro) ay isang posibleng paglipat ng unang (pangalawang) manlalaro, na pinili niya na may posibilidad na katumbas ng 1.

Kung ang unang manlalaro ay may m mga diskarte, at ang pangalawang manlalaro ay may n mga diskarte, kung gayon para sa anumang pares ng mga diskarte ng una at pangalawang manlalaro, ang mga purong diskarte ay maaaring katawanin bilang mga vector ng yunit. Halimbawa, para sa isang pares ng mga diskarte
,
Ang mga purong diskarte ng una at pangalawang manlalaro ay isusulat bilang:
,
. Para sa isang pares ng mga diskarte ,ang mga purong estratehiya ay maaaring isulat bilang:

,

.

Teorama: Sa isang matrix game, ang mas mababang net price ng laro ay hindi lalampas sa itaas na net price ng laro, i.e.
.

Kahulugan: Kung puro diskarte ,mga manlalaro A at B, ayon sa pagkakabanggit, mayroong pagkakapantay-pantay
, pagkatapos ay isang pares ng mga purong diskarte ( ,) ay tinatawag na saddle point ng matrix game, ang elemento matrix, na nakatayo sa intersection ng i-th row at j-th column ay ang saddle element ng payment matrix, at ang numero
- ang dalisay na presyo ng laro.

Halimbawa: Hanapin ang mas mababa at itaas na mga presyo ng net, itatag ang pagkakaroon ng mga saddle point ng matrix game

.

Tukuyin natin ang mas mababa at mas mataas na mga presyo ng net ng laro: , ,
.

Sa kasong ito, mayroon kaming isang saddle point (A 1 ; B 2), at ang saddle element ay 5. Ang elementong ito ang pinakamaliit sa 1st row at ang pinakamalaking sa 2nd column. Ang paglihis ng manlalaro A mula sa maximin na diskarte A 1 ay humahantong sa pagbaba sa kanyang mga panalo, at ang paglihis ng manlalaro B mula sa minimax na diskarte B 2 ay humahantong sa pagtaas ng kanyang pagkatalo. Sa madaling salita, kung ang isang larong matrix ay may elemento ng saddle, kung gayon ang pinakamahusay na mga diskarte para sa mga manlalaro ay ang kanilang mga diskarte sa minimax. At ang mga purong diskarte na ito, na bumubuo ng saddle point at nagha-highlight sa elemento ng saddle na 12 =5 sa game matrix, ay pinakamainam na purong diskarte. At mga manlalaro A at B, ayon sa pagkakabanggit.

Kung ang isang matrix game ay walang saddle point, kung gayon ang paglutas ng laro ay magiging mahirap. Sa mga larong ito
. Ang paggamit ng mga diskarte sa minimax sa mga naturang laro ay humahantong sa katotohanan na para sa bawat manlalaro ang kabayaran ay hindi lalampas , at hindi bababa ang pagkatalo . Para sa bawat manlalaro, ang tanong ay bumangon sa pagtaas ng mga panalo (pagbabawas ng mga pagkalugi). Ang solusyon ay matatagpuan gamit ang magkahalong estratehiya.

Kahulugan: Ang pinaghalong diskarte ng unang (pangalawang) manlalaro ay isang vector
, Saan
At
(
, Saan
At
).

Ang vector p(q) ay nangangahulugan ng posibilidad ng paggamit ng i-th pure strategy ng unang manlalaro (j-th pure strategy ng pangalawang manlalaro).

Dahil pinili ng mga manlalaro ang kanilang mga purong diskarte nang random at independiyente sa bawat isa, ang laro ay random at ang halaga ng mga panalo (pagkatalo) ay nagiging random. Sa kasong ito, ang average na halaga ng pakinabang (pagkawala) - pag-asa sa matematika - ay isang function ng halo-halong mga diskarte p, q:

.

Kahulugan: Ang function na f(р, q) ay tinatawag na payoff function ng matrix game
.

Kahulugan: Estratehiya
,
ay tinatawag na pinakamainam kung para sa mga arbitrary na estratehiya
,
natutugunan ang kundisyon

Ang paggamit ng pinakamainam na pinaghalong estratehiya sa laro ay nagbibigay sa unang manlalaro ng kabayaran na hindi bababa sa kapag gumamit siya ng anumang iba pang diskarte p; ang pangalawang manlalaro ay matatalo nang hindi hihigit sa kung gumamit siya ng ibang diskarte q.

Ang kumbinasyon ng mga pinakamainam na diskarte at ang presyo ng laro ay bumubuo sa solusyon ng laro.

© 2023 skudelnica.ru -- Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway