Ang konsepto ng mga modelo ng laro. Pagbabayad ng Matrix

bahay / Sikolohiya

PRAKTIKAL NA GAWAIN Blg. 3

Mga modelo ng teorya ng Laro

Pag-unawa sa mga modelo ng laro

Ang teorya ng laro ay nakikibahagi sa pagbuo ng iba't ibang uri ng mga rekomendasyon para sa pagpapasya sa mga kondisyon sitwasyon sa kaguluhan... Ang pagbuo ng mga sitwasyon ng salungatan sa matematika, maaari silang maging kinatawan bilang isang laro ng dalawa, tatlo o higit pang mga manlalaro, na ang bawat isa ay naglalayong mapakinabangan ang kanyang kita sa gastos ng ibang manlalaro. Ang modelo ng matematika ng isang sitwasyon ng salungatan ay tinatawag laro, ang mga partido sa salungatan - mga manlalaro, at ang kinalabasan ng salungatan ay panalo... Para sa bawat pormal na laro, regulasyon, i.e. isang sistema ng mga kondisyon na tumutukoy:

1. mga pagpipilian para sa mga aksyon ng mga manlalaro;

2. ang halaga ng impormasyon ng bawat manlalaro ay tungkol sa pag-uugali ng mga kasosyo;

3. ang pakinabang kung saan humahantong ang bawat hanay ng mga aksyon.

Karaniwan, ang mga panalo ay maaaring matukoy nang dami (halimbawa, pagkawala - 0, panalo - 1, gumuhit - ½). Ang laro ay tinatawag silid-pasingawankung ang dalawang manlalaro ay lumahok dito, at maramihangkung ang bilang ng mga manlalaro ay higit sa dalawa. Ang laro ay tinatawag isang laro na zero-sumkung ang pakinabang ng isa sa mga manlalaro ay pantay sa pagkawala ng iba. Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay para sa mga patakaran ay tinatawag lumipat manlalaro. Ang mga galaw ay maaaring personal o random. Personal na paglipat - isang malay na pagpipilian ng player ng isa sa mga posibleng pagkilos (lumipat sa isang laro ng chess), random na paglipat - random na napiling aksyon (pagpili ng isang card mula sa isang shuffled deck).

Diskarte sa player ay tinatawag na isang hanay ng mga patakaran na tumutukoy sa pagpili ng kanyang pagkilos para sa bawat personal na paglipat, depende sa sitwasyon. Ang laro ay tinatawag ang panghulikung ang manlalaro ay may isang tiyak na bilang ng mga diskarte, at walang katapusang - kung hindi man.

Upang malutas ang isang laro, o hanapin solusyon sa laro, dapat pumili ng isang diskarte para sa bawat manlalaro na nasiyahan sa kundisyon ng pagiging maaasahan, i.e. ang isa sa mga manlalaro ay dapat tumanggap maximum na panalokapag ang iba pang dumikit sa kanyang diskarte. Sa parehong oras, ang pangalawang manlalaro ay dapat magkaroon kaunting pagkawalakung ang dating dumikit sa kanyang diskarte. Ang ganitong mga diskarte ay tinatawag na optimal. Ang layunin teorya ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro... Kapag pumipili ng pinakamainam na diskarte, natural na ipalagay na ang parehong mga manlalaro ay kumilos nang makatwiran mula sa punto ng view ng kanilang mga interes.

Bayad sa pagbabayad. Ang mga presyo ng mas mababa at itaas na laro

Isaalang-alang ang isang laro sa pagtatapos ng pares. Hayaan ang player AT ay m mga personal na diskarte, na itinalaga namin Isang 1, A 2, ..., A m. Hayaan ang player B meron n mga personal na diskarte, ituro natin ang mga ito B 1, B 2, ..., B n.Sinabi nila na ang laro ay may sukat m ´ n... Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte A i at B j ang kinalabasan ng laro ay natatanging natukoy, i.e. makakuha isang ij manlalaro AT (positibo o negatibo) at pagkawala (- isang ij) manlalaro SA... Matrix Р \u003d (isang ij), na ang mga elemento ay payoff na naaayon sa mga diskarte A i at B jay tinatawag na pagbabayad ng matrix o laro ng matris.

B j A i B 1 B 2 B n
Isang 1 isang 11 isang 12 isang 1n
Isang 2 isang 21 isang 22 isang 2n
Isang m isang m1 isang m 2 isang mn

Halimbawa - ang laro "Paghahanap"

Manlalaro AT maitago sa vault 1 - sabihin natin ang diskarte na ito Isang 1 o sa vault 2 - diskarte Isang 2... Manlalaro SA maaaring maghanap para sa unang manlalaro sa vault 1 - diskarte SA 1, o sa vault 2 - diskarte SA 2... Kung ang player AT ay nasa vault 1 at natuklasan doon ng player SA, i.e. ang ilang mga diskarte ay ipinatupad (A 1, B 1), pagkatapos ang player AT nagbabayad ng isang multa, i.e. isang 11\u003d -1. Katulad nito, nakukuha natin isang 22\u003d -1. Malinaw, mga diskarte (A 1, B 2) at (A 2, B 1) bigyan ang player AT ang bayad ay 1, samakatuwid isang 12=isang 21\u003d 1. Kaya, nakuha namin ang pagbabayad ng matrix

Isaalang-alang ang laro m ´ n may matris Р \u003d (isang ij) at matukoy ang pinakamahusay sa mga diskarte ng player AT... Ang pagpili ng isang diskarte A i, manlalaro AT dapat asahan na ang player SA sasagutin ito sa isa sa mga diskarte Sa jpara sa kung saan ang pakinabang para sa player AT minimal (player SA naglalayong "saktan" ang manlalaro AT).

Ipaalam sa amin a i pinakamaliit na kabayaran ng isang manlalaro AT kapag pumipili ng isang diskarte A i para sa lahat ng posibleng mga diskarte sa player SA (ang pinakamaliit na numero sa ako-th row ng pagbabayad ng matrix), i.e. ...

Kabilang sa lahat ng mga numero a i piliin ang pinakamalaking:. Tumawag tayo a ang ibabang presyo ng laro , o maximum na panalo (maximin ). ito garantisadong pagbabayad ng player A para sa anumang diskarte ng player B... Samakatuwid, .

Ang diskarte na naaayon sa maximin ay tinatawag diskarte sa maximin... Manlalaro SA interesado sa pagbabawas ng panalo ng manlalaro AT; pagpili ng isang diskarte B j, isinasaalang-alang ang maximum na posibleng pakinabang para sa A. Denote.

Kabilang sa lahat ng mga numero pinili namin ang pinakamaliit na isa at tawag b nangungunang presyo ng laro , o minimax panalo (minimax ). ito garantisadong pagkawala ng player B para sa anumang diskarte ng player A... Samakatuwid, .

Ang diskarte na naaayon sa minimax ay tinatawag diskarte sa minimax... Ang prinsipyo na nagdidikta sa mga manlalaro ang pagpili ng mas maingat na minimax at maximin strategies ay tinawag prinsipyo ng minimax.

Mga laro sa istatistika

Sa maraming mga gawain na humantong sa mga problema sa laro, ang kawalan ng katiyakan ay sanhi ng kakulangan ng impormasyon tungkol sa mga kondisyon kung saan isinasagawa ang pagkilos. Ang mga kondisyong ito ay hindi nakasalalay sa malay na pagkilos ng isa pang player, ngunit sa layunin ng katotohanan, na karaniwang tinatawag na "kalikasan." Ang ganitong mga laro ay tinatawag na mga likas na laro (statistical game).

Isang gawain

Matapos ang maraming taon ng pagpapatakbo, ang mga pang-industriya na kagamitan ay lumiliko sa isa sa mga sumusunod na estado: B 1 - ang kagamitan ay maaaring magamit sa susunod na taon pagkatapos ng pagpigil sa pagpigil; - 2 - para sa libreng operasyon ng kagamitan, sa hinaharap, ang mga indibidwal na bahagi at pagtitipon ay dapat mapalitan; В 3 - ang kagamitan ay nangangailangan ng mga pangunahing pag-aayos o kapalit.

Nakasalalay sa kasalukuyang sitwasyon, B 1, B 2, B 3, ang pamamahala ng negosyo ay maaaring gumawa ng mga sumusunod na desisyon: A 1 - upang ayusin ang kagamitan ng mga espesyalista sa pabrika, na nangangailangan ng kaukulang gastos ng 1 \u003d 6, isang 2 \u003d 10, at 3 \u003d 15 na mga yunit ng pananalapi ; At 2 - tumawag sa isang espesyal na koponan ng pag-aayos, ang mga gastos sa kasong ito ay magiging b 1 \u003d 15, b 2 \u003d 9, b 3 \u003d 18 mga yunit ng pananalapi; At 3 - upang palitan ang mga kagamitan sa bago, na nagbebenta ng hindi napapanahong kagamitan sa natitirang halaga nito. Ang kabuuang gastos ng mga resulta ng aktibidad na ito ay magiging pantay, ayon sa pagkakabanggit, na may 1 \u003d 13, na may 2 \u003d 24, na may 3 \u003d 12 mga yunit ng pananalapi.

Ang gawain

1. Ang pagkakaroon ng inilarawan na sitwasyon ng isang iskema ng laro, kilalanin ang mga kalahok, nagpapahiwatig ng posibleng dalisay na mga diskarte ng mga partido.

2. Gumawa ng isang matrikula sa pagbabayad, na nagpapaliwanag ng kahulugan ng mga elemento ng isang ij ng matrix (bakit negatibo sila?).

3. Alamin kung ano ang pasya sa pagpapatakbo ng kagamitan sa darating na taon ay maipapayo na magrekomenda sa pamamahala ng negosyo upang mabawasan ang mga pagkalugi sa ilalim ng mga sumusunod na pagpapalagay: a) ang karanasan na nakuha sa negosyo sa pagpapatakbo ng mga katulad na kagamitan ay nagpapakita na ang mga probabilidad ng ipinahiwatig na estado ng kagamitan ay, ayon sa pagkakabanggit, q 1 \u003d 0.15; q 2 \u003d 0.55; q 3 \u003d 0.3 (mag-apply ng Bayes criterion); b) ipinakikita ng karanasan na ang lahat ng tatlong posibleng mga estado ng kagamitan ay pantay na maaaring mangyari (ilapat ang Laplis criterion); c) walang tiyak na masasabi tungkol sa posibilidad ng mga kagamitan (ilapat ang pamantayan ng Wald, Savage, Hurwitz). Ang halaga ng parameter g \u003d 0.8 sa Hurwitz test ay ibinibigay.

Desisyon

1) Ang sitwasyon na inilarawan ay isang istatistika laro.

Ang istatistika ay ang pamamahala ng negosyo, na maaaring gumawa ng isa sa mga sumusunod na pagpapasya: ayusin ang kagamitan sa sarili nitong (diskarte A1), tawagan ang repairmen (diskarte A2); palitan ang kagamitan gamit ang bago (diskarte A 3).

Ang pangalawang bahagi ng paglalaro - likas na katangian, isasaalang-alang namin ang isang hanay ng mga kadahilanan na nakakaapekto sa kondisyon ng kagamitan: ang kagamitan ay maaaring magamit pagkatapos ng pag-aayos ng preventive (estado B 1); kinakailangan upang palitan ang mga indibidwal na sangkap at mga bahagi ng kagamitan (estado B 2): kinakailangan overhaul o pagpapalit ng kagamitan (estado B 3).

2) Isulat natin ang matrix ng pagbabayad ng laro:

Ang elemento ng matrix ng pagbabayad isang ij ay nagpapakita ng mga gastos ng pamamahala ng negosyo kung, kasama ang napiling diskarte A i, ang kagamitan ay nasa estado B j. Ang mga elemento ng matrix ng pagbabayad ay negatibo, dahil para sa anumang napiling diskarte, ang pamamahala ng negosyo ay kailangang magdala ng mga gastos.

a) ang karanasan na nakuha sa negosyo para sa pagpapatakbo ng katulad sa kagamitan ay nagpapakita na ang mga posibilidad ng mga estado ng kagamitan ay pantay sa q 1 \u003d 0.15; q 2 \u003d 0.55; q 3 \u003d 0.3.

Kinakatawan namin ang matrix ng pagbabayad sa form:

Mga istatistika ng estratehiya, A i Mga estado ng kalikasan B j
B 1 B 2 B 3
Isang 1 -6 -10 -15 -10,9
Isang 2 -15 -9 -18 -12,6
Isang 3 -13 -24 -12 -18,75
q j 0,15 0,55 0,3

kung saan, (i \u003d 1,3)

Ayon sa criterion ni Bayes, ang pinakamainam na diskarte ay ang purong diskarte А i, na pinalaki ang average na kabayaran ng statistician, i.e. ibinigay \u003d max.

Ang pinakamainam na diskarte sa Bayesian ay diskarte A 1.

b) ang magagamit na karanasan ay nagpapahiwatig na ang lahat ng tatlong posibleng mga estado ng kagamitan ay pantay na posibleng, i.e. \u003d 1/3.

Ang average na panalo ay pantay-pantay:

1/3 * (- 6-10-15) \u003d -31/3 "-10.33;

1/3*(-15-9-18) = -42/3 = -14;

1/3 * (- 13-24-12) \u003d -49/3 "-16.33.

Ang pinakamainam na diskarte sa Laplace ay diskarte A 1.

c) walang tiyak na masasabi tungkol sa mga posibilidad ng mga kagamitan.

Ayon sa kriterya ni Wald, ang pinakamainam na diskarte ay kinuha upang maging isang dalisay na diskarte na ginagarantiyahan ang pinakamataas na pakinabang sa mga pinakamasamang kondisyon, i.e.

.

\u003d max (-15, -18, -24) \u003d -15.

Kaya, ang diskarte A 1 ay pinakamainam.

Gumawa tayo ng isang panganib na matris, kung saan.

Ang diskarte ng isang player ay isang plano ayon sa kung saan siya ay pumili ng isang pagpipilian sa anumang posibleng sitwasyon at sa anumang posibleng impormasyon na totoo. Naturally, ang player ay gumagawa ng mga desisyon sa panahon ng laro. Gayunpaman, sa teorya, maaari nating ipalagay na ang lahat ng mga pagpapasyang ito ay ginawa ng player nang maaga. Kung gayon ang kabuuan ng mga pagpapasyang ito ay bumubuo sa kanyang diskarte. Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa may hangganan at walang hanggan. Ang gawain ng teorya ng laro ay upang bumuo ng mga rekomendasyon para sa mga manlalaro, iyon ay, upang matukoy ang pinakamainam na diskarte para sa kanila. Ang isang pinakamainam na diskarte ay isang diskarte na, na may maraming mga pag-uulit ng laro, ay nagbibigay ng isang naibigay na player na may pinakamataas na posibleng average na kabayaran.

Ang pinakasimpleng uri ng estratehikong laro ay isang laro ng dalawang manlalaro na may zero sum (ang kabuuan ng mga panalo ng mga partido ay pantay sa zero). Ang laro ay binubuo ng dalawang galaw: player Ang pipili ng isa sa kanyang posibleng mga diskarte Ai (i \u003d 1, 2, m), at pinipili ng player B ang diskarte Bj (j \u003d 1, 2,., N), at ang bawat pagpipilian ay ginawa nang may kumpletong kamangmangan ang pagpipilian ng isa pang player.

Ang layunin ng Player A ay upang i-maximize ang function φ (Ai, Bj), sa turn, ang layunin ng player B ay upang mabawasan ang parehong pag-andar. Ang bawat isa sa mga manlalaro ay maaaring pumili ng isa sa mga variable kung saan nakasalalay ang halaga ng pagpapaandar. Kung pipiliin ng manlalaro ang ilan sa mga diskarte na Ai, kung gayon ito mismo ay hindi makakaimpluwensya sa halaga ng pag-andar φ (Ai, Bj).

Ang impluwensya ng Ai sa halaga ng halaga ng φ (Ai, Bj) ay hindi sigurado; Ang katiyakan ay nagaganap lamang pagkatapos ng pagpipilian, batay sa prinsipyo ng pag-minimize ng φ (Ai, Bj), sa pamamagitan ng isa pang manlalaro ng variable Bj. Sa kasong ito, si Bj ay natutukoy ng isa pang player. Hayaan ang φ (Ai, Bj) \u003d aij. Isulat natin ang matrix A:

Ang mga hilera ng matris ay tumutugma sa mga estratehiya Ai, ang mga haligi ay tumutugma sa mga estratehiya na Bj. Ang Matrix A ay tinatawag na bayad o laro matrix. Ang elementong aij ng matrix ay ang kabayaran ng manlalaro A kung napili niya ang diskarte Ai, at ang player na B ay napili ng diskarte Bj.

Hayaan ang player A pumili ng ilang diskarte Ai; pagkatapos ay sa pinakamasamang kaso (hal. kung ang pagpipilian ay naging kilala sa player C) makakatanggap siya ng isang payoff na katumbas ng min aij. Sa pag-asang tulad ng isang posibilidad, ang player A ay dapat pumili ng ganoong diskarte upang ma-maximize ang kanyang minimum na kabayaran:

a \u003d max min aij

Ang halaga a - ang garantisadong kabayaran ng player A - ay tinatawag na mas mababang presyo ng laro. Ang diskarte ng Аi0, na nagsisiguro sa pagkuha ng isang, ay tinatawag na maximin.

Ang Player B, ang pagpili ng isang diskarte, ay makukuha mula sa sumusunod na prinsipyo: kapag pumipili ng isang tiyak na diskarte Bj, ang kanyang pagkawala ay hindi lalampas sa maximum ng mga halaga ng mga elemento ng mga j-th na haligi ng matrix, i.e. mas mababa sa o katumbas ng max aij

Isinasaalang-alang ang set max aij para sa magkakaibang kahulugan j, ang player B ay natural na pumili ng tulad ng isang halaga ng j kung saan ang kanyang maximum na pagkawala ay nabawasan:

β \u003d min miax aij

Ang halaga β ay tinatawag na itaas na presyo ng laro, at ang diskarte na Bj0 na naaayon sa payoff β ay tinatawag na minimax.

Ang aktwal na kita ng player A na may makatuwirang mga aksyon ng mga kasosyo ay limitado sa pamamagitan ng mas mababa at itaas na mga presyo ng laro. Kung ang mga expression na ito ay pantay-pantay, i.e.

Ang teorya ng laro ay isang disiplinang pang-matematika, ang paksa kung saan ang mga pamamaraan ng pagpapasya sa mga sitwasyong salungatan.

Ang sitwasyon ay tinatawag salungatankung ang mga interes ng maraming (karaniwang dalawa) mga taong nagtutugis sa kabaligtaran ng mga layunin ay nabangga dito. Ang bawat panig ay maaaring magsagawa ng isang bilang ng mga aktibidad upang makamit ang mga layunin, na may tagumpay sa isang panig ay nangangahulugang kabiguan ng isa.

Sa ekonomiya, ang mga sitwasyon ng salungatan ay napaka pangkaraniwan (ang relasyon sa pagitan ng tagapagtustos at consumer, mamimili at nagbebenta, tagabangko at kliyente). Ang mga salungat na sitwasyon ay nangyayari sa maraming iba pang mga lugar.

Ang isang sitwasyon ng salungatan ay nabuo sa pamamagitan ng pagkakaiba sa mga interes ng mga kasosyo at ang pagnanais ng bawat isa sa kanila na gumawa ng pinakamainam na mga desisyon na napagtanto ang itinakdang mga layunin sa pinakamalaking sukat. Sa kasong ito, dapat isaalang-alang ng bawat isa hindi lamang sa kanilang sariling mga layunin, kundi pati na rin sa mga layunin ng kapareha, at isinasaalang-alang ang mga desisyon na hindi alam nang maaga na gagawin ng mga kasosyo.

Karaniwan, ang mga sitwasyon ng salungatan ay mahirap pag-aralan nang direkta dahil sa maraming pangalawang kadahilanan na pumapasok. Upang maging posible ang isang pagtatasa ng matematika ng isang sitwasyon ng salungatan, dapat itong gawing simple, isinasaalang-alang lamang ang pangunahing mga kadahilanan. Ang isang pinasimple na pormal na modelo ng isang sitwasyon ng salungatan ay tinatawag laro, ang mga partido sa salungatan - mga manlalaro, at ang kinalabasan ng salungatan ay nanalo.Karaniwan, ang pakinabang (o pagkawala) ay maaaring masukat; halimbawa, maaari mong matantya ang pagkawala bilang zero, ang pakinabang bilang isa, at mabubunot bilang 1/2.

Ang laro ay isang koleksyon mga panuntunannaglalarawan ng pag-uugali ng mga manlalaro. Ang bawat halimbawa ng paglalaro ng laro sa ilang partikular na paraan mula simula hanggang sa katapusan ay partido ng laro. Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay para sa mga patakaran ay tinatawag lumipatmanlalaro. Ang mga galaw ay maaaring personal o random. Personal na paglipat ay isang malay na pagpipilian ng player ng isa sa mga posibleng pagkilos (halimbawa, isang paglipat sa isang laro ng chess). Random na paglipat- Ito rin ay pagpipilian ng isa sa maraming mga pagpipilian, ngunit narito ang pagpipilian ay hindi pinili ng player, ngunit sa pamamagitan ng ilang mekanismo ng random na pagpili (pagkahagis ng mga barya, pagpili ng isang kard mula sa isang shuffled deck).

Diskarteang player ay isang hanay ng mga patakaran na tumutukoy sa pagpili ng kanyang mga aksyon para sa bawat personal na paglipat, depende sa sitwasyon.



Kung ang laro ay binubuo lamang ng mga personal na galaw, kung gayon ang kalalabasan ng laro ay natutukoy kung ang bawat isa sa mga manlalaro ay pinili ang kanyang sariling diskarte. Gayunpaman, kung mayroong mga random na gumagalaw sa laro, kung gayon ang laro ay magiging probabilistic at ang pagpili ng mga diskarte ng mga manlalaro ay hindi pa matukoy ang kinalabasan ng laro.

Sa magpasyaang laro, o makahanap ng isang solusyon sa laro, ang isa ay dapat pumili ng isang diskarte para sa bawat manlalaro na nasiyahan sa kondisyon pagiging maaasahan, mga. ang isa sa mga manlalaro ay dapat tumanggap maximum na panalo,kapag ang iba pang dumikit sa kanyang diskarte. Sa parehong oras, ang pangalawang manlalaro ay dapat magkaroon kaunting pagkawalakung ang dating dumikit sa kanyang diskarte. Ang ganitong mga diskarte ay tinatawag na optimal. Ang mga diskarte sa pinakamabuting kalagayan ay dapat masiyahan ang kondisyon ng katatagan, i.e. dapat itong hindi kapaki-pakinabang para sa sinumang mga manlalaro na iwanan ang kanilang diskarte sa larong ito.

Ang layunin ng teorya ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

Isaalang-alang ang isang laro sa pagtatapos ng pares. Hayaan ang player AT ay m mga personal na diskarte, na itinalaga namin Isang 1 , Isang 2 , ..., Isang m ... Hayaan ang player SA meron n mga personal na diskarte, ituro natin ang mga ito B 1 , B 2 , ..., B m ... Sinabi nila na ang laro ay may sukat m × n ... Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte



A i at B j (i \u003d 1, 2, ..., m; j \u003d 1, 2, ..., n)

ang kinalabasan ng laro ay natatanging natukoy, i.e. makakuha isang ij manlalaro AT (positibo o negatibo) at pagkawala ( - isang ij ) manlalaro SA ... Ipagpalagay na ang mga halaga oU kilala para sa anumang pares ng mga diskarte (A i, B j ). Matrix , na ang mga elemento ay payoff na naaayon sa mga diskarte A i at B j ay tinatawag na pagbabayad ng matrix o laro ng matris. Pangkalahatang form tulad ng isang matris ay ipinakita sa Talahanayan 3.1.

Talahanayan 3.1

Ang mga hilera ng talahanayan na ito ay tumutugma sa mga diskarte ng player AT , at ang mga haligi ay para sa mga diskarte ng player SA ... Gumawa tayo ng isang matrikula sa pagbabayad para sa susunod na laro.

Isaalang-alang ang laro m × n may matris P \u003d (isang ij), i \u003d 1, 2, ..., m; j \u003d 1, 2, ..., n at matukoy ang pinakamahusay sa mga diskarte Isang 1 , Isang 2 , ..., Isang m ... Ang pagpili ng isang diskarte A i manlalaro AT dapat asahan na ang player SA sasagutin ito sa isa sa mga diskarte B j para sa kung saan ang pakinabang para sa player AT minimal (player SA naglalayong "saktan" ang manlalaro AT ). Ipaalam sa amin α i , ang pinakamaliit na payoff ng player AT kapag pumipili ng isang diskarte A i para sa lahat ng posibleng mga diskarte sa player SA (ang pinakamaliit na numero sa ako-th row ng pagbabayad ng matrix), i.e.

Ang diskarte na naaayon sa maximin ay tinatawag diskarte sa maximin... Manlalaro SA interesado sa pagbabawas ng panalo ng manlalaro AT ; pagpili ng isang diskarte B j , isinasaalang-alang ang maximum na posibleng pakinabang para sa AT ... Nagpapakilala kami

Ang diskarte na naaayon sa isang minimax ay tinatawag na isang diskarte sa minimax. Ang prinsipyo na nagdidikta sa mga manlalaro ang pagpili ng pinaka "maingat" na minimax at pinakamataas na diskarte ay tinawag prinsipyo ng minimax... Ang prinsipyong ito ay sumusunod mula sa makatuwirang pag-aakalang hangarin ng bawat manlalaro upang makamit ang kabaligtaran na layunin ng kalaban. Tukuyin natin ang mas mababa at itaas na presyo ng laro at ang kaukulang mga diskarte sa problema.

Kung ang pang-itaas at mas mababang mga presyo ng laro ay nagkakasabay, kung gayon kabuuang halaga tuktok at mas mababang presyo mga laro α \u003d β \u003d v tinawag purong presyo ng laro , o sa gastos ng laro ... Mga diskarte sa minimax na katumbas ng presyo ng laro pinakamainam na diskarte, at ang kanilang kabuuan ay pinakamainam na solusyon , o desisyon ng laro... Sa kasong ito, ang player AT nakakakuha ng maximum na garantisadong (independiyenteng ng pag-uugali ng player SA ) manalo v at ang manlalaro SA nakamit ang minimum na garantisadong (anuman ang pag-uugali ng player AT ) pagkawala v ... Sinasabing ang solusyon sa laro ay pagpapanatili , i.e. kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na diskarte, kung gayon hindi ito maaaring kumita para sa iba pang lumihis mula sa kanyang pinakamainam na diskarte.

Ilang malinis na mga diskarte A i at B j ay nagbibigay ng isang pinakamainam na solusyon sa laro kung at lamang kung ang kaukulang elemento isang ij , ay pareho ang pinakamalaking sa haligi nito at ang pinakamaliit sa hilera nito. Ang ganitong sitwasyon, kung mayroon, ay tinawag point saddle (sa pamamagitan ng pagkakatulad na may isang saddle na ibabaw na curves paitaas sa isang direksyon at pababa sa kabilang linya).

Mga pangunahing konsepto ng modelo ng pamamahala ng imbentaryo.

Sa parehong negosyo at pagmamanupaktura, karaniwang kaugalian na mapanatili ang isang makatwirang imbentaryo ng mga materyal na mapagkukunan o mga sangkap upang matiyak ang pagpapatuloy proseso ng produksyon... Ayon sa kaugalian, ang stock ay tiningnan bilang isang hindi maiiwasang gastos kung masyadong mababa ang isang antas ay humahantong sa mga pagkagambala ng gastos, at masyadong mataas sa "manhid" na kapital. Ang hamon para sa pamamahala ng imbentaryo ay upang matukoy ang antas ng imbentaryo na binabalanse ang dalawang nabanggit na mga kaso sa gilid.

Isaalang-alang natin ang pangunahing katangian ng mga modelo ng pamamahala ng imbentaryo.

Demand... Ang demand para sa naka-imbak na produkto ay maaaring deterministik(sa pinakasimpleng kaso, pare-pareho sa oras) o random.Ang randomness ng demand ay inilarawan alinman sa pamamagitan ng isang random na sandali ng demand o sa pamamagitan ng isang random na dami ng demand sa deterministic o random na oras ng oras.

Ang muling pagdadagdag ng bodega. Ang muling pagdadagdag ng bodega ay maaaring isagawa alinman sa pana-panahon sa ilang mga agwat, o habang ang mga stock ay maubos, i.e. binabawasan ang mga ito sa isang tiyak na antas.

Dami ng pag-order. Sa pana-panahong muling pagdadagdag at hindi sinasadyang pag-ubos ng stock, ang dami ng pagkakasunud-sunod ay maaaring nakasalalay sa estado na sinusunod sa oras ng paglalagay ng pagkakasunud-sunod. Ang order ay karaniwang isinumite para sa parehong halaga kapag ang stock ay umabot sa isang naibigay na antas - ang tinatawag na mga puntos ng pagkakasunud-sunod.

Oras ng paghahatid.Sa mga idealized na mga modelo ng pamamahala ng imbentaryo, ipinapalagay na ang iniutos na muling pagdadagdag ay inihatid sa tindahan agad. Isinasaalang-alang ng iba pang mga modelo ang pagkaantala sa mga paghahatid para sa isang nakapirming o random na agwat ng oras.

Presyo ng padala. Bilang isang patakaran, ipinapalagay na ang gastos ng bawat paghahatid ay binubuo ng dalawang sangkap - isang beses na mga gastos na hindi nakasalalay sa dami ng iniutos na batch, at mga gastos na umaasa (kadalasang magkakasunod) sa laki ng batch.

Mga gastos sa pag-iimbak.Sa karamihan ng mga modelo ng pamamahala ng imbentaryo, ang dami ng bodega ay itinuturing na walang limitasyong, at ang dami ng nakaimbak na imbentaryo ay nagsisilbing isang halaga ng pagkontrol. Ito ay pinaniniwalaan na ang pag-iimbak ng bawat yunit ng stock bawat yunit ng oras ay sinisingil ng isang tiyak na bayad.

Deficit penalty.Ang anumang bodega ay nilikha upang maiwasan ang mga kakulangan isang tiyak na uri mga produkto sa sistema ng serbisyo. Ang kakulangan sa stock sa tamang oras ay humahantong sa mga pagkalugi na nauugnay sa downtime ng kagamitan, iregularidad ng produksyon, atbp. Ang mga pagkalugi na ito ay tinatawag depisit na parusa.

Pangngalan sa stock.Sa pinakasimpleng mga kaso, ipinapalagay na ang isang stock ng parehong uri ng produkto o isang homogenous na produkto ay nakaimbak sa bodega. Sa mas maraming mahirap kaso isinasaalang-alang stock ng multinomenclature.

Istraktura ng sistema ng bodega.Karamihan sa ganap na binuo modelo ng matematika solong matamis. Gayunpaman, sa pagsasagawa, mayroon ding mga mas kumplikadong mga istraktura: hierarchical system ng mga alipin na may iba't ibang mga panahon ng muling pagdadagdag at mga oras ng paghahatid, na may posibilidad na palitan ang mga stock sa pagitan ng mga bodega ng parehong antas ng hierarchy, atbp.

Ang criterion para sa pagiging epektibo ng diskarte sa pamamahala ng imbentaryo ay function na gastos (gastos),na kumakatawan sa kabuuang gastos ng pagbibigay ng stock na produkto, ang pag-iimbak nito at ang gastos ng mga parusa.

Ang pamamahala ng imbentaryo ay binubuo sa paghahanap ng tulad ng isang diskarte ng muling pagdadagdag at pagkonsumo ng imbentaryo, kung saan ang paggana ng gastos ay tumatagal ng isang minimum na halaga.

Hayaan ang mga function, at ipahayag ayon sa pagkakabanggit:

Ang muling pagdadagdag ng stock,

Inventory consumption,

Suplay ng demand

para sa isang tagal ng panahon.

Karaniwang ginagamit ng mga modelo ng pamamahala ng imbensyon ang mga derivatives ng oras ng mga pag-andar na ito, na tinatawag na, ayon sa pagkakabanggit,

Ang laro ay tinatawag isang laro na zero-sum, o antagonistickung ang pakinabang ng isa sa mga manlalaro ay katumbas ng pagkawala ng iba pa, i.e. para sa isang kumpletong gawain ng laro, sapat na upang ipahiwatig ang halaga ng isa sa kanila. Kung magpapakilala tayo a- ang panalo ng isa sa mga manlalaro, b- ang kabayaran ng iba, pagkatapos ay para sa isang laro na zero-sum b \u003d - a, samakatuwid, sapat na upang isaalang-alang, halimbawa, a.

Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay para sa mga patakaran ay tinatawag lumipat manlalaro. Ang mga galaw ay maaaring personal o random.

Personal na paglipatay isang malay na pagpipilian ng player ng isa sa mga posibleng pagkilos (halimbawa, isang paglipat sa isang laro ng chess).

Random na paglipatay isang random na napiling aksyon (halimbawa, pagpili ng isang card mula sa isang shuffled deck). Sa aking trabaho, isasaalang-alang ko lamang ang mga personal na galaw ng mga manlalaro.

Diskarte ang isang manlalaro ay isang hanay ng mga patakaran na tumutukoy sa pagpili ng kanyang pagkilos sa bawat personal na paglipat, depende sa kasalukuyang sitwasyon. Karaniwan, sa panahon ng laro, sa bawat personal na paglipat, ang player ay gumawa ng isang pagpipilian depende sa tiyak na sitwasyon. Gayunpaman, sa prinsipyo, posible na ang lahat ng mga pagpapasya ay ginawa ng player nang maaga (bilang tugon sa anumang sitwasyon na lumitaw). Nangangahulugan ito na pinili ng player ang isang tiyak na diskarte, na maaaring itakda sa anyo ng isang listahan ng mga patakaran o isang programa. (Kaya maaari mong i-play ang laro sa isang computer). Ang laro ay tinatawag ang panghulikung ang bawat manlalaro ay may isang tiyak na bilang ng mga diskarte, at walang katapusang- kung hindi man.

Upang malutas ang laro, o makahanap ng isang solusyon sa laro, dapat pumili ang bawat isa para sa bawat manlalaro ng isang diskarte na nagbibigay kasiyahan sa kondisyon pagiging maaasahan, i.e. ang isa sa mga manlalaro ay dapat tumanggap maximum na panalokapag ang iba pang dumikit sa kanyang diskarte. Sa parehong oras, ang pangalawang manlalaro ay dapat magkaroon kaunting pagkawalakung ang dating dumikit sa kanyang diskarte. Ganyan diskarte ay tinawag pinakamabuting kalagayan... Ang mga diskarte sa optimum ay dapat ding masiyahan kondisyon ng katatagan, i.e. dapat itong hindi kapaki-pakinabang para sa sinumang mga manlalaro na iwanan ang kanilang diskarte sa larong ito.

Ang layunin ng teorya ng laro: pagtukoy ng pinakamainam na diskarte para sa bawat manlalaro. Kapag pumipili ng pinakamainam na diskarte, natural na ipalagay na ang parehong mga manlalaro ay kumilos nang makatwiran mula sa punto ng view ng kanilang mga interes.

Ang mga laro na antagonistic na kung saan ang bawat manlalaro ay may isang hangganan na hanay ng mga diskarte ay tinatawag laro ng matris... Ang pangalang ito ay ipinaliwanag sa pamamagitan ng sumusunod na posibilidad ng paglalarawan ng mga larong ito. Gumuhit kami ng isang hugis-parihaba na talahanayan na kung saan ang mga hilera ay tumutugma sa mga diskarte ng unang manlalaro, ang mga haligi ay tumutugma sa mga diskarte ng pangalawa, at ang mga cell ng talahanayan sa intersection ng mga hilera at haligi na tumutugma sa mga sitwasyon ng laro. Kung inilalagay namin sa bawat cell ang kabayaran ng unang manlalaro sa kaukulang sitwasyon, pagkatapos ay nakakakuha kami ng isang paglalarawan ng laro sa anyo ng ilang mga matris. Ang matris na ito ay tinawag laro ng matris o payoff matrix.

Ang isa at ang parehong panghuling antagonistic na laro ay maaaring inilarawan ng iba't ibang mga matrice, naiiba sa bawat isa lamang sa pagkakasunud-sunod ng mga hilera at haligi.

Isaalang-alang ang laro m x n may matris Р \u003d (isang ij), i \u003d 1,2, ..., m; j \u003d 1,2, ..., n at matukoy ang pinakamahusay sa mga diskarte Isang 1, A 2, ..., A m... Ang pagpili ng isang diskarte A imanlalaro AT dapat asahan na ang player SA sasagutin ito sa isa sa mga diskarte B jpara sa kung saan ang pakinabang para sa player AT minimal (player SAnaglalayong "saktan" ang manlalaro AT). Ipaalam sa amin a ako, ang pinakamaliit na payoff ng player ATkapag pumipili ng isang diskarte A i para sa lahat ng posibleng mga diskarte sa player SA (ang pinakamaliit na numero sa i-ika bayaran ang hilera ng matrix), i.e.

isang i \u003d isang ij , j \u003d 1, ..., n.

Kabilang sa lahat ng mga numero a ako (i \u003d 1,2, ..., m ) piliin ang pinakamalaking isa. Tawagin natin a ang ibabang presyo ng laro o ang maximum na kabayaran (maximin). Ito ay isang garantisadong panalo ng manlalaro AT para sa anumang diskarte ng player SA... Kaya, i \u003d 1, ..., m; j \u003d 1, ..., n

Ang diskarte na naaayon sa maximin ay tinatawag maximum na diskarte... Manlalaro SA interesado sa pagbabawas ng panalo ng manlalaro AT; pagpili ng isang diskarte B j, isinasaalang-alang ang maximum na posibleng pakinabang para sa AT.

Ipinapahiwatig namin: β ako = isang ij , i \u003d 1, ..., m

Kabilang sa lahat ng mga numero B j piliin ang pinakamaliit na isa at tumawag β nangungunang presyo ng laroo minimax winnings (minimax). Ito ay isang garantisadong pagkawala para sa player SA.

Samakatuwid, i \u003d 1, ..., m; j \u003d 1, ..., n.

Ang diskarte na naaayon sa minimax ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ang pagpili ng pinaka "maingat" na minimax at pinakamataas na diskarte ay tinawag ang prinsipyong minimax. Ang prinsipyong ito ay sumusunod mula sa makatuwirang pag-aakalang hangarin ng bawat manlalaro upang makamit ang kabaligtaran na layunin ng kalaban.

Panayam 9. Ang konsepto ng mga modelo ng laro. Bayad sa pagbabayad.

§ 6 ELEMENTO NG LARO NG LARO

6.1 Ang konsepto ng mga modelo ng laro.

Ang modelo ng matematika ng isang sitwasyon ng salungatan ay tinatawag laro , ang mga partido sa salungatan - mga manlalaro, at ang kinalabasan ng hidwaan ay panalo .

Para sa bawat pormal na laro, regulasyon , mga. isang sistema ng mga kondisyon na tumutukoy: 1) mga pagpipilian para sa mga aksyon ng mga manlalaro; 2) ang halaga ng impormasyon ng bawat manlalaro ay tungkol sa pag-uugali ng mga kasosyo; 3) ang kabayaran na kung saan ang bawat hanay ng mga aksyon ay humahantong. Karaniwan, ang pakinabang (o pagkawala) ay maaaring masukat; halimbawa, maaari mong matantya ang pagkawala bilang zero, ang pakinabang bilang isa, at mabubunot bilang 1/2. Ang dami ng pagtatasa ng mga resulta ng laro ay tinatawag pagbabayad .

Ang laro ay tinatawag silid-pasingawan , kung ang dalawang manlalaro ay lumahok dito, at maramihang , kung ang bilang ng mga manlalaro ay higit sa dalawa. Tatalakayin lamang namin ang mga ipares na laro. Nagsasangkot sila ng dalawang manlalaro AT at SA, na ang mga interes ay kabaligtaran, at sa pamamagitan ng laro ay nangangahulugang isang serye ng mga aksyon mula sa panig AT at SA.

Ang laro ay tinatawag isang laro na zero-sum, o antagonistic kalangitan , kung ang pakinabang ng isa sa mga manlalaro ay pantay sa pagkawala ng iba, i.e. ang kabuuan ng mga panalo ng parehong partido ay zero. Para sa isang kumpletong gawain ng laro, sapat na upang ipahiwatig ang halaga ng isa sa kanila . Kung magpapakilala tayo at - panalo ng isa sa mga manlalaro, bang kabayaran ng iba, pagkatapos ay para sa isang laro na zero-sum b \u003dat, samakatuwid sapat na isaalang-alang, halimbawa at.

Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay para sa mga patakaran ay tinatawag lumipat manlalaro. Ang paggalaw ay maaaring personal at random . Personal na paglipat ito ay isang malay na pagpipilian ng player ng isa sa mga posibleng pagkilos (halimbawa, isang paglipat sa isang laro ng chess). Ang hanay ng mga posibleng pagpipilian para sa bawat personal na paglipat ay kinokontrol ng mga patakaran ng laro at nakasalalay sa buong hanay ng mga nakaraang gumagalaw sa magkabilang panig.

Random na paglipat ito ay isang random na napiling aksyon (halimbawa, pagpili ng isang card mula sa isang shuffled deck). Para matukoy ang laro sa matematika, dapat ipahiwatig ng mga patakaran ng laro para sa bawat random na paglipat probabilidad na pamamahagi posibleng kinalabasan.

Ang ilang mga laro ay maaari lamang binubuo ng mga random na gumagalaw (tinatawag na purong pagsusugal) o mga personal na gumagalaw lamang (chess, checker). Karamihan sa mga laro ng card ay halo-halong mga laro, iyon ay, naglalaman ng parehong mga random at personal na galaw. Sa hinaharap, isasaalang-alang lamang ang mga personal na galaw ng mga manlalaro.

Ang mga laro ay inuri hindi lamang sa likas na katangian ng kanilang mga gumagalaw (personal, random), kundi pati na rin sa likas na katangian at dami ng impormasyon na magagamit sa bawat manlalaro tungkol sa mga aksyon ng isa pa. Ang isang espesyal na klase ng mga laro ay binubuo ng tinatawag na "mga laro kasama kumpletong impormasyon». Isang laro na may kumpletong impormasyon ay tinatawag na isang laro kung saan ang bawat manlalaro sa bawat personal na paglipat ay nakakaalam ng mga resulta ng lahat ng nakaraang mga gumagalaw, kapwa personal at random. Ang mga halimbawa ng mga laro na may kumpletong impormasyon ay chess, pamato, at sikat na laro "Noughts at crosses". Karamihan sa mga laro ng praktikal na kahalagahan ay hindi kabilang sa klase ng mga laro na may kumpletong impormasyon, dahil ang kawalan ng katiyakan tungkol sa mga aksyon ng kaaway ay karaniwang isang mahalagang elemento ng mga sitwasyong salungatan.

Isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto diskarte .

Diskarte ang manlalaro ay tinatawag na isang hanay ng mga patakaran na tumutukoy sa pagpili ng kanyang pagkilos para sa bawat personal na paglipat, depende sa sitwasyon. Karaniwan, sa panahon ng laro, sa bawat personal na paglipat, ang player ay gumawa ng isang pagpipilian depende sa tiyak na sitwasyon. Gayunpaman, sa prinsipyo posible na ang lahat ng mga pagpapasya ay ginawa ng player nang maaga (bilang tugon sa anumang sitwasyon na lumitaw). Nangangahulugan ito na pinili ng player ang isang tiyak na diskarte, na maaaring itakda sa anyo ng isang listahan ng mga patakaran o isang programa. (Kaya maaari mong i-play ang laro sa isang computer). Ang laro ay tinatawag ang panghuli , kung ang bawat manlalaro ay may isang tiyak na bilang ng mga diskarte, at walang katapusang .– kung hindi man.

Sa magpasya ang laro , o hanapin solusyon sa laro , para sa bawat manlalaro, pumili ng isang diskarte na nasiyahan sa kondisyon pagiging maaasahan , mga. ang isa sa mga manlalaro ay dapat tumanggap maximum na panalo, kapag ang pangalawang player ay sumunod sa kanyang diskarte, sa parehong oras, ang pangalawang manlalaro ay dapat magkaroon kaunting pagkawala , kung ang dating dumikit sa kanyang diskarte. Ang ganitong mga diskarte ay tinatawag pinakamabuting kalagayan . Ang mga diskarte sa optimum ay dapat ding masiyahan ang kondisyon pagpapanatili , mga. dapat itong hindi kapaki-pakinabang para sa sinumang mga manlalaro na talikuran ang kanilang diskarte sa larong ito.

Kung ang laro ay paulit-ulit na paulit-ulit na beses, kung gayon ang mga manlalaro ay maaaring hindi interesado na manalo at mawala sa bawat partikular na laro, ataverage na pakinabang (pagkawala) sa lahat ng mga partido.

Ang layunin ng teorya ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

6.2. Bayad sa pagbabayad. Ang mga presyo ng mas mababa at itaas na laro

Ang panghuli laro kung saan ang player AT Mayroon ito t mga diskarte, at player B - p ang mga diskarte ay tinatawag na isang laro.

Isaalang-alang ang laro
dalawang manlalaro AT at SA ("Kami" at "kaaway").

Hayaan ang player AT ay t mga personal na diskarte, na itinalaga namin
... Hayaan ang player SA meron n mga personal na diskarte, ituro natin ang mga ito
.

Hayaang pumili ang bawat panig ng isang tukoy na diskarte; para sa amin ito ay , para sa kaaway ... Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte at (
) ang kinalabasan ng laro ay natatanging natukoy, i.e. makakuha manlalaro AT(positibo o negatibo) at mawala
manlalaro SA.

Ipagpalagay na ang mga halaga ay kilala para sa anumang pares ng mga diskarte ( ,). Matrix
,
, mga elemento kung saan ang mga panalo na naaayon sa mga diskarte at , tinawag pagbabayad ng matrix o ang laro matrix. Ang mga hilera ng matris na ito ay tumutugma sa mga diskarte ng player AT, at ang mga haligi ay para sa mga diskarte ng player B... Ang mga diskarte na ito ay tinatawag na malinis na mga diskarte.

Game Matrix
mukhang:

Isaalang-alang ang laro
may matris

at matukoy ang pinakamahusay sa mga diskarte
. Ang pagpili ng isang diskarte , manlalaro AT dapat asahan na ang player SAsasagutin ito sa isa sa mga diskarte , para sa kung saan ang pakinabang para sa player AT minimal (player SA naglalayong "saktan" ang manlalaro A).

Ipaalam sa amin pinakamaliit na kabayaran ng isang manlalaro AT kapag pumipili ng isang diskarte para sa lahat ng posibleng mga diskarte sa player SA(ang pinakamaliit na numero sa ako-th row ng pagbabayad ng matrix), i.e.

(1)

Kabilang sa lahat ng mga numero (
) pumili ng pinakamalaking:
.

Tawagin natin
ang ibabang presyo ngra, o ang maximum na panalo (maxmin). Ito ang garantisadong panalo para sa player A para sa anumang diskarte ng player B. Samakatuwid,

. (2)

Ang diskarte na naaayon sa maximin ay tinatawag pinakamataas na diskarte . Manlalaro SA interesado sa pagbabawas ng panalo ng manlalaro AT, pagpili ng isang diskarte , isinasaalang-alang ang maximum na posibleng pakinabang para sa AT. Nagpapakilala kami

. (3)

Kabilang sa lahat ng mga numero piliin ang pinakamaliit

at tumawag tayo nangungunang presyo ng laro o minimax panalo (minimax). Ginarantiyahan ni Ego ang pagkawala ng player B . Samakatuwid,

. (4)

Ang diskarte na naaayon sa minimax ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ang pagpili ng pinaka "maingat" na minimax at pinakamataas na diskarte ay tinawag prinsipyo ng minimax . Ang prinsipyong ito ay sumusunod mula sa makatuwirang pag-aakalang hangarin ng bawat manlalaro upang makamit ang isang layunin na katapat ng kalaban.

Teorya.Ang mas mababang presyo ng laro ay hindi palaging lumampas sa itaas na presyo ng laro
.

Kung ang itaas at mas mababang mga presyo ng laro ay magkapareho, kung gayon ang kabuuang halaga ng itaas at mas mababang mga presyo ng laro
tinawag ang purong presyo ng laro, o sa gastos ng laro. Mga diskarte sa minimax na katumbas ng presyo ng laro pinakamainam na diskarte , at ang kanilang kabuuan - pinakamainam na solusyon o sa pamamagitan ng desisyon ng laro. Sa kasong ito, ang player AT nakakakuha ng maximum na garantisadong (independiyenteng ng pag-uugali ng player SA) makakuha vat ang manlalaro SA nakamit ang minimum na garantisadong (anuman ang pag-uugali ng player AT) talo v... Sinasabing ang solusyon sa laro ay pagpapanatili , mga. kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na diskarte, kung gayon hindi ito maaaring kumita para sa iba pang lumihis mula sa kanyang pinakamainam na diskarte.

Kung ang isa sa mga manlalaro (halimbawa AT) dumikit sa kanyang pinakamainam na diskarte at iba pang player (SA) lihis mula sa pinakamainam na diskarte nito sa anumang paraan, kung gayon hindi ito maaaring maging kapaki-pakinabang para sa isang manlalaro na gumagawa ng isang paglihis; tulad paglihis ng player SAmaaaring pinakamahusay na iwanan ang mga panalo na hindi nagbabago. at sa pinakamasamang kaso, dagdagan mo ito.

Sa kabilang banda, kung SA sumunod sa pinakamainam na diskarte nito, at AT lumihis mula sa sarili nitong, kung gayon, sa anumang kaso maaari itong maging kapaki-pakinabang para sa AT.

Ang isang pares ng mga malinis na diskarte at ay nagbibigay ng isang pinakamainam na solusyon sa laro kung at lamang kung ang kaukulang elemento ay parehong pinakamalaking sa haligi at pinakamaliit sa hilera nito. Ang ganitong sitwasyon, kung mayroon, ay tinawag point saddle. Sa geometry, isang punto sa isang ibabaw na may ari-arian ng isang sabay-sabay na minimum kasama ang isang coordinate at isang maximum kasama ang iba pang mga tinatawag na lamesa point, sa pamamagitan ng pagkakatulad ang term na ito ay ginagamit sa teorya ng laro.

Isang laro para sa kung saan
,
tinawag laro ng saddle point. Elemento pag-aari ng ari-arian na ito, ang saddle point ng matrix.

Kaya, para sa bawat laro na may isang saddle point, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na mga diskarte para sa magkabilang panig, na mayroong mga sumusunod na katangian.

1) Kung ang magkabilang panig ay sumunod sa kanilang pinakamainam na diskarte, kung gayon ang average na kabayaran ay katumbas ng presyo ng net game v, na kung saan ay sa parehong oras ang mas mababa at itaas na mga presyo.

2) Kung ang isa sa mga partido ay sumunod sa pinakamainam na diskarte nito, at ang iba pang mga lihis mula sa sarili nito, kung gayon ang lihis na bahagi ay maaaring mawala lamang mula dito at sa anumang kaso ay hindi maaaring dagdagan ang pakinabang.

Ang klase ng mga laro na may isang punong punong-puno ay may malaking interes kapwa mula sa isang panteorya at praktikal na punto ng pagtingin.

Sa teorya ng laro, napatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may puntong punla, at, samakatuwid, ang bawat naturang laro ay may solusyon, iyon ay, mayroong isang pares ng pinakamainam na mga diskarte ng magkabilang panig na nagbibigay ng isang average na kabayaran na katumbas ng presyo ng laro. Kung ang isang laro na may kumpletong impormasyon ay binubuo lamang ng mga personal na galaw, pagkatapos kapag ang bawat panig ay nalalapat ang pinakamainam na diskarte, dapat itong palaging magtatapos sa isang ganap na tiyak na kinalabasan, samakatuwid, isang panalo na eksaktong katumbas ng presyo ng laro.

© 2020 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway