Ang konsepto ng mga modelo ng laro. Payment matrix

PRAKTIKAL NA GAWAIN №3

Mga modelo ng teorya ng laro

Ang konsepto ng mga modelo ng laro

Ang teorya ng laro ay tumatalakay sa pagbuo ng iba't ibang uri ng mga rekomendasyon para sa paggawa ng desisyon sa ilalim ng mga kondisyon sitwasyon ng tunggalian. Bumubuo ng mga sitwasyon ng salungatan sa matematika, maaari silang katawanin bilang isang laro ng dalawa, tatlo o higit pang mga manlalaro, na ang bawat isa ay humahabol sa layunin na i-maximize ang kabayaran nito sa kapinsalaan ng ibang manlalaro. Ang matematikal na modelo ng isang sitwasyon ng salungatan ay tinatawag laro, ang mga partidong sangkot sa tunggalian - mga manlalaro, at ang kinalabasan ng tunggalian ay panalo. Para sa bawat pormal na laro, ipinakilala namin mga regulasyon, ibig sabihin. isang sistema ng mga kondisyon na tumutukoy sa:

1. mga pagpipilian sa manlalaro;

2. ang dami ng impormasyon na mayroon ang bawat manlalaro tungkol sa pag-uugali ng mga kasosyo;

3. ang kabayaran kung saan humahantong ang bawat hanay ng mga aksyon.

Bilang isang patakaran, ang panalo ay maaaring tukuyin sa dami (halimbawa, pagkatalo - 0, panalo - 1, draw - ½). Ang laro ay tinatawag silid-pasingawan, kung dalawang manlalaro ang lumahok dito, at maramihan kung ang bilang ng mga manlalaro ay higit sa dalawa. Ang laro ay tinatawag larong zero sum kung ang nakuha ng isa sa mga manlalaro ay katumbas ng pagkawala ng isa. Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay ng mga patakaran ay tinatawag gumalaw manlalaro. Maaaring personal at random ang mga galaw. personal na galaw- isang malay na pagpili ng manlalaro ng isa sa mga posibleng aksyon (isang paglipat sa isang laro ng chess), random na galaw- isang random na piniling aksyon (pagpili ng isang card mula sa isang shuffled deck).

Diskarte ng manlalaro tinatawag na set ng mga patakaran na tumutukoy sa pagpili ng kanyang aksyon para sa bawat personal na galaw, depende sa sitwasyon. Ang laro ay tinatawag panghuli kung ang manlalaro ay may limitadong bilang ng mga diskarte, at walang katapusan- kung hindi.

Upang malutas ang laro, o upang mahanap desisyon ng laro, dapat pumili para sa bawat manlalaro ng diskarte na nakakatugon sa kondisyon ng optimality, i.e. dapat matanggap ng isa sa mga manlalaro maximum na panalo kapag ang pangalawa ay nananatili sa diskarte nito. Kasabay nito, ang pangalawang manlalaro ay dapat magkaroon pinakamababang pagkawala kung ang una ay mananatili sa diskarte nito. Ang ganitong mga estratehiya ay tinatawag na pinakamainam. pakay Ang teorya ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro. Kapag pumipili ng pinakamainam na diskarte, natural na ipagpalagay na ang parehong mga manlalaro ay kumikilos nang makatwiran mula sa punto ng view ng kanilang mga interes.

Payment matrix. Mas mababa at mas mataas na presyo ng laro

Isaalang-alang ang isang ipinares na larong may hangganan. Hayaan ang manlalaro PERO may m mga personal na estratehiya, na tinutukoy namin A 1 , A 2 ,…, A m . Hayaan ang manlalaro B magagamit n personal na mga diskarte, tinutukoy namin ang mga ito B 1 , B 2 ,…,B n . May dimensyon daw ang laro m ´ n. Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte A i At Bj ang kinalabasan ng laro ay natatanging tinutukoy, i.e. panalo aij manlalaro PERO(positibo o negatibo) at pagkawala (- aij) manlalaro SA. Ang matrix P=(a ij), na ang mga elemento ay ang mga kabayarang naaayon sa mga estratehiya A i At Bj, ay tinatawag na matrix ng pagbabayad o matris ng laro.

Bj A i	B1	B2	…	B n
A 1	isang 11	isang 12	…	isang 1n
A2	isang 21	isang 22	…	isang 2n
…	…	…	…	…
Isang m	isang m1	isang m 2		amn

Halimbawa - ang larong "Paghahanap"

Manlalaro PERO maaaring magtago sa kanlungan 1 - tukuyin natin ang diskarteng ito bilang A 1 o sa kanlungan 2 - diskarte A 2. Manlalaro SA maaaring hanapin ang unang manlalaro sa shelter 1 - diskarte SA 1, o sa shelter 2 - diskarte SA 2. Kung ang manlalaro PERO naninirahan sa Vault 1 at natuklasan ng player SA, ibig sabihin. isang pares ng mga estratehiya ang ipinapatupad (A 1, B 1), pagkatapos ay ang manlalaro PERO nagbabayad ng multa, i.e. isang 11=–1. Katulad nito, nakukuha namin isang 22=–1. Malinaw na ang mga diskarte (A 1, B 2) At (A 2, B 1) ibigay ang manlalaro PERO panalo 1, kaya isang 12=isang 21=1. Kaya, nakukuha namin ang payoff matrix

Isaalang-alang ang laro m ´ n may matrix P=(a ij) at tukuyin ang pinakamahusay sa mga diskarte ng manlalaro PERO. Pagpili ng diskarte A i, manlalaro PERO dapat asahan ang manlalaro SA sasagutin ito ng isa sa mga estratehiya Sa j, kung saan ang kabayaran para sa manlalaro PERO minimal (manlalaro SA naglalayong "manakit" ang manlalaro PERO).

Tukuyin ng a i pinakamababang bayad ng manlalaro PERO kapag pumipili ng isang diskarte A i para sa lahat ng posibleng diskarte ng manlalaro SA(pinakamaliit na numero sa i-th row ng payoff matrix), i.e. .

Sa lahat ng numero a i piliin ang pinakamalaki: . Tawagan natin si a mas mababang presyo ng laro , o maximum na panalo (maximin ). Ito garantisadong kabayaran ng manlalaro A para sa anumang diskarte ng manlalaro B. Dahil dito, .

Ang diskarte na naaayon sa maximin ay tinatawag diskarte sa maximum. Manlalaro SA interesadong bawasan ang kabayaran ng manlalaro PERO; pagpili ng diskarte Bj, isinasaalang-alang nito ang pinakamataas na posibleng kabayaran para sa A. Denote .

Sa lahat ng numero, pipiliin namin ang pinakamaliit at tinatawag namin ito b nangungunang presyo ng laro , o minimax na kabayaran (minimax ). Ito garantisadong pagkawala ng player B para sa anumang diskarte ng player A. Dahil dito, .

Ang minimax na diskarte ay tinatawag diskarte sa minimax. Ang prinsipyong nagdidikta sa mga manlalaro ng pagpili ng pinakamaingat na diskarte sa minimax at maximin ay tinatawag prinsipyo ng minimax.

istatistikal na laro

Sa maraming mga gawain na humahantong sa paglalaro, ang kawalan ng katiyakan ay sanhi ng kakulangan ng impormasyon tungkol sa mga kondisyon kung saan isinasagawa ang aksyon. Ang mga kundisyong ito ay hindi nakasalalay sa malay-tao na mga aksyon ng isa pang manlalaro, ngunit sa layunin na katotohanan, na karaniwang tinatawag na "kalikasan". Ang mga ganitong laro ay tinatawag na larong may kalikasan (mga larong istatistikal).

Isang gawain

Pagkatapos ng ilang taon ng operasyon, ang mga kagamitang pang-industriya ay nasa isa sa mga sumusunod na estado: Sa 1 - ang kagamitan ay maaaring gamitin sa susunod na taon pagkatapos ng preventive maintenance; B 2 - para sa walang problema na pagpapatakbo ng kagamitan sa hinaharap, kinakailangan upang palitan ang mga indibidwal na bahagi at pagtitipon nito; Sa 3 - ang kagamitan ay nangangailangan ng malalaking pag-aayos o pagpapalit.

Depende sa kasalukuyang sitwasyon B 1, B 2, B 3, ang pamamahala ng enterprise ay maaaring gumawa ng mga sumusunod na desisyon: A 1 - pag-aayos ng kagamitan ng mga espesyalista sa pabrika, na nangangailangan ng naaangkop na mga gastos a 1 = 6, a 2 = 10, at 3 = 15 na yunit ng pananalapi ; A 2 - tumawag sa isang espesyal na pangkat ng mga repairman, ang mga gastos sa kasong ito ay magiging b 1 \u003d 15, b 2 \u003d 9, b 3 \u003d 18 na mga yunit ng pananalapi; A 3 - palitan ang kagamitan ng bago, ibenta ang hindi na ginagamit na kagamitan sa natitirang halaga nito. Ang kabuuang halaga ng mga resulta ng kaganapang ito ay magiging katumbas ng, ayon sa pagkakabanggit, na may 1 =13, na may 2 =24, na may 3 =12 na yunit ng pananalapi.

Ang gawain

1. Ang pagkakaroon ng ibinigay na inilarawan na sitwasyon ng isang scheme ng laro, kilalanin ang mga kalahok nito, ipahiwatig ang mga posibleng purong estratehiya ng mga partido.

2. Bumuo ng isang payoff matrix, na nagpapaliwanag ng kahulugan ng mga elemento a ij ng matrix (bakit negatibo ang mga ito?).

3. Alamin kung anong desisyon sa pagpapatakbo ng kagamitan sa darating na taon ipinapayong irekomenda sa pamamahala ng negosyo upang mabawasan ang mga pagkalugi sa ilalim ng mga sumusunod na pagpapalagay: a) ang karanasan na nakuha sa negosyo sa pagpapatakbo ng mga katulad na kagamitan ay nagpapakita na ang mga probabilidad ng mga ipinahiwatig na estado ng kagamitan ay ayon sa pagkakabanggit q 1 = 0.15; q 2 =0.55; q 3 \u003d 0.3 (ilapat ang pagsubok sa Bayes); b) ipinapakita ng karanasan na ang lahat ng tatlong posibleng estado ng kagamitan ay pantay na posibilidad (ilapat ang Laplace criterion); c) walang tiyak na masasabi tungkol sa posibilidad ng kagamitan (ilapat ang pamantayan ng Wald, Savage, Hurwitz). Nakatakda ang value ng parameter na g=0.8 sa Hurwitz criterion.

Solusyon

1) Ang inilarawang sitwasyon ay isang istatistikal na laro.

Ang statistician ay ang pamamahala ng negosyo, na maaaring gumawa ng isa sa mga sumusunod na desisyon: ayusin ang kagamitan sa sarili nitong (diskarte A 1), tumawag sa mga repairman (diskarte A 2); palitan ang kagamitan ng bago (diskarte A 3).

Ang pangalawang bahagi ng paglalaro - kalikasan, isasaalang-alang namin ang isang kumbinasyon ng mga kadahilanan na nakakaapekto sa kondisyon ng kagamitan: ang kagamitan ay maaaring gamitin pagkatapos ng preventive maintenance (kondisyon B 1); kinakailangang palitan ang mga indibidwal na bahagi at bahagi ng kagamitan (estado B 2): kakailanganin ito overhaul o pagpapalit ng kagamitan (estado B 3).

2) Bumuo ng payoff matrix ng laro:

Ipinapakita ng elemento ng payment matrix a ij ang mga gastos ng pamamahala ng enterprise kung, sa napiling diskarte A i, ang kagamitan ay nasa estado B j . Ang mga elemento ng payoff matrix ay negatibo, dahil para sa anumang napiling diskarte, ang pamamahala ng negosyo ay kailangang pasanin ang mga gastos.

a) ang karanasan sa pagpapatakbo na naipon sa enterprise na katulad ng mga kagamitan ay nagpapakita na ang mga probabilidad ng mga estado ng kagamitan ay katumbas ng q 1 =0.15; q 2 =0.55; q 3 \u003d 0.3.

Katawanin natin ang payoff matrix tulad ng sumusunod:

Mga istatistika ng diskarte, A i	Estado ng kalikasan B j
B1	B2	B3
A 1	-6	-10	-15	-10,9
A2	-15	-9	-18	-12,6
A 3	-13	-24	-12	-18,75
qj	0,15	0,55	0,3

kung saan , (i=1.3)

Ayon sa pamantayan ng Bayes, ang purong diskarte A i ay kinuha bilang pinakamainam, kung saan ang average na pakinabang ng statistician ay na-maximize, i.e. ibinigay ng =max .

Ang pinakamainam na diskarte ng Bayesian ay diskarte A 1 .

b) ipinapakita ng karanasan na ang lahat ng tatlong posibleng estado ng kagamitan ay pantay na posibilidad, i.e. = 1/3.

Ang average na panalo ay:

1/3 * (-6-10-15) \u003d -31/3 "-10.33;

1/3*(-15-9-18) = -42/3 = -14;

1/3 * (-13-24-12) \u003d -49/3 "-16.33.

Ayon kay Laplace, ang pinakamainam na diskarte ay A 1 .

c) walang tiyak na masasabi tungkol sa mga probabilidad ng kagamitan.

Ayon sa pamantayan ng Wald, ang purong diskarte ay kinuha bilang pinakamainam, na ginagarantiyahan ang pinakamataas na kabayaran sa ilalim ng pinakamasamang mga kondisyon, i.e.

= max(-15, -18, -24) = -15.

Kaya, ang diskarte A 1 ay pinakamainam.

Bumuo tayo ng isang risk matrix , kung saan .

Ang diskarte ng isang manlalaro ay isang plano ayon sa kung saan siya ay gumagawa ng isang pagpipilian sa anumang posibleng sitwasyon at sa anumang posibleng makatotohanang impormasyon. Natural, ang manlalaro ay gumagawa ng mga desisyon habang umuusad ang laro. Gayunpaman, sa teoryang ito ay maaaring ipagpalagay na ang lahat ng mga desisyong ito ay ginawa ng manlalaro nang maaga. Kung gayon ang kabuuan ng mga desisyong ito ay bumubuo sa kanyang diskarte. Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa may hangganan at walang katapusan. Ang gawain ng teorya ng laro ay bumuo ng mga rekomendasyon para sa mga manlalaro, ibig sabihin, upang matukoy ang pinakamainam na diskarte para sa kanila. Ang pinakamainam na diskarte ay isang diskarte na, kapag ang laro ay paulit-ulit na maraming beses, ay nagbibigay sa ibinigay na manlalaro ng pinakamataas na posibleng average na kabayaran.

Ang pinakasimpleng uri ng madiskarteng laro ay isang dalawang-taong zero-sum na laro (ang kabuuan ng mga kabayaran ng mga partido ay zero). Ang laro ay binubuo ng dalawang galaw: ang manlalaro A ay pipili ng isa sa kanyang posibleng mga diskarte Ai (i = 1, 2, m), at ang manlalaro B ay pipili ng diskarte Bj (j = 1, 2, ., n), at ang bawat pagpipilian ay ginawa sa kumpletong kamangmangan sa pagpili ng isa pang manlalaro.

Ang layunin ng player A ay i-maximize ang function na φ (Ai, Bj), sa turn, ang layunin ng player B ay i-minimize ang parehong function. Ang bawat isa sa mga manlalaro ay maaaring pumili ng isa sa mga variable kung saan nakasalalay ang halaga ng function. Kung pipiliin ng manlalaro A ang ilan sa mga estratehiyang Ai, ito mismo ay hindi makakaapekto sa halaga ng function na φ (Ai, Bj).

Ang impluwensya ng Ai, sa magnitude ng halaga ng φ (Ai, Bj) ay hindi tiyak; Ang katiyakan ay nagaganap lamang pagkatapos ng pagpili, batay sa prinsipyo ng pagliit ng φ (Ai, Bj), ng isa pang manlalaro ng variable na Bj. Sa kasong ito, ang Bj ay tinutukoy ng ibang manlalaro. Hayaan ang φ (Ai, Bj)= aij. Gumawa tayo ng matrix A:

Ang mga hilera ng matrix ay tumutugma sa mga estratehiya Ai, ang mga hanay ay tumutugma sa mga estratehiya Bj. Ang Matrix A ay tinatawag na payoff o game matrix. Ang elementong aij ng matrix ay ang kabayaran ng manlalaro A kung pinili niya ang diskarte Ai, at pinili ng manlalaro B ang diskarte na Bj.

Hayaang pumili ang manlalaro A ng ilang diskarte Ai; pagkatapos ay sa pinakamasamang kaso (halimbawa, kung ang pagpipilian ay magiging sikat na manlalaro C) makakatanggap siya ng kabayarang katumbas ng min aij. Inaasahan ang posibilidad na ito, ang manlalaro A ay dapat pumili ng isang diskarte upang i-maximize ang kanyang pinakamababang kabayaran a:

a = max min aij

Ang halaga a - ang garantisadong kabayaran ng manlalaro A - ay tinatawag na mas mababang presyo ng laro. Ang diskarteng Ai0, na nagsisiguro sa pagtanggap ng a, ay tinatawag na maximin.

Ang manlalaro B, na pumipili ng isang diskarte, ay nagpapatuloy mula sa sumusunod na prinsipyo: kapag pumipili ng ilang diskarte Bj, ang kanyang pagkawala ay hindi lalampas sa maximum ng mga halaga ng mga elemento ng jth na haligi ng matrix, i.e. mas mababa sa o katumbas ng max aij

Isinasaalang-alang ang set max aij para sa iba't ibang kahulugan j, ang manlalaro B ay natural na pipili ng isang halaga ng j upang ang kanyang pinakamataas na pagkawala β ay mababawasan:

β = min miax aij

Ang halagang β ay tinatawag na pinakamataas na halaga ng laro, at ang diskarte na Bj0 na tumutugma sa kabayaran na β ay tinatawag na diskarteng minimax.

Ang aktwal na kabayaran ng player A na may mga makatwirang aksyon ng mga kasosyo ay nililimitahan ng mas mababa at matataas na presyo ng laro. Kung ang mga expression na ito ay pantay, i.e.

Ang teorya ng laro ay isang matematikal na disiplina, ang paksa kung saan ay ang mga pamamaraan ng paggawa ng desisyon sa mga sitwasyon ng salungatan.

Ang sitwasyon ay tinatawag tunggalian, kung ang mga interes ng ilang (karaniwan ay dalawa) na tao na naghahabol sa magkasalungat na layunin ay nagbanggaan dito. Ang bawat isa sa mga partido ay maaaring magsagawa ng isang bilang ng mga aktibidad upang makamit ang kanilang mga layunin, at ang tagumpay ng isang panig ay nangangahulugan ng kabiguan ng isa pa.

Sa ekonomiya, ang mga sitwasyon ng salungatan ay napaka-pangkaraniwan (ang relasyon sa pagitan ng tagapagtustos at ng mamimili, ng mamimili at nagbebenta, ng bangkero at ng kliyente). Ang mga sitwasyon ng salungatan ay matatagpuan sa maraming iba pang mga lugar.

Ang sitwasyon ng salungatan ay nabuo sa pamamagitan ng pagkakaiba sa mga interes ng mga kasosyo at ang pagnanais ng bawat isa sa kanila na gumawa ng pinakamainam na mga desisyon na napagtanto ang mga layunin na itinakda sa pinakamalaking lawak. Kasabay nito, ang bawat isa ay kailangang umasa hindi lamang sa kanilang sariling mga layunin, kundi pati na rin sa mga layunin ng kapareha, at isaalang-alang ang hindi kilalang mga desisyon na gagawin ng mga kasosyo.

Kadalasan ang mga sitwasyon ng salungatan ay mahirap para sa direktang pagsusuri dahil sa maraming pangalawang papasok na mga kadahilanan. Upang gawing posible ang pagsusuri sa matematika ng sitwasyon ng salungatan, dapat itong gawing simple, na isinasaalang-alang lamang ang mga pangunahing kadahilanan. Ang isang pinasimple na pormal na modelo ng isang sitwasyon ng salungatan ay tinatawag laro, ang mga partidong sangkot sa tunggalian - mga manlalaro, at ang kinalabasan ng tunggalian - panalo. Karaniwan, ang pakinabang (o pagkalugi) ay maaaring mabilang; halimbawa, maaari mong suriin ang isang pagkawala ng zero, isang panalo ng isa, at isang draw ng 1/2.

Ang laro ay isang koleksyon mga tuntunin inilalarawan ang pag-uugali ng mga manlalaro. Ang bawat pagkakataon ng paglalaro ng laro sa ilang partikular na paraan mula simula hanggang katapusan ay party ng laro. Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay ng mga patakaran ay tinatawag gumalaw manlalaro. Maaaring personal at random ang mga galaw. personal na galaw- ito ay isang malay na pagpili ng manlalaro ng isa sa mga posibleng aksyon (halimbawa, isang paglipat sa isang laro ng chess). Random na galaw- ito rin ang pagpipilian ng isa sa maraming mga pagpipilian, ngunit narito ang pagpipilian ay hindi pinili ng player, ngunit sa pamamagitan ng ilang random na mekanismo ng pagpili (paghagis ng mga barya, pagpili ng isang card mula sa isang shuffled deck).

diskarte Ang isang manlalaro ay isang hanay ng mga panuntunan na tumutukoy sa pagpili ng kanyang mga aksyon para sa bawat personal na galaw, depende sa sitwasyon.

Kung ang laro ay binubuo lamang ng mga personal na galaw, kung gayon ang kalalabasan ng laro ay matutukoy kung ang bawat isa sa mga manlalaro ay pumili ng kanyang sariling diskarte. Gayunpaman, kung mayroong mga random na galaw sa laro, ang laro ay magiging probabilistikong kalikasan at ang pagpili ng mga diskarte ng mga manlalaro ay hindi pa matukoy ang huling resulta ng laro.

Nang sa gayon lutasin laro, o makahanap ng solusyon sa laro, kinakailangan para sa bawat manlalaro na pumili ng diskarte na nakakatugon sa kondisyon pinakamainam, mga. dapat matanggap ng isa sa mga manlalaro maximum na panalo, kapag ang pangalawa ay nananatili sa diskarte nito. Kasabay nito, ang pangalawang manlalaro ay dapat magkaroon pinakamababang pagkawala kung ang una ay mananatili sa diskarte nito. Ang ganitong mga estratehiya ay tinatawag na pinakamainam. Ang mga pinakamainam na estratehiya ay dapat matugunan ang kondisyon ng katatagan, ibig sabihin. hindi dapat kumikita ang sinuman sa mga manlalaro na talikuran ang kanilang diskarte sa larong ito.

Ang layunin ng teorya ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

Isaalang-alang ang isang ipinares na larong may hangganan. Hayaan ang manlalaro PERO may m mga personal na estratehiya, na tinutukoy namin A 1 , A2 , ..., Isang m . Hayaan ang manlalaro SA magagamit n personal na mga diskarte, tinutukoy namin ang mga ito B1 , B2 , ..., Bm . May dimensyon daw ang laro m × n . Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte

A i at B j (i = 1, 2, ..., m; j = 1, 2, ..., n)

ang kinalabasan ng laro ay natatanging tinutukoy, i.e. panalo aij manlalaro PERO (positibo o negatibo) at pagkawala ( - aij ) manlalaro SA . Ipagpalagay natin na ang mga halaga OU kilala para sa anumang pares ng mga diskarte (A i ,B j ). Ang matrix , na ang mga elemento ay ang mga kabayarang naaayon sa mga estratehiya A i At Bj , ay tinatawag na matrix ng pagbabayad o matris ng laro. Pangkalahatang anyo ang naturang matrix ay ipinakita sa Talahanayan 3.1.

Talahanayan 3.1

Ang mga hilera ng talahanayang ito ay tumutugma sa mga diskarte ng manlalaro PERO , at ang mga column ay mga diskarte ng manlalaro SA . Gumawa tayo ng payoff matrix para sa susunod na laro.

Isaalang-alang ang laro m × n may matrix P = (a ij), i = 1, 2, ..., m; j = 1, 2, ..., n at tukuyin ang pinakamahusay sa mga estratehiya A 1 , A2 , ..., Isang m . Pagpili ng diskarte A i manlalaro PERO dapat asahan ang manlalaro SA sasagutin ito ng isa sa mga estratehiya Bj , kung saan ang kabayaran para sa manlalaro PERO minimal (manlalaro SA naglalayong "manakit" ang manlalaro PERO ). Tukuyin ng a i , ang pinakamaliit na kabayaran ng manlalaro PERO kapag pumipili ng isang diskarte A i para sa lahat ng posibleng diskarte ng manlalaro SA (pinakamaliit na numero sa i-th row ng payoff matrix), i.e.

Ang diskarte na naaayon sa maximin ay tinatawag diskarte sa maximum. Manlalaro SA interesadong bawasan ang kabayaran ng manlalaro PERO ; pagpili ng diskarte Bj , isinasaalang-alang nito ang pinakamataas na posibleng kabayaran para sa PERO . Magpakilala

Ang isang diskarte na naaayon sa isang minimax ay tinatawag na isang minimax na diskarte. Ang prinsipyo na nagdidikta sa mga manlalaro ng pagpili ng pinaka "maingat" na mga diskarte sa minimax at maximin ay tinatawag prinsipyo ng minimax. Ang prinsipyong ito ay sumusunod mula sa makatwirang pagpapalagay na ang bawat manlalaro ay naglalayong makamit ang kabaligtaran na layunin ng kalaban. Alamin natin ang mas mababa at matataas na presyo ng laro at ang mga kaukulang diskarte sa problema.

Kung ang itaas at mas mababang mga presyo ng laro ay pareho, kung gayon pangkalahatang kahulugan tuktok at Mas mababang presyo mga laro α = β = v tinawag ang netong presyo ng laro , o sa halaga ng laro . Ang mga diskarte sa minimax na naaayon sa presyo ng laro ay pinakamainam na estratehiya, at ang kanilang kabuuan ay pinakamainam na solusyon , o desisyon ng laro. Sa kasong ito ang manlalaro PERO tumatanggap ng pinakamataas na garantisadong (independiyente sa gawi ng manlalaro) SA ) manalo v , at ang manlalaro SA nakakamit ang pinakamababang garantisadong (anuman ang pag-uugali ng manlalaro PERO ) pagkalugi v . Ang solusyon sa laro ay sinasabing mayroon Pagpapanatili , ibig sabihin. kung ang isa sa mga manlalaro ay mananatili sa kanyang pinakamainam na diskarte, kung gayon hindi magiging kapaki-pakinabang para sa isa pa na lumihis mula sa kanyang pinakamainam na diskarte.

Magpares puro diskarte A i At Bj nagbibigay ng pinakamainam na solusyon sa laro kung at kung ang kaukulang elemento lamang aij , ay parehong pinakamalaki sa column nito at pinakamaliit sa row nito. Ang ganitong sitwasyon, kung mayroon man, ay tinatawag saddle point (katulad ng ibabaw ng isang saddle, na kumukurba pataas sa isang direksyon at pababa sa kabilang direksyon).

Mga pangunahing konsepto ng modelo ng pamamahala ng imbentaryo.

Sa parehong negosyo at pagmamanupaktura, karaniwan nang magpanatili ng isang makatwirang stock ng mga materyal na mapagkukunan o mga supply upang matiyak ang pagpapatuloy. proseso ng produksyon. Ayon sa kaugalian, ang imbentaryo ay tinitingnan bilang isang hindi maiiwasang gastos, na may masyadong maliit na imbentaryo na humahantong sa magastos na pagsasara ng produksyon, at masyadong maraming imbentaryo na pumapatay sa kapital. Ang gawain ng pamamahala ng imbentaryo ay upang matukoy ang antas ng imbentaryo na nagbabalanse sa dalawang matinding kaso na nabanggit.

Isaalang-alang ang mga pangunahing katangian ng mga modelo ng pamamahala ng imbentaryo.

Demand. Ang pangangailangan para sa isang stocked na produkto ay maaaring deterministiko(sa pinakasimpleng kaso - pare-pareho sa oras) o random. Ang randomness ng demand ay inilalarawan alinman sa pamamagitan ng isang random na sandali ng demand, o ng isang random na halaga ng demand sa deterministic o random na mga oras.

Ang muling pagdadagdag ng bodega. Ang muling pagdadagdag ng bodega ay maaaring isagawa alinman sa pana-panahon sa ilang mga agwat, o habang ang mga stock ay naubos, i.e. pagbabawas ng mga ito sa isang tiyak na antas.

Dami ng order. Sa kaso ng pana-panahong muling pagdadagdag at hindi sinasadyang pag-ubos ng mga stock, ang dami ng order ay maaaring depende sa estado na sinusunod sa oras ng order. Ang order ay karaniwang isinusumite para sa parehong halaga kapag ang stock ay umabot sa isang naibigay na antas - ang tinatawag na mga puntos ng order.

Oras ng paghatid. Sa idealized na mga modelo ng pamamahala ng imbentaryo, ipinapalagay na ang iniutos na muling pagdadagdag ay inihahatid kaagad sa bodega. Sa ibang mga modelo, ang pagkaantala sa mga paghahatid para sa isang nakapirming o random na pagitan ng oras ay isinasaalang-alang.

Presyo ng padala. Bilang isang patakaran, ipinapalagay na ang halaga ng bawat paghahatid ay binubuo ng dalawang bahagi - isang beses na mga gastos na hindi nakasalalay sa dami ng iniutos na batch, at mga gastos na nakadepende (madalas na linearly) sa dami ng batch.

mga gastos sa imbakan. Sa karamihan ng mga modelo ng pamamahala ng imbentaryo, ang halaga ng imbakan ay itinuturing na halos walang limitasyon, at ang halaga ng nakaimbak na imbentaryo ay ginagamit bilang isang control variable. Kasabay nito, ipinapalagay na ang isang tiyak na bayad ay sinisingil para sa pag-iimbak ng bawat yunit ng stock bawat yunit ng oras.

Deficit penalty. Ang anumang bodega ay nilikha upang maiwasan ang mga kakulangan tiyak na uri mga produkto sa sistema ng serbisyo. Ang kakulangan ng stock sa tamang oras ay humahantong sa mga pagkalugi na nauugnay sa downtime ng kagamitan, hindi regular na produksyon, atbp. Ang mga pagkalugi na ito ay tinatawag depisit na parusa.

stock nomenclature. Sa pinakasimpleng mga kaso, ipinapalagay na ang isang stock ng parehong uri ng mga produkto o isang homogenous na produkto ay nakaimbak sa bodega. Sa mas maraming mahirap na mga kaso isinasaalang-alang stock ng maraming item.

Ang istraktura ng sistema ng bodega. Karamihan sa ganap na binuo mga modelo ng matematika nag-iisa matamis. Gayunpaman, sa pagsasagawa mayroon ding mga mas kumplikadong istruktura: mga hierarchical system ng mga bodega na may iba't ibang mga panahon ng muling pagdadagdag at mga oras ng paghahatid ng order, na may posibilidad ng stock exchange sa pagitan ng mga bodega ng parehong antas ng hierarchy, atbp.

Ang pamantayan para sa pagiging epektibo ng pinagtibay na diskarte sa pamamahala ng imbentaryo ay gastos (gastos) function, kumakatawan sa kabuuang halaga ng pagbibigay ng stocked na produkto, imbakan nito at ang halaga ng mga multa.

Ang pamamahala ng imbentaryo ay binubuo sa paghahanap ng ganoong diskarte para sa muling pagdadagdag at pagkonsumo ng imbentaryo, kung saan ang paggana ng gastos ay tumatagal sa isang minimum na halaga.

Hayaan ang mga function , at ipahayag ayon sa pagkakabanggit:

Restocking,

pagkonsumo ng stock,

Demand para sa stock na produkto

para sa isang yugto ng panahon.

Karaniwang ginagamit ng mga modelo ng pamamahala ng imbentaryo ang mga derivative ng oras ng mga function na ito, , , tinatawag, ayon sa pagkakabanggit,

Ang laro ay tinatawag larong zero sum, o antagonistic, kung ang nakuha ng isa sa mga manlalaro ay katumbas ng pagkawala ng isa pa, i.e. upang makumpleto ang gawain ng laro, ito ay sapat na upang ipahiwatig ang halaga ng isa sa kanila. Kung italaga natin a- manalo ng isa sa mga manlalaro, b ay ang kabayaran ng isa, pagkatapos ay para sa isang zero-sum game b = - a, kaya sapat na upang isaalang-alang, halimbawa, a.

Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay ng mga patakaran ay tinatawag gumalaw manlalaro. Maaaring personal at random ang mga galaw.

personal na galaw- ito ay isang malay na pagpili ng manlalaro ng isa sa mga posibleng aksyon (halimbawa, isang paglipat sa isang laro ng chess).

Random na galaw ay isang random na piniling aksyon (halimbawa, pagpili ng card mula sa isang shuffled deck). Sa aking trabaho, isasaalang-alang ko lamang ang mga personal na galaw ng mga manlalaro.

diskarte Ang isang manlalaro ay tinatawag na isang set ng mga panuntunan na tumutukoy sa pagpili ng kanyang aksyon para sa bawat personal na galaw, depende sa sitwasyon. Karaniwan sa panahon ng laro, sa bawat personal na galaw, ang manlalaro ay gumagawa ng isang pagpipilian depende sa partikular na sitwasyon. Gayunpaman, sa prinsipyo, posible na ang lahat ng mga desisyon ay ginawa ng manlalaro nang maaga (bilang tugon sa anumang naibigay na sitwasyon). Nangangahulugan ito na ang manlalaro ay pumili ng isang tiyak na diskarte, na maaaring ibigay sa anyo ng isang listahan ng mga panuntunan o isang programa. (Kaya maaari mong i-play ang laro gamit ang isang computer). Ang laro ay tinatawag panghuli kung ang bawat manlalaro ay may limitadong bilang ng mga diskarte, at walang katapusan- kung hindi.

Upang malutas ang laro o makahanap ng solusyon sa laro, kinakailangan para sa bawat manlalaro na pumili ng isang diskarte na nakakatugon sa kondisyon. pinakamainam, ibig sabihin. dapat matanggap ng isa sa mga manlalaro maximum na panalo kapag ang pangalawa ay nananatili sa diskarte nito. Kasabay nito, ang pangalawang manlalaro ay dapat magkaroon pinakamababang pagkawala kung ang una ay mananatili sa diskarte nito. ganyan estratehiya tinawag pinakamainam. Ang mga pinakamainam na estratehiya ay dapat ding masiyahan kalagayan ng katatagan, ibig sabihin. hindi dapat kumikita ang sinuman sa mga manlalaro na talikuran ang kanilang diskarte sa larong ito.

Ang Layunin ng Teorya ng Laro: pagtukoy ng pinakamainam na diskarte para sa bawat manlalaro. Kapag pumipili ng pinakamainam na diskarte, natural na ipagpalagay na ang parehong mga manlalaro ay kumikilos nang makatwiran mula sa punto ng view ng kanilang mga interes.

Ang mga antagonistic na laro kung saan ang bawat manlalaro ay may hangganan na hanay ng mga diskarte ay tinatawag matrix laro. Ang pangalang ito ay ipinaliwanag sa pamamagitan ng sumusunod na posibilidad ng paglalarawan ng mga laro ng ganitong uri. Gumagawa kami ng isang hugis-parihaba na talahanayan kung saan ang mga hilera ay tumutugma sa mga diskarte ng unang manlalaro, ang mga haligi ay tumutugma sa mga diskarte ng pangalawa, at ang mga cell ng talahanayan sa intersection ng mga hilera at mga haligi ay tumutugma sa mga sitwasyon ng laro. Kung ilalagay namin ang kabayaran ng unang manlalaro sa kaukulang sitwasyon sa bawat cell, pagkatapos ay makakakuha kami ng isang paglalarawan ng laro sa anyo ng isang tiyak na matrix. Ang matrix na ito ay tinatawag matris ng laro o payoff matrix.

Ang parehong huling antagonistic na laro ay maaaring ilarawan sa pamamagitan ng iba't ibang mga matrice, na naiiba sa bawat isa lamang sa pagkakasunud-sunod ng mga hilera at haligi.

Isaalang-alang ang laro m x n may matrix Р = (a ij), i = 1,2, ... , m; j = 1,2, ... , n at tukuyin ang pinakamahusay sa mga estratehiya A 1, A 2, ..., A m. Pagpili ng diskarte A i manlalaro PERO dapat asahan ang manlalaro SA sasagutin ito ng isa sa mga estratehiya Bj, kung saan ang kabayaran para sa manlalaro PERO minimal (manlalaro SA naghahangad na "manakit" ang manlalaro PERO). Tukuyin ng a i, ang pinakamaliit na kabayaran ng manlalaro PERO kapag pumipili ng isang diskarte A i para sa lahat ng posibleng diskarte ng manlalaro SA(pinakamaliit na numero sa i-th linya ng payoff matrix), i.e.

a i = aij , j = 1,...,n.

Sa lahat ng numero a i (i = 1,2, ... , m ) piliin ang pinakamalaki. Tawagin natin a mas mababang presyo ng laro o ang pinakamataas na kabayaran (maximin). Ito ay isang garantisadong panalo para sa manlalaro. PERO para sa anumang diskarte ng manlalaro SA. Dahil dito, , i = 1,... , m; j = 1,...,n

Ang diskarte na naaayon sa maximin ay tinatawag maximum na diskarte. Manlalaro SA interesadong bawasan ang kabayaran ng manlalaro PERO; pagpili ng diskarte Bj, isinasaalang-alang nito ang pinakamataas na posibleng kabayaran para sa PERO.

Ipahiwatig: β i = aij , i = 1,... , m

Sa lahat ng numero Bj piliin ang pinakamaliit at tawagan β nangungunang presyo ng laro o minimax na kabayaran (minimax). Ito ay isang garantisadong pagkawala para sa manlalaro. SA.

Dahil dito, i = 1,... , m; j = 1,...,n.

Ang minimax na diskarte ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ng pagpili ng pinaka "maingat" na mga diskarte sa minimax at maximin ay tinatawag prinsipyo ng minimax. Ang prinsipyong ito ay sumusunod mula sa makatwirang pagpapalagay na ang bawat manlalaro ay naglalayong makamit ang kabaligtaran na layunin ng kalaban.

Lektura 9 Ang konsepto ng mga modelo ng laro. Payment matrix.

§ 6 ELEMENTO NG TEORYANG LARO

6.1 Ang konsepto ng mga modelo ng laro.

Ang matematikal na modelo ng isang sitwasyon ng salungatan ay tinatawag laro , mga partidong sangkot sa tunggalian mga manlalaro at ang kinalabasan ng tunggalian panalo .

Para sa bawat pormal na laro, ipinakilala namin mga regulasyon , mga. isang sistema ng mga kondisyon na tumutukoy sa: 1) mga opsyon para sa mga aksyon ng mga manlalaro; 2) ang dami ng impormasyon na mayroon ang bawat manlalaro tungkol sa pag-uugali ng mga kasosyo; 3) ang kabayaran kung saan humahantong ang bawat hanay ng mga aksyon. Karaniwan, ang pakinabang (o pagkalugi) ay maaaring mabilang; halimbawa, maaari mong suriin ang isang pagkawala ng zero, isang panalo ng isa, at isang draw ng 1/2. Ang pagbibilang ng mga resulta ng isang laro ay tinatawag pagbabayad .

Ang laro ay tinatawag silid-pasingawan , kung mayroong dalawang manlalaro na kasangkot, at maramihan , kung ang bilang ng mga manlalaro ay higit sa dalawa. Isasaalang-alang lamang namin ang mga ipinares na laro. Sila ay nilalaro ng dalawang manlalaro PERO At SA, na ang mga interes ay kabaligtaran, at ang ibig sabihin ng laro ay isang serye ng mga aksyon sa bahagi ng PERO At SA.

Ang laro ay tinatawag larong zero sum o antagonistic si skoy , kung ang nakuha ng isa sa mga manlalaro ay katumbas ng pagkawala ng isa pa, i.e. ang kabuuan ng mga kabayaran ng parehong partido ay zero. Upang makumpleto ang gawain ng laro, ito ay sapat na upang ipahiwatig ang halaga ng isa sa kanila . Kung italaga natin ngunit- manalo ng isa sa mga manlalaro, b – kabayaran ng isa, pagkatapos ay para sa isang zero-sum game b= –ngunit, kaya sapat na itong isaalang-alang, halimbawa ngunit.

Ang pagpili at pagpapatupad ng isa sa mga aksyon na ibinigay ng mga patakaran ay tinatawag gumalaw manlalaro. Ang mga galaw ay maaaring personal At random . personal na galaw – ito ay isang malay na pagpili ng manlalaro ng isa sa mga posibleng aksyon (halimbawa, isang paglipat sa isang laro ng chess). Ang hanay ng mga posibleng opsyon para sa bawat personal na galaw ay kinokontrol ng mga patakaran ng laro at depende sa kabuuan ng mga nakaraang galaw sa magkabilang panig.

Random na galaw – isa itong random na piniling aksyon (halimbawa, pagpili ng card mula sa isang shuffled deck). Para matukoy sa matematika ang laro, dapat tukuyin ang mga panuntunan ng laro para sa bawat random na galaw pamamahagi ng posibilidad posibleng resulta.

Ang ilang mga laro ay maaaring binubuo lamang ng mga random na galaw (tinatawag na purong laro ng pagkakataon) o ng mga personal na galaw lamang (chess, checkers). Karamihan sa mga laro ng card ay nabibilang sa magkahalong uri ng mga laro, iyon ay, naglalaman ang mga ito ng parehong random at personal na mga galaw. Sa mga sumusunod, isasaalang-alang lamang namin ang mga personal na galaw ng mga manlalaro.

Ang mga laro ay inuri hindi lamang ayon sa likas na katangian ng mga galaw (personal, random), kundi pati na rin sa likas na katangian at dami ng impormasyong magagamit ng bawat manlalaro tungkol sa mga aksyon ng iba. Ang isang espesyal na klase ng mga laro ay ang tinatawag na "mga laro na may kumpletong impormasyon». Isang laro na may kumpletong impormasyon Tinatawag ang isang laro kung saan alam ng bawat manlalaro ang mga resulta ng lahat ng nakaraang galaw, parehong personal at random, sa bawat personal na galaw. Ang mga halimbawa ng mga laro na may perpektong impormasyon ay chess, checkers, at sikat na laro"tic-tac-toe". Karamihan sa mga larong may praktikal na kahalagahan ay hindi kabilang sa klase ng mga laro na may kumpletong impormasyon, dahil ang hindi alam tungkol sa mga aksyon ng kalaban ay kadalasang isang mahalagang elemento ng mga sitwasyon ng salungatan.

Isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto estratehiya .

diskarte Ang isang manlalaro ay tinatawag na isang set ng mga panuntunan na tumutukoy sa pagpili ng kanyang aksyon para sa bawat personal na galaw, depende sa sitwasyon. Karaniwan sa panahon ng laro, sa bawat personal na galaw, ang manlalaro ay gumagawa ng isang pagpipilian depende sa partikular na sitwasyon. Gayunpaman, sa prinsipyo posible na ang lahat ng mga desisyon ay ginawa ng manlalaro nang maaga (bilang tugon sa anumang naibigay na sitwasyon). Nangangahulugan ito na ang manlalaro ay pumili ng isang tiyak na diskarte, na maaaring ibigay sa anyo ng isang listahan ng mga panuntunan o isang programa. (Kaya maaari mong i-play ang laro gamit ang isang computer). Ang laro ay tinatawag panghuli , kung ang bawat manlalaro ay may limitadong bilang ng mga diskarte, at walang katapusan .– kung hindi.

Nang sa gayon lutasin laro , o hanapin desisyon ng laro , kinakailangan para sa bawat manlalaro na pumili ng isang diskarte na nakakatugon sa kondisyon pinakamainam , mga. dapat matanggap ng isa sa mga manlalaro maximum na panalo, kapag ang pangalawa ay dumikit sa kanyang diskarte, Kasabay nito, ang pangalawang manlalaro ay dapat magkaroon pinakamababang pagkawala , kung ang una ay sumunod sa diskarte nito. Ang mga ganitong estratehiya ay tinatawag pinakamainam . Ang pinakamainam na estratehiya ay dapat ding matugunan ang kondisyon Pagpapanatili , mga. hindi dapat kumikita ang sinuman sa mga manlalaro na talikuran ang kanilang diskarte sa larong ito.

Kung ang laro ay paulit-ulit ng sapat na beses, kung gayon ang mga manlalaro ay maaaring hindi interesado na manalo at matalo sa bawat partikular na laro, ngunitaverage na panalo (pagkatalo) sa lahat ng partido.

Ang layunin ng teorya ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

6.2. Payment matrix. Mas mababa at mas mataas na presyo ng laro

Tapusin ang laro kung saan ang manlalaro PERO Mayroon itong T mga diskarte, at ang manlalaro B - p ang mga estratehiya ay tinatawag na laro.

Isaalang-alang ang laro
dalawang manlalaro PERO At SA("kami" at "kalaban").

Hayaan ang manlalaro PERO may T mga personal na estratehiya, na tinutukoy namin
. Hayaan ang manlalaro SA magagamit n personal na mga diskarte, tinutukoy namin ang mga ito
.

Hayaan ang bawat panig na pumili ng isang tiyak na diskarte; para sa atin ito , para sa kalaban . Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte At (
) ang kinalabasan ng laro ay natatanging tinutukoy, ibig sabihin. panalo manlalaro PERO(positibo o negatibo) at pagkatalo
manlalaro SA.

Ipagpalagay natin na ang mga halaga ay kilala sa anumang pares ng mga estratehiya ( ,). Ang matrix
,
, na ang mga elemento ay ang mga kabayaran na naaayon sa mga estratehiya At , tinawag matrix ng pagbabayad o matris ng laro. Ang mga hilera ng matrix na ito ay tumutugma sa mga diskarte ng manlalaro PERO, at ang mga column ay mga diskarte ng manlalaro B. Ang mga estratehiyang ito ay tinatawag na dalisay.

Game Matrix
mukhang:

Isaalang-alang ang laro
may matrix

at tukuyin ang pinakamahusay sa mga estratehiya
. Pagpili ng diskarte , manlalaro PERO dapat asahan ang manlalaro SA sasagutin ito ng isa sa mga estratehiya , kung saan ang kabayaran para sa manlalaro PERO minimal (manlalaro SA naghahangad na "manakit" ang manlalaro A).

Tukuyin ng pinakamababang bayad ng manlalaro PERO kapag pumipili ng isang diskarte para sa lahat ng posibleng diskarte ng manlalaro SA(pinakamaliit na numero sa i-th row ng payoff matrix), i.e.

(1)

Sa lahat ng numero (
) piliin ang pinakamalaki:
.

Tawagin natin
mababang presyo ngra, o maximum na panalo (maxmin). Ito ang garantisadong kabayaran ng player A para sa anumang diskarte ng player B. Dahil dito,

. (2)

Ang diskarte na naaayon sa maximin ay tinatawag diskarte sa maximum . Manlalaro SA interesadong bawasan ang kabayaran ng manlalaro PERO, pagpili ng diskarte , isinasaalang-alang nito ang pinakamataas na posibleng kabayaran para sa PERO. Magpakilala

. (3)

Sa lahat ng numero piliin ang pinakamaliit

at tumawag nangungunang presyo ng laro o minimax na kabayaran (minimax). Ginagarantiyahan ng ego ang pagkawala ng manlalaro B . Samakatuwid,

. (4)

Ang minimax na diskarte ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ng pagpili ng pinaka "maingat" na mga diskarte sa minimax at maximin ay tinatawag prinsipyo ng minimax . Ang prinsipyong ito ay sumusunod mula sa makatwirang pagpapalagay na ang bawat manlalaro ay naglalayong makamit ang kabaligtaran na layunin ng kalaban.

Teorama.Ang mas mababang presyo ng laro ay hindi lalampas sa mataas na presyo ng laro.
.

Kung pareho ang nakatataas at mas mababang presyo ng laro, ang kabuuang halaga ng nakatataas at mas mababang presyo ng laro
tinawag ang netong presyo ng laro, o ang presyo ng laro. Ang mga diskarte sa minimax na naaayon sa presyo ng laro ay pinakamainam na estratehiya , at ang kanilang kabuuan pinakamainam na solusyon o desisyon ng laro. Sa kasong ito ang manlalaro PERO tumatanggap ng pinakamataas na garantisadong (independiyente sa gawi ng manlalaro) SA) panalo v, at ang manlalaro SA nakakamit ang pinakamababang garantisadong (anuman ang pag-uugali ng manlalaro PERO) natatalo v. Ang solusyon sa laro ay sinasabing mayroon Pagpapanatili , mga. kung ang isa sa mga manlalaro ay mananatili sa kanyang pinakamainam na diskarte, kung gayon hindi magiging kapaki-pakinabang para sa isa pa na lumihis mula sa kanyang pinakamainam na diskarte.

Kung ang isa sa mga manlalaro (halimbawa PERO) nananatili sa kanyang pinakamainam na diskarte, at ang iba pang manlalaro (SA) ay lilihis mula sa pinakamainam na diskarte nito sa anumang paraan, kung gayon para sa manlalaro na gumawa ng paglihis, hindi ito kailanman magiging kapaki-pakinabang; tulad ng isang paglihis ng player SA maaaring sa pinakamahusay na iwanan ang pakinabang na hindi nagbabago. at sa pinakamasamang kaso, dagdagan ito.

Sa kabaligtaran, kung SA sumusunod sa pinakamainam na diskarte nito, at PERO lumihis mula sa sarili nito, kung gayon hindi ito maaaring maging kapaki-pakinabang sa anumang paraan PERO.

Isang pares ng mga purong diskarte At nagbibigay ng pinakamainam na solusyon sa laro kung at kung ang kaukulang elemento lamang ay parehong pinakamalaki sa column nito at pinakamaliit sa row nito. Ang ganitong sitwasyon, kung mayroon man, ay tinatawag saddle point. Sa geometry, ang isang punto sa ibabaw na may katangian: sabay-sabay na minimum kasama ang isang coordinate at maximum kasama ang isa, ay tinatawag saddle tuldok, sa pamamagitan ng pagkakatulad ang terminong ito ay ginagamit sa teorya ng laro.

Ang laro kung saan
, tinawag laro ng saddle point. Elemento , na may ganitong katangian, ay isang saddle point ng matrix.

Kaya, para sa bawat laro na may saddle point, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na diskarte para sa magkabilang panig, na naiiba sa mga sumusunod na katangian.

1) Kung ang magkabilang panig ay nananatili sa kanilang pinakamainam na mga diskarte, kung gayon ang average na kabayaran ay katumbas ng netong halaga ng laro v, na parehong mas mababa at mataas na presyo nito.

2) Kung ang isa sa mga partido ay sumunod sa pinakamainam na diskarte nito, habang ang iba ay lumihis mula sa sarili nito, kung gayon ang lumilihis na partido ay maaari lamang matalo mula dito at sa anumang kaso ay hindi maaaring madagdagan ang pakinabang nito.

Ang klase ng mga laro na may saddle point ay may malaking interes kapwa mula sa teoretikal at praktikal na pananaw.

Sa teorya ng laro, pinatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may saddle point, at, dahil dito, ang bawat naturang laro ay may solusyon, ibig sabihin, mayroong isang pares ng pinakamainam na estratehiya para sa isang panig at sa isa pa, na nagbibigay ng isang average na kabayaran na katumbas ng presyo ng laro. Kung ang isang laro na may perpektong impormasyon ay binubuo lamang ng mga personal na galaw, kung gayon, kapag ang bawat panig ay naglapat ng sarili nitong pinakamainam na diskarte, dapat itong palaging magtatapos sa isang tiyak na resulta, ibig sabihin, isang kabayarang eksaktong katumbas ng presyo ng laro.

Pinili ng Editor