Ang konsepto ng mga modelo ng laro. Payment matrix

bahay / Manloloko ng asawa

Isaalang-alang ang isang ipinares na larong may hangganan. Hayaan ang manlalaro PERO may t mga personal na estratehiya, na tinutukoy namin

Hayaan ang manlalaro AT magagamit P personal na mga diskarte, sabihin natin ang mga ito. May dimensyon daw ang laro t X P.

Bilang resulta ng pagpili ng mga manlalaro ng anumang pares ng mga diskarte, ang kinalabasan ng laro ay natatanging tinutukoy, i.e. panalo a;. manlalaro PERO(positibo o negatibo) at pagkatalo (-ay) manlalaro AT. Ipagpalagay natin na ang mga halaga a.. kilala para sa anumang pares ng mga diskarte (A:, B;.). Matrix P =(a..), ako == 1, 2, ..., mj = 1, 2, ..., P, na ang mga elemento ay ang mga kabayaran na naaayon sa mga estratehiya PERO. at bj, tinawag matrix ng pagbabayad, o matris ng laro. Pangkalahatang anyo tulad ng isang matrix ay ipinakita sa Talahanayan. 12.1. Ang mga hilera ng talahanayang ito ay tumutugma sa mga diskarte ng manlalaro PERO, at ang mga column ay mga diskarte ng manlalaro AT.

Talahanayan 12.1

Gumawa tayo ng payoff matrix para sa susunod na laro.

12.1. Laro sa paghahanap.

Manlalaro PERO maaaring magtago sa isa sa dalawang silungan (I at II); manlalaro AT naghahanap ng player PERO, at kung masumpungan niya, tatanggap siya ng multa ng 1 den. mga yunit mula sa PERO, kung hindi ay binabayaran ang manlalaro PERO 1 araw mga yunit Kinakailangang buuin ang payoff matrix ng laro.

D e s h e n i s. Upang i-compile ang payoff matrix, kinakailangan na pag-aralan ang pag-uugali ng bawat isa sa mga manlalaro. Manlalaro PERO maaaring magtago sa kanlungan I – tinutukoy namin ang diskarteng ito sa pamamagitan ng A v alinman sa kanlungan II - diskarte PERO. g Manlalaro AT maaaring hanapin ang unang manlalaro sa shelter I - diskarte AT(o sa kanlungan II - diskarte AT.,. Kung ang manlalaro PERO ay nasa hideout I at natuklasan doon ng player SA, mga. isang pares ng mga estratehiya ang ipinapatupad ν AT{), tapos yung player PERO nagbabayad ng multa, i.e. a n = -1. Katulad nito, nakukuha namin a. n = -1 (PERO 2, AT.,). Malinaw, ang mga estratehiya (A, AT.,) at (R2, /1,) bigyan ang manlalaro PERO panalo 1, kaya a P = a. n = I. Kaya, para sa larong "paghahanap" na may sukat na 2x2, nakukuha namin ang payoff matrix:

Isaalang-alang ang laro t X P may matrix P = a j) , ako = 1,2, ..., τη; j= 1, 2, ..., at at tukuyin ang pinakamahusay sa mga estratehiya PERO sa A v..., PERO m. Pagpili ng isang diskarte A jy player PERO dapat asahan ang manlalaro AT sasagutin ito ng isa sa mga estratehiya AT., kung saan ang kabayaran para sa manlalaro PERO minimal (manlalaro AT naghahangad na "manakit" ang manlalaro PERO).

Tukuyin ng a; pinakamababang bayad ng manlalaro PERO kapag pinili niya ang diskarte L; para sa lahat ng posibleng diskarte ng manlalaro AT(pinakamaliit na numero sa i-ika linya payoff matrix), i.e.

Sa lahat ng numero a (r = 1,2,..., t) piliin ang pinakamalaki: . Tawagin natin at ang mas mababang presyo ng laro, o maximum na kabayaran (maximin). Ito ay Garantiyang kabayaran ng manlalaro A para sa anumang diskarte ng manlalaro B. Kaya naman,

(12.2)

Ang diskarte na naaayon sa maximin ay tinatawag diskarte sa maximum. Manlalaro AT interesadong bawasan ang kabayaran ng manlalaro NGUNIT; pagpili ng diskarte AT., isinasaalang-alang nito ang pinakamataas na posibleng kabayaran para sa PERO. Magpakilala

Sa lahat ng numero β. piliin ang pinakamaliit

at tawagan si β nangungunang presyo ng laro, o minimax na kabayaran (minimax). Ito ay garantisadong pagkawala ng manlalaro B. Kaya naman,

(12.4)

Ang minimax na diskarte ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ng pagpili ng pinaka "maingat" na mga diskarte sa minimax at maximin ay tinatawag na prinsipyo minimax. Ang prinsipyong ito ay sumusunod mula sa makatwirang pagpapalagay na ang bawat manlalaro ay naglalayong makamit ang kabaligtaran na layunin ng kalaban. Alamin natin ang mas mababa at matataas na presyo ng laro at ang mga kaukulang estratehiya sa Problema 12.1. Isaalang-alang ang payoff matrix

mula sa problema 12.1. Kapag pumipili ng diskarte A, (ang unang hilera ng matrix), ang minimum na kabayaran ay katumbas ng a, =min(-l; 1) = -1 at tumutugma sa diskarte β1 ng manlalaro AT. Kapag pumipili ng isang diskarte L 2 (pangalawang hilera ng matrix) ang pinakamababang kabayaran ay a 2 = min(l; -1) = -1, ito ay nakakamit gamit ang diskarte AT.,.

Ginagarantiya ang iyong sarili maximum na panalo para sa anumang diskarte ng manlalaro AT, ibig sabihin. ang mas mababang presyo ng laro a = max(a, a2) = max(-l; -1) = -1, player PERO maaaring pumili ng anumang diskarte: Aj o PERO 2, ibig sabihin. kahit anong diskarte niya ay maximin.

Pagpili ng diskarte B, (hanay 1), ang manlalaro AT naiintindihan na ang player PERO ay tutugon sa isang diskarte PERO 2 upang i-maximize ang iyong pakinabang (pagkawala AT). Samakatuwid, ang pinakamataas na pagkawala ng manlalaro AT kapag pinili niya ang diskarte B, ay katumbas ng β, = max(-1; 1) = 1.

Katulad nito, ang maximum na pagkawala ng player B (gain PERO) kapag pinili niya ang diskarte B2 (column 2) ay katumbas ng β2 = max(l; -1) = 1.

Kaya, para sa anumang diskarte ng player PERO ang garantisadong minimum na pagkawala ng player B ay katumbas ng β = πιίη(β1, β2) = min(l; 1) = 1- ang pinakamataas na presyo ng laro.

Ang anumang diskarte ng player B ay minimax. Sa pamamagitan ng pagdaragdag ng Table. 12.1 linya β; at column a;, nakukuha namin ang table. 12.2. Sa intersection ng mga karagdagang row at column, ire-record namin ang nakatataas at mas mababang presyo ng mga laro.

Talahanayan 12.2

Sa Problema 12.1 sa itaas, ang itaas at mas mababang gastos ng laro ay iba: isang f β.

Kung ang itaas at mas mababang mga presyo ng laro ay pareho, kung gayon pangkalahatang kahulugan tuktok at Mas mababang presyo laro α = β = υ ay tinatawag ang netong presyo ng laro, o ang presyo ng laro. Ang mga diskarte sa minimax na naaayon sa presyo ng laro ay pinakamainam na estratehiya at ang kanilang kabuuan ang pinakamainam na solusyon o desisyon mga laro. Sa kasong ito ang manlalaro PERO tumatanggap ng pinakamataas na garantisadong (independiyente sa gawi ng manlalaro) AT) ang kabayaran ay υ, at ang manlalaro AT nakakamit ang minimum na garantisadong (anuman ang pag-uugali ng player L) pagkawala υ. Ang solusyon sa laro ay sinasabing mayroon katatagan, mga. kung ang isa sa mga manlalaro ay mananatili sa kanyang pinakamainam na diskarte, kung gayon hindi magiging kapaki-pakinabang para sa isa pa na lumihis mula sa kanyang pinakamainam na diskarte.

Magpares puro diskarte PERO. at B. ay nagbibigay ng pinakamainam na solusyon sa laro kung at kung ang katumbas na elemento r ay parehong pinakamalaki sa column nito at pinakamaliit sa row nito. Ang ganitong sitwasyon, kung mayroon man, ay tinatawag saddle point(katulad ng ibabaw ng isang saddle, na kumukurba pataas sa isang direksyon at pababa sa kabilang direksyon).

Magpakilala PERO* at AT* ay isang pares ng mga purong diskarte kung saan ang solusyon ng laro sa problema na may saddle point ay nakakamit. Ipakilala natin ang payoff function ng unang manlalaro sa bawat pares ng mga diskarte: P(A:, AT-) = at sa. Pagkatapos ang kondisyon ng pinakamainam sa saddle point ay nakakatugon sa dobleng hindi pagkakapantay-pantay: P(Aj, B*)<Р(А*, В*)<Р(А", В ), na totoo para sa lahat ako = 1, 2, ..., m;j = 1, 2, ..., P. Sa katunayan, ang pagpili ng diskarte PERO* ang unang manlalaro sa ilalim ng pinakamainam na diskarte SA" pinalaki ng pangalawang manlalaro ang pinakamababang posibleng kabayaran: P(A*, B")> P(A G AT"), at ang pagpili ng diskarte B" ang pangalawang manlalaro, na may pinakamainam na diskarte ng una, ay pinapaliit ang pinakamataas na pagkawala: P(D , AT*)<Р(А", В).

12.2. Tukuyin ang mas mababa at mataas na presyo ng laro na ibinigay ng payoff matrix

May saddle point ba ang laro?

Talahanayan 12 3

Desisyon. Ang lahat ng mga kalkulasyon ay maginhawang isinasagawa sa isang talahanayan kung saan, bilang karagdagan sa matrix R, ipinasok ang column a; at linya)

© 2022 skudelnica.ru -- Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway