Puro mga laro sa diskarte. Halo-halong diskarte

pangunahing / Dating

halo-halong diskarte sa teorya ng laro

Halo-halong diskarte

Kung sa isang matrix na laro walang point ng siyahan sa purong mga diskarte, kung gayon ang mas mataas at mas mababang presyo ng laro ay matatagpuan. Ipinakita nila na ang manlalaro 1 ay hindi makakatanggap ng isang panalo na lumampas sa mas mataas na presyo ng laro, at ang manlalaro 1 ay ginagarantiyahan ng isang panalo na hindi mas mababa sa mas mababang presyo ng laro.

Ang halo-halong diskarte ng manlalaro ay isang kumpletong hanay ng kanyang purong diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kundisyon na may naibigay na mga posibilidad. Ibuod natin kung ano ang nasabi at ilista ang mga kundisyon para sa paggamit ng magkahalong diskarte:

  • * maglaro nang walang saddle point;
  • * Ang mga manlalaro ay gumagamit ng isang random na halo ng mga purong diskarte na may naibigay na posibilidad;
  • * Ang laro ay paulit-ulit na maraming beses sa mga katulad na kondisyon;
  • * sa bawat isa sa mga gumagalaw, walang manlalaro ang may kaalaman tungkol sa pagpili ng diskarte ng isa pang manlalaro;
  • * Pinapayagan ang pag-average ng mga resulta ng laro.

Ang sumusunod na notasyon para sa halo-halong mga diskarte ay ginagamit.

Para sa manlalaro 1, isang halo-halong diskarte na binubuo sa paglalapat ng mga purong diskarte A 1, A 2, ..., A m na may kaukulang mga posibilidad na p 1, p 2, ..., p m.

Para sa player 2

ang q j ay ang posibilidad na mailapat ang purong diskarte B j.

Sa kaso kapag р i \u003d 1, para sa player 1 mayroon kaming isang purong diskarte

Ang puro diskarte ng manlalaro ang posible hindi pantay-pantay na mga kaganapan... Sa isang matrix game, alam ang matrix A (nalalapat ito sa parehong manlalaro 1 at manlalaro 2), matutukoy ito para sa ibinigay na mga vector at ang average na kabayaran ( inaasahang halaga epekto) ng player 1:

kung saan at ang mga vector;

p i at q ako ay mga bahagi ng mga vector.

Sa pamamagitan ng paglalapat ng kanyang halo-halong mga diskarte, hinahangad ng manlalaro 1 na i-maximize ang kanyang average na kabayaran, at ang manlalaro 2 - upang dalhin ang epektong ito sa pinakamaliit na posibleng halaga. Ang Player 1 ay naglalayong makamit

Tinitiyak ng Player 2 na natutugunan ang kundisyon

Ipaalam din sa amin ang mga vector na naaayon sa pinakamainam na halo-halong mga diskarte ng mga manlalaro 1 at 2, i. tulad ng mga vector at kung saan ang pagkakapantay-pantay

Ang presyo ng laro ay ang average na kabayaran ng manlalaro 1 kapag ang parehong mga manlalaro ay gumagamit ng magkakahalong diskarte. Samakatuwid, ang solusyon sa larong matrix ay:

  • - pinakamainam na halo-halong diskarte ng player 1;
  • - pinakamainam na halo-halong diskarte ng player 2;

Ang presyo ng laro.

Halo-halong diskarte ay magiging pinakamainam (at) kung bumubuo sila ng isang saddle point para sa pagpapaandar ibig sabihin

Mayroong pangunahing teorya para sa mga larong matematika.

Para sa isang matrix game na may anumang matrix A, ang dami

umiiral at pantay sa bawat isa: \u003d \u003d.

Dapat pansinin na kapag pumipili ng pinakamainam na mga diskarte, ang manlalaro 1 ay palaging garantisadong isang average na kabayaran, hindi mas mababa sa presyo ng laro, para sa anumang nakapirming diskarte ng player 2 (at, sa kabaligtaran, para sa manlalaro 2). Ang mga aktibong diskarte ng mga manlalaro 1 at 2 ay ang mga diskarte na kasama sa pinakamainam na halo-halong mga diskarte ng kaukulang mga manlalaro na may mga probabilidad na hindi non-zero. Nangangahulugan ito na ang komposisyon ng pinakamainam na halo-halong mga diskarte ng mga manlalaro ay maaaring hindi isama ang lahat ng kanilang mga a priori tinukoy na diskarte.

Ang paglutas ng laro ay nangangahulugang paghahanap ng presyo ng laro at ang pinakamainam na mga diskarte. Sisimulan namin ang aming pagsasaalang-alang ng mga pamamaraan para sa paghahanap ng pinakamainam na magkahalong diskarte para sa mga laro ng matrix na may pinakasimpleng larawang inilarawan ng matrix 22. Ang mga laro ng saddle point ay hindi espesyal na isasaalang-alang. Kung nakuha ang isang punto ng siyahan, pagkatapos ay nangangahulugan ito na mayroong mga hindi kapaki-pakinabang na diskarte na dapat iwanang. Sa kawalan ng isang saddle point, maaaring makuha ang dalawang pinakamainam na magkahalong diskarte. Tulad ng nabanggit, ang magkahalong diskarte na ito ay nakasulat nang ganito:

Nangangahulugan ito na mayroong isang matrix sa pagbabayad

isang 11 p 1 + a 21 p 2 \u003d; (1.16)

isang 12 p 1 + a 22 p 2 \u003d; (1.17)

p 1 + p 2 \u003d 1. (1.18)

isang 11 p 1 + a 21 (1 - p 1) \u003d a 12 p 1 + a 22 (1 - p 1); (1.19)

isang 11 p 1 + a 21 - a 21 p 1 \u003d a 12 p 1 + a 22 - a 22 p 1, (1.20)

saan natin nakuha ang pinakamainam na mga halaga at:

Alam at, nakita natin:

Pagkalkula, nakita namin at:

isang 11 q 1 + a 12 q 2 \u003d; q 1 + q 2 \u003d 1; (1.24)

isang 11 q 1 + a 12 (1 - q 1) \u003d. (1.25)

para sa isang 11 a 12. (1.26)

Nalutas ang problema, dahil ang mga vector at ang presyo ng laro ay natagpuan. Ang pagkakaroon ng matrix ng mga pagbabayad A, posible na malutas ang problema nang grapiko. Sa pamamaraang ito, ang solusyon sa algorithm ay napaka-simple (Larawan 2.1).

  • 1. Ang isang segment ng haba ng yunit ay naka-plot kasama ang abscissa axis.
  • 2. Ang ordinate ay ang mga panalo para sa diskarte A 1.
  • 3. Sa isang linya na parallel sa ordinate axis, sa puntong 1, ang mga panalo ay naka-plot para sa diskarte ng 2.
  • 4. Ang mga dulo ng mga segment ay itinalaga para sa isang 11 -b 11, isang 12 -b 21, isang 22 -b 22, isang 21 -b 12 at dalawang tuwid na linya b 11 b 12 at b 21 b 22 ay iginuhit.
  • 5. Ang ordenado ng punto ng intersection sa ay natutukoy. Ito ay pantay. Ang abscissa ng point c ay katumbas ng p 2 (p 1 \u003d 1 - p 2).

Fig. 1.1.

Ang pamamaraang ito ay may isang malawak na malawak na lugar ng aplikasyon. Ito ay batay sa karaniwang ari-arian mga laro mn, na binubuo sa ang katunayan na sa anumang mga laro mn bawat manlalaro ay may isang optimal na halo-halong diskarte kung saan ang bilang ng mga purong diskarte ay hindi hihigit sa (m, n). Mula sa pag-aari na ito, maaaring makakuha ang isang kilalang kinahinatnan: sa anumang laro 2n at m2, ang bawat pinakamainam na diskarte ay naglalaman ng higit sa dalawang aktibong diskarte. Nangangahulugan ito na ang anumang mga laro 2n at m2 ay maaaring mabawasan sa laro 22. Samakatuwid, ang mga laro 2n at m2 ay maaaring lutasin nang grapiko. Kung ang matrix ng isang may hangganan na laro ay may dimensyon mn, kung saan ang m\u003e 2 at n\u003e 2, kung gayon ang linear na programa ay ginagamit upang matukoy ang pinakamainam na halo-halong mga diskarte.

Puro diskarte Ang Player I ay pipili ng isa sa mga n hilera ng payoff matrix A, at ang dalisay na diskarte ng manlalaro II ay ang pagpili ng isa sa mga haligi ng parehong matrix.

Optimal malinis na diskarte ang mga manlalaro ay naiiba mula sa halo-halong mga manlalaro sa pagkakaroon ng isang ipinag-uutos na yunit p i \u003d 1, q i \u003d 1. Halimbawa: P (1,0), Q (1,0). Dito p 1 \u003d 1, q 1 \u003d 1.

Suliranin 1
Gamit ang matrix sa pagbabayad, hanapin ang pinakamainam na malinis na mga diskarte gamit ang prinsipyo ng mahigpit na pangingibabaw. Bilang isang sagot, isulat ang mga vector na P *, Q *.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Desisyon:

Malulutas namin ang lahat ng mga problema sa paggamit ng calculator ng Matrix Game.

Ipinapalagay namin na ang manlalaro ay pipiliin ko ang kanyang diskarte upang makuha ang kanyang maximum na kabayaran, at pipiliin ng manlalaro II ang kanyang diskarte upang mabawasan ang kabayaran ng manlalaro I.

Mga manlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 13 1 2 5 1
A 22 0 0 3 0
Isang 3-3 -5 -5 -2 -5
Isang 40 -2 -2 1 -2
b \u003d max (B i)3 1 2 5
Natagpuan namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng larong a \u003d max (a i) \u003d 1, na nagsasaad ng maximum na purong diskarte A 1.
Ang pinakamataas na presyo ng laro ay b \u003d min (b j) \u003d 1.
Ang saddle point (1, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A1, B2). Ang presyo ng laro ay 1.
2. Suriin ang payout matrix para sa mga nangingibabaw na hilera at nangingibabaw na mga haligi.
Minsan, batay sa isang simpleng pagsasaalang-alang sa matrix ng laro, masasabi nating ang ilang mga dalisay na diskarte ay maaaring ipasok lamang ang pinakamainam na halo-halong diskarte na may zero probabilidad.
Sabi nila i-ika nangingibabaw sa kanya ang diskarte ng 1st player k-th diskarte kung ang isang ij ≥ isang kj para sa lahat j E N at para sa kahit isang j isang ij\u003e isang kj. Sa kasong ito, sinabi din na i-ika diskarte (o linya) - nangingibabaw, k-th - pinangungunahan.
Sabi nila j-th Ang diskarte ng 2nd player ay nangingibabaw sa kanya l-th diskarte kung para sa lahat j E M isang ij ≤ a il at para sa kahit isang i a ij< a il . В этом случае j-th ang diskarte (haligi) ay tinatawag na nangingibabaw, l-th - pinangungunahan.
Diskarte A 1 nangingibabaw diskarte A 2 (lahat ng mga elemento ng hilera 1 ay mas malaki kaysa o katumbas ng mga halaga ng ika-2 hilera), samakatuwid, ibinubukod namin ang ika-2 hilera ng matrix. Probabilidad p 2 \u003d 0.
Diskarte A 1 nangingibabaw diskarte A 3 (lahat ng mga elemento ng hilera 1 ay mas malaki kaysa o katumbas ng mga halaga ng ika-3 hilera), samakatuwid, ibinubukod namin ang ika-3 hilera ng matrix. Probabilidad p 3 \u003d 0.
3 1 2 5
0 -2 -2 1

Mula sa posisyon ng pagkalugi ng manlalaro B, ang diskarte B 1 ay nangingibabaw sa diskarte B 2 (lahat ng mga elemento ng haligi 1 mas maraming item haligi 2), samakatuwid ay ibinubukod namin ang ika-1 haligi ng matrix. Probabilidad q 1 \u003d 0.
Mula sa posisyon ng pagkalugi ng manlalaro B, ang diskarte B 4 ay nangingibabaw sa diskarte B 1 (lahat ng mga elemento ng haligi 4 ay mas malaki kaysa sa mga elemento ng haligi 1), samakatuwid, ibinubukod namin ang ika-4 na haligi ng matrix. Probabilidad q 4 \u003d 0.
1 2
-2 -2

Nabawasan namin ang isang 4 x 4 na laro sa isang 2 x 2 na laro.



Solusyon sa laro ( 2 x n


p 1 \u003d 1
p 2 \u003d 0
Presyo ng laro, y \u003d 1
Ngayon mahahanap natin ang diskarte ng minimax ng manlalaro B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation
q 1 \u003d 1
q 1 + q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 1 \u003d 1.
Sagot:
Presyo ng laro: y \u003d 1, mga vector vector ng diskarte ng mga manlalaro:
Q (1,0), P (1,0)

∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (1 1) + (2 0) \u003d 1 \u003d v
M (P 2; Q) \u003d (-2 1) + (-2 0) \u003d -2 ≤ v
M (P; Q 1) \u003d (1 1) + (-2 0) \u003d 1 \u003d v
M (P; Q 2) \u003d (2 1) + (-2 0) \u003d 2 ≥ v

Dahil ang mga hilera at haligi ay inalis mula sa orihinal na matrix, ang mga nahanap na posibilidad ng vector ay maaaring isulat bilang:
P (1,0,0,0)
Q (0,1,0,0)

Gawain 2
Hanapin ang mas mababa at mas mataas na mga presyo ng laro gamit ang matrix sa pagbabayad. Sa pagkakaroon ng isang saddle point, isulat ang mga vector ng pinakamainam na purong diskarte na P *, Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, isusulat namin ang solusyon sa laro sa purong diskarte.
Mga manlalaroB 1B 2B 3a \u003d min (A i)
Isang 1-6 -5 0 -6
A 2-8 -3 -2 -8
Isang 3-3 -2 3 -3
b \u003d max (B i)-3 -2 3

Natagpuan namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng larong a \u003d max (a i) \u003d -3, na nagsasaad ng maximum na purong diskarte A 3.
Ang pinakamataas na presyo ng laro ay b \u003d min (b j) \u003d -3.
Ang saddle point (3, 1) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A3, B1). Ang presyo ng laro ay -3.
Sagot: P (0,0,1), Q (1,0,0)

Suliranin 3
Maghanap ng mga vector ng pinakamainam na diskarte na P *, Q * at ang presyo ng laro gamit ang matrix sa pagbabayad. Sinong manlalaro ang nagwagi?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, isusulat namin ang solusyon sa laro sa purong diskarte.
Ipinapalagay namin na ang manlalaro ay pipiliin ko ang kanyang diskarte upang makuha ang kanyang maximum na kabayaran, at pipiliin ng manlalaro II ang kanyang diskarte upang mabawasan ang kabayaran ng manlalaro I.
Mga manlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b \u003d max (B i)2 -2 7 4

Natagpuan namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng larong a \u003d max (a i) \u003d -2, na nagsasaad ng maximum na purong diskarte A 2.
Ang pinakamataas na presyo ng laro ay b \u003d min (b j) \u003d -2.
Ang saddle point (2, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A2, B2). Ang presyo ng laro ay -2.
3. Hanapin ang solusyon sa laro sa magkahalong diskarte.
Malutas natin ang problema sa pamamagitan ng pamamaraang geometriko, na kasama ang mga sumusunod na hakbang:
1. Sa sistemang coordinate ng Cartesian, isang segment ang naka-plot kasama ang axis ng abscissa, ang haba nito ay 1. Ang kaliwang dulo ng segment (point x \u003d 0) ay tumutugma sa diskarte A 1, ang tamang isa - sa diskarte Isang 2 (x \u003d 1). Ang mga panloob na puntos na x ay tumutugma sa mga posibilidad ng ilang magkakahalong diskarte S 1 \u003d (p 1, p 2).
2. Ang mga panalo ng diskarte A 1 ay naka-plot sa kaliwang ordinate axis. Sa isang linya na parallel sa ordinate axis, mula sa puntong 1, ang mga panalo ng diskarte A 2 ay naka-plot.
Solusyon sa laro ( 2 x n) ay isinasagawa mula sa posisyon ng player A adhering to the maximin diskarte. Wala sa mga manlalaro ang may nangingibabaw at dobleng diskarte.

Ang maximum na pinakamainam na diskarte ng manlalaro A ay tumutugma sa punto N, kung saan maaaring maisulat ang sumusunod na sistema ng mga equation:
p 1 \u003d 0
p 2 \u003d 1
Presyo ng laro, y \u003d -2
Ngayon ay mahahanap natin ang diskarte ng minimax ng manlalaro B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation, hindi kasama ang diskarte B 1, B 3, B 4, na malinaw na nagbibigay ng mas malaking pagkawala sa manlalaro B, at, samakatuwid, q 1 \u003d 0, q 3 \u003d 0, q 4 \u003d 0 ...
-2q 2 \u003d -2
q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 2 \u003d 1.
Sagot:
Presyo ng laro: y \u003d -2, mga diskarte ng vector ng mga manlalaro:
Q (0, 1, 0, 0), P (0, 1)
4. Suriin natin ang kawastuhan ng solusyon sa laro gamit ang pamantayan sa pagiging epektibo ng diskarte.
∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (-6 0) + (-6 1) + (2 0) + (4 0) \u003d -6 ≤ v
M (P 2; Q) \u003d (2 0) + (-2 1) + (7 0) + (-1 0) \u003d -2 \u003d v
M (P; Q 1) \u003d (-6 0) + (2 1) \u003d 2 ≥ v
M (P; Q 2) \u003d (-6 0) + (-2 1) \u003d -2 \u003d v
M (P; Q 3) \u003d (2 0) + (7 1) \u003d 7 ≥ v
M (P; Q 4) \u003d (4 0) + (-1 1) \u003d -1 ≥ v
Ang lahat ng mga hindi pagkakapantay-pantay ay nasiyahan bilang mga pagkakapantay-pantay o mahigpit na hindi pagkakapantay-pantay, samakatuwid, ang solusyon sa laro ay matatagpuan nang tama.

Suliranin 4
Magbigay ng detalyadong sagot sa tanong

5. TEorya NG GAMES AT STATISTICAL SOLUTIONS

5.1. Zero-sum matrix game

Isinasagawa ang pagmomodelo sa ekonomiya at matematika sa mga sumusunod na kundisyon:

Mga katiyakan;

Walang katiyakan.

Pagmomodelo sa mga kondisyon ng katiyakan Ipinapalagay ang pagkakaroon ng lahat ng kinakailangang paunang data ng normative (pagmomodelo ng matrix, pagpaplano ng network at pamamahala).

Pagmomodelo nanganganib ay isinasagawa sa stochastic kawalang-katiyakan, kapag ang mga halaga ng ilang paunang data ay random at ang mga batas sa pamamahagi ng posibilidad ng mga random na variable na ito ay kilala (pagsusuri sa pag-urong, teorya ng pila).

Pagmomodelo sa harap ng kawalan ng katiyakan naaayon sa kumpletong kawalan ilan sa mga kinakailangang data para dito (teorya ng laro).

Ang mga modelo ng matematika para sa paggawa ng pinakamainam na mga desisyon sa mga sitwasyon ng salungatan ay binuo sa ilalim ng mga kundisyon ng kawalan ng katiyakan.

Sa teorya ng laro, ginagamit ang mga sumusunod na pangunahing konsepto:

Diskarte;

Panalong pag-andar.

Sa pamamagitan ng kurso tatawagan namin ang pagpipilian at pagpapatupad ng manlalaro ng isa sa mga aksyon na inilaan ng mga patakaran ng laro.

Diskarte ay isang teknolohiya para sa pagpili ng isang kurso ng aksyon sa bawat paglipat, depende sa kasalukuyang sitwasyon.

Panalong pag-andar naghahatid upang matukoy ang halaga ng pagbabayad ng natalo na manlalaro sa nanalong isa.

Sa isang matrix na laro, ang pagpapaandar na bayad ay kinakatawan bilang bayad sa matrix :

nasaan ang halaga ng pagbabayad sa manlalaro I, na pumili ng paglipat, mula sa manlalaro II, na pumili ng paglipat.

Sa gayong pares ng laro, ang mga halaga ng mga pagpapaandar ng kabayaran ng parehong mga manlalaro sa bawat sitwasyon ay pantay-pantay sa lakas at kabaligtaran sa pag-sign, ibig sabihin at ang larong ito ay tinawag zero sum .

Ang proseso ng "paglalaro ng matrix game" ay kinakatawan bilang mga sumusunod:

Nakatakda ang pagbabayad matrix;

Ang manlalaro I, nang nakapag-iisa ng manlalaro II, ay pipili ng isa sa mga hilera ng matrix na ito, halimbawa, ang ika;

Ang Player II, anuman ang manlalaro I, ay pipili ng isa sa mga haligi ng matrix na ito, halimbawa, - ika;

Tinutukoy ng elemento ng matrix kung magkano ang matatanggap kong manlalaro mula sa manlalaro II. Siyempre, kung, kung gayon dumating na tungkol sa tunay na pagkawala ng manlalaro I.

Ang isang antagonistic na pares na laro na may isang payoff matrix ay tatawaging isang laro.

Halimbawa

Isaalang-alang ang laro.

Nakatakda ang pagbabayad matrix:

.

Hayaan ang manlalaro I, nang nakapag-iisa ng manlalaro II, piliin ang pangatlong hilera ng matrix na ito, at ang manlalaro II, nang nakapag-iisa ng manlalaro I, piliin ang pangalawang haligi ng matrix na ito:

Pagkatapos ang manlalaro ay makakatanggap ako ng 9 na yunit mula sa manlalaro II.

5.2. Pinakamainam na malinis na diskarte sa isang matrix game

Pinakamainam na diskarte ay isang diskarte ng manlalaro I tulad na hindi niya binawasan ang kanyang nakuha para sa anumang pagpipilian ng diskarte ng manlalaro II, at isang diskarte ng manlalaro II na hindi niya nadagdagan ang kanyang pagkawala para sa anumang pagpipilian ng diskarte ng manlalaro I.

Ang pagpili ng hilera ng pagbabayad matrix bilang kanyang paglipat, player Tinitiyak ko ang kanyang sarili ng isang makakuha ng hindi bababa sa ang halaga sa pinakamasamang kaso, kapag sinusubukan ng manlalaro II na i-minimize ang halagang ito. Samakatuwid, pipiliin ko ang player ng tulad ng isang ika-hilera na magbibigay sa kanya maximum na panalo:

.

Ang Player II ay nag-iisip sa katulad na paraan at tiyak na masisiguro ang kanyang sarili ng kaunting pagkawala:

.

Ang hindi pagkakapantay-pantay ay laging totoo:

Ang dami ng tinawag ang ibabang presyo ng laro .

Ang dami ng tinawag ang nangungunang presyo ng laro .

Ang pinakamainam na mga diskarte ay tinatawag malinis kung nasiyahan nila ang mga pagkakapantay-pantay:

,

.

Ang dami ng tinawag ang purong presyo ng laro , kung ang .

Pinakamainam na purong diskarte at form saddle point bayad sa matrix.

Para sa punto ng siyahan, natutugunan ang mga sumusunod na kundisyon:

iyon ay, ang elemento ay ang pinakamaliit sa hilera at ang pinakamalaki sa haligi.

Kaya, kung ang payoff matrix ay mayroon saddle point pagkatapos ay maaari kang makahanap pinakamainam na malinis na diskarte mga manlalaro

Ang dalisay na diskarte ng manlalaro Maaari akong mailahad ng isang nakaayos na hanay ng mga numero (vector), kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa lugar na ika, na katumbas ng isa.

Ang purong diskarte ng Player II ay maaaring kinatawan ng isang nakaayos na hanay ng mga numero (vector) kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa lugar na ika, na katumbas ng isa.

Halimbawa

.

Sa pamamagitan ng pagpili bilang isang paglipat ng anumang hilera ng pagbabayad matrix, tinitiyak ko ang kanyang sarili sa isang pinakamasamang kaso na kabayaran na hindi bababa sa halaga sa haligi na ipinahiwatig ng:

Samakatuwid, ang manlalaro pipiliin ko ang ika-2 hilera ng payoff matrix, na nagbibigay sa kanya ng maximum na kabayaran nang walang alintana ang paglipat ng manlalaro II, na susubukan na i-minimize ang halagang ito:

Ang Player II ay nag-iisip nang katulad at pipiliin ang ika-1 haligi bilang kanyang paglipat:

Sa gayon, mayroong isang saddle point ng matrix sa pagbabayad:

naaayon sa pinakamainam na purong diskarte para sa manlalaro I at para sa manlalaro II, kung saan ang manlalaro ay hindi ko binawasan ang kanyang nakuha para sa anumang pagbabago sa diskarte ng manlalaro II at ang manlalaro II ay hindi nagdaragdag ng kanyang pagkawala para sa anumang pagbabago sa diskarte ng manlalaro I.

5.3. Pinakamainam na halo-halong diskarte sa isang matrix game

Kung ang payoff matrix ay walang saddle point, hindi makatuwiran para sa sinumang manlalaro na gumamit ng isang purong diskarte. Mas kapaki-pakinabang ang paggamit "mga probabilistic na halo" puro diskarte. Pagkatapos, ang magkahalong mga diskarte ay natutukoy bilang pinakamainam na mga.

Halo-halong diskarte ang manlalaro ay nailalarawan sa pamamahagi ng posibilidad ng isang random na kaganapan na binubuo sa pagpili ng paglipat ng manlalaro.

Ang magkahalong diskarte ng manlalaro I ay isang order ng hanay ng mga numero (vector) na nagbibigay-kasiyahan sa dalawang kundisyon:

1) para, ibig sabihin, ang posibilidad ng pagpili ng bawat hilera ng matrix sa pagbabayad ay hindi negatibo;

2), ibig sabihin, ang pagpipilian ng bawat isa sa mga hilera ng matrix sa pagbabayad sa pinagsamang kinakatawan buong pangkat mga pangyayari

Ang halo-halong diskarte ng Player II ay isang order ng hanay ng mga numero (vector) nagbibigay-kasiyahan sa mga kundisyon:

Halaga ng pagbabayad sa manlalaro I, na pumili ng magkahalong diskarte

mula sa manlalaro II na pumili ng isang magkahalong diskarte

,

kumakatawan sa average

.

Optimal tinawag na magkahalong diskarte

at ,

kung para sa anumang di-makatwirang halo-halong mga diskarte at kundisyon ay nasiyahan:

iyon ay, sa ilalim ng pinakamainam na halo-halong diskarte, ang kabayaran ng manlalaro I ang pinakamalaking, at ang pagkawala ng manlalaro II ay ang pinakamaliit.

Kung walang punto ng siyahan sa bayad na matrix, kung gayon

,

ibig sabihin, mayroong isang positibong pagkakaiba ( hindi inilaang pagkakaiba )

- ³ 0,

at mga manlalaro ay kailangang maghanap ng mga karagdagang pagkakataon upang tiwala na makakuha ng isang malaking bahagi ng pagkakaiba na ito sa kanilang pabor.

Halimbawa

Isaalang-alang ang laro na ibinigay ng payoff matrix:

.

Tukuyin kung mayroong isang saddle point:

, .

Ito ay lumabas na walang saddle point sa payoff matrix at ang hindi nakalaan na pagkakaiba ay katumbas ng:

.

5.4. Paghahanap ng Pinakamainam na Pinagsama-samang Diskarte

para sa mga laro 2 × 2

Ang pagpapasiya ng pinakamainam na halo-halong mga diskarte para sa payoff matrix ng sukat ay isinasagawa ng pamamaraan ng paghahanap ng mga pinakamabuting kalagayan na puntos ng isang pagpapaandar ng dalawang variable.

Hayaan ang posibilidad ng manlalaro na pipiliin ko ang unang hilera ng matrix sa pagbabayad

ay pantay. Pagkatapos ang posibilidad na piliin ang pangalawang hilera ay.

Hayaan ang posibilidad ng pagpili ng manlalaro II na katumbas ng. Pagkatapos ang posibilidad na piliin ang pangalawang haligi ay.

Ang halaga ng pagbabayad sa manlalaro I ng manlalaro II ay katumbas ng:

Ang matinding halaga ng nakuha ng manlalaro I at ang pagkawala ng manlalaro II ay tumutugma sa mga kundisyon:

;

.

Kaya, ang pinakamainam na halo-halong mga diskarte ng mga manlalaro I at II ay, ayon sa pagkakabanggit, pantay-pantay:

5.5. Geometric solution ng mga laro 2 ×n

Sa isang pagtaas sa sukat ng payoff matrix mula sa, hindi na posible na bawasan ang pagpapasiya ng pinakamainam na halo-halong mga diskarte sa paghahanap ng pinakamabuting kalagayan ng isang pagpapaandar ng dalawang variable. Gayunpaman, dahil sa isa sa mga manlalaro ay may dalawang diskarte lamang, maaaring magamit ang isang solusyon na geometriko.

Ang mga pangunahing yugto ng paghahanap ng isang solusyon sa laro ay ang mga sumusunod.

Ipakilala natin ang isang sistema ng coordinate sa eroplano. Gumuhit ng isang segment sa axis. Gumuhit ng mga patayo mula sa kaliwa at kanang mga dulo ng segment na ito.


Ang kaliwa at kanang dulo ng segment ng yunit ay tumutugma sa dalawang diskarte at, magagamit sa manlalaro I. Sa mga iginuhit na patayo, ipagpaliban namin ang mga panalo ng manlalaro na ito. Halimbawa, para sa isang matrix sa pagbabayad


tulad ng mga kabayaran ng manlalaro ako kapag pumipili ng isang diskarte ay magiging at, at kapag pumipili ng isang diskarte ay magiging at.

Ikonekta natin sa pamamagitan ng tuwid na mga segment ng linya ang mga puntos ng kabayaran ng manlalaro na naaayon ako sa mga diskarte ng manlalaro II. Pagkatapos ang nabuong sirang linya, na hangganan ang grap mula sa ibaba, tinutukoy ang mas mababang hangganan ng kabayaran ng manlalaro I.



Hanapin ang pinakamainam na halo-halong diskarte ng manlalaro I

,

na tumutugma sa punto sa mas mababang hangganan ng kabayaran ng manlalaro I na may pinakamataas na ordenate.

Tandaan na sa halimbawang isinasaalang-alang, gamit lamang ang dalawang diskarte at naaayon sa mga tuwid na linya na tumatawid sa nahanap na punto sa mas mababang hangganan ng kabayaran ng manlalaro I, maiiwasan ng manlalaro II ang manlalaro I na makakuha ng mas malaking kabayaran.

Sa gayon, ang laro ay nabawasan sa isang laro at ang pinakamainam na halo-halong diskarte ng manlalaro II sa isinasaalang-alang na halimbawa ay

,

kung saan ang posibilidad ay pareho sa laro:

5.6. Solusyon sa larom× n

Kung ang laro ng matrix ay walang solusyon sa mga purong diskarte (ibig sabihin, walang saddle point) at, dahil sa malaking sukat ng payoff matrix, hindi malulutas nang grapiko, pagkatapos ay upang makakuha ng isang solusyon, gamitin linear na pamamaraan ng programa .

Hayaan ang ibigay na matrix ng sukat ng sukat na ibigay:

.

Kailangang matagpuan ang mga posibilidad , kung aling manlalaro ang dapat kong piliin ang kanyang mga gumagalaw upang ang halo-halong diskarte na ito ay garantiya sa kanya ng isang makakuha ng hindi bababa sa lakas, hindi alintana ang pagpili ng mga galaw ng manlalaro II.

Para sa bawat paglipat na pinili ng manlalaro II, ang kabayaran ng manlalaro I ay natutukoy ng mga dependency:

Hinahati namin ang magkabilang panig ng mga hindi pagkakapantay-pantay ng at nagpapakilala ng bagong notasyon:

Pagkakapantay-pantay

Dadalhin ang form:

Dahil ang manlalaro ay hinahangad kong i-maximize ang kabayaran, dapat na mabawasan ang gantihan. Pagkatapos ang problema sa linear na programa para sa manlalaro ay kukuha ako ng form:

na may mga paghihigpit

Katulad nito, ang problema para sa manlalaro II ay itinayo bilang isang dalawahan:

na may mga paghihigpit

Ang paglutas ng mga problema sa paggamit ng pamamaraang simplex, nakukuha namin ang:

,

5.7. Mga tampok ng paglutas ng mga laro ng matrix

Bago malutas ang problema sa paghahanap ng pinakamainam na mga diskarte, dapat suriin ang dalawang mga kundisyon:

Posible bang pasimplehin ang matrix sa pagbabayad;

Kung ang matrix sa pagbabayad ay may isang saddle point.

Isaalang-alang ang posibilidad na gawing simple ang matrix sa pagbabayad:

Dahil sa ang katunayan na ang manlalaro na hinahangad kong makuha pinakamalaking panalo, pagkatapos ay maaari mong i-cross ang linya mula sa matrix sa pagbabayad, dahil hindi niya kailanman gagamitin ang paglipat na ito kung ang sumusunod na ugnayan ay natutupad sa anumang iba pang hilera:

Katulad nito, ang pagsusumikap para sa pinakamaliit na pagkawala, ang manlalaro II ay hindi pipiliin ang haligi ng ith sa matrix ng pagbabayad bilang isang paglipat, at ang haligi na ito ay maaaring ma-cross kung ang sumusunod na ugnayan ay humahawak sa anumang iba pang haligi na ito:

Karamihan simpleng solusyon ng laro ay ang pagkakaroon ng pinasimple na matrix ng pagbabayad ng isang saddle point na nakakatugon sa sumusunod na kondisyon (sa pamamagitan ng kahulugan):

Halimbawa

Ibinibigay ang isang matrix sa pagbabayad:

.

Pagpapasimple ng matrix sa pagbabayad:

Saddle point:

5.8. Naglalaro ng kalikasan

Sa kaibahan sa mga problema ng teorya ng laro sa mga problema ng teorya mga pagpapasya sa istatistika ang isang hindi sigurado na sitwasyon ay walang pangkontra sa pangkulay ng alitan at nakasalalay sa layunin na katotohanan, na karaniwang tinatawag "kalikasan" .

Sa mga larong matrix na may kalikasan, ang manlalaro II ay nilalaro ng isang hanay ng mga hindi tiyak na kadahilanan na nakakaapekto sa kahusayan ng mga desisyon na ginawa.

Ang mga laro ng matrix na may likas na katangian ay naiiba mula sa ordinaryong mga laro ng matrix lamang sa na, kapag pumipili ng pinakamainam na diskarte ng manlalaro I, hindi na posible na gabayan ng katotohanan na susubukan ng manlalaro II na i-minimize ang kanyang pagkawala. Samakatuwid, kasama ang matrix sa pagbabayad, panganib matrix :

saan ang halaga ng peligro ng manlalaro I kapag ginagamit ang paglipat sa ilalim ng mga kundisyon na katumbas ng pagkakaiba sa pagitan ng kabayaran ng manlalaro na tatanggapin ko kung alam niya na ang kundisyon ay maitatatag, ibig sabihin , at ang mga panalo na matatanggap niya, hindi alam kung pumipili ng isang paglipat na ang kundisyon ay maitatatag.

Kaya, ang payoff matrix ay hindi malinaw na binago sa isang peligro ng matris, at ang balikbalik na pagbabago ay hindi siguradong.

Halimbawa

Bayaran matrix:

.

Risk Matrix:

Maaari dalawang pahayag na may problema tungkol sa pagpili ng solusyon sa isang matrix game na may likas na katangian :

Pag-maximize ng iyong mga panalo;

Pagliit ng peligro.

Ang problema sa paggawa ng desisyon ay maaaring mailagay para sa isa sa dalawang mga kundisyon:

- nanganganib kapag ang posibilidad ng pamamahagi ng posibilidad ng mga diskarte ng kalikasan ay kilala, halimbawa, ang random na halaga ng paglitaw ng bawat isa sa mga ipinapalagay na tukoy na pang-ekonomiyang sitwasyon;

- sa harap ng kawalan ng katiyakan kapag ang gayong pagpapaandar sa posibilidad ng pamamahagi ay hindi alam.

5.9. Paglutas ng mga problema sa teorya ng mga pagpapasyang pang-istatistika

nanganganib

Kapag gumagawa ng mga desisyon sa ilalim ng mga kundisyon ng peligro, alam ko ang player ng mga posibilidad ang pagsisimula ng mga estado ng kalikasan.

Pagkatapos ito ay kapaki-pakinabang para sa player na pipiliin ko ang diskarte kung saan ang average na halaga ng mga panalo, kinuha bawat linya, maximum :

.

Kapag nalulutas ang problemang ito sa isang panganib matrix, nakakakuha kami ng parehong solusyon na naaayon sa minimum na average na panganib :

.

5.10. Paglutas ng mga problema sa teorya ng mga pagpapasyang pang-istatistika

sa harap ng kawalan ng katiyakan

Kapag gumagawa ng mga desisyon sa ilalim ng mga kundisyon ng kawalan ng katiyakan, maaari mong gamitin ang sumusunod pamantayan :

Ang pamantayan ni Wald's Maximin;

Pamantayan kaunting panganib Sevija;

Ang pamantayan para sa pesimismo ay ang pag-asa sa optimismo ni Hurwitz;

Ang prinsipyo ni Laplace na hindi sapat na batayan.

Isaalang-alang maximin test ni Wald .

Ang larong may likas na katangian ay nilalaro tulad ng isang makatwirang agresibo na kalaban, iyon ay, isang reinsurance na diskarte ay isinasagawa mula sa posisyon ng matinding pesimismo para sa matrix sa pagbabayad:

.

Isaalang-alang Savage minimum criterion ng peligro .

Isang diskarte na katulad sa naunang isa mula sa posisyon ng matinding pesimismo para sa panganib matrix:

.

Isaalang-alang pamantayan ng pesimismo - optimismo ni Hurwitz .

Inaalok ang isang pagkakataon na huwag gabayan ng alinman sa matinding pesimismo o matinding pag-asa sa mabuti:

nasaan ang antas ng pesimismo;

sa - matinding pag-asa,

sa - matinding pesimismo.

Isaalang-alang Ang prinsipyo ni Laplace na hindi sapat na batayan .

Pinaniniwalaan na ang lahat ng mga estado ng kalikasan ay pantay na maaaring probable:

,

.

Mga konklusyon sa ikalimang seksyon

Ang dalawang manlalaro ay lumahok sa laro ng matrix, at ang pagpapaandar na function, na nagsisilbing matukoy ang halaga ng pagbabayad ng natalo na manlalaro sa nagwagi, ay kinakatawan sa anyo ng isang payoff matrix. Sumang-ayon kami na pipiliin ko ang manlalaro ng isa sa mga hilera ng payrix matrix bilang isang paglipat, at pipiliin ng manlalaro II ang isa sa mga haligi nito. Pagkatapos, sa intersection ng napiling hilera at haligi ng matrix na ito, mayroong numerong halaga ng pagbabayad sa manlalaro I mula sa manlalaro II (kung positibo ang halagang ito, kung gayon ang manlalaro ay nanalo talaga ako, at kung ito ay negatibo, pagkatapos ang manlalaro II mahalagang nanalo).

Kung may isang punto ng siyahan sa pagbabayad matrix, kung gayon ang mga manlalaro ay may pinakamainam na purong diskarte, iyon ay, upang manalo, bawat isa sa kanila ay dapat ulitin ang kanyang isang pinakamainam na paglipat. Kung walang punto ng siyahan, pagkatapos ay upang manalo, ang bawat isa sa kanila ay dapat gumamit ng pinakamainam na halo-halong diskarte, iyon ay, gumamit ng isang halo ng mga galaw, bawat isa ay dapat gumanap na may pinakamainam na posibilidad.

Ang paghahanap para sa pinakamainam na halo-halong mga diskarte para sa mga laro ng 2 × 2 ay ginaganap sa pamamagitan ng pagkalkula ng pinakamainam na mga posibilidad na gumagamit ng mga kilalang pormula. Sa pamamagitan ng solusyon sa geometriko Para sa mga laro na 2 × n, ang kahulugan ng pinakamainam na halo-halong mga diskarte sa mga ito ay nabawasan sa paghahanap ng pinakamainam na halo-halong mga diskarte para sa 2 × 2 na mga laro. Upang malutas ang mga laro sa m × n, ginagamit ang isang linear na pamamaraan ng pag-program upang hanapin ang pinakamainam na halo-halong mga diskarte sa mga ito.

Ang ilang mga matrice sa pagbabayad ay nagpahiram sa kanilang sarili sa pagpapasimple, bilang isang resulta kung saan ang kanilang sukat ay nabawasan sa pamamagitan ng pag-aalis ng mga hilera at haligi na naaayon sa hindi nakakaintindi na paglipat.

Kung ang manlalaro II ay isang hanay ng mga hindi tiyak na kadahilanan na nakasalalay sa layunin na realidad at walang isang pangkontra sa pangkulay ng salungatan, kung gayon ang naturang laro ay tinatawag na isang laro na may likas na katangian, at ginagamit ang mga problema ng teorya ng mga pagpapasyang pang-istatistika upang malutas ito. Pagkatapos, kasama ang matrix ng pagbabayad, ipinakilala ang isang peligro ng peligro, at dalawang pahayag ng problema ng pagpili ng isang solusyon sa isang laro na matrix na may likas na katangian: posible na i-maximize ang kabayaran at i-minimize ang peligro.

Ang solusyon ng mga problema sa teorya ng mga pagpapasyang pang-istatistika sa ilalim ng mga kundisyon ng peligro ay ipinapakita na maipapayo para sa manlalaro I na piliin ang diskarte kung saan ang average na halaga (inaasahan sa matematika) ng kabayaran na kinuha sa hilera ng pagbabayad matrix ay maximum, o (na kapareho) ang average na halaga (inaasahan sa matematika) ng peligro na kinuha ng hilera ng peligro ng matris ay minimal. Kapag gumagawa ng mga desisyon sa ilalim ng mga kundisyon ng kawalan ng katiyakan, gamitin ang mga sumusunod na pamantayan: Pinakamataas na criterion ni Wald, minimal criterion ng Sevidge, criterion ng pesimism-optimism ni Hurwitz, ang prinsipyo ni Laplace na hindi sapat na batayan.

Mga tanong sa pansubok na sarili

Paano tinukoy ang pangunahing mga konsepto ng teorya ng laro: paglipat, diskarte at pagbabayad function?

Paano kinakatawan ang pagpapaandar ng payoff sa isang matrix game?

Bakit tinawag na zero sum ang laro ng matrix?

Paano kinakatawan ang proseso ng paglalaro ng isang matrix game?

Anong laro ang tinatawag na m × n game?

Ano ang pinakamainam na diskarte para sa isang matrix game?

Ano ang pinakamainam na diskarte para sa isang matrix game na tinatawag na puro?

Ano ang ibig sabihin ng punto ng siyahan ng payoff matrix?

Ano ang pinakamainam na diskarte para sa isang matrix game na tinatawag na halo-halong?

Paano lumilitaw ang halo-halong diskarte ng manlalaro?

Ano ang halaga ng pagbabayad sa Player I mula sa Player II, na pumili ng magkahalong diskarte?

Anong mga halo-halong diskarte ang tinatawag na pinakamainam?

Ano ang ibig sabihin ng hindi naalis na pagkakaiba?

Anong pamamaraan ang ginagamit upang makahanap ng pinakamainam na halo-halong mga diskarte para sa 2 × 2 na laro?

Paano matatagpuan ang pinakamainam na halo-halong mga diskarte para sa mga laro ng 2 × n?

Anong pamamaraan ang ginagamit upang makahanap ng pinakamainam na halo-halong mga diskarte para sa mga laro sa m × n?

Ano ang mga tampok sa paglutas ng mga laro ng matrix?

Ano ang ibig sabihin ng pagpapagaan ng matrix sa pagbabayad at sa ilalim ng anong mga kundisyon ito maaaring magawa?

Aling matrix game ang mas madaling malutas kapag ang payoff matrix ay mayroon o walang isang saddle point?

Anong mga problema sa teorya ng laro ang nauugnay sa mga problema sa teorya ng mga pagpapasyang pang-istatistika?

Paano binago ang Payment Matrix sa isang Risk Matrix?

Ano ang dalawang formulasyon ng problema ng pagpili ng mga solusyon na posible sa isang matrix game na may likas na katangian?

Para sa anong dalawang kundisyon maaaring maitakda ang mga problema sa paggawa ng desisyon sa isang matrix na laro na may likas na katangian?

Anong diskarte ang kinakailangan para sa manlalaro na pipiliin ko kapag nilulutas ang problema ng teorya ng mga pagpapasyang pang-istatistika sa ilalim ng mga kondisyong peligro?

Anong pamantayan sa paggawa ng desisyon ang maaaring magamit sa paglutas ng mga problema ng teorya ng mga pagpapasyang pang-istatistika sa ilalim ng mga kundisyon ng kawalan ng katiyakan?

Mga halimbawa ng paglutas ng problema

1. Ipinapakita ng matrix sa pagbabayad ang halaga ng kita ng negosyo kapag ito ay nagbebenta iba`t ibang uri mga produkto (haligi) depende sa matatag na pangangailangan (mga hilera). Kinakailangan upang matukoy ang pinakamainam na diskarte ng negosyo para sa paggawa ng iba't ibang uri ng mga produkto at ang kaukulang maximum (sa average) na kita mula sa kanilang pagbebenta.

Tukuyin natin ang ibinigay na matrix sa pamamagitan at ipakilala ang mga variable. Gumagamit din kami ng isang matrix (vector). Pagkatapos at, ibig sabihin

Ang inverse matrix ay kinakalkula:

Ang mga halaga ay matatagpuan:

.

Kinakalkula ang mga posibilidad:

Natutukoy ang average na kita mula sa mga benta:

.

2. Ang matatag na "Pharmacist" ay isang tagagawa ng mga gamot at biomedical na produkto sa rehiyon. Alam na ang pinakamataas na demand para sa ilang mga gamot ay bumaba tag-araw (mga gamot ng pangkat ng cardiovascular, analgesics), para sa iba pa - para sa taglagas at mga panahon ng tagsibol (kontra-nakakahawa, antitussive).

Mga gastos para sa 1 conv. mga yunit ang mga produkto para sa Setyembre-Oktubre ay: para sa unang pangkat (mga gamot sa cardiovascular at analgesics) - 20 rubles; sa pangalawang pangkat (kontra-nakakahawang, antitussive na gamot) - 15 rubles.

Ayon sa mga obserbasyon para sa marami mga nakaraang taon ang serbisyo sa marketing ng kumpanya ay itinatag na maaari itong mapagtanto sa loob ng dalawang buwan na isinasaalang-alang sa mainit na panahon 3050 conv. mga yunit mga produkto ng unang pangkat at 1100 conv. mga yunit mga produkto ng pangalawang pangkat; sa malamig na panahon - 1525 conv. mga yunit mga produkto ng unang pangkat at 3690 conv. mga yunit ang pangalawang pangkat.

Kaugnay sa mga posibleng pagbabago sa panahon, ipinapakita ang gawain - upang matukoy ang diskarte ng kumpanya sa paggawa ng mga produkto na nagbibigay ng maximum na kita mula sa mga benta sa isang presyo ng benta na 40 rubles. para sa 1 conv. mga yunit mga produkto ng unang pangkat at 30 rubles. - ang pangalawang pangkat.

DESISYON. Ang firm ay may dalawang diskarte:

Ang panahon ay magiging mainit sa taong ito;

Ang lamig ng panahon.

Kung ang kumpanya ay nagpatibay ng isang diskarte at sa katotohanan magkakaroon ng mainit na panahon (diskarte ng kalikasan), kung gayon ang mga produktong gawa (3050 maginoo na yunit ng unang pangkat ng mga gamot at 1100 mga maginoo na yunit ng pangalawang pangkat) ay buong maibebenta at ang kita ay maging

3050 × (40-20) + 1100 × (30-15) \u003d 77500 p.

Sa cool na panahon (diskarte sa kalikasan), ang mga gamot ng pangalawang pangkat ay ibebenta nang buo, at ang unang pangkat lamang sa halagang 1525 conv. mga yunit at ang ilan sa mga gamot ay mananatiling hindi maisasakatuparan. Ang kita ay

1525 × (40-20) + 1100 × (30-15) -20 × () \u003d 16500 p.

Katulad nito, kung ang form ay nagpatibay ng isang diskarte at ang panahon ay talagang malamig, kung gayon ang kita ay magiging

1525 × (40-20) + 3690 × (30-15) \u003d 85850 p.

Sa mainit na panahon, ang kita ay

1525 × (40-20) + 1100 × (30-15) - () × 15 \u003d 8150 p.

Isinasaalang-alang ang firm at ang panahon bilang dalawang manlalaro, nakukuha namin ang matrix sa pagbabayad

,

Ang presyo ng laro ay nakasalalay sa saklaw

Maaari itong makita mula sa matrix sa pagbabayad na, sa ilalim ng lahat ng mga kondisyon, ang kita ng firm ay hindi bababa sa 16,500 rubles, ngunit kung ang mga kondisyon ng panahon ay tumutugma sa napiling diskarte, kung gayon ang kita ng firm ay maaaring maging 77,500 rubles.

Maghanap tayo ng isang solusyon sa laro.

Tukuyin natin ang posibilidad ng aplikasyon ng firm ng diskarte sa pamamagitan ng, ang diskarte sa pamamagitan ng, at. Ang paglutas ng laro nang grapiko sa pamamagitan ng pamamaraan, nakukuha namin , habang ang presyo ng laro ay p.

Ang pinakamainam na plano sa paggawa ng gamot ay

Kaya, ipinapayong gumawa ang kumpanya sa panahon ng Setyembre at Oktubre 2379 na kumbiksyon. mga yunit gamot ng unang pangkat at 2239.6 conv. mga yunit gamot ng pangalawang pangkat, pagkatapos ay sa anumang lagay ng panahon ay makakatanggap siya ng kita na hindi bababa sa 46986 rubles.

Sa mga kundisyon ng kawalan ng katiyakan, kung hindi posible para sa isang firm na gumamit ng isang halo-halong diskarte (mga kontrata sa iba pang mga samahan), upang matukoy ang pinakamainam na diskarte ng firm, ginagamit namin ang mga sumusunod na pamantayan:

Pamantayan ni Walde:

Criterion ng Hurwitz: para sa kahulugan, tatanggapin namin, pagkatapos para sa diskarte ng firm

para sa diskarte

ipinapayo para sa firm na gumamit ng isang diskarte.

Kritikal ng Savage. Ang maximum na elemento sa unang haligi ay 77500, sa pangalawang haligi ay 85850.

Ang mga elemento ng panganib matrix ay matatagpuan mula sa ekspresyon

,

saan ba ,,

Ang pormasyong matris ay mayroong form

,

ipinapayong gamitin ang diskarte o.

Samakatuwid, ipinapayong ilapat ng firm ang diskarte o.

Tandaan na ang bawat isa sa mga isinasaalang-alang na pamantayan ay hindi maituturing na ganap na kasiya-siya para sa pangwakas na pagpipilian mga desisyon, gayunpaman, ang kanilang magkasanib na pagsusuri ay nagbibigay-daan sa iyo upang mas malinaw na kumatawan sa mga kahihinatnan ng paggawa ng ilang mga desisyon sa pamamahala.

Sa isang kilalang pamamahagi ng mga posibilidad para sa iba't ibang mga estado ng kalikasan, ang pamantayan ng desisyon ay ang maximum na inaasahan sa matematika ng isang kabayaran.

Ipaalam sa problemang isinasaalang-alang na ang mga posibilidad ng mainit at malamig na panahon ay pantay at katumbas ng 0.5, kung gayon ang pinakamainam na diskarte ng kumpanya ay natutukoy tulad ng sumusunod:

Maipapayo para sa isang kompanya na gumamit ng isang diskarte o.

Mga takdang aralin sa sarili

1. Ang isang negosyo ay maaaring gumawa ng tatlong uri ng mga produkto (A, B at C), habang tumatanggap ng kita na nakasalalay sa demand. Ang pangangailangan ay maaaring tumagal ng isa sa apat na estado (I, II, III at IV). Sa sumusunod na matrix, nailalarawan ng mga elemento ang kita na matatanggap ng enterprise kapag gumagawa ng ika-ika produkto at ng ika-estado ng demand:

Kung sa laro bawat isa sa mga kalaban ay naglalapat lamang ng isa at parehong diskarte, pagkatapos ay tungkol sa laro mismo sa kasong ito sinabi nila na nangyayari ito sa purong diskarte , at ginamit ng manlalaro AT at ang manlalaro SA ang isang pares ng mga diskarte ay tinawag puro diskarte .

Kahulugan Sa isang laban na laro, isang pares ng mga diskarte ( AT ako , SA Ang j) ay tinatawag na balanse o matatag kung hindi kumikita para sa alinman sa mga manlalaro na lumihis mula sa kanilang diskarte.

Makatuwirang gamitin ang purong diskarte kapag mga manlalaro AT at SA may impormasyon tungkol sa aksyon ng bawat isa at mga nakamit na resulta. Kung ipinapalagay natin na hindi bababa sa isa sa mga partido ay hindi alam ang tungkol sa pag-uugali ng kalaban, pagkatapos ang ideya ng balanse ay nilabag, at ang laro ay pinatugtog nang malabo.

Isaalang-alang ang laro ng matrix G (3x4)

Sa halimbawang ito, ang mas mababang presyo ng laro ay katumbas ng nasa itaas: \u003d\u003d 9, ibig sabihin ang laro ay may isang saddle point.

Ito ay naka-out na sa kasong ito ang maximin na mga diskarte AT 2 at SA 2 kalooban napapanatili na may kaugnayan sa impormasyon tungkol sa pag-uugali ng kaaway.

Sa katunayan, hayaan ang manlalaro AT nalaman na ang kaaway ay gumagamit ng isang diskarte SA 2. Ngunit sa kasong ito ang manlalaro AT mananatili pa rin sa diskarte AT 2, dahil ang anumang paglihis mula sa diskarte AT 2 lamang ang magbabawas ng mga panalo. Gayundin, ang impormasyong natanggap ng manlalaro SA, hindi pipilitin na lumihis siya sa kanyang diskarte SA 2 .

Isang pares ng mga diskarte AT 2 at SA Nagmamay-ari ang 2 ng pag-aari ng katatagan, at ang kabayaran (sa isinasaalang-alang na halimbawa na ito ay katumbas ng 9), na nakamit sa pares ng mga diskarte na ito, ay naging saddle point ng payrix matrix.

Ang palatandaan ng katatagan (balanse) ng pares ng diskarte ay ang pagkakapantay-pantay ng mas mababa at nangungunang presyo mga laro.

Estratehiya AT ako at SA j (sa isinasaalang-alang halimbawa AT 2 , SA 2), kung saan nasiyahan ang pagkakapantay-pantay ng mas mababa at mas mataas na mga presyo ng laro, ay tinatawag na pinakamainam na purong diskarte, at ang kanilang kombinasyon ay tinatawag na solusyon ng laro. Sa kasong ito, ang laro mismo ay sinasabing malulutas sa purong diskarte.

Ang halaga ay tinatawag na gastos ng laro.

Kung 0, kung gayon ang laro ay kapaki-pakinabang para sa manlalaro A, kung 0 - para sa manlalaro B; para sa \u003d 0 ang laro ay patas, ibig sabihin ay pantay na kapaki-pakinabang para sa parehong mga kalahok.

Gayunpaman, ang pagkakaroon ng isang saddle point sa isang laro ay malayo sa isang panuntunan, sa halip isang pagbubukod. Karamihan sa mga matrix na laro ay walang saddle point, at samakatuwid ay walang optimal na purong diskarte. Gayunpaman, mayroong isang uri ng mga laro na laging may isang saddle point at, samakatuwid, ay malulutas sa mga dalisay na diskarte. Ito ang mga laro kasama kumpletong impormasyon.

Teorama 2. Ang bawat laro na may kumpletong impormasyon ay may isang saddle point, at, samakatuwid, ay nalulutas sa purong mga diskarte, ibig sabihin mayroong isang pares ng pinakamainam na purong diskarte na nagbibigay ng isang matatag na kabayaran na katumbas ng.

Kung ang naturang laro ay binubuo lamang ng mga personal na paglipat, pagkatapos kapag inilapat ng bawat manlalaro ang kanyang pinakamainam na purong diskarte, dapat itong magtapos sa isang panalo na katumbas ng presyo ng laro. Halimbawa ng mga posibleng diskarte sa isang laro ng chess ay malaki).

Kung ang laro matrix ay naglalaman ng isang saddle point, kung gayon ang solusyon nito ay agad na matatagpuan alinsunod sa prinsipyo ng maximin.

Ang tanong ay arises: kung paano makahanap ng isang solusyon sa isang laro na ang payoff matrix ay walang isang saddle point? Ang aplikasyon ng maximin na prinsipyo ng bawat isa sa mga manlalaro ay nagbibigay sa manlalaro A ng hindi bababa sa isang nakuha, at isang pagkawala para sa manlalaro nang higit pa. Isinasaalang-alang na natural para sa manlalaro A na nais na dagdagan ang kanyang mga panalo, at para sa manlalaro B na bawasan ang kanyang pagkawala. Ang paghahanap para sa naturang solusyon ay humahantong sa pangangailangan na mag-apply ng halo-halong mga diskarte: upang kahalili ng purong diskarte sa ilang mga frequency.

Kahulugan Ang isang random variable na ang halaga ay purong diskarte ng player ay tinawag na kanya halo-halong diskarte .

Kaya, ang gawain ng halo-halong diskarte ng manlalaro ay binubuo sa pagpapahiwatig ng mga posibilidad na mapili ang kanyang dalisay na diskarte.

Ipapahiwatig namin ang magkahalong mga diskarte ng mga manlalaro AT at SA ayon sa pagkakabanggit

S A \u003d || p 1, p 2, ..., p m ||,

S B \u003d || q 1, q 2, ..., q n ||,

kung saan p i ang posibilidad ng paggamit ng manlalaro AT malinis mula sa diskarte AT i; ; Ang q j ay ang posibilidad ng manlalaro B gamit ang purong diskarte B j; ...

Sa espesyal na kaso, kapag ang lahat ng mga posibilidad, maliban sa isa, ay katumbas ng zero, at ang isang ito ay katumbas ng isa, ang halo-halong diskarte ay nagiging isang dalisay.

Ang aplikasyon ng magkahalong mga diskarte ay isinasagawa, halimbawa, sa ganitong paraan: ang laro ay paulit-ulit na maraming beses, ngunit sa bawat laro ang player ay naglalapat ng iba't ibang mga dalisay na diskarte na may kamag-anak na frequency ng kanilang aplikasyon na katumbas ng p ako at q j .

Ang mga halo-halong diskarte sa teorya ng laro ay isang modelo ng likido, kakayahang umangkop na mga taktika, kung saan alinman sa manlalaro ay hindi nakakaalam kung aling malinis na diskarte ang pipiliin ng kalaban sa isang naibigay na laro.

Kung ang manlalaro AT inilalapat ang halo-halong diskarte S A \u003d || p 1, p 2, ..., p m ||, at ang player SA halo-halong diskarte S B \u003d || q 1, q 2, ..., q n ||, pagkatapos ay ang average na kabayaran (inaasahan sa matematika) ng manlalaro AT ay natutukoy ng ratio

Naturally, ang inaasahang pagkawala ng player SA ay katumbas ng parehong halaga.

Kaya, kung ang laro ng matrix ay walang saddle point, dapat gamitin ng manlalaro ang pinakamainam na halo-halong diskarte na magbibigay ng maximum na kabayaran.

Likas na lumitaw ang tanong: anong mga pagsasaalang-alang ang dapat sundin kapag pumipili ng magkahalong diskarte? Ito ay lumalabas na ang prinsipyo ng maximin ay nagpapanatili ng kahulugan nito sa kasong ito rin. Bukod sa, mahalaga upang maunawaan ang solusyon sa mga laro, i-play ang pangunahing mga teorya ng teorya ng laro.

Mga pamamaraan at modelo ng matematika sa ekonomiya

Mga laro ng matrix

Panimula

Sa praktikal na pang-ekonomiya, madalas na lumitaw ang mga sitwasyon kung saan ang iba't ibang mga partido ay naghabol ng iba't ibang mga layunin. Halimbawa, ang ugnayan sa pagitan ng isang nagbebenta at isang mamimili, isang tagapagtustos at isang mamimili, isang bangko at isang depositor, atbp. Ang mga nasabing sitwasyon ng hidwaan ay lumitaw hindi lamang sa ekonomiya, ngunit sa iba pang mga aktibidad. Halimbawa, kapag naglalaro ng chess, mga pamato, domino, loto, atbp.

Isang laro- ito ay matematikal na modelo sitwasyon ng hidwaan na kinasasangkutan ng hindi bababa sa dalawang tao na gumagamit ng marami iba't ibang paraan upang makamit ang iyong mga layunin. Ang laro ay tinawag silid-pasingawan, kung dalawang manlalaro ang lumahok dito. Ang laro ay tinawag kalaban, kung ang nakuha ng isang manlalaro ay katumbas ng pagkawala ng isa pa. Samakatuwid, upang maitakda ang laro, sapat na upang itakda ang mga halaga ng mga kabayaran ng isang manlalaro sa iba't ibang mga sitwasyon.

Ang anumang paraan ng pagkilos ng manlalaro, depende sa kasalukuyang sitwasyon, ay tinawag diskarte Ang bawat manlalaro ay may isang tukoy na hanay ng mga diskarte. Kung ang bilang ng mga diskarte ay may hangganan, pagkatapos ang laro ay tinatawag panghuli, kung hindi man - walang katapusang . Tinatawag ang mga diskarte malinis, kung ang bawat isa sa mga manlalaro ay pipili lamang ng isang diskarte sa isang tiyak at hindi random na paraan.

Solusyon sa laroay ang pumili ng isang diskarte na nagbibigay-kasiyahan kalagayan ng pagiging optimidad. Ang kundisyong ito ay nakukuha ng isang manlalaro maximum na panalo, kung ang pangalawa ay sumusunod sa kanyang diskarte. Sa kabaligtaran, natatanggap ng pangalawang manlalaro kaunting pagkawala, kung ang unang manlalaro ay nananatili sa kanyang diskarte. Ang mga nasabing diskarte ay tinawag pinakamainam . Kaya, ang layunin ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

Puro laro ng diskarte

Isaalang-alang ang isang laro kasama ang dalawang manlalaro AT at SA.Ipagpalagay na ang manlalaro ATmayroon ito mestratehiya А 1, А 2, ..., А mat ang manlalaro SAmayroon ito nestratehiya B 1, B 2, ..., B n.Ipagpalagay namin na ang pagpipilian ng manlalaro ATdiskarte A ako,at ang manlalaro SAdiskarte B jnatatanging tumutukoy sa kinalabasan ng laro, ibig sabihin makakuha isang ijmanlalaro ATat manalo b ijmanlalaro SA.Dito i \u003d 1,2, ..., m, j \u003d 1,2, ..., n.

Ang pinakasimpleng laro kasama ang dalawang manlalaro ay isang laban na laban , mga yan isang laro kung saan ang interes ng mga manlalaro ay direktang kabaligtaran. Sa kasong ito, ang mga kabayaran ng mga manlalaro ay nauugnay sa pagkakapantay-pantay

b ij \u003d -a ij

Ang pagkakapantay-pantay na ito ay nangangahulugan na ang nakuha ng isa sa mga manlalaro ay katumbas ng pagkawala ng iba. Sa kasong ito, sapat na upang isaalang-alang lamang ang mga kabayaran ng isa sa mga manlalaro, halimbawa, ang manlalaro AT.

Ang bawat pares ng mga diskarte A iat B jtumugma sa panalo isang ijmanlalaro AT.Maginhawa upang isulat ang lahat ng mga panalo na ito sa anyo ng tinaguriang bayad sa matrix

Ang mga hilera ng matrix na ito ay tumutugma sa mga diskarte ng manlalaro AT,at ang mga haligi ay para sa mga diskarte ng manlalaro SA.Sa pangkalahatan, ang naturang laro ay tinatawag (m × n) -game.


Halimbawa 1.Dalawang manlalaro AT at SAmagtapon ng barya. Kung ang mga gilid ng barya ay nag-tutugma, pagkatapos ay nanalo AT, ibig sabihin manlalaro SAbinabayaran ang manlalaro ATilang kabuuan na katumbas ng 1, at kung hindi sila nag-tutugma, nanalo ang manlalaro B, ibig sabihin sa laban, ang manlalaro ATbinabayaran ang manlalaro SAsa parehong halaga , pantay 1. Bumuo ng isang matrix sa pagbabayad.

Desisyon.Sa kondisyon ng problema

© 2021 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pagtatalo