Puro laro ng diskarte. Hinahalong mga diskarte

bahay / Dating

halo-halong diskarte sa laro ng teorya

Hinahalong mga diskarte

Kung walang point saddle sa isang laro ng matrix sa purong mga diskarte, pagkatapos ay matatagpuan ang itaas at mas mababang mga presyo ng laro. Ipinakita nila na ang player 1 ay hindi makakatanggap ng isang panalo na lumampas sa itaas na presyo ng laro at ang manlalaro na 1 ay garantisadong isang panalo na hindi mas mababa sa mas mababang presyo ng laro.

Ang halo-halong diskarte ng isang manlalaro ay isang kumpletong hanay ng kanyang purong mga diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kondisyon na may ibinigay na mga posibilidad. Isaalang-alang natin ang nasa itaas at ilista ang mga kundisyon para sa paggamit ng halo-halong mga diskarte:

  • * maglaro nang walang isang saddle point;
  • * Ang mga manlalaro ay gumagamit ng isang random na pinaghalong purong estratehiya na may ibinigay na mga posibilidad;
  • * ang laro ay paulit-ulit na maraming beses sa mga katulad na kondisyon;
  • * Sa bawat isa sa mga gumagalaw, walang manlalaro ang nalaman tungkol sa pagpili ng diskarte ng ibang manlalaro;
  • * Pinapayagan ang averaging ng mga resulta ng laro.

Ang sumusunod na notasyon para sa halo-halong mga diskarte ay ginagamit.

Para sa player 1, isang halo-halong diskarte na binubuo sa application ng mga dalisay na estratehiya A 1, A 2, ..., A m sa kaukulang mga probabilidad p 1, p 2, ..., p m.

Para sa player 2

q j ang posibilidad ng paglalapat ng dalisay na diskarte B j.

Sa kaso kapag р i \u003d 1, para sa player 1 mayroon kaming purong diskarte

Puro mga diskarte ng manlalaro ang tanging posible hindi pantay na mga kaganapan... Sa isang laro ng matrix, alam ang matrix A (nalalapat ito sa parehong player 1 at player 2), maaari itong matukoy ibinigay na mga vectors at ang average na kabayaran ( inaasahang halaga epekto) ng player 1:

kung saan at mga vectors;

p i at q ako ay mga sangkap ng mga vectors.

Sa pamamagitan ng paglalapat ng kanyang halo-halong mga diskarte, ang player 1 ay naglalayong i-maximize ang kanyang average na kabayaran, at player 2 - upang madala ang epekto sa pinakamababang posibleng halaga. Ang Player 1 ay naghahanap upang makamit

Nakamit ng Player 2 ang kundisyon

Ipinapahiwatig din namin ang mga vectors na naaayon sa pinakamainam na halo-halong mga diskarte ng mga manlalaro 1 at 2, i.e. tulad vectors at kung saan ang pagkakapantay-pantay

Ang presyo ng laro ay ang average na pagbabayad ng player 1 kapag ang parehong mga manlalaro ay gumagamit ng halo-halong mga diskarte. Samakatuwid, ang solusyon sa laro ng matrix ay:

  • - pinakamainam na halo-halong diskarte ng player 1;
  • - pinakamainam na halo-halong diskarte ng player 2;

Presyo ng laro.

Hinahalong mga diskarte ay magiging optimal (at) kung sila ay bumubuo ng isang saddle point para sa pagpapaandar i.e.

Mayroong pangunahing teorem para sa mga laro sa matematika.

Para sa isang laro ng matrix na may anumang matrix A, ang dami

umiiral at pantay-pantay sa bawat isa: \u003d \u003d.

Dapat pansinin na kapag pumipili ng pinakamainam na mga diskarte, ang player 1 ay palaging ginagarantiyahan ng isang average na kabayaran, hindi mas mababa sa presyo ng laro, para sa anumang nakapirming diskarte ng player 2 (at, sa kabilang banda, para sa player 2). Ang mga aktibong diskarte ng mga manlalaro 1 at 2 ay tinatawag na mga diskarte na bahagi ng pinakamainam na halo-halong mga diskarte ng kaukulang mga manlalaro na may mga probabilidad na nonzero. Nangangahulugan ito na ang komposisyon ng pinakamainam na halo-halong mga diskarte ng mga manlalaro ay maaaring hindi kasama ang lahat ng kanilang mga nakatukoy na mga diskarte sa priori.

Ang paglutas ng laro ay nangangahulugang paghahanap ng presyo ng laro at ang pinakamainam na mga diskarte. Sisimulan namin ang aming pagsasaalang-alang sa mga pamamaraan para sa paghahanap ng pinakamainam na halo-halong mga diskarte para sa mga laro sa matrix na may pinakasimpleng laro na inilarawan ng matrix 22. Ang mga larong point ng saddle ay hindi isasaalang-alang na espesyal. Kung nakuha ang isang saddle point, nangangahulugan ito na may mga hindi kasiya-siyang diskarte na dapat iwanan. Sa kawalan ng isang saddle point, maaaring makuha ang dalawang pinakamainam na halo-halong mga diskarte. Tulad ng nabanggit, ang mga halo-halong mga diskarte na ito ay nakasulat na tulad nito:

Nangangahulugan ito na mayroong isang matrikula sa pagbabayad

isang 11 p 1 + a 21 p 2 \u003d; (1.16)

isang 12 p 1 + a 22 p 2 \u003d; (1.17)

p 1 + p 2 \u003d 1. (1.18)

isang 11 p 1 + a 21 (1 - p 1) \u003d a 12 p 1 + a 22 (1 - p 1); (1.19)

isang 11 p 1 + a 21 - isang 21 p 1 \u003d a 12 p 1 + a 22 - isang 22 p 1, (1.20)

kung saan nakukuha namin ang pinakamainam na mga halaga at:

Alam at, nahanap namin:

Ang pagkalkula, natagpuan namin at:

isang 11 q 1 + a 12 q 2 \u003d; q 1 + q 2 \u003d 1; (1.24)

isang 11 q 1 + a 12 (1 - q 1) \u003d. (1.25)

para sa isang 11 a 12. (1.26)

Malutas ang problema, dahil ang mga vectors at ang presyo ng laro ay matatagpuan. Ang pagkakaroon ng isang matris ng mga pagbabayad A, maaari mong malutas ang problema sa grapiko. Sa pamamaraang ito, ang algorithm ng solusyon ay napaka-simple (Fig. 2.1).

  • 1. Ang isang segment ng haba ng yunit ay naka-plot sa axis ng abscissa.
  • 2. Ang ordinate ay ang mga panalo para sa diskarte A 1.
  • 3. Sa isang linya na kahanay sa ordinate axis, sa puntong 1, ang mga panalo ay idineposito gamit ang diskarte ng 2.
  • 4. Ang mga dulo ng mga segment ay itinalaga para sa isang 11 -b 11, isang 12 -b 21, isang 22 -b 22, isang 21 -b 12 at dalawang tuwid na linya b 11 b 12 at b 21 b 22 ay iguguhit.
  • 5. Natutukoy ang pagkakasunud-sunod ng punto ng intersection. Ito ay pantay. Ang abscissa ng point c ay katumbas ng p 2 (p 1 \u003d 1 - p 2).

Larawan: 1.1.

Ang pamamaraang ito ay may medyo malawak na lugar ng aplikasyon. Ito ay batay sa karaniwang ari-arian mga laro mn, na nangangahulugang sa anumang laro mn, ang bawat manlalaro ay may isang pinakamainam na halo-halong diskarte kung saan ang bilang ng mga dalisay na estratehiya ay halos min (m, n). Mula sa pag-aari na ito, ang isa ay maaaring makakuha ng isang kilalang kinahinatnan: sa anumang laro 2n at m2, ang bawat pinakamainam na diskarte ay naglalaman ng hindi hihigit sa dalawang aktibong diskarte. Nangangahulugan ito na ang anumang laro 2n at m2 ay maaaring mabawasan sa laro 22. Dahil dito, ang mga laro 2n at m2 ay maaaring malutas nang grapiko. Kung ang matris ng isang may hangganan na laro ay may sukat mn, kung saan ang m\u003e 2 at n\u003e 2, kung gayon ang linear na programa ay ginagamit upang matukoy ang pinakamainam na halo-halong mga diskarte.

Puro diskarte Ang Player I ay pumili ng isa sa mga hilera ng payoff matrix A, at ang purong diskarte ng player II ay ang pagpili ng isa sa mga haligi ng parehong matris.

Optimum malinis na mga diskarte ang mga manlalaro ay naiiba sa halo-halong mga manlalaro sa pamamagitan ng pagkakaroon ng sapilitan unit p i \u003d 1, q i \u003d 1. Halimbawa: P (1,0), Q (1,0). Narito p 1 \u003d 1, q 1 \u003d 1.

Suliranin 1
Maghanap ng pinakamainam na malinis na diskarte batay sa pagbabayad ng matrix gamit ang prinsipyo ng mahigpit na pangingibabaw. Isulat ang mga vectors P *, Q * bilang isang sagot.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Desisyon:

Nalutas namin ang lahat ng mga problema gamit ang calculator ng Matrix Game.

Ipinapalagay namin na player ang pipiliin ko ang kanyang diskarte upang makuha ang kanyang pinakamataas na bayad, at pipiliin ng player II ang kanyang diskarte upang mabawasan ang kabayaran ng player I.

Mga ManlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 13 1 2 5 1
Isang 22 0 0 3 0
Isang 3-3 -5 -5 -2 -5
Isang 40 -2 -2 1 -2
b \u003d max (B i)3 1 2 5
Hanapin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng laro ng isang \u003d max (a i) \u003d 1, na nagpapahiwatig ng maximum na dalisay na diskarte A 1.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d 1.
Ang point saddle (1, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A1, B2). Ang presyo ng laro ay 1.
2. Sinusuri ang payoff matrix para sa nangingibabaw na mga hilera at nangingibabaw na mga haligi.
Minsan, batay sa isang simpleng pagsasaalang-alang ng matrix ng laro, masasabi nating ang ilang mga dalisay na estratehiya ay maaaring makapasok sa pinakamainam na halo-halong diskarte na may posibilidad na zero.
Sabi nila i-ika Ang diskarte ng 1st player ay nangingibabaw sa kanya k-ika diskarte kung ang isang ij ≥ a kj para sa lahat j E N at kahit isa j isang ij\u003e a kj. Sa pagkakataong ito ay sinabi din na i-ika diskarte (o linya) - nangingibabaw, k-ika - pinangungunahan.
Sabi nila j-ika Ang diskarte ng 2nd player ay nangingibabaw sa kanya l-th diskarte kung para sa lahat j E M isang ij ≤ a il at para sa kahit isang i a ij< a il . В этом случае j-ika ang diskarte (haligi) ay tinatawag na nangingibabaw, l-th - pinangungunahan.
Diskarte Ang 1 ay namumuno sa diskarte Ang 2 (lahat ng mga elemento ng hilera 1 ay higit sa o katumbas ng mga halaga ng ika-2 hilera), samakatuwid, ibinabukod namin ang ika-2 hilera ng matrix. Posible p 2 \u003d 0.
Diskarte Ang 1 ay namumuno sa diskarte Ang 3 (lahat ng mga elemento ng hilera 1 ay higit sa o katumbas ng mga halaga ng ika-3 hilera), samakatuwid, ibinabukod namin ang ika-3 hilera ng matrix. Posible p 3 \u003d 0.
3 1 2 5
0 -2 -2 1

Mula sa posisyon ng mga pagkalugi ng player B, ang diskarte B 1 ay namumuno sa diskarte B 2 (lahat ng mga elemento ng haligi 1 marami pang item haligi 2), samakatuwid ibukod namin ang 1st haligi ng matrix. Posibilidad q 1 \u003d 0.
Mula sa posisyon ng pagkalugi ng player B, ang diskarte B 4 ay namumuno sa diskarte B 1 (lahat ng mga elemento ng haligi 4 ay mas malaki kaysa sa mga elemento ng haligi 1), samakatuwid, ibinabukod namin ang ika-4 na haligi ng matrix. Posibilidad q 4 \u003d 0.
1 2
-2 -2

Binawasan namin ang isang 4 x 4 na laro sa isang 2 x 2 na laro.



Solusyon ng Laro ( 2 x n


p 1 \u003d 1
p 2 \u003d 0
Presyo ng laro, y \u003d 1
Ngayon mahahanap natin ang minimax na diskarte ng player B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation
q 1 \u003d 1
q 1 + q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 1 \u003d 1.
Sagot:
Presyo ng laro: y \u003d 1, mga vectors ng diskarte ng mga manlalaro:
Q (1, 0), P (1, 0)

∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (1 1) + (2 0) \u003d 1 \u003d v
M (P 2; Q) \u003d (-2 1) + (-2 0) \u003d -2 ≤ v
M (P; Q 1) \u003d (1 1) + (-2 0) \u003d 1 \u003d v
M (P; Q 2) \u003d (2 1) + (-2 0) \u003d 2 ≥ v

Dahil ang mga hilera at haligi ay tinanggal mula sa orihinal na matrix, ang nahanap na posibilidad na mga vectors ay maaaring isulat bilang:
P (1,0,0,0)
Q (0,1,0,0)

Suliranin 2
Hanapin ang mas mababa at itaas na mga presyo ng laro gamit ang pagbabayad ng matrix. Sa pagkakaroon ng isang punung-punong point, isulat ang mga vectors ng pinakamainam na purong estratehiya P *, Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, pagkatapos ay isusulat namin ang solusyon ng laro sa dalisay na mga diskarte.
Mga ManlalaroB 1B 2B 3a \u003d min (A i)
Isang 1-6 -5 0 -6
Isang 2-8 -3 -2 -8
Isang 3-3 -2 3 -3
b \u003d max (B i)-3 -2 3

Natagpuan namin ang garantisadong payoff na tinutukoy ng mas mababang presyo ng laro a \u003d max (a i) \u003d -3, na nagpapahiwatig ng maximum na dalisay na diskarte A 3.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d -3.
Ang point saddle (3, 1) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A3, B1). Ang presyo ng laro ay -3.
Sagot: P (0,0,1), Q (1,0,0)

Suliranin 3
Maghanap ng mga vectors ng pinakamainam na diskarte P *, Q * at ang presyo ng laro gamit ang matrix ng pagbabayad. Aling player ang nagwagi?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, pagkatapos ay isusulat namin ang solusyon ng laro sa dalisay na mga diskarte.
Ipinapalagay namin na player ang pipiliin ko ang kanyang diskarte upang makuha ang kanyang pinakamataas na bayad, at pipiliin ng player II ang kanyang diskarte upang mabawasan ang kabayaran ng player I.
Mga ManlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 1-6 -6 2 4 -6
Isang 22 -2 7 -1 -2
b \u003d max (B i)2 -2 7 4

Natagpuan namin ang garantisadong payoff na tinutukoy ng mas mababang presyo ng laro a \u003d max (a i) \u003d -2, na nagpapahiwatig ng maximum na dalisay na diskarte A 2.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d -2.
Ang point saddle (2, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A2, B2). Ang presyo ng laro ay -2.
3. Hanapin ang solusyon sa laro sa halo-halong mga diskarte.
Malutas natin ang problema sa pamamagitan ng pamamaraang geometriko, na kinabibilangan ng mga sumusunod na hakbang:
1. Sa sistema ng coordinate ng Cartesian, ang isang segment ay naka-plot sa axis ng abscissa, ang haba ng kung saan ay 1. Ang kaliwang dulo ng segment (point x \u003d 0) ay tumutugma sa diskarte A 1, ang kanan - upang diskarte A 2 (x \u003d 1). Ang mga gitnang puntos x ay tumutugma sa mga posibilidad ng ilang magkakaibang mga diskarte S 1 \u003d (p 1, p 2).
2. Ang mga panalo ng diskarte A 1 ay naka-plot sa kaliwang ordinate axis. Sa isang linya na kahanay sa ordinate axis, mula sa punto 1, ang mga panalo ng diskarte A 2 ay naka-plot.
Solusyon ng Laro ( 2 x n) ay isinasagawa mula sa posisyon ng manlalaro A, na sumunod sa diskarte na pinakamataas. Wala sa mga manlalaro ang may nangingibabaw at dobleng diskarte.

Ang pinakamataas na pinakamainam na diskarte ng player A ay tumutugma sa point N, kung saan ang sumusunod na sistema ng mga equation ay maaaring isulat:
p 1 \u003d 0
p 2 \u003d 1
Presyo ng laro, y \u003d -2
Ngayon mahahanap natin ang minimax na diskarte ng player B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation, hindi kasama ang diskarte B 1, B 3, B 4, na malinaw na nagbibigay ng isang mas malaking pagkawala sa player B, at, samakatuwid, q 1 \u003d 0, q 3 \u003d 0, q 4 \u003d 0 ...
-2q 2 \u003d -2
q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 2 \u003d 1.
Sagot:
Presyo ng laro: y \u003d -2, mga vectors ng diskarte ng mga manlalaro:
Q (0, 1, 0, 0), P (0, 1)
4. Suriin natin ang kawastuhan ng solusyon sa laro gamit ang diskarte sa pagiging maaasahan ng diskarte.
∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (-6 0) + (-6 1) + (2 0) + (4 0) \u003d -6 ≤ v
M (P 2; Q) \u003d (2 0) + (-2 1) + (7 0) + (-1 0) \u003d -2 \u003d v
M (P; Q 1) \u003d (-6 0) + (2 1) \u003d 2 ≥ v
M (P; Q 2) \u003d (-6 0) + (-2 1) \u003d -2 \u003d v
M (P; Q 3) \u003d (2 0) + (7 1) \u003d 7 ≥ v
M (P; Q 4) \u003d (4 0) + (-1 1) \u003d -1 ≥ v
Ang lahat ng mga hindi pagkakapareho ay nasiyahan bilang pagkakapantay-pantay o mahigpit na pagkakapantay-pantay, samakatuwid, ang solusyon sa laro ay matatagpuan nang tama.

Suliranin 4
Bigyan ng detalyadong sagot sa tanong

5. Ang teorya ng mga GAMES AT STATISTICAL SOLUSYON

5.1. Larong Zero-sum matrix

Ang modeling pang-ekonomiya at matematika ay isinasagawa sa mga sumusunod na kondisyon:

Mga katiyakan;

Mga Kawalang-katiyakan.

Pagmomodelo sa mga kondisyon ng katiyakan Ipinapalagay ang pagkakaroon ng lahat ng kinakailangang paunang data ng normatibong (pagmomolde ng matrix, pagpaplano ng network at pamamahala).

Pagmomodelo nanganganib ay isinasagawa nang walang pag-aalinlangan na kawalan ng katiyakan, kapag ang mga halaga ng ilang paunang data ay sapalaran at ang mga batas sa pamamahagi ng posibilidad para sa mga random na variable na ito ay kilala (pagtatasa ng regression, queuing theory).

Pagmomodelo sa kawalan ng katiyakan mga sulat kumpletong kawalan ilang kinakailangang data para sa (teorya ng laro).

Ang mga modelo ng matematika para sa paggawa ng pinakamainam na desisyon sa mga sitwasyon ng salungatan ay itinayo sa ilalim ng mga kondisyon ng kawalan ng katiyakan.

Sa teorya ng laro, ginagamit ang mga sumusunod na pangunahing konsepto:

Diskarte;

Function ng pagwagi.

Sa pamamagitan ng kurso tatawagin namin ang pagpipilian at pagpapatupad ng player ng isa sa mga pagkilos na ibinigay para sa mga patakaran ng laro.

Diskarte ay isang teknolohiya para sa pagpili ng isang kurso ng pagkilos sa bawat paglipat, depende sa kasalukuyang sitwasyon.

Win function nagsisilbi upang matukoy ang halaga ng pagbabayad ng pagkawala ng manlalaro sa nagwagi.

Sa isang laro ng matris, ang payoff function ay kinakatawan bilang pagbabayad ng matrix :

saan ang halaga ng pagbabayad sa player I, na pumili ng paglipat, mula sa player II, na pumili ng paglipat.

Sa ganoong laro ng pares, ang mga halaga ng mga pagpapaandar ng payoff ng parehong mga manlalaro sa bawat sitwasyon ay pantay sa laki at kabaligtaran sa pag-sign, i.e. at ang larong ito ay tinawag zero kabuuan .

Ang proseso ng "paglalaro ng laro ng matrix" ay kinakatawan bilang mga sumusunod:

Nakatakda ang pagbabayad ng matrix;

Ang Player I, nang nakapag-iisa ng player II, ay pipili ng isa sa mga hilera ng matrix na ito, halimbawa, ang th;

Ang Player II, anuman ang player ko, ay pipili ng isa sa mga haligi ng matrix na ito, halimbawa, - th;

Ang elemento ng matrix ay tumutukoy kung magkano ang player na matatanggap ko mula sa player II. Siyempre, kung, kung gayon dumating na tungkol sa aktwal na pagkawala ng player I.

Ang isang laro ng paragonong antagonistic na may payoff matrix ay tatawaging isang laro.

Halimbawa

Isaalang-alang ang isang laro.

Itakda ang pagbabayad ng matrix:

.

Hayaan ang player ko, nang nakapag-iisa ng player II, piliin ang ika-3 hilera ng matrix na ito, at player II, anuman ang player ko, piliin ang ika-2 na haligi ng matris na ito:

Pagkatapos player ay makakatanggap ako ng 9 na mga yunit mula sa player II.

5.2. Optimum na malinis na diskarte sa isang laro ng matris

Diskarte sa pinakamabuting kalagayan ay isang diskarte ng player na tulad ko na hindi niya binabawasan ang kanyang kabayaran para sa anumang pagpili ng diskarte sa pamamagitan ng player II, at isang diskarte ng player II tulad na hindi niya nadagdagan ang kanyang pagkawala para sa anumang pagpili ng diskarte sa pamamagitan ng player I.

Ang pagpili ng ika-hilera ng payoff matrix bilang isang paglipat, tinitiyak ng manlalaro ang kanyang sarili na isang kabayaran ng hindi bababa sa halaga sa pinakamasamang kaso, kapag sinusubukan ng player II na mabawasan ang halagang ito. Samakatuwid, pipiliin ng player ang tulad ng isang hilera na magbibigay sa kanya maximum na panalo:

.

Sa tingin ng Player II sa isang katulad na paraan at tiyak na mai-secure ang kanyang sarili ng isang minimal na pagkawala:

.

Ang hindi pagkakapantay-pantay ay palaging totoo:

Ang dami ay tinatawag ang ibabang presyo ng laro .

Ang dami ay tinatawag nangungunang presyo ng laro .

Ang mga diskarte sa pinakamabuting kalagayan ay tinatawag malinis kung masiyahan nila ang pagkakapantay-pantay:

,

.

Ang dami ay tinatawag purong presyo ng laro , kung ang .

Mga pinakamabuting kalagayan na purong diskarte at form point saddle pagbabayad ng matrix.

Para sa punong saddle, ang mga sumusunod na kondisyon ay natutugunan:

iyon ay, ang elemento ay ang pinakamaliit sa hilera at ang pinakamalaking sa haligi.

Kaya, kung ang payoff matrix ay mayroon point saddle pagkatapos ay maaari mong mahanap pinakamainam na malinis na diskarte mga manlalaro.

Ang dalisay na diskarte ng manlalaro ay maaaring ako ay kinakatawan ng isang inayos na hanay ng mga numero (isang vector) kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa ika-apat na lugar, na kung saan ay katumbas ng isa.

Ang dalisay na diskarte ng player II ay maaaring kinakatawan ng isang iniutos na hanay ng mga numero (isang vector), kung saan ang lahat ng mga numero ay katumbas ng zero, maliban sa numero sa ika-apat na lugar, na katumbas ng isa.

Halimbawa

.

Sa pamamagitan ng pagpili ng anumang hilera ng payoff matrix bilang kanyang paglipat, tinitiyak ng manlalaro ang kanyang sarili na isang pinakamasamang kaso na pagbabayad ng hindi bababa sa halaga sa haligi na ipinahiwatig ng:

Samakatuwid, pipiliin ng manlalaro ang ika-2 hilera ng payoff matrix, na nagbibigay sa kanya ng maximum na kabayaran kahit ano ang paglipat ng player II, na susubukan na mabawasan ang halagang ito:

Iniisip ng Player II ang parehong paraan at pinipili ang 1st haligi bilang kanyang paglipat:

Kaya, mayroong isang saddle point ng pagbabayad ng matrix:

naaayon sa pinakamainam na purong diskarte para sa player I at para sa player II, kung saan player ay hindi ko binabawasan ang kanyang pakinabang para sa anumang pagbabago sa diskarte sa pamamagitan ng player II at player II ay hindi nadaragdagan ang kanyang pagkawala para sa anumang pagbabago sa diskarte ng player I.

5.3. Pinakamabuting halo-halong diskarte sa isang laro ng matris

Kung ang payoff matrix ay walang saddle point, kung gayon hindi makatwiran para sa sinumang manlalaro na gumamit ng isang dalisay na diskarte. Ito ay mas kapaki-pakinabang na gamitin "probabilistic mixtures" purong mga diskarte. Pagkatapos, ang halo-halong mga diskarte ay natutukoy bilang pinakamainam.

Hinahalong diskarte ng isang player ay nailalarawan sa pamamagitan ng posibilidad ng pamamahagi ng isang random na kaganapan na binubuo sa isang pagpipilian ng player ng isang ilipat.

Ang halo-halong diskarte ng player ko ay tulad ng isang iniutos na hanay ng mga numero (vector) na nasiyahan sa dalawang kundisyon:

1) para sa, i.e., ang posibilidad ng pagpili ng bawat hilera ng matrix ng pagbabayad ay hindi negatibo;

2), i.e., ang pagpili ng bawat isa sa mga hilera ng pagbabayad ng matrix sa pinagsama-samang kumakatawan buong pangkat mga kaganapan.

Ang halo-halong diskarte ng Player II ay magiging isang order na hanay ng mga numero (vector) na nasiyahan ang mga kondisyon:

Halaga ng pagbabayad sa player ko, na pumili ng isang halo-halong diskarte

mula sa player II na pumili ng isang halo-halong diskarte

,

kumakatawan sa average

.

Optimum tinatawag na halo-halong mga diskarte

at ,

kung para sa anumang mga di-makatarungang halo-halong mga diskarte at ang kondisyon ay nasiyahan:

iyon ay, sa ilalim ng pinakamainam na halo-halong diskarte, ang kabayaran ng player na ako ang pinakamalaki, at ang pagkawala ng player II ay ang pinakamaliit.

Kung walang point saddle sa payoff matrix, kung gayon

,

i.e., mayroong isang positibong pagkakaiba ( hindi pinapamahalang pagkakaiba )

- ³ 0,

at ang mga manlalaro ay kailangang maghanap ng karagdagang mga pagkakataon upang kumpiyansa na makakuha ng isang mas malaking bahagi ng pagkakaiba sa kanilang pabor.

Halimbawa

Isaalang-alang ang isang laro na ibinigay ng isang payoff matrix:

.

Alamin kung mayroong isang saddle point:

, .

Ito ay lumiliko na walang saddle point sa payoff matrix at ang hindi pinapamahalang pagkakaiba ay katumbas ng:

.

5.4. Paghahanap ng pinakamainam na halo-halong mga diskarte

para sa mga laro 2 × 2

Ang pagpapasiya ng pinakamainam na halo-halong mga diskarte para sa payoff matrix ng sukat ay isinasagawa sa pamamagitan ng pamamaraan ng paghahanap ng mga pinakamabuting kalagayan na mga puntos ng isang function ng dalawang variable.

Hayaan ang posibilidad ng player na pinili ko ang unang hilera ng pagbabayad ng matrix

ay pantay. Pagkatapos ang posibilidad ng pagpili ng pangalawang hilera ay.

Hayaan ang posibilidad ng pagpili ng player II na pumili ng unang haligi ay katumbas ng. Pagkatapos ang posibilidad ng pagpili ng pangalawang haligi ay.

Ang halaga ng pagbabayad sa player I sa pamamagitan ng player II ay katumbas ng:

Ang matinding halaga ng pakinabang ng player ko at ang pagkawala ng player II ay tumutugma sa mga kondisyon:

;

.

Kaya, ang pinakamainam na halo-halong mga diskarte ng mga manlalaro I at II ay ayon sa pagkakabanggit:

5.5. Geometric solution ng mga laro 2 ×n

Sa pagtaas ng sukat ng payoff matrix mula sa, hindi na posible na mabawasan ang pagpapasiya ng pinakamainam na halo-halong mga diskarte sa paghahanap ng pinakamabuting kalagayan ng isang function ng dalawang variable. Gayunpaman, ibinigay na ang isa sa mga manlalaro ay may dalawang mga diskarte lamang, maaaring magamit ang isang geometric solution.

Ang mga pangunahing yugto ng paghahanap ng isang solusyon sa laro ay ang mga sumusunod.

Ipakilala natin ang isang coordinate system sa eroplano. Gumuhit ng isang segment sa axis. Gumuhit ng mga patayo mula sa kaliwa at kanang mga dulo ng segment na ito.


Ang kaliwa at kanang dulo ng yunit ng seksyon ay tumutugma sa dalawang mga diskarte at magagamit para sa manlalaro I. Sa mga iginuhit na mga patayo ay ipagpaliban natin ang mga panalo ng manlalaro na ito. Halimbawa, para sa isang matrikula sa pagbabayad


ang nasabing payoff ng player ko kapag pumipili ng isang diskarte ay magiging at, at kapag pumipili ng isang diskarte ay magiging at.

Ipaalam sa amin na kumonekta sa pamamagitan ng mga tuwid na mga linya ng mga payoff point ng player na naaayon sa mga diskarte ng player II. Pagkatapos ang nabuo na sirang linya, na naghahawak ng graph mula sa ibaba, tinukoy ang mas mababang hangganan ng kabayaran ng manlalaro I.



Hanapin ang pinakamainam na halo-halong diskarte ng player ko

,

na tumutugma sa puntong nasa ibabang hangganan ng kabayaran ng manlalaro ko sa maximum na ordinate.

Tandaan na sa halimbawa na isinasaalang-alang, ang paggamit lamang ng dalawang mga diskarte at naaayon sa mga tuwid na linya na pumapasok sa nahanap na punto sa mas mababang hangganan ng kabayaran ng manlalaro I, ang player II ay maaaring mapigilan ang player na ako mula sa pagtanggap ng isang mas malaking bayad.

Kaya, ang laro ay nabawasan sa isang laro at ang pinakamainam na halo-halong diskarte ng player II sa halimbawang ito ay

,

kung saan ang posibilidad ay pareho sa laro:

5.6. Solusyon ng Larom× n

Kung ang isang laro ng matrix ay walang solusyon sa mga dalisay na estratehiya (i.e., walang point saddle) at, dahil sa malaking sukat ng payoff matrix, ay hindi malulutas ng grapiko, kung gayon upang makakuha ng isang solusyon, gamitin linear na paraan ng pagprograma .

Hayaan ang sukat ng payoff ng sukat:

.

Hanapin ang mga probabilidad , kung aling manlalaro ang dapat kong piliin ang kanyang mga gumagalaw para sa halo-halong diskarte na ito upang matiyak sa kanya ang isang pakinabang ng hindi bababa sa isang halaga, anuman ang pagpili ng mga gumagalaw sa pamamagitan ng player II.

Para sa bawat galaw na pinili ng player II, ang kabayaran ng player na ako ay tinutukoy ng mga dependencies:

Hatiin natin ang magkabilang panig ng hindi pagkakapareho sa pamamagitan ng at ipakilala ang bagong notasyon:

Pagkakapantay-pantay

Dadalhin ang form:

Dahil naglalayong ang player na i-maximize ang kabayaran, dapat na mabawasan ang gantimpala. Pagkatapos ang liham na problema sa programming para sa player na kukuha ko ng form:

may mga paghihigpit

Katulad nito, ang problema para sa player II ay itinayo bilang isang dalawahan:

may mga paghihigpit

Ang paglutas ng mga problema gamit ang simpleng pamamaraan, nakukuha namin:

,

5.7. Mga Tampok ng paglutas ng mga laro ng matrix

Bago lutasin ang problema sa paghahanap ng pinakamainam na mga diskarte, dapat suriin ang dalawang kundisyon:

Posible bang gawing simple ang matrix ng pagbabayad;

Mayroon bang point saddle ang pagbabayad.

Isaalang-alang natin ang posibilidad ng gawing simple ang matrix ng pagbabayad:

Dahil sa ang katunayan na player na hinahangad ko upang makakuha pinakamalaking panalo, pagkatapos ay maaari mong i-cross out ang linya mula sa matrix ng pagbabayad, dahil hindi niya gagamitin ang paglipat na ito kung ang sumusunod na kaugnayan ay nasiyahan sa anumang iba pang linya:

Katulad nito, ang pagsusumikap para sa pinakamaliit na pagkawala, ang player II ay hindi pipiliin ang haligi ng ith sa pay matrix bilang isang paglipat, at ang haligi na ito ay maaaring ma-cross kung ang sumusunod na ugnayan ay may hawak ng anumang iba pang haligi:

Karamihan simpleng solusyon ang laro ay ang pagkakaroon ng pinasimple na matrix ng pagbabayad ng isang punong punong nakakatugon sa sumusunod na kondisyon (sa pamamagitan ng kahulugan):

Halimbawa

Ibinibigay ang isang matrikula sa pagbabayad:

.

Pagpapasimple ng matrix ng pagbabayad:

Puno ng lungkot:

5.8. Nakikipaglaro sa kalikasan

Kabaligtaran sa mga problema ng teorya ng laro sa mga problema ng teorya mga desisyon sa istatistika ang isang hindi tiyak na sitwasyon ay walang pagkontra ng antagonistic na salungatan at nakasalalay sa layunin ng katotohanan, na karaniwang tinatawag "kalikasan" .

Sa mga laro ng matrix na may likas na katangian, ang player II ay nilalaro ng isang hanay ng mga hindi tiyak na mga kadahilanan na nakakaapekto sa kahusayan ng mga pagpapasya.

Ang mga laro ng matrix na may likas na katangian ay naiiba sa mga ordinaryong laro ng matrix lamang, na kapag pumipili ng isang pinakamainam na diskarte sa pamamagitan ng player ko, hindi na posible na gabayan ng katotohanan na ang player II ay susubukan na mabawasan ang kanyang pagkawala. Samakatuwid, kasama ang pagbabayad ng matrix, peligro ng matris :

saan ang halaga ng panganib ng player ko kapag gumagamit ng paglipat sa ilalim ng mga kondisyon na katumbas ng pagkakaiba sa pagitan ng kabayaran na tatanggap ng manlalaro kung alam niya na ang kondisyon ay maitatag, i.e. , at ang mga panalo na matatanggap niya, hindi alam kung pumipili ng isang paglipat na maitatag ang kundisyon.

Sa gayon, ang payoff matrix ay hindi mabago na-convert sa isang panganib na matrix, habang ang reverse conversion ay hindi maliwanag.

Halimbawa

Payoff matrix:

.

Panganib na Matrix:

Maaari dalawang pahayag sa problema tungkol sa pagpili ng isang solusyon sa isang laro ng matrix na may likas na katangian :

Pag-maximize ng mga panalo;

Ang pag-minimize ng panganib.

Ang problema sa paggawa ng desisyon ay maaaring magawa para sa isa sa dalawang kundisyon:

- nanganganib kung ang pag-andar ng pamamahagi ng posibilidad ng pamamahagi ng mga diskarte ng kalikasan ay kilala, halimbawa, ang random na halaga ng paglitaw ng bawat isa sa ipinapalagay na tiyak na mga sitwasyon sa ekonomiya;

- sa kawalan ng katiyakan kung hindi alam ang gayong isang posibilidad ng pamamahagi ng posibilidad.

5.9. Paglutas ng mga problema ng teorya ng mga desisyon sa istatistika

nanganganib

Kapag nagpapasya sa ilalim ng mga kondisyon ng peligro, player alam ko ang mga posibilidad ang simula ng mga estado ng kalikasan.

Kung gayon kinakailangan para sa player na pipiliin ko ang diskarte kung saan ang average na halaga ng mga panalo, kinuha bawat linya, maximum :

.

Kapag nalutas ang problemang ito sa isang panganib na matrix, nakukuha namin ang parehong solusyon na naaayon sa pinakamababang average na panganib :

.

5.10. Paglutas ng mga problema ng teorya ng mga desisyon sa istatistika

sa kawalan ng katiyakan

Kapag nagpapasya sa ilalim ng mga kondisyon ng kawalan ng katiyakan, maaari mong gamitin ang sumusunod pamantayan :

Wald's Maximin criterion;

Ang criterion kaunting panganib Sevija;

Ang criterion para sa pesimism ay ang optimismo ni Hurwitz;

Ang prinsipyo ni Laplace ng hindi sapat na batayan.

Isaalang-alang ang maximin test ni Wald .

Ang laro na may kalikasan ay nilalaro bilang isang makatwirang agresibo na kalaban, i.e., isang pamamaraan ng muling pagsiguro ay isinasagawa mula sa posisyon ng matinding pesimismo para sa matrikula sa pagbabayad:

.

Isaalang-alang Ang minimum na criterion ng pag-save ng pag-save .

Isang diskarte na katulad sa nauna mula sa posisyon ng matinding pesimismo para sa panganib na matrix:

.

Isaalang-alang criterion ng pesimism - optimismo ng Hurwitz .

Inaalok ang isang pagkakataon na hindi gagabay sa alinman sa matinding pesimismo o matinding pag-optimize:

kung saan ang antas ng pesimismo;

sa - matinding pag-optimize,

sa - matinding pesimismo.

Isaalang-alang Ang prinsipyo ni Laplace ng hindi sapat na batayan .

Ito ay pinaniniwalaan na ang lahat ng mga estado ng kalikasan ay pantay na malamang:

,

.

Mga konklusyon sa ikalimang seksyon

Sa laro ng matrix, ang dalawang manlalaro ay lumahok at ang payoff function, na nagsisilbi upang matukoy ang halaga ng pagbabayad ng pagkawala ng manlalaro sa nagwagi, ay kinakatawan sa anyo ng isang payoff matrix. Napagkasunduan na ang player na pipiliin ko ang isa sa mga hilera ng payoff matrix bilang isang paglipat, at pipiliin ng player II ang isa sa mga haligi nito. Pagkatapos, sa intersection ng napiling hilera at haligi ng matrix na ito, mayroong isang numerical na halaga ng pagbabayad sa player I mula sa player II (kung ang halagang ito ay positibo, kung gayon ang manlalaro ay talagang nanalo ako, at kung negatibo, pagkatapos ay manalo ang player II).

Kung mayroong isang saddle point sa payoff matrix, kung gayon ang mga manlalaro ay may pinakamainam na purong diskarte, iyon ay, upang manalo, ang bawat isa sa kanila ay dapat ulitin ang kanyang isang pinakamabuting paglipat. Kung walang point saddle, kung gayon ang bawat isa sa kanila ay dapat gumamit ng pinakamainam na halo-halong diskarte upang manalo, iyon ay, gumamit ng isang halo ng mga galaw, bawat isa ay dapat gumanap nang may pinakamainam na posibilidad.

Ang paghahanap para sa pinakamainam na halo-halong mga diskarte para sa 2 × 2 na laro ay isinasagawa sa pamamagitan ng pagkalkula ng pinakamainam na posibilidad na gumagamit ng mga kilalang formula. Sa pamamagitan ng geometric solution Para sa 2 × n na laro, ang kahulugan ng pinakamainam na halo-halong mga diskarte sa mga ito ay nabawasan sa paghahanap ng pinakamainam na halo-halong mga diskarte para sa 2 × 2 na mga laro. Upang malutas ang mga laro ng m × n, ginagamit ang isang linear na paraan ng programming upang mahanap ang pinakamainam na halo-halong mga diskarte sa kanila.

Ang ilang mga matrice sa pagbabayad ay nagpapahiram sa kanilang sarili sa pagpapasimple, bilang isang resulta kung saan ang kanilang sukat ay nabawasan sa pamamagitan ng pag-alis ng mga hilera at haligi na naaayon sa hindi nakakagambalang mga galaw.

Kung ang player II ay isang hanay ng mga hindi tiyak na mga kadahilanan na nakasalalay sa layunin ng katotohanan at walang pagkakaroon ng antagonistic na salungatan sa pagkakasalungatan, kung gayon ang ganitong laro ay tinatawag na isang laro na may likas na katangian, at ang mga problema ng teorya ng mga statistic na desisyon ay ginagamit upang malutas ito. Pagkatapos, kasama ang payoff matrix, ipinakilala ang isang panganib na matrix at dalawang pahayag ng problema ng pagpili ng isang solusyon sa laro ng matrix na may kalikasan ay posible: pag-maximize ang kabayaran at pag-minimize ng panganib.

Ang solusyon ng mga problema sa teorya ng mga statistic decision sa ilalim ng mga kondisyon ng peligro ay nagpapakita na ipinapayong para sa player na pipiliin ko ang diskarte kung saan ang average na halaga (pag-asa sa matematika) ng payoff na kinuha sa hilera ng payoff matrix ay maximum, o (na magkapareho) ang average na halaga (pag-asa sa matematika) ng peligro kinuha ng hilera ng panganib matrix ay minimal. Kapag nagpapasya sa ilalim ng mga kondisyon ng kawalan ng katiyakan, gamitin ang mga sumusunod na pamantayan: Ang pinakamaraming kriterya ni Wald, ang minimal na criterion ng panganib ni Sevidge, ang kritika ng pessimism-optimism ni Hurwitz, ang prinsipyo ni Laplace na hindi sapat na batayan.

Mga tanong sa pagsubok sa sarili

Paano tinukoy ang mga pangunahing konsepto ng teorya ng laro: ilipat, diskarte at payoff function?

Kumusta ang pagpapaandar ng payoff sa isang laro ng matrix?

Bakit ang isang laro ng matrix ay tinatawag na zero sum?

Paano kinakatawan ang proseso ng paglalaro ng laro ng matrix?

Anong laro ang tinatawag na isang m × n game?

Ano ang pinakamainam na diskarte sa laro ng matrix?

Ano ang pinakamainam na diskarte para sa isang laro ng matrix na tinatawag na puro?

Ano ang ibig sabihin ng saddle point ng payoff matrix?

Ano ang pinakamainam na diskarte para sa isang laro ng matrix na tinatawag na halo?

Paano lumilitaw ang halo-halong diskarte ng manlalaro?

Ano ang halaga ng pagbabayad sa Player I mula sa Player II, na pumili ng mga halo-halong mga diskarte?

Anong mga halo-halong diskarte ang tinatawag na pinakamainam?

Ano ang ibig sabihin ng hindi pinapamahaging pagkakaiba?

Anong pamamaraan ang ginamit upang mahanap ang pinakamainam na halo-halong mga diskarte para sa 2 × 2 na mga laro?

Paano natagpuan ang pinakamainam na halo-halong mga diskarte para sa 2 × n na mga laro?

Ano ang pamamaraan na ginagamit upang mahanap ang pinakamainam na halo-halong mga diskarte para sa mga laro ng m × n?

Ano ang mga tampok ng paglutas ng mga laro ng matrix?

Ano ang kahulugan ng pagiging simple ng pagbabayad ng matrix at sa ilalim ng anong mga kundisyon maaari itong gawin?

Aling laro ng matrix ang mas madaling malutas kapag ang payoff matrix ay mayroon o walang isang saddle point?

Ano ang mga problema sa teorya ng laro na nauugnay sa mga problema sa teorya ng mga desisyon sa istatistika?

Paano Nagbago ang Matrix ng Pagbabayad sa isang Panganib na Matrix?

Ano ang dalawang pahayag ng problema ng pagpili ng mga solusyon na posible sa isang laro ng matrix na may likas na katangian?

Para sa anong dalawang kundisyon ang maaaring maitakda ang mga problema sa paggawa ng desisyon sa isang laro ng matris na may likas na katangian?

Ano ang diskarte na angkop para sa player na pipiliin ko sa paglutas ng problema ng teorya ng mga desisyon sa istatistika sa ilalim ng mga kondisyon ng peligro?

Anong pamantayan sa paggawa ng desisyon ang maaaring magamit sa paglutas ng mga problema ng teorya ng mga desisyon sa istatistika sa ilalim ng mga kawalang-katiyakan?

Mga halimbawa ng paglutas ng problema

1. Ipinapakita ng matrikula sa pagbabayad ang halaga ng kita ng negosyo kapag nagbebenta ito iba't ibang uri mga produkto (haligi) depende sa matatag na demand (mga hilera). Kinakailangan upang matukoy ang pinakamainam na diskarte ng negosyo para sa paggawa ng mga produkto ng iba't ibang uri at kaukulang maximum (sa average) na kita mula sa kanilang pagbebenta.

Ipaalam sa amin na ipahiwatig ang ibinigay na matris sa at ipakilala ang mga variable. Gumagamit din kami ng isang matrix (vector). Pagkatapos at, i.e.

Ang kabaligtaran matrix ay kinakalkula:

Ang mga halaga ay matatagpuan:

.

Ang mga posibilidad ay kinakalkula:

Ang average na kita mula sa mga benta ay tinutukoy:

.

Ang Firm "Pharmacist" ay isang tagagawa ng mga gamot at biomedical na produkto sa rehiyon. Ito ay kilala na ang rurok na hinihingi para sa ilang mga gamot ay bumababa tag-araw (mga gamot ng pangkat ng cardiovascular, analgesics), para sa iba - para sa mga taglagas at tagsibol na panahon (anti-nakakahawang, antitussive).

Mga gastos para sa 1 conv. mga yunit Ang mga produkto para sa Setyembre-Oktubre ay: para sa unang pangkat (mga cardiovascular na gamot at analgesics) - 20 rubles; sa pangalawang pangkat (anti-nakakahawang, gamot na antitussive) - 15 rubles.

Ayon sa mga obserbasyon para sa marami mga nakaraang taon ang serbisyo sa pagmemerkado ng kumpanya ay natagpuan na maaari itong mapagtanto sa loob ng dalawang buwan na isinasaalang-alang sa mainit-init na panahon 3050 conv. mga yunit mga produkto ng unang pangkat at 1100 conv. mga yunit mga produkto ng pangalawang pangkat; sa malamig na panahon - 1525 conv. mga yunit mga produkto ng unang pangkat at 3690 conv. mga yunit ang pangalawang pangkat.

Kaugnay ng mga posibleng pagbabago sa panahon, ang gawain ay nakuha - upang matukoy ang diskarte ng kumpanya sa paggawa ng mga produkto na nagbibigay ng maximum na kita mula sa mga benta sa isang presyo ng benta na 40 rubles. para sa 1 conv. mga yunit mga produkto ng unang pangkat at 30 rubles. - ang pangalawang pangkat.

DESISYON. Ang firm ay may dalawang diskarte:

Ang panahon ay magiging mainit-init sa taong ito;

Malamig ang panahon.

Kung ang kumpanya ay nagpatibay ng isang diskarte at sa katotohanan magkakaroon ng mainit-init na panahon (diskarte sa kalikasan), pagkatapos ay ang output (3050 maginoo na yunit ng unang pangkat ng mga gamot at 1100 mga maginoo na yunit ng pangalawang pangkat) ay ganap na ibebenta at ang kita ay magiging

3050 × (40-20) + 1100 × (30-15) \u003d 77500 p.

Sa malamig na panahon (diskarte sa kalikasan), ang mga gamot ng pangalawang pangkat ay ibebenta nang buo, at ang unang pangkat lamang sa halagang 1525 conv. mga yunit at ang ilan sa mga gamot ay mananatiling hindi natanto. Ang kita ay

1525 × (40-20) + 1100 × (30-15) -20 × () \u003d 16500 p.

Katulad nito, kung ang form ay nagpatibay ng isang diskarte at ang panahon ay talagang malamig, kung gayon ang magiging kita

1525 × (40-20) + 3690 × (30-15) \u003d 85850 p.

Sa mainit na panahon, ang kita ay

1525 × (40-20) + 1100 × (30-15) - () × 15 \u003d 8150 p.

Isinasaalang-alang ang firm at ang panahon bilang dalawang manlalaro, nakakakuha kami ng matrix ng pagbabayad

,

Ang presyo ng laro ay namamalagi sa saklaw

Makikita mula sa matrix ng pagbabayad na, sa ilalim ng lahat ng mga kundisyon, ang kita ng kompanya ay hindi bababa sa 16,500 rubles, ngunit kung ang kondisyon ng panahon ay nag-tutugma sa napiling diskarte, kung gayon ang kita ng kompanya ay maaaring maging 77,500 rubles.

Maghanap ng isang solusyon sa laro.

Ipagpalagay natin ang posibilidad ng diskarte ng firm na inilalapat ng, diskarte sa pamamagitan ng, at. Malulutas ang laro sa graph sa pamamagitan ng pamamaraan, nakukuha namin , habang ang presyo ng laro ay p.

Ang pinakamainam na plano sa paggawa ng gamot ay

Kaya, ipinapayong para sa kumpanya na makagawa noong Setyembre at Oktubre 2379 conv. mga yunit gamot ng unang pangkat at 2239.6 conv. mga yunit gamot sa pangalawang pangkat, pagkatapos sa anumang panahon ay makakatanggap siya ng kita ng hindi bababa sa 46986 rubles.

Sa mga kondisyon ng kawalan ng katiyakan, kung hindi posible para sa isang firm na gumamit ng isang halo-halong diskarte (mga kontrata sa iba pang mga organisasyon), ginagamit namin ang mga sumusunod na pamantayan upang matukoy ang pinakamainam na diskarte ng firm:

Walde criterion:

Hurwitz criterion: para sa pagpapaliwanag, tatanggapin namin, pagkatapos para sa diskarte ng firm

para sa diskarte

ipinapayong para sa firm na gumamit ng isang diskarte.

Criterion ng pag-save. Ang maximum na elemento sa unang haligi ay 77500, sa pangalawang haligi ito ay 85850.

Ang mga elemento ng panganib matrix ay matatagpuan mula sa expression

,

kung saan ,,

Ang panganib matrix ay may form

,

ipinapayong gamitin ang diskarte o.

Samakatuwid, ipinapayong para sa kompanya na mag-apply ng diskarte o.

Tandaan na ang bawat isa sa mga itinuturing na pamantayan ay hindi makikilala bilang ganap na kasiya-siya para sa panghuling pagpipilian Gayunpaman, ang kanilang mga pinagsamang pagsusuri ay nagbibigay-daan sa iyo upang mas malinaw na kumakatawan sa mga kahihinatnan ng paggawa ng ilang mga desisyon sa pamamahala.

Sa isang kilalang pamamahagi ng mga probabilidad para sa iba't ibang mga estado ng kalikasan, ang pagpapasya sa pagpapasya ay ang pinakamataas na pag-asa sa matematika ng isang kabayaran.

Ipaalam ito sa problema sa pagsasaalang-alang na ang mga posibilidad ng mainit at malamig na panahon ay pantay at pantay sa 0.5, kung gayon ang pinakamainam na diskarte ng kumpanya ay natutukoy tulad ng sumusunod:

Maipapayo para sa isang firm na gumamit ng isang diskarte o.

Mga takdang aralin sa sarili

1. Ang isang negosyo ay maaaring makagawa ng tatlong uri ng mga produkto (A, B at C), habang tumatanggap ng kita na nakasalalay sa hinihingi. Ang kahilingan, sa turn, ay maaaring tumagal ng isa sa apat na estado (I, II, III at IV). Sa mga sumusunod na matris, ang mga elemento ay sumasalamin sa kita na matatanggap ng negosyo kapag gumagawa ng pang-produkto at ang pang-estado ng demand:

Kung sa laro ang bawat isa sa mga kalaban ay nalalapat lamang sa parehong diskarte, pagkatapos ay tungkol sa laro mismo sa kasong ito sinabi nila na nangyayari ito sa mga purong diskarte , at ginamit ng player AT at ang manlalaro SA ang isang pares ng mga diskarte ay tinatawag purong mga diskarte .

Kahulugan. Sa isang antagonistic na laro, isang pares ng mga diskarte ( AT ako , SA j) ay tinatawag na balanse o matatag kung hindi kumikita para sa sinumang manlalaro na lumihis mula sa kanyang diskarte.

Makatuwiran na gumamit ng dalisay na diskarte kapag ang mga manlalaro AT at SA magkaroon ng impormasyon tungkol sa bawat kilos ng bawat isa at nakamit ang mga resulta. Kung ipinapalagay natin na hindi bababa sa isa sa mga partido ay hindi nalalaman ang tungkol sa pag-uugali ng kalaban, kung gayon ang ideya ng balanse ay nilabag at ang laro ay nilalaro ng haphazardly.

Isaalang-alang ang laro ng matris G (3x4)

Sa halimbawang ito, ang mas mababang presyo ng laro ay katumbas ng pang-itaas: \u003d\u003d 9, i.e. ang laro ay may puntong punla.

Ito ay lumiliko na sa kasong ito ang pinakamataas na diskarte AT 2 at SA 2 ay mapanatili na may kaugnayan sa impormasyon tungkol sa pag-uugali ng kalaban.

Sa katunayan, hayaan ang player AT nalaman na ang kaaway ay gumagamit ng isang diskarte SA 2. Ngunit sa kasong ito ang player AT mananatili pa rin sa diskarte AT 2, dahil ang anumang paglihis mula sa diskarte AT Bawasan lamang ang panalo. Pareho, ang impormasyong natanggap ng player SAhindi pipilitin siyang lumihis sa kanyang diskarte SA 2 .

Ang isang pares ng mga diskarte AT 2 at SA 2 nagtataglay ng pag-aari ng katatagan, at ang payoff (sa itinuturing na halimbawa, ito ay katumbas ng 9), na nakamit kasama ang pares ng mga estratehiya, na ito ay naging saddle point ng payoff matrix.

Ang tanda ng katatagan (balanse) ng isang pares ng diskarte ay ang pagkakapantay-pantay ng mas mababa at nangungunang presyo mga laro.

Diskarte AT ako at SA j (sa itinuturing na halimbawa AT 2 , SA 2), kung saan ang mas mababa at itaas na mga presyo ng laro ay pantay, ay tinatawag na pinakamainam na purong diskarte, at ang kanilang kumbinasyon ay tinatawag na larong solusyon. Sa kasong ito, ang laro mismo ay sinasabing malulutas sa purong mga diskarte.

Ang halaga ay tinatawag na gastos ng laro.

Kung 0, kung gayon ang laro ay kapaki-pakinabang para sa player A, kung 0 - para sa player B; para sa \u003d 0 ang patas ay patas, i.e. ay pantay na kapaki-pakinabang para sa parehong mga kalahok.

Gayunpaman, ang pagkakaroon ng isang punung-punong point sa isang laro ay malayo sa isang patakaran, sa halip isang eksepsiyon. Karamihan sa mga laro ng matrix ay walang saddle point, at samakatuwid ay walang optimal na mga diskarte na purong. Gayunpaman, mayroong isang uri ng mga laro na palaging may punong punla at, samakatuwid, ay nalulutas sa mga dalisay na diskarte. Ito ay mga laro kasama kumpletong impormasyon.

Teorya 2. Ang bawat laro na may kumpletong impormasyon ay may puntong punla at, samakatuwid, ay nalulutas sa mga dalisay na estratehiya, i. mayroong isang pares ng pinakamainam na purong estratehiya na nagbibigay ng isang matatag na kabayaran na katumbas.

Kung ang nasabing laro ay binubuo lamang ng mga personal na galaw, pagkatapos kapag inilalapat ng bawat manlalaro ang kanyang pinakamainam na dalisay na diskarte, dapat itong magtapos sa isang panalo na katumbas ng presyo ng laro. Halimbawa, ang isang laro ng chess, bilang isang laro na may kumpletong impormasyon, alinman ay laging nagtatapos sa isang panalo para sa puti, o palaging may isang panalo para sa itim, o palaging may isang draw (kung ano mismo - hindi namin alam, dahil ang bilang ng mga posibleng mga diskarte sa isang laro ng chess ay napakalaki).

Kung ang laro matrix ay naglalaman ng isang saddle point, pagkatapos ang solusyon nito ay agad na natagpuan alinsunod sa pinakamataas na prinsipyo.

Ang tanong ay lumitaw: kung paano makahanap ng isang solusyon sa isang laro na ang matrikula sa pagbabayad ay walang saddle point? Ang application ng pinakamataas na prinsipyo ng bawat isa sa mga manlalaro ay nagbibigay ng player A ng hindi bababa sa isang pakinabang, at isang pagkawala para sa manlalaro. Isinasaalang-alang na ito ay natural para sa player A na nais na madagdagan ang kanyang mga panalo, at para sa player B upang mabawasan ang kanyang pagkawala. Ang paghahanap para sa isang solusyon ay humantong sa pangangailangan na mag-aplay ng mga halo-halong mga diskarte: kahaliling dalisay na diskarte na may ilang mga dalas.

Kahulugan. Ang isang random variable na ang mga halaga ay purong mga diskarte ng player ay tinatawag na kanyang halo-halong diskarte .

Kaya, ang gawain ng halo-halong diskarte ng manlalaro ay binubuo sa pagpapahiwatig ng mga posibilidad na pinili ang kanyang purong mga diskarte.

Itinutukoy namin ang halo-halong mga diskarte ng mga manlalaro AT at SA ayon sa pagkakabanggit

S A \u003d || p 1, p 2, ..., p m ||,

S B \u003d || q 1, q 2, ..., q n ||,

kung saan ang p i ay ang posibilidad ng paggamit ng player AT malinis mula sa diskarte AT ako; ; q j - ang posibilidad ng player B gamit ang purong diskarte B j; ...

Sa espesyal na kaso, kapag ang lahat ng mga posibilidad, maliban sa isa, ay pantay sa zero, at ang isang ito ay pantay sa isa, ang halo-halong diskarte ay nagiging isang dalisay.

Ang paggamit ng halo-halong mga diskarte ay isinasagawa, halimbawa, sa sumusunod na paraan: ang laro ay paulit-ulit na maraming beses, ngunit sa bawat laro ang player ay nalalapat ang iba't ibang mga dalisay na diskarte na may mga kamag-anak na mga frequency ng kanilang aplikasyon na katumbas ng p ako at q j .

Ang halo-halong mga diskarte sa teorya ng laro ay isang modelo ng likido, kakayahang umangkop na mga taktika, na hindi alam ng manlalaro kung aling malinis na diskarte ang pipiliin ng kalaban sa isang naibigay na laro.

Kung ang player AT nalalapat ang halo-halong diskarte S A \u003d || p 1, p 2, ..., p m ||, at player SA halo-halong diskarte S B \u003d || q 1, q 2, ..., q n ||, pagkatapos ay ang average na kabayaran (pag-asa sa matematika) ng player AT ay tinutukoy ng ratio

Naturally, ang inaasahang pagkawala ng player SA katumbas ng parehong halaga.

Kaya, kung ang laro ng matrix ay walang isang saddle point, pagkatapos ay dapat gamitin ng manlalaro ang pinakamainam na halo-halong diskarte na magbibigay ng maximum na kabayaran.

Ang tanong ay natural na lumitaw: anong pagsasaalang-alang ang dapat sundin kapag pumipili ng mga halo-halong mga diskarte? Ito ay lumiliko na ang pinakamataas na prinsipyo ay nagpapanatili ng kahalagahan sa kasong ito. Bukod sa, mahalaga upang maunawaan ang solusyon ng mga laro, i-play ang pangunahing teorema ng teorya ng laro.

Mga pamamaraan at modelo ng matematika sa ekonomiya

Mga laro sa Matrix

Panimula

Sa kasanayang pang-ekonomiya, ang mga sitwasyon ay madalas na lumitaw kung saan ang iba't ibang mga partido ay nagtutugis ng iba't ibang mga layunin. Halimbawa, ang ugnayan sa pagitan ng isang nagbebenta at isang mamimili, isang tagapagtustos at isang consumer, isang bangko at isang depositor, atbp. Ang ganitong mga sitwasyon ng salungatan ay lumitaw hindi lamang sa ekonomiya, kundi sa iba pang mga aktibidad. Halimbawa, kapag naglalaro ng chess, checker, domino, loto, atbp.

Isang laro- ito ay matematikal na modelo sitwasyon sa kaguluhan kasangkot sa hindi bababa sa dalawang tao na gumagamit ng maraming iba't ibang paraan upang makamit ang iyong mga layunin. Ang laro ay tinatawag silid-pasingawan, kung ang dalawang manlalaro ay nakikilahok dito. Ang laro ay tinatawag antagonistic, kung ang pakinabang ng isang manlalaro ay katumbas ng pagkawala ng isa pa. Samakatuwid, upang tukuyin ang laro, sapat na upang itakda ang mga halaga ng mga kabayaran ng isang manlalaro sa iba't ibang mga sitwasyon.

Ang anumang paraan ng pagkilos ng manlalaro, depende sa kasalukuyang sitwasyon, ay tinawag diskarte. Ang bawat manlalaro ay may isang tiyak na hanay ng mga diskarte. Kung ang bilang ng mga diskarte ay may hangganan, kung gayon ang laro ay tinatawag panghuli, kung hindi - walang katapusang . Ang mga diskarte ay tinawag malinis, kung ang bawat isa sa mga manlalaro ay pumili lamang ng isang diskarte sa isang tiyak at hindi random na paraan.

Solusyon ng Laroay pumili ng isang diskarte na kasiya-siya kalagayan ng pagiging maaasahan. Ang kundisyong ito ay nakakakuha ng isang manlalaro maximum na panalo, kung ang pangalawang sumunod sa kanyang diskarte. Sa kabaligtaran, natatanggap ang pangalawang manlalaro kaunting pagkawala, kung ang unang manlalaro ay nananatili sa kanyang diskarte. Ang ganitong mga diskarte ay tinatawag pinakamabuting kalagayan . Kaya, ang layunin ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

Nagpe-play sa mga dalisay na diskarte

Isaalang-alang ang isang laro na may dalawang manlalaro AT at SA.Ipagpalagay na ang player ATmayroon ito mestratehiya А 1, А 2, ..., А mat ang manlalaro SAmayroon ito nestratehiya B 1, B 2, ..., B n.Ipapalagay namin na ang pagpipilian ng player ATdiskarte A ako,at ang manlalaro SAdiskarte B jnatatanging tinutukoy ang kinalabasan ng laro, i.e. makakuha isang ijmanlalaro ATat manalo b ijmanlalaro SA.Dito i \u003d 1,2, ..., m, j \u003d 1,2, ..., n.

Ang pinakasimpleng laro kasama ang dalawang manlalaro ay isang antagonistic na laro , mga. isang laro kung saan ang mga interes ng mga manlalaro ay direktang kabaligtaran. Sa kasong ito, ang kabayaran ng mga manlalaro ay nauugnay sa pagkakapantay-pantay

b ij \u003d -a ij

Ang pagkakapantay-pantay na ito ay nangangahulugan na ang pagkakaroon ng isa sa mga manlalaro ay pantay sa pagkawala ng iba. Sa kasong ito, sapat na upang isaalang-alang lamang ang mga pagbabayad ng isa sa mga manlalaro, halimbawa, ang player AT.

Ang bawat pares ng mga diskarte A iat B jpanalo win isang ijmanlalaro AT.Maginhawang isulat ang lahat ng mga panalo na ito sa anyo ng tinatawag na pagbabayad ng matrix

Ang mga hilera ng matris na ito ay tumutugma sa mga diskarte ng player AT,at ang mga haligi ay para sa mga diskarte ng player SA.Sa pangkalahatan, ang ganitong laro ay tinatawag (m × n) -game.


Halimbawa 1.Dalawang manlalaro AT at SAmagtapon ng isang barya. Kung ang mga panig ng barya ay nag-tutugma, pagkatapos ay mananalo AT, i.e. manlalaro SAnagbabayad ang player ATilang halagang katumbas ng 1, at kung hindi sila nagkakasabay, pagkatapos manalo ang player B, i.e. sa kabaligtaran, ang player ATnagbabayad ang player SAsa parehong halaga , pantay 1. Bumuo ng isang matrix ng pagbabayad.

Desisyon.Sa pamamagitan ng kondisyon ng problema

© 2020 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway