Teorya ng laro at mga pagpapasya sa istatistika.

pangunahing / Asawang mandaraya

Ang pagpipilian ng isang aksyon ng manlalaro ay tinawag gumalaw... May galaw pansarili (ang manlalaro ay sadyang gumawa nito o sa pagpapasyang iyon) at sapalaran (ang kinalabasan ng laro ay hindi nakasalalay sa kalooban ng manlalaro). Ang hanay ng mga patakaran na tumutukoy kung aling paglipat ang kailangang gawin ng manlalaro ay tinawag diskarte... Ang mga diskarte ay malinis (di-random na mga desisyon ng mga manlalaro) at magkakahalo (ang diskarte ay maaaring isaalang-alang bilang isang random variable).

Saddle point

SA teorya ng laro S. t. ( elemento ng saddle) ay ang pinakamalaking elemento ng haligi laro matrices, na sabay na pinakamaliit na elemento ng kaukulang hilera (sa zero-sum na laro ng dalawang tao). Sa puntong ito, samakatuwid, ang maximin ng isang manlalaro ay katumbas ng pinakamaliit na iba pa; S. t. Mayroong isang punto punto ng balanse.

Minimax theorem

Ang diskarte na naaayon sa minimax ay tinawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ng pagpili ng pinaka "maingat" na mga diskarte sa maximin at minimax ay tinawag ang prinsipyo ng minimax... Ang prinsipyong ito ay sumusunod mula sa makatuwirang palagay na hinahangad ng bawat manlalaro na makamit ang isang layunin na kabaligtaran ng kalaban.

Pinipili ng manlalaro ang kanyang mga aksyon, ipinapalagay na ang kalaban ay kikilos sa isang hindi kanais-nais na paraan, ibig sabihin susubukan na "saktan".

Pag-andar ng pagkawala

Pag-andar ng pagkawala - isang pagpapaandar na, sa teorya ng mga pagpapasyang pang-istatistika, nailalarawan ang pagkawala sa kaso ng maling paggawa ng desisyon batay sa naobserbahang data. Kung ang problema sa pagtantya ng parameter ng signal laban sa background ng ingay ay nalulutas, kung gayon ang pagkawala ng pag-andar ay isang sukatan ng pagkakaiba sa pagitan ng totoong kahulugan ng tinatayang parameter at ang pagtatantya ng parameter

Pinakamainam na Diskarte sa Mixed Player ay isang kumpletong hanay ng mga aplikasyon ng mga purong diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kundisyon na may naibigay na posibilidad.

Ang halo-halong diskarte ng manlalaro ay isang kumpletong hanay ng pag-apply ng kanyang purong diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kundisyon na may ibinigay na mga posibilidad.

1. Kung ang lahat ng mga elemento ng isang hilera ay hindi mas malaki kaysa sa mga kaukulang elemento ng isa pang hilera, kung gayon ang orihinal na hilera ay maaaring matanggal mula sa matrix ng pagbabayad. Gayundin sa mga haligi.

2. Ang gastos ng laro ay natatangi.

Doc: sabihin nating mayroong 2 presyo ng laro v at, na naabot sa isang pares at, ayon sa pagkakabanggit, pagkatapos

3. Kung ang parehong numero ay naidagdag sa lahat ng mga elemento ng payoff matrix, kung gayon ang pinakamainam na halo-halong mga diskarte ay hindi magbabago, at ang presyo ng laro ay tataas ng numerong ito.

Doc:
kung saan

4. Kung ang lahat ng mga elemento ng payoff matrix ay pinarami ng parehong numero na nonzero, ang presyo ng laro ay maparami ng bilang na ito, at ang mga pinakamainam na diskarte ay hindi magbabago.

Ang halo-halong diskarte SA ng manlalaro A ay ang aplikasyon ng purong mga diskarte A1, A2, ..., Am na may mga posibilidad na p1, p2, ..., pi, ..., pm at ang kabuuan ng mga posibilidad na katumbas ng 1: Ang mga halo-halong diskarte ng manlalaro A ay nakasulat sa anyo ng isang matrix o bilang isang string SA \u003d (p1, p2, ..., pi, ..., pm) Katulad nito, ang magkahalong mga diskarte ng manlalaro B ay tinukoy ng :, o , SB \u003d (q1, q2, ..., qi, ..., qn), kung saan ang kabuuan ng mga posibilidad ng paglitaw ng mga diskarte ay 1: Malinis na diskarte maaaring maituring na isang espesyal na kaso ng halo-halong at ibinigay ng isang string kung saan ang 1 ay tumutugma sa isang purong diskarte. Batay sa prinsipyo ng minimax, natutukoy ang pinakamainam na solusyon (o solusyon) ng laro: ito ay isang pares ng pinakamainam na diskarte na S * A, S * B, sa pangkalahatang kaso, halo-halong, sa mga sumusunod na pag-aari: kung ang isa ng mga manlalaro ay sumusunod sa kanyang pinakamainam na diskarte, kung gayon hindi ito maaaring maging kapaki-pakinabang para sa iba pang lumihis mula sa kanya. Ang kabayaran na naaayon sa pinakamainam na solusyon ay tinatawag na gastos ng larong v. Ang presyo ng laro ay nasiyahan ang hindi pagkakapantay-pantay :? ? v? ? (3.5) saan? at? - ang mas mababang at mataas na mga presyo ng laro. Ang sumusunod na pangunahing teorya ng teorya ng laro ay totoo - teorama ni Neumann. Ang bawat end game ay mayroong kahit na isang pinakamainam na solusyon, posibleng kabilang sa magkahalong diskarte... Hayaan ang S * A \u003d (p * 1, p * 2, ..., p * i, ..., p * m) at S * B \u003d (q * 1, q * 2, ..., q * Ang i, ..., q * n) ay isang pares ng pinakamainam na diskarte. Kung ang isang dalisay na diskarte ay kasama sa pinakamainam na halo-halong diskarte na may posibilidad na nonzero, kung gayon ito ay tinatawag na aktibo. Ang teorama sa mga aktibong diskarte ay may bisa: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte, kung gayon ang bayad ay mananatiling hindi nagbabago at katumbas ng presyo ng laro v, kung ang pangalawang manlalaro ay hindi lalampas sa mga limitasyon ng kanyang mga aktibong diskarte. Ang teoryang ito ay may dakilang praktikal na kahalagahan - nagbibigay ito ng mga tiyak na modelo para sa paghahanap ng pinakamainam na mga diskarte sa kawalan ng isang saddle point. Isaalang-alang ang isang 2 × 2 na laro, na kung saan ay ang pinakasimpleng kaso ng isang may hangganan na laro. Kung ang naturang laro ay may isang saddle point, kung gayon ang pinakamainam na solusyon ay isang pares ng purong mga diskarte na naaayon sa puntong ito. Isang laro na walang saddle point, alinsunod sa pangunahing teorya ng teorya ng laro, umiiral ang isang pinakamainam na solusyon at natutukoy ng isang pares ng magkakahalong diskarte S * A \u003d (p * 1, p * 2) at S * B \u003d (q * 1, q * 2) ... Upang hanapin ang mga ito, gagamitin namin ang teorama sa mga aktibong diskarte. Kung ang manlalaro A ay sumusunod sa kanyang pinakamainam na diskarte na S "A, kung gayon ang kanyang average na kabayaran ay magiging katumbas ng presyo ng laro v, hindi mahalaga kung anong aktibong diskarte ang ginagamit ng manlalaro B. Para sa isang 2 × 2 na laro, ang anumang purong diskarte ng kalaban ay aktibo kung walang saddle point. Ang kabayaran ng player A (pagkawala ng player B) ay isang random variable, inaasahang halaga (average) na kung saan ay ang presyo ng laro. Samakatuwid, ang average na kabayaran ng manlalaro A (pinakamainam na diskarte) ay magiging katumbas ng v para sa parehong ika-1 at ika-2 na diskarte ng kalaban. Hayaan ang laro na tinukoy ng payoff matrix. Ang average na kabayaran ng manlalaro A kung gumagamit siya ng pinakamainam na halo-halong diskarte, at ginagamit ng manlalaro B ang purong diskarte na B1 (tumutugma ito sa ika-1 haligi ng payoff matrix P), ay katumbas ng presyo ng laro v: a11 p * 1 + a21 p * 2 \u003d v. Ang Player A ay nakakakuha ng parehong average na kabayaran kung ang ika-2 manlalaro ay naglalapat ng diskarte B2, ibig sabihin a12 p * 1 + a22 p * 2 \u003d v. Isinasaalang-alang ang p * 1 + p * 2 \u003d 1, nakakakuha kami ng isang sistema ng mga equation para sa pagtukoy ng pinakamainam na diskarte S "A at ang presyo ng laro v: (3.6) Ang paglutas sa sistemang ito, nakukuha namin ang pinakamainam na diskarte (3.7 ) at ang presyo ng laro (3.8). aktibong mga diskarte kapag naghahanap ng SB * - ang pinakamainam na diskarte ng player B, nalaman namin na para sa anumang purong diskarte ng manlalaro A (A1 o A2), ang average na pagkawala ng manlalaro B ay katumbas ng ang presyo ng laro v, ibig sabihin (3.9) Pagkatapos ang pinakamainam na diskarte ay natutukoy ng mga formula: (3.10)

Mga pamamaraan at modelo ng matematika sa ekonomiya

Mga laro ng matrix

Panimula

Sa praktikal na pang-ekonomiya, madalas na lumitaw ang mga sitwasyon kung saan ang iba't ibang mga partido ay naghabol ng iba't ibang mga layunin. Halimbawa, ang ugnayan sa pagitan ng isang nagbebenta at isang mamimili, isang tagapagtustos at isang mamimili, isang bangko at isang depositor, atbp. Ang mga nasabing sitwasyon ng hidwaan ay lumitaw hindi lamang sa ekonomiya, ngunit sa iba pang mga aktibidad. Halimbawa, kapag naglalaro ng chess, mga pamato, domino, loto, atbp.

Isang laro- ito ay matematikal na modelo sitwasyon ng pagkakasalungatan na kinasasangkutan ng hindi bababa sa dalawang tao na gumagamit ng marami iba't ibang paraan upang makamit ang iyong mga layunin. Tinawag ang laro silid-pasingawan, kung dalawang manlalaro ang lumahok dito. Tinawag ang laro kalaban, kung ang nakuha ng isang manlalaro ay katumbas ng pagkawala ng isa pa. Samakatuwid, upang maitakda ang laro, sapat na upang itakda ang mga halaga ng mga kabayaran ng isang manlalaro sa iba't ibang mga sitwasyon.

Ang anumang paraan ng pagkilos ng manlalaro, depende sa kasalukuyang sitwasyon, ay tinawag diskarte Ang bawat manlalaro ay may isang tukoy na hanay ng mga diskarte. Kung ang bilang ng mga diskarte ay may hangganan, pagkatapos ang laro ay tinatawag panghuli, kung hindi man - walang katapusang . Tinatawag ang mga diskarte malinis, kung ang bawat isa sa mga manlalaro ay pipili lamang ng isang diskarte sa isang tiyak at hindi random na paraan.

Solusyon sa laroay ang pumili ng isang diskarte na nagbibigay-kasiyahan kalagayan ng pagiging optimidad. Ang kundisyong ito ay nakukuha ng isang manlalaro maximum na panalo, kung ang pangalawa ay sumusunod sa kanyang diskarte. Sa kabaligtaran, natatanggap ng pangalawang manlalaro kaunting pagkawala, kung ang unang manlalaro ay nananatili sa kanyang diskarte. Ang mga nasabing diskarte ay tinawag pinakamainam . Kaya, ang layunin ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

Puro laro ng diskarte

Isaalang-alang ang isang laro kasama ang dalawang manlalaro AT at SA.Ipagpalagay na ang manlalaro ATmayroon ito mestratehiya А 1, А 2, ..., А mat ang manlalaro SAmayroon ito nestratehiya B 1, B 2, ..., B n.Ipagpalagay namin na ang pagpipilian ng manlalaro ATdiskarte A ako,at ang manlalaro SAdiskarte B jnatatanging tumutukoy sa kinalabasan ng laro, ibig sabihin makakuha isang ijmanlalaro ATat manalo b ijmanlalaro SA.Dito i \u003d 1,2, ..., m, j \u003d 1,2, ..., n.

Ang pinakasimpleng laro ng dalawang manlalaro ay isang antagonistic na laro , mga yan isang laro kung saan ang interes ng mga manlalaro ay direktang kabaligtaran. Sa kasong ito, ang mga kabayaran ng mga manlalaro ay nauugnay sa pagkakapantay-pantay

b ij \u003d -a ij

Ang pagkakapantay-pantay na ito ay nangangahulugan na ang nakuha ng isa sa mga manlalaro ay katumbas ng pagkawala ng iba. Sa kasong ito, sapat na upang isaalang-alang lamang ang mga kabayaran ng isa sa mga manlalaro, halimbawa, ang manlalaro AT.

Ang bawat pares ng mga diskarte A iat B jtumugma sa panalo isang ijmanlalaro AT.Maginhawa upang isulat ang lahat ng mga panalo na ito sa anyo ng tinaguriang bayad sa matrix

Ang mga hilera ng matrix na ito ay tumutugma sa mga diskarte ng manlalaro AT,at ang mga haligi ay para sa mga diskarte ng manlalaro SA.Sa pangkalahatan, ang naturang laro ay tinatawag (m × n) -game.


Halimbawa 1.Dalawang manlalaro AT at SAmagtapon ng barya. Kung ang mga gilid ng barya ay nag-tutugma, pagkatapos ay nanalo AT, ibig sabihin manlalaro SAbinabayaran ang manlalaro ATilang kabuuan na katumbas ng 1, at kung hindi sila nag-tutugma, nanalo ang manlalaro B, ibig sabihin sa laban, ang manlalaro ATbinabayaran ang manlalaro SAsa parehong halaga , pantay 1. Bumuo ng isang matrix sa pagbabayad.

Desisyon.Sa kondisyon ng problema

Puro diskarte Ang Player I ay pipili ng isa sa mga n hilera ng payoff matrix A, at ang dalisay na diskarte ng manlalaro II ay ang pagpili ng isa sa mga haligi ng parehong matrix.

Ang mga pinakamainam na dalisay na diskarte ng mga manlalaro ay naiiba mula sa mga halo-halong mga sa pamamagitan ng pagkakaroon ng isang sapilitan na yunit p i \u003d 1, q i \u003d 1. Halimbawa: P (1,0), Q (1,0). Dito p 1 \u003d 1, q 1 \u003d 1.

Suliranin 1
Gamit ang matrix sa pagbabayad, hanapin ang pinakamainam na malinis na mga diskarte gamit ang prinsipyo ng mahigpit na pangingibabaw. Bilang isang sagot, isulat ang mga vector na P *, Q *.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Desisyon:

Malulutas namin ang lahat ng mga problema sa paggamit ng calculator ng Matrix Game.

Ipinapalagay namin na ang manlalaro ay pipiliin ko ang kanyang diskarte upang makuha ang kanyang maximum na kabayaran, at pipiliin ng manlalaro II ang kanyang diskarte upang mabawasan ang kabayaran ng manlalaro I.

Mga manlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 13 1 2 5 1
A 22 0 0 3 0
Isang 3-3 -5 -5 -2 -5
Isang 40 -2 -2 1 -2
b \u003d max (B i)3 1 2 5
Natagpuan namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng larong a \u003d max (a i) \u003d 1, na nagsasaad ng maximum na purong diskarte A 1.
Ang pinakamataas na presyo ng laro ay b \u003d min (b j) \u003d 1.
Ang saddle point (1, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A1, B2). Ang presyo ng laro ay 1.
2. Suriin ang payout matrix para sa mga nangingibabaw na hilera at nangingibabaw na mga haligi.
Minsan, batay sa isang simpleng pagsasaalang-alang sa matrix ng laro, masasabi nating ang ilang mga dalisay na diskarte ay maaaring ipasok lamang ang pinakamainam na halo-halong diskarte na may zero probabilidad.
Sabi nila i-ika nangingibabaw sa kanya ang diskarte ng 1st player k-th diskarte kung ang isang ij ≥ isang kj para sa lahat j E N at para sa kahit isang j isang ij\u003e isang kj. Sa kasong ito, sinabi din na i-ika diskarte (o linya) - nangingibabaw, k-th - pinangungunahan.
Sabi nila j-th Ang diskarte ng 2nd player ay nangingibabaw sa kanya l-th diskarte kung para sa lahat j E M isang ij ≤ a il at para sa kahit isang i a ij< a il . В этом случае j-th ang diskarte (haligi) ay tinatawag na nangingibabaw, l-th - pinangungunahan.
Diskarte A 1 nangingibabaw diskarte A 2 (lahat ng mga elemento ng hilera 1 ay mas malaki kaysa o katumbas ng mga halaga ng ika-2 hilera), samakatuwid, ibinubukod namin ang ika-2 hilera ng matrix. Probabilidad p 2 \u003d 0.
Diskarte A 1 nangingibabaw diskarte A 3 (lahat ng mga elemento ng hilera 1 ay mas malaki kaysa o katumbas ng mga halaga ng ika-3 hilera), samakatuwid, ibinubukod namin ang ika-3 hilera ng matrix. Probabilidad p 3 \u003d 0.
3 1 2 5
0 -2 -2 1

Mula sa posisyon ng pagkalugi ng manlalaro B, ang diskarte B 1 ay nangingibabaw sa diskarte B 2 (lahat ng mga elemento ng haligi 1 mas maraming item haligi 2), samakatuwid ay ibinubukod namin ang ika-1 haligi ng matrix. Probabilidad q 1 \u003d 0.
Mula sa posisyon ng pagkalugi ng manlalaro B, ang diskarte B 4 ay nangingibabaw sa diskarte B 1 (lahat ng mga elemento ng haligi 4 ay mas malaki kaysa sa mga elemento ng haligi 1), samakatuwid, ibinubukod namin ang ika-4 na haligi ng matrix. Probabilidad q 4 \u003d 0.
1 2
-2 -2

Nabawasan namin ang isang 4 x 4 na laro sa isang 2 x 2 na laro.



Solusyon sa laro ( 2 x n


p 1 \u003d 1
p 2 \u003d 0
Presyo ng laro, y \u003d 1
Ngayon mahahanap natin ang diskarte ng minimax ng manlalaro B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation
q 1 \u003d 1
q 1 + q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 1 \u003d 1.
Sagot:
Presyo ng laro: y \u003d 1, mga vector vector ng diskarte ng mga manlalaro:
Q (1,0), P (1,0)

∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (1 1) + (2 0) \u003d 1 \u003d v
M (P 2; Q) \u003d (-2 1) + (-2 0) \u003d -2 ≤ v
M (P; Q 1) \u003d (1 1) + (-2 0) \u003d 1 \u003d v
M (P; Q 2) \u003d (2 1) + (-2 0) \u003d 2 ≥ v

Dahil ang mga hilera at haligi ay inalis mula sa orihinal na matrix, ang mga nahanap na posibilidad ng vector ay maaaring isulat bilang:
P (1,0,0,0)
Q (0,1,0,0)

Gawain 2
Hanapin ang mas mababa at mas mataas na mga presyo ng laro gamit ang matrix sa pagbabayad. Sa pagkakaroon ng isang saddle point, isulat ang mga vector ng pinakamainam na purong diskarte na P *, Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, isusulat namin ang solusyon sa laro sa purong diskarte.
Mga manlalaroB 1B 2B 3a \u003d min (A i)
Isang 1-6 -5 0 -6
A 2-8 -3 -2 -8
Isang 3-3 -2 3 -3
b \u003d max (B i)-3 -2 3

Natagpuan namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng larong a \u003d max (a i) \u003d -3, na nagsasaad ng maximum na purong diskarte A 3.
Ang pinakamataas na presyo ng laro ay b \u003d min (b j) \u003d -3.
Ang saddle point (3, 1) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A3, B1). Ang presyo ng laro ay -3.
Sagot: P (0,0,1), Q (1,0,0)

Suliranin 3
Maghanap ng mga vector ng pinakamainam na diskarte na P *, Q * at ang presyo ng laro gamit ang matrix sa pagbabayad. Sinong manlalaro ang nagwagi?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, isusulat namin ang solusyon sa laro sa purong diskarte.
Ipinapalagay namin na ang manlalaro ay pipiliin ko ang kanyang diskarte upang makuha ang kanyang maximum na kabayaran, at pipiliin ng manlalaro II ang kanyang diskarte upang mabawasan ang kabayaran ng manlalaro I.
Mga manlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b \u003d max (B i)2 -2 7 4

Natagpuan namin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng larong a \u003d max (a i) \u003d -2, na nagsasaad ng maximum na purong diskarte A 2.
Ang pinakamataas na presyo ng laro ay b \u003d min (b j) \u003d -2.
Ang saddle point (2, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A2, B2). Ang presyo ng laro ay -2.
3. Hanapin ang solusyon sa laro sa magkahalong diskarte.
Malutas natin ang problema sa pamamagitan ng pamamaraang geometriko, na kasama ang mga sumusunod na hakbang:
1. Sa sistemang coordinate ng Cartesian, isang segment ang naka-plot kasama ang axis ng abscissa, ang haba nito ay 1. Ang kaliwang dulo ng segment (point x \u003d 0) ay tumutugma sa diskarte A 1, ang tamang isa - sa diskarte Isang 2 (x \u003d 1). Ang mga panloob na puntos na x ay tumutugma sa mga posibilidad ng ilang magkakahalong diskarte S 1 \u003d (p 1, p 2).
2. Ang mga panalo ng diskarte A 1 ay naka-plot sa kaliwang ordinate axis. Sa isang linya na parallel sa ordinate axis, mula sa puntong 1, ang mga panalo ng diskarte A 2 ay naka-plot.
Solusyon sa laro ( 2 x n) ay isinasagawa mula sa posisyon ng player A adhering to the maximin diskarte. Wala sa mga manlalaro ang may nangingibabaw at dobleng diskarte.

Ang maximum na pinakamainam na diskarte ng manlalaro A ay tumutugma sa punto N, kung saan maaaring maisulat ang sumusunod na sistema ng mga equation:
p 1 \u003d 0
p 2 \u003d 1
Presyo ng laro, y \u003d -2
Ngayon ay mahahanap natin ang diskarte ng minimax ng manlalaro B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation, hindi kasama ang diskarte B 1, B 3, B 4, na malinaw na nagbibigay ng mas malaking pagkawala sa manlalaro B, at, samakatuwid, q 1 \u003d 0, q 3 \u003d 0, q 4 \u003d 0 ...
-2q 2 \u003d -2
q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 2 \u003d 1.
Sagot:
Presyo ng laro: y \u003d -2, mga diskarte ng vector ng mga manlalaro:
Q (0, 1, 0, 0), P (0, 1)
4. Suriin natin ang kawastuhan ng solusyon sa laro gamit ang pamantayan sa pagiging epektibo ng diskarte.
∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (-6 0) + (-6 1) + (2 0) + (4 0) \u003d -6 ≤ v
M (P 2; Q) \u003d (2 0) + (-2 1) + (7 0) + (-1 0) \u003d -2 \u003d v
M (P; Q 1) \u003d (-6 0) + (2 1) \u003d 2 ≥ v
M (P; Q 2) \u003d (-6 0) + (-2 1) \u003d -2 \u003d v
M (P; Q 3) \u003d (2 0) + (7 1) \u003d 7 ≥ v
M (P; Q 4) \u003d (4 0) + (-1 1) \u003d -1 ≥ v
Ang lahat ng mga hindi pagkakapantay-pantay ay nasiyahan bilang mga pagkakapantay-pantay o mahigpit na hindi pagkakapantay-pantay, samakatuwid, ang solusyon sa laro ay matatagpuan nang tama.

Suliranin 4
Magbigay ng detalyadong sagot sa tanong

Bagaman nagtapos ako mula sa Faculty of Physics and Technology, hindi ako tinuro sa teorya ng laro sa pamantasan. Pero dahil papasok na ako taon ng mag-aaral Naglaro ako ng marami, una sa kagustuhan, at pagkatapos ay sa tulay, interesado ako sa teorya ng laro, at pinagkadalubhasaan ko ang isang maliit na aklat. At kamakailan lamang ay nalutas ng mambabasa ng site na Mikhail ang problema ng teorya ng laro. Napagtanto na ang gawain ay hindi ibinigay sa akin kaagad, nagpasya akong i-refresh ang aking kaalaman sa teorya ng laro sa aking memorya. Ipinakita ko sa iyo ang isang maliit na libro - isang tanyag na paglalahad ng mga elemento ng teorya ng laro at ilang mga pamamaraan ng paglutas ng mga larong matrix. Naglalaman ito ng halos walang katibayan at naglalarawan ng mga pangunahing punto ng teorya na may mga halimbawa. Ang libro ay isinulat ng dalub-agbilang at matematikal na agham na si Elena Sergeevna Ventzel. Maraming mga henerasyon ng mga inhinyero ng Soviet ang nag-aral mula sa kanyang aklat na "Theory of Probability". Sumulat din si Elena Sergeevna ng maraming akdang pampanitikan sa ilalim ng sagisag ng I. Grekov.

Elena Wentzel. Mga elemento ng teorya ng laro. - M.: Fizmatgiz, 1961 .-- 68 p.

Mag-download maikling buod sa format o

§ 1. Ang paksa ng teorya ng laro. Pangunahing konsepto

Kapag nalulutas ang isang bilang ng mga praktikal na problema (sa larangan ng ekonomiya, mga gawain sa militar, atbp.), Kinakailangan upang pag-aralan ang mga sitwasyon kung saan mayroong dalawa (o higit pa) na nakikipaglaban na mga partido na naghabol sa magkabilang mga layunin, at ang resulta ng bawat kaganapan ng isa sa ang mga partido ay nakasalalay sa kung anong kurso ng pagkilos ang pipiliin ng kaaway. Tatawagan namin ang mga nasabing sitwasyon na "sitwasyon ng pagkakasalungatan".

Mayroong maraming mga halimbawa ng mga sitwasyon ng salungatan mula sa iba't ibang mga lugar ng pagsasanay. Anumang sitwasyon na nagmumula sa kurso ng mga poot ay kabilang sa mga sitwasyon ng salungatan: ang bawat isa sa mga nakikipaglaban na partido ay kumukuha ng lahat ng mga hakbang na magagamit dito upang maiwasang makamit ng kalaban ang tagumpay. Ang mga sitwasyon ng hindi pagkakasundo ay nagsasama rin ng mga sitwasyong lumitaw kapag pumipili ng isang sistema ng sandata, mga pamamaraan ng paggamit nito sa pakikipaglaban at, sa pangkalahatan, kapag nagpaplano ng pagpapatakbo ng militar: ang bawat isa sa mga desisyon sa lugar na ito ay dapat gawin na may pagtingin sa mga aksyon ng kaaway na hindi gaanong kapaki-pakinabang tayo Ang isang bilang ng mga sitwasyon sa larangan ng ekonomiya (lalo na sa pagkakaroon ng malayang kumpetisyon) ay nabibilang sa mga sitwasyon ng salungatan; ang mga nakikipaglaban na partido ay mga kumpanya ng pangangalakal, pang-industriya na negosyo, atbp.

Ang pangangailangan na pag-aralan ang mga nasabing sitwasyon ay nagbigay ng isang espesyal na aparatong matematika. Ang teorya ng laro ay mahalagang hindi hihigit sa isang teorya ng matematika ng mga sitwasyon ng salungatan. Ang layunin ng teorya ay upang makabuo ng mga rekomendasyon para sa isang makatuwiran kurso ng aksyon para sa bawat isa sa mga kalaban sa kurso ng isang sitwasyon ng kontrahan. Ang bawat sitwasyon ng hidwaan na direktang kinuha mula sa kasanayan ay napakahirap, at ang pag-aaral nito ay nababagabag ng pagkakaroon ng maraming mga kadahilanan na dumadalo. Upang gawing posible ang isang matematikal na pagtatasa ng sitwasyon, kinakailangang mag-abstract mula sa pangalawa, hindi sinasadyang mga kadahilanan at bumuo ng isang pinasimple, gawing pormal na modelo ng sitwasyon. Tatawagan namin ang modelong ito na "laro".

Ang laro ay naiiba mula sa isang tunay na sitwasyon ng hidwaan na ito ay isinasagawa ayon sa mahusay na natukoy na mga patakaran. Ang sangkatauhan ay matagal nang gumagamit ng naturang pormal na mga modelo ng mga sitwasyon ng kontrahan, na mga laro sa literal na kahulugan ng salita. Kasama sa mga halimbawa ang chess, checkers, card games, atbp. Ang lahat ng mga larong ito ay may katangian ng isang kumpetisyon na nagpapatuloy ayon sa mga kilalang panuntunan at nagtatapos sa isang "tagumpay" (nakuha) ng isa o ibang manlalaro.

Ang nasabing pormal na kinokontrol, artipisyal na organisadong mga laro ay kumakatawan sa pinaka angkop na materyal upang ilarawan at makabisado ang pangunahing mga konsepto ng teorya ng laro. Ang terminolohiya na hiniram mula sa pagsasagawa ng naturang mga laro ay ginagamit din sa pagtatasa ng iba pang mga sitwasyon ng salungatan: ang mga partido na nakikilahok sa kanila ay ayon sa kombensyon na tinukoy bilang "mga manlalaro", at ang resulta ng banggaan ay ang "panalo" ng isa sa mga partido .

Sa laro, ang mga interes ng dalawa o higit pang mga kalaban ay maaaring magkabanggaan; sa unang kaso, ang laro ay tinatawag na "doble", sa pangalawa - "maraming". Ang mga kalahok sa isang maramihang mga laro ay maaaring bumuo ng mga koalisyon - permanente o pansamantala. Sa pagkakaroon ng dalawang permanenteng koalisyon, ang maramihang mga laro ay nagiging isang pares. Ang mga pares na laro ay ang pinaka dakilang praktikal na kahalagahan; dito natin pipigilan ang ating sarili na isaalang-alang lamang ang mga nasabing laro.

Sinimulan namin ang aming pagtatanghal ng teoryang elementarya ng laro sa pagbubuo ng ilang pangunahing mga konsepto. Isasaalang-alang namin ang isang doble na laro kung saan lumahok ang dalawang manlalaro A at B na may kabaligtaran na interes. Sa pamamagitan ng "laro" nangangahulugan kami ng isang kaganapan na binubuo ng isang serye ng mga aksyon ng panig A at B. Upang ang laro ay mapailalim sa pagsusuri sa matematika, ang mga patakaran ng laro ay dapat na tumpak na binubuo. Sa pamamagitan ng "mga patakaran ng laro" ibig sabihin namin ang sistema ng mga kundisyon na kinokontrol ang mga posibleng pagpipilian para sa mga aksyon ng magkabilang panig, ang dami ng impormasyon na mayroon ang bawat panig tungkol sa pag-uugali ng iba pa, ang pagkakasunud-sunod ng mga alternatibong "paggalaw" (indibidwal na mga desisyon na ginawa sa panahon ng laro), pati na rin ang resulta o kinalabasan ng laro kung saan ang ibinigay na hanay ng mga gumagalaw. Ang resulta na ito (makakuha o pagkawala) ay hindi laging may isang dami ng pagpapahayag, ngunit karaniwang posible, sa pamamagitan ng pagtatakda ng isang tiyak na sukat ng pagsukat, upang maipahayag ito isang tiyak na numero... Halimbawa, sa isang laro ng chess, ang pagkakakuha ay maaaring maitalaga sa pagtatalaga ng halagang +1, pagkawala –1, gumuhit ng 0.

Ang isang laro ay tinawag na isang zero-sum game kung ang isang manlalaro ay nanalo kung ano ang natalo ng iba pa, ibig sabihin ang kabuuan ng mga panalo ng parehong partido ay katumbas ng zero. Sa isang zero-sum game, ang interes ng mga manlalaro ay eksaktong kabaligtaran. Dito lamang isasaalang-alang namin ang mga nasabing laro.

Dahil sa isang zero-sum game, ang kabayaran ng isa sa mga manlalaro ay katumbas ng kabayaran ng iba pang kasama kabaligtaran sign, kung gayon, malinaw naman, kapag pinag-aaralan ang gayong laro, maaaring isaalang-alang ng isa ang kabayaran ng isa lamang sa mga manlalaro. Hayaan ito, halimbawa, manlalaro A. Sa kung ano ang sumusunod, para sa kaginhawaan, tatawagin namin ayon sa kombensyon ang panig A na "kami", at panig na B - "kalaban".

Sa kasong ito, ang panig A ("kami") ay palaging isasaalang-alang bilang "panalo", at ang panig B ("kalaban") bilang "pagkatalo". Ang pormal na kondisyong ito ay malinaw naman ay hindi nagpapahiwatig ng anumang tunay na kalamangan para sa unang manlalaro; madaling makita na pinalitan ito ng kabaligtaran kung ang panalong nag-sign ay baligtad.

Isasaisip namin ang pagbuo ng laro sa oras na binubuo ng isang serye ng sunud-sunod na yugto o "gumagalaw". Ang isang paglipat sa teorya ng laro ay ang pagpipilian ng isa sa mga pagpipilian na ibinigay ng mga patakaran ng laro. Ang mga galaw ay nahahati sa personal at random. Ang isang personal na paglipat ay isang may malay na pagpipilian ng isa sa mga manlalaro ng isa sa mga posibleng galaw sa isang naibigay na sitwasyon at pagpapatupad nito. Ang isang halimbawa ng isang personal na paglipat ay ang anumang paglipat sa isang laro ng chess. Ginagawa ang susunod na paglipat, ang manlalaro ay gumagawa ng isang may malay na pagpipilian ng isa sa mga pagpipilian na posible para sa isang naibigay na pag-aayos ng mga piraso sa board. Ang hanay ng mga posibleng pagpipilian para sa bawat personal na paglipat ay kinokontrol ng mga patakaran ng laro at nakasalalay sa kabuuan ng mga nakaraang paggalaw ng magkabilang panig.

Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, natupad hindi sa pamamagitan ng desisyon ng manlalaro, ngunit sa pamamagitan ng ilang mga mekanismo ng random na pagpipilian (pagkahagis ng isang barya, isang dice, shuffling at deal cards, atbp.). Halimbawa, ang pagbibigay ng unang kard sa isa sa mga manlalaro na ginusto ay isang random na paglipat na may 32 pantay na posibleng mga pagpipilian. Para sa laro na maaaring matukoy sa matematika, ang mga patakaran ng laro ay dapat na ipahiwatig ang pamamahagi ng posibilidad ng mga posibleng resulta para sa bawat random na paglipat.

Ang ilang mga laro ay maaari lamang binubuo ng mga random na paggalaw (ang tinaguriang pulos pagsusugal) o mga personal na galaw lamang (chess, checkers). Karamihan mga larong kard nabibilang sa mga laro halo-halong uri, ibig sabihin naglalaman ng kapwa mga random at personal na galaw.

Ang mga laro ay inuri hindi lamang sa likas na katangian ng kanilang mga galaw (personal, random), kundi pati na rin ng likas na katangian at dami ng impormasyong magagamit sa bawat manlalaro hinggil sa mga pagkilos ng iba. Ang isang espesyal na klase ng mga laro ay binubuo ng tinaguriang "mga laro kasama kumpletong impormasyon". Ang isang laro na may kumpletong impormasyon ay isang laro kung saan alam ng bawat manlalaro sa bawat personal na paglipat ang mga resulta ng lahat ng mga nakaraang paggalaw, parehong personal at random. Ang mga halimbawa ng mga larong may kumpletong impormasyon ay kasama ang chess, mga pamato, at ang kilalang laro ng "mga kalungkutan at mga krus".

Karamihan sa mga laro na may praktikal na kahalagahan ay hindi kabilang sa klase ng mga laro na may kumpletong impormasyon, dahil ang kawalan ng katiyakan tungkol sa mga aksyon ng kaaway ay karaniwang isang mahalagang elemento ng mga sitwasyon ng kontrahan.

Ang isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto ng "diskarte". Ang diskarte ng manlalaro ay isang hanay ng mga patakaran na natatanging matukoy ang pagpipilian para sa bawat personal na paglipat ng isang naibigay na manlalaro, depende sa sitwasyon na nabuo sa panahon ng laro. Karaniwan, ang desisyon (pagpipilian) para sa bawat personal na paglipat ay ginagawa ng manlalaro sa panahon ng laro mismo, depende sa tukoy na sitwasyon na nabuo. Gayunpaman, sa teoretikal, ang mga bagay ay hindi magbabago kung naiisip natin na ang lahat ng mga pasyang ito ay isinasagawa na ng manlalaro nang maaga. Upang magawa ito, kailangang i-compile nang maaga ng manlalaro ang isang listahan ng lahat ng mga sitwasyong posible sa panahon ng laro at magbigay ng kanyang sariling solusyon para sa bawat isa sa kanila. Sa prinsipyo (kung hindi praktikal) posible ito para sa anumang laro. Kung ang naturang sistema ng pagpapasya ay pinagtibay, nangangahulugan ito na ang manlalaro ay pumili ng isang tiyak na diskarte.

Ang isang manlalaro na pumili ng isang diskarte ay hindi na makikilahok sa laro nang personal, ngunit palitan ang kanyang pakikilahok sa isang listahan ng mga patakaran na ilalapat para sa kanya ng isang hindi interesadong tao (hukom). Ang diskarte ay maaari ding ibigay sa automaton sa anyo ng isang tukoy na programa. Ganito naglalaro ng chess ang mga computer ngayon. Para sa konsepto ng "diskarte" upang magkaroon ng kahulugan, dapat mayroong mga personal na paglipat sa laro; sa mga larong binubuo lamang ng mga random na galaw, wala ang mga diskarte.

Nakasalalay sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa "may hangganan" at "walang katapusang". Ang isang may hangganang laro ay isang laro kung saan ang bawat manlalaro ay may isang may hangganan na bilang ng mga diskarte. Ang pangwakas na laro kung saan mayroon ang manlalaro A m mga diskarte, at player B - n ang diskarte ay tinawag na mxn game.

Isaalang-alang ang isang mxn na laro ng dalawang manlalaro A at B ("kami" at "kalaban"). Isasaad namin ang aming mga diskarte A 1, A 2, ..., A m ng diskarte ng kaaway B 1, B 2,…, B n. Hayaan ang bawat panig na pumili ng isang tukoy na diskarte; para sa atin ito ay magiging A i, para sa kalaban B j. Kung ang laro ay binubuo lamang ng mga personal na paglipat, pagkatapos ang pagpili ng mga diskarte A i, B j natatanging tumutukoy sa kinalabasan ng laro - ang aming mga panalo. Ipaalam natin ito bilang isang ij. Kung naglalaman ang laro, bilang karagdagan sa personal, mga random na paglipat, pagkatapos ay ang kabayaran para sa isang pares ng mga diskarte A i, B j ay isang random na halaga na nakasalalay sa mga kinalabasan ng lahat ng mga random na paggalaw. Sa kasong ito, ang natural na pagtatantya ng inaasahang kabayaran ay ang average na halaga nito (inaasahan sa matematika). Isasaad namin sa pamamagitan ng parehong pag-sign kapwa ang kabayaran mismo (sa isang laro nang walang mga random na paggalaw) at ang average na halaga (sa isang laro na may mga random na paggalaw).

Ipaalam sa amin ang mga halagang isang ij payoff (o average na kabayaran) para sa bawat pares ng mga diskarte. Ang mga halaga ay maaaring nakasulat sa anyo ng isang hugis-parihaba na talahanayan (matrix), ang mga hilera na tumutugma sa aming mga diskarte (A i), at ang mga haligi ay tumutugma sa mga diskarte ng kaaway (B j). Ang nasabing isang talahanayan ay tinatawag na payoff matrix o simpleng laro matrix. Ang game matrix mxn ay ipinapakita sa Fig. isa

Fig. 1. Matrix mxn

Sa madaling salita isasaad namin ang matrix ng laro ‖а ij ‖. Tingnan natin ang ilang pangunahing mga halimbawa ng mga laro.

Halimbawa 1. Dalawang manlalaro A at B, nang walang pagtingin sa bawat isa, maglagay ng isang barya na baligtad sa mesa, sagisag o mga buntot, ayon sa nakikita nilang akma. Kung ang mga manlalaro ay pumili ng magkatulad na panig (kapwa may amerikana o pareho ay may buntot), pagkatapos ang manlalaro A ay kukuha ng parehong mga barya; kung hindi man sila ay kinuha ng manlalaro B. Kinakailangan na pag-aralan ang laro at buuin ang matrix nito. Desisyon. Ang laro ay binubuo lamang ng dalawang mga galaw: ang aming paglipat at paglipat ng kalaban, parehong personal. Ang laro ay hindi kabilang sa mga laro na may kumpletong impormasyon, dahil sa oras ng pagliko ng player na gumaganap ay hindi nito alam kung ano ang nagawa ng iba. Dahil ang bawat isa sa mga manlalaro ay may isang personal na paglipat lamang, ang diskarte ng manlalaro ay isang pagpipilian sa solong personal na paglipat na ito.

Mayroon kaming dalawang mga diskarte: Isang 1 - upang pumili ng isang amerikana at A 2 - upang pumili ng mga buntot; ang kalaban ay may parehong dalawang diskarte: B 1 - coat of arm at B 2 - tails. Kaya, ang larong ito ay isang 2 × 2 na laro. Isaalang-alang natin ang mga panalo ng isang barya bilang +1. Game Matrix:

Sa pamamagitan ng halimbawa ng larong ito, tulad ng elementarya, maaari mong maunawaan ang ilan sa mahahalagang ideya ng teorya ng laro. Ipagpalagay muna na ang naibigay na laro ay naisagawa nang isang beses lamang. Pagkatapos, malinaw naman, walang katuturan na pag-usapan ang anumang "mga diskarte" ng mga manlalaro na mas makatuwiran kaysa sa iba. Ang bawat isa sa mga manlalaro na may parehong dahilan ay maaaring gumawa ng anumang desisyon. Gayunpaman, kapag naulit ang laro, nagbabago ang sitwasyon.

Sa katunayan, sabihin natin na tayo (manlalaro A) ay pumili ng ilang diskarte para sa ating sarili (sabihin, A1) at mananatili dito. Pagkatapos, batay sa mga resulta ng unang ilang mga paggalaw, hulaan ng kaaway ang aming diskarte at tutugon dito sa hindi gaanong kapaki-pakinabang na paraan para sa amin, ibig sabihin pumili ng mga buntot. Malinaw na hindi kapaki-pakinabang para sa amin na laging gamitin ang anumang isang diskarte; upang hindi mapunta sa pagkawala ng panig, dapat nating piliin minsan ang amerikana, minsan - mga buntot. Gayunpaman, kung papalitan namin ang mga coats ng braso at buntot sa isang tiyak na pagkakasunud-sunod (halimbawa, pagkatapos ng isa), maaari ring hulaan ng kaaway ang tungkol dito at tumugon sa diskarteng ito sa pinakamasamang paraan para sa amin. Malinaw na, isang maaasahang paraan upang matiyak na hindi alam ng kaaway ang aming diskarte ay upang ayusin ang pagpipilian sa bawat galaw, kung tayo mismo ay hindi alam nang maaga (maaari itong matiyak, halimbawa, sa pamamagitan ng paghuhugas ng isang barya). Kaya, sa pamamagitan ng intuitive na pangangatuwiran nakarating kami sa isa sa mga mahahalagang konsepto ng teorya ng laro - sa konsepto ng "halo-halong diskarte", ibig sabihin. tulad ng mga diskarte na "puro" - sa kasong ito A 1 at A 2 - kahalili nang sapalaran sa ilang mga dalas. Sa halimbawang ito, mula sa pagsasaalang-alang ng mahusay na proporsyon, malinaw na maaga na ang mga diskarte A 1 at A 2 ay dapat na kahalili sa parehong dalas; sa mas kumplikadong mga laro, ang solusyon ay maaaring malayo sa walang halaga.

Halimbawa 2. Mga manlalaro A at B nang sabay-sabay at nakapag-iisa sa bawat isa ay isulat ang bawat isa sa tatlong mga numero: 1, 2 o 3. Kung ang kabuuan ng mga nakasulat na numero ay pantay, pagkatapos ay babayaran ng B ang halagang ito sa rubles; kung ito ay kakaiba, kung gayon, sa kabaligtaran, binabayaran ng A ang halagang ito sa B. Kinakailangan upang suriin ang laro at iguhit ang matrix nito.

Desisyon. Ang laro ay binubuo ng dalawang galaw; pareho ang personal. Mayroon kaming (A) tatlong diskarte: A 1 - sumulat ng 1; At 2 - isulat ang 2; At 3 - isulat 3. Ang kalaban (B) ay may parehong tatlong diskarte. Ang laro ay isang 3 × 3 na laro:

Malinaw na, tulad ng sa dating kaso, ang kaaway ay maaaring tumugon sa pinakamasamang paraan para sa amin sa anumang diskarte na pinili namin. Sa katunayan, kung pipiliin natin, halimbawa, diskarte A1, ang kaaway ay palaging tutugon dito sa diskarte B2; sa diskarte A 2 - ayon sa diskarte B 3; sa diskarte A 3 - ayon sa diskarte B 2; sa gayon, ang anumang pagpipilian ng isang tiyak na diskarte ay hindi maiiwasang magdala sa atin sa isang pagkawala (hindi kinakailangan, gayunpaman, upang kalimutan na ang kaaway ay nasa parehong nakababahalang sitwasyon). Ang solusyon sa larong ito (ibig sabihin, ang kabuuan ang pinaka-kapaki-pakinabang na mga diskarte ang parehong mga manlalaro) ay ibibigay sa § 5.

Halimbawa 3.Mayroon kaming tatlong uri ng mga sandata na magagamit namin: А 1, А 2, А 3; ang kaaway ay mayroong tatlong uri ng sasakyang panghimpapawid: B 1, B 2, B 3. Ang aming gawain ay upang maabot ang eroplano; ang gawain ng kalaban ay panatilihin siyang hindi naaapektuhan. Kapag gumagamit ng armament A 1, ang sasakyang panghimpapawid B 1, B 2, B 3 ay na-hit, ayon sa pagkakabanggit, na may posibilidad na 0.9, 0.4 at 0.2; na may sandata A 2 - na may mga posibilidad na 0.3, 0.6 at 0.8; na may A 3 armament - na may posibilidad na 0.5, 0.7 at 0.2. Kinakailangan na bumalangkas ng sitwasyon sa mga tuntunin ng teorya ng laro.

Desisyon. Ang sitwasyon ay maaaring isipin bilang isang 3 × 3 laro na may dalawang personal na paglipat at isang random na isa. Ang aming personal na paglipat ay ang pagpipilian ng uri ng sandata; personal na paglipat ng kaaway - ang pagpipilian ng sasakyang panghimpapawid para sa pakikilahok sa labanan. Random na paglipat - ang paggamit ng sandata; ang hakbang na ito ay maaaring magtapos sa pagkatalo o di-pagkatalo ng sasakyang panghimpapawid. Ang aming kabayaran ay iisa kung ang eroplano ay na-hit at zero kung hindi man. Ang aming mga diskarte ay tatlong mga pagpipilian sa sandata; mga diskarte ng kaaway - tatlong mga pagpipilian sa sasakyang panghimpapawid. Ang average na halaga ng kabayaran para sa bawat naibigay na pares ng mga diskarte ay walang hihigit sa posibilidad na tamaan ang isang naibigay na sasakyang panghimpapawid sa isang ibinigay na sandata. Game Matrix:

Ang layunin ng teorya ng laro ay upang magbigay ng mga rekomendasyon para sa makatuwirang pag-uugali mga manlalaro sa mga sitwasyon ng hidwaan, ibig sabihin pagpapasiya ng "pinakamainam na diskarte" para sa bawat isa sa kanila. Ang pinakamainam na diskarte ng isang manlalaro sa teorya ng laro ay isang diskarte na, kapag ang laro ay paulit-ulit nang maraming beses, nagbibigay ng isang naibigay na manlalaro ng maximum na posibleng average na makakuha (o ang minimum na posibleng average na pagkawala). Sa pagpili ng diskarteng ito, ang batayan ng pangangatuwiran ay ang palagay na ang kaaway ay hindi gaanong kasing talino tulad ng ating sarili, at ginagawa ang lahat upang maiwasang makamit ang ating layunin.

Sa teorya ng laro, ang lahat ng mga rekomendasyon ay ginawa batay sa mga prinsipyong ito; samakatuwid, hindi ito isinasaalang-alang ang mga elemento ng peligro na hindi maiwasang naroroon sa bawat totoong diskarte, pati na rin ang mga posibleng pagkalkula at pagkakamali ng bawat isa sa mga manlalaro. Ang teorya ng laro, tulad ng anumang modelo ng matematika ng isang komplikadong kababalaghan, ay may mga limitasyon. Ang pinakamahalaga sa kanila ay ang nakuha ay artipisyal na nabawasan sa isa isahan... Sa karamihan ng mga praktikal na sitwasyon ng salungatan, kapag bumubuo ng isang makatwirang diskarte, kinakailangang isaalang-alang hindi isa, ngunit maraming mga parameter ng bilang - ang pamantayan para sa tagumpay ng kaganapan. Ang isang diskarte na pinakamainam sa isang pamantayan ay hindi kinakailangang pinakamainam sa iba. Gayunpaman, ang pagkakaroon ng kamalayan sa mga limitasyong ito at samakatuwid ay hindi bulag na sumunod sa mga rekomendasyong nakuha ng mga pamamaraan ng laro, maaari pa ring makatuwirang gamitin ang aparatong matematika ng teorya ng laro upang paunlarin, kung hindi eksaktong "pinakamainam", kung gayon, kahit papaano, "katanggap-tanggap" na diskarte .

§ 2. Ang mas mababa at mataas na presyo ng laro. Ang prinsipyo ng minimax

Isaalang-alang ang isang mxn game na may isang matrix tulad ng sa Fig. 1. Tukuyin natin sa pamamagitan ng letrang i ang bilang ng aming diskarte; ang letrang j ang bilang ng diskarte ng kalaban. Itakda natin ang ating sarili sa gawain: upang matukoy ang aming pinakamainam na diskarte. Pag-aralan nating sunud-sunod ang bawat isa sa ating mga diskarte, nagsisimula sa A 1.

Pagpili ng diskarte А i, dapat nating palaging umasa sa katotohanan na ang kaaway ay tutugon dito gamit ang diskarte na j kung saan ang aming kabayaran ay isang maliit. Tukuyin natin ang halagang ito ng kabayaran, ibig sabihin ang minimum ng mga bilang na isang ij in akoika linya Ipaalam natin ito sa pamamagitan ng α i:

Dito, ang min sign (minimum na higit sa j) ay nangangahulugan ng minimum ng mga halaga ng parameter na ito para sa lahat ng posibleng j. Isulat natin ang mga bilang α i; sa tabi ng matrix sa kanan bilang isang labis na haligi:

Pagpili ng anumang diskarte A, kailangan nating umasa sa katotohanan na bilang isang resulta ng mga makatuwirang aksyon ng kalaban hindi kami mananalo ng higit sa α i. Naturally, kumilos nang mas maingat at umaasa sa pinaka makatwirang kalaban (ibig sabihin, pag-iwas sa anumang peligro), dapat tayong huminto sa diskarte kung saan ang bilang α i ang maximum. Tukuyin natin ang maximum na halagang ito α:

o, isinasaalang-alang ang formula ng account (2.1),

Ang halagang α ay tinatawag na mas mababang presyo ng laro, sa madaling salita - ang maximin na panalo o simpleng maximin lamang. Ang bilang α ay namamalagi sa isang tiyak na linya ng matrix; ang diskarte ng manlalaro A na tumutugma sa linyang ito ay tinatawag na maximin na diskarte. Malinaw na, kung sumunod tayo sa maximin na diskarte, kung gayon para sa anumang pag-uugali ng kalaban ginagarantiyahan namin ang isang pagbabayad, hindi bababa sa hindi mas mababa sa α. Samakatuwid, ang halaga ng α ay tinawag na "mas mababang presyo ng laro". Ito ang garantisadong minimum na maaari naming ibigay ang aming mga sarili sa pamamagitan ng pagsunod sa pinaka maingat ("muling pagsiguro") na diskarte.

Malinaw na, ang isang katulad na pangangatuwiran ay maaaring isagawa para sa kalaban B. Dahil ang kaaway ay interesado na i-minimize ang aming mga panalo, dapat niyang tingnan ang bawat isa sa kanyang mga diskarte mula sa pananaw maximum na panalo sa diskarteng ito. Samakatuwid, sa ilalim ng matrix, isusulat namin ang maximum na mga halaga para sa bawat haligi:

at hanapin ang minimum na β j:

Ang halagang β ay tinawag na pinakamataas na presyo ng laro, sa madaling salita, ang "minimax". Ang diskarte ng kalaban na naaayon sa pakinabang ng minimax ay tinatawag na kanyang "diskarte sa minimax". Sumusunod sa kanyang pinaka maingat na diskarte sa minimax, ginagarantiyahan ng kalaban sa kanyang sarili ang mga sumusunod: anumang gawin natin laban sa kanya, mawawala sa kanya sa anumang kaso ang halagang hindi hihigit sa β. Ang prinsipyo ng pag-iingat, na nagdidikta ng pagpili ng mga naaangkop na diskarte (maximin at minimax) para sa mga manlalaro, ay madalas na tinatawag na "prinsipyo ng minimax" sa teorya ng laro at mga aplikasyon nito. Ang pinaka-maingat na maximin at minimax na diskarte ng mga manlalaro ay minsang tinukoy pangkalahatang term "Mga diskarte sa Minimax".

Bilang mga halimbawa, tinutukoy namin ang mas mababa at itaas na mga presyo ng laro at mga diskarte ng minimum na halimbawa para sa mga halimbawa 1, 2, at 3 ng § 1.

Halimbawa 1.Ang halimbawa 1 § 1 ay nagbibigay ng isang laro na may sumusunod na matrix:

Dahil ang mga halagang α i at β j ay pare-pareho at katumbas ng –1 at +1, ayon sa pagkakabanggit, ang mas mababa at itaas na mga presyo ng laro ay din –1 at +1: α \u003d –1, β \u003d +1. Anumang diskarte ng manlalaro A ay ang kanyang maximin, at ang anumang diskarte ng manlalaro B ay ang kanyang diskarte sa minimax. Ang konklusyon ay walang halaga: sa pamamagitan ng pagdikit sa alinman sa kanyang mga diskarte, ang manlalaro A ay maaaring ginagarantiyahan na siya ay natalo ng hindi hihigit sa 1; ang pareho ay maaaring ginagarantiyahan ng player B.

Halimbawa 2. Halimbawa 2 § 1 ay nagbibigay ng isang laro na may isang matrix:

Ang mas mababang presyo ng laro ay α \u003d –3; ang pinakamataas na presyo ng laro β \u003d 4. Ang aming maximin na diskarte ay А 1; sa pamamagitan ng sistematikong paglalapat nito, mahigpit nating maaasahan na manalo ng hindi bababa sa –3 (talo ng hindi bababa sa 3). Ang diskarte ng minimax ng kalaban ay alinman sa mga diskarte B 1 at B 2; sistematikong inilalapat ang mga ito, sa anumang kaso, maaaring magagarantiyahan na mawawalan siya ng hindi hihigit sa 4. Kung lumihis tayo mula sa aming pinakamataas na diskarte (halimbawa, pumili ng diskarte A2), maaaring "parusahan" tayo ng kalaban para dito sa pamamagitan ng paglalapat ng diskarte B 3 at ang pagbawas ng ating mga panalo ay hanggang -5; Gayundin, ang pag-atras ng kalaban mula sa kanyang diskarte sa minimax ay maaaring dagdagan ang kanyang pagkawala sa 6.

Halimbawa 3.Halimbawa 3 § 1 ay nagbibigay ng isang laro na may isang matrix:

Ang mas mababang presyo ng laro ay α \u003d 0.3; ang pinakamataas na halaga ng laro β \u003d 0.7. Ang aming pinaka-konserbatibo (maximin) na diskarte ay A 2; gamit ang А 2 armament, ginagarantiyahan namin na tatama ang sasakyang panghimpapawid sa average ng hindi bababa sa 0.3 sa lahat ng mga kaso. Ang pinaka maingat (minimax) na diskarte ng kaaway ay B 2; gamit ang sasakyang panghimpapawid na ito, makakasiguro ang kaaway na siya ay tatamaan sa hindi hihigit sa 0.7 sa lahat ng mga kaso.

Ang huling halimbawa ay maginhawa upang ipakita ang isa mahalagang pag-aari mga diskarte sa minimax - ang kanilang kawalang-tatag. Gumamit tayo ng aming pinaka maingat (maximin) na diskarte 2, at ang kalaban - ang kanyang pinaka maingat (minimax) na diskarte sa 2. Hangga't ang parehong kalaban ay sumusunod sa mga diskarteng ito, ang average na kabayaran ay 0.6; mas malaki ito sa ilalim, ngunit mas maliit nangungunang presyo mga laro. Ipagpalagay natin ngayon na natutunan ng kalaban na gumagamit tayo ng diskarte A 2; agad niyang tutugon dito gamit ang diskarte B 1 at babawasan ang mga panalo sa 0.3. Kaugnay nito, mayroon kaming magandang sagot sa diskarte B 1: diskarte A 1, na nagbibigay sa amin ng isang panalo na 0.9, at iba pa.

Samakatuwid, ang posisyon kung saan ang parehong mga manlalaro ay gumagamit ng kanilang mga diskarte sa minimax ay hindi matatag at maaaring malabag ng impormasyong natanggap tungkol sa diskarte ng kalaban. Gayunpaman, mayroong ilang mga laro kung saan ang mga diskarte sa minimax ay matatag. Ito ang mga laro kung saan ang mas mababang presyo ay katumbas ng nasa itaas: α \u003d β. Kung ang mas mababang presyo ng laro ay katumbas ng itaas, pagkatapos ay ang kanilang kabuuang halaga ay tinawag na net cost ng laro (minsan gastos lang ng laro), isasaad namin ito sa pamamagitan ng titik ν.

Tingnan natin ang isang halimbawa. Hayaan ang 4 × 4 na laro na ibigay ng matrix:

Hanapin natin ang mas mababang presyo ng laro: α \u003d 0.6. Hanapin natin ang pinakamataas na presyo ng laro: β \u003d 0.6. Pareho silang naging, samakatuwid, ang laro ay mayroong netong presyo na katumbas ng α \u003d β \u003d ν \u003d 0.6. Ang Element 0.6, na naka-highlight sa payoff matrix, ay parehong minimum sa hilera nito at maximum sa haligi nito. Sa geometry, ang isang punto sa isang ibabaw na may isang katulad na pag-aari (isang sabay na minimum kasama ang isang coordinate at isang maximum kasama ang isa pa) ay tinatawag na isang saddle point; sa pamamagitan ng pagkakatulad, ang term na ito ay ginagamit din sa teorya ng laro. Ang isang elemento ng isang matrix na may ganitong pag-aari ay tinatawag na isang saddle point ng matrix, at ang isang laro ay sinasabing mayroong isang saddle point.

Ang punto ng siyahan ay tumutugma sa isang pares ng mga diskarte sa minimax (sa halimbawang ito, A 3 at B 2). Ang mga diskarte na ito ay tinatawag na pinakamainam, at ang kanilang kombinasyon ay tinatawag na solusyon sa laro. Ang solusyon sa laro ay may mga sumusunod kamangha-manghang pag-aari... Kung ang isa sa mga manlalaro (halimbawa, A) ay sumusunod sa kanyang pinakamainam na diskarte, at ang iba pang manlalaro (B) ay lumihis sa anumang paraan mula sa kanyang pinakamainam na diskarte, kung gayon para sa manlalaro na gumawa ng paglihis, hindi ito maaaring maging kapaki-pakinabang, tulad ng paglihis ng manlalaro B maaaring pinakamahusay na iwanan ang mga panalo na hindi nabago, at sa pinakamasamang kaso - taasan ito. Sa kabaligtaran, kung ang B ay sumunod sa pinakamainam na diskarte nito, at ang A ay lumihis mula sa sarili nitong, sa gayon ay hindi ito maaaring maging kapaki-pakinabang para sa A

Ang pahayag na ito ay maaaring madaling ma-verify sa pamamagitan ng halimbawa ng laro na may isinasaalang-alang na isang saddle point. Nakita namin na sa kaso ng isang laro na may isang saddle point, ang mga diskarte sa minimax ay may isang uri ng "katatagan": kung ang isang panig ay sumunod sa diskarte ng minimax nito, kung gayon maaari lamang itong maging hindi kapaki-pakinabang para sa iba pang lumihis mula sa sarili nitong. Tandaan na sa kasong ito, ang kaalaman ng sinumang manlalaro na pinili ng kaaway ang kanyang pinakamainam na diskarte ay hindi maaaring baguhin ang sariling ugali ng manlalaro: kung ayaw niyang kumilos laban sa kanyang sariling interes, dapat siyang sumunod sa kanyang pinakamainam na diskarte. Ang isang pares ng pinakamainam na diskarte sa isang laro ng saddle point ay, tulad ng, isang "posisyon ng balanse": ang anumang paglihis mula sa pinakamainam na diskarte ay humahantong sa lumihis na manlalaro sa hindi kanais-nais na mga kahihinatnan, pinipilit siyang bumalik sa kanyang orihinal na posisyon.

Kaya, para sa bawat laro ng saddle point, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na diskarte para sa magkabilang panig, na may mga sumusunod na katangian.

1) Kung ang parehong partido ay sumunod sa kanilang pinakamainam na mga diskarte, kung gayon ang average na kabayaran ay katumbas ng netong presyo ng laro ν, na sabay na mas mababa at mas mataas na presyo.

2) Kung ang isa sa mga partido ay sumunod sa pinakamainam na diskarte, at ang iba ay lumihis mula sa sarili nitong, pagkatapos ay ang lihis na panig ay maaari lamang mawala mula dito at sa anumang kaso ay maaaring dagdagan ang pakinabang nito.

Ang klase ng mga laro na may isang punto ng siyahan ay may malaking interes kapwa mula sa teoretikal at praktikal na pananaw. Sa teorya ng laro, napatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may isang saddle point, at, samakatuwid, ang bawat gayong laro ay may solusyon, ibig sabihin. mayroong isang pares ng pinakamainam na diskarte ng magkabilang panig, na nagbibigay ng isang average na kabayaran na katumbas ng presyo ng laro. Kung ang isang laro na may kumpletong impormasyon ay binubuo lamang ng mga personal na paglipat, pagkatapos kapag ang bawat panig ay naglalapat ng pinakamainam na diskarte, dapat itong laging magtapos sa isang ganap na tiyak na kinalabasan, lalo na, isang panalo na eksaktong katumbas ng presyo ng laro.

Bilang isang halimbawa ng isang laro na may kumpletong impormasyon, nagbibigay kami sikat na laro na may stacking coins bilog na mesa... Dalawang manlalaro na halili na naglalagay ng magkatulad na mga barya sa bilog na mesa, sa tuwing pumipili ng isang di-makatwirang posisyon ng gitna ng barya; Hindi pinapayagan ang magkakapatong na mga barya. Ang manlalaro na naglalagay ng huling barya ay nanalo (kapag walang puwang para sa iba). Malinaw na, ang kinalabasan ng larong ito ay palaging isang pangwakas na konklusyon, at mayroong isang mahusay na natukoy na diskarte na tinitiyak ang isang maaasahang panalo para sa manlalaro na inuuna ang barya. Pangalanan, dapat maglagay siya ng barya sa gitna ng talahanayan sa kauna-unahang pagkakataon, at pagkatapos ay tumugon sa isang simetriko na paglipat sa paglipat ng bawat kalaban. Sa kasong ito, ang ikalawang manlalaro ay maaaring kumilos ayon sa gusto niya nang hindi binabago ang paunang natukoy na resulta ng laro. Samakatuwid, ang larong ito ay may katuturan lamang para sa mga manlalaro na hindi alam ang pinakamainam na diskarte. Ang sitwasyon ay katulad sa chess at iba pang mga laro na may kumpletong impormasyon; anuman sa mga larong ito ay may isang saddle point at isang solusyon na nagpapahiwatig sa bawat isa sa mga manlalaro ng kanyang pinakamainam na diskarte; ang solusyon ng larong chess ay hindi lamang natagpuan dahil ang bilang ng mga kumbinasyon ng mga posibleng paglipat sa chess ay masyadong malaki upang makapagtayo ng isang matrix sa pagbabayad at makahanap ng isang saddle point dito.

§ 3. Dalisay at magkahalong diskarte. Solusyon ng laro sa magkahalong diskarte

Kabilang sa mga walang hanggan na laro ng praktikal na kahalagahan, ang mga laro na may isang saddle point ay medyo bihira; mas tipikal ang kaso kapag ang ilalim at nangungunang mga presyo ng laro ay magkakaiba. Ang pagsusuri sa mga matrice ng naturang mga laro, napagpasyahan namin na kung ang bawat manlalaro ay bibigyan ng isang pagpipilian ng isang solong diskarte, kung gayon, pagbibilang sa isang makatuwirang kumikilos na kalaban, ang pagpipiliang ito ay dapat na matukoy ng prinsipyo ng minimum. Sumusunod sa aming pinakamataas na diskarte, para sa anumang pag-uugali ng kalaban, sinasadya naming ginagarantiyahan ang aming sarili ng isang kabayaran na katumbas ng mas mababang presyo ng laro α. Lumilitaw ang isang natural na katanungan: posible bang garantiyahan ang sarili ng isang average na kabayaran na mas malaki kaysa sa α, kung gagamit tayo ng hindi isang solong "dalisay" na diskarte, ngunit sapal na alternatibong maraming mga diskarte? Ang nasabing pinagsamang mga diskarte, na binubuo sa paglalapat ng maraming mga purong diskarte alternating ayon sa isang random na batas na may isang tiyak na ratio ng dalas, ay tinatawag na magkahalong mga diskarte sa teorya ng laro.

Malinaw na, ang bawat dalisay na diskarte ay isang espesyal na kaso ng isang halo-halong isa, kung saan ang lahat ng mga diskarte, maliban sa isa, ay inilalapat na may mga zero frequency, at ang isang ito - na may dalas na 1. Lumalabas na, ang paglalapat hindi lamang dalisay, kundi pati na rin magkahalong mga diskarte, maaaring makakuha ng isa para sa bawat wakas na solusyon sa laro, ibig sabihin isang pares ng (pangkalahatang magkakahalo) na mga diskarte tulad na kapag inilapat ng parehong mga manlalaro ang mga ito, ang kabayaran ay katumbas ng presyo ng laro, at para sa anumang panig na paglihis mula sa pinakamainam na diskarte, ang pagbabayad ay maaari lamang magbago sa isang direksyon na hindi kanais-nais para sa ang nalihis.

Ang pahayag sa itaas ay bumubuo sa nilalaman ng tinaguriang pangunahing teorya ng teorya ng laro. Ang teoryang ito ay unang napatunayan ni von Neumann noong 1928. Ang mga kilalang patunay ng teorama ay medyo kumplikado; samakatuwid, ipinapakita lamang namin ang pagbabalangkas nito.

Ang bawat end game ay mayroong kahit isang solusyon (posibleng sa lugar ng magkahalong diskarte).

Ang nakuha na nagreresulta mula sa isang desisyon ay tinatawag na gastos ng laro. Ipinapahiwatig ng pangunahing teorama na ang bawat may takda na laro ay may isang presyo. Malinaw na, ang presyo ng laro ν laging namamalagi sa pagitan ng mas mababang presyo ng laro α at ng mas mataas na presyo ng laro β:

(3.1) α ≤ ν ≤ β

Sa katunayan, ang α ay ang maximum na garantisadong kabayaran na maibibigay namin sa ating sarili na ginagamit lamang ang aming mga dalisay na diskarte. Dahil ang mga halo-halong diskarte ay kasama, bilang isang partikular na kaso, lahat ng mga dalisay, pagkatapos, na pinapayagan, bilang karagdagan sa mga dalisay, ay magkakahalo din ng mga diskarte, kami, sa anumang kaso, ay hindi pinalala ang aming mga kakayahan; samakatuwid, ν ≥ α. Katulad nito, isinasaalang-alang ang mga kakayahan ng kalaban, ipinapakita namin ang ν ≤ β, na nagpapahiwatig ng pinatunayan na hindi pagkakapantay-pantay (3.1).

Ipaalam sa amin ang isang espesyal na notasyon para sa magkahalong mga diskarte. Kung, halimbawa, ang aming halo-halong diskarte ay binubuo sa paglalapat ng mga diskarte A 1, A 2, A 3 na may mga frequency p 1, p 2, p 3, at p 1 + p 2 + p 3 \u003d 1, isasaad namin ang diskarteng ito

Katulad nito, ang halo-halong diskarte ng kalaban ay isinasaad ng:

kung saan ang q 1, q 2, q 3 ay ang mga frequency na kung saan ang mga diskarte B 1, B 2, B 3 ay halo-halong; q 1 + q 2 + q 3 \u003d 1.

Ipagpalagay na nakakita kami ng isang solusyon sa laro, na binubuo ng dalawang pinakamainam na halo-halong diskarte S A *, S B *. Sa pangkalahatang kaso, hindi lahat ng mga purong diskarte na magagamit sa isang naibigay na manlalaro ay kasama sa kanyang pinakamainam na halo-halong diskarte, ngunit ilan lamang. Tatawagan namin ang mga diskarte na kasama sa pinakamainam na halo-halong diskarte ng manlalaro ng kanyang "kapaki-pakinabang" na mga diskarte. Ito ay lumabas na ang solusyon sa laro ay may isa pang kamangha-manghang pag-aari: kung ang isa sa mga manlalaro ay sumusunod sa kanyang pinakamainam na halo-halong diskarte SA * (SB *), kung gayon ang bayad ay mananatiling hindi nagbabago at katumbas ng presyo ng laro game, anuman ang kung ano ang ginagawa ng ibang manlalaro, maliban kung lumampas siya sa mga "kapaki-pakinabang" na diskarte. Halimbawa, siya ay maaaring gumamit ng anuman sa kanyang "kapaki-pakinabang" na mga diskarte sa purong anyo, at maaari ring ihalo ang mga ito sa anumang proporsyon.

§ 4. Elementary na pamamaraan para sa paglutas ng mga laro. Mga Laro 2x2 at 2xn

Kung ang laro mxn ay walang isang saddle point, pagkatapos ang paghahanap ng isang solusyon sa pangkalahatan ay isang mahirap na gawain, lalo na para sa malaking m at n. Minsan ang gawaing ito ay maaaring gawing simple sa pamamagitan ng pagbawas muna ng bilang ng mga diskarte sa pamamagitan ng pagtanggal ng ilang hindi kinakailangan. Ang labis na diskarte ay a) duplicate at b) halatang hindi kapaki-pakinabang. Isaalang-alang, halimbawa, ang isang laro na may matrix:

Madali upang matiyak na ang diskarte 3 3 eksaktong inuulit ("duplicate") na diskarte 1, samakatuwid, ang alinman sa dalawang diskarte na ito ay maaaring matanggal. Dagdag dito, ang paghahambing ng mga linya A 1 at A 2, nakikita natin na ang bawat elemento ng linya A2 ay mas mababa (o katumbas ng) katumbas na elemento ng linya A 1. Malinaw na, hindi natin dapat gamitin ang diskarte sa A2, sadyang hindi ito kapaki-pakinabang. Sa pamamagitan ng pagtanggal ng A 3 at A 2, dinala namin ang matrix sa higit pa simpleng isip... Dagdag dito, tandaan namin na ang diskarte B 3 ay malinaw na hindi kapaki-pakinabang para sa kalaban; tinatanggal ito, dinadala namin ang matrix sa huling form:

Kaya, ang 4 × 4 na laro ay nabawasan sa isang 2 × 3 na laro sa pamamagitan ng pag-aalis ng duplicate at halatang hindi magandang diskarte.

Ang pamamaraan para sa pagtanggal ng duplicate at malinaw naman na hindi kanais-nais na mga diskarte ay dapat palaging nauuna ang desisyon ng laro. Ang pinakasimpleng mga kaso ng may wakas na mga laro, na laging malulutas ng mga pamamaraan sa elementarya, ay mga larong 2 × 2 at 2xn.

Isaalang-alang ang isang 2 × 2 laro na may isang matrix:

Dalawang kaso ang maaaring mangyari dito: 1) ang laro ay may isang saddle point; 2) ang laro ay walang saddle point. Sa unang kaso, malinaw ang solusyon: ito ay isang pares ng mga diskarte na lumusot sa isang saddle point. Sa pamamagitan ng paraan, tandaan na sa isang 2 × 2 na laro, ang pagkakaroon ng isang saddle point ay laging tumutugma sa pagkakaroon ng sinasadyang hindi magandang diskarte, na dapat tanggalin sa paunang pagtatasa.

Huwag hayaang may punto ng siyahan at, samakatuwid, ang mas mababang presyo ng laro ay hindi katumbas ng pang-itaas: α ≠ β. Kinakailangan upang mahanap ang pinakamainam na halo-halong diskarte ng manlalaro A:

Ito ay nakikilala sa pamamagitan ng pag-aari na anuman ang mga pagkilos ng kalaban (maliban kung lumampas siya sa mga limitasyon ng kanyang "kapaki-pakinabang" na mga diskarte), ang kabayaran ay katumbas ng presyo ng laro ν. Sa isang 2 × 2 na laro, ang parehong mga diskarte ng kaaway ay "kapaki-pakinabang", kung hindi man ang laro ay magkakaroon ng isang dalisay na solusyon sa diskarte (saddle point). Nangangahulugan ito na kung susundin namin ang aming pinakamainam na diskarte (4.1), kung gayon ang kaaway ay maaaring gumamit ng anuman sa kanyang mga dalisay na diskarte B 1, B 2 nang hindi binabago ang average na kabayaran ν. Samakatuwid mayroon kaming dalawang mga equation:

mula sa kung saan, isinasaalang-alang ang p 1 + p 2 \u003d 1, nakukuha namin:

Nahanap namin ang halaga ng laro ν sa pamamagitan ng pagpapalit ng mga halagang p 1, p 2 sa alinman sa mga equation (4.2).

Kung ang presyo ng laro ay kilala, pagkatapos ay upang matukoy ang pinakamainam na diskarte ng kalaban

sapat ang isang equation, halimbawa:

kung saan, isinasaalang-alang ang q 1 + q 2 \u003d 1, mayroon kaming:

Halimbawa 1. Hahanapin natin ang solusyon ng larong 2 × 2 na isinasaalang-alang sa Halimbawa 1 § 1, kasama ang matrix:

Ang laro ay walang saddle point (α \u003d –1; β \u003d +1), at, samakatuwid, ang solusyon ay dapat na nakasalalay sa domain ng magkahalong diskarte:

Kailangan mong hanapin ang p 1, p 2, q 1 at q 2. Para sa p 1 mayroon kaming equation

1 * p 1 + (–1) (1 - p 1) \u003d (–1) p 1 + 1 (1 - p 1)

saan p 1 \u003d 1/2, p 2 \u003d 1/2.

Katulad nito, nakita namin: q 1 \u003d 1/2, q 2 \u003d 1/2, ν \u003d 0.

Dahil dito, ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro ay ang sapalarang kahalili pareho sa kanilang dalisay na diskarte, gamit ang bawat isa sa kanila nang pantay madalas; sa kasong ito, ang average na kabayaran ay magiging katumbas ng zero.

Ang nagresultang konklusyon ay sapat na malinaw nang maaga. Sa susunod na halimbawa, titingnan pa natin ang higit pa mahirap na laro, ang solusyon kung saan ay hindi masyadong halata. Ang halimbawa ay isang panimulang halimbawa ng mga larong kilala bilang "pagdaraya" o "pagdaraya" na mga laro. Sa pagsasagawa, sa mga sitwasyon ng hidwaan, madalas silang ginagamit iba't ibang paraan mapanlinlang ang kaaway (maling impormasyon, paglalagay ng maling mga target, atbp.). Ang halimbawa, sa kabila ng pagiging simple nito, ay medyo nakapagtuturo.

Halimbawa 2. Ang laro ay ang mga sumusunod. Mayroong dalawang kard: isang alas at isang deuce. Ginaguhit ng Player A ang isa sa kanila nang sapalaran; Hindi nakikita ni B kung aling kard ang kinuha niya. Kung naglabas si A ng isang alas, ipinahayag niya: "Mayroon akong alas," at hinihiling mula sa kalaban na 1 ruble. Kung ang A ay kumuha ng isang deuce, pagkatapos ay maaari niyang alinman sa A 1) sabihin na "Mayroon akong alas" at humiling ng 1 ruble mula sa kalaban, o A 2) aminin na mayroon siyang isang deuce at bayaran ang kalaban na 1 ruble.

Ang kaaway, kung kusang-loob siyang binayaran ng 1 ruble, maaari lamang itong tanggapin. Kung ang 1 ruble ay hinihingi sa kanya, pagkatapos ay maaari niyang alinman sa B 1) maniwala sa manlalaro A na mayroon siyang alas at bigyan siya ng 1 ruble, o B 2) humiling ng isang tseke upang matiyak na ang pahayag na A. suriin ay lumabas na Ang A ay talagang may alas, si B ay dapat magbayad ng A 2 rubles. Kung lumalabas na ang A ay nagdaraya at mayroon siyang isang deuce, ang manlalaro A ay nagbabayad ng manlalaro B 2 rubles. Kinakailangan upang suriin ang laro at hanapin ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro.

Desisyon. Ang laro ay may isang medyo kumplikadong istraktura; binubuo ito ng isang ipinag-uutos na random na paglipat - ang pagpipilian ng manlalaro A ng isa sa dalawang kard - at dalawang personal na paglipat, na, gayunpaman, ay hindi kinakailangang maganap. Sa katunayan, kung ang A ay kumuha ng isang alas, kung gayon hindi siya gumagawa ng anumang personal na paglipat: bibigyan lamang siya ng isang pagkakataon - na humingi ng 1 ruble, na ginagawa niya. Sa kasong ito, ang isang personal na paglipat - maniwala o hindi maniwala (ibig sabihin magbayad o hindi magbayad ng 1 ruble) - ay inililipat sa manlalaro B. Kung ang A bilang isang resulta ng unang random na paglipat na natanggap ng dalawa, pagkatapos ay bibigyan siya ng isang personal ilipat: magbayad ng 1 ruble o subukang lokohin ang kalaban at humiling ng 1 ruble (sa madaling salita: "huwag linlangin" o "linlangin"). Kung pipiliin ng A ang una, pagkatapos ay ang B ay dapat lamang tanggapin ang 1 ruble; kung pinili ng A ang huli, pagkatapos ang manlalaro B ay bibigyan ng isang personal na paglipat: maniwala o hindi maniwala sa A (iyon ay, magbayad ng A 1 ruble o humiling ng pag-verify).

Ang mga diskarte ng bawat isa sa mga manlalaro ay mga patakaran na nagpapahiwatig kung paano dapat kumilos ang manlalaro kapag binigyan siya ng isang personal na paglipat. Malinaw na, ang A ay may dalawang diskarte lamang: A 1 - upang manloko, A 2 - hindi manloko. Ang B ay mayroon ding dalawang mga diskarte: B 1 - upang maniwala, B 2 - hindi maniwala. Bumuo tayo ng game matrix. Upang magawa ito, kinakalkula namin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1. A 1 B 1 (A daya, naniniwala si B). Kung ang A ay nakatanggap ng ace (ang posibilidad na ito ay ½, kung gayon hindi siya bibigyan ng isang personal na paglipat; hinihingi niya ang 1 ruble, at naniniwala ang manlalaro na B sa kanya; Ang nakuha ni A sa rubles ay 1. Kung ang A ay nakatanggap ng dalawa (ang posibilidad na ito ay din ½), alinsunod sa kanyang diskarte, nanloko at humihingi siya ng 1 ruble; Naniniwala sa kanya at nagbabayad; ang bayad ay A ay katumbas din ng 1. Average na kabayaran: isang 11 \u003d ½ * 1 + ½ * 1 \u003d 1.

2. A 1 B 2 (A daya, B ay hindi naniniwala). Kung ang A ay nakakakuha ng alas, wala siyang personal na paglipat; nangangailangan siya ng 1 ruble; Ayon sa kanyang diskarte, hindi siya naniniwala at, bilang resulta ng tseke, nagbabayad ng 2 rubles (ang nakuha ng A ay +2). Kung ang A ay nakakakuha ng isang deuce, alinsunod sa kanyang diskarte, hinihingi niya ang 1 ruble; Si B, ayon sa kanyang sarili, ay hindi naniniwala; bilang isang resulta, nagbabayad ang A ng 2 rubles (ang nakuha ni A ay –2). Ang average na kabayaran ay: isang 12 \u003d ½ * (+ 2) + ½ * (- 2) \u003d 0.

3. A 2 B 1 (A ay hindi manloko, naniniwala si B). Kung ang A ay naglalabas ng isang alas, hinihingi niya ang 1 ruble; Ang B, alinsunod sa kanyang diskarte, ay nagbabayad; ang nakuha ng A ay +1. Kung naglabas si A ng isang deuce, nagbabayad siya ng 1 ruble alinsunod sa kanyang diskarte; Ang natitira lamang ay ang tanggapin (ang nakuha ng A ay –1). Ang average na kabayaran ay: isang 21 \u003d ½ * (+ 1) + ½ * (- 1) \u003d 0.

4. A 2 B 2 (A ay hindi manlinlang, B ay hindi naniniwala). Kung ang A ay naglalabas ng isang alas, hinihingi niya ang 1 ruble; Ang mga tseke ng B at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang panalo ay +2). Kung ang A ay naglalabas ng isang deuce, nagbabayad siya ng 1 ruble; Ang natitira lamang ay ang tanggapin (ang kabayaran ay 1). Ang average na kabayaran ay: isang 22 \u003d ½ * (+ 2) + ½ * (- 1) \u003d ½.

Binubuo namin ang game matrix:

Ang matrix ay walang saddle point. Ang mas mababang presyo ng laro ay α \u003d 0, ang pinakamataas na presyo ng laro ay β \u003d ½. Maghanap tayo ng isang solusyon sa laro sa larangan ng halo-halong mga diskarte. Paglalapat ng formula (4.3), nakukuha namin ang:

mga yan Dapat gamitin ng manlalaro A ang kanyang unang diskarte (impostor) sa isang katlo ng lahat ng mga kaso, at ang pangalawa (hindi daya) sa dalawang third. Sa kasong ito, mananalo siya sa average ng presyo ng laro ν \u003d 1/3.

Ang halagang ν \u003d 1/3 ay nagpapahiwatig na sa ilalim ng mga kundisyong ito ang laro ay kapaki-pakinabang para sa A at hindi kanais-nais para sa B. Gamit ang kanyang pinakamainam na diskarte, A ay maaaring palaging magbigay sa kanyang sarili ng isang positibong average na kabayaran. Tandaan na kung ginamit ni A ang kanyang pinaka-maingat (maximin) na diskarte (sa kasong ito, ang parehong mga diskarte A 1 at A 2 ay maximin), magkakaroon siya ng average na kabayaran na katumbas ng zero. Kaya, ang paggamit ng isang halo-halong diskarte ay nagbibigay sa A ng pagkakataong mapagtanto ang kanyang kalamangan sa paglipas ng B, na lumitaw sa ilalim ng ibinigay na mga patakaran ng laro.

Tukuyin natin ang pinakamainam na diskarte B. Mayroon kaming: q 1 * 1 + q 2 * 0 \u003d 1/3, q 1 \u003d 1/3, q 2 \u003d 2/3. Mula saan

ibig sabihin ang manlalaro B ay dapat magtiwala sa A sa isang katlo ng lahat ng mga kaso at bayaran siya ng 1 ruble nang hindi sinusuri, at sa dalawang katlo ng mga kaso - suriin. Pagkatapos siya, sa average, mawawala ang 1/3 para sa bawat laro. Kung ginamit niya ang kanyang minimax purong diskarte B 2 (huwag maniwala), matatalo siya sa average na 1/2 para sa bawat laro.

Ang solusyon sa 2 × 2 na laro ay maaaring mabigyan ng isang simpleng interpretasyong geometriko. Hayaang mayroong isang 2 × 2 na laro na may matrix

Kumuha ng isang seksyon ng axis ng abscissa na may haba na 1 (Larawan 4.1). Ang kaliwang dulo ng seksyon (ang punto na may abscissa x \u003d 0) ay kumakatawan sa diskarte A 1; ang kanang dulo ng seksyon (x \u003d 1) - diskarte A 2. Gumuhit tayo ng dalawang patayo sa axis ng abscissa sa pamamagitan ng mga puntos 1 at and 2: axis Ako–Ako at axis II - II... Sa axis Ako–Ako ipagpaliban namin ang mga panalo para sa diskarteng A 1; sa axis II - II - Nanalo para sa diskarte A 2. Isaalang-alang ang diskarte ng kalaban B 1; nagbibigay ito ng dalawang puntos sa mga palakol Ako–Ako at II - II na may ordinates isang 11 at isang 21, ayon sa pagkakabanggit. Gumuhit tayo ng isang tuwid na linya B 1 B 1 sa pamamagitan ng mga puntong ito. Malinaw na, kung may diskarte ang kaaway B 1 ilalapat natin ang halo-halong diskarte

pagkatapos ang aming average na kabayaran, pantay sa kasong ito sa isang 11 p 1 + a 21 p 2, ay kinakatawan ng isang punto M sa linya B 1 B 1; ang abscissa ng puntong ito ay katumbas ng p 2. Ang tuwid na linya ng 1 1 1, na kumakatawan sa kabayaran sa kaso ng diskarte will 1, ay regular na tatawaging "diskarte 1".

Malinaw na, ang diskarte na B2 ay maaaring maitayo nang eksakto sa parehong paraan (Larawan 4.2).

Kailangan nating hanapin ang pinakamainam na diskarte S A *, iyon ay, isa na kung saan ang minimum na kabayaran (para sa anumang pag-uugali ng B) ay magiging isang maximum. Para dito, itinatayo namin ang mas mababang hangganan ng kabayaran para sa mga diskarte na B 1, B 2, ibig sabihin. sirang linya B 1 NB 2 na minarkahan sa Fig. 4.2 na may isang naka-bold na linya. Ang mas mababang hangganan na ito ay ipahayag ang minimum na kabayaran ng manlalaro A para sa alinman sa kanyang magkahalong diskarte; ang puntong N, kung saan ang minimum na nakuha na ito ay umabot sa maximum nito, tumutukoy sa desisyon at sa presyo ng laro. Madaling ma-verify na ang ordinate ng point N ay ang presyo ng laro game, at ang abscissa nito ay katumbas ng p 2 - ang dalas ng aplikasyon ng diskarte A 2 sa pinakamainam na halo-halong diskarte S A *.

Sa aming kaso, ang desisyon ng laro ay natutukoy ng intersection point ng mga diskarte. Gayunpaman, hindi ito palaging magiging kaso; sa igos Ipinapakita ng 4.3 ang kaso kung, sa kabila ng pagkakaroon ng intersection ng mga diskarte, ang solusyon ay nagbibigay para sa parehong mga manlalaro ng purong diskarte (A 2 at B 2), at ang presyo ng laro ν \u003d a 22. Sa kasong ito, ang matrix ay may isang saddle point, at ang diskarte na A 1 ay malinaw na hindi kapaki-pakinabang, dahil para sa anumang purong diskarte ng kalaban, nagbibigay ito ng mas kaunting pakinabang kaysa sa A2.

Sa kaso kung ang kalaban ay may sadyang hindi kanais-nais na diskarte, ang interpretasyong geometriko ay may form na ipinakita sa Fig. 4.4.

Sa kasong ito, ang mas mababang hangganan ng kabayaran ay kasabay ng diskarte B 1, ang diskarte B 2 ay halatang hindi kapaki-pakinabang para sa kalaban.

Ginawang posible ng interpretasyon ng geometriko na mailarawan din ang mas mababa at mataas na mga presyo ng laro (Larawan 4.5).

Upang ilarawan, nagtatayo kami ng mga geometric na interpretasyon ng mga larong 2 × 2 na isinasaalang-alang sa mga halimbawa 1 at 2 (Larawan 4.6 at 4.7).

Natiyak namin na ang anumang 2 × 2 na laro ay malulutas ng mga trick sa elementarya. Ang anumang 2xn na laro ay maaaring malutas sa eksaktong katulad na paraan. kung saan mayroon lamang kaming dalawang mga diskarte, at ang kaaway ay may isang di-makatwirang numero.

Ipagpalagay na mayroon kaming dalawang mga diskarte: А 1, А 2, at mga istratehiya ng kaaway - n: 1, 2, ..., n. Ang matrix ‖a ij ‖ ay ibinigay; binubuo ito ng dalawang mga hilera at n haligi. Katulad din sa kaso ng dalawang diskarte, binibigyan namin ang problema ng isang geometric na interpretasyon; ang mga diskarte ng kalaban ay kinakatawan ng mga tuwid na linya (Larawan 4.8). Binubuo namin ang mas mababang hangganan ng mga panalo (sirang linya B 1 MNB 2) at hahanapin dito ang puntong N na may pinakamataas na ordinate. Ang puntong ito ay nagbibigay ng solusyon sa laro (diskarte ) ang ordenado ng puntong N ay katumbas ng presyo ng larong ν, at ang abscissa ay katumbas ng dalas p 2 ng diskarte A 2.

Sa kasong ito, ang pinakamainam na diskarte ng kalaban ay nakuha sa pamamagitan ng paggamit ng isang halo ng dalawang "kapaki-pakinabang" na diskarte: B 2 at B 4, intersecting sa point N. Ang diskarte B 3 ay malinaw na hindi kapaki-pakinabang, at ang diskarte B 1 ay hindi kapaki-pakinabang para sa pinakamainam na diskarte SA *. Kung ang A ay mananatili sa kanyang pinakamainam na diskarte, kung gayon ang pagbabayad ay hindi magbabago, alinman sa kanyang mga "kapaki-pakinabang" na diskarte na ginagamit ng B, gayunpaman, magbabago ito kung ang B ay lilipat sa mga diskarte na B 1 o B 3. Sa teorya ng laro, napatunayan na ang anumang may wakas na laro na mxn ay may isang solusyon kung saan ang bilang ng mga "kapaki-pakinabang" na diskarte ng magkabilang panig ay hindi lalampas sa hindi bababa sa dalawang numero m at n. Sa partikular, sumusunod ito mula sa palaging ang laro 2xm ay may solusyon kung saan hindi hihigit sa dalawang "kapaki-pakinabang" na diskarte ang lumahok sa magkabilang panig.

Gamit ang isang interpretasyong geometriko, maaaring magbigay ang isang simpleng paraan upang malutas ang anumang 2xm na laro. Direkta mula sa pagguhit, nakakahanap kami ng isang pares ng "kapaki-pakinabang" na mga diskarte ng kalaban B j at B k, intersecting sa point N (kung higit sa dalawang diskarte ang lumusot sa point N, kumuha kami ng alinman sa dalawa). Alam namin na kung ang manlalaro A ay sumusunod sa kanyang pinakamainam na diskarte, kung gayon ang kabayaran ay hindi nakasalalay sa proporsyon kung saan inilalapat niya ang B sa kanyang "kapaki-pakinabang" na mga diskarte, samakatuwid,

Mula sa mga equation na ito at sa kundisyon p 2 \u003d 1 - p 1, mahahanap namin ang p1, p2 at ang presyo ng laro ν. Alam ang presyo ng laro, maaari mong agad na matukoy ang pinakamainam na diskarte player B. Para dito, halimbawa, nalutas ang equation: qja 1 j + qka 1 k \u003d ν, kung saan qj + qk \u003d 1. Sa kaso kung mayroon tayong mga diskarte, at ang kaaway ay mayroon lamang dalawa, malinaw naman, ang ang problema ay nalulutas sa isang ganap na katulad na paraan; sapat na pansinin na sa pamamagitan ng pagbabago ng palatandaan ng panalo sa kabaligtaran, maaaring gawing isa ang manlalaro A mula sa "panalo" hanggang sa "pagkatalo". Maaari mong malutas ang laro nang hindi binabago ang panalong tanda; pagkatapos ang problema ay malulutas nang direkta para sa B, ngunit hindi isang mas mababa, ngunit isang itaas na kabayaran ay itinayo (Larawan 4.9). Sa hangganan, isang point N na may minimum na ordinate ang hinahanap, na ang presyo ng laro ν.

Isaalang-alang at lutasin ang maraming mga halimbawa ng mga laro na 2 × 2 at 2xm, na pinasimple na mga halimbawa ng mga laro na may praktikal na kahalagahan.

Halimbawa 3.Nagpadala ang Side A ng dalawang bomba sa lugar ng kalaban B Ako at II; Ako lilipad sa harap, II - sa likod. Ang isa sa mga bomba - hindi alam nang maaga kung alin - dapat magdala ng bomba, ang iba pa ay gumaganap ng pagpapaandar ng escort. Sa lugar ng kalaban, ang mga bomba ay inaatake ng isang mandirigmang B. Ang mga bomba ay armado ng mga kanyon ng iba't ibang mga rate ng sunog. Kung inaatake ng manlalaban ang likurang bombero II, pagkatapos ay ang mga kanyon lamang ng bomba na ito ang sumunog dito; kung inaatake niya ang harap na bomba, pagkatapos ay pinaputukan siya ng mga kanyon ng parehong mga bomba. Ang posibilidad ng pagpindot ng isang manlalaban sa unang kaso ay 0.3, sa pangalawang 0.7.

Kung ang manlalaban ay hindi kinunan ng defensive bombardment fire, hinahampas nito ang target na pinili nito na may posibilidad na 0.6. Ang gawain ng mga bomba ay upang dalhin ang bomba sa target; ang gawain ng manlalaban ay upang maiwasan ito, i. pagbaril ng isang bomba ng carrier. Kinakailangan na pumili ng pinakamainam na mga diskarte ng mga partido:

a) para sa panig A: aling bombero ang dapat gamitin bilang isang carrier?

b) para sa panig B: alin ang bomba na aatake?

Desisyon. Mayroon kaming isang simpleng kaso ng isang 2 × 2 laro; panalo-posibilidad hindi pagkatalo ng carrier. Ang aming mga diskarte: Isang 1 - carrier - bomber Ako; Isang 2 - carrier - bombero II... Mga diskarte ng kaaway: B 1 - ang bomba ay inaatake Ako; B 2 - atake ng bomba II... Isulat natin ang game matrix, ibig sabihin hanapin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1.A 1 B 1 (carrier Ako, ay inaatake Ako). Ang carrier ay hindi maaabot kung ang mga bomba ay shoot down ang manlalaban, o huwag shoot down, ngunit hindi ito pindutin ang target nito: isang 11 \u003d 0.7 + 0.3 * 0.4 \u003d 0.82.

2.A 2 B 1 (carrier II, ay inaatake Ako). isang 21 \u003d 1

3.A 1 B 2 (carrier Ako, ay inaatake II). Isang 12 \u003d 1

4.A 2 B 2 (carrier II, ay inaatake II). 22 \u003d 0.3 + 0.7 * 0.4 \u003d 0.58

Ang game matrix ay mayroong form:

Ang ilalim na presyo ng laro ay 0.82; nangungunang presyo 1. Ang Matrix ay walang saddle point; naghahanap kami ng isang solusyon sa larangan ng magkahalong diskarte. Meron kami:

p 1 * 0.82 + p 2 * 1 \u003d ν

p 1 * 1 + p 2 * 0.58 \u003d ν

p 1 \u003d 0.7; p 2 \u003d 0.3

Ang aming pinakamainam na diskarte ay, iyon ay, bilang isang carrier, kailangan mong pumili ng mas madalas Akokaysa sa II... Ang presyo ng laro ay ν \u003d 0.874. Alam ν, natutukoy namin ang q 1 at q 2 - ang mga dalas ng mga diskarte B 1 at B 2 sa pinakamainam na diskarte ng kalaban S B *. Mayroon kaming: q 1 * 0.82 + q 2 * 1 \u003d 0.874 at q 2 \u003d 1 - q 1, saan mula q 1 \u003d 0.7; q 2 \u003d 0.3, ibig sabihin, ang pinakamainam na diskarte ng kalaban ay .

Halimbawa 4.Inaatake ng Side A ang bagay, ipinagtatanggol ito ng panig B. Ang panig A ay may dalawang eroplano; ang panig B ay may tatlong mga baril laban sa sasakyang panghimpapawid. Ang bawat sasakyang panghimpapawid ay nagdadala ng isang malakas na nakasisirang armas; upang ma-hit ang bagay, sapat na para sa kahit isang eroplano ang lumusot dito. Ang panig ng sasakyang panghimpapawid ay maaaring pumili ng alinman sa tatlong mga direksyon upang lumapit sa pasilidad: Ako, II, III (fig. 4.10). Ang kaaway (panig B) ay maaaring maglagay ng anuman sa kanyang mga baril sa anumang direksyon; sa parehong oras, ang bawat sandata ay nag-shoot lamang ng lugar ng puwang na may kaugnayan sa naibigay na direksyon, at hindi kukunan ang mga katabing direksyon. Ang bawat baril ay maaari lamang magpaputok sa isang sasakyang panghimpapawid; ang fired eroplano ay hit ng posibilidad 1. Hindi alam ng Side A kung saan matatagpuan ang mga baril; hindi alam ng panig B kung saan magmula ang mga eroplano. Ang gawain ng Side A ay upang maabot ang bagay; ang gawain ng panig B ay upang maiwasan ang kanyang pagkatalo. Maghanap ng solusyon sa laro.

Desisyon. Ang laro ay isang 2 × 3 na laro. Ang kabayaran ay ang posibilidad na maabot ang bagay. Ang aming mga posibleng diskarte ay: Isang 1 - magpadala ng isang eroplano nang paisa-isa sa dalawang magkakaibang direksyon. At 2 - ipadala ang parehong mga eroplano sa parehong direksyon. Mga diskarte ng kaaway: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - ilagay ang dalawang baril sa isang direksyon at isa sa kabilang direksyon; Sa 3 - ilagay ang lahat ng tatlong mga baril sa parehong direksyon. Binubuo namin ang matrix ng laro.

1.A 1 B 1 (lumilipad ang mga eroplano magkakaibang direksyon; isa-isang inilalagay ang mga baril). Malinaw na, sa kasong ito, hindi isang solong eroplano ang makakalusot sa object: isang 11 \u003d 0.

2. А 2 1 1 (ang mga eroplano ay sabay na lumilipad sa parehong direksyon; ang mga baril ay inilalagay isa-isa). Malinaw na, sa kasong ito, isang sasakyang panghimpapawid ang pumasa sa bagay nang hindi nagpaputok: isang 21 \u003d 1.

3. А 1 В 2 (ang mga eroplano ay lumilipad nang paisa-isa; ipinagtatanggol ng kaaway ang dalawang direksyon at iniiwan ang pangatlong walang proteksyon). Ang posibilidad na hindi bababa sa isang eroplano ang masira sa bagay ay katumbas ng posibilidad na ang isa sa kanila ay pipili ng isang hindi protektadong direksyon: isang 12 \u003d 2/3.

4. А 2 В 2 (ang mga eroplano ay sama-sama na lumilipad sa parehong direksyon; ipinagtatanggol ng kaaway ang isang direksyon na may dalawang baril at isa sa isa, iyon ay, talagang ipinagtatanggol ang isang direksyon at iniiwan ang dalawang walang proteksyon). Ang posibilidad na hindi bababa sa isang eroplano ang masira sa bagay ay katumbas ng posibilidad ng isang pares ng mga eroplano na pumili ng isang talagang hindi protektadong direksyon: isang 22 \u003d 2/3.

5. A 1 B 3 (ang mga eroplano ay lumilipad nang paisa-isa; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong baril): a 13 \u003d 1.

6. А 2 В 3 (ang parehong mga eroplano ay lumipad na magkasama; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong mga baril). Para sa bagay na ma-hit, ang sasakyang panghimpapawid ay dapat pumili ng isang hindi protektadong direksyon: isang 23 \u003d 2/3.

Game Matrix:

Ipinapakita ng matrix na ang diskarte sa 3 ay malinaw naman na hindi maganda kung ihahambing sa 2 (maaaring malutas ito nang maaga). Diskarte sa pagtawid sa 3, ang laro ay nabawasan sa isang 2 × 2 na laro:

Ang matrix ay may isang saddle point: ang ilalim na presyo ng larong 2/3 ay tumutugma sa nangungunang isa. Sa parehong oras, tandaan namin na para sa amin (A) ang diskarte na A 1 ay halatang hindi kapaki-pakinabang. Konklusyon: ang magkabilang panig A at B ay dapat palaging gumamit ng kanilang purong diskarte A 2 at B 2, ibig sabihin kailangan naming magpadala ng mga eroplano ng 2, pagpili nang sapalaran ang direksyon kung saan ipinadala ang pares; dapat ilagay ng kalaban ang kanyang mga sandata sa sumusunod na paraan: dalawa - sa isang direksyon, isa - sa isa pa, at ang pagpili ng mga direksyon na ito ay dapat ding gawin nang sapalaran (dito, tulad ng nakikita natin, na "dalisay na diskarte" ay nagsasama ng isang elemento ng pagkakataon). Ang paglalapat ng mga pinakamainam na diskarte na ito, palagi kaming makakakuha ng isang pare-pareho ang average na kabayaran na 2/3 (ibig sabihin, ang bagay ay maaabot ng isang 2/3 na posibilidad). Tandaan na ang nahanap na solusyon sa laro ay hindi lamang ang isa; bilang karagdagan sa solusyon sa purong mga diskarte, mayroong isang buong seksyon ng halo-halong mga diskarte ng player A, na kung saan ay pinakamainam, mula p 1 \u003d 0 hanggang p 1 \u003d 1/3 (Larawan 4.11).

Madali, halimbawa, upang makita nang direkta na ang parehong average na kabayaran ng 2/3 ay makukuha kung ilalapat namin ang aming mga diskarte A1 at A2 sa mga proporsyon ng 1/3 at 2/3.

Halimbawa 5. Ang mga kundisyon ay pareho sa naunang halimbawa, ngunit ang apat na direksyon ng pag-atake ay posible para sa amin, at ang kaaway ay may apat na sandata.

Desisyon.Mayroon pa kaming dalawang posibleng diskarte: Isang 1 - magpadala ng mga eroplano nang paisa-isa, Isang 2 - magkakasamang magpadala ng dalawang mga eroplano. Ang kaaway ay may limang posibleng diskarte: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - ilagay ang dalawang baril sa dalawang magkakaibang direksyon; Sa 3 - ilagay ang dalawang baril sa isang direksyon at isa-isa sa isa pang dalawa; Sa 4, ilagay ang tatlong baril sa isang direksyon at ang isa sa kabilang direksyon; Sa 5 - ilagay ang lahat ng apat na baril sa parehong direksyon. Ang mga istratehiyang B 4, B 5 ay itatapon nang maaga na halatang hindi kapaki-pakinabang. Nangangatuwiran nang katulad sa naunang halimbawa, binubuo namin ang game matrix:

Ang mas mababang presyo ng laro ay 1/2, ang nasa itaas ay 3/4. Ang matrix ay walang saddle point; ang solusyon ay nakasalalay sa lugar ng magkahalong diskarte. Gamit ang interpretasyong geometriko (Larawan 4.12), isama natin ang mga "kapaki-pakinabang" na diskarte ng kaaway: B 1 at B 2.

Ang mga frequency p 1 at p 2 ay natutukoy mula sa mga equation: p 1 * 0 + (1 - p 1) * 1 \u003d ν at p 1 * 5/6 + (1 - p 1) * 1/2 \u003d ν; saan p 1 \u003d 3/8; p 2 \u003d 5/8; ν \u003d 5/8, ibig sabihin ang aming pinakamainam na diskarte ay ... Gamit ito, ginagarantiyahan namin ang aming sarili ng average na panalo na 5/8. Alam ang presyo ng laro ν \u003d 5/8, nakita namin ang mga frequency q 1 at q 2 ng mga "kapaki-pakinabang" na diskarte ng kalaban: q 1 * 0 + (1 - q 1) * 5/6 \u003d 5/8, q 1 \u003d ¼, q 2 \u003d ¾. Ang pinakamainam na diskarte ng kalaban ay: .

Halimbawa 6. Ang panig A ay may dalawang diskarte A 1 at A 2, ang panig B ay may apat na B 1, B 2, B 3 at B 4. Ang game matrix ay mayroong form:

Maghanap ng solusyon sa laro.

Desisyon. Mas mababang presyo ng laro 3; tuktok 4. Ang interpretasyong geometriko (fig 4.13) ay nagpapakita na ang mga kapaki-pakinabang na diskarte ng manlalaro B ay B 1 at B 2 o B 2 at B 4:

Ang Player A ay walang hanggan maraming pinakamainam na halo-halong mga diskarte: sa pinakamainam na diskarte, ang p 1 ay maaaring mag-iba mula 1/5 hanggang 4/5. Ang presyo ng laro ν \u003d 4. Ang Player B ay may dalisay na pinakamainam na diskarte B 2.

§ lima. Mga Karaniwang Pamamaraan wakasan ang mga solusyon sa laro

Sa ngayon, isinasaalang-alang lamang namin ang mga pinaka-elementong laro ng uri ng 2xn, na maaaring madaling malulutas at payagan ang isang maginhawa at madaling maunawaan na interpretasyon ng geometriko. Sa pangkalahatang kaso, ang paglutas ng laro na mxn ay isang mahirap na problema, at ang pagiging kumplikado ng problema at ang dami ng kinakailangang pagkalkula upang malutas ito ay tumataas nang malaki sa pagtaas ng m at n. Gayunpaman, ang mga paghihirap na ito ay hindi isang pangunahing katangian at nauugnay lamang sa isang napakalaking dami ng mga kalkulasyon, na sa ilang mga kaso ay maaaring maging praktikal na hindi praktikal. Ang pangunahing aspeto ng pamamaraan para sa paghahanap ng solusyon ay mananatiling pareho para sa anumang m.

Ilarawan natin ito sa halimbawa ng larong 3xn. Bigyan natin ito ng isang interpretasyong geometriko - isa na sa spatial. Ang aming tatlong estratehiya A 1, A 2 at A 3 ay ilalarawan ng tatlong puntos sa eroplano hoy; ang una ay namamalagi sa pinagmulan (Larawan.5.1), ang pangalawa at pangatlo - sa mga palakol Oh at OU sa layo na 1 mula sa simula.

Ang mga palakol ay iginuhit sa pamamagitan ng mga puntong A 1, A 2 at A 3 AkoAko, IIII at IIIIIIpatayo sa eroplano hoy... Sa axis AkoAko ang mga nadagdag ay idineposito sa diskarteng A 1 sa mga palakol IIII at IIIIII - Mga panalo na may mga diskarte A 2, A 3. Ang bawat diskarte ng kaaway na B j ay inilalarawan ng isang eroplano na pinuputol sa mga palakol AkoAko, IIII at IIIIII mga segment na katumbas ng mga kabayaran para sa mga kaukulang diskarte A 1, A 2 at A 3 at diskarte B j. Sa gayon itinayo ang lahat ng mga diskarte ng kaaway, nakakakuha kami ng isang pamilya ng mga eroplano sa ibabaw ng tatsulok na A 1, A 2 at A 3 (Larawan 5.2). Para sa pamilyang ito, posible ring bumuo ng isang mas mababang hangganan ng kabayaran, tulad ng ginawa namin sa kaso ng 2xn, at hanapin sa hangganan na ito ang isang punto N na may maximum na taas sa itaas ng eroplano hoy... Ang taas na ito ang magiging gastos ng laro ν.

Ang mga frequency p 1, p 2, p 3 ng mga diskarte A 1, A 2 at A 3 sa pinakamainam na diskarte SA * ay matutukoy ng mga coordinate (x, y) ng point N, katulad ng: p 2 \u003d x, p 3 \u003d y, p 1 \u003d 1 - p 2 - p 3. Gayunpaman, tulad ng isang geometric na konstruksyon, kahit na para sa 3xn case, ay hindi madaling ipatupad at nangangailangan ng maraming oras at pagsisikap ng imahinasyon. Sa pangkalahatang kaso ng isang laro, gayunpaman, ilipat ito sa isang m-dimensional na puwang at mawala ang lahat ng kalinawan, bagaman ang paggamit ng terminolohiya na geometriko sa isang bilang ng mga kaso ay maaaring maging kapaki-pakinabang. Kapag nilulutas ang mga laro sa mxn, sa pagsasagawa mas madaling gamitin ang hindi mga geometric na pagkakatulad, ngunit ang mga pamamaraang analytical ng computational, lalo na't ang mga pamamaraang ito ang tanging angkop para sa paglutas ng isang problema sa mga computer.

Ang lahat ng mga pamamaraang ito ay mahalagang pakuluan sa paglutas ng isang problema sa pamamagitan ng sunud-sunod na mga pagsubok, ngunit ang pag-order ng pagkakasunud-sunod ng mga pagsubok ay nagbibigay-daan sa iyo upang bumuo ng isang algorithm na hahantong sa isang solusyon sa pinaka-matipid na paraan. Dito ay magtutuon kami ng saglit sa isang pamamaraang computational para sa paglutas ng mga laro sa mxn - ang tinaguriang "linear program" na pamamaraan. Para sa mga ito, unang nagbibigay kami ng isang pangkalahatang pahayag ng problema ng paghahanap ng isang solusyon sa laro mxn. Hayaan ang isang laro mxn na may mga diskarte m A 1, A 2,…, Isang m ng manlalaro A at mga diskarte na B 1, B 2,…, B n ng manlalaro B ay bibigyan at isang pagbabayad matrix ‖a i j ‖ ay ibinigay. Kinakailangan upang makahanap ng isang solusyon sa laro, ibig sabihin dalawang pinakamainam na halo-halong diskarte ng mga manlalaro A at B

kung saan ang p 1 + p 2 + ... + p m \u003d 1; q 1 + q 2 +… + q n \u003d 1 (ang ilan sa mga bilang na p i at q j ay maaaring katumbas ng zero).

Ang aming pinakamainam na diskarte na S A * ay dapat magbigay sa amin ng isang kabayaran na hindi mas mababa sa ν para sa anumang pag-uugali ng kalaban, at isang pagbabayad na katumbas ng ν para sa kanyang pinakamainam na pag-uugali (diskarte S B *). Katulad nito, ang diskarte na S B * ay dapat magbigay sa kalaban ng isang pagkawala na hindi hihigit sa ν para sa alinman sa aming pag-uugali at katumbas ng ν para sa aming pinakamainam na pag-uugali (diskarte S A *).

Ang halaga ng presyo ng laro ν sa kasong ito ay hindi namin alam; ipalagay natin na ito ay katumbas ng ilan positibong numero... Sa paniniwalang ito, hindi namin nilalabag ang pangkalahatang pangangatuwiran; para sa ν\u003e 0, halatang sapat na ang lahat ng mga elemento ng matrix ‖a i j ‖ maging hindi nauugnay. Ito ay maaaring laging makamit sa pamamagitan ng pagdaragdag sa mga elemento ‖a i j ‖ isang sapat na malaking positibong halaga L; habang ang presyo ng laro ay tataas ng Lat ang desisyon ay hindi magbabago.

Ipagpalagay na pinili namin ang aming pinakamainam na diskarte S A *. Pagkatapos ang aming average na kabayaran sa diskarte ng kalaban B j ay magiging: a j \u003d p 1 a 1j + p 2 a 2j +… + p m a mj. Ang aming pinakamainam na diskarte sa S A * ay may pag-aari na, para sa anumang pag-uugali ng kalaban, nagbibigay ito ng kabayaran na hindi kukulangin sa ν; samakatuwid, ang alinman sa mga bilang na isang j ay hindi maaaring mas mababa sa ν. Nakukuha namin ang isang bilang ng mga kundisyon:

Hinahati namin ang mga hindi pagkakapantay-pantay (5.1) ng isang positibong halaga ν at ipahiwatig

Pagkatapos ang mga kundisyon (5.1) ay maaaring nakasulat sa form

kung saan ang ξ 1, ξ 2,…, ξ m ay mga hindi negatibong numero. Dahil р 1 + p 2 +… + p m \u003d 1, kung gayon ang dami ξ 1, ξ 2,…, masiyahan ang kondisyon

(5.3) ξ 1 + ξ 2 +… + ξ m \u003d 1 / ν.

Nais naming gawin ang aming mga garantisadong panalo hangga't maaari hangga't maaari; malinaw naman, at the same time tamang bahagi pagkakapantay-pantay (5.3) tumatagal ng isang minimum na halaga. Kaya, ang problema ng paghahanap ng isang solusyon sa laro ay nabawasan sa sumusunod na problema sa matematika: tukuyin ang mga hindi nagkakahalagang halaga ξ 1, ξ 2,…, satisf m kasiya-siyang mga kondisyon (5.2) upang ang kanilang kabuuan Φ \u003d ξ 1 + ξ 2 +… + ξ m ay minimal.

Karaniwan, kapag ang paglutas ng mga problema na nauugnay sa paghahanap ng matinding halaga (maxima at minima), ang pagpapaandar ay naiiba at ang mga derivatives ay ipinapantay sa zero. Ngunit ang gayong pamamaraan ay walang silbi sa kasong ito, dahil ang pagpapaandar Φ, na kailangang mabawasan sa isang minimum, ay linear, at ang mga derivatives nito na patungkol sa lahat ng mga argumento ay katumbas ng pagkakaisa, ibig sabihin huwag maglaho kahit saan. Dahil dito, ang maximum ng pagpapaandar ay naabot sa isang lugar sa hangganan ng saklaw ng pagkakaiba-iba ng mga argumento, na tinutukoy ng kinakailangan ng hindi negatibiti ng mga argumento at kundisyon (5.2). Ang pamamaraan ng paghanap ng matinding halaga sa pamamagitan ng pagkita ng kaibhan ay hindi angkop din sa mga kasong iyon kapag ang maximum ng mas mababa (o minimum ng itaas) na limitasyon sa pagbabayad ay natutukoy para sa paglutas ng laro, tulad ng ginawa namin, halimbawa, kapag nilulutas ang 2xn games. Sa katunayan, ang mas mababang hangganan ay binubuo ng mga seksyon ng mga tuwid na linya, at ang maximum ay naabot hindi sa punto kung saan ang derivative ay zero (walang ganoong punto sa lahat), ngunit sa hangganan ng agwat o sa punto ng intersection ng tuwid na mga seksyon.

Upang malutas ang mga naturang problema, na kung saan ay karaniwang sa pagsasanay, isang espesyal na linear na patakaran ng pamahalaan programa ay binuo sa matematika. Ang problema sa linear na programa ay ipinahiwatig bilang mga sumusunod. Ang isang sistema ng mga linear equation ay ibinibigay:

Kinakailangan upang makahanap ng mga hindi nagkakahalagang halaga ng mga dami ξ 1, ξ 2,…, ξ m kasiya-siyang kondisyon (5.4) at sabay na pinapaliit ang ibinigay na homogenous na linear na pagpapaandar ng mga dami ξ 1, ξ 2,…, ξ m (linear form): Φ \u003d c 1 ξ 1 + c 2 ξ 2 +… + cm ξ m

Madaling mapatunayan na ang problema sa itaas ng teorya ng laro ay isang espesyal na kaso ng problema sa linear na programa para sa c 1 \u003d c 2 \u003d ... \u003d cm \u003d 1. Sa unang tingin, maaaring ang mga kondisyon (5.2) ay hindi katumbas ng mga kundisyon (5.4), dahil sa halip na pantay na mga palatandaan naglalaman sila ng mga palatandaan ng hindi pagkakapantay-pantay. Gayunpaman, madaling mapupuksa ang mga palatandaan ng hindi pagkakapantay-pantay sa pamamagitan ng pagpapakilala ng mga bagong kathang-isip na di-negatibong mga variable na z 1, z 2,…, z n at mga kundisyon sa pagsulat (5.2) sa form:

Ang form Φ na mabawasan sa isang minimum ay Φ \u003d ξ 1 + ξ 2 +… + ξ m. Ginagawang posible ng linear na patakaran ng programa na piliin ang mga halagang ξ 1, ξ 2,…, ξ m na nakakatugon sa mga nakasaad na kinakailangan sa pamamagitan ng isang maliit na bilang ng mga sunud-sunod na sample. Para sa higit na kalinawan, ipapakita namin dito ang paggamit ng aparatong ito nang direkta sa materyal ng paglutas ng mga partikular na laro.

Halimbawa 1. Kinakailangan upang makahanap ng isang solusyon sa larong 3 × 3 na ibinigay sa Halimbawa 2 § 1 na may matrix:

Upang gawing hindi negatibo ang lahat ng isang ij, idinagdag namin ang lahat ng mga elemento ng matrix L \u003d 5. Nakukuha namin ang matrix:

Sa kasong ito, tataas ang presyo ng laro ng 5, at hindi magbabago ang desisyon.

Tukuyin natin ang pinakamainam na diskarte na S A *. Mga Kundisyon (5.2) ay may form:

kung saan ξ 1 \u003d p 1 / ν, ξ 2 \u003d p 2 / ν, ξ 3 \u003d p 3 / ν. Upang matanggal ang mga palatandaan ng hindi pagkakapantay-pantay, ipinakikilala namin ang mga variable ng dummy z 1, z 2, z 3; ang mga kundisyon (5.6) ay isusulat sa form:

Ang linear form na Φ ay mayroong form: Φ \u003d ξ 1 + ξ 2 + ξ 3 at dapat gawin nang maliit hangga't maaari. Kung ang lahat ng tatlong mga diskarte B ay "kapaki-pakinabang", pagkatapos lahat ng tatlong mga variable na dummy z 1, z 2, z 3 ay nawala (ibig sabihin, isang kabayaran na katumbas ng presyo ng laro ν ay makakamit para sa bawat diskarte B j). Ngunit wala pa rin kaming dahilan upang sabihin na ang lahat ng tatlong mga diskarte ay "kapaki-pakinabang". Upang suriin ito, susubukan naming ipahayag ang form Φ sa mga tuntunin ng mga variable ng dummy z 1, z 2, z 3 at tingnan kung makakamit natin, sa pag-aakalang ang mga ito ay katumbas ng zero, ang minimum ng form. Upang magawa ito, nilulutas namin ang mga equation (5.7) na patungkol sa mga variable ables 1,, 2, ξ 3 (ibig sabihin, ipinahahayag namin ang ξ 1,, 2, ξ 3 sa mga tuntunin ng dummy variable na z 1, z 2, z 3 ):

Ang pagdaragdag ng ξ 1, ξ 2, ξ 3, nakukuha natin ang: Φ \u003d 1/5 + z 1/20 + z 2/10 + z 3/20. Narito ang mga koepisyent para sa lahat ng z ay positibo; samakatuwid, ang anumang pagtaas sa z 1, z 2, z 3 sa itaas ng zero ay maaari lamang humantong sa isang pagtaas sa form Φ, at nais naming ito ay maging minimal. Samakatuwid, ang mga halagang z 1, z 2, z 3 na gumagawa ng form na Φ sa isang minimum ay z 1 \u003d z 2 \u003d z 3 \u003d 0. Samakatuwid, ang minimum na halaga ng form Φ ay: 1 / ν \u003d 1 / 5, saan nagmula ang presyo ng laro ν \u003d 5. Ang pagpapalit ng zero na halaga z 1, z 2, z 3 sa mga pormula (5.8), nalaman natin: ξ 1 \u003d 1/20, ξ 2 \u003d 1/10, ξ 3 \u003d 1/20, o, pagpaparami ng mga ito ng ν, p 1 \u003d 1/4, p 2 \u003d 1/2, p 3 \u003d 1/4. Kaya, ang pinakamainam na diskarte A ay natagpuan: , ibig sabihin dapat nating isulat ang bilang 1 sa isang isang-kapat ng lahat ng mga kaso, 2 sa kalahati ng mga kaso, at 3 sa natitirang quarter ng mga kaso.

Alam ang presyo ng laro ν \u003d 5, maaari na ng isa kilalang pamamaraan hanapin ang pinakamainam na diskarte ng kaaway ... Upang magawa ito, gagamitin namin ang aming anumang dalawang "kapaki-pakinabang" na diskarte (halimbawa, A 2 at A 3) at isulat ang mga equation:

9q 1 + 11 (1-q 2 -q 1) \u003d 5,

saan mula q 1 \u003d q3 \u003d 1/4; q 2 \u003d 1/2. Ang pinakamainam na diskarte ng kalaban ay magiging pareho sa atin: ... Bumalik tayo ngayon sa orihinal na (hindi nabago) na laro. Upang magawa ito, kinakailangan lamang na ibawas ang halagang L \u003d 5 na idinagdag sa mga elemento ng matrix mula sa presyo ng laro ν \u003d 5. Nakukuha namin ang presyo ng orihinal na laro v 0 \u003d 0. Samakatuwid, ang pinakamainam na mga diskarte ng parehong partido ay nagbibigay ng isang average na kabayaran na katumbas ng zero; ang laro ay pantay na kapaki-pakinabang o hindi maganda para sa parehong partido.

Halimbawa 2. Ang Sports Club A ay may tatlong mga pagpipilian para sa komposisyon ng koponan A 1, A 2 at A 3. Club B - din sa tatlong mga pagpipilian B 1, B 2 at B 3. Kapag nag-aaplay upang lumahok sa kumpetisyon, wala sa mga club ang nakakaalam kung aling lineup ang pipiliin ng kalaban. Ang mga posibilidad ng club A na nanalo sa iba't ibang mga pagpipilian ang mga lineup, na halos kilala mula sa karanasan ng mga nakaraang pagpupulong, ay ibinibigay ng matrix:

Alamin kung gaano kadalas dapat maglaro ang mga club ng bawat iskwad laban sa bawat isa upang makamit ang pinakamataas na average na bilang ng mga tagumpay.

Desisyon. Ang mas mababang presyo ng laro ay 0.4; nangungunang 0.6; naghahanap kami ng isang solusyon sa larangan ng magkahalong diskarte. Upang hindi makitungo sa mga praksyon, pinarami namin ang lahat ng mga elemento ng matrix ng 10; sa kasong ito, ang presyo ng laro ay tataas ng 10 beses, at ang desisyon ay hindi magbabago. Nakukuha namin ang matrix:

Mga Kundisyon (5.5) ay may form:

at ang minimum na kundisyon Φ \u003d ξ 1 + ξ 2 + ξ 3 \u003d min.

Suriin kung ang lahat ng tatlong mga diskarte ng kalaban ay "kapaki-pakinabang". Bilang isang teorya, unang ipinapalagay namin na ang mga variable ng dummy z 1, z 2, z 3 ay katumbas ng zero, at para sa pagpapatunay ay nalulutas namin ang mga equation (5.10) para sa ξ 1, ξ 2, ξ 3:

(5.12) 136Φ \u003d 30 + 13z 1 + 18z 2 - 51z 3

Ipinapakita ng Formula (5.12) na ang isang pagtaas sa mga variable na z 1 at z 2 sa paghahambing sa kanilang ipinapalagay na halaga ng zero ay maaari lamang dagdagan Φ, habang ang isang pagtaas sa z 3 ay maaaring bawasan Φ. Gayunpaman, ang pagtaas sa z 3 ay dapat gawin nang maingat upang ang mga halagang ξ 1, ξ 2, ξ 3, depende sa z 3, ay hindi maging negatibo sa kasong ito. Samakatuwid, sa kanang bahagi ng mga pagkakapantay-pantay (5.11), itinakda namin ang mga halagang z 1 at z 2 na katumbas ng zero, at tataasan namin ang halagang z 3 sa mga pinapayagan na mga limitasyon (hanggang sa alinman sa mga halagang 1, ξ 2, ξ 3 nawawala). Mula sa pangalawang pagkakapantay-pantay sa (5.11) makikita na ang pagtaas sa z 3 ay "ligtas" para sa halagang ξ 2 - tataas lamang ito mula rito. Tulad ng para sa mga dami na ξ 1 at ξ 3, narito ang isang pagtaas sa z 3 hanggang sa isang tiyak na limitasyon lamang ang posible. Ang dami ξ 1 ay nawawala sa z 3 \u003d 10/23; ang dami ξ 3 ay nawawala nang mas maaga, nasa z 3 \u003d 1/4. Samakatuwid, na binibigyan ang z 3 ng maximum na pinapayagan na halagang z 3 \u003d 1/4, sa kasong ito ay zero ang halagang ξ 3.

Upang suriin kung ang form Φ ay nagiging isang minimum sa z 1 \u003d 0, z 2 \u003d 0, ξ 3 \u003d 0, ipinapahayag namin ang natitirang mga (nonzero) variable sa mga tuntunin ng sinasabing zero z 1, z 2, ξ 3. Ang paglutas ng mga equation (5.10) na patungkol sa ξ 1, ξ 2 at z 3, nakukuha namin:

(5.13) 32Φ \u003d 7 + Зz 1 + 4z 2 + ξ 3

Mula sa pormula (5.13) makikita na ang anumang pagtaas sa z 1, z 2, ξ 3 sa kanilang ipinapalagay na zero halaga ay maaari lamang dagdagan ang form Φ. Samakatuwid, ang solusyon sa laro ay natagpuan; natutukoy ito ng mga halagang z 1 \u003d z 2 \u003d ξ 3 \u003d 0, kung saan ξ 1 \u003d 1/32, ξ 2 \u003d 3/16, z 3 \u003d 1/4. Pagpalit sa formula (5.13), nakita namin ang presyo ng laro ν: 32Φ \u003d 7 \u003d 32 / ν; ν \u003d 32/7. Ang aming pinakamainam na diskarte: ... Ang mga diskarte na "Kapaki-pakinabang" (mga komposisyon A 1 at A 2) ay dapat na ilapat sa mga frequency na 1/7 at 6/7; komposisyon A 3 - hindi kailanman nalalapat.

Upang hanapin ang pinakamainam na diskarte ng kalaban, sa pangkalahatang kaso, maaari mong gawin ang mga sumusunod: baguhin ang tanda ng bayad sa kabaligtaran, magdagdag ng isang pare-pareho na halaga L sa mga elemento ng matrix upang gawin silang hindi negatibo, at malutas ang problema para sa kalaban sa katulad na paraan sa paglutas nito para sa ating sarili. Gayunpaman, ang katotohanan na alam na natin ang presyo ng laro ν medyo pinapasimple ang problema. Bilang karagdagan, sa partikular na kaso, ang gawain ay karagdagang pinasimple ng katotohanan na dalawang "kapaki-pakinabang" na diskarte lamang ng kalaban, B 1 at B 2, lumahok sa solusyon, dahil ang halaga ng z 3 ay hindi katumbas ng zero, at samakatuwid, sa diskarte B 3, ang presyo ng laro ay hindi naabot ... Pagpili ng anumang "kapaki-pakinabang" na diskarte ng manlalaro A, halimbawa ng A 1, mahahanap ng isa ang mga frequency q 1 at q 2. Upang magawa ito, nagsusulat kami ng equation na 8q 1 + 2 (1 - q 1) \u003d 32/7, saan nanggaling ang q 1 \u003d 3/7, q 2 \u003d 4/7; ang pinakamainam na diskarte ng kalaban ay: , ibig sabihin ang kaaway ay hindi dapat gumamit ng komposisyon B 3, at ang mga komposisyon B 1 at B2 ay dapat gamitin sa mga dalas ng 3/7 at 4/7.

Bumabalik sa orihinal na matrix, natutukoy namin ang totoong halaga ng laro ν 0 \u003d 32/7: 10 \u003d 0.457. Nangangahulugan ito na para sa isang malaking bilang pagpupulong Ang bilang ng mga tagumpay sa club A ay magiging 0.457 ng lahat ng mga pagpupulong

§ 6. Tinatayang mga pamamaraan para sa paglutas ng mga laro

Kadalasan, sa mga praktikal na problema, hindi na kailangang makahanap ng eksaktong solusyon sa laro; sapat na ito upang makahanap ng isang tinatayang solusyon na nagbibigay ng isang average na kabayaran na malapit sa presyo ng laro. Ang isang tinatayang kaalaman sa halaga ng laro ν ay maaaring ibigay sa pamamagitan ng isang simpleng pagtatasa ng matrix at ang pagpapasiya ng mas mababang (α) at \u200b\u200bitaas (β) na mga presyo ng laro. Kung ang α at β ay malapit, halos hindi na kailangang maghanap para sa isang eksaktong solusyon, ngunit sapat na upang pumili ng purong mga diskarte sa minimax. Sa mga kaso kung saan ang α at β ay hindi malapit, ang isa ay makakakuha ng isang praktikal na solusyon gamit ang mga pamamaraang numerikal para sa paglutas ng mga laro, kung saan maikling na-highlight namin ang pamamaraan ng pag-ulit.

Ang ideya sa likod ng pamamaraan ng pag-ulit ay ang mga sumusunod. Isang "naisip na eksperimento" ang nilalaro kung saan ginagamit ng mga kalaban A at B ang kanilang mga diskarte laban sa bawat isa. Ang eksperimento ay binubuo ng isang pagkakasunud-sunod ng mga elementong laro, na ang bawat isa ay may isang matrix ng isang naibigay na laro. Nagsisimula ito sa katotohanang kami (manlalaro A) ay pumili ng di-makatwirang isa sa aming mga diskarte, halimbawa, A i. Tumutugon dito ang kaaway sa kanyang diskarte na B j, na kung saan ay ang hindi gaanong kapaki-pakinabang para sa atin, i. binabago ang kabayaran para sa diskarte A i sa isang minimum. Tumugon kami sa paglipat na ito sa aming diskarte strategy k, na nagbibigay ng maximum na average na kabayaran kapag ang kalaban ay gumagamit ng diskarte B j. Dagdag dito - ang ulit ng kaaway. Tumugon siya sa aming pares ng mga gumagalaw na A i at A k sa kanyang diskarte na B j, na nagbibigay sa amin ng pinakamaliit na average na kabayaran para sa dalawang diskarte na ito (A i, A k), at iba pa. Sa bawat hakbang ng umuulit na proseso, ang bawat manlalaro ay tumutugon sa anumang paglipat ng iba pang manlalaro gamit ang kanyang sariling diskarte na pinakamainam na kamag-anak sa lahat ng kanyang nakaraang paggalaw, na isinasaalang-alang bilang isang uri ng halo-halong diskarte, kung saan ang mga dalisay na diskarte ay ipinakita sa mga sukat na naaayon ang dalas ng kanilang aplikasyon.

Ang pamamaraang ito ay, tulad ng, isang modelo ng totoong praktikal na "pagsasanay" ng mga manlalaro, kapag sinisiyasat ng bawat isa sa kanila ang pag-uugali ng kalaban sa pamamagitan ng karanasan at sinisikap na tumugon dito sa paraang kapaki-pakinabang para sa kanyang sarili. Kung ang gayong paggaya ng proseso ng pag-aaral ay nagpatuloy ng sapat na katagalan, kung gayon ang average na kabayaran sa bawat isang pares ng mga galaw (elementong laro) ay may posibilidad na ang presyo ng laro, at ang mga frequency na p 1 ... p m; q 1 ... q n, na natutugunan ng mga diskarte ng mga manlalaro sa rally na ito, lalapit sa mga frequency na tumutukoy sa pinakamainam na diskarte. Ipinapakita ng mga pagkalkula na ang tagpo ng pamamaraan ay napakabagal, ngunit hindi ito isang hadlang para sa mga makina ng pagkalkula ng bilis.

Ilarawan natin ang aplikasyon ng umuulit na pamamaraan gamit ang halimbawa ng larong 3 × 3 na nalutas sa Halimbawa 2 ng nakaraang seksyon. Ang laro ay ibinigay ng matrix:

Ipinapakita ng Talahanayan 6.1 ang unang 18 mga hakbang ng paulit-ulit na proseso. Naglalaman ang unang haligi ng bilang ng laro sa elementarya (isang pares ng mga galaw) n; sa pangalawang - numero ako ang napiling diskarte ng manlalaro A; sa susunod na tatlo - "naipon na mga panalo" para sa una n mga larong may mga diskarte sa kaaway B 1, B 2, B 3. Ang pinakamaliit sa mga halagang ito ay may salungguhit. Susunod ay ang numero j ang diskarte na pinili ng kaaway, at, nang naaayon, ang naipon na nakuha para sa n mga laro na may mga diskarte A 1, A 2, A 3 ng mga halagang ito, ang maximum ay may salungguhit mula sa itaas. Natutukoy ng mga may salungguhit na halaga ang pagpipilian ng diskarte sa pagtugon ng iba pang manlalaro. Ang mga sumusunod na graph ay sunud-sunod na nagpapakita: ang minimum na average na kabayaran ν, katumbas ng minimum na naipon na kabayaran na hinati sa bilang ng mga laro n; maximum na average na panalo na katumbas ng maximum na naipon na panalo na hinati sa n, at ang ibig sabihin ng kanilang arithmetic na ν * \u003d (ν +) / 2. Kapag dumarami n lahat ng tatlong dami ν, at ν * ay lalapit sa presyo ng larong ν, ngunit ang halagang ν *, natural, ay lalapit ito sa medyo mabilis.

Talahanayan 6.1.

Tulad ng nakikita mo mula sa halimbawa, ang tagpo ng mga pag-ulit ay napakabagal, ngunit pa rin, kahit na ang isang maliit na pagkalkula ay ginagawang posible upang makahanap ng isang tinatayang halaga ng presyo ng laro at ihayag ang pagkalat ng "kapaki-pakinabang" na mga diskarte. Kapag gumagamit ng mga makina ng pagkalkula, ang halaga ng pamamaraan ay tataas nang malaki. Ang bentahe ng umuulit na pamamaraan para sa paglutas ng mga laro ay ang dami at pagiging kumplikado ng mga pagkalkula na medyo mahina habang tumataas ang bilang ng mga diskarte. m at n.

§ 7. Mga pamamaraan para sa paglutas ng ilang mga walang katapusang laro

Ang isang walang katapusang laro ay isang laro kung saan hindi bababa sa isang panig ang may isang walang katapusang bilang ng mga diskarte. Ang mga pangkalahatang pamamaraan para sa paglutas ng mga nasabing laro ay hindi pa nabubuo ng sapat. Gayunpaman, para sa pagsasanay, ang ilang mga espesyal na kaso ay maaaring maging interesado, na aminin ang isang medyo simpleng solusyon. Isaalang-alang ang laro ng dalawang kalaban A at B, na ang bawat isa ay may isang walang hanggan (hindi mabilang) na hanay ng mga diskarte; ang mga diskarte para sa manlalaro A ay tumutugma sa magkakaibang kahulugan patuloy na pagbabago ng parameter x, at para sa parameter - sa... Sa kasong ito, sa halip na ang matrix ‖a ij ‖, ang laro ay tinukoy ng ilang pagpapaandar ng dalawang patuloy na magkakaibang mga argumento a (x, y), na tatawagin namin ang pagpapaandar na pagpapaandar (tandaan na ang pagpapaandar mismo a (x, y) ay hindi dapat magpapatuloy). Manalo ng pagpapaandar a (x, y) maaaring kinatawan ng geometrically ng ilang mga ibabaw a (x, y) sa lugar ng pagbabago ng mga argumento (x, y) (fig. 7.1)

Pagsusuri ng pagpapaandar na bayad a (x, y) ay ginaganap na katulad sa pagtatasa ng matrix sa pagbabayad. Una, ang mas mababang presyo ng laro α ay matatagpuan; para dito, natutukoy ito para sa bawat isa x minimum na pag-andar a (x, y) para sa lahat sa:, pagkatapos ang maximum ng mga halagang ito ay hinanap para sa lahat x (maximin):

Ang pinakamataas na presyo ng laro (minimax) ay natutukoy sa parehong paraan:

Isaalang-alang ang kaso kung kailan α \u003d β. Dahil ang halaga ng laro ν ay laging nasa pagitan ng α at β, ang kanilang kabuuang halaga ay ν. Ang pagkakapantay-pantay α \u003d β ay nangangahulugang ang ibabaw a (x, y) ay may isang saddle point, ibig sabihin, isang punto na may mga coordinate x 0, y 0, kung saan a (x, y) ay sa parehong oras minimal sa sa at maximum x (fig. 7.2).

Halaga a (x, y) sa puntong ito ang presyo ng laro ν: ν \u003d a (x 0, y 0). Ang pagkakaroon ng isang saddle point ay nangangahulugang ang walang katapusang larong ito ay may dalisay na solusyon sa diskarte; x 0, y 0 kumakatawan sa pinakamainam na purong diskarte A at B. Sa pangkalahatang kaso, kapag α ≠ β, ang laro ay maaaring magkaroon ng isang solusyon lamang sa larangan ng halo-halong mga diskarte (marahil hindi lamang ang isa). Halo-halong diskarte para sa walang katapusang mga laro mayroong ilang pamamahagi ng posibilidad para sa mga diskarte x at saisinasaalang-alang bilang mga random variable. Ang pamamahagi na ito ay maaaring maging tuloy-tuloy at natutukoy ng mga density f 1 (x) at f 2 (y); maaaring maging discrete, at pagkatapos ay ang pinakamainam na mga diskarte ay binubuo ng isang hanay ng magkakahiwalay na dalisay na diskarte na pinili na may ilang mga posibilidad na hindi nonzero.

Sa kaso kung saan ang walang katapusang laro ay walang saddle point, maaaring bigyan ng isang visual na geometric na interpretasyon ng mas mababa at itaas na mga presyo ng laro. Isaalang-alang ang isang walang katapusang laro na may pagpapaandar na bayad a (x, y)at mga diskarte x, ypatuloy na pinupuno ang mga segment ng linya (x 1, x 2) at (y 1, y 2)... Upang matukoy ang mas mababang presyo ng laro α, kailangan mong "tumingin" sa ibabaw a (x, y) mula sa axis sa, ibig sabihin proyekto ito sa isang eroplano xOa (fig. 7.3). Nakakuha kami ng isang tiyak na pigura na nakagapos mula sa mga gilid ng mga tuwid na linya x \u003d x 1 at x \u003d x 2, at mula sa itaas at ibaba ng mga kurba KB at K N. Ang mas mababang presyo ng laro α, malinaw naman, ay walang hihigit sa ang maximum na ordinate ng curve K N.

Katulad nito, upang mahanap ang mas mataas na presyo ng laro β, dapat na "tumingin" ang isang tao sa ibabaw a (x, y) mula sa axis x (ibabaw ng eroplano ang proyekto yoa) at hanapin ang minimum na ordenate ng itaas na hangganan ng K Sa projection (Larawan, 7.4).

Isaalang-alang ang dalawang halimbawa ng elementarya ng walang katapusang mga laro.

Halimbawa 1. Ang mga manlalaro A at B bawat isa ay may isang hindi mabilang na hanay ng mga posibleng diskarte xat sa, at 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Ang pagpapaandar na bayad para sa a ay ibinibigay ng ekspresyong a (x, y) - (x - y) 2. Maghanap ng solusyon sa laro.

Solusyon, Ibabaw ng isang (x, y) ay isang parabolic silindro (Larawan 7.5) at walang saddle point. Tukuyin ang mas mababang presyo ng laro; halata sa lahat x; kaya't \u003d 0. Tukuyin natin ang mas mataas na presyo ng laro. Upang magawa ito, mahahanap namin para sa isang nakapirming sa

Sa kasong ito, ang maximum ay laging naabot sa hangganan ng agwat (sa x \u003d 0 o x \u003d 1), ibig sabihin katumbas ito ng mga halagang y 2; (1 - y) 2, na mas malaki. Iguhit natin ang mga graph ng mga pagpapaandar na ito (Larawan 7.6), ibig sabihin paglabas ng proyekto a (x, y) sa eroplano yoa... Ang naka-bold na linya sa Fig. Ipinapakita ng 7.6 ang pagpapaandar. Malinaw na, ang pinakamababang halaga nito ay naabot sa y \u003d 1/2 at katumbas ng 1/4. Samakatuwid, ang pinakamataas na presyo ng laro ay β \u003d 1/4. Sa kasong ito, ang mas mataas na presyo ng laro ay tumutugma sa presyo ng laro ν. Sa katunayan, ang manlalaro A ay maaaring maglapat ng isang halo-halong diskarte S A \u003d , kung saan ang matinding halaga na x \u003d 0 at x \u003d 1 ay kasama kasama ang parehong mga frequency; pagkatapos para sa anumang diskarte ng manlalaro B ang average na kabayaran ng manlalaro A ay magiging katumbas ng: ½y 2 + ½ (1 - y) 2. Madaling mapatunayan na ang dami na ito para sa anumang mga halaga sa sa pagitan ng 0 at 1 ay may halagang hindi kukulangin sa ¼: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Sa gayon, ang manlalaro A na gumagamit ng halo-halong diskarte ay maaaring magagarantiyahan ang kanyang sarili ng isang kabayarang katumbas ng mas mataas na presyo ng laro; dahil ang presyo ng laro ay hindi maaaring maging higit sa mataas na presyo, pagkatapos diskarte na ito S Isang pinakamainam: S A \u003d S A *.

Ito ay mananatili upang mahanap ang pinakamainam na diskarte ng manlalaro B. Malinaw na, kung ang presyo ng laro ν ay katumbas ng mas mataas na presyo ng laro then, kung gayon ang pinakamainam na diskarte ng manlalaro B ay palaging magiging kanyang purong diskarte sa minimax, na ginagarantiyahan sa kanya ang mataas na presyo ng laro. Sa kasong ito, ang gayong diskarte ay y 0 \u003d ½. Sa katunayan, sa diskarteng ito, anuman ang gawin ng manlalaro A, ang kanyang kabayaran ay hindi hihigit sa ¼. Sumusunod ito mula sa halatang hindi pagkakapantay-pantay (x - ½) 2 \u003d x (x –1) + ¼ ≤ ¼

Halimbawa 2. Ang Side A ("kami") ay nagpaputok sa sasakyang panghimpapawid ng kaaway B. Upang makaiwas sa pagbabaril, maaaring maneuver ng kaaway na may ilang labis na karga sa, kung saan siya, sa kanyang paghuhusga, ay maaaring maglakip ng mga halaga mula sa sa \u003d 0 (tuwid na paggalaw) sa sa = sa max (paglipad sa isang bilog ng maximum na kurbada). Ipinapalagay namin sa max yunit ng pagsukat, ibig sabihin ilagay sa max \u003d 1. Sa paglaban sa kalaban, maaari tayong gumamit ng mga aparato sa paningin batay sa isa o iba pang teorya tungkol sa paggalaw ng target sa panahon ng paglipad ng projectile. Labis na karga x sa kadahilanang mapaglalarawang ito, maaari itong ipalagay na katumbas ng anumang halaga mula 0 hanggang 1. Ang aming gawain ay ang maabot ang kalaban; ang gawain ng kalaban ay manatiling hindi apektado. Probabilidad ng hit ng data x at sa ay tinatayang ipinahayag ng pormula: a (x, y) \u003d , Kung saan sa - labis na karga na ginamit ng kaaway; x - labis na karga na accounted para sa paningin. Kinakailangan upang matukoy ang pinakamainam na mga diskarte ng parehong partido.

Desisyon. Malinaw na, ang solusyon ng laro ay hindi nagbabago kung itinakda namin ang p \u003d 1. Ang pagpapaandar na bayad a (x, y) itinatanghal ng ibabaw na ipinakita sa Fig. 7.7.

Ito ay isang silindro na ibabaw na ang mga generatrice ay kahanay sa bisector ng anggulo ng coordinate hoy, at ang seksyon ng isang eroplano na patayo sa generatrix ay isang kurba ng uri ng isang normal na curve ng pamamahagi. Gamit ang interpretasyong geometriko ng mas mababa at mataas na mga presyo ng larong iminungkahi sa itaas, nakita namin ang β \u003d 1 (Larawan 7.8) at (Larawan 7.9). Ang laro ay walang saddle point; ang solusyon ay dapat hanapin sa lugar ng magkahalong diskarte. Ang problema ay medyo katulad ng problema sa nakaraang halimbawa. Sa katunayan, para sa maliit na halaga k ang pag-andar ay kumikilos tulad ng isang pagpapaandar - (x - y) 2, at ang solusyon ng laro ay makukuha kung ang mga tungkulin ng mga manlalaro A at B ay binago sa solusyon ng naunang halimbawa; mga yan ang aming pinakamainam na diskarte ay ang purong diskarte x \u003d 1/2, at ang pinakamainam na diskarte ng kalaban SB \u003d ay ilapat ang matinding mga diskarte y \u003d 0 at y \u003d 1 na may parehong mga frequency. Nangangahulugan ito na sa lahat ng mga kaso kailangan nating gamitin ang crosshair, na idinisenyo para sa isang labis na karga x \u003d 1/2, at ang kaaway ay hindi dapat gumamit ng isang maneuver sa kalahati ng lahat ng mga kaso, at sa kalahati - ang maximum na posibleng maniobra.

Fig. 7.8 Fig. 7.9.

Madaling patunayan na ang solusyon na ito ay magiging wasto para sa mga halagang k ≤ 2. Sa katunayan, ang average na kabayaran para sa diskarte ng kalaban S B \u003d at para sa aming diskarte x na ipinahayag ng pagpapaandar , na para sa mga halagang k ≤ 2 ay may isang maximum na х \u003d 1/2, na katumbas ng mas mababang presyo ng laro α. Dahil dito, ang paglalapat ng diskarte na S B ay ginagarantiyahan ang kalaban ng isang pagkawala na hindi hihigit sa α, kung saan malinaw na ang α - ang mas mababang presyo ng laro - ay ang presyo ng laro ν.

Para sa k\u003e 2, ang pagpapaandar a (x) ay may dalawang maxima (Larawan 7.10), na matatagpuan nang simetriko patungkol sa x \u003d 1/2 sa mga puntong x 0 at 1 - x 0, at ang halaga ng x 0 ay nakasalalay sa k .

Malinaw na, para sa k \u003d 2 x 0 \u003d 1 - x 0 \u003d ½; kapag dumarami k puntos x 0 at 1 - x 0 gumalaw, papalapit sa matinding mga puntos (0 at 1). Samakatuwid, ang desisyon ng laro ay depende sa k. Magtakda tayo ng isang tukoy na halaga para sa k, halimbawa, k \u003d 3, at maghanap ng solusyon sa laro; para dito tinutukoy namin ang abscissa x 0 ng maximum ng curve a (x). Katumbas sa zero ng hango ng pagpapaandar a (x), isinusulat namin ang equation upang matukoy ang x 0:

Ang equation na ito ay may tatlong mga ugat: x \u003d 1/2 (kung saan naabot ang minimum) at x 0, 1 - x 0, kung saan naabot ang maximum. Paglutas ng equation ayon sa bilang, mahahanap namin ang tinatayang x 0 ≈ 0.07; 1 - x 0 ≈ 0.93.

Patunayan natin na ang solusyon sa laro sa kasong ito ay ang sumusunod na pares ng mga diskarte:

Sa aming diskarte at diskarte ng kaaway sa ang average na kabayaran ay

Hanapin ang minimum na 1 (y) sa 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Ang pagtatakda ng y \u003d 1/2, nakukuha natin

na higit sa isang 1 (0); samakatuwid, ang presyo ng laro ay hindi mas mababa sa isang 1 (0):

Ngayon sabihin natin na ang kalaban ay gumagamit ng diskarte na S B *, at ginagamit namin ang diskarte x. Pagkatapos ang average na kabayaran ay magiging

Ngunit napili namin ang x 0 na tiyak upang sa x \u003d x 0 ang maximum ng expression (7.2) ay naabot; Dahil dito,

mga yan ang kalaban, gamit ang diskarte na S B *, ay maaaring maiwasan ang pagkawala na higit sa 0.530; samakatuwid, ν \u003d 0.530 ang presyo ng laro, at ang mga istratehiyang S A * at S B * ay nagbibigay ng solusyon. Nangangahulugan ito na dapat kaming gumamit ng mga pasyalan na may x \u003d 0.07 at x \u003d 0.93 na may parehong dalas, at ang kaaway ay hindi dapat maneuver na may parehong dalas at maneuver na may maximum na labis na karga.

Tandaan na ang kabayaran ν \u003d 0.530 ay kapansin-pansin na mas malaki kaysa sa mas mababang presyo ng laro , na maibibigay namin sa aming sarili sa pamamagitan ng paglalapat ng aming maximin na diskarte x 0 \u003d 1/2.

Isa sa praktikal na paraan ang paglutas ng walang katapusang mga laro ay ang kanilang tinatayang pagbawas sa mga may hangganan. Sa kasong ito, ang isang buong saklaw ng mga posibleng diskarte para sa bawat manlalaro ay magkakasama na pinagsama sa isang diskarte. Sa ganitong paraan, syempre, isang tinatayang solusyon lamang sa laro ang maaaring makuha, ngunit sa karamihan ng mga kaso ang isang eksaktong solusyon ay hindi kinakailangan.

Gayunpaman, dapat tandaan na kapag inilapat ang diskarteng ito, ang mga solusyon sa larangan ng halo-halong mga diskarte ay maaaring lumitaw kahit na sa mga kaso kung posible ang solusyon ng orihinal na walang katapusang laro sa mga purong diskarte, ibig sabihin kapag ang walang katapusang laro ay may isang saddle point. Kung, sa pamamagitan ng pagbawas ng isang walang katapusang laro sa isang may hangganan, isang halo-halong solusyon ang nakuha, na nagsasama lamang ng dalawang katabing "kapaki-pakinabang" na mga diskarte, pagkatapos ay makatuwiran upang subukang maglapat ng isang pantay na dalisay na diskarte ng orihinal na walang katapusang laro sa pagitan nila.

Bilang pagtatapos, tandaan namin na ang walang katapusang mga laro, hindi katulad ng mga may hangganan, ay maaaring walang solusyon. Magbigay tayo ng isang halimbawa ng isang walang katapusang laro na walang solusyon. Dalawang manlalaro ang nagpapangalan sa bawat integer. Pinangalanan higit pa natatanggap mula sa iba pang 1 ruble. Kung kapwa tumawag sa parehong numero, ang laro ay nagtatapos sa isang draw. Malinaw na walang solusyon ang laro. Gayunpaman, may mga klase ng walang katapusang mga laro kung saan tiyak na umiiral ang isang solusyon.

© 2021 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pagtatalo