Teorya ng larong at istatistika.

bahay / Pandaraya na asawa

Ang pagpili ng player ng isang aksyon ay tinatawag lumipat... May mga galaw personal (sinasadya ng player na ito o desisyon na iyon) at random (ang kinalabasan ng laro ay hindi nakasalalay sa kalooban ng player). Ang hanay ng mga patakaran na tumutukoy kung aling ilipat ang kailangang gawin ng manlalaro ay tinatawag diskarte... Ang mga diskarte ay malinis (di-random na mga pagpapasya ng mga manlalaro) at magkakahalo (ang diskarte ay maaaring isaalang-alang bilang isang random variable).

Puntong malungkot

SA teorya ng laro S. t. ( elemento ng pamana) ang pinakamalaking elemento ng haligi laro matrice, na kung saan ay sabay-sabay na pinakamaliit na elemento ng kaukulang hilera (sa laro ng dalawang taong may zero sum). Sa puntong ito, samakatuwid, ang pinakamataas sa isang manlalaro ay katumbas ng minimax ng iba pa; S. t May isang punto punto ng balanse.

Minimax teorem

Ang diskarte na naaayon sa minimax ay tinatawag diskarte sa minimax.

Ang prinsipyo na nagdidikta sa mga manlalaro ang pagpili ng pinaka "maingat" na maximin at minimax na mga diskarte ay tinatawag prinsipyo ng minimax... Ang prinsipyong ito ay sumusunod mula sa makatuwirang pag-aakalang hangarin ng bawat manlalaro upang makamit ang kabaligtaran na layunin ng kalaban.

Pinipili ng manlalaro ang kanyang mga aksyon, sa pag-aakalang ang kalaban ay kikilos sa isang hindi kanais-nais na pamamaraan, i.e. susubukan na "makasama".

Pagkawala ng pag-andar

Pagkawala ng pag-andar - isang pagpapaandar na, sa teorya ng mga desisyon sa istatistika, ay nagpapakilala sa pagkawala sa kaso ng hindi tamang paggawa ng desisyon batay sa sinusunod na data. Kung ang problema sa pagtantya ng parameter ng signal laban sa background ng ingay ay nalulutas, kung gayon ang pagkawala ng function ay isang sukatan ng pagkakaiba sa pagitan ng totoong kahulugan ang tinantyang parameter at pagtatantya ng parameter

Diskarte sa Pinakamahusay na Mixed Player ay isang kumpletong hanay ng mga aplikasyon ng mga dalisay na estratehiya na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kondisyon na may ibinigay na mga posibilidad.

Ang halo-halong diskarte ng manlalaro ay isang kumpletong hanay ng aplikasyon ng kanyang dalisay na mga diskarte na may maraming mga pag-uulit ng laro sa ilalim ng parehong mga kondisyon na may ibinigay na mga posibilidad.

1. Kung ang lahat ng mga elemento ng isang hilera ay hindi mas malaki kaysa sa mga kaukulang elemento ng ibang hilera, kung gayon ang orihinal na hilera ay maaaring matanggal mula sa payout matrix. Gayundin para sa mga haligi.

2. Ang gastos ng laro ay natatangi.

Dok: sabihin natin na mayroong 2 mga presyo ng laro v at, na naabot sa isang pares at, ayon sa pagkakabanggit, kung gayon

3. Kung ang parehong numero ay idinagdag sa lahat ng mga elemento ng payoff matrix, kung gayon ang pinakamainam na halo-halong mga diskarte ay hindi magbabago, at ang presyo ng laro ay tataas ng bilang na ito.

Dok:
saan

4. Kung ang lahat ng mga elemento ng payoff matrix ay pinarami ng parehong di-zero na numero, ang presyo ng laro ay paparami ng bilang na ito, at ang pinakamainam na diskarte ay hindi magbabago.

Ang halo-halong diskarte SA ng manlalaro A ay ang aplikasyon ng mga purong diskarte A1, A2, ..., Am na may mga probabilidad p1, p2, ..., pi, ..., pm at ang kabuuan ng mga probabilidad ay katumbas ng 1: Ang halo-halong mga diskarte ng player A ay nakasulat sa anyo ng isang matris o bilang isang string SA \u003d (p1, p2, ..., pi, ..., pm) Katulad nito, ang halo-halong mga diskarte ng player B ay tinukoy ng :, o, SB \u003d (q1, q2, ..., qi, ..., qn ), kung saan ang kabuuan ng mga posibilidad ng mga estratehiya na lumilitaw ay 1: Malinis na mga diskarte maaaring isaalang-alang ng isang espesyal na kaso ng halo-halong at ibinigay ng isang string na kung saan 1 tumutugma sa isang purong diskarte. Sa batayan ng prinsipyo ng minimax, ang pinakamainam na solusyon (o solusyon) ng laro ay natutukoy: ito ay isang pares ng mga pinakamainam na diskarte S * A, S * B, sa pangkalahatang kaso, halo-halong, pagkakaroon ng sumusunod na pag-aari: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na diskarte, kung gayon hindi ito maaaring kumita para sa iba pang lumihis mula sa kanyang. Ang payoff na naaayon sa pinakamainam na solusyon ay tinatawag na gastos ng laro v. Ang presyo ng laro ay nasiyahan sa hindi pagkakapareho:? ? v? ? (3.5) saan? at? - ang mas mababa at itaas na presyo ng laro. Ang sumusunod na pangunahing teorema ng teorya ng laro ay totoo - teorema ni Neumann. Ang bawat end game ay may isang kahit na isang pinakamainam na solusyon, marahil kasama halo-halong mga diskarte... Hayaan ang S * A \u003d (p * 1, p * 2, ..., p * i, ..., p * m) at S * B \u003d (q * 1, q * 2, ..., q * ako, ..., q * n) ay isang pares ng mga pinakamainam na diskarte. Kung ang isang dalisay na diskarte ay kasama sa pinakamainam na halo-halong diskarte na may posibilidad na nonzero, pagkatapos ito ay tinatawag na aktibo. Ang teorya tungkol sa mga aktibong diskarte ay may bisa: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte, kung gayon ang kabayaran ay nananatiling hindi nagbabago at katumbas ng presyo ng laro v, kung ang pangalawang manlalaro ay hindi lalampas sa mga limitasyon ng kanyang aktibong mga diskarte. Ang teorema na ito ay napakahusay na praktikal na kahalagahan - nagbibigay ito ng mga tukoy na modelo para sa paghahanap ng pinakamainam na mga diskarte sa kawalan ng isang punong saddle. Isaalang-alang ang isang 2 × 2 na laro, na kung saan ay ang pinakasimpleng kaso ng isang may hangganang laro. Kung ang ganitong laro ay may isang saddle point, kung gayon ang pinakamainam na solusyon ay isang pares ng mga dalisay na diskarte na naaayon sa puntong ito. Ang isang laro na walang saddle point, alinsunod sa pangunahing teorya ng teorya ng laro, ang isang pinakamainam na solusyon ay umiiral at natutukoy ng isang pares ng mga halo-halong mga diskarte S * A \u003d (p * 1, p * 2) at S * B \u003d (q * 1, q * 2) ... Upang mahanap ang mga ito, ginagamit namin ang mga aktibong teorema ng estratehiya. Kung ang manlalaro ay sumunod sa kanyang pinakamainam na diskarte S "A, kung gayon ang kanyang average na kabayaran ay magiging katumbas ng presyo ng laro v, kahit na ano ang aktibong estratehiya ng gumagamit ng B. Para sa isang 2 × 2 na laro, ang anumang dalisay na diskarte ng kalaban ay aktibo kung walang point saddle. Ang bayad ng player A (pagkawala ng player B) ay isang random variable, inaasahang halaga (average) na kung saan ay ang presyo ng laro. Samakatuwid, ang average na kabayaran ng player A (pinakamainam na diskarte) ay magiging katumbas sa v para sa kapwa sa 1st at 2nd strategies ng kalaban. Hayaan ang laro na ibigay ng payoff matrix.Ang average na kabayaran ng player A kung gumagamit siya ng pinakamainam na halo-halong diskarte, at ang manlalaro B ay gumagamit ng purong diskarte B1 (ito ay tumutugma sa 1st haligi ng payoff matrix P), ay katumbas ng presyo ng laro v: a11 p * 1 + a21 p * 2 \u003d v. Tumatanggap ang Player A ng parehong average na kabayaran kung ang ika-2 player na naglalapat diskarte B2, i.e. a12 p * 1 + a22 p * 2 \u003d v. Isinasaalang-alang na ang p * 1 + p * 2 \u003d 1, nakakakuha kami ng isang sistema ng mga equation para sa pagtukoy ng pinakamainam na diskarte S "A at ang presyo ng laro v: (3.6) Ang paglutas ng sistemang ito, nakuha namin ang pinakamainam na diskarte (3.7) at ang presyo ng laro (3.8) Paglalapat ng teorema sa aktibong mga diskarte sa paghahanap ng SB * - ang pinakamainam na diskarte ng player B, nakuha namin na para sa anumang dalisay na diskarte ng player A (A1 o A2), ang average na pagkawala ng player B ay katumbas ng presyo ng laro v, i.e. (3.9) Kung gayon ang pinakamainam na diskarte ay natutukoy ng mga formula: (3.10 )

Mga pamamaraan at modelo ng matematika sa ekonomiya

Mga laro sa Matrix

Panimula

Sa kasanayang pang-ekonomiya, ang mga sitwasyon ay madalas na lumitaw kung saan ang iba't ibang mga partido ay nagtutugis ng iba't ibang mga layunin. Halimbawa, ang ugnayan sa pagitan ng isang nagbebenta at isang mamimili, isang tagapagtustos at isang consumer, isang bangko at isang depositor, atbp. Ang ganitong mga sitwasyon ng salungatan ay lumitaw hindi lamang sa ekonomiya, kundi sa iba pang mga aktibidad. Halimbawa, kapag naglalaro ng chess, checker, domino, loto, atbp.

Isang laro- ito ay matematikal na modelo isang sitwasyon ng salungatan na kinasasangkutan ng hindi bababa sa dalawang tao na gumagamit ng maraming iba't ibang paraan upang makamit ang iyong mga layunin. Ang laro ay tinatawag silid-pasingawan, kung ang dalawang manlalaro ay nakikilahok dito. Ang laro ay tinatawag antagonistic, kung ang pakinabang ng isang manlalaro ay katumbas ng pagkawala ng isa pa. Samakatuwid, upang itakda ang laro, sapat na upang itakda ang mga halaga ng mga kabayaran ng isang manlalaro sa iba't ibang mga sitwasyon.

Ang anumang paraan ng pagkilos ng manlalaro, depende sa kasalukuyang sitwasyon, ay tinawag diskarte. Ang bawat manlalaro ay may isang tiyak na hanay ng mga diskarte. Kung ang bilang ng mga diskarte ay may hangganan, kung gayon ang laro ay tinatawag panghuli, kung hindi - walang katapusang . Ang mga diskarte ay tinawag malinis, kung ang bawat isa sa mga manlalaro ay pumili lamang ng isang diskarte sa isang tiyak at hindi random na paraan.

Solusyon ng Laroay pumili ng isang diskarte na kasiya-siya kalagayan ng pagiging maaasahan. Ang kundisyong ito ay nakakakuha ng isang manlalaro maximum na panalo, kung ang pangalawang sumunod sa kanyang diskarte. Sa kabaligtaran, natatanggap ang pangalawang manlalaro kaunting pagkawala, kung ang unang manlalaro ay nananatili sa kanyang diskarte. Ang ganitong mga diskarte ay tinatawag pinakamabuting kalagayan . Kaya, ang layunin ng laro ay upang matukoy ang pinakamainam na diskarte para sa bawat manlalaro.

Puro diskarte sa laro

Isaalang-alang ang isang laro na may dalawang manlalaro AT at SA.Ipagpalagay na ang player ATmayroon ito mestratehiya А 1, А 2, ..., А mat ang manlalaro SAmayroon ito nestratehiya B 1, B 2, ..., B n.Ipapalagay namin na ang pagpipilian ng player ATdiskarte A ako,at ang manlalaro SAdiskarte B jnatatanging tinutukoy ang kinalabasan ng laro, i.e. makakuha isang ijmanlalaro ATat manalo b ijmanlalaro SA.Dito i \u003d 1,2, ..., m, j \u003d 1,2, ..., n.

Ang pinakasimpleng dalawang laro ng manlalaro ay isang laro ng antagonistic , mga. isang laro kung saan ang mga interes ng mga manlalaro ay direktang kabaligtaran. Sa kasong ito, ang kabayaran ng mga manlalaro ay nauugnay sa pagkakapantay-pantay

b ij \u003d -a ij

Ang pagkakapantay-pantay na ito ay nangangahulugan na ang pagkakaroon ng isa sa mga manlalaro ay pantay sa pagkawala ng iba. Sa kasong ito, sapat na upang isaalang-alang lamang ang mga pagbabayad ng isa sa mga manlalaro, halimbawa, ang player AT.

Ang bawat pares ng mga diskarte A iat B jpanalo win isang ijmanlalaro AT.Maginhawang isulat ang lahat ng mga panalo na ito sa anyo ng tinatawag na pagbabayad ng matrix

Ang mga hilera ng matris na ito ay tumutugma sa mga diskarte ng player AT,at ang mga haligi ay para sa mga diskarte ng player SA.Sa pangkalahatan, ang ganitong laro ay tinatawag (m × n) -game.


Halimbawa 1.Dalawang manlalaro AT at SAmagtapon ng isang barya. Kung ang mga panig ng barya ay nag-tutugma, pagkatapos ay mananalo AT, i.e. manlalaro SAnagbabayad ang player ATilang kabuuan na katumbas ng 1, at kung hindi sila nag-tutugma, pagkatapos manalo ang player B, i.e. sa kabaligtaran, ang player ATnagbabayad ang player SAsa parehong halaga , pantay 1. Bumuo ng isang matrix ng pagbabayad.

Desisyon.Sa pamamagitan ng kondisyon ng problema

Puro diskarte Ang Player I ay pumili ng isa sa mga hilera ng payoff matrix A, at ang purong diskarte ng player II ay ang pagpili ng isa sa mga haligi ng parehong matris.

Ang mga pinakamabuting kalagayan na mga diskarte ng mga manlalaro ay naiiba sa mga halo-halong sa pamamagitan ng pagkakaroon ng mandatory unit p i \u003d 1, q i \u003d 1. Halimbawa: P (1,0), Q (1,0). Narito p 1 \u003d 1, q 1 \u003d 1.

Suliranin 1
Maghanap ng pinakamainam na malinis na diskarte batay sa pagbabayad ng matrix gamit ang prinsipyo ng mahigpit na pangingibabaw. Isulat ang mga vectors P *, Q * bilang isang sagot.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Desisyon:

Nalutas namin ang lahat ng mga problema gamit ang calculator ng Matrix Game.

Ipinapalagay namin na player ang pipiliin ko ang kanyang diskarte upang makuha ang kanyang pinakamataas na bayad, at pipiliin ng player II ang kanyang diskarte upang mabawasan ang kabayaran ng player I.

Mga ManlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 13 1 2 5 1
Isang 22 0 0 3 0
Isang 3-3 -5 -5 -2 -5
Isang 40 -2 -2 1 -2
b \u003d max (B i)3 1 2 5
Hanapin ang garantisadong kabayaran na tinutukoy ng mas mababang presyo ng laro ng isang \u003d max (a i) \u003d 1, na nagpapahiwatig ng maximum na dalisay na diskarte A 1.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d 1.
Ang point saddle (1, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A1, B2). Ang presyo ng laro ay 1.
2. Sinusuri ang payoff matrix para sa nangingibabaw na mga hilera at nangingibabaw na mga haligi.
Minsan, batay sa isang simpleng pagsasaalang-alang ng matrix ng laro, masasabi nating ang ilang mga dalisay na estratehiya ay maaaring makapasok sa pinakamainam na halo-halong diskarte na may posibilidad na zero.
Sabi nila i-ika Ang diskarte ng 1st player ay nangingibabaw sa kanya k-ika diskarte kung ang isang ij ≥ a kj para sa lahat j E N at kahit isa j isang ij\u003e a kj. Sa pagkakataong ito ay sinabi din na i-ika diskarte (o linya) - nangingibabaw, k-ika - pinangungunahan.
Sabi nila j-ika Ang diskarte ng 2nd player ay nangingibabaw sa kanya l-th diskarte kung para sa lahat j E M isang ij ≤ a il at para sa kahit isang i a ij< a il . В этом случае j-ika ang diskarte (haligi) ay tinatawag na nangingibabaw, l-th - pinangungunahan.
Diskarte Ang 1 ay namumuno sa diskarte Ang 2 (lahat ng mga elemento ng hilera 1 ay higit sa o katumbas ng mga halaga ng ika-2 hilera), samakatuwid, ibinabukod namin ang ika-2 hilera ng matrix. Posible p 2 \u003d 0.
Diskarte Ang 1 ay namumuno sa diskarte Ang 3 (lahat ng mga elemento ng hilera 1 ay higit sa o katumbas ng mga halaga ng ika-3 hilera), samakatuwid, ibinabukod namin ang ika-3 hilera ng matrix. Posible p 3 \u003d 0.
3 1 2 5
0 -2 -2 1

Mula sa posisyon ng mga pagkalugi ng player B, ang diskarte B 1 ay namumuno sa diskarte B 2 (lahat ng mga elemento ng haligi 1 marami pang item haligi 2), samakatuwid ibukod namin ang 1st haligi ng matrix. Posibilidad q 1 \u003d 0.
Mula sa posisyon ng pagkalugi ng player B, ang diskarte B 4 ay namumuno sa diskarte B 1 (lahat ng mga elemento ng haligi 4 ay mas malaki kaysa sa mga elemento ng haligi 1), samakatuwid, ibinabukod namin ang ika-4 na haligi ng matrix. Posibilidad q 4 \u003d 0.
1 2
-2 -2

Binawasan namin ang isang 4 x 4 na laro sa isang 2 x 2 na laro.



Solusyon ng Laro ( 2 x n


p 1 \u003d 1
p 2 \u003d 0
Presyo ng laro, y \u003d 1
Ngayon mahahanap natin ang minimax na diskarte ng player B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation
q 1 \u003d 1
q 1 + q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 1 \u003d 1.
Sagot:
Presyo ng laro: y \u003d 1, mga vectors ng diskarte ng mga manlalaro:
Q (1, 0), P (1, 0)

∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (1 1) + (2 0) \u003d 1 \u003d v
M (P 2; Q) \u003d (-2 1) + (-2 0) \u003d -2 ≤ v
M (P; Q 1) \u003d (1 1) + (-2 0) \u003d 1 \u003d v
M (P; Q 2) \u003d (2 1) + (-2 0) \u003d 2 ≥ v

Dahil ang mga hilera at haligi ay tinanggal mula sa orihinal na matrix, ang nahanap na posibilidad na mga vectors ay maaaring isulat bilang:
P (1,0,0,0)
Q (0,1,0,0)

Suliranin 2
Hanapin ang mas mababa at itaas na mga presyo ng laro gamit ang pagbabayad ng matrix. Sa pagkakaroon ng isang punung-punong point, isulat ang mga vectors ng pinakamainam na purong estratehiya P *, Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, pagkatapos ay isusulat namin ang solusyon ng laro sa dalisay na mga diskarte.
Mga ManlalaroB 1B 2B 3a \u003d min (A i)
Isang 1-6 -5 0 -6
Isang 2-8 -3 -2 -8
Isang 3-3 -2 3 -3
b \u003d max (B i)-3 -2 3

Natagpuan namin ang garantisadong payoff na tinutukoy ng mas mababang presyo ng laro a \u003d max (a i) \u003d -3, na nagpapahiwatig ng maximum na dalisay na diskarte A 3.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d -3.
Ang point saddle (3, 1) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A3, B1). Ang presyo ng laro ay -3.
Sagot: P (0,0,1), Q (1,0,0)

Suliranin 3
Maghanap ng mga vectors ng pinakamainam na diskarte P *, Q * at ang presyo ng laro gamit ang matrix ng pagbabayad. Aling player ang nagwagi?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Desisyon:
1. Suriin kung ang payoff matrix ay may isang saddle point. Kung oo, pagkatapos ay isusulat namin ang solusyon ng laro sa dalisay na mga diskarte.
Ipinapalagay namin na player ang pipiliin ko ang kanyang diskarte upang makuha ang kanyang pinakamataas na bayad, at pipiliin ng player II ang kanyang diskarte upang mabawasan ang kabayaran ng player I.
Mga ManlalaroB 1B 2B 3B 4a \u003d min (A i)
Isang 1-6 -6 2 4 -6
Isang 22 -2 7 -1 -2
b \u003d max (B i)2 -2 7 4

Natagpuan namin ang garantisadong payoff na tinutukoy ng mas mababang presyo ng laro a \u003d max (a i) \u003d -2, na nagpapahiwatig ng maximum na dalisay na diskarte A 2.
Ang itaas na presyo ng laro ay b \u003d min (b j) \u003d -2.
Ang point saddle (2, 2) ay nagpapahiwatig ng isang solusyon sa isang pares ng mga kahalili (A2, B2). Ang presyo ng laro ay -2.
3. Hanapin ang solusyon sa laro sa halo-halong mga diskarte.
Malutas natin ang problema sa pamamagitan ng pamamaraang geometriko, na kinabibilangan ng mga sumusunod na hakbang:
1. Sa sistema ng coordinate ng Cartesian, ang isang segment ay naka-plot sa axis ng abscissa, ang haba ng kung saan ay 1. Ang kaliwang dulo ng segment (point x \u003d 0) ay tumutugma sa diskarte A 1, ang kanan - upang diskarte A 2 (x \u003d 1). Ang mga gitnang puntos x ay tumutugma sa mga posibilidad ng ilang magkakaibang mga diskarte S 1 \u003d (p 1, p 2).
2. Ang mga panalo ng diskarte A 1 ay naka-plot sa kaliwang ordinate axis. Sa isang linya na kahanay sa ordinate axis, mula sa punto 1, ang mga panalo ng diskarte A 2 ay naka-plot.
Solusyon ng Laro ( 2 x n) ay isinasagawa mula sa posisyon ng manlalaro A, na sumunod sa diskarte na pinakamataas. Wala sa mga manlalaro ang may nangingibabaw at dobleng diskarte.

Ang pinakamataas na pinakamainam na diskarte ng player A ay tumutugma sa point N, kung saan ang sumusunod na sistema ng mga equation ay maaaring isulat:
p 1 \u003d 0
p 2 \u003d 1
Presyo ng laro, y \u003d -2
Ngayon mahahanap natin ang minimax na diskarte ng player B sa pamamagitan ng pagsulat ng kaukulang sistema ng mga equation, hindi kasama ang diskarte B 1, B 3, B 4, na malinaw na nagbibigay ng isang mas malaking pagkawala sa player B, at, samakatuwid, q 1 \u003d 0, q 3 \u003d 0, q 4 \u003d 0 ...
-2q 2 \u003d -2
q 2 \u003d 1
Paglutas ng sistemang ito, nakita namin:
q 2 \u003d 1.
Sagot:
Presyo ng laro: y \u003d -2, mga vectors ng diskarte ng mga manlalaro:
Q (0, 1, 0, 0), P (0, 1)
4. Suriin natin ang kawastuhan ng solusyon sa laro gamit ang diskarte sa pagiging maaasahan ng diskarte.
∑a ij q j ≤ v
∑a ij p i ≥ v
M (P 1; Q) \u003d (-6 0) + (-6 1) + (2 0) + (4 0) \u003d -6 ≤ v
M (P 2; Q) \u003d (2 0) + (-2 1) + (7 0) + (-1 0) \u003d -2 \u003d v
M (P; Q 1) \u003d (-6 0) + (2 1) \u003d 2 ≥ v
M (P; Q 2) \u003d (-6 0) + (-2 1) \u003d -2 \u003d v
M (P; Q 3) \u003d (2 0) + (7 1) \u003d 7 ≥ v
M (P; Q 4) \u003d (4 0) + (-1 1) \u003d -1 ≥ v
Ang lahat ng mga hindi pagkakapareho ay nasiyahan bilang pagkakapantay-pantay o mahigpit na pagkakapantay-pantay, samakatuwid, ang solusyon sa laro ay matatagpuan nang tama.

Suliranin 4
Bigyan ng detalyadong sagot sa tanong

Bagaman nagtapos ako mula sa Faculty ng Physics at Teknolohiya, hindi ako itinuro sa teorya ng laro sa unibersidad. Ngunit dahil nakapasok ako mga taon ng mag-aaral Naglaro ako ng maraming, una sa kagustuhan, at pagkatapos ay sa tulay, teorya ng laro na interesado sa akin, at pinagkadalubhasaan ko ang isang maliit na aklat-aralin. At kamakailan lamang ang mambabasa ng site na si Mikhail ay nalutas ang isang problema sa teorya ng laro. Napagtanto na ang gawain ay hindi ibinigay sa akin kaagad, nagpasya akong i-refresh ang aking kaalaman sa teorya ng laro. Nag-aalok ako sa iyo ng isang maliit na libro - isang tanyag na paglalantad ng mga elemento ng teorya ng laro at ilang mga paraan upang malutas ang mga laro ng matrix. Naglalaman ito ng halos walang katibayan at inilalarawan ang mga pangunahing punto ng teorya na may mga halimbawa. Ang libro ay isinulat ng matematika at popularizer ng agham na si Elena Sergeevna Ventzel. Maraming henerasyon ng mga inhinyero ng Sobyet ang nag-aral mula sa kanyang aklat-aralin na "Teorya ng Probabilidad". Nagsulat din si Elena Sergeevna ng maraming akdang pampanitikan sa ilalim ng pangalan ng I. Grekov.

Elena Wentzel. Mga Sangkap ng teorya ng laro. - M .: Fizmatgiz, 1961 .-- 68 p.

Pag-download maikling buod sa format o

§ 1. Ang paksa ng teorya ng laro. Mga pangunahing konsepto

Kapag nalutas ang isang bilang ng mga praktikal na problema (sa larangan ng ekonomiya, mga gawain sa militar, atbp.), Kinakailangan upang pag-aralan ang mga sitwasyon kung saan mayroong dalawa (o higit pa) na nakikipagdigma sa mga partido na hinahabol ang kabaligtaran na mga layunin, at ang resulta ng bawat aksyon ng isa sa mga partido ay nakasalalay sa kung anong kurso ng kilos pipiliin ng kalaban. Tatawagin natin ang mga ganitong sitwasyon na "mga sitwasyong salungatan".

Maraming mga halimbawa ng mga sitwasyon ng salungatan mula sa iba't ibang mga lugar ng pagsasanay. Anumang sitwasyon na lumitaw sa kurso ng poot ay kabilang sa mga sitwasyon ng salungatan: bawat isa sa mga partidong lumalaban ay tumatagal ng lahat ng mga hakbang na magagamit upang maiwasan ang kalaban na makamit ang tagumpay. Kasama rin sa mga salungat na sitwasyon ang mga sitwasyon na lumitaw kapag pumipili ng isang sistema ng sandata, mga pamamaraan ng paggamit nito sa labanan at, sa pangkalahatan, kapag pinaplano ang mga operasyon ng militar: ang bawat isa sa mga pagpapasya sa lugar na ito ay dapat gawin nang may pananaw sa mga aksyon ng kaaway na hindi gaanong kapaki-pakinabang sa atin. Ang isang bilang ng mga sitwasyon sa larangan ng ekonomiya (lalo na sa pagkakaroon ng libreng kumpetisyon) ay kabilang sa mga sitwasyong salungatan; ang mga laban na partido ay mga kumpanya ng pangkalakalan, mga negosyo sa industriya, atbp.

Ang pangangailangan upang pag-aralan ang gayong mga sitwasyon ay nagbigay ng isang espesyal na patakaran ng matematika. Ang teorya ng Laro ay mahalagang higit pa sa isang teoryang matematika ng mga sitwasyong salungatan. Ang layunin ng teorya ay upang makabuo ng mga rekomendasyon para sa isang nakapangangatwiran na kurso ng pagkilos para sa bawat isa sa mga kalaban sa kurso ng isang sitwasyon ng tunggalian. Ang bawat sitwasyon ng salungatan na direktang kinuha mula sa kasanayan ay napaka kumplikado, at ang pagsusuri nito ay kumplikado sa pamamagitan ng pagkakaroon ng maraming mga kadahilanan na dumadalo. Upang maging posible ang isang pagsusuri sa matematika ng sitwasyon, kinakailangan upang umiwas mula sa pangalawa, nagkataon na mga kadahilanan at bumuo ng isang pinasimple, pormal na modelo ng sitwasyon. Tatawagan namin ang modelong ito na "laro".

Ang laro ay naiiba mula sa isang totoong sitwasyon ng tunggalian na isinasagawa ayon sa mahusay na tinukoy na mga patakaran. Ang sangkatauhan ay matagal nang gumagamit ng nasabing pormal na mga modelo ng mga sitwasyon ng tunggalian, na mga laro sa literal na kahulugan ng salita. Kasama sa mga halimbawa ang chess, checker, card game, atbp. Ang lahat ng mga larong ito ay may katangian ng isang pagpapatuloy ng kumpetisyon ayon sa kilalang mga patakaran at nagtatapos sa isang "tagumpay" (pakinabang) ng isa o ibang manlalaro.

Ang nasabing pormal na regulated, artipisyal na inayos na laro ay kumakatawan sa karamihan angkop na materyal upang mailarawan at makabisado ang mga pangunahing konsepto ng teorya ng laro. Ang terminolohiya na hiniram mula sa pagsasagawa ng mga naturang laro ay ginagamit din sa pagsusuri ng iba pang mga sitwasyon ng salungatan: ang mga partido na nakikilahok sa kanila ay nakatawag sa "mga manlalaro", at ang resulta ng banggaan ay ang "panalo" ng isa sa mga partido.

Ang mga interes ng dalawa o higit pang mga kalaban ay maaaring bumangga sa laro; sa unang kaso, ang laro ay tinatawag na "doble", sa pangalawa - "maramihang". Ang mga kalahok sa maraming laro ay maaaring makabuo ng mga koalisyon - permanenteng o pansamantala. Sa pagkakaroon ng dalawang permanenteng koalisyon, ang maraming laro ay nagiging isang pares. Ang mga pares ng laro ay ang pinakadakilang praktikal na kahalagahan; narito, nililimitahan natin ang ating sarili sa pagsasaalang-alang lamang sa mga larong ito.

Sinisimulan namin ang aming pagtatanghal ng teoryang pang-elementarya ng laro sa pagbabalangkas ng ilang mga pangunahing konsepto. Isaalang-alang natin ang isang dobleng laro kung saan ang dalawang manlalaro A at B na may kabaligtaran na interes ay lumahok. Sa pamamagitan ng "laro" ay nangangahulugang isang kaganapan na binubuo ng isang serye ng mga aksyon ng mga panig A at B. Upang ang laro ay isailalim sa matematika na pagsusuri, ang mga patakaran ng laro ay dapat na tumpak na nabalangkas. Sa pamamagitan ng "mga patakaran ng laro" ay sinadya ang sistema ng mga kondisyon na umayos ng mga posibleng pagpipilian para sa mga aksyon ng magkabilang panig, ang dami ng impormasyon sa bawat panig tungkol sa pag-uugali ng iba pa, ang pagkakasunud-sunod ng paghahalili "gumagalaw" (mga indibidwal na desisyon na ginawa sa panahon ng laro), pati na rin ang resulta o kinalabasan ng laro kung saan ang ibinigay hanay ng mga gumagalaw. Ang resulta (pakinabang o pagkawala) ay hindi palaging dami, ngunit kadalasan posible, sa pamamagitan ng pagtatakda ng isang tiyak na sukat ng pagsukat, upang ipahayag ito isang tiyak na bilang... Halimbawa, sa isang larong chess, ang pakinabang ay maaaring itinalaga ng nakatalaga na halaga +1, pagkawala –1, iguhit 0.

Ang isang laro ay tinatawag na laro na zero-sum kung ang isang manlalaro ay nanalo kung ano ang nawala sa iba, i.e. ang kabuuan ng mga panalo ng parehong partido ay zero. Sa isang laro na zero-sum, ang mga interes ng mga manlalaro ay eksaktong kabaligtaran. Narito isasaalang-alang lamang ang mga larong ito.

Dahil sa isang laro na zero-sum, ang kabayaran ng isa sa mga manlalaro ay katumbas ng kabayaran ng kapwa kasama kabaligtaran sign, kung gayon, malinaw naman, kapag sinusuri ang tulad ng isang laro, maaari isaalang-alang ng isa ang kabayaran ng isa lamang sa mga manlalaro. Hayaan ito, halimbawa, player A. Sa kung ano ang sumusunod, para sa kaginhawahan, kami ay mag-konsyerto na tawagan ang bahagi na "kami", at sa gilid B - "kaaway".

Sa kasong ito, ang panig A ("kami") ay palaging isasaalang-alang bilang "pagpanalo", at panig B ("kalaban") bilang "pagkatalo". Ang pormal na kondisyon na ito ay malinaw na hindi nagpapahiwatig ng anumang tunay na kalamangan para sa unang manlalaro; madaling makita na pinalitan ito ng kabaligtaran kung ang nanalong palatandaan ay baligtad.

Isipin natin ang pag-unlad ng laro sa oras bilang binubuo ng isang serye ng sunud-sunod na yugto o "gumagalaw". Ang isang ilipat sa teorya ng laro ay ang pagpili ng isa sa mga pagpipilian na ibinigay ng mga patakaran ng laro. Ang mga galaw ay nahahati sa personal at random. Ang isang personal na paglipat ay isang malay na pagpipilian ng isa sa mga manlalaro ng isa sa mga posibleng paglipat sa isang naibigay na sitwasyon at pagpapatupad nito. Ang isang halimbawa ng isang personal na paglipat ay ang anumang paglipat sa isang laro ng chess. Ang pagsasagawa ng susunod na paglipat, ang player ay gumagawa ng isang malay-tao na pagpipilian ng isa sa mga pagpipilian na posible sa isang naibigay na pagsasaayos ng mga piraso sa board. Ang hanay ng mga posibleng pagpipilian para sa bawat personal na paglipat ay kinokontrol ng mga patakaran ng laro at nakasalalay sa kabuuan ng nakaraang mga gumagalaw ng magkabilang panig.

Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, na isinasagawa hindi sa desisyon ng player, ngunit sa pamamagitan ng ilang mekanismo ng random na pagpili (pagkahagis ng isang barya, isang dice, shuffling at pakikipag-ugnay sa mga kard, atbp.). Halimbawa, ang pagbibigay ng unang card sa isa sa mga manlalaro ng kagustuhan ay isang random na paglipat na may 32 pantay na posibleng mga pagpipilian. Para sa laro na matukoy sa matematika, dapat ipahiwatig ng mga patakaran ng laro ang posibilidad na pamamahagi ng mga posibleng kinalabasan para sa bawat random na paglipat.

Ang ilang mga laro ay maaari lamang binubuo ng mga random na gumagalaw (tinatawag na purong pagsusugal) o mga personal na gumagalaw lamang (chess, checker). Karamihan mga laro ng card nabibilang sa mga laro halo-halong uri, i.e. naglalaman ng parehong mga random at personal na galaw.

Ang mga laro ay inuri hindi lamang sa likas na katangian ng kanilang mga gumagalaw (personal, random), kundi pati na rin sa likas na katangian at dami ng impormasyon na magagamit sa bawat manlalaro tungkol sa mga aksyon ng isa pa. Ang isang espesyal na klase ng mga laro ay binubuo ng tinatawag na "mga laro kasama kumpletong impormasyon". Ang isang laro na may kumpletong impormasyon ay isang laro kung saan ang bawat manlalaro, sa bawat personal na paglipat, ay nakakaalam ng mga resulta ng lahat ng nakaraang mga gumagalaw, parehong personal at random. Ang mga halimbawa ng mga laro na may kumpletong impormasyon ay kasama ang chess, checker, at ang kilalang laro ng "noughts at crosses".

Karamihan sa mga laro ng praktikal na kahalagahan ay hindi kabilang sa klase ng mga laro na may kumpletong impormasyon, dahil ang kawalan ng katiyakan tungkol sa mga aksyon ng kaaway ay karaniwang isang mahalagang elemento ng mga sitwasyong salungatan.

Isa sa mga pangunahing konsepto ng teorya ng laro ay ang konsepto ng "diskarte". Ang diskarte ng isang manlalaro ay isang hanay ng mga patakaran na natatanging matukoy ang pagpipilian para sa bawat personal na paglipat ng isang naibigay na manlalaro, depende sa sitwasyon na binuo sa panahon ng laro. Karaniwan, ang pagpapasya (pagpipilian) para sa bawat personal na paglipat ay ginawa ng manlalaro sa panahon ng laro mismo, depende sa tiyak na sitwasyon na binuo. Gayunpaman, sa teoryang, ang mga bagay ay hindi magbabago kung isipin natin na ang lahat ng mga pagpapasyang ito ay ginawa ng player nang maaga. Upang gawin ito, ang player ay kailangang mag-compile nang maaga ang isang listahan ng lahat ng mga sitwasyon na posible sa panahon ng laro at magbigay ng kanyang sariling solusyon para sa bawat isa sa kanila. Sa prinsipyo (kung hindi praktikal) posible ito sa anumang laro. Kung ang naturang sistema ng desisyon ay pinagtibay, nangangahulugan ito na pinili ng player ang isang tiyak na diskarte.

Ang isang manlalaro na pumili ng isang diskarte ay hindi na ngayon makikilahok sa laro nang personal, ngunit palitan ang kanyang pakikilahok sa isang listahan ng mga patakaran na ilalapat para sa kanya ang ilang hindi interesado (hukom). Ang diskarte ay maaari ring italaga sa automaton sa anyo ng isang tiyak na programa. Ito ay kung paano naglalaro ng chess ang mga computer ngayon. Para sa konsepto ng "diskarte" upang magkaroon ng kahulugan, dapat may mga personal na gumagalaw sa laro; walang mga diskarte sa mga laro na binubuo lamang ng mga random na gumagalaw.

Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa "may hangganan" at "walang katapusang". Ang hangganan ay isang laro kung saan ang bawat manlalaro ay may isang hangganan na bilang lamang ng mga diskarte. Ang panghuling laro kung saan mayroon ang manlalaro A m mga diskarte, at player B - n ang mga diskarte ay tinatawag na mxn game.

Isaalang-alang ang isang mxn laro ng dalawang manlalaro A at B ("kami" at "kalaban"). Itinutukoy namin ang aming mga diskarte A 1, A 2, ..., A m ang mga diskarte ng kaaway B 1, B 2, ..., B n. Hayaang pumili ang bawat panig ng isang tiyak na diskarte; para sa amin ito ay magiging A i, para sa kalaban B j. Kung ang laro ay binubuo lamang ng mga personal na galaw, kung gayon ang pagpili ng mga diskarte A i, B j natatanging tinutukoy ang kinalabasan ng laro - ang aming mga panalo. Ipakilala natin ito bilang isang ij. Kung naglalaman ang laro, bilang karagdagan sa personal, random na gumagalaw, kung gayon ang kabayaran para sa isang pares ng mga diskarte A i, B j ay isang random na halaga na nakasalalay sa mga kinalabasan ng lahat ng mga random na gumagalaw. Sa kasong ito, ang natural na pagtatantya ng inaasahang pagbabayad ay ang average na halaga (pag-asa sa matematika). Kami ay magpapahiwatig sa pamamagitan ng parehong pag-sign pareho ang payoff mismo (sa isang laro nang walang random na gumagalaw) at ang average na halaga nito (sa isang laro na may mga random na gumagalaw).

Ipaalam sa amin ang mga halaga ng isang ij payoff (o average payoff) para sa bawat pares ng mga diskarte. Ang mga halaga ay maaaring isulat sa anyo ng isang hugis-parihaba na talahanayan (matrix), ang mga hilera na tumutugma sa aming mga diskarte (A i), at ang mga haligi ay tumutugma sa mga diskarte ng kaaway (B j). Ang nasabing talahanayan ay tinatawag na payoff matrix o simpleng laro matrix. Ang laro matrix mxn ay ipinapakita sa Fig. 1.

Fig. 1. Matrix mxn

Sa madaling sabi ay ipapahiwatig natin ang matrix ng laro ‖а ij ‖. Tingnan natin ang ilang mga pangunahing halimbawa ng mga laro.

Halimbawa 1. Ang dalawang manlalaro A at B, nang hindi tumitingin sa bawat isa, naglalagay ng barya na baligtad sa mesa, sagisag o mga buntot, ayon sa kanilang pagpapasya. Kung ang mga manlalaro ay pinili ang magkabilang panig (ang parehong may isang coat ng braso o pareho ay may mga buntot), kung gayon ang player A ay kukuha ng parehong mga barya; kung hindi man sila ay kinuha ng manlalaro B. Kinakailangan na pag-aralan ang laro at isulat ang matrix nito. Desisyon. Ang laro ay binubuo lamang ng dalawang gumagalaw: ang aming paglipat at ang paglipat ng kalaban, parehong personal. Ang laro ay hindi nabibilang sa mga laro na may kumpletong impormasyon, dahil sa sandaling ito ang turn ng player na gumaganap ay hindi alam kung ano ang nagawa ng iba. Dahil ang bawat isa sa mga manlalaro ay may iisang personal na paglipat, ang diskarte ng player ay isang pagpipilian sa iisang personal na paglipat na ito.

Mayroon kaming dalawang mga diskarte: A 1 - upang pumili ng isang amerikana ng braso at A 2 - upang pumili ng mga buntot; ang kalaban ay may parehong dalawang estratehiya: B 1 - amerikana ng braso at B 2 - buntot. Kaya, ang larong ito ay isang 2 × 2 na laro. Isaalang-alang natin ang mga panalo ng isang barya bilang +1. Game Matrix:

Sa pamamagitan ng halimbawa ng larong ito, elementarya ito, maaari mong maunawaan ang ilang mahahalagang ideya ng teorya ng laro. Ipagpalagay muna na ang larong ito ay pinaandar nang isang beses lamang. Pagkatapos, malinaw naman, walang saysay na pag-usapan ang tungkol sa anumang "mga diskarte" ng mga manlalaro na mas makatwiran kaysa sa iba. Ang bawat isa sa mga manlalaro na may parehong dahilan ay maaaring gumawa ng anumang desisyon. Gayunpaman, kapag ang laro ay paulit-ulit, nagbabago ang sitwasyon.

Sa katunayan, ipagpalagay natin na tayo (player A) ay pumili ng ilang diskarte para sa ating sarili (sabihin, A1) at dumidikit tayo dito. Pagkatapos, batay sa mga resulta ng mga unang ilang mga gumagalaw, hulaan ng kalaban ang aming diskarte at tutugon ito sa hindi bababa sa kapaki-pakinabang na paraan para sa amin, i.e. pumili ng mga buntot. Malinaw na hindi kapaki-pakinabang para sa amin na palaging gumamit ng anumang isang diskarte; upang hindi maging talo, kailangan nating piliin ang paminsan-minsang mga bisig, kung minsan - mga buntot. Gayunpaman, kung kami ay pumalit ng mga coats ng armas at buntot sa isang tiyak na pagkakasunod-sunod (halimbawa, pagkatapos ng isa), maaari ring hulaan ng kaaway ito at tumugon sa diskarte na ito sa pinakamasamang paraan para sa amin. Malinaw, isang maaasahang paraan upang matiyak na hindi alam ng kaaway ang aming diskarte ay upang ayusin ang pagpipilian sa bawat galaw, kapag hindi natin alam ito nang maaga (maaari itong matiyak, halimbawa, sa pamamagitan ng paghuhugas ng isang barya). Kaya, sa pamamagitan ng intuitive na pangangatuwiran ay nakarating tayo sa isa sa mga mahahalagang konsepto ng teorya ng laro - sa konsepto ng "halo-halong diskarte", ibig sabihin. tulad ng mga "dalisay" na diskarte - sa kasong ito A 1 at A 2 - alternatibong random na may ilang mga frequency. Sa halimbawang ito, mula sa mga pagsasaalang-alang ng simetrya, malinaw nang maaga na ang mga diskarte ng A 1 at A 2 ay dapat na kahaliling may parehong dalas; sa mas kumplikadong mga laro, ang solusyon ay maaaring malayo sa walang kwenta.

Halimbawa 2. Ang mga manlalaro A at B nang sabay-sabay at nakapag-iisa sa bawat isa ay sumulat ng bawat isa sa tatlong mga numero: 1, 2 o 3. Kung ang kabuuan ng mga nakasulat na numero ay kahit na, babayaran ng B ang A ng halagang ito sa rubles; kung kakaiba, kung gayon, sa kabaligtaran, Isang babayaran ang halagang ito sa B. Kinakailangan upang pag-aralan ang laro at iguhit ang matrix nito.

Desisyon. Ang laro ay binubuo ng dalawang gumagalaw; kapwa ay personal. Kami (A) ay may tatlong estratehiya: A 1 - isulat 1; At 2 - isulat 2; At 3 - isulat 3. Ang kalaban (B) ay may parehong tatlong diskarte. Ang laro ay isang 3 × 3 na laro:

Malinaw, tulad ng sa nakaraang kaso, ang kaaway ay maaaring tumugon sa pinakamasama paraan para sa amin sa anumang diskarte na pinili natin. Sa katunayan, kung pipiliin natin, halimbawa, diskarte A1, ang kaaway ay palaging tutugon dito sa diskarte B2; sa diskarte A 2 - sa pamamagitan ng diskarte B 3; sa diskarte A 3 - sa pamamagitan ng diskarte B 2; sa gayon, ang anumang pagpili ng isang tiyak na diskarte ay hindi maiiwasang hahantong sa atin sa isang pagkawala (gayunpaman, hindi dapat kalimutan ng isang tao na ang kaaway ay nasa parehong kakila-kilabot na sitwasyon). Ang solusyon sa larong ito (i.e., ang kabuuan ang pinaka-kapaki-pakinabang na mga diskarte kapwa manlalaro) ay ibibigay sa § 5.

Halimbawa 3.Mayroon kaming tatlong uri ng mga armas sa aming itapon: А 1, А 2, А 3; ang kaaway ay may tatlong uri ng sasakyang panghimpapawid: B 1, B 2, B 3. Ang aming gawain ay pindutin ang eroplano; tungkulin ng kaaway na panatilihin siyang hindi maapektuhan. Kapag gumagamit ng armament A 1, ang mga sasakyang panghimpapawid B 1, B 2, B 3 ay sinaktan, ayon sa pagkakabanggit, na may mga posibilidad na 0.9, 0.4 at 0.2; may armament A 2 - na may mga posibilidad na 0.3, 0.6 at 0.8; na may isang 3 armament - na may mga posibilidad na 0.5, 0.7 at 0.2. Kinakailangan upang mabalangkas ang sitwasyon sa mga tuntunin ng teorya ng laro.

Desisyon. Ang sitwasyon ay maaaring isipin bilang isang 3 × 3 na laro na may dalawang personal na gumagalaw at isang random. Ang aming personal na paglipat ay ang pagpili ng uri ng armas; personal na paglipat ng kaaway - ang pagpili ng isang sasakyang panghimpapawid upang lumahok sa labanan. Random na paglipat - ang paggamit ng mga armas; ang hakbang na ito ay maaaring magtapos sa pagkatalo o hindi pagkatalo ng sasakyang panghimpapawid. Ang aming kabayaran ay isa kung ang eroplano ay tinamaan, at zero kung hindi man. Ang aming mga diskarte ay tatlong pagpipilian sa sandata; mga diskarte ng kaaway - tatlong mga pagpipilian sa sasakyang panghimpapawid. Ang average na halaga ng kabayaran para sa bawat naibigay na pares ng mga diskarte ay hindi hihigit sa posibilidad ng paghagupit ng isang naibigay na sasakyang panghimpapawid na may isang sandata. Game Matrix:

Ang layunin ng teorya ng laro ay upang magbigay ng mga rekomendasyon para sa makatuwirang pag-uugali mga manlalaro sa mga sitwasyong salungatan, i.e. pagpapasiya ng "pinakamainam na diskarte" para sa bawat isa sa kanila. Ang pinakamainam na diskarte ng isang manlalaro sa teorya ng laro ay isang diskarte na, kapag ang isang laro ay paulit-ulit na maraming beses, ay nagbibigay ng isang naibigay na player na may pinakamataas na posibleng average na pakinabang (o ang pinakamababang posibleng average loss). Sa pagpili ng diskarte na ito, ang batayan ng pangangatuwiran ay ang pag-aakalang ang kalaban ay hindi gaanong matalino tulad ng ating sarili, at ginagawa ang lahat upang maiwasan ang ating makamit.

Sa teorya ng laro, ang lahat ng mga rekomendasyon ay ginawa batay sa mga prinsipyong ito; samakatuwid, hindi isinasaalang-alang ang mga elemento ng peligro na hindi maiiwasang naroroon sa bawat tunay na diskarte, pati na rin ang posibleng maling pagkakamali at pagkakamali ng bawat isa sa mga manlalaro. Ang teorya ng laro, tulad ng anumang modelo ng matematika ng isang kumplikadong kababalaghan, ay may mga limitasyon. Ang pinakamahalaga sa kanila ay ang panalo ay artipisyal na nabawasan sa isa isahan... Sa karamihan ng mga praktikal na sitwasyon ng salungatan, kapag nagkakaroon ng isang makatwirang diskarte, kinakailangang isaalang-alang hindi isa, ngunit maraming mga bilang ng mga parameter - ang pamantayan para sa tagumpay ng kaganapan. Ang isang diskarte na pinakamainam sa isang criterion ay hindi kinakailangan optimal sa iba. Gayunpaman, napagtanto ang mga limitasyong ito at samakatuwid ay hindi bulag na sumunod sa mga rekomendasyon na nakuha ng mga pamamaraan ng laro, maaari pa ring gamitin ng isang makatwirang gamit ang matematika na patakaran ng teorya ng laro upang mabuo, kung hindi eksaktong "optimal", kung gayon hindi bababa sa "katanggap-tanggap" na diskarte.

§ 2. Ang mas mababa at itaas na presyo ng laro. Ang prinsipyong minimax

Isaalang-alang ang isang mxn na laro na may isang matris tulad ng sa Fig. 1. Ipakilala natin sa pamamagitan ng liham i ang bilang ng aming diskarte; ang sulat j ay ang bilang ng diskarte ng kalaban. Itakda natin ang ating sarili ang gawain: upang matukoy ang aming pinakamainam na diskarte. Suriin natin ang bawat isa sa aming mga diskarte nang sunud-sunod, na nagsisimula sa A 1.

Ang pagpili ng estratehiya, dapat nating palaging umaasa sa katotohanan na tutugon ito ng kaaway gamit ang diskarte na kung saan ang aming kabayaran at ij ay minimal. Tukuyin natin ang halagang ito ng payoff, i.e. ang minimum ng mga numero ng ij in akolinya. Ipinapahiwatig namin ito sa pamamagitan ng α i:

Dito, ang min sign (minimum over j) ay nagpapahiwatig ng minimum ng mga halaga ng parameter na ito para sa lahat ng posibleng j. Isulat natin ang mga numero α i; sa tabi ng matris sa kanan bilang isang dagdag na haligi:

Ang pagpili ng anumang diskarte A i, dapat tayong umasa sa katotohanan na bilang isang resulta ng makatuwirang mga aksyon ng kalaban ay hindi tayo mananalo ng higit sa α i. Naturally, kumikilos nang maingat at umaasa sa pinaka makatwirang kalaban (i pag-iwas sa anumang peligro), dapat nating ituon ang diskarte kung saan ang bilang ng α i ay ang maximum. Ipaila sa amin ang maximum na halaga ng α:

o, isinasaalang-alang ang formula (2.1),

Ang halaga ng α ay tinatawag na mas mababang presyo ng laro, sa madaling salita, ang pinakamataas na pakinabang o simpleng maximin. Ang bilang α ay namamalagi sa isang tiyak na linya ng matrix; ang diskarte ng player A na tumutugma sa linyang ito ay tinatawag na pinakamataas na diskarte. Malinaw, kung sumunod tayo sa pinakamataas na diskarte, kung gayon para sa anumang pag-uugali ng kalaban, ginagarantiyahan kaming isang kabayaran, hindi bababa sa α. Samakatuwid, ang halaga ng α ay tinatawag na "mas mababang presyo ng laro". Ito ang garantisadong minimum na maibibigay natin ang ating sarili sa pamamagitan ng pagsunod sa pinaka maingat ("reinsurance") na diskarte.

Malinaw, ang isang katulad na pangangatwiran ay maaaring maisagawa para sa kalaban B. Dahil ang kaaway ay interesado na mabawasan ang aming mga panalo, dapat niyang tingnan ang bawat isa sa kanyang mga diskarte mula sa punto ng view maximum na panalo gamit ang diskarte na ito. Samakatuwid, sa ilalim ng matrix, isusulat namin ang maximum na mga halaga para sa bawat haligi:

at hanapin ang minimum ng of j:

Ang halaga β ay tinatawag na itaas na presyo ng laro, sa madaling salita, ang "minimax". Ang diskarte ng kalaban na naaayon sa pakinabang na minimax ay tinatawag na kanyang "minimax strategies". Ang pagsunod sa kanyang pinaka-maingat na diskarte sa minimax, ginagarantiyahan ng kalaban sa kanyang sarili ang mga sumusunod: anuman ang ginagawa natin laban sa kanya, siya ay sa anumang kaso mawalan ng isang halaga na hindi hihigit sa β. Ang prinsipyo ng pag-iingat, na nagdidikta sa pagpili ng naaangkop na mga diskarte (maximin at minimax) para sa mga manlalaro, ay madalas na tinatawag na "minimax na prinsipyo" sa teorya ng laro at mga aplikasyon nito. Ang pinaka-maingat na maximin at minimax na mga diskarte ng mga manlalaro ay minarkahan minsan isang pangkalahatang term "Mga diskarte sa Minimax".

Bilang mga halimbawa, tinukoy namin ang mas mababa at itaas na mga presyo ng laro at mga diskarte sa minimax para sa mga halimbawa 1, 2, at 3 ng § 1.

Halimbawa 1.Halimbawa 1 § 1 ay nagbibigay ng isang laro sa mga sumusunod na matris:

Dahil ang mga halaga ng α i at β j ay pare-pareho at katumbas ng -1 at +1, ayon sa pagkakabanggit, ang mas mababa at itaas na mga presyo ng laro ay din -1 at +1: α \u003d –1, β \u003d +1. Ang anumang diskarte ng player A ay ang kanyang pinakamataas, at ang anumang diskarte ng player B ay ang kanyang minimax na diskarte. Ang konklusyon ay walang halaga: sa pamamagitan ng pag-stick sa alinman sa kanyang mga diskarte, ang manlalaro A ay magagarantiyahan na siya ay mawawala ng hindi hihigit sa 1; ang parehong ay maaaring garantisado ng player B.

Halimbawa 2. Halimbawa 2 § 1 ay nagbibigay ng isang laro na may isang matris:

Ang mas mababang presyo ng laro ay α \u003d –3; ang itaas na presyo ng laro β \u003d 4. Ang aming pinakamataas na diskarte ay А 1; sa pamamagitan ng paglalapat nito nang sistematiko, matatag nating maaasahan na manalo ng hindi bababa sa –3 (mawala sa halos 3). Ang diskarte ng kalaban ng kalaban ay alinman sa mga diskarte B 1 at B 2; sa paglalapat ng mga ito nang sistematikong, siya, sa anumang kaso, ay magagarantiyahan na mawawala siya ng higit sa 4. Kung lumihis tayo sa aming pinakamataas na diskarte (halimbawa, pumili ng diskarte A2), ang kalaban ay maaaring "parusahan" sa amin para sa pamamagitan ng paglalapat ng diskarte B 3 at pagbabawas ang aming panalo ay to -5; gayon din, ang pag-atras ng kaaway mula sa kanyang diskarte sa minimax ay maaaring dagdagan ang kanyang pagkawala sa 6.

Halimbawa 3.Halimbawa 3 § 1 ay nagbibigay ng isang laro na may isang matris:

Ang mas mababang presyo ng laro ay α \u003d 0.3; ang itaas na halaga ng laro β \u003d 0.7. Ang aming pinaka-konserbatibo (maximin) na diskarte ay A 2; gamit ang А 2 armament, ginagarantiyahan namin na tatamaan kami ng sasakyang panghimpapawid nang hindi bababa sa 0.3 sa lahat ng mga kaso. Ang pinaka maingat (minimax) na diskarte ng kaaway ay B 2; gamit ang sasakyang panghimpapawid na ito, ang kaaway ay maaaring maging sigurado na siya ay maabot sa higit sa 0.7 sa lahat ng mga kaso

Ang huling halimbawa ay maginhawa upang ipakita ang isa mahalagang pag-aari mga estratehiyang minimax - ang kanilang kawalang katatagan. Gumamit tayo ng aming pinaka-maingat (maximin) na diskarte А 2, at ang kaaway - ang kanyang pinaka-maingat (minimax) na diskarte В 2. Hangga't ang parehong mga kalaban ay sumunod sa mga diskarte na ito, ang average na kabayaran ay 0.6; ito ay mas malaki kaysa sa ilalim, ngunit mas maliit nangungunang presyo mga laro. Ngayon sabihin natin na natutunan ng kaaway na gumagamit kami ng diskarte A 2; agad niya itong tutugon kasama ang diskarte B 1 at bawasan ang pakinabang sa 0.3. Kaugnay nito, mayroon kaming isang mahusay na sagot sa diskarte B 1: diskarte A 1, na nagbibigay sa amin ng isang panalo ng 0.9, at iba pa.

Kaya, ang posisyon kung saan ginagamit ng parehong mga manlalaro ang kanilang mga diskarte sa minimax ay hindi matatag at maaaring lumabag sa impormasyong natanggap tungkol sa diskarte ng kalaban. Gayunpaman, may ilang mga laro kung saan ang mga diskarte sa minimax ay matatag. Ito ang mga laro kung saan ang mas mababang presyo ay katumbas ng pang-itaas: α \u003d β. Kung ang mas mababang presyo ng laro ay katumbas sa itaas, kung gayon kabuuang halaga ay tinatawag na netong gastos ng laro (kung minsan ay ang gastos lamang ng laro), ipakikilala natin ito sa pamamagitan ng liham ν.

Tingnan natin ang isang halimbawa. Hayaan ang isang laro na 4 × 4 na bibigyan ng matrix:

Hahanapin natin ang mas mababang presyo ng laro: α \u003d 0.6. Hahanapin ang tuktok na presyo ng laro: β \u003d 0.6. Sila ay naging pareho, samakatuwid, ang laro ay may net na presyo na katumbas ng α \u003d β \u003d ν \u003d 0.6. Elemento 0.6, na naka-highlight sa payoff matrix, ay pareho ang minimum sa hilera nito at maximum sa haligi nito. Sa geometry, isang punto sa isang ibabaw na may katulad na pag-aari (isang sabay-sabay na minimum kasama ang isang coordinate at isang maximum na kasama ng iba pa) ay tinatawag na isang saddle point; sa pamamagitan ng pagkakatulad, ang term na ito ay ginagamit din sa teorya ng laro. Ang isang elemento ng isang matrix na may ari-arian na ito ay tinatawag na isang saddle point ng matrix, at ang isang laro ay sinasabing mayroong saddle point.

Ang point saddle ay tumutugma sa isang pares ng mga diskarte sa minimax (sa halimbawa na ito, A 3 at B 2). Ang mga diskarte na ito ay tinatawag na optimal, at ang kanilang kumbinasyon ay tinatawag na solusyon sa laro. Ang solusyon ng laro ay may mga sumusunod kamangha-manghang pag-aari... Kung ang isa sa mga manlalaro (halimbawa, A) ay sumunod sa kanyang pinakamainam na diskarte, at ang iba pang manlalaro (B) ay lumihis mula sa kanyang pinakamainam na diskarte sa anumang paraan, kung gayon para sa manlalaro na gumawa ng isang paglihis, hindi ito maaaring maging kapaki-pakinabang, tulad ng isang paglihis ng player B maaari sa pinakamahusay iwan ang mga panalo na hindi nagbabago, at sa pinakamasamang kaso, dagdagan ito. Sa kabaligtaran, kung ang B ay sumunod sa pinakamainam na diskarte nito, at ang A ay lumihis mula sa sarili nitong, kung gayon hindi sa anumang kaso maaari itong maging kapaki-pakinabang para sa A.

Ang pahayag na ito ay madaling ma-verify sa pamamagitan ng halimbawa ng laro na may point saddle na isinasaalang-alang. Nakikita namin na sa kaso ng isang laro na may isang saddle point, ang mga diskarte sa minimax ay may isang uri ng "katatagan": kung ang isang panig ay sumunod sa diskarteng minimax nito, kung gayon maaari lamang itong hindi kapaki-pakinabang para sa iba pang lumihis mula sa sarili nitong. Tandaan na sa kasong ito, ang sinumang manlalaro na mayroong impormasyon na pinili ng kaaway ang kanyang pinakamainam na diskarte ay hindi maaaring baguhin ang sariling pag-uugali ng manlalaro: kung ayaw niyang kumilos laban sa kanyang sariling interes, dapat niyang sumunod sa kanyang pinakamainam na diskarte. Ang isang pares ng mga pinakamainam na diskarte sa larong punong-punong ay, tulad nito, isang "posisyon ng balanse": ang anumang paglihis mula sa pinakamainam na diskarte ay humahantong sa paglihis ng manlalaro sa hindi kanais-nais na mga kahihinatnan, pinilit siyang bumalik sa kanyang orihinal na posisyon.

Kaya, para sa bawat laro na may punong punla, mayroong isang solusyon na tumutukoy sa isang pares ng pinakamainam na mga diskarte para sa magkabilang panig at may mga sumusunod na katangian.

1) Kung ang parehong mga partido ay sumunod sa kanilang pinakamainam na diskarte, kung gayon ang average na kabayaran ay katumbas ng net presyo ng laro ν, na kung saan ay sabay-sabay na mas mababa at itaas na presyo.

2) Kung ang isa sa mga partido ay sumunod sa pinakamainam na diskarte nito, at ang iba pang mga lihis mula sa sarili nitong, kung gayon ang lihis na bahagi ay maaaring mawala lamang mula dito at sa anumang kaso ay hindi maaaring madagdagan ang pakinabang.

Ang klase ng mga laro na may isang punong punong-puno ay may malaking interes kapwa mula sa isang panteorya at praktikal na punto ng pagtingin. Sa teorya ng laro, napatunayan na, sa partikular, ang bawat laro na may kumpletong impormasyon ay may puntong punla, at, samakatuwid, ang bawat naturang laro ay may solusyon, i.e. mayroong isang pares ng pinakamainam na diskarte ng magkabilang panig, na nagbibigay ng isang average na kabayaran na katumbas ng presyo ng laro. Kung ang isang laro na may kumpletong impormasyon ay binubuo lamang ng mga personal na galaw, pagkatapos kapag ang bawat panig ay nalalapat ang pinakamainam na diskarte, dapat itong palaging magtatapos sa isang tiyak na kalalabasan, samakatuwid, isang panalo na eksaktong katumbas ng presyo ng laro.

Bilang isang halimbawa ng isang laro na may kumpletong impormasyon, ibinibigay namin sikat na laro gamit ang pag-stack ng mga barya bilog na mesa... Ang dalawang manlalaro ay kahaliling naglalagay ng magkaparehong mga barya sa talahanayan ng pag-ikot, sa bawat oras na pumili ng isang di-makatwirang posisyon sa gitna ng barya; Ang pag-overlay ng mga barya ay hindi pinapayagan. Ang player na naglalagay ng huling barya ay nanalo (kapag walang silid para sa iba). Malinaw, ang kinalabasan ng larong ito ay palaging isang konklusyon ng foregone, at mayroong isang mahusay na natukoy na diskarte na nagsisiguro sa isang maaasahang panalo para sa player na naglalagay muna ng barya. Lalo na, kailangan muna niyang maglagay ng barya sa gitna ng mesa, at pagkatapos ay tumugon na may simetriko na paglipat sa galaw ng bawat kalaban. Sa kasong ito, ang pangalawang manlalaro ay maaaring kumilos habang nais niya nang hindi binabago ang paunang natukoy na resulta ng laro. Samakatuwid, ang larong ito ay may katuturan lamang para sa mga manlalaro na hindi alam ang pinakamainam na diskarte. Ang sitwasyon ay katulad ng chess at iba pang mga laro na may kumpletong impormasyon; alinman sa mga larong ito ay may puntong punla at isang solusyon na nagpapahiwatig sa bawat manlalaro ng kanyang pinakamainam na diskarte; ang solusyon ng larong chess ay hindi lamang natagpuan dahil ang bilang ng mga kumbinasyon ng mga posibleng gumagalaw sa chess ay napakalaki upang makagawa ng isang matrikula sa pagbabayad at makahanap ng isang saddle point sa loob nito.

§ 3. Puro at halo-halong mga diskarte. Solusyon ng laro sa halo-halong mga diskarte

Ang mga laro ng saddle point ay medyo bihira sa mga may hangganan na laro ng praktikal na kahalagahan; ang isang mas karaniwang kaso ay kapag ang mas mababa at itaas na mga presyo ng laro ay naiiba. Sinusuri ang mga matrice ng naturang mga laro, natapos namin na kung ang bawat manlalaro ay bibigyan ng pagpipilian ng isang solong diskarte, kung gayon, ang pagbibilang sa isang makatwirang kumikilos na kalaban, ang pagpili na ito ay dapat matukoy ng minimax na prinsipyo. Ang pagsunod sa aming pinakamataas na diskarte, para sa anumang pag-uugali ng kalaban, alam namin na ginagarantiyahan ang aming sarili ng isang pakinabang na katumbas ng mas mababang presyo ng laro α. Ang isang likas na tanong ay lumitaw: posible bang garantiya ang sarili ng isang average na kabayaran na mas malaki kaysa sa α, kung hindi namin ginagamit ang isang solong "dalisay" na diskarte, ngunit sapalarang kahaliling ilang mga diskarte? Ang nasabing pinagsamang mga diskarte, na binubuo sa application ng maraming mga dalisay na diskarte, alternating ayon sa isang random na batas na may isang tiyak na ratio ng dalas, ay tinatawag na halo-halong mga diskarte sa teorya ng laro.

Malinaw na, ang bawat dalisay na diskarte ay isang espesyal na kaso ng isang halo-halong isa, kung saan ang lahat ng mga diskarte, maliban sa isa, ay inilalapat na may mga dalas na zero, at ang isang ito - na may dalas ng 1. Ito ay lumilitaw na, ang pag-aaplay hindi lamang puro, ngunit din halo-halong mga diskarte, maaaring makuha ang bawat isa para sa bawat wakas na laro solusyon, i.e. isang pares ng mga tulad nito (sa pangkalahatang kaso, halo-halong) mga estratehiya na kapag ang parehong mga manlalaro ay nag-aaplay sa kanila, ang kabayaran ay magiging katumbas ng presyo ng laro, at para sa anumang isang panig na paglihis mula sa pinakamainam na diskarte, ang payoff ay maaari lamang magbago sa direksyon na hindi kanais-nais para sa mga lumihis.

Ang pahayag na ito ay ang nilalaman ng tinatawag na pangunahing teorema ng teorya ng laro. Ang teorem na ito ay unang napatunayan ni von Neumann noong 1928. Ang kilalang mga patunay ng teorema ay medyo kumplikado; samakatuwid, ipinapakita lamang namin ang pagbabalangkas.

Ang bawat laro sa pagtatapos ay may hindi bababa sa isang solusyon (marahil sa lugar ng mga halo-halong mga diskarte).

Ang nakuha na resulta mula sa isang desisyon ay tinatawag na gastos ng laro. Ang pangunahing teorema ay nagpapahiwatig na ang bawat hangganan ng laro ay may presyo. Malinaw, ang presyo ng laro ν palaging namamalagi sa pagitan ng mas mababang presyo ng laro α at ang pinakamataas na presyo ng laro:

(3.1) α ≤ ν ≤ β

Sa katunayan, ang α ang pinakamataas na garantisadong kabayaran na maaari nating mai-secure para sa ating sarili gamit lamang ang aming dalisay na mga diskarte. Dahil kasama ang halo-halong mga diskarte, bilang isang espesyal na kaso, lahat ng mga dalisay, kung gayon, pag-amin, bilang karagdagan sa mga purong mga, din na halo-halong mga diskarte, kami, sa anumang kaso, ay hindi pinalala ang aming mga kakayahan; samakatuwid, ν ≥ α. Katulad nito, isinasaalang-alang ang mga kakayahan ng kalaban, ipinakita namin na ν ≤ β, na nagpapahiwatig ng napatunayan na hindi pagkakapantay-pantay (3.1).

Ipaalam sa amin ipakilala ang isang espesyal na notasyon para sa halo-halong mga diskarte. Kung, halimbawa, ang aming halo-halong diskarte ay binubuo sa paglalapat ng mga estratehiya A 1, A 2, A 3 na may mga frequency p 1, p 2, p 3, at p 1 + p 2 + p 3 \u003d 1, ipakikilala natin ang diskarte na ito

Katulad nito, ang halo-halong diskarte ng kaaway ay isasaad ng:

kung saan ang q 1, q 2, q 3 ay ang mga dalas kung saan ang mga diskarte sa B 1, B 2, B 3 ay halo-halong; q 1 + q 2 + q 3 \u003d 1.

Ipagpalagay na natagpuan namin ang isang solusyon sa laro na binubuo ng dalawang pinakamainam na halo-halong mga diskarte S A *, S B *. Sa pangkalahatang kaso, hindi lahat ng mga purong diskarte na magagamit sa isang naibigay na manlalaro ay kasama sa kanyang pinakamainam na halo-halong diskarte, ngunit ilan lamang. Tatawagin namin ang mga diskarte na kasama sa pinakamainam na halo-halong diskarte ng player ng kanyang "kapaki-pakinabang" na mga diskarte. Ito ay lumiliko na ang solusyon sa laro ay may isa pang kamangha-manghang pag-aari: kung ang isa sa mga manlalaro ay sumunod sa kanyang pinakamainam na halo-halong diskarte SA * (SB *), kung gayon ang kabayaran ay mananatiling hindi nagbabago at katumbas ng presyo ng laro ν, anuman ang ginagawa ng ibang manlalaro, maliban kung siya lampas sa mga "kapaki-pakinabang" na mga diskarte nito. Halimbawa, siya ay maaaring gumamit ng alinman sa kanyang mga "kapaki-pakinabang" na mga diskarte sa dalisay na anyo, at maaari ring ihalo ang mga ito sa anumang proporsyon.

§ 4. Pang-elemental na pamamaraan para sa paglutas ng mga laro. Mga Laro 2x2 at 2xn

Kung ang laro mxn ay walang isang saddle point, kung gayon ang paghahanap ng isang solusyon sa pangkalahatan ay isang mahirap na gawain, lalo na para sa malalaking m at n. Minsan ang gawaing ito ay maaaring gawing simple sa pamamagitan ng unang pagbabawas ng bilang ng mga diskarte sa pamamagitan ng pagtanggal ng ilang kalabisan. Ang labis na mga diskarte ay isang) doble at b) malinaw na hindi kapaki-pakinabang. Isaalang-alang, halimbawa, isang laro na may isang matris:

Hindi mahirap tiyakin na ang estratehiya exactly 3 eksaktong inuulit ("mga duplicate") na diskarte А 1, samakatuwid, maaaring matanggal ang alinman sa dalawang mga diskarte na ito. Karagdagan, ang paghahambing ng mga linya A 1 at A 2, nakikita namin na ang bawat elemento ng linya A2 ay mas mababa (o katumbas) sa kaukulang elemento ng linya A 1. Malinaw, hindi namin dapat gamitin ang diskarte ng A2, malinaw na hindi ito kapaki-pakinabang. Sa pamamagitan ng pagtanggal ng A 3 at A 2, dinadala namin ang matris sa higit pa simpleng isip... Dagdag pa, napapansin natin na ang diskarte sa B 3 ay malinaw na hindi kapaki-pakinabang para sa kaaway; Tinatanggal ito, dinala namin ang matrix sa pangwakas na form nito:

Kaya, ang 4 × 4 na laro ay nabawasan sa isang 2 × 3 na laro sa pamamagitan ng pagtanggal ng dobleng at malinaw na hindi kanais-nais na mga diskarte.

Ang pamamaraan para sa pagtanggal ng dobleng at malinaw na hindi kanais-nais na mga diskarte ay dapat palaging unahan ang desisyon ng laro. Ang pinakasimpleng mga kaso ng mga may hangganan na laro na laging malulutas sa mga pangunahing paraan ay 2 × 2 at 2xn na laro.

Isaalang-alang ang isang 2 × 2 na laro na may isang matris:

Maaaring maganap ang dalawang kaso dito: 1) ang laro ay may punong punong-abala; 2) ang laro ay walang point saddle. Sa unang kaso, ang solusyon ay halata: ito ay isang pares ng mga estratehiya na bumalandra sa isang punla. Sa pamamagitan ng paraan, tandaan na sa isang 2 × 2 na laro, ang pagkakaroon ng isang punong punso ay palaging tumutugma sa pagkakaroon ng sadyang hindi sinasadyang mga diskarte, na dapat tanggalin sa paunang pagsusuri.

Hayaan walang point saddle at, samakatuwid, ang mas mababang presyo ng laro ay hindi katumbas sa itaas na: α ≠ β. Kinakailangan upang mahanap ang pinakamainam na halo-halong diskarte ng player A:

Nakikilala sa pamamagitan ng pag-aari na ang anumang pagkilos ng kalaban ay maaaring maging (maliban kung lalampas niya ang mga limitasyon ng kanyang "kapaki-pakinabang" na mga diskarte), ang kabayaran ay magiging katumbas ng presyo ng laro ν. Sa isang 2 × 2 na laro, ang parehong mga diskarte ng kaaway ay "kapaki-pakinabang", kung hindi, ang laro ay magkakaroon ng isang purong diskarte sa diskarte (point saddle). Nangangahulugan ito na kung sumunod tayo sa aming pinakamainam na diskarte (4.1), kung gayon ang kaaway ay maaaring gumamit ng alinman sa kanyang mga purong estratehiya B 1, B 2 nang hindi binabago ang average na kabayaran ν. Samakatuwid mayroon kaming dalawang mga equation:

mula kung saan, isinasaalang-alang na p 1 + p 2 \u003d 1, nakukuha namin:

Nahanap namin ang halaga ng laro ν sa pamamagitan ng paghahalili ng mga halaga p 1, p 2 sa alinman sa mga equation (4.2).

Kung ang presyo ng laro ay kilala, pagkatapos upang matukoy ang pinakamainam na diskarte ng kalaban

sapat ang isang equation, halimbawa:

kung saan, isinasaalang-alang na q 1 + q 2 \u003d 1, mayroon kaming:

Halimbawa 1. Hahanapin natin ang solusyon ng larong 2 × 2 na isinasaalang-alang sa Halimbawa 1 § 1, kasama ang matrix:

Ang laro ay walang isang saddle point (α \u003d –1; β \u003d +1), at, samakatuwid, ang solusyon ay dapat magsinungaling sa domain ng halo-halong mga diskarte:

Kailangan mong maghanap ng p 1, p 2, q 1 at q 2. Para sa p 1 mayroon kaming equation

1 * p 1 + (–1) (1 - p 1) \u003d (–1) p 1 + 1 (1 - p 1)

kung saan p 1 \u003d 1/2, p 2 \u003d 1/2.

Katulad nito, nahanap namin: q 1 \u003d 1/2, q 2 \u003d 1/2, ν \u003d 0.

Dahil dito, ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro ay sapalarang palitan ang pareho ng kanilang mga dalisay na diskarte, gamit ang bawat isa sa mga ito nang pantay na madalas; ang average na kabayaran ay magiging zero.

Ang resulta ng konklusyon ay malinaw na malinaw nang maaga. Sa susunod na halimbawa, titingnan natin ang higit pa mahirap na laro, ang solusyon kung saan hindi halata. Ang halimbawa ay isang hindi magandang halimbawa ng mga laro na kilala bilang "pagdaraya" o "pagdaraya" na mga laro. Sa pagsasagawa, sa mga sitwasyon ng salungatan, madalas silang ginagamit iba't ibang paraan nakaliligaw sa kaaway (maling impormasyon, paglalagay ng maling target, atbp.). Ang halimbawa, sa kabila ng pagiging simple nito, sa halip ay pagtuturo.

Halimbawa 2. Ang laro ay ang mga sumusunod. Mayroong dalawang kard: isang alas at isang deuce. Ang Player A ay kumukuha ng isa sa mga ito nang random; Hindi nakikita ni B kung aling card ang kinuha niya. Kung kumuha si A ng isangce, sinabi niya: "Mayroon akong isang ace," at hinihiling mula sa kalaban 1 ruble. Kung ang A ay kumuha ng isang deuce, pagkatapos ay maaari niyang alinman sa A 1) sabihin "Mayroon akong isang ace" at humiling ng 1 ruble mula sa kalaban, o A 2) aminin na mayroon siyang isang deuce at bayaran ang kalaban 1 ruble.

Ang kaaway, kung kusang siya ay binabayaran ng 1 ruble, tatanggapin lamang ito. Kung ang 1 ruble ay hinihiling sa kanya, kung gayon maaari niyang alinman sa B 1) maniwala manlalaro A na siya ay mayroong isangce at bigyan siya ng 1 ruble, o B 2) humiling ng isang tseke upang matiyak na ang assertion A. Kung bilang isang resulta. suriin ito na ang A ay talagang may ace, ang B ay dapat magbayad ng A 2 rubles. Kung lumiliko na ang A ay ang pagdaraya at mayroon siyang isang deuce, ang magbabayad ay nagbabayad ng player B 2 rubles. Kinakailangan upang pag-aralan ang laro at hanapin ang pinakamainam na diskarte para sa bawat isa sa mga manlalaro.

Desisyon. Ang laro ay may medyo kumplikadong istraktura; binubuo ito ng isang sapilitan sapalarang paglipat - napili ng player A ng isa sa dalawang kard - at dalawang personal na gumagalaw, na, gayunpaman, ay hindi kinakailangang maganap. Sa katunayan, kung kinuha ni A ang isang ace, kung gayon hindi siya gumawa ng anumang personal na paglipat: bibigyan lamang siya ng isang pagpipilian - upang humiling ng 1 ruble, na ginagawa niya. Sa kasong ito, isang personal na paglipat - upang maniwala o hindi maniniwala (magbabayad o hindi magbabayad ng 1 ruble) - ay inilipat sa player B. Kung ang A bilang isang resulta ng unang random na paglipat ay natanggap ng dalawa, pagkatapos ay bibigyan siya ng isang personal na ilipat: magbayad ng 1 ruble o subukang manloko kaaway at hinihiling ang 1 ruble (sa madaling sabi: "huwag lokohin" o "linlangin"). Kung pipiliin ng una ang A, kailangan lamang tanggapin ng B ang 1 ruble; kung pinili ni A ang huli, kung gayon ang player B ay bibigyan ng isang personal na paglipat: maniwala o hindi maniwala A (i.e., magbayad ng A 1 ruble o pag-verify ng demand).

Ang mga diskarte ng bawat isa sa mga manlalaro ay mga patakaran na nagpapahiwatig kung paano dapat kumilos ang player kapag binigyan ng isang personal na galaw. Malinaw, ang A ay may lamang dalawang mga diskarte: A 1 - upang lokohin, A 2 - hindi manloko. Mayroon ding dalawang diskarte si B: B 1 - upang maniwala, B 2 - hindi dapat paniwalaan. Gawing itayo ang laro matrix. Upang gawin ito, kinakalkula namin ang average na bayad para sa bawat kumbinasyon ng mga diskarte.

1. A 1 B 1 (Isang nanlinlang, naniniwala si B). Kung ang A ay tumanggap ng isang ace (ang posibilidad na ito ay ½, kung gayon hindi siya bibigyan ng isang personal na galaw; hinihiling niya ang 1 ruble, at naniniwala ang manlalaro B; 1. Ang nakuha ng isang rubles ay 1. Kung ang A ay tumanggap ng dalawa (ang posibilidad ng ito ay din ½), ayon sa kanyang diskarte, tinatamad niya. at nangangailangan ng 1 ruble; Naniniwala sa kanya at nagbabayad; ang kabayaran A ay katumbas din ng 1. Average na kabayaran: isang 11 \u003d ½ * 1 + ½ * 1 \u003d 1.

2. A 1 B 2 (Isang panlilinlang, hindi naniniwala si B). Kung ang A ay nakakakuha ng isang ace, wala siyang personal na galaw; nangangailangan siya ng 1 ruble; Ayon sa kanyang diskarte, hindi siya naniniwala at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang nakuha ng A ay +2). Kung ang A ay nakatanggap ng dalawa, ayon sa kanyang diskarte, hinihiling niya ang 1 ruble; B, ayon sa kanyang sarili, ay hindi naniniwala; bilang isang resulta, Isang nagbabayad ng 2 rubles (Ang nakuha ng A ay -2). Ang average na kabayaran ay: isang 12 \u003d ½ * (+ 2) + ½ * (- 2) \u003d 0.

3. A 2 B 1 (A ay hindi linlangin, naniniwala si B). Kung ang A ay kumuha ng isang ace, hinihiling niya ang 1 ruble; B nagbabayad alinsunod sa kanyang diskarte; payoff A ay +1. Kung kinuha ni A ang isang deuce, nagbabayad siya ng 1 ruble ayon sa kanyang diskarte; Dapat lamang tanggapin ng B (ang pakinabang ng A ay -1). Ang average na kabayaran ay: isang 21 \u003d ½ * (+ 1) + ½ * (- 1) \u003d 0.

4. A 2 B 2 (A ay hindi linlangin, hindi naniniwala si B). Kung ang A ay kumuha ng isang ace, hinihiling niya ang 1 ruble; Mga tseke ng B at, bilang isang resulta ng tseke, nagbabayad ng 2 rubles (ang panalo ay +2). Kung kinuha ni A ang isang deuce, nagbabayad siya ng 1 ruble; Ang natitira lamang ay tatanggapin (ang kabayaran ay 1). Ang average na kabayaran ay: isang 22 \u003d ½ * (+ 2) + ½ * (- 1) \u003d ½.

Binuo namin ang laro matrix:

Ang matrix ay walang saddle point. Ang mas mababang presyo ng laro ay α \u003d 0, ang pinakamataas na presyo ng laro ay β \u003d ½. Hahanapin ang isang solusyon sa laro sa larangan ng halo-halong mga diskarte. Paglalapat ng formula (4.3), nakukuha namin:

mga. Dapat gamitin ng Player A ang kanyang unang diskarte (impostor) sa isang third ng lahat ng mga kaso, at ang kanyang pangalawang diskarte (hindi manloko) sa dalawang third. Sa kasong ito, mananalo siya sa average na presyo ng laro ν \u003d 1/3.

Ang halaga ν \u003d 1/3 ay nagpapahiwatig na sa ilalim ng mga kundisyong ito ang laro ay kapaki-pakinabang para sa A at hindi kanais-nais para sa B. Gamit ang kanyang pinakamainam na diskarte, Ang A ay palaging maaaring magbigay ng kanyang sarili ng isang positibong average na kabayaran. Tandaan na kung ginamit ni A ang kanyang pinaka maingat (maximin) na diskarte (sa kasong ito, ang parehong mga diskarte ng A 1 at A 2 ay maximin), magkakaroon siya ng isang average na kabayaran na katumbas ng zero. Kaya, ang paggamit ng isang halo-halong diskarte ay nagbibigay sa Isang pagkakataon na mapagtanto ang kalamangan nito sa B, na lumabas sa ilalim ng ibinigay na mga patakaran ng laro.

Tukuyin natin ang pinakamainam na diskarte B. Mayroon kaming: q 1 * 1 + q 2 * 0 \u003d 1/3, q 1 \u003d 1/3, q 2 \u003d 2/3. Mula saan

i.e. dapat magtiwala ang player B A sa isang third ng lahat ng mga kaso at bayaran siya ng 1 ruble nang hindi sinuri, at sa dalawang katlo ng mga kaso - suriin. Pagkatapos ay siya, sa average, mawalan ng 1/3 para sa bawat laro. Kung ginamit niya ang kanyang minimax purong diskarte B 2 (huwag naniniwala), mawawala siya sa average na 1/2 para sa bawat laro.

Ang solusyon sa larong 2 × 2 ay maaaring mabigyan ng isang simpleng geometric na interpretasyon. Hayaan mayroong isang 2 × 2 na laro kasama ang matrix

Kumuha tayo ng isang seksyon ng abscissa axis na may haba na 1 (Larawan 4.1). Ang kaliwang dulo ng seksyon (ang punto kasama ang abscissa x \u003d 0) ay kumakatawan sa diskarte A 1; ang kanang dulo ng seksyon (x \u003d 1) - diskarte A 2. Gumuhit tayo ng dalawang patayo sa axis ng abscissa sa pamamagitan ng mga punto А 1 at А 2: axis Ako-Ako at axis II - II... Sa axis Ako-Ako ipagpaliban namin ang mga panalo para sa diskarte A 1; sa axis II - II - panalo para sa diskarte A 2. Isaalang-alang ang diskarte ng kalaban B 1; nagbibigay ito ng dalawang puntos sa mga axes Ako-Ako at II - II na may ordinasyon ng isang 11 at 21, ayon sa pagkakabanggit. Gumuhit ng isang tuwid na linya B 1 B 1 sa pamamagitan ng mga puntong ito. Malinaw, kung mag-aplay kami ng isang halo-halong diskarte para sa diskarte ng kaaway B 1

pagkatapos ang aming average na kabayaran, na pantay sa kasong ito sa isang 11 p 1 + a 21 p 2, ay kinakatawan ng point M sa linya B 1 B 1; ang abscissa sa puntong ito ay pantay sa p 2. Ang tuwid na linya В 1 В 1, na kumakatawan sa kabayaran para sa diskarte В 1, ay tinatawag na conventionally "diskarte В 1".

Malinaw, ang diskarte sa B2 ay maaaring itayo nang eksakto sa parehong paraan (Larawan 4.2).

Kailangan nating hanapin ang pinakamainam na diskarte S A *, iyon ay, kung saan ang minimum na pagbabayad (para sa anumang pag-uugali ng B) ay magiging isang maximum. Upang gawin ito, bubuo tayo ng mas mababang gapos ng kabayaran para sa mga diskarte B 1, B 2, i.e. sirang linya B 1 NB 2 na minarkahan sa Fig. 4.2 na may isang matapang na linya. Ang mas mababang gapos na ito ay magpapahayag ng minimum na pagbabayad ng player A para sa alinman sa kanyang mga halo-halong mga diskarte; ang puntong N kung saan ang pinakamababang pakinabang na ito ay umaabot sa pinakamataas na tinutukoy ang pasya at ang presyo ng laro. Madaling i-verify na ang ordinate ng point N ay ang presyo ng laro ν, at ang abscissa nito ay katumbas ng p 2 - ang dalas ng aplikasyon ng diskarte A 2 sa pinakamainam na halo-halong diskarte S A *.

Sa aming kaso, ang desisyon ng laro ay tinutukoy ng punto ng intersection ng mga diskarte. Gayunpaman, hindi ito palaging magiging kaso; sa fig. Ipinakita ng 4.3 ang kaso kung, sa kabila ng pagkakaroon ng isang intersection ng mga diskarte, ang solusyon ay nagbibigay para sa parehong mga manlalaro ng purong estratehiya (A 2 at B 2), at ang presyo ng laro ν \u003d a 22. Sa kasong ito, ang matrix ay may saddle point, at ang diskarte sa A 1 ay malinaw na hindi kapaki-pakinabang, mula pa para sa anumang dalisay na diskarte ng kalaban, nagbibigay ito ng mas kaunting pakinabang kaysa sa A2.

Sa kaso kapag ang kalaban ay may isang hindi kilalang diskarte na hindi kanais-nais, ang geometric na interpretasyon ay may form na ipinakita sa Fig. 4.4.

Sa kasong ito, ang mas mababang gapos ng payoff ay nagkakasabay sa diskarte B 1, ang diskarte B 2 ay malinaw na hindi nakakasama para sa kalaban.

Ang geometric na interpretasyon ay ginagawang posible upang mailarawan din ang mas mababa at itaas na presyo ng laro (Fig. 4.5).

Para sa paglalarawan, nagtatayo kami ng mga geometric na interpretasyon ng 2 × 2 na mga laro na isinasaalang-alang sa mga halimbawa 1 at 2 (Larawan 4.6 at 4.7).

Tiniyak namin na ang anumang 2 × 2 na laro ay maaaring malutas gamit ang mga simpleng pamamaraan. Ang anumang laro ng 2xn ay maaaring malutas nang eksakto sa parehong paraan. kung saan mayroon lamang kaming dalawang mga diskarte, at ang kaaway ay may isang di-makatwirang bilang.

Ipagpalagay na mayroon tayong dalawang mga diskarte: A 1, A 2, at ang mga diskarte ng kaaway: B 1, B 2, ..., B n. Ang matris ‖a ij ‖ ay ibinigay; binubuo ito ng dalawang hilera at n haligi. Katulad sa kaso ng dalawang estratehiya, binibigyan namin ang problema ng isang geometric na interpretasyon; n mga diskarte ng kalaban ay kinakatawan ng n tuwid na mga linya (Larawan. 4.8). Binuo namin ang mas mababang hangganan ng panalo (sirang linya B 1 MNB 2) at matatagpuan sa puntong ito ng N na may pinakamataas na ordinate. Ang puntong ito ay nagbibigay ng solusyon sa laro (diskarte ) ang ordinate ng point N ay katumbas ng presyo ng laro ν, at ang abscissa ay katumbas ng dalas ng p 2 ng diskarte A 2.

Sa kasong ito, ang pinakamainam na diskarte ng kalaban ay nakuha sa pamamagitan ng paggamit ng isang halo ng dalawang "kapaki-pakinabang" na diskarte: B 2 at B 4, ang intersecting sa point N. Diskarte B 3 ay malinaw na hindi kapaki-pakinabang, at ang diskarte B 1 ay hindi kapaki-pakinabang para sa pinakamainam na diskarte S A *. Kung ang A ay nananatili sa kanyang pinakamainam na diskarte, kung gayon ang pagbabayad ay hindi magbabago, alinman sa kanyang "kapaki-pakinabang" na mga diskarte na ginagamit ng B, gayunpaman, magbabago ito kung ang B ay lumilipat sa mga diskarte B 1 o B 3. Sa teorya ng laro, napatunayan na ang anumang hangganan na laro mxn ay may isang solusyon kung saan ang bilang ng mga "kapaki-pakinabang" na mga diskarte ng magkabilang panig ay hindi lalampas sa hindi bababa sa dalawang mga numero m at n. Sa partikular, sumusunod sa ito na ang laro 2xm ay palaging may isang solusyon kung saan hindi hihigit sa dalawang "kapaki-pakinabang" na mga diskarte ang lumahok sa magkabilang panig.

Gamit ang isang geometric na interpretasyon, ang isa ay maaaring magbigay ng isang madaling paraan upang malutas ang anumang 2xm na laro. Direkta mula sa pagguhit, nakatagpo kami ng isang pares ng "kapaki-pakinabang" na mga diskarte ng kalaban B j at B k na intersect sa point N (kung higit sa dalawang mga diskarte na intersect sa point N, kukuha kami ng alinman sa dalawa). Alam namin na kung manlalaro Ang sumunod sa kanyang pinakamainam na diskarte, kung gayon ang kabayaran ay hindi nakasalalay sa proporsyon kung saan inilalapat niya ang B sa kanyang "kapaki-pakinabang" na mga diskarte, samakatuwid,

Mula sa mga equation na ito at ang kondisyon p 2 \u003d 1 - p 1, nahanap namin ang p1, p2 at ang presyo ng laro ν. Alam ang presyo ng laro, maaari mong agad na matukoy ang pinakamainam na diskarte player B. Para dito, halimbawa, ang equation ay nalulutas: qja 1 j + qka 1 k \u003d ν, kung saan ang qj + qk \u003d 1. Sa kaso kung mayroon tayong mga diskarte sa m, at ang kaaway ay may dalawa lamang, malinaw naman, ang problema ay nalutas sa isang ganap na katulad na paraan ; sapat na upang tandaan na sa pamamagitan ng pagpapalit ng tanda ng panalo sa kabaligtaran, maaaring iikot ng isa ang player A mula sa "panalong" hanggang sa "pagkatalo". Maaari mong malutas ang laro nang hindi binabago ang nanalong sign; pagkatapos ang problema ay lutasin nang direkta para sa B, ngunit hindi mas mababa, ngunit ang isang itaas na kabayaran ay itinayo (Fig. 4.9). Sa hangganan, isang point N na may pinakamababang ordinate ay hinahangad, na kung saan ay ang presyo ng laro ν.

Isaalang-alang at lutasin ang ilang mga halimbawa ng 2 × 2 at 2xm na mga laro, na pinasimple na mga halimbawa ng mga laro na praktikal na kahalagahan.

Halimbawa 3.Ang Side A ay nagpapadala ng dalawang bomba sa lugar ng kaaway B Ako at II; Ako lilipad sa harap, II - sa likod. Ang isa sa mga bombero - hindi ito kilala nang una kung alin ang dapat - dalhin ang bomba, ang iba pang kumikilos bilang isang escort. Sa lugar ng kalaban, ang mga bombero ay inaatake ng isang manlalaban sa panig B. Ang mga bombero ay armado ng mga kanyon ng iba't ibang mga rate ng sunog. Kung ang manlalaban ay umaatake sa likuran ng bomba II, pagkatapos lamang ang mga kanyon ng bomber na ito ay sumunog sa ito; kung inaatake niya ang front bomber, pagkatapos ang mga kanyon ng parehong mga bombero ay sumunog sa kanya. Ang posibilidad ng paghagupit ng isang manlalaban sa unang kaso ay 0.3, sa pangalawang 0.7.

Kung ang manlalaban ay hindi binaril sa pamamagitan ng nagtatanggol na bomba ng bomba, pagkatapos ay tinamaan ang target ng pagpili nito na may posibilidad na 0.6. Ang gawain ng mga bomba ay ang dalhin ang bomba sa target; ang gawain ng manlalaban ay upang maiwasan ito, i.e. pagbaril down ng isang bomber ng bapor. Kinakailangan na piliin ang pinakamainam na diskarte ng mga partido:

a) para sa panig A: alin sa bomba ang dapat gamitin bilang isang carrier?

b) para sa panig B: alin ang bomba na atake?

Desisyon. Mayroon kaming isang simpleng kaso ng isang 2 × 2 na laro; posibilidad na manalo hindi pagkatalo ng carrier. Ang aming mga diskarte: Isang 1 - carrier - bomber Ako; Isang 2 - carrier - bomba II... Mga diskarte sa Kaaway: B 1 - atake sa bombero Ako; B 2 - pag-atake ng bomba II... Isulat natin ang matrix ng laro, i.e. hanapin ang average na kabayaran para sa bawat kumbinasyon ng mga diskarte.

1.A 1 B 1 (carrier Ako, ay inaatake Ako). Ang carrier ay hindi maabot kung ang mga bombero ay bumaril sa manlalaban, o hindi bumaril, ngunit hindi ito matamaan sa target nito: isang 11 \u003d 0.7 + 0.3 * 0.4 \u003d 0.82.

2.A 2 B 1 (carrier II, ay inaatake Ako). isang 21 \u003d 1

3.A 1 B 2 (carrier Ako, ay inaatake II). Isang 12 \u003d 1

4.A 2 B 2 (carrier II, ay inaatake II). Isang 22 \u003d 0.3 + 0.7 * 0.4 \u003d 0.58

Ang laro matrix ay may form:

Ang ibabang presyo ng laro ay 0.82; nangungunang presyo 1. Ang Matrix ay walang point saddle; naghahanap kami ng isang solusyon sa larangan ng halo-halong mga diskarte. Meron kami:

p 1 * 0.82 + p 2 * 1 \u003d ν

p 1 * 1 + p 2 * 0.58 \u003d ν

p 1 \u003d 0.7; p 2 \u003d 0.3

Ang aming pinakamainam na diskarte ay, iyon ay, bilang isang tagadala, kailangan mong pumili nang mas madalas Akokaysa II... Ang presyo ng laro ay ν \u003d 0.874. Alam ang ν, tinutukoy namin ang q 1 at q 2 - ang mga dalas ng mga diskarte B 1 at B 2 sa pinakamainam na diskarte ng kalaban S B *. Mayroon kaming: q 1 * 0.82 + q 2 * 1 \u003d 0.874 at q 2 \u003d 1 - q 1, kung saan ang q 1 \u003d 0.7; q 2 \u003d 0.3, i.e. ang pinakamabuting diskarte ng kalaban ay .

Halimbawa 4.Ang Side A ay umaatake sa object, ipinagtatanggol ito ng side B. Ang Side A ay may dalawang eroplano; ang panig B ay may tatlong anti-sasakyang panghimpapawid na baril. Ang bawat sasakyang panghimpapawid ay nagdadala ng isang malakas na mapanirang armas; para sa isang bagay na matumbok, sapat na para sa kahit isang eroplano upang masira ito. Side Isang sasakyang panghimpapawid ay maaaring pumili ng alinman sa tatlong direksyon upang makalapit sa pasilidad: Ako, II, III (Larawan 4.10). Ang kaaway (side B) ay maaaring maglagay ng alinman sa kanyang mga baril sa anumang direksyon; sa kasong ito, ang bawat armas ay tumutukoy lamang sa lugar ng puwang na nauugnay sa ibinigay na direksyon, at hindi kukunan ng mga kalapit na direksyon. Ang bawat baril ay maaari lamang sunog sa isang sasakyang panghimpapawid; ang fired eroplano ay tinamaan ng posibilidad 1. Hindi alam ng Side A kung saan matatagpuan ang mga baril; hindi alam ng gilid B kung saan nagmula ang mga eroplano. Ang gawain ng Side A ay ang pindutin ang bagay; ang gawain ng panig B ay upang maiwasan ang kanyang pagkatalo. Maghanap ng isang solusyon sa laro.

Desisyon. Ang laro ay isang 2 × 3 na laro. Ang kabayaran ay ang posibilidad ng paghagupit sa bagay. Ang aming posibleng mga diskarte ay: A 1 - magpadala ng isang eroplano nang sabay-sabay sa dalawang magkakaibang direksyon. At 2 - ipadala ang parehong mga eroplano sa parehong direksyon. Mga diskarte sa Kaaway: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - maglagay ng dalawang baril sa isang direksyon at ang isa sa iba pang; Sa 3 - ilagay ang lahat ng tatlong baril sa parehong direksyon. Nag-compose kami ng game matrix.

1.A 1 B 1 (sumakay ang mga eroplano magkakaibang direksyon; ang mga baril ay inilalagay nang paisa-isa). Malinaw, sa kasong ito, hindi isang solong eroplano ang sasabog sa bagay: isang 11 \u003d 0.

2. В 2 В 1 (ang mga eroplano ay lumipad nang magkasama sa parehong direksyon; ang mga baril ay inilalagay nang paisa-isa). Malinaw, sa kasong ito, ang isang eroplano ay ipapasa sa bagay nang hindi nagpaputok: isang 21 \u003d 1.

3. А 1 В 2 (ang mga eroplano ay lumipad nang paisa-isa; tinatanggol ng kaaway ang dalawang direksyon at iniwan ang ikatlong hindi protektado). Ang posibilidad na hindi bababa sa isang eroplano ay sasabog sa bagay ay katumbas ng posibilidad na ang isa sa kanila ay pumili ng isang hindi protektadong direksyon: isang 12 \u003d 2/3.

4. В 2 В 2 (ang mga eroplano ay lumipad nang magkasama sa isang direksyon; ipinagtatanggol ng kaaway ang isang direksyon na may dalawang baril at isa sa isa, iyon ay, sa katunayan, ipinagtatanggol niya ang isang direksyon at iniwan ang dalawang hindi protektado). Ang posibilidad na hindi bababa sa isang eroplano ay sasabog sa bagay ay katumbas ng posibilidad ng isang pares ng mga eroplano na pumili ng isang talagang hindi protektadong direksyon: isang 22 \u003d 2/3.

5. Isang 1 B 3 (ang mga eroplano ay lumipad nang paisa-isa; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong baril): isang 13 \u003d 1.

6. В 2 В 3 (ang parehong mga eroplano ay lumipad nang sama-sama; ang kaaway ay nagtatanggol lamang ng isang direksyon na may tatlong baril). Para maabot ang bagay, dapat pumili ang sasakyang panghimpapawid ng isang hindi protektadong direksyon: isang 23 \u003d 2/3.

Game Matrix:

Ipinakita ng matris na ang diskarte В 3 ay malinaw na hindi nakakasama sa paghahambing sa В 2 (ito ay maaaring malutas nang maaga). Diskarte sa pagtawid Sa 3, ang laro ay nabawasan sa isang 2 × 2 na laro:

Ang matrix ay may isang saddle point: ang pinakamababang presyo ng laro 2/3 ay nagkakasabay sa tuktok. Sa parehong oras, tandaan namin na para sa amin (A) diskarte A 1 ay malinaw na hindi kapaki-pakinabang. Konklusyon: ang magkabilang panig A at B ay dapat palaging gumamit ng kanilang mga dalisay na diskarte A 2 at B 2, i.e. kailangan naming magpadala ng mga eroplano sa 2, nang pumili nang random sa direksyon kung saan ipinadala ang pares; dapat ilagay ng kaaway ang mga sandata sa sumusunod na paraan: dalawa sa isang direksyon, ang isa sa iba pa, at ang pagpili ng mga direksyon na ito ay dapat ding gawin nang sapalaran (dito, tulad ng nakikita natin, na "mga dalisay na estratehiya" ay nagsasama ng isang elemento ng pagkakataon). Ang paglalapat ng mga pinakamainam na diskarte na ito, palaging makakakuha kami ng isang palaging average na kabayaran ng 2/3 (i.e. ang bagay ay tatama sa isang posibilidad na 2/3). Tandaan na ang nahanap na solusyon sa laro ay hindi lamang ang isa; Bilang karagdagan sa solusyon sa dalisay na mga diskarte, mayroong isang buong seksyon ng halo-halong mga diskarte ng player A, na pinakamainam, mula p 1 \u003d 0 hanggang p 1 \u003d 1/3 (Larawan 4.11).

Madali, halimbawa, upang mapatunayan nang direkta na ang parehong average na kabayaran ng 2/3 ay makuha kung ilalapat namin ang aming mga diskarte A1 at A2 sa mga proporsyon ng 1/3 at 2/3.

Halimbawa 5. Ang mga kondisyon ay katulad ng sa nakaraang halimbawa, ngunit apat na direksyon ng pag-atake ang posible para sa amin, at ang kaaway ay may apat na sandata.

Desisyon.Mayroon pa kaming dalawang posibleng mga diskarte: A 1 - magpadala ng mga eroplano nang paisa-isa, A 2 - magpadala ng dalawang eroplano. Ang kaaway ay may limang posibleng mga diskarte: B 1 - maglagay ng isang sandata sa bawat direksyon; Sa 2 - maglagay ng dalawang baril sa dalawang magkakaibang direksyon; Sa 3 - maglagay ng dalawang baril sa isang direksyon at isa-isa - sa kabilang dalawa; Sa 4, ilagay ang tatlong baril sa isang direksyon at ang isa sa iba pang; Sa 5 - ilagay ang lahat ng apat na baril sa parehong direksyon. Mga istratehiya B 4, B 5 ay itinapon nang maaga bilang malinaw na hindi kapaki-pakinabang. Nangangatuwiran nang katulad sa nakaraang halimbawa, itinatayo namin ang laro matrix:

Ang ibaba ng presyo ng laro ay 1/2, ang tuktok ay 3/4. Ang matrix ay walang saddle point; ang solusyon ay namamalagi sa lugar ng halo-halong mga diskarte. Gamit ang interpretasyong geometric (Fig. 4.12), ipaalam natin sa labas ang mga "kapaki-pakinabang" na diskarte ng kaaway: B 1 at B 2.

Ang mga dalas p 1 at p 2 ay natutukoy mula sa mga equation: p 1 * 0 + (1 - p 1) * 1 \u003d ν at p 1 * 5/6 + (1 - p 1) * 1/2 \u003d ν; kung saan p 1 \u003d 3/8; p 2 \u003d 5/8; ν \u003d 5/8, i.e. ang aming pinakamainam na diskarte ay ... Sa pamamagitan nito, ginagarantiyahan namin ang aming sarili ng isang average na panalo ng 5/8. Alam ang presyo ng laro ν \u003d 5/8, nakita namin ang mga frequency q 1 at q 2 ng mga kapaki-pakinabang na diskarte ng kalaban: q 1 * 0 + (1 - q 1) * 5/6 \u003d 5/8, q 1 \u003d ¼, q 2 \u003d ¾. Ang pinakamainam na diskarte ng kaaway ay: .

Halimbawa 6. Ang Side A ay may dalawang estratehiya A 1 at A 2, ang panig B ay mayroong apat na B 1, B 2, B 3 at B 4. Ang laro matrix ay may form:

Maghanap ng isang solusyon sa laro.

Desisyon. Mas mababang presyo ng laro 3; nangungunang 4. Ang interpretasyong geometric (Larawan 4.13) ay nagpapakita na ang mga kapaki-pakinabang na diskarte ng player B ay B 1 at B 2 o B 2 at B 4:

Ang Player A ay walang hanggan maraming pinakamainam na halo-halong mga diskarte: sa pinakamainam na diskarte, ang p 1 ay maaaring mag-iba mula 1/5 hanggang 4/5. Ang presyo ng laro ν \u003d 4. Player B ay may purong optimal diskarte B 2.

§ limang. Karaniwang pamamaraan mga solusyon sa pagtatapos ng laro

Sa ngayon, isinasaalang-alang lamang namin ang karamihan sa mga pangunahing laro ng 2xn na uri, na maaaring madaling malutas at payagan ang isang maginhawa at madaling maunawaan na geometric na interpretasyon. Sa pangkalahatang kaso, ang paglutas ng laro mxn ay isang medyo mahirap na problema, at ang pagiging kumplikado ng problema at ang halaga ng mga pagkalkula na kinakailangan upang malutas ito nang madagdagan sa pagtaas ng m at n. Gayunpaman, ang mga paghihirap na ito ay hindi isang pangunahing likas na katangian at nauugnay lamang sa isang napakalaking dami ng mga kalkulasyon, na sa ilang mga kaso ay maaaring maging praktikal na hindi praktikal. Ang pangunahing aspeto ng pamamaraan para sa paghahanap ng isang solusyon ay nananatiling pareho para sa anumang m.

Ipailarawan natin ito sa halimbawa ng larong 3xn. Bigyan natin ito ng isang interpretasyong geometriko - mayroon na isang spatial. Ang aming tatlong mga diskarte na A 1, A 2 at A 3 ay kinakatawan ng tatlong puntos sa eroplano hoy; ang mga unang namamalagi sa pinagmulan (Fig.5.1), ang pangalawa at pangatlo - sa mga ehe Oh at OU sa mga distansya ng 1 mula sa simula.

Ang Axes ay iguguhit sa pamamagitan ng mga punto A 1, A 2 at A 3 AkoAko, IIII at IIIIIIpatayo sa eroplano hoy... Sa axis AkoAko ang mga nakuha ay idineposito gamit ang diskarte A 1 sa mga ehe IIII at IIIIII - Mga panalo na may mga diskarte A 2, A 3. Ang bawat diskarte ng kalaban B j ay inilalarawan ng isang eroplano na pinutol sa mga palakol AkoAko, IIII at IIIIII mga segment na katumbas ng mga payoff para sa kaukulang mga diskarte A 1, A 2 at A 3 at diskarte B j. Ang pagkakaroon ng gayon naitayo ang lahat ng mga diskarte ng kaaway, nakakakuha kami ng isang pamilya ng mga eroplano sa tatsulok na A 1, A 2 at A 3 (Larawan 5.2). Para sa pamilyang ito, maaari ka ring magtayo ng isang mas mababang hangganan ng payoff, tulad ng ginawa namin sa kaso ng 2xn, at matagpuan sa hangganan na ito ng isang puntong N na maximum na taas sa itaas ng eroplano hoy... Ang taas na ito ay ang gastos ng laro ν.

Ang mga dalas p 1, p 2, p 3 ng mga diskarte A 1, A 2 at A 3 sa pinakamainam na diskarte SA * ay matutukoy ng mga coordinate (x, y) ng point N, lalo: p 2 \u003d x, p 3 \u003d y, p 1 \u003d 1 - p 2 - p 3. Gayunpaman, tulad ng isang geometric na konstruksyon, kahit na para sa 3xn case, ay hindi madaling ipatupad at nangangailangan ng maraming oras at pagsisikap ng imahinasyon. Sa pangkalahatang kaso ng laro, gayunpaman, inililipat ito sa isang puwang ng m-dimensional at nawawala ang lahat ng kaliwanagan, bagaman ang paggamit ng geometric terminology sa isang bilang ng mga kaso ay maaaring maging kapaki-pakinabang. Kapag ang paglutas ng mga laro ng mxn, sa pagsasagawa, mas maginhawa na hindi gumamit ng mga geometriko na pagkakatulad, ngunit ang mga pamamaraan sa pagsusuri ng computational, lalo na dahil ang mga pamamaraan na ito ay ang tanging angkop para sa paglutas ng isang problema sa mga computer.

Ang lahat ng mga pamamaraan na ito ay mahalagang kumulo sa paglutas ng isang problema sa pamamagitan ng sunud-sunod na mga pagsubok, ngunit ang pag-order ng pagkakasunud-sunod ng mga pagsubok ay nagpapahintulot sa iyo na bumuo ng isang algorithm na humahantong sa isang solusyon sa pinaka matipid. Dito ay maikli naming tatahan ang isang paraan ng computational para sa paglutas ng mga laro ng mxn - ang tinatawag na "linear programming" na pamamaraan. Para sa mga ito, nagbibigay muna kami ng isang pangkalahatang pahayag ng problema ng paghahanap ng isang solusyon sa laro mxn. Hayaan ang isang laro mxn na may mga estratehiya A 1, A 2, ..., A m ng player A at n mga diskarte B 1, B 2, ..., B n ng player B ay bibigyan ng isang payoff matrix ‖a i j ‖ ay ibinigay. Kinakailangan upang maghanap ng solusyon sa laro, i.e. dalawang pinakamainam na halo-halong mga diskarte ng mga manlalaro A at B

kung saan p 1 + p 2 + ... + p m \u003d 1; q 1 + q 2 + ... + q n \u003d 1 (ang ilan sa mga bilang p i at q j ay maaaring katumbas ng zero).

Ang aming pinakamainam na diskarte S A * ay dapat magbigay sa amin ng isang kabayaran na hindi bababa sa ν para sa anumang pag-uugali ng kalaban, at isang kabayaran na katumbas ng ν para sa kanyang pinakamainam na pag-uugali (diskarte S B *). Katulad nito, ang diskarte na S B * ay dapat magbigay ng kalaban sa isang pagkawala na hindi lalampas sa ν para sa alinman sa aming pag-uugali at katumbas ng ν para sa aming pinakamainam na pag-uugali (diskarte S A *).

Sa kasong ito, ang halaga ng presyo ng laro ν ay hindi alam sa amin; ipapalagay natin na pantay ito sa ilan positibong bilang... Sa paniniwala nito, hindi namin nilalabag ang pangkalahatang pangangatuwiran; para sa 0\u003e 0, malinaw na sapat na ang lahat ng mga elemento ng matrix ‖a i j ‖ maging hindi negatibo. Ito ay palaging makakamit sa pamamagitan ng pagdaragdag sa mga elemento ‖a i j ‖ isang sapat na malaking positibong halaga L; habang ang presyo ng laro ay tataas ng Lat ang desisyon ay hindi magbabago.

Ipagpalagay na pinili namin ang aming pinakamainam na diskarte S A *. Pagkatapos ang aming average na kabayaran sa diskarte ng kalaban B j ay: a j \u003d p 1 a 1j + p 2 a 2j + ... + p m a mj. Ang aming pinakamainam na diskarte S A * ay may pag-aari na, para sa anumang pag-uugali ng kalaban, nagbibigay ito ng kabayaran na hindi bababa sa ν; samakatuwid, ang alinman sa mga bilang ng isang j ay hindi maaaring mas mababa sa ν. Nakakuha kami ng isang bilang ng mga kondisyon:

Hinahati namin ang mga hindi pagkakapareho (5.1) sa pamamagitan ng isang positibong halaga ν at magpahiwatig

Pagkatapos ang mga kondisyon (5.1) ay maaaring isulat sa form

kung saan ξ 1, ξ 2,…, ξ m ay mga di-negatibong numero. Dahil ang р 1 + p 2 + ... + p m \u003d 1, kung gayon ang dami ng ξ 1, ξ 2, ..., ay masiyahan ang kundisyon

(5.3) ξ 1 + ξ 2 + ... + ξ m \u003d 1 / ν.

Nais naming gawin ang aming garantisadong panalo hangga't maaari hangga't maaari; malinaw naman, habang tamang bahagi pagkakapantay-pantay (5.3) ay tumatagal ng isang minimum na halaga. Sa gayon, ang problema sa paghahanap ng isang solusyon sa laro ay nabawasan sa sumusunod na problema sa matematika: matukoy ang mga nonnegative na mga halaga ξ 1, ξ 2, ..., ξ m kasiya-siyang mga kondisyon (5.2) upang ang kanilang kabuuan Φ \u003d ξ 1 + ξ 2 + ... + ξ m ay minimal.

Karaniwan, kapag ang paglutas ng mga problema na nauugnay sa paghahanap ng matinding halaga (maxima at minima), ang pag-andar ay naiiba at ang mga derivatives ay pantay-pantay sa zero. Ngunit ang gayong pamamaraan ay walang silbi sa kasong ito, dahil ang pag-andar Φ, na kailangang mabawasan sa isang minimum, ay linear, at ang mga derivatives na may paggalang sa lahat ng mga argumento ay pantay sa pagkakaisa, i.e. huwag mawala kahit saan. Dahil dito, ang maximum ng pag-andar ay naabot sa isang lugar sa hangganan ng pagkakaiba-iba ng mga argumento, na natutukoy sa pamamagitan ng kahilingan ng hindi negatibiti ng mga argumento at kundisyon (5.2). Ang pamamaraan ng paghahanap ng matinding halaga sa pamamagitan ng pagkita ng kaibhan ay hindi angkop din sa mga kasong iyon kapag ang maximum ng mas mababang (o pinakamaliit sa itaas) na limitasyon ng kabayaran ay tinutukoy para sa paglutas ng laro, tulad namin, halimbawa, ay ginawa sa paglutas ng mga laro ng 2xn. Sa katunayan, ang mas mababang hangganan ay binubuo ng mga seksyon ng mga tuwid na linya, at ang maximum ay naabot hindi sa punto kung saan ang derivative ay zero (walang ganoong punto sa lahat), ngunit sa hangganan ng agwat o sa punto ng intersection ng tuwid na mga seksyon.

Upang malutas ang gayong mga problema, na karaniwang pangkaraniwan, ang isang espesyal na linear programming apparatus ay binuo sa matematika. Ang problemang pag-programming ng linear ay nakuha tulad ng mga sumusunod. Ang isang sistema ng mga linear na equation ay ibinigay:

Kinakailangan na makahanap ng mga di-katuturang mga halaga ng dami ξ 1, ξ 2, ..., ξ m kasiya-siyang mga kondisyon (5.4) at sa parehong oras na binawasan ang isang naibigay na homogenous linear function ng dami ng dami 1, ξ 2, ..., ξ m (linear form): Φ \u003d c 1 ξ 1 + c 2 ξ 2 + ... + cm ξ m

Madaling i-verify na ang problema sa itaas ng teorya ng laro ay isang espesyal na kaso ng isang linear na problema sa programming para sa c 1 \u003d c 2 \u003d ... \u003d c m \u003d 1. Sa unang sulyap, maaaring mukhang ang mga kondisyon (5.2) ay hindi katumbas ng mga kondisyon (5.4), dahil sa halip na pantay na mga palatandaan na naglalaman sila ng mga palatandaan na hindi pagkakapantay-pantay. Gayunpaman, madaling mapupuksa ang mga palatandaan ng hindi pagkakapareho sa pamamagitan ng pagpapakilala ng mga bagong kathang-isip na hindi negatibong variable na z 1, z 2, ..., z n at mga kondisyon ng pagsulat (5.2) sa anyo:

Ang form na maaaring mabawasan sa isang minimum ay Φ \u003d ξ 1 + ξ 2 + ... + ξ m. Ang linear programming apparatus ay posible upang piliin ang mga halaga ξ 1,, 2, ..., ξ m na nakakatugon sa ipinahayag na mga kinakailangan sa pamamagitan ng isang medyo maliit na bilang ng mga sunud-sunod na mga sample. Para sa higit na kalinawan, narito ipapakita namin ang paggamit ng aparatong ito nang direkta sa materyal ng paglutas ng mga tukoy na laro.

Halimbawa 1. Kinakailangan upang maghanap ng solusyon sa larong 3 × 3 na ibinigay sa Halimbawa 2 § 1, kasama ang matrix:

Upang gawin ang lahat ng ij non-negatibo, idagdag sa lahat ng mga elemento ng matrix L \u003d 5. Nakukuha namin ang matrix:

Sa kasong ito, ang presyo ng laro ay tataas ng 5, at ang desisyon ay hindi magbabago.

Ipaalam sa amin na tukuyin ang pinakamainam na diskarte S A *. Ang mga kondisyon (5.2) ay may form:

kung saan ξ 1 \u003d p 1 / ν, ξ 2 \u003d p 2 / ν, ξ 3 \u003d p 3 / ν. Upang mapupuksa ang mga palatandaan ng hindi pagkakapantay-pantay, ipinakilala namin ang mga variable ng dummy z 1, z 2, z 3; ang mga kondisyon (5.6) ay isusulat sa anyo:

Ang linear form Φ ay may form: Φ \u003d ξ 1 + ξ 2 + ξ 3 at dapat gawin bilang maliit hangga't maaari. Kung ang lahat ng tatlong mga diskarte B ay "kapaki-pakinabang", pagkatapos ang lahat ng tatlong mga variable na dummy z 1, z 2, z 3 mawala (ibig sabihin, isang kabayaran na katumbas ng presyo ng laro ν ay makakamit para sa bawat diskarte B j). Ngunit wala pa rin tayong dahilan upang sabihin na ang lahat ng tatlong mga diskarte ay "kapaki-pakinabang". Upang suriin ito, susubukan naming ipahiwatig ang form Φ sa mga tuntunin ng mga variable na dummy z 1, z 2, z 3 at tingnan kung makakamit natin ang minimum ng form sa pamamagitan ng pagtatakda ng mga ito na pantay sa zero. Upang gawin ito, malulutas namin ang mga equation (5.7) na may paggalang sa mga variable ables 1, ξ 2, ξ 3 (i.e., ipinahayag namin ang ξ 1, 2, 2, 3 sa mga tuntunin ng mga dummy variable na z 1, z 2, z 3):

Pagdaragdag ng ξ 1, ξ 2, ξ 3, nakukuha namin: Φ \u003d 1/5 + z 1/20 + z 2/10 + z 3/20. Narito ang mga coefficient para sa lahat ng z ay positibo; samakatuwid, ang anumang pagtaas sa z 1, z 2, z 3 sa itaas ng zero ay maaari lamang humantong sa isang pagtaas sa form Φ, at nais naming ito ay minimal. Samakatuwid, ang mga halaga z 1, z 2, z 3 na gumagawa ng form Φ sa isang minimum ay z 1 \u003d z 2 \u003d z 3 \u003d 0. Samakatuwid, ang pinakamababang halaga ng form Φ ay: 1 / ν \u003d 1/5, kung saan ang presyo ng laro ν \u003d 5. Pagsusulat ng zero na halaga ng z 1, z 2, z 3 sa mga formula (5.8), nahanap namin: ξ 1 \u003d 1/20, ξ 2 \u003d 1/10, ξ 3 \u003d 1/20, o, pinarami ang mga ito ng ν, p 1 \u003d 1/4, p 2 \u003d 1/2, p 3 \u003d 1/4. Kaya, ang pinakamainam na diskarte A ay matatagpuan: , i.e. dapat nating isulat ang numero 1 sa isang quarter ng lahat ng mga kaso, 2 sa kalahati ng mga kaso at 3 sa natitirang quarter ng mga kaso.

Alam ang presyo ng laro ν \u003d 5, maaari na kilalang mga pamamaraan hanapin ang pinakamainam na diskarte sa kaaway ... Upang gawin ito, gagamitin namin ang aming dalawang dalawang "kapaki-pakinabang" na mga diskarte (halimbawa, A 2 at A 3) at isulat ang mga equation:

9q 1 + 11 (1-q 2 -q 1) \u003d 5,

kung saan q 1 \u003d q3 \u003d 1/4; q 2 \u003d 1/2. Ang pinakamainam na diskarte ng kaaway ay magiging pareho sa atin: ... Ngayon bumalik tayo sa orihinal na (hindi na-convert) na laro. Upang gawin ito, kinakailangan lamang na ibawas ang halaga L \u003d 5 na idinagdag sa mga elemento ng matrix mula sa presyo ng laro ν \u003d 5. Nakukuha namin ang presyo ng orihinal na laro v 0 \u003d 0. Samakatuwid, ang pinakamainam na mga diskarte ng parehong partido ay nagbibigay ng isang average na kabayaran na katumbas ng zero; ang laro ay pantay na kapaki-pakinabang o hindi kapahamakan para sa parehong partido.

Halimbawa 2. Ang Sports Club A ay may tatlong pagpipilian para sa komposisyon ng pangkat A 1, A 2 at A 3. Club B - din sa tatlong pagpipilian B 1, B 2 at B 3. Kapag nagsumite ng isang aplikasyon upang lumahok sa kumpetisyon, wala sa mga club ang nakakaalam kung aling mga pulutong ang pipiliin ng kalaban. Ang mga posibilidad ng club A nanalo sa iba't ibang mga pagpipilian ang mga lineup, na halos kilala mula sa karanasan ng mga nakaraang pagpupulong, ay ibinibigay ng matrix:

Alamin kung gaano kadalas ang mga club ay dapat i-play ang bawat koponan laban sa bawat isa upang makamit ang pinakamataas na average na bilang ng mga tagumpay.

Desisyon. Ang mas mababang presyo ng laro ay 0.4; nangungunang 0.6; naghahanap kami ng isang solusyon sa larangan ng halo-halong mga diskarte. Upang hindi makitungo sa mga praksiyon, pinarami namin ang lahat ng mga elemento ng matrix sa pamamagitan ng 10; sa kasong ito, ang presyo ng laro ay tataas ng 10 beses, at ang desisyon ay hindi magbabago. Nakukuha namin ang matris:

Ang mga kondisyon (5.5) ay may form:

at ang minimum na kondisyon Φ \u003d ξ 1 + ξ 2 + ξ 3 \u003d min.

Suriin kung ang lahat ng tatlong mga diskarte ng kalaban ay "kapaki-pakinabang". Bilang isang hipotesis, ipinapalagay muna natin na ang mga dummy variable na z 1, z 2, z 3 ay katumbas ng zero, at para sa pagpapatunay na nalutas namin ang mga equation (5.10) para sa 1, 2, 2, 3:

(5.12) 136Φ \u003d 30 + 13z 1 + 18z 2 - 51z 3

Ipinapakita ng Formula (5.12) na ang isang pagtaas sa mga variable z 1 at z 2 kumpara sa kanilang ipinapalagay na halaga ng zero ay maaari lamang dagdagan Φ, habang ang isang pagtaas sa z 3 ay maaaring bumaba Φ. Gayunpaman, ang pagtaas sa z 3 ay dapat gawin nang maingat upang ang mga halaga ng ξ 1, ξ 2, ξ 3, depende sa z 3, ay hindi maging negatibo sa kasong ito. Samakatuwid, sa kanang bahagi ng mga pagkakapantay-pantay (5.11), itinakda namin ang mga halaga ng z 1 at z 2 na katumbas ng zero, at tataas namin ang halaga z 3 sa mga pinapayagan na mga limitasyon (hanggang sa anuman sa mga halaga ng ξ 1, ξ 2, ξ 3 na mawawala). Mula sa pangalawang pagkakapantay-pantay sa (5.11) makikita na ang isang pagtaas sa z 3 ay "ligtas" para sa halaga ξ 2 - tataas lamang ito. Tulad ng para sa dami ng ξ 1 at ξ 3, narito ang isang pagtaas sa z 3 ay posible lamang hanggang sa isang tiyak na limitasyon. Ang dami ξ 1 ay nawawala sa z 3 \u003d 10/23; ang dami ξ 3 ay mawawala nang mas maaga, na nasa z 3 \u003d 1/4. Samakatuwid, ang pagbibigay sa z 3 ng pinakamataas na pinahihintulutang halaga z 3 \u003d 1/4, gagawin namin sa kasong ito zero ang halaga ng ξ 3.

Upang suriin kung ang form Φ ay nagiging isang minimum sa z 1 \u003d 0, z 2 \u003d 0, ξ 3 \u003d 0, ipinahayag namin ang mga natitirang (non-zero) variable sa mga tuntunin ng sinasabing zero z 1, z 2,. 3. Ang paglutas ng mga equation (5.10) na may kaugnayan sa ξ 1, ξ 2 at z 3, nakukuha namin:

(5.13) 32Φ \u003d 7 + Зz 1 + 4z 2 + ξ 3

Mula sa formula (5.13) makikita na ang anumang pagtaas sa z 1, z 2, ξ 3 sa itaas ng kanilang ipinapalagay na mga halaga ng zero ay maaari lamang dagdagan ang form Φ. Samakatuwid, ang solusyon sa laro ay natagpuan; ito ay tinutukoy ng mga halaga z 1 \u003d z 2 \u003d ξ 3 \u003d 0, kung saan ξ 1 \u003d 1/32, ξ 2 \u003d 3/16, z 3 \u003d 1/4. Pagsusulit sa formula (5.13), nahanap namin ang presyo ng laro ν: 32Φ \u003d 7 \u003d 32 / ν; ν \u003d 32/7. Ang aming pinakamainam na diskarte: ... Ang mga "kapaki-pakinabang" na mga diskarte (mga komposisyon A 1 at A 2) ay dapat mailapat sa mga frequency 1/7 at 6/7; komposisyon A 3 - hindi nalalapat.

Upang mahanap ang pinakamainam na diskarte ng kalaban, sa pangkalahatang kaso, magagawa mo ang sumusunod: baguhin ang tanda ng payoff sa kabaligtaran, magdagdag ng isang palaging halaga L sa mga elemento ng matrix upang gawin silang hindi negatibo, at lutasin ang problema para sa kalaban sa parehong paraan tulad ng paglutas namin para sa ating sarili. Gayunpaman, ang katotohanan na alam na natin ang presyo ng laro ν medyo pinapadali ang problema. Bilang karagdagan, sa partikular na kaso na ito, ang gawain ay karagdagang pinasimple ng katotohanan na ang dalawang "kapaki-pakinabang" na mga diskarte ng kalaban, B 1 at B 2, ay lumahok sa solusyon, dahil ang halaga ng z 3 ay hindi katumbas ng zero, at samakatuwid, sa diskarte B 3, ang presyo ng laro ay hindi naabot ... Ang pagpili ng anumang "kapaki-pakinabang" na diskarte ng player A, halimbawa A 1, ang isang tao ay maaaring makahanap ng mga frequency q 1 at q 2. Para sa mga ito isusulat namin ang equation 8q 1 + 2 (1 - q 1) \u003d 32/7, kung saan ang q 1 \u003d 3/7, q 2 \u003d 4/7; ang pinakamainam na diskarte ng kaaway ay: , i.e. ang kaaway ay hindi dapat gumamit ng komposisyon B 3, at ang mga komposisyon B 1 at B2 ay dapat gamitin gamit ang mga frequency 3/7 at 4/7.

Pagbabalik sa orihinal na matris, tinutukoy namin ang totoong halaga ng laro ν 0 \u003d 32/7: 10 \u003d 0.457. Nangangahulugan ito na para sa malaking numero mga pulong Ang bilang ng mga tagumpay para sa Club A ay 0.457 sa lahat ng mga pagpupulong.

§ 6. Tinatayang mga pamamaraan para sa paglutas ng mga laro

Kadalasan, sa mga praktikal na problema, hindi na kailangang makahanap ng eksaktong solusyon sa laro; sapat na upang makahanap ng isang tinatayang solusyon na nagbibigay ng isang average na bayad na malapit sa presyo ng laro. Ang isang tinatayang kaalaman sa halaga ng laro ν ay maaaring makuha mula sa isang simpleng pagsusuri ng matrix at ang pagpapasiya ng mas mababang (α) at \u200b\u200bitaas (β) na mga presyo ng laro. Kung malapit ang α at β, halos hindi na kailangang maghanap para sa isang eksaktong solusyon, ngunit magiging sapat na upang pumili ng mga dalisay na diskarte sa minimax. Sa mga kaso kung saan ang α at β ay hindi malapit, makakakuha kami ng isang praktikal na solusyon gamit ang mga de-numerong pamamaraan para sa paglutas ng mga laro, mula sa kung saan namin maikli ang pag-highlight ng paraan ng pag-ulit.

Ang ideya sa likod ng pamamaraan ng pag-iiba ay ang mga sumusunod. Ang isang "naisip na eksperimento" ay nilalaro kung saan ginagamit ng mga kalaban A at B ang kanilang mga diskarte laban sa bawat isa. Ang eksperimento ay binubuo ng isang pagkakasunud-sunod ng mga elementong laro, ang bawat isa ay mayroong matrix ng isang naibigay na laro. Nagsisimula ito sa katotohanan na kami (player A) ay pumili ng isang arbitraryo na isa sa aming mga diskarte, halimbawa A i. Tumugon ang kaaway dito sa kanyang diskarte B j, na hindi bababa sa kapaki-pakinabang para sa atin, i.e. lumiliko ang kabayaran para sa diskarte A i sa isang minimum. Tumugon kami sa paglipat na ito gamit ang aming diskarte А k, na nagbibigay ng maximum na average na kabayaran kapag ang kalaban ay gumagamit ng diskarte B j. Karagdagan - ang pagliko ng kaaway muli. Tumugon siya sa aming pares ng mga gumagalaw A i at A k sa kanyang diskarte B j, na nagbibigay sa amin ng pinakamaliit na average na kabayaran para sa dalawang diskarte na ito (A i, A k), at iba pa. Sa bawat hakbang ng proseso ng pag-iiba, ang bawat manlalaro ay tumugon sa anumang paglipat ng iba pang manlalaro na may kanyang diskarte na pinakamainam na kamag-anak sa lahat ng kanyang nakaraang mga paggalaw, na itinuturing bilang ilang uri ng halo-halong diskarte, kung saan ang mga dalisay na estratehiya ay iniharap sa mga proporsyon na naaayon sa dalas ng kanilang aplikasyon.

Ang pamamaraang ito ay, tulad nito, isang modelo ng tunay na praktikal na "pagsasanay" ng mga manlalaro, kapag ang bawat isa sa kanila ay sumusuri sa pag-uugali ng kalaban sa pamamagitan ng karanasan at sinusubukan upang tumugon dito sa paraang kapaki-pakinabang para sa kanyang sarili. Kung ang imitasyong ito sa proseso ng pag-aaral ay patuloy na matagal, kung gayon ang average na kabayaran sa bawat isang pares ng mga gumagalaw (elementarya) ay may posibilidad na ang presyo ng laro, at ang mga frequency p 1 ... p m; q 1 ... q n, na kinakaharap ng mga diskarte ng mga manlalaro sa rally na ito, ay lalapit sa mga dalas na matukoy ang pinakamainam na mga diskarte. Ang mga pagkalkula ay nagpapakita na ang pag-uugnay ng pamamaraan ay napakabagal, ngunit hindi ito isang balakid para sa mga makina ng pagkalkula ng high-speed.

Isalarawan natin ang aplikasyon ng pamamaga ng pamamaga gamit ang halimbawa ng larong 3 × 3 na lutasin sa Halimbawa 2 ng nakaraang seksyon. Ang laro ay ibinigay ng matrix:

Ipinapakita ng talahanayan 6.1 ang unang 18 mga hakbang ng proseso ng iterative. Ang unang haligi ay naglalaman ng bilang ng elementong laro (isang pares ng mga gumagalaw) n; sa pangalawa - bilang ako ang napiling diskarte ng player A; sa susunod na tatlo - "naipon na panalo" para sa una n mga laro na may mga diskarte sa kaaway B 1, B 2, B 3. Ang pinakamaliit sa mga halagang ito ay may salungguhit. Susunod na darating ang bilang j ang diskarte na pinili ng kaaway, at, nang naaayon, ang naipon na pakinabang para sa n mga laro na may mga diskarte A 1, A 2, A 3 ng mga halagang ito, ang maximum ay may salungguhit mula sa itaas. Ang mga may salungguhit na halaga ay tumutukoy sa pagpili ng diskarte sa pagtugon ng iba pang player. Ang sumusunod na mga graph sunud-sunod na nagpapakita: ang minimum na average na payoff ν, katumbas ng minimum na naipon na kabayaran na nahahati sa bilang ng mga laro n; maximum na average winnings na katumbas ng maximum na naipon na panalo na hinati ng n, at ang kanilang aritmetika ay nangangahulugan na ν * \u003d (ν +) / 2. Kapag tumataas n lahat ng tatlong dami ng ν, at ν * ay lalapit sa presyo ng laro ν, ngunit ang halaga ν * ay natural na lapitan ito nang medyo mas mabilis.

Talahanayan 6.1.

Tulad ng nakikita mo mula sa halimbawa, ang pagsasama-sama ng mga iterasyon ay napakabagal, ngunit gayunpaman, kahit na ang isang maliit na pagkalkula ay posible upang makahanap ng isang tinatayang halaga ng presyo ng laro at ihayag ang paglaganap ng mga "kapaki-pakinabang" na mga diskarte. Kapag gumagamit ng mga pagkalkula ng mga makina, ang halaga ng pamamaraan ay tumaas nang malaki. Ang bentahe ng pamamaga ng iterative para sa paglutas ng mga laro ay ang dami at pagiging kumplikado ng mga pagkalkula ay nadaragdagan nang mahina habang tumataas ang bilang ng mga diskarte. m at n.

§ 7. Mga pamamaraan para sa paglutas ng ilang mga walang katapusang laro

Ang isang walang katapusang laro ay isang laro kung saan hindi bababa sa isang panig ay may isang walang katapusang bilang ng mga diskarte. Ang mga pangkalahatang pamamaraan para sa paglutas ng nasabing mga laro ay hindi pa sapat na binuo. Gayunpaman, para sa pagsasanay, ang ilang mga espesyal na kaso ay maaaring maging interesado, na umamin sa isang medyo simpleng solusyon. Isaalang-alang ang laro ng dalawang kalaban A at B, ang bawat isa ay mayroong isang walang hanggan (hindi mabilang) na hanay ng mga diskarte; ang mga diskarte na ito para sa manlalaro A tumutugma sa magkakaibang kahulugan patuloy na pagbabago ng parameter x, at para sa В - parameter sa... Sa kasong ito, sa halip na matris ‖a ij ‖, ang laro ay tinukoy ng ilang pag-andar ng dalawang patuloy na magkakaibang mga argumento isang (x, y), na tatawagin namin ang payoff function (tandaan na ang pagpapaandar mismo isang (x, y) hindi kailangang maging tuluy-tuloy). Win function isang (x, y) maaaring kinakatawan geometrically ng ilang mga ibabaw isang (x, y) sa lugar ng pagbabago ng mga argumento (x, y) (fig. 7.1)

Pagtatasa ng payoff function isang (x, y) ay ginanap sa katulad na pagsusuri ng pagbabayad ng matrix. Una, ang mas mababang presyo ng laro α ay matatagpuan; para dito natutukoy para sa bawat isa x minimum na pag-andar isang (x, y) para sa lahat sa:, pagkatapos ay ang maximum ng mga halagang ito ay hinanap para sa lahat x (maximin):

Ang itaas na presyo ng laro (minimax) ay natutukoy sa parehong paraan:

Isaalang-alang ang kaso kapag α \u003d β. Dahil ang presyo ng laro ν ay palaging sa pagitan ng α at β, ang kanilang kabuuang halaga ay ν. Ang pagkakapantay-pantay α \u003d β ay nangangahulugang ang ibabaw isang (x, y) ay may isang saddle point, i.e., isang punto sa mga coordinate x 0, y 0, kung saan isang (x, y) sabay-sabay minimal sa sa at maximum x (fig. 7.2).

Halaga isang (x, y) sa puntong ito ay ang presyo ng laro ν: ν \u003d isang (x 0, y 0). Ang pagkakaroon ng isang punong puntong nangangahulugan na ang walang katapusang larong ito ay may purong solusyon sa diskarte; x 0, y 0 kumakatawan sa pinakamainam na dalisay na estratehiya A at B. Sa pangkalahatang kaso, kapag α ≠ β, ang laro ay maaaring magkaroon ng solusyon lamang sa larangan ng pinaghalong mga diskarte (marahil hindi lamang ang isa). Ang halo-halong diskarte para sa walang katapusang mga laro mayroong ilang posibilidad na pamamahagi para sa mga diskarte x at saitinuturing bilang random variable. Ang pamamahagi na ito ay maaaring maging tuluy-tuloy at natutukoy ng mga density f 1 (x) at f 2 (y); maaaring maging discrete, kung saan ang pinakamainam na mga diskarte ay binubuo ng isang hanay ng mga hiwalay na dalisay na diskarte na pinili kasama ng ilang mga nonzero probabilidad.

Sa kaso kung saan ang walang katapusang laro ay walang saddle point, maaaring mabigyan ng isang visual na geometric na interpretasyon ng mas mababa at itaas na mga presyo ng laro. Isaalang-alang ang isang walang hanggan laro na may isang payoff function isang (x, y)at mga diskarte x, ypagpupuno ng patuloy na mga segment ng linya (x 1, x 2) at (y 1, y 2)... Upang matukoy ang mas mababang presyo ng laro α, kailangan mong "tumingin" sa ibabaw isang (x, y) mula sa axis sa, i.e. isulong ito sa isang eroplano xOa (fig. 7.3). Nakakakuha kami ng isang tiyak na pigura na nakatali mula sa mga gilid ng mga tuwid na linya x \u003d x 1 at x \u003d x 2, at mula sa itaas at ibaba ng mga kurbada K B at K N. Ang mas mababang presyo ng laro α, malinaw naman, ay walang higit pa sa maximum na ordenansa ng curve K N.

Katulad nito, upang mahanap ang itaas na presyo ng laro β, ang isa ay dapat na "tumingin" sa ibabaw isang (x, y) mula sa axis x (ibabaw ng proyekto papunta sa eroplano yoa) at hanapin ang minimum na ordinate ng itaas na hangganan K Sa projection (Fig, 7.4).

Isaalang-alang ang dalawang pangunahing halimbawa ng mga walang katapusang laro.

Halimbawa 1. Ang mga manlalaro A at B bawat isa ay may isang hindi mabilang na hanay ng mga posibleng diskarte xat sa, at 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Ang pagpapaandar ng payoff para sa isang ay ibinigay sa pamamagitan ng expression a (x, y) - (x - y) 2. Maghanap ng isang solusyon sa laro.

Ang solusyon, ang Surface a (x, y) ay isang parabolic cylinder (Fig. 7.5) at walang point sad. Alamin ang mas mababang presyo ng laro; halata sa lahat x; samakatuwid \u003d 0. Tukuyin natin ang itaas na presyo ng laro. Para sa mga ito, nakita namin para sa isang nakapirming sa

Sa kasong ito, ang maximum ay palaging naabot sa hangganan ng agwat (sa x \u003d 0 o x \u003d 1), i.e. ito ay katumbas ng mga halaga sa 2; (1 - y) 2, na kung saan ay mas malaki. Iguhit natin ang mga graph ng mga pagpapaandar na ito (Fig. 7.6), i.e. projection sa ibabaw isang (x, y) sa eroplano yoa... Ang naka-bold na linya sa Fig. Ipinapakita ng 7.6 ang pag-andar. Malinaw, ang pinakamababang halaga nito ay naabot sa y \u003d 1/2 at katumbas ng 1/4. Samakatuwid, ang pinakamataas na presyo ng laro ay β \u003d 1/4. Sa kasong ito, ang pang-itaas na presyo ng laro ay nagkakasabay sa presyo ng laro ν. Sa katunayan, ang player A ay maaaring mag-aplay ng isang halo-halong diskarte S A \u003d , kung saan ang mga matinding halaga x \u003d 0 at x \u003d 1 ay pumasok sa magkatulad na mga dalas; pagkatapos para sa anumang diskarte ng manlalaro B ang average na pagbabayad ng player A ay magiging katumbas ng: ½y 2 + ½ (1 - y) 2. Madaling i-verify na ang halagang ito para sa anumang mga halaga sa sa pagitan ng 0 at 1 ay may halaga na hindi mas mababa sa ¼: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Kaya, ang player A sa pamamagitan ng paggamit ng halo-halong diskarte na ito ay maaaring garantiya sa kanyang sarili ng isang kabayaran na katumbas ng itaas na presyo ng laro; dahil ang presyo ng laro ay hindi maaaring higit pa sa itaas na presyo, kung gayon ang diskarte na ito S Isang optimal: S A \u003d S A *.

Ito ay nananatiling upang mahanap ang pinakamainam na diskarte ng player B. Malinaw, kung ang presyo ng laro ν ay katumbas ng pinakamataas na presyo ng laro β, kung gayon ang pinakamainam na diskarte ng player B ay palaging ang kanyang dalisay na diskarte sa minimax, na ginagarantiyahan sa kanya ang itaas na presyo ng laro. Sa kasong ito, ang ganitong diskarte ay y 0 \u003d ½. Sa katunayan, sa diskarte na ito, kahit na ano ang gawin ng player A, ang kanyang kabayaran ay hindi magiging mas malaki kaysa sa ¼. Sinusundan ito mula sa halata na hindi pagkakapareho (x - ½) 2 \u003d x (x –1) + ¼ ≤ ¼

Halimbawa 2. Ang Side A ("kami") ay nagpaputok sa sasakyang panghimpapawid ng kaaway B. Upang maiwasan ang pag-shelling, ang kaaway ay maaaring mapaglalangan ng ilang labis na karga sa, kung saan siya, sa kanyang pagpapasya, ay maaaring maglakip ng mga halaga mula sa sa \u003d 0 (tuwid na paggalaw) sa sa = sa max (paglipad sa isang bilog na pinakamataas na kurbada). Ipinapalagay namin sa max yunit ng pagsukat, i.e. ilagay sa max \u003d 1. Sa paglaban sa kaaway, maaari naming gamitin ang mga aparato ng paningin batay sa isa o isa pang hypothesis tungkol sa paggalaw ng target sa panahon ng paglipad ng projectile. Sobrang karga x sa ganitong pagmamaniobra ng hypothetical, maaari itong ipagpalagay na maging pantay sa anumang halaga mula 0 hanggang 1. Ang aming gawain ay pindutin ang kaaway; ang gawain ng kaaway ay upang manatiling hindi maapektuhan. Ang posibilidad ng hit ng data x at sa ay tinatayang ipinahayag ng pormula: a (x, y) \u003d , Saan sa - Sobra na inilapat ng kaaway; x - labis na karga, isinasaalang-alang sa paningin. Kinakailangan upang matukoy ang pinakamainam na diskarte ng parehong partido.

Desisyon. Malinaw, ang solusyon ng laro ay hindi nagbabago kung nagtakda tayo ng p \u003d 1. Ang pagpapaandar ng payoff isang (x, y) na inilalarawan ng ibabaw na ipinakita sa Fig. 7.7.

Ito ay isang cylindrical na ibabaw na ang mga generatrice ay kahanay sa bisector ng anggulo ng coordinate hoy, at ang seksyon ng isang eroplano na patayo sa generatrix ay isang curve ng uri ng isang normal na curve ng pamamahagi. Gamit ang geometric na interpretasyon ng mas mababa at itaas na mga presyo ng laro na iminungkahi sa itaas, nahanap namin ang β \u003d 1 (Larawan 7.8) at (Larawan 7.9). Ang laro ay walang point saddle; ang solusyon ay dapat hinahangad sa lugar ng mga halo-halong mga diskarte. Ang problema ay medyo katulad ng problema sa nakaraang halimbawa. Sa katunayan, para sa maliit na halaga k ang function ay kumikilos tulad ng isang function - (x - y) 2, at malulutas ang laro kung ang mga tungkulin ng mga manlalaro A at B ay nabago sa solusyon ng nakaraang halimbawa; mga. ang aming pinakamainam na diskarte ay ang dalisay na diskarte x \u003d 1/2, at ang pinakamainam na diskarte ng kalaban SB \u003d ay ilalapat ang matinding diskarte y \u003d 0 at y \u003d 1 na may parehong mga frequency.Ito ay nangangahulugan na sa lahat ng mga kaso dapat nating gamitin ang crosshair, dinisenyo para sa isang labis na karga x \u003d 1/2, at ang kaaway ay hindi dapat gumamit ng isang mapaglalangan sa kalahati ng lahat ng mga kaso, at sa kalahati - ang maximum na posibleng maneuver.

Fig. 7.8 Fig. 7.9.

Madaling patunayan na ang solusyon na ito ay magiging wasto para sa mga halaga k ≤ 2. Sa katunayan, ang average na kabayaran para sa diskarte ng kalaban S B \u003d at para sa aming diskarte x ipinahayag ng pagpapaandar , na para sa mga halaga k ≤ 2 ay may isang maximum sa х \u003d 1/2, katumbas ng mas mababang presyo ng laro α. Samakatuwid, ang application ng diskarte S B ginagarantiyahan ang kalaban ng isang pagkawala na hindi lalampas sa α, kung saan malinaw na ang α - ang mas mababang presyo ng laro - ay ang presyo ng laro ν.

Para sa k\u003e 2, ang pagpapaandar ng isang (x) ay may dalawang maxima (Fig. 7.10), na matatagpuan symmetrically na may paggalang sa x \u003d 1/2 sa mga puntong x 0 at 1 - x 0, at ang halaga ng x 0 ay nakasalalay sa k.

Malinaw, para sa k \u003d 2 x 0 \u003d 1 - x 0 \u003d ½; kapag tumataas k puntos x 0 at 1 - x 0 na lumipat, papalapit sa mga matinding puntos (0 at 1). Samakatuwid, ang desisyon ng laro ay depende sa k. Itakda natin ang isang tukoy na halaga para sa k, halimbawa k \u003d 3, at makahanap ng solusyon sa laro; para dito tinukoy namin ang abscissa x 0 ng maximum ng curve a (x). Paghahambing sa zero ang derivative ng function a (x), nagsusulat kami ng isang equation upang matukoy ang x 0:

Ang equation na ito ay may tatlong mga ugat: x \u003d 1/2 (kung saan naabot ang minimum) at x 0, 1 - x 0, kung saan naabot ang maximum. Paglutas ng equation nang ayon sa bilang, nahanap namin ang humigit-kumulang na x 0 ≈ 0.07; 1 - x 0 ≈ 0.93.

Patunayan natin na ang solusyon sa laro sa kasong ito ay ang mga sumusunod na pares ng mga diskarte:

Sa aming diskarte at diskarte ng kalaban sa ang average payoff ay

Hanapin ang minimum ng isang 1 (y) sa 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Pagtatakda ng y \u003d 1/2, nakukuha namin

na higit pa sa isang 1 (0); samakatuwid, ang presyo ng laro ay hindi mas mababa sa isang 1 (0):

Ngayon sabihin natin na ginagamit ng kalaban ang estratehiya S B *, at ginagamit namin ang diskarte x. Pagkatapos ang average payoff ay

Ngunit pinili namin ang x 0 tumpak upang sa x \u003d x 0 ang maximum ng pagpapahayag (7.2) ay naabot; kaya,

mga. ang kalaban, gamit ang diskarte na S B *, ay maaaring maiwasan ang pagkawala ng mas malaki kaysa sa 0.530; samakatuwid, ang ν \u003d 0.530 ay ang presyo ng laro, at ang mga diskarte na S A * at S B * ay nagbibigay ng solusyon. Nangangahulugan ito na dapat nating gamitin ang mga tanawin na may x \u003d 0.07 at x \u003d 0.93 na may parehong dalas, at ang kaaway ay hindi dapat mapaglalangan na may parehong dalas at mapaglalangan na may maximum na labis na karga.

Tandaan na ang payoff ν \u003d 0.530 ay kapansin-pansin na mas malaki kaysa sa mas mababang presyo ng laro , na maibigay namin sa aming sarili sa pamamagitan ng paglalapat ng aming pinakamataas na diskarte x 0 \u003d 1/2.

Isa sa praktikal na paraan ang paglutas ng mga walang katapusang laro ay ang kanilang tinatayang pagbawas sa mga hangganan. Sa kasong ito, ang isang buong hanay ng mga posibleng mga diskarte para sa bawat manlalaro ay kombinasyon ng kombinasyon sa isang diskarte. Sa ganitong paraan, siyempre, isang tinatayang solusyon lamang sa laro ang maaaring makuha, ngunit sa karamihan ng mga kaso ay hindi kinakailangan ang isang eksaktong solusyon.

Gayunpaman, dapat tandaan na kapag inilalapat ang diskarteng ito, ang mga solusyon sa larangan ng halo-halong mga diskarte ay maaaring lumitaw kahit na sa mga kaso kung ang solusyon ng orihinal na walang hanggan na laro ay posible sa mga dalisay na estratehiya, i.e. kapag ang walang hanggan laro ay may puntong punla. Kung, sa pamamagitan ng pagbabawas ng isang walang hanggan na laro sa isang may hangganan, nakuha ang isang halo-halong solusyon, na kasama ang dalawang katabing "kapaki-pakinabang" na mga diskarte, pagkatapos ay makatuwiran na subukan na mag-aplay ng isang namamagitan na dalisay na diskarte ng orihinal na walang katapusan na laro sa pagitan nila.

Sa konklusyon, napapansin natin na ang walang katapusan na mga laro, hindi katulad ng mga hangganan, ay maaaring walang solusyon. Bigyan tayo ng isang halimbawa ng isang walang katapusang laro na walang solusyon. Dalawang mga manlalaro ang pinangalanan ang bawat integer. Pinangalanan higit pa natatanggap mula sa iba pang 1 ruble. Kung ang parehong tumawag ng parehong numero, ang laro ay nagtatapos sa isang mabubunot. Ang laro ay malinaw na walang solusyon. Gayunpaman, may mga klase ng mga walang hanggan na laro kung saan tiyak na umiiral ang isang solusyon.

© 2020 skudelnica.ru - Pag-ibig, pagtataksil, sikolohiya, diborsyo, damdamin, pag-aaway