Dhana ya mifano ya mchezo. Matrix Matangazo

nyumbani / Kudanganya mume

Fikiria mchezo wa mwisho wa jozi. Hebu mchezaji A ina T mikakati ya kibinafsi, ambayo tutateua

Hebu mchezaji V kuna NS mikakati ya kibinafsi, tutayateua. Wanasema kwamba mchezo una mwelekeo T NS NS.

Kama matokeo ya chaguo na wachezaji wa mikakati yoyote, matokeo ya mchezo yameamuliwa kipekee, i.e. faida a;. mchezaji A(chanya au hasi) na kupoteza (-ah) mchezaji V. Tuseme maadili a .. inayojulikana kwa mikakati yoyote (A:, B;.). Matrix P =(a ..), i = = 1, 2, ..., m j = 1, 2, ..., NS, mambo ambayo ni ushindi unaolingana na mikakati A. na Bj, inaitwa tumbo la malipo, au tumbo la mchezo. Fomu ya jumla tumbo kama hiyo imewasilishwa kwenye jedwali. 12.1. Safu za meza hii zinahusiana na mikakati ya mchezaji A, na safu ni za mikakati ya mchezaji V.

Jedwali 12.1

Wacha tuunde matrix ya malipo kwa mchezo unaofuata.

12.1. Tafuta mchezo.

Mchezaji A anaweza kujificha katika moja ya makao mawili (mimi na II); mchezaji V kutafuta mchezaji A, na akiipata, anapata faini ya tundu 1. vitengo kutoka A, vinginevyo hulipa mchezaji A Siku 1 vitengo Ni muhimu kujenga tumbo la malipo ya mchezo.

Uamuzi na. Ili kukusanya matrix ya malipo, unapaswa kuchambua tabia ya kila mmoja wa wachezaji. Mchezaji A tunaweza kujificha katika makao I - tunaashiria mkakati huu kwa A v ama katika kuba II - mkakati A. g Mchezaji V anaweza kutafuta mchezaji wa kwanza katika mkakati wa makazi I - mkakati V(au katika vault II - mkakati V.,. Ikiwa mchezaji A iko katika makazi ya mimi na hapo hugunduliwa na mchezaji V, hizo. mikakati kadhaa hufanywa ν V{), basi mchezaji A analipa faini, i.e. a n = -1. Vivyo hivyo, tunapata a. n = -1 (A 2, V.,). Ni dhahiri kwamba mikakati (A, V.,) na (A2, / 1,) mpe mchezaji A malipo ni 1, kwa hivyo a NS = a. n = I. Kwa hivyo, kwa mchezo "utaftaji" wa saizi 2x2, tunapata matrix ya malipo:

Fikiria mchezo T NS NS na tumbo P = a j) , i = 1,2, ..., τη; j= 1, 2, ..., na ufafanue mkakati bora A katika A v .., A t. Kuchagua mkakati A jy mchezaji A lazima kutarajia kwamba mchezaji V itaijibu kwa moja ya mikakati V., ambayo faida kwa mchezaji A ndogo (mchezaji V inatafuta "kumdhuru" mchezaji A).

Wacha tuashiria kwa a; ujira mdogo wa mchezaji A wakati wa kuchagua mkakati L; kwa mikakati yote inayowezekana ya wachezaji V(nambari ndogo zaidi ndani mstari wa th tumbo la malipo), i.e.

Kati ya nambari zote a (r = 1,2, ..., T) chagua kubwa zaidi: Wacha tuite lakini chini ya mchezo, au malipo ya juu (kiwango cha juu). ni malipo ya uhakika ya mchezaji A kwa mkakati wowote wa mchezaji B. Kwa hivyo,

(12.2)

Mkakati unaolingana na kiwango cha juu huitwa mkakati wa kiwango cha juu. Mchezaji V nia ya kupunguza ushindi wa mchezaji A; kuchagua mkakati V., inachukua kuzingatia faida ya juu inayowezekana kwa A. Tunaashiria

Miongoni mwa nambari zote β. chagua ndogo zaidi

na piga simu β bei ya juu ya mchezo, au kushinda minimax (minimax). ni uhakika wa kupoteza mchezaji B. Kwa hivyo,

(12.4)

Mkakati unaolingana na minimax unaitwa mkakati mdogo.

Kanuni inayoelekeza kwa wachezaji uchaguzi wa mikakati ya "makini" zaidi na mikakati ya juu inaitwa kanuni dakika ndogo. Kanuni hii inafuata kutoka kwa dhana inayofaa kwamba kila mchezaji anatafuta kufikia lengo kinyume na lile la mpinzani. Wacha tuamua bei za chini na za juu za mchezo na mikakati inayofanana katika Tatizo 12.1. Fikiria tumbo la malipo

kutoka kwa shida 12.1. Wakati wa kuchagua mkakati Л, (safu ya kwanza ya tumbo), malipo ya chini ni sawa na, = min (-l; 1) = -1 na inalingana na mkakati β1 wa mchezaji V. Wakati wa kuchagua mkakati L 2 (safu ya pili ya tumbo) malipo ya chini ni a 2 = min (l; -1) = -1, inafanikiwa na mkakati V.,.

Kujihakikishia kiwango cha juu kushinda kwa mkakati wowote wa mchezaji V, i.e. bei ya chini ya mchezo a = max (a, a2) = = max (-l; -1) = -1, mchezaji A unaweza kuchagua mkakati wowote: Aj au A 2, i.e. mikakati yake yoyote ni maximinnoi.

Kuchagua mkakati B, (safu ya 1), mchezaji V anaelewa kuwa mchezaji A atajibu na mkakati A 2 kuongeza faida yako (hasara V). Kwa hivyo, upotezaji mkubwa wa mchezaji V wakati anachagua mkakati B, ni sawa na β, = angalia (-1; 1) = 1.

Vivyo hivyo, upotezaji mkubwa wa mchezaji B (faida A wakati anachagua mkakati B2 (safu 2) ni β2 = max (l; -1) = 1.

Kwa hivyo, kwa mkakati wowote wa mchezaji A hasara ya chini iliyohakikishiwa ya mchezaji B ni β = πιίη (β1, β2) = min (l; 1) = 1 - bei ya juu ya mchezo.

Mkakati wowote wa mchezaji B ni minimax. Kuongezea meza. 12.1 kwa kamba β; na safu a;, tunapata meza. 12.2. Katika makutano ya safu na nguzo za ziada, tutaandika bei za juu na za chini za mchezo.

Jedwali 12.2

Katika Shida 12.1, iliyozingatiwa hapo juu, bei za juu na za chini za mchezo ni tofauti: f β.

Ikiwa bei ya juu na ya chini ya mchezo inafanana, basi jumla ya thamani juu na bei ya chini ya mchezo α = β = υ inaitwa bei safi ya mchezo, au kwa gharama ya mchezo. Mikakati ya Minimax inayolingana na bei ya mchezo ni mikakati bora, na jumla yao - suluhisho mojawapo, au uamuzi michezo. Katika kesi hii, mchezaji A hupata kiwango cha juu kilichohakikishiwa (huru na tabia ya mchezaji V) malipo υ, na mchezaji V inafanikisha kiwango cha chini kilichohakikishiwa (bila kujali tabia ya mchezaji Л) hasara υ. Inasemekana kuwa suluhisho la mchezo huo lina utulivu, hizo. ikiwa mmoja wa wachezaji anazingatia mkakati wake mzuri, basi haiwezi kuwa na faida kwa mwingine kuachana na mkakati wake mzuri.

Jozi mikakati safi A. na V. hutoa suluhisho bora kwa mchezo ikiwa na ikiwa tu kitu kinachofanana rt wakati huo huo ni kubwa zaidi katika safu yake na ndogo zaidi katika safu yake. Hali kama hiyo, ikiwa ipo, inaitwa hatua ya tandiko(sawa na uso wa tandiko, ambao huzunguka juu katika mwelekeo mmoja na kushuka kwa upande mwingine).

Tunaashiria A * na V *- mikakati safi ambayo inafanikisha suluhisho la mchezo katika shida ya kitandani. Wacha tuanzishe kazi ya malipo ya mchezaji wa kwanza kwenye kila mikakati: P (A:, V-) = na saa... Halafu, kutoka kwa hali ya usawa katika hatua ya saruji, ukosefu wa usawa mara mbili unashikilia: P (Aj, B *)<Р(А*, В*)<Р(А", В ), ambayo ni kweli kwa kila mtu i = 1, 2, ..., m; j = 1, 2, ..., NS. Hakika, uchaguzi wa mkakati A* mchezaji wa kwanza na mkakati mzuri V " mchezaji wa pili anaongeza ushindi wa chini kabisa: P (A*, B")> P (A G V "), na uchaguzi wa mkakati B " mchezaji wa pili na mkakati mzuri wa wa kwanza hupunguza upotezaji wa juu: P (D, V *)<Р(А", В).

12.2. Tambua bei ya chini na ya juu ya mchezo uliotolewa na tumbo la malipo

Je! Mchezo una hatua ya tandiko?

Jedwali 12. 3

Suluhisho. Ni rahisi kutekeleza mahesabu yote kwenye meza, ambayo, pamoja na tumbo R, ilianzisha safu a; na kamba)

© 2021 skudelnica.ru - Upendo, usaliti, saikolojia, talaka, hisia, ugomvi