Pelimallien käsite. Maksumatriisi

Harkitse rajallista paripeliä. Anna pelaaja MUTTA on t henkilökohtaisia strategioita, joita me tarkoitamme

Anna pelaaja AT saatavilla P henkilökohtaisia strategioita, merkitään ne. He sanovat, että pelissä on ulottuvuus t X P.

Sen seurauksena, että pelaajat valitsevat minkä tahansa strategiaparin, pelin lopputulos määräytyy yksiselitteisesti, ts. voittaa a;. pelaaja MUTTA(positiivinen tai negatiivinen) ja häviäminen (-ay) pelaaja AT. Oletetaan, että arvot a.. tunnetaan mistä tahansa strategiaparista (A:, B;.). Matriisi P =(a..), minä == 1, 2, ..., mj = 1, 2, ..., P, jonka elementit ovat strategioita vastaavat voitot MUTTA. ja bj, nimeltään maksumatriisi, tai pelin matriisi. Yleinen muoto tällainen matriisi on esitetty taulukossa. 12.1. Tämän taulukon rivit vastaavat pelaajan strategioita MUTTA, ja sarakkeet ovat pelaajan strategioita AT.

Taulukko 12.1

Tehdään voittomatriisi seuraavaa peliä varten.

12.1. Etsi peli.

Pelaaja MUTTA voi piiloutua toiseen kahdesta turvakodista (I ja II); pelaaja AT etsii pelaajaa MUTTA, ja jos hän löytää, hän saa 1 den sakon. yksiköitä alkaen MUTTA, muuten maksaa pelaajalle MUTTA 1 päivä yksiköitä On tarpeen rakentaa pelin voittomatriisi.

D e s h e n i s. Voittomatriisin laatimiseksi on tarpeen analysoida jokaisen pelaajan käyttäytyminen. Pelaaja MUTTA voi piiloutua suojaan I – merkitsemme tätä strategiaa A v joko suojassa II - strategia MUTTA. g Soitin AT voi etsiä ensimmäistä pelaajaa suoja I -strategiasta AT(tai suojassa II - strategia AT.,. Jos pelaaja MUTTA on piilopaikassa I ja pelaaja löytää hänet sieltä AT, nuo. pari strategiaa ollaan toteuttamassa (Α ν AT{), sitten pelaaja MUTTA maksaa sakkoja, ts. a n = -1. Samoin saamme a. n = -1 (MUTTA 2, AT.,). On selvää, että strategiat (A, AT.,) ja (R2, /1,) antavat pelaajalle MUTTA voitto 1, joten a P = a. n = I. Täten pelin "hakulle", jonka koko on 2x2, saamme voittomatriisin:

Harkitse peliä t X P matriisin kanssa P = a j) , i = 1,2, ..., τη; j= 1, 2, ... ja ja määritä strategioista paras MUTTA klo A v..., MUTTA m. Strategian valinta A jy pelaaja MUTTA pitäisi odottaa pelaajaa AT vastaa siihen jollakin strategioista AT., josta pelaaja saa voittoa MUTTA minimaalinen (soitin AT yrittää "vahingottaa" pelaajaa MUTTA).

Merkitse a; pelaajan pienin voitto MUTTA kun hän valitsee strategian L; kaikille mahdollisille pelaajastrategioille AT(pienin luku i. rivi voittomatriisi), ts.

Kaikkien lukujen joukossa a (r = 1,2,..., t) valitse suurin: . Soitetaan ja pelin alhaisempi hinta, tai suurin voitto (maximin). Tämä on Pelaajan A taattu voitto mistä tahansa pelaajan B strategiasta. Siten,

(12.2)

Maksimia vastaavaa strategiaa kutsutaan maksimistrategia. Pelaaja AT kiinnostunut vähentämään pelaajan voittoa MUTTA; strategian valinta AT., siinä otetaan huomioon suurin mahdollinen voitto MUTTA. Merkitse

Kaikkien lukujen joukossa β. valitse pienin

ja soita β pelin huippuhinta, tai minimax voitto (minimax). Tämä on pelaaja B:n taattu menetys. Siten,

(12.4)

Minimax-strategiaa kutsutaan minimax-strategia.

Periaate, joka sanelee pelaajille "varovaisimman" minimax- ja maximin-strategioiden valinnan, kutsutaan periaatteeksi. minimimax. Tämä periaate seuraa järkevästä oletuksesta, että jokainen pelaaja pyrkii saavuttamaan vastustajan päinvastaisen tavoitteen. Määritetään pelin alempi ja ylempi hinta sekä vastaavat strategiat tehtävässä 12.1. Harkitse voittomatriisia

ongelmasta 12.1. Kun valitaan strategia A, (matriisin ensimmäinen rivi), minimivoitto on yhtä suuri kuin a, =min(-l; 1) = -1 ja vastaa pelaajan strategiaa β1 AT. Kun valitset strategiaa L 2 (matriisin toinen rivi) minimivoitto on a 2 = min(l; -1) = -1, se saavutetaan strategialla AT.,.

Takaa itsesi maksimi voitto mille tahansa pelaajan strategialle AT, eli pelin alempi hinta a = max(a, a2) = max(-l; -1) = -1, pelaaja MUTTA voi valita minkä tahansa strategian: Aj tai MUTTA 2, eli mikä tahansa hänen strategioistaan on maksimi.

Valitsemalla strategian B (sarake 1), pelaaja AT ymmärtää, että pelaaja MUTTA vastaa strategialla MUTTA 2 maksimoidaksesi voittosi (tappio AT). Siksi pelaajan suurin tappio AT kun hän valitsee strategian B, on yhtä suuri kuin β, = max(-1; 1) = 1.

Vastaavasti pelaajan B maksimitappio (voitto MUTTA), kun hän valitsee strategian B2 (sarake 2), on yhtä suuri kuin β2 = max(l; -1) = 1.

Näin ollen mihin tahansa pelaajan strategiaan MUTTA pelaajan B taattu minimitappio on yhtä suuri kuin β = πιίη(β1, β2) = min(l; 1) = 1- pelin huippuhinta.

Mikä tahansa pelaajan B strategia on minimax. Lisäämällä taulukon. 12,1 viiva β; ja sarake a;, saamme taulukon. 12.2. Lisärivien ja -sarakkeiden risteyskohtaan kirjaamme pelien ylä- ja alahinnat.

Taulukko 12.2

Yllä olevassa tehtävässä 12.1 pelin ylä- ja alakustannukset ovat erilaiset: a F β.

Jos pelin ylä- ja alahinnat ovat samat, niin yleinen merkitys ylhäältä ja alempi hinta peli α = β = υ kutsutaan pelin nettohinta, tai pelin hinta. Pelin hintaa vastaavat minimax-strategiat ovat optimaaliset strategiat ja niiden kokonaisuus optimaalinen ratkaisu tai päätös pelejä. Tässä tapauksessa pelaaja MUTTA saa suurimman takuun (riippumatta pelaajan käyttäytymisestä) AT) voitto on υ ja pelaaja AT saavuttaa taatun vähimmäishäviön (pelaajan L käyttäytymisestä riippumatta) υ. Ratkaisun peliin sanotaan olevan vakaus, nuo. jos toinen pelaajista pitää kiinni optimaalisesta strategiastaan, toisen ei voi olla edullista poiketa optimaalisesta strategiastaan.

Pari puhtaat strategiat MUTTA. ja B. antaa pelille optimaalisen ratkaisun silloin ja vain, jos vastaava elementti r on sekä sarakkeensa suurin että rivinsä pienin. Tällaista tilannetta, jos sellainen on, kutsutaan satulapiste(samanlainen kuin satulan pinta, joka kaartuu yhteen suuntaan ja alas toiseen suuntaan).

Merkitse MUTTA* ja AT* ovat pari puhdasta strategiaa, joilla saavutetaan pelin ratkaisu satulapisteen ongelmaan. Esitellään jokaisen strategiaparin ensimmäisen pelaajan voittofunktio: P(A:, AT-) = ja klo. Silloin optimiehto satulapisteessä täyttää kaksois-epäyhtälön: P(Aj, B*)<Р(А*, В*)<Р(А", В ), mikä on totta kaikille minä = 1, 2, ..., m;j = 1, 2, ..., P. Todellakin, strategian valinta MUTTA* Ensimmäinen pelaaja optimaalisen strategian alla AT" toinen pelaaja maksimoi pienimmän mahdollisen voiton: P(A*, B")> P(A G AT"), ja strategian valinta B" toinen pelaaja, ensimmäisen optimaalisella strategialla, minimoi maksimitappion: P(D , AT*)<Р(А", В).

12.2. Määritä voittomatriisin antama pelin alempi ja ylempi hinta

Onko pelissä satulakohta?

Taulukko 12 3

Päätös. Kaikki laskelmat suoritetaan kätevästi taulukossa, jossa matriisin lisäksi R, syötetty sarake a; ja rivi)

Toimittajan valinta