Konsep model permainan. Matriks pembayaran

rumah / Suami curang

Pertimbangkan permainan terhingga berpasangan. Biarkan pemain A mempunyai T strategi peribadi, yang kami nyatakan

Biarkan pemain V tersedia P strategi peribadi, mari kita nyatakan mereka. Mereka mengatakan bahawa permainan itu mempunyai dimensi T X P.

Hasil daripada pilihan oleh pemain mana-mana pasangan strategi, hasil permainan ditentukan secara unik, i.e. menang a;. pemain A(positif atau negatif) dan rugi (-ay) pemain V. Mari kita anggap bahawa nilai a.. dikenali untuk mana-mana pasangan strategi (A:, B;.). Matriks P =(a..), saya == 1, 2, ..., mj = 1, 2, ..., P, yang unsur-unsurnya adalah ganjaran yang sepadan dengan strategi A. dan bj, dipanggil matriks pembayaran, atau matriks permainan. Borang am matriks sedemikian dibentangkan dalam Jadual. 12.1. Barisan jadual ini sepadan dengan strategi pemain A, dan lajur adalah strategi pemain V.

Jadual 12.1

Mari kita buat matriks bayaran untuk perlawanan seterusnya.

12.1. Permainan carian.

Pemain A boleh bersembunyi di salah satu daripada dua tempat perlindungan (I dan II); pemain V mencari pemain A, dan jika dia mendapati, dia menerima denda 1 den. unit daripada A, jika tidak membayar pemain A 1 hari unit Ia adalah perlu untuk membina matriks hasil permainan.

D e s h e n i s. Untuk menyusun matriks bayaran, adalah perlu untuk menganalisis tingkah laku setiap pemain. Pemain A boleh bersembunyi di tempat perlindungan I – kami nyatakan strategi ini dengan A v sama ada di tempat perlindungan II - strategi A. g Pemain V boleh mencari pemain pertama dalam perlindungan I - strategi V(atau di tempat perlindungan II - strategi V.,. Jika pemain A berada di tempat persembunyian I dan ditemui di sana oleh pemain V, mereka. beberapa strategi sedang dilaksanakan ν V{), kemudian pemain A membayar denda, i.e. a n = -1. Begitu juga, kita dapat a. n = -1 (A 2, V.,). Jelas sekali, strategi (A, V.,) dan (R2, /1,) berikan pemain A menang 1, jadi a P = a. n = I. Oleh itu, untuk permainan "carian" bersaiz 2x2, kita mendapat matriks hasil:

Pertimbangkan permainan T X P dengan matriks P = a j) , i = 1,2, ..., τη; j= 1, 2, ..., dan dan tentukan yang terbaik antara strategi A di A v..., A m. Memilih strategi A pemain jy A harus mengharapkan pemain V akan menjawabnya dengan salah satu strategi V., yang mana ganjaran untuk pemain A minimum (pemain V berusaha untuk "memudaratkan" pemain A).

Nyatakan dengan a; bayaran terendah pemain A apabila dia memilih strategi L; untuk semua strategi pemain yang mungkin V(nombor terkecil dalam baris ke-i matriks bayaran), i.e.

Di antara semua nombor a (r = 1,2,..., T) pilih yang terbesar: . Jom telefon dan harga permainan yang lebih rendah, atau bayaran maksimum (maksimum). ini Jaminan ganjaran pemain A untuk mana-mana strategi pemain B. Oleh itu,

(12.2)

Strategi yang sepadan dengan maximin dipanggil strategi maksimum. Pemain V berminat untuk mengurangkan ganjaran pemain A; memilih strategi V., ia mengambil kira bayaran maksimum yang mungkin untuk A. Tandakan

Di antara semua nombor β. pilih yang terkecil

dan panggil β harga permainan teratas, atau bayaran minimax (minimax). ini dijamin kehilangan pemain B. Oleh itu,

(12.4)

Strategi minimax dipanggil strategi minimax.

Prinsip yang menentukan kepada pemain pilihan strategi minimax dan maximin yang paling "berhati-hati" dipanggil prinsip minimax. Prinsip ini mengikut andaian munasabah bahawa setiap pemain berusaha untuk mencapai matlamat lawan lawan. Mari kita tentukan harga yang lebih rendah dan atas permainan dan strategi yang sepadan dalam masalah 12.1. Pertimbangkan matriks bayaran

daripada masalah 12.1. Apabila memilih strategi A, (baris pertama matriks), bayaran minimum adalah sama dengan a, =min(-l; 1) = -1 dan sepadan dengan strategi β1 pemain V. Apabila memilih strategi L 2 (baris kedua matriks) bayaran minimum ialah a 2 = min(l; -1) = -1, ia dicapai dengan strategi V.,.

Menjamin diri sendiri kemenangan maksimum untuk sebarang strategi pemain V, iaitu harga permainan yang lebih rendah a = max(a, a2) = max(-l; -1) = -1, pemain A boleh memilih mana-mana strategi: Aj atau A 2, iaitu mana-mana strategi dia adalah maximin.

Memilih strategi B, (lajur 1), pemain V memahami bahawa pemain A akan bertindak balas dengan strategi A 2 untuk memaksimumkan keuntungan anda (kerugian V). Oleh itu, kerugian maksimum pemain V apabila dia memilih strategi B, adalah sama dengan β, = maks(-1; 1) = 1.

Begitu juga, kerugian maksimum pemain B (keuntungan A) apabila dia memilih strategi B2 (lajur 2) adalah sama dengan β2 = max(l; -1) = 1.

Oleh itu, untuk mana-mana strategi pemain A kehilangan minimum pemain B yang dijamin adalah sama dengan β = πιίη(β1, β2) = min(l; 1) = 1- harga teratas permainan.

Mana-mana strategi pemain B adalah minimax. Dengan menambah Jadual. 12.1 baris β; dan lajur a;, kita mendapat jadual. 12.2. Di persimpangan baris dan lajur tambahan, kami akan merekodkan harga atas dan bawah permainan.

Jadual 12.2

Dalam Masalah 12.1 di atas, kos atas dan bawah permainan adalah berbeza: a F β.

Jika harga atas dan bawah permainan adalah sama, maka maksud umum atas dan harga lebih rendah permainan α = β = υ dipanggil harga bersih permainan, atau harga permainan. Strategi minimax yang sepadan dengan harga permainan adalah strategi yang optimum dan keseluruhannya penyelesaian yang optimum atau keputusan permainan. Dalam kes ini pemain A menerima jaminan maksimum (bebas daripada tingkah laku pemain) V) bayarannya ialah υ, dan pemain V mencapai kerugian minimum yang dijamin (tanpa mengira tingkah laku pemain L) υ. Penyelesaian kepada permainan dikatakan mempunyai kestabilan, mereka. jika salah seorang pemain berpegang pada strategi optimumnya, maka tidaklah menguntungkan bagi yang lain untuk menyimpang daripada strategi optimumnya.

berpasangan strategi murni A. dan B. memberikan penyelesaian yang optimum kepada permainan jika dan hanya jika elemen yang sepadan r adalah kedua-dua yang terbesar dalam lajurnya dan yang terkecil dalam barisnya. Keadaan sedemikian, jika wujud, dipanggil titik pelana(serupa dengan permukaan pelana, yang melengkung ke atas ke satu arah dan ke bawah di arah yang lain).

Tandakan A* dan V* adalah sepasang strategi tulen di mana penyelesaian permainan dalam masalah dengan titik pelana dicapai. Mari kita perkenalkan fungsi bayaran pemain pertama pada setiap pasangan strategi: P(A:, V-) = dan pada. Kemudian keadaan optimum pada titik pelana memenuhi ketaksamaan berganda: P(Aj, B*)<Р(А*, В*)<Р(А", В ), yang benar untuk semua orang i = 1, 2, ..., m;j = 1, 2, ..., P. Sesungguhnya, pilihan strategi A* pemain pertama di bawah strategi optimum V" pemain kedua memaksimumkan bayaran minimum yang mungkin: P(A*, B")> P(A G V"), dan pilihan strategi B" pemain kedua, dengan strategi optimum yang pertama, meminimumkan kerugian maksimum: P(D , V*)<Р(А", В).

12.2. Tentukan harga yang lebih rendah dan harga atas permainan yang diberikan oleh matriks hasil

Adakah permainan mempunyai titik pelana?

Jadual 12 3

Penyelesaian. Semua pengiraan dilakukan dengan mudah dalam jadual di mana, sebagai tambahan kepada matriks R, masuk lajur a; dan baris)

© 2022 skudelnica.ru -- Cinta, pengkhianatan, psikologi, perceraian, perasaan, pertengkaran