Teori permainan dan keputusan statistik.

yang utama / Suami curang

Pemilihan tindakan pemain dipanggil bergerak... Terdapat pergerakan peribadi(pemain sengaja membuat keputusan ini atau itu) dan rawak(hasil permainan tidak bergantung pada kehendak pemain). Kumpulan peraturan yang menentukan pergerakan mana yang perlu dibuat pemain dipanggil strategi... Strategi adalah bersih(keputusan pemain yang tidak rawak) dan bercampur(strategi boleh dianggap sebagai pemboleh ubah rawak).

Titik pelana

DALAM teori permainan S. t. ( elemen pelana) adalah unsur lajur terbesar matriks permainan, yang sekaligus merupakan unsur terkecil dari baris yang sesuai (dalam permainan sifar jumlah dua orang). Oleh itu, pada tahap ini, maksimin satu pemain sama dengan minimax yang lain; S. t. Terdapat titik keseimbangan.

Teorema minimum

Strategi yang sesuai dengan minimax disebut strategi minimax.

Prinsip menentukan kepada pemain pilihan strategi maximin dan minimax yang paling "berhati-hati" disebut prinsip minimax... Prinsip ini berpunca dari andaian yang munasabah bahawa setiap pemain berusaha untuk mencapai gol yang bertentangan dengan lawan.

Pemain memilih tindakannya, dengan anggapan bahawa lawan akan bertindak dengan cara yang tidak baik, iaitu. akan cuba "memudaratkan".

Kehilangan fungsi

Kehilangan fungsi- fungsi yang, dalam teori keputusan statistik, mencirikan kerugian sekiranya membuat keputusan yang salah berdasarkan data yang diperhatikan. Sekiranya masalah menganggarkan parameter isyarat terhadap latar belakang kebisingan diselesaikan, maka fungsi kehilangan adalah ukuran perbezaan antara maksud sebenar parameter yang dianggar dan anggaran parameter

Strategi Pemain Campuran Optimum adalah satu set lengkap aplikasi strategi murni dengan pelbagai pengulangan permainan dalam keadaan yang sama dengan kebarangkalian yang diberikan.

Strategi campuran pemain adalah satu set lengkap menerapkan strategi murni dengan pelbagai pengulangan permainan dalam keadaan yang sama dengan kebarangkalian yang diberikan.

1. Sekiranya semua elemen baris tidak lebih besar daripada elemen baris lain yang sesuai, maka baris asal dapat dihapus dari matriks pembayaran. Begitu juga untuk lajur.

2. Kos permainan adalah unik.

Dokumen: katakan ada 2 harga permainan v dan, yang dicapai pada pasangan dan, masing-masing, kemudian

3. Sekiranya nombor yang sama ditambahkan ke semua elemen matriks pembayaran, maka strategi campuran yang optimum tidak akan berubah, dan harga permainan akan meningkat dengan jumlah ini.

Dokumen:
di mana

4. Sekiranya semua elemen matriks pembayaran dikalikan dengan nombor bukan sifar yang sama, harga permainan akan dikalikan dengan nombor ini, dan strategi optimum tidak akan berubah.

Strategi campuran SA pemain A adalah penerapan strategi murni A1, A2, ..., Am dengan kebarangkalian p1, p2, ..., pi, ..., pm dan jumlah kebarangkalian adalah sama dengan 1: Strategi campuran pemain A ditulis dalam bentuk matriks atau sebagai rentetan SA = (p1, p2, ..., pi, ..., pm) Begitu juga, strategi campuran pemain B dilambangkan dengan:, atau , SB = (q1, q2, ..., qi, ..., qn), di mana jumlah kebarangkalian strategi muncul sama dengan 1: Strategi bersih boleh dianggap sebagai kes khas campuran dan diberikan oleh tali di mana 1 sesuai dengan strategi murni. Berdasarkan prinsip minimax, penyelesaian (atau penyelesaian) permainan yang optimum ditentukan: ini adalah sepasang strategi optimum S * A, S * B, pada umumnya, bercampur, mempunyai sifat berikut: jika ada pemain mematuhi strategi optimumnya, maka tidak dapat menguntungkan bagi yang lain untuk menyimpang dari strategi. Hasil yang sesuai dengan penyelesaian optimum disebut kos permainan v. Harga permainan memenuhi ketaksamaan:? ? v? ? (3.5) di mana? dan? - harga permainan yang lebih rendah dan lebih tinggi. Teorema utama teori permainan berikut adalah benar - teorema Neumann. Setiap permainan akhir mempunyai sekurang-kurangnya satu penyelesaian optimum, mungkin antara strategi campuran... Katakan S * A = (p * 1, p * 2, ..., p * i, ..., p * m) dan S * B = (q * 1, q * 2, ..., q * i, ..., q * n) adalah sepasang strategi optimum. Sekiranya strategi murni dimasukkan dalam strategi campuran optimum dengan kebarangkalian nol, maka itu disebut aktif. Teorema mengenai strategi aktif adalah sah: jika salah satu pemain mematuhi strategi campurannya yang optimum, maka pembayaran tetap tidak berubah dan sama dengan harga permainan v, jika pemain kedua tidak melampaui batas strategi aktifnya. Teorema ini sangat praktikal - ia menyediakan model khusus untuk mencari strategi yang optimum sekiranya tidak ada titik pelana. Pertimbangkan permainan 2 × 2, yang merupakan kes termudah dari permainan terhingga. Sekiranya permainan seperti itu mempunyai titik pelana, maka penyelesaian yang optimum adalah sepasang strategi murni yang sesuai dengan titik ini. Permainan tanpa titik pelana, sesuai dengan teorema utama teori permainan, penyelesaian optimum ada dan ditentukan oleh sepasang strategi campuran S * A = (p * 1, p * 2) dan S * B = (q * 1, q * 2) ... Untuk mencarinya, kami akan menggunakan teorema mengenai strategi aktif. Sekiranya pemain A mematuhi strategi optimum S "A, maka rata-rata pembayarannya akan sama dengan harga permainan v, tidak kira apa strategi aktif yang digunakan pemain B. Untuk permainan 2 × 2, strategi murni lawan adalah aktif jika tidak ada titik pelana. Bayaran pemain A (kehilangan pemain B) adalah pemboleh ubah rawak, nilai jangkaan(rata-rata) yang merupakan harga permainan. Oleh itu, gaji rata-rata pemain A (strategi optimum) akan sama dengan v untuk strategi pertama dan ke-2 lawan. Biarkan permainan diberikan oleh matriks pembayaran. Bayaran rata-rata pemain A jika dia menggunakan strategi campuran optimum, dan pemain B menggunakan strategi murni B1 (ini sepadan dengan lajur matriks pembayaran P), sama dengan harga permainan v: a11 p * 1 + a21 p * 2 = v. Pemain A mendapat gaji rata-rata yang sama jika pemain ke-2 menerapkan strategi B2, iaitu a12 p * 1 + a22 p * 2 = v. Dengan mempertimbangkan bahawa p * 1 + p * 2 = 1, kami memperoleh sistem persamaan untuk menentukan strategi optimum S "A dan harga permainan v: (3.6) Dengan menyelesaikan sistem ini, kami memperoleh strategi yang optimum (3.7 ) dan harga permainan (3.8). strategi aktif ketika mencari SB * - strategi pemain B yang optimum, kami mendapati bahawa untuk strategi murni pemain A (A1 atau A2), rata-rata kehilangan pemain B sama harga permainan v, iaitu (3.9) Maka strategi optimum ditentukan oleh formula: (3.10)

Kaedah dan model matematik dalam ekonomi

Permainan matriks

Pengenalan

Dalam amalan ekonomi, situasi sering timbul di mana pihak yang berbeza mengejar tujuan yang berbeza. Contohnya, hubungan antara penjual dan pembeli, pembekal dan pengguna, bank dan pendeposit, dll. Situasi konflik seperti itu tidak hanya timbul dalam ekonomi, tetapi juga dalam aktiviti lain. Contohnya, semasa bermain catur, kotak-kotak, domino, loto, dll.

Permainan- ini adalah model matematik situasi konflik yang melibatkan sekurang-kurangnya dua orang menggunakan beberapa cara yang berbeza untuk mencapai matlamat anda. Permainan dipanggil bilik wap, sekiranya dua pemain mengambil bahagian di dalamnya. Permainan dipanggil antagonis, jika keuntungan satu pemain sama dengan kerugian yang lain. Oleh itu, untuk mengatur permainan, cukup untuk menetapkan nilai-nilai pembayaran satu pemain dalam situasi yang berbeza.

Sebarang kaedah tindakan pemain, bergantung pada keadaan, dipanggil strategi. Setiap pemain mempunyai strategi tertentu. Sekiranya bilangan strategi adalah terbatas, maka permainan akan dipanggil muktamad, jika tidak - tidak berkesudahan . Strategi dipanggil bersih, sekiranya setiap pemain memilih satu strategi hanya dengan cara tertentu dan bukan secara rawak.

Penyelesaian permainan adalah memilih strategi yang memuaskan keadaan optimum. Keadaan ini adalah satu pemain mendapat kemenangan maksimum, sekiranya yang kedua mematuhi strateginya. Sebaliknya, pemain kedua menerima kerugian minimum, sekiranya pemain pertama berpegang pada strateginya. Strategi sedemikian disebut optimum . Dengan cara ini, tujuan permainan adalah untuk menentukan strategi optimum bagi setiap pemain.

Permainan strategi murni

Pertimbangkan permainan dengan dua pemain TETAPI dan DALAM. Andaikan pemain TETAPI Ia mempunyai m strategi А 1, А 2, ..., А m dan pemain DALAM Ia mempunyai n strategi B 1, B 2, ..., B n. Kami akan menganggap bahawa pilihan pemain TETAPI strategi A i, dan pemain DALAM strategi B j menentukan hasil permainan secara unik, iaitu memperoleh sebuah ij pemain TETAPI dan menang b ij pemain DALAM. Di sini i = 1,2, ..., m, j = 1,2, ..., n.

Permainan dua pemain paling mudah adalah permainan antagonis , mereka. permainan di mana kepentingan pemain bertentangan. Dalam kes ini, pembayaran pemain berkaitan dengan persamaan

b ij = -a ij

Persamaan ini bermaksud bahawa keuntungan salah satu pemain sama dengan kerugian yang lain. Dalam kes ini, memadai untuk mempertimbangkan hanya pembayaran salah satu pemain, misalnya pemain TETAPI.

Setiap pasangan strategi A i dan B j sepadan dengan kemenangan sebuah ij pemain TETAPI. Adalah senang untuk menulis semua kemenangan ini dalam bentuk matrik pembayaran

Baris matriks ini sesuai dengan strategi pemain TETAPI, dan lajur adalah untuk strategi pemain DALAM. Secara umum, permainan seperti itu disebut (m × n)-permainan.


Contoh 1. Dua pemain TETAPI dan DALAM buang duit syiling. Sekiranya sisi duit syiling bertepatan, maka menang TETAPI, iaitu pemain DALAM membayar pemain TETAPI sejumlah wang sama dengan 1, dan jika tidak bertepatan, maka pemain B menang, iaitu sebaliknya, pemain TETAPI membayar pemain DALAM jumlah yang sama , sama 1. Bentuk matrik pembayaran.

Keputusan. Dengan keadaan masalah

Strategi murni Pemain I memilih salah satu daripada n baris matrik pembayaran A, dan strategi murni pemain II adalah memilih salah satu lajur matriks yang sama.

Strategi pemain yang murni optimum berbeza dengan strategi campuran dengan adanya unit wajib p i = 1, q i = 1. Contohnya: P (1,0), Q (1,0). Di sini p 1 = 1, q 1 = 1.

Masalah 1
Dengan menggunakan matriks pembayaran, cari strategi bersih yang optimum menggunakan prinsip dominasi yang ketat. Sebagai jawapan, tuliskan vektor P *, Q *.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Keputusan:

Kami menyelesaikan semua masalah menggunakan kalkulator permainan Matrix.

Kami menganggap bahawa pemain I memilih strateginya untuk mendapatkan hasil maksimumnya, dan pemain II memilih strateginya untuk meminimumkan pembayaran pemain I.

PemainB 1B 2B 3B 4a = min (A i)
A 13 1 2 5 1
A 22 0 0 3 0
A 3-3 -5 -5 -2 -5
A 40 -2 -2 1 -2
b = maks (B i)3 1 2 5
Kami dapati hasil yang dijamin ditentukan oleh harga permainan yang lebih rendah a = max (a i) = 1, yang menunjukkan strategi murni maksimum A 1.
Harga atas permainan adalah b = min (b j) = 1.
Titik pelana (1, 2) menunjukkan penyelesaian untuk sepasang alternatif (A1, B2). Harga permainan adalah 1.
2. Periksa matriks pembayaran untuk baris dominan dan lajur dominan.
Kadang-kadang, berdasarkan pertimbangan sederhana mengenai matriks permainan, kita dapat mengatakan bahawa beberapa strategi murni dapat memasuki strategi campuran yang optimum hanya dengan kebarangkalian sifar.
Mereka mengatakan bahawa i-i strategi pemain pertama menguasai dirinya k-i strategi jika ij ≥ a kj untuk semua j E N dan sekurang-kurangnya satu j a ij> kj. Dalam kes ini, dikatakan juga bahawa i-i strategi (atau garis) - dominan, k-i- dikuasai.
Mereka mengatakan bahawa j-th strategi pemain ke-2 menguasai dirinya l-i strategi jika untuk semua j E M a ij ≤ a il dan sekurang-kurangnya satu ij< a il . В этом случае j-th strategi (lajur) disebut dominan, l-i- dikuasai.
Strategi A 1 mendominasi strategi A 2 (semua elemen baris 1 lebih besar daripada atau sama dengan nilai baris ke-2), oleh itu, kami mengecualikan baris ke-2 matriks. Kebarangkalian p 2 = 0.
Strategi A 1 menguasai strategi A 3 (semua elemen baris 1 lebih besar daripada atau sama dengan nilai baris ke-3), oleh itu, kami mengecualikan baris ke-3 matriks. Kebarangkalian p 3 = 0.
3 1 2 5
0 -2 -2 1

Dari kedudukan kekalahan pemain B, strategi B 1 menguasai strategi B 2 (semua elemen lajur 1 lebih banyak barang lajur 2), oleh itu kami mengecualikan lajur matriks 1. Kebarangkalian q 1 = 0.
Dari kedudukan kekalahan pemain B, strategi B 4 mendominasi strategi B 1 (semua elemen lajur 4 lebih besar daripada elemen lajur 1), oleh itu, kami mengecualikan lajur matriks ke-4. Kebarangkalian q 4 = 0.
1 2
-2 -2

Kami telah mengurangkan permainan 4 x 4 menjadi permainan 2 x 2.



Penyelesaian permainan ( 2 x n


p 1 = 1
p 2 = 0
Harga permainan, y = 1
Sekarang kita dapat mencari strategi minimum pemain B dengan menulis sistem persamaan yang sesuai
q 1 = 1
q 1 + q 2 = 1
Menyelesaikan sistem ini, kami dapati:
q 1 = 1.
Jawapan:
Harga permainan: y = 1, vektor strategi pemain:
Q (1,0), P (1,0)

Ia ij q j ≤ v
Ia ij p i ≥ v
M (P 1; Q) = (1 1) + (2 0) = 1 = v
M (P 2; Q) = (-2 1) + (-2 0) = -2 ≤ v
M (P; Q 1) = (1 1) + (-2 0) = 1 = v
M (P; Q 2) = (2 1) + (-2 0) = 2 ≥ v

Oleh kerana baris dan lajur dikeluarkan dari matriks asal, vektor kebarangkalian yang dijumpai dapat ditulis sebagai:
P (1,0,0,0)
Q (0,1,0,0)

Tugasan 2
Cari harga permainan yang lebih rendah dan lebih tinggi menggunakan matriks pembayaran. Sekiranya terdapat titik pelana, tuliskan vektor strategi murni optimum P *, Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Keputusan:
1. Periksa sama ada matriks pembayaran mempunyai titik pelana. Sekiranya ya, maka kami akan menulis penyelesaian permainan dengan strategi murni.
PemainB 1B 2B 3a = min (A i)
A 1-6 -5 0 -6
A 2-8 -3 -2 -8
A 3-3 -2 3 -3
b = maks (B i)-3 -2 3

Kami dapati pembayaran yang dijamin ditentukan oleh harga permainan yang lebih rendah a = max (a i) = -3, yang menunjukkan strategi murni maksimum A 3.
Harga atas permainan adalah b = min (b j) = -3.
Titik pelana (3, 1) menunjukkan penyelesaian untuk sepasang alternatif (A3, B1). Harga permainan adalah -3.
Jawapan: P (0,0,1), Q (1,0,0)

Masalah 3
Cari vektor strategi optimum P *, Q * dan harga permainan menggunakan matriks pembayaran. Pemain mana yang menjadi pemenang?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Keputusan:
1. Periksa sama ada matriks pembayaran mempunyai titik pelana. Sekiranya ya, maka kami akan menulis penyelesaian permainan dengan strategi murni.
Kami menganggap bahawa pemain I memilih strateginya untuk mendapatkan hasil maksimumnya, dan pemain II memilih strateginya untuk meminimumkan pembayaran pemain I.
PemainB 1B 2B 3B 4a = min (A i)
A 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b = maks (B i)2 -2 7 4

Kami dapati hasil yang dijamin ditentukan oleh harga permainan yang lebih rendah a = max (a i) = -2, yang menunjukkan strategi murni maksimum A 2.
Harga atas permainan adalah b = min (b j) = -2.
Titik pelana (2, 2) menunjukkan penyelesaian untuk sepasang alternatif (A2, B2). Harga permainan adalah -2.
3. Cari penyelesaian untuk permainan dalam strategi campuran.
Mari selesaikan masalahnya dengan kaedah geometri, yang merangkumi langkah-langkah berikut:
1. Dalam sistem koordinat Cartesian, segmen diplot sepanjang abses, yang panjangnya adalah 1. Hujung kiri segmen (titik x = 0) sesuai dengan strategi A 1, yang kanan - dengan strategi A 2 (x = 1). Titik pertengahan x sesuai dengan kebarangkalian beberapa strategi campuran S 1 = (p 1, p 2).
2. Menang strategi A 1 ditunjukkan pada paksi ordinat kiri. Pada garis selari dengan paksi ordinat, dari titik 1, kemenangan strategi A 2 digambarkan.
Penyelesaian permainan ( 2 x n) dilakukan dari posisi pemain A, mematuhi strategi maksimin. Tidak ada pemain yang mempunyai strategi dominan dan pendua.

Strategi maksimal pemain A sesuai dengan titik N, yang mana sistem persamaan berikut dapat ditulis:
p 1 = 0
p 2 = 1
Harga permainan, y = -2
Sekarang kita dapat mencari strategi minimum pemain B dengan menuliskan sistem persamaan yang sesuai, tidak termasuk strategi B 1, B 3, B 4, yang jelas memberikan kerugian yang lebih besar kepada pemain B, dan, oleh itu, q 1 = 0, q 3 = 0, q 4 = 0 ...
-2q 2 = -2
q 2 = 1
Menyelesaikan sistem ini, kami dapati:
q 2 = 1.
Jawapan:
Harga permainan: y = -2, vektor strategi pemain:
Q (0, 1, 0, 0), P (0, 1)
4. Mari kita periksa kebenaran penyelesaian permainan dengan menggunakan kriteria optimum strategi.
Ia ij q j ≤ v
Ia ij p i ≥ v
M (P 1; Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M (P 2; Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M (P; Q 1) = (-6 0) + (2 1) = 2 ≥ v
M (P; Q 2) = (-6 0) + (-2 1) = -2 = v
M (P; Q 3) = (2 0) + (7 1) = 7 ≥ v
M (P; Q 4) = (4 0) + (-1 1) = -1 ≥ v
Semua ketaksamaan berpuas hati sebagai persamaan atau ketaksamaan yang ketat, oleh itu, penyelesaian untuk permainan dijumpai dengan betul.

Masalah 4
Berikan jawapan terperinci untuk soalan tersebut

Walaupun saya lulus dari Fakulti Fizik dan Teknologi, saya tidak diajar teori permainan di universiti. Tetapi sejak saya masuk tahun pelajar Saya banyak bermain, pertama dalam pilihan, dan kemudian di jambatan, teori permainan menarik minat saya, dan saya menguasai buku teks kecil. Dan baru-baru ini pembaca laman web Mikhail telah menyelesaikan masalah teori permainan. Menyedari bahawa tugas itu tidak diberikan kepada saya dengan segera, saya memutuskan untuk menyegarkan pengetahuan saya mengenai teori permainan dalam ingatan saya. Saya menyampaikan kepada anda sebuah buku kecil - eksposisi yang popular mengenai elemen teori permainan dan beberapa kaedah menyelesaikan permainan matriks. Ia hampir tidak mengandungi bukti dan menggambarkan perkara utama teori dengan contoh. Buku ini ditulis oleh ahli matematik dan mempopularkan sains Elena Sergeevna Ventzel. Beberapa generasi jurutera Soviet belajar dari buku teksnya "Teori Kebarangkalian". Elena Sergeevna juga menulis beberapa karya sastera dengan nama samaran I. Grekov.

Elena Wentzel. Elemen teori permainan. - M .: Fizmatgiz, 1961 .-- 68 p.

Muat turun sinopsis pendek dalam format atau

§ 1. Subjek teori permainan. Konsep asas

Semasa menyelesaikan sejumlah tugas praktikal (dalam bidang ekonomi, urusan ketenteraan, dll.), Adalah perlu untuk menganalisis situasi di mana terdapat dua (atau lebih) pihak yang berperang mengejar tujuan yang berlawanan, dan hasil dari setiap peristiwa salah satu dari pihak bergantung pada tindakan apa yang akan dipilih oleh musuh. Kami akan memanggil situasi seperti itu "situasi konflik".

Terdapat banyak contoh situasi konflik dari pelbagai bidang praktik. Segala situasi yang timbul semasa permusuhan termasuk dalam situasi konflik: setiap pihak yang bertempur mengambil semua langkah yang ada untuk mencegah musuh mencapai kejayaan. Situasi konflik juga merangkumi situasi yang timbul ketika memilih sistem senjata, kaedah penggunaan pertempurannya dan, secara umum, ketika merancang operasi ketenteraan: setiap keputusan di daerah ini harus diambil dengan mempertimbangkan tindakan musuh yang paling tidak menguntungkan kita. Sejumlah situasi dalam bidang ekonomi (terutamanya dengan adanya persaingan bebas) tergolong dalam situasi konflik; pihak yang berperang adalah firma perdagangan, perusahaan perindustrian, dll.

Keperluan untuk menganalisis situasi seperti itu menimbulkan alat matematik khas. Teori permainan pada dasarnya tidak lebih daripada teori matematik situasi konflik. Matlamat teori ini adalah untuk mengembangkan cadangan untuk tindakan yang rasional untuk setiap lawan dalam situasi konflik. Setiap situasi konflik yang diambil secara langsung dari praktik sangat kompleks, dan analisisnya terhambat oleh adanya banyak faktor. Untuk memungkinkan analisis matematik keadaan, perlu diambil dari faktor sekunder, faktor sampingan dan membina model situasi yang disederhanakan dan formal. Kami akan memanggil model ini sebagai "permainan".

Permainan ini berbeza dengan situasi konflik yang sebenarnya kerana ia dijalankan mengikut peraturan yang ditentukan dengan baik. Kemanusiaan telah lama menggunakan model situasi konflik yang diformalkan seperti permainan dalam arti harfiah kata. Contohnya termasuk catur, kotak-kotak, permainan kad, dll. Semua permainan ini mempunyai watak pertandingan yang berjalan mengikut peraturan yang terkenal dan diakhiri dengan "kemenangan" (keuntungan) satu atau pemain lain.

Permainan yang diatur secara formal dan tersusun secara artifisial adalah yang paling banyak bahan yang sesuai untuk menggambarkan dan menguasai konsep asas teori permainan. Istilah yang dipinjam dari praktik permainan seperti itu juga digunakan dalam analisis situasi konflik lain: pihak yang berpartisipasi di dalamnya secara konvensional disebut sebagai "pemain", dan hasil pertembungan tersebut adalah "kemenangan" salah satu pihak .

Dalam permainan, kepentingan dua atau lebih lawan mungkin bertembung; dalam kes pertama, permainan ini disebut "beregu", pada yang kedua - "berganda". Peserta dalam pelbagai permainan boleh membentuk gabungan dalam kursus - kekal atau sementara. Dengan adanya dua gabungan tetap, permainan berganda bertukar menjadi pasangan. Permainan berpasangan adalah kepentingan praktikal yang paling penting; di sini kita akan mengehadkan diri untuk hanya mempertimbangkan permainan seperti itu.

Kami memulakan persembahan teori permainan asas kami dengan penyusunan beberapa konsep asas. Kami akan mempertimbangkan permainan beregu di mana dua pemain A dan B dengan minat berlainan mengambil bahagian. Dengan "permainan" kami bermaksud acara yang terdiri dari serangkaian tindakan sisi A dan B. Agar permainan dapat dilakukan analisis matematik, peraturan permainan harus dirumuskan secara tepat. Dengan "peraturan permainan" kita bermaksud sistem syarat yang mengatur kemungkinan pilihan untuk tindakan kedua-dua belah pihak, jumlah maklumat yang dimiliki setiap pihak mengenai tingkah laku yang lain, urutan "gerakan" yang bergantian (keputusan individu dibuat semasa permainan), serta hasil atau hasil permainan yang mana set pergerakannya diberikan. Hasil ini (keuntungan atau kerugian) tidak selalu mempunyai ekspresi kuantitatif, tetapi biasanya adalah mungkin, dengan menetapkan skala pengukuran tertentu, untuk menyatakannya nombor tertentu... Sebagai contoh, dalam permainan catur, keuntungan dapat secara konvensional diberikan nilai +1, kerugian –1, seri 0.

Permainan dipanggil permainan sifar jumlah jika satu pemain memenangkan apa yang kalah yang lain, iaitu jumlah kemenangan kedua-dua pihak adalah sama dengan sifar. Dalam permainan sifar jumlah, minat para pemain adalah sebaliknya. Di sini kita hanya akan mempertimbangkan permainan seperti itu.

Oleh kerana dalam permainan jumlah sifar, pembayaran salah satu pemain adalah sama dengan pembayaran yang lain dengan tanda bertentangan, maka, jelas, ketika menganalisis permainan seperti itu, seseorang dapat mempertimbangkan pembayaran hanya satu pemain. Biarkan, sebagai contoh, pemain A. Dalam yang berikut, untuk kemudahan, kita secara konvensional akan memanggil sisi A "kita", dan sisi B - "musuh".

Dalam kes ini, sisi A ("kita") akan selalu dianggap "menang", dan sisi B ("lawan") sebagai "kalah". Keadaan formal ini jelas tidak menunjukkan kelebihan nyata bagi pemain pertama; mudah dilihat bahawa ia digantikan dengan yang sebaliknya jika tanda kemenangan dibalikkan.

Kami akan membayangkan perkembangan permainan pada waktunya sebagai terdiri daripada satu siri peringkat berturut-turut atau "bergerak". Pergerakan teori permainan adalah pilihan salah satu pilihan yang disediakan oleh peraturan permainan. Pergerakan dibahagikan kepada peribadi dan rawak. Langkah peribadi adalah pilihan sedar oleh salah satu pemain salah satu kemungkinan pergerakan dalam situasi tertentu dan pelaksanaannya. Contoh pergerakan peribadi adalah pergerakan dalam permainan catur. Melakukan langkah seterusnya, pemain membuat pilihan sedar dari salah satu pilihan yang mungkin dilakukan dengan susunan kepingan tertentu di papan. Set kemungkinan pilihan untuk setiap gerakan peribadi diatur oleh peraturan permainan dan bergantung pada total pergerakan sebelumnya dari kedua-dua belah pihak.

Pergerakan secara rawak adalah pilihan dari sejumlah kemungkinan, yang dilakukan bukan dengan keputusan pemain, tetapi oleh beberapa mekanisme pemilihan rawak (melemparkan koin, dadu, mengocok dan menjual kad, dll.). Sebagai contoh, memberi kad pertama kepada salah satu pemain sebagai pilihan adalah langkah rawak dengan 32 pilihan yang sama. Untuk permainan ditakrifkan secara matematik, peraturan permainan mesti menunjukkan taburan kebarangkalian hasil yang mungkin untuk setiap gerakan rawak.

Beberapa permainan hanya boleh terdiri daripada gerakan rawak (yang disebut perjudian semata-mata) atau hanya pergerakan peribadi (catur, kotak-kotak). Paling permainan kad tergolong dalam permainan jenis campuran, iaitu mengandungi pergerakan rawak dan peribadi.

Permainan diklasifikasikan bukan hanya berdasarkan sifat pergerakannya (peribadi, rawak), tetapi juga oleh sifat dan jumlah maklumat yang ada pada setiap pemain mengenai tindakan yang lain. Kelas permainan khas terdiri daripada apa yang disebut "permainan dengan maklumat lengkap". Permainan dengan maklumat lengkap adalah permainan di mana setiap pemain pada setiap pergerakan peribadi mengetahui hasil dari semua pergerakan sebelumnya, baik secara peribadi dan rawak. Contoh permainan dengan maklumat lengkap termasuk catur, kotak-kotak, dan permainan "noughts and crosses" yang terkenal.

Sebilangan besar permainan yang praktikal tidak termasuk dalam kelas permainan dengan maklumat lengkap, kerana ketidakpastian mengenai tindakan musuh biasanya merupakan elemen penting dalam situasi konflik.

Salah satu konsep asas teori permainan adalah konsep "strategi". Strategi pemain adalah sekumpulan peraturan yang menentukan secara unik pilihan untuk setiap pergerakan peribadi pemain tertentu, bergantung pada situasi yang telah berkembang selama permainan. Biasanya, keputusan (pilihan) untuk setiap pergerakan peribadi dibuat oleh pemain semasa permainan itu sendiri, bergantung pada situasi tertentu yang telah berkembang. Namun, secara teorinya, perkara tidak akan berubah jika kita membayangkan bahawa semua keputusan ini dibuat oleh pemain terlebih dahulu. Untuk melakukan ini, pemain harus menyusun senarai semua situasi yang mungkin berlaku semasa permainan terlebih dahulu dan memberikan penyelesaiannya sendiri untuk setiap dari mereka. Pada prinsipnya (jika tidak praktikal) ini mungkin untuk mana-mana permainan. Sekiranya sistem keputusan seperti itu diadopsi, ini akan bermakna bahawa pemain telah memilih strategi tertentu.

Seorang pemain yang telah memilih strategi sekarang tidak boleh berpartisipasi dalam permainan secara peribadi, tetapi menggantikan penyertaannya dengan senarai peraturan yang akan dikenakan oleh seseorang (hakim) yang tidak berminat untuknya. Strategi juga dapat diberikan kepada automaton dalam bentuk program tertentu. Inilah cara komputer bermain catur hari ini. Agar konsep "strategi" masuk akal, mesti ada gerakan peribadi dalam permainan; dalam permainan yang hanya terdiri daripada gerakan rawak, tidak ada strategi.

Bergantung pada bilangan strategi yang mungkin, permainan dibahagikan kepada "terhingga" dan "tanpa henti". Permainan terhingga adalah permainan di mana setiap pemain hanya mempunyai sebilangan strategi. Permainan terakhir di mana pemain A mempunyai m strategi, dan pemain B - n strategi dipanggil permainan mxn.

Pertimbangkan permainan mxn dua pemain A dan B ("kita" dan "lawan"). Kami akan menunjukkan strategi kami A 1, A 2, ..., A m strategi musuh B 1, B 2, ..., B n. Biarkan setiap pihak memilih strategi tertentu; bagi kita itu akan menjadi A i, untuk musuh B j. Sekiranya permainan hanya terdiri daripada gerakan peribadi, maka pilihan strategi A i, B j secara unik menentukan hasil permainan - kemenangan kami. Mari kita nyatakannya sebagai ij. Sekiranya permainan mengandungi, selain pergerakan peribadi, rawak, maka hasil sepasang strategi A i, B j adalah nilai rawak yang bergantung pada hasil dari semua gerakan rawak. Dalam kes ini, anggaran semula jadi hasil yang diharapkan adalah nilai purata (jangkaan matematik). Kami akan menandakan dengan tanda yang sama baik hasilnya sendiri (dalam permainan tanpa pergerakan rawak) dan nilai rata-rata (dalam permainan dengan gerakan rawak).

Marilah kita mengetahui nilai-nilai pembayaran ij (atau rata-rata pembayaran) untuk setiap pasangan strategi. Nilai dapat ditulis dalam bentuk tabel persegi panjang (matriks), baris yang sesuai dengan strategi kami (A i), dan lajur sesuai dengan strategi musuh (B j). Jadual seperti itu disebut matrik pembayaran atau sekadar matriks permainan. Matriks permainan mxn ditunjukkan dalam Rajah. satu.

Rajah. 1. Matriks mxn

Singkatnya kita akan menunjukkan matriks permainan ‖а ij ‖. Mari lihat beberapa contoh permainan asas.

Contoh 1. Dua pemain A dan B, tanpa melihat satu sama lain, meletakkan duit syiling terbalik di atas meja, lambang atau ekor, yang mereka anggap sesuai. Sekiranya pemain telah memilih sisi yang sama (kedua-duanya mempunyai lambang atau kedua-duanya mempunyai ekor), maka pemain A mengambil kedua-dua syiling; jika tidak, mereka diambil oleh pemain B. Ia diperlukan untuk menganalisis permainan dan menyusun matriksnya. Keputusan. Permainan ini hanya terdiri dari dua gerakan: gerakan kami dan gerakan lawan, baik secara peribadi. Permainan ini bukan milik permainan dengan maklumat lengkap, kerana pada saat giliran pemain yang melakukannya tidak tahu apa yang telah dilakukan oleh yang lain. Oleh kerana setiap pemain hanya mempunyai satu gerakan peribadi, strategi pemain adalah pilihan dengan satu gerakan peribadi ini.

Kami mempunyai dua strategi: A 1 - untuk memilih lambang dan A 2 - untuk memilih ekor; lawan mempunyai dua strategi yang sama: B 1 - lambang tangan dan B 2 - ekor. Oleh itu, permainan ini adalah permainan 2 × 2. Mari anggap kemenangan duit syiling sebagai +1. Matrik Permainan:

Dengan contoh permainan ini, secara asasnya, anda dapat memahami beberapa idea penting teori permainan. Anggap dahulu bahawa permainan yang diberikan dijalankan sekali sahaja. Maka, jelas, tidak masuk akal untuk membicarakan "strategi" pemain yang lebih masuk akal daripada yang lain. Setiap pemain dengan alasan yang sama dapat membuat keputusan. Namun, apabila permainan diulang, keadaan berubah.

Memang, katakan bahawa kita (pemain A) telah memilih beberapa strategi untuk diri kita sendiri (katakanlah, A 1) dan berpegang teguh pada strategi tersebut. Kemudian, berdasarkan hasil dari beberapa gerakan pertama, musuh akan meneka strategi kita dan akan bertindak balas dengan cara yang paling tidak menguntungkan bagi kita, iaitu. pilih ekor. Jelas sekali tidak menguntungkan bagi kita untuk selalu menggunakan strategi apa pun; agar tidak menjadi yang kalah, kita kadang-kadang mesti memilih lambang, kadang-kadang - ekor. Walau bagaimanapun, jika kita mengganti lambang dan ekor dalam urutan tertentu (contohnya, setelah satu), musuh juga dapat meneka tentang ini dan bertindak balas terhadap strategi ini dengan cara yang paling buruk bagi kita. Jelas, cara yang boleh dipercayai untuk memastikan bahawa musuh tidak mengetahui strategi kita adalah mengatur pilihan pada setiap pergerakan, sedangkan kita sendiri tidak mengetahuinya terlebih dahulu (ini dapat dipastikan, misalnya, dengan melemparkan koin). Oleh itu, dengan penaakulan intuitif kita sampai pada salah satu konsep penting teori permainan - kepada konsep "strategi campuran", iaitu. seperti ketika strategi "murni" - dalam kes ini A 1 dan A 2 - bergantian secara rawak dengan frekuensi tertentu. Dalam contoh ini, dari pertimbangan simetri, sudah jelas sebelumnya bahawa strategi A 1 dan A 2 mesti bergantian dengan frekuensi yang sama; dalam permainan yang lebih kompleks, penyelesaiannya mungkin jauh dari perkara remeh.

Contoh 2. Pemain A dan B secara serentak dan bebas antara satu sama lain menuliskan masing-masing daripada tiga nombor: 1, 2 atau 3. Sekiranya jumlah nombor yang ditulis sama, maka B membayar A jumlah ini dalam rubel; jika ia ganjil, sebaliknya, A membayar jumlah ini kepada B. Diperlukan untuk menganalisis permainan dan menyusun matriksnya.

Keputusan. Permainan terdiri daripada dua gerakan; kedua-duanya bersifat peribadi. Kami (A) mempunyai tiga strategi: A 1 - tulis 1; Dan 2 - tulis 2; Dan 3 - tulis 3. Lawan (B) mempunyai tiga strategi yang sama. Permainan ini adalah permainan 3 × 3:

Jelas, seperti dalam kes sebelumnya, musuh dapat bertindak balas dengan cara terburuk bagi kita terhadap strategi apa pun yang kita pilih. Memang, jika kita memilih, misalnya, strategi A1, musuh akan selalu membalasnya dengan strategi B2; mengenai strategi A 2 - dengan strategi B 3; mengenai strategi A 3 - dengan strategi B 2; Oleh itu, pilihan strategi tertentu pasti akan membawa kita kepada kerugian (tidak perlu, bagaimanapun, untuk melupakan bahawa musuh berada dalam situasi yang sama menyedihkan). Penyelesaian untuk permainan ini (iaitu, keseluruhannya strategi yang paling bermanfaat kedua-dua pemain) akan diberikan dalam § 5.

Contoh 3. Kami mempunyai tiga jenis senjata: our 1, А 2, А 3; musuh mempunyai tiga jenis pesawat terbang: B 1, B 2, B 3. Tugas kita adalah memukul pesawat; tugas musuh adalah untuk memastikan dia tidak terpengaruh. Semasa menggunakan persenjataan A 1, pesawat B 1, B 2, B 3 masing-masing dipukul, dengan kebarangkalian 0.9, 0.4 dan 0.2; dengan persenjataan A 2 - dengan kebarangkalian 0.3, 0.6 dan 0.8; dengan persenjataan A 3 - dengan kebarangkalian 0.5, 0.7 dan 0.2. Ia diperlukan untuk merumuskan keadaan dari segi teori permainan.

Keputusan. Situasi ini boleh dianggap sebagai permainan 3 × 3 dengan dua gerakan peribadi dan satu permainan rawak. Pergerakan peribadi kita adalah pilihan jenis senjata; langkah peribadi musuh - pilihan pesawat untuk penyertaan dalam pertempuran. Langkah rawak - penggunaan senjata; langkah ini boleh berakhir dengan kekalahan atau kekalahan pesawat. Bayaran kami adalah satu jika pesawat terkena dan sifar sebaliknya. Strategi kami adalah tiga pilihan senjata; strategi musuh - tiga pilihan pesawat. Nilai rata-rata pembayaran untuk setiap pasangan strategi yang diberikan tidak lebih dari kebarangkalian memukul pesawat tertentu dengan senjata tertentu. Matrik Permainan:

Matlamat teori permainan adalah untuk memberikan cadangan untuk tingkah laku yang wajar pemain di situasi konflik, iaitu penentuan "strategi optimum" untuk masing-masing. Strategi pemain yang optimum dalam teori permainan adalah strategi yang, ketika permainan diulang berkali-kali, memberikan keuntungan rata-rata maksimum pemain (atau kerugian rata-rata minimum yang mungkin). Dalam memilih strategi ini, dasar penaakulan adalah anggapan bahawa musuh sekurang-kurangnya sama pintarnya dengan kita, dan melakukan segalanya untuk mencegah kita mencapai tujuan kita.

Dalam teori permainan, semua cadangan dibuat berdasarkan prinsip-prinsip ini; oleh itu, ia tidak mengambil kira unsur risiko yang pasti ada dalam setiap strategi sebenar, serta kemungkinan salah perhitungan dan kesalahan setiap pemain. Teori permainan, seperti model matematik fenomena kompleks, mempunyai batasannya. Yang paling penting adalah keuntungannya dikurangkan secara buatan tunggal... Dalam kebanyakan situasi konflik praktikal, ketika mengembangkan strategi yang masuk akal, perlu mengambil kira bukan satu, tetapi beberapa parameter numerik - kriteria kejayaan acara tersebut. Strategi yang optimum pada satu kriteria tidak semestinya optimum pada yang lain. Namun, setelah mengetahui batasan-batasan ini dan karena itu tidak mematuhi saranan yang diperoleh dengan kaedah permainan secara membabi buta, seseorang masih boleh menggunakan alat matematik teori permainan untuk mengembangkan, jika tidak tepat "optimum", maka, setidaknya, strategi "dapat diterima" .

§ 2. Harga permainan yang lebih rendah dan lebih tinggi. Prinsip minimax

Pertimbangkan permainan mxn dengan matriks seperti dalam Gambar. 1. Mari kita nyatakan dengan huruf i bilangan strategi kita; huruf j adalah bilangan strategi lawan. Mari kita tentukan sendiri tugas: untuk menentukan strategi optimum kita. Mari analisis setiap strategi kami secara berurutan, bermula dengan A 1.

Memilih strategi А i, kita harus selalu mengandalkan fakta bahawa musuh akan membalasnya dengan strategi В j yang imbal hasil kita minimum. Mari tentukan nilai pembayaran ini, iaitu minimum nombor a ij i baris ke-5. Marilah kita menunjukkannya dengan α i:

Di sini, tanda min (minimum dalam j) menunjukkan minimum nilai parameter ini untuk semua kemungkinan j. Mari kita tuliskan nombor α i; di sebelah matriks di sebelah kanan sebagai lajur tambahan:

Memilih sebarang strategi A i, kita mesti bergantung pada kenyataan bahawa sebagai hasil tindakan wajar pihak lawan kita tidak akan menang lebih banyak daripada α i. Secara semula jadi, bertindak dengan berhati-hati dan bergantung pada musuh yang paling munasabah (iaitu mengelakkan risiko), kita harus fokus pada strategi yang bilangan maksimumnya adalah maksimum. Mari kita nyatakan nilai maksimum α ini:

atau, dengan mengambil kira formula (2.1),

Nilai α disebut harga permainan yang lebih rendah, dengan kata lain, kemenangan maximin atau sekadar maximin. Nombor α terletak pada garis matriks tertentu; strategi pemain A yang sesuai dengan garis ini disebut strategi maksimin. Jelas, jika kita mematuhi strategi maksimin, maka untuk setiap tingkah laku musuh kita dijamin akan mendapat hasil, sekurang-kurangnya tidak kurang dari α. Oleh itu, nilai α disebut sebagai "harga permainan yang lebih rendah". Inilah minimum yang dijamin yang dapat kami sediakan dengan mematuhi strategi ("reasuransi") yang paling berhemah.

Jelas, alasan yang serupa dapat dilakukan untuk lawan B. Oleh kerana musuh berminat untuk meminimumkan kemenangan kita, dia mesti melihat setiap strategi dari sudut pandang kemenangan maksimum dengan strategi ini. Oleh itu, di bahagian bawah matriks, kami akan menuliskan nilai maksimum untuk setiap lajur:

dan cari minimum β j:

Nilai β disebut harga atas permainan, dengan kata lain, "minimax". Strategi lawan yang sesuai dengan keuntungan minimax disebut "strategi minimum" nya. Mematuhi strategi minimax yang paling berhati-hati, musuh memberi jaminan kepada dirinya sendiri perkara berikut: apa sahaja yang kita lakukan terhadapnya, dia akan kehilangan jumlah yang tidak lebih besar daripada β. Prinsip berhati-hati, yang menentukan pilihan strategi yang sesuai (maksimin dan minimax) untuk pemain, sering disebut "prinsip minimum" dalam teori permainan dan aplikasinya. Strategi maksimin dan minimax yang paling berhati-hati pemain kadang-kadang dilambangkan istilah umum"Strategi minimum".

Sebagai contoh, kami menentukan strategi permainan minimum dan atas dan strategi minimum untuk contoh 1, 2, dan 3 dari § 1.

Contoh 1. Contoh 1 § 1 memberikan permainan dengan matriks berikut:

Oleh kerana nilai α i dan β j adalah tetap dan sama dengan –1 dan +1, masing-masing, harga permainan yang lebih rendah dan atas juga –1 dan +1: α = –1, β = +1. Segala strategi pemain A adalah pepatahnya, dan strategi pemain B apa pun adalah strategi minimumnya. Kesimpulannya sepele: dengan mematuhi strategi apa pun, pemain A dapat menjamin bahawa dia kalah tidak lebih dari 1; perkara yang sama dapat dijamin oleh pemain B.

Contoh 2. Contoh 2 § 1 memberikan permainan dengan matriks:

Harga permainan yang lebih rendah ialah α = –3; harga atas permainan β = 4. Strategi maksimin kami ialah А 1; dengan menerapkannya secara sistematik, kita boleh mengharapkan kemenangan sekurang-kurangnya –3 (kalah paling banyak 3). Strategi minimax lawan adalah strategi B 1 dan B 2; menerapkannya secara sistematik, dia, dalam hal apa pun, dapat menjamin bahawa dia akan kehilangan tidak lebih dari 4. Jika kita menyimpang dari strategi maksimin kita (misalnya, memilih strategi A2), musuh dapat "menghukum" kita untuk ini dengan menerapkan strategi B 3 dan mengurangkan pembayaran kami adalah -5; begitu juga, pengunduran lawan dari strategi minimaxnya dapat meningkatkan kerugiannya menjadi 6.

Contoh 3. Contoh 3 § 1 memberikan permainan dengan matriks:

Harga permainan yang lebih rendah ialah α = 0.3; nilai atas permainan β = 0.7. Strategi paling konservatif (maksimin) kami adalah A 2; menggunakan persenjataan А 2, kami menjamin bahawa kami akan menembak pesawat secara purata sekurang-kurangnya 0.3 dalam semua kes. Strategi musuh yang paling berhati-hati (minimum) adalah B 2; Dengan menggunakan pesawat ini, musuh dapat memastikan bahawa dia akan terkena tidak lebih dari 0.7 semua kes.

Contoh terakhir adalah mudah untuk menunjukkannya harta penting strategi minimum - ketidakstabilannya. Anggaplah kita menggunakan strategi A 2 yang paling berhati-hati (maksimin), dan musuh menggunakan strategi B2 yang paling berhati-hati (minimum). Selagi kedua lawan mematuhi strategi ini, rata-rata hasilnya adalah 0.6; ia lebih besar dari bawah, tetapi lebih kecil harga teratas permainan. Sekarang mari kita anggap bahawa musuh telah mengetahui bahawa kita menggunakan strategi A 2; dia akan segera bertindak balas dengan strategi B 1 dan mengurangkan kemenangan menjadi 0.3. Sebagai gantinya, kita mempunyai jawapan yang baik untuk strategi B 1: strategi A 1, yang memberikan kita kemenangan 0,9, dan seterusnya.

Oleh itu, kedudukan di mana kedua pemain menggunakan strategi minimax mereka tidak stabil dan dapat dilanggar oleh maklumat yang diterima mengenai strategi pihak lawan. Walau bagaimanapun, terdapat beberapa permainan yang strategi minimumnya stabil. Ini adalah permainan yang harganya lebih rendah sama dengan yang lebih tinggi: α = β. Sekiranya harga permainan yang lebih rendah sama dengan yang lebih tinggi, maka harga mereka jumlah nilai dipanggil kos bersih permainan (kadang-kadang hanya kos permainan), kita akan menandakannya dengan huruf ν.

Mari lihat contohnya. Biarkan permainan 4 × 4 diberikan oleh matriks:

Mari cari harga permainan yang lebih rendah: α = 0.6. Mari cari harga atas permainan: β = 0.6. Mereka ternyata sama, oleh karena itu, permainan ini memiliki harga bersih sama dengan α = β = ν = 0.6. Elemen 0.6, yang disorot dalam matriks pembayaran, adalah minimum di barisnya dan maksimum di lajurnya. Dalam geometri, titik pada permukaan yang memiliki sifat serupa (minimum serentak sepanjang satu koordinat dan maksimum sepanjang yang lain) disebut titik pelana; secara analogi, istilah ini juga digunakan dalam teori permainan. Unsur matriks dengan sifat ini disebut titik pelana matriks, dan permainan dikatakan mempunyai titik pelana.

Titik pelana sesuai dengan sepasang strategi minimax (dalam contoh ini, A 3 dan B 2). Strategi-strategi ini disebut optimum, dan kombinasi mereka disebut penyelesaian untuk permainan. Penyelesaian permainan mempunyai yang berikut harta yang indah... Sekiranya salah satu pemain (misalnya, A) mematuhi strategi optimumnya, dan pemain lain (B) menyimpang dengan strategi optimumnya, maka untuk pemain yang membuat penyimpangan, ini tidak akan pernah bermanfaat, seperti penyimpangan pemain B dengan sebaiknya membiarkan kemenangan tidak berubah, dan dalam keadaan terburuk, meningkatkannya. Sebaliknya, jika B mematuhi strategi optimumnya, dan A menyimpang dari strategi sendiri, maka hal ini tidak dapat bermanfaat bagi A.

Pernyataan ini dapat disahkan dengan mudah dengan contoh permainan dengan titik pelana yang dipertimbangkan. Kami melihat bahawa dalam hal permainan dengan titik pelana, strategi minimax memiliki semacam "kestabilan": jika satu pihak mematuhi strategi minimumnya, maka mungkin hanya tidak menguntungkan bagi pihak lain untuk menyimpang dari permainannya sendiri. Perhatikan bahawa dalam kes ini, pengetahuan pemain bahawa musuh telah memilih strategi optimumnya tidak dapat mengubah tingkah laku pemain itu sendiri: jika dia tidak mahu bertindak melawan kepentingannya sendiri, dia harus mematuhi strategi optimumnya. Sepasang strategi optimum dalam permainan titik pelana adalah, seperti itu, "posisi keseimbangan": penyimpangan dari strategi optimum menyebabkan pemain yang menyimpang menjadi akibat yang tidak menguntungkan, memaksanya untuk kembali ke posisi semula.

Jadi, untuk setiap permainan titik pelana, ada penyelesaian yang menentukan sepasang strategi optimum untuk kedua-dua belah pihak, yang mempunyai sifat berikut.

1) Sekiranya kedua-dua pihak mematuhi strategi optimum mereka, maka rata-rata pembayarannya sama dengan harga bersih permainan ν, yang pada masa yang sama adalah harga yang lebih rendah dan lebih tinggi.

2) Jika salah satu pihak mematuhi strategi optimumnya, dan yang lain menyimpang dari strategi sendiri, maka pihak yang menyimpang hanya dapat kalah dari ini dan dalam hal apapun tidak dapat meningkatkan keuntungannya.

Kelas permainan dengan titik pelana sangat menarik dari sudut pandangan teori dan praktikal. Dalam teori permainan, terbukti bahawa, khususnya, setiap permainan dengan maklumat lengkap mempunyai titik pelana, dan, oleh itu, setiap permainan tersebut mempunyai jalan keluar, yaitu. terdapat sepasang strategi optimum kedua-dua belah pihak, memberikan hasil rata-rata sama dengan harga permainan. Sekiranya permainan dengan maklumat lengkap hanya terdiri dari gerakan peribadi, maka ketika setiap pihak menggunakan strategi optimumnya, permainan harus selalu berakhir dengan hasil yang pasti, iaitu kemenangan yang sama dengan harga permainan.

Sebagai contoh permainan dengan maklumat lengkap, kami memberikan permainan terkenal dengan menyusun duit syiling meja bulat... Dua pemain bergantian meletakkan syiling yang sama di meja bulat, setiap kali memilih kedudukan sewenang-wenang di tengah-tengah duit syiling; pertindihan syiling tidak dibenarkan. Pemain yang meletakkan duit syiling terakhir menang (apabila tidak ada ruang untuk orang lain). Jelas, hasil permainan ini selalu menjadi kesimpulan yang terdahulu, dan ada strategi yang dapat ditentukan yang memastikan kemenangan yang boleh dipercayai untuk pemain yang mengutamakan koin. Yaitu, dia mesti meletakkan duit syiling di tengah meja untuk pertama kalinya, dan kemudian bertindak balas dengan gerakan simetri pada setiap gerakan lawan. Dalam kes ini, pemain kedua dapat bersikap sesuka hati tanpa mengubah hasil permainan yang telah ditentukan. Oleh itu, permainan ini hanya masuk akal untuk pemain yang tidak mengetahui strategi yang optimum. Keadaannya serupa dengan catur dan permainan lain dengan maklumat lengkap; mana-mana permainan ini mempunyai titik pelana dan penyelesaian yang menunjukkan kepada setiap pemain strategi optimumnya; penyelesaian permainan catur belum dijumpai hanya kerana jumlah kombinasi kemungkinan pergerakan catur terlalu besar sehingga tidak dapat membina matriks pembayaran dan mencari titik pelana di dalamnya.

§ 3. Strategi murni dan bercampur. Penyelesaian permainan dalam strategi campuran

Di antara permainan penting yang praktikal, permainan dengan titik pelana agak jarang berlaku; lebih tipikal berlaku apabila harga bawah dan teratas permainan berbeza. Menganalisis matriks permainan seperti itu, kami sampai pada kesimpulan bahawa jika setiap pemain diberi pilihan strategi tunggal, maka, dengan mengandalkan lawan yang bertindak wajar, pilihan ini harus ditentukan oleh prinsip minimax. Mematuhi strategi maksimin kami, untuk tingkah laku lawan apa pun, kami dengan sengaja menjamin hasil yang sama dengan harga permainan α yang lebih rendah. Satu persoalan semula jadi timbul: adakah mungkin untuk menjamin diri anda hasil rata-rata lebih besar daripada α, jika anda tidak menggunakan satu strategi "murni", tetapi secara bergantian mengganti beberapa strategi? Strategi gabungan seperti itu, yang terdiri dalam penerapan beberapa strategi murni yang bergantian menurut hukum rawak dengan nisbah frekuensi tertentu, disebut strategi campuran dalam teori permainan.

Jelas, setiap strategi murni adalah kes khas dari gabungan, di mana semua strategi, kecuali satu, diterapkan dengan frekuensi sifar, dan ini - dengan frekuensi 1. Ternyata, menerapkan bukan hanya murni, tetapi juga strategi campuran, seseorang dapat memperoleh untuk setiap penyelesaian permainan terhingga, iaitu sepasang strategi (umumnya dicampur) seperti ketika kedua pemain menerapkannya, hasilnya akan sama dengan harga permainan, dan untuk penyimpangan satu sisi dari strategi yang optimal, hasilnya hanya dapat berubah ke arah yang tidak menguntungkan yang menyimpang.

Pernyataan di atas merupakan isi dari teori utama permainan teori yang disebut. Teorema ini pertama kali dibuktikan oleh von Neumann pada tahun 1928. Bukti teorem yang diketahui agak rumit; oleh itu, kami hanya memaparkan rumusannya.

Setiap permainan akhir mempunyai sekurang-kurangnya satu penyelesaian (mungkin dalam bidang strategi campuran).

Keuntungan yang dihasilkan dari keputusan disebut kos permainan. Teorema utama menunjukkan bahawa setiap permainan terhingga mempunyai harga. Jelas, harga permainan ν selalu terletak di antara harga permainan α yang lebih rendah dan harga permainan yang lebih tinggi β:

(3.1) α ≤ ν ≤ β

Memang, α adalah hasil maksimum yang dijamin yang dapat kita sediakan dengan menggunakan strategi murni kita sahaja. Oleh kerana strategi campuran merangkumi, sebagai kes tertentu, semua strategi yang murni, maka, di samping strategi yang murni, juga strategi campuran, kita, bagaimanapun juga, tidak memperburuk kemampuan kita; oleh itu, ν ≥ α. Begitu juga, dengan mempertimbangkan kemampuan lawan, kita menunjukkan bahawa ν ≤ β, yang menunjukkan ketidaksamaan yang terbukti (3.1).

Mari kita memperkenalkan notasi khas untuk strategi campuran. Sekiranya, misalnya, strategi campuran kita terdiri dalam menerapkan strategi A 1, A 2, A 3 dengan frekuensi p 1, p 2, p 3, dan p 1 + p 2 + p 3 = 1, kita akan menunjukkan strategi ini

Begitu juga, strategi campuran musuh akan dilambangkan dengan:

di mana q 1, q 2, q 3 adalah frekuensi di mana strategi B 1, B 2, B 3 dicampur; q 1 + q 2 + q 3 = 1.

Anggaplah kita telah menemui penyelesaian untuk permainan, yang terdiri daripada dua strategi campuran optimum S A *, S B *. Dalam kes umum, tidak semua strategi murni yang tersedia untuk pemain tertentu termasuk dalam strategi campurannya yang optimum, tetapi hanya beberapa. Kami akan menyebut strategi yang termasuk dalam strategi campuran pemain yang terbaik sebagai strategi "berguna". Ternyata penyelesaian untuk permainan itu mempunyai satu lagi harta yang luar biasa: jika salah satu pemain mematuhi strategi campurannya yang optimum SA * (SB *), maka pembayaran tetap tidak berubah dan sama dengan harga permainan ν, tanpa mengira apa yang dilakukan oleh pemain lain, kecuali dia melampaui strategi "berguna". Dia, misalnya, dapat menggunakan salah satu strategi "berguna" dalam bentuk murni, dan juga dapat mencampurkannya dalam perkadaran apa pun.

§ 4. Kaedah asas untuk menyelesaikan permainan. Permainan 2x2 dan 2xn

Sekiranya permainan mxn tidak mempunyai titik pelana, maka mencari jalan keluar adalah tugas yang agak sukar, terutama untuk m dan n yang besar. Kadang-kadang tugas ini dapat dipermudah dengan terlebih dahulu mengurangkan jumlah strategi dengan menghapus beberapa strategi yang tidak perlu. Strategi berlebihan adalah a) pendua dan b) jelas tidak menguntungkan. Pertimbangkan, misalnya, permainan dengan matriks:

Adalah mudah untuk memastikan bahawa strategi А 3 mengulangi tepat ("pendua") strategi А 1, oleh itu, salah satu daripada kedua strategi ini dapat dihapuskan. Selanjutnya, membandingkan baris A 1 dan A 2, kita melihat bahawa setiap elemen baris A2 kurang (atau sama dengan) elemen baris A1 yang sepadan. Jelas sekali, kita tidak boleh menggunakan strategi A2, sengaja tidak menguntungkan. Dengan menghapus A 3 dan A 2, kami membawa matriks menjadi lebih banyak fikiran sederhana... Selanjutnya, kita perhatikan bahawa strategi B 3 jelas tidak menguntungkan musuh; menghapusnya, kami membawa matriks ke bentuk terakhirnya:

Oleh itu, permainan 4 × 4 diturunkan menjadi permainan 2 × 3 dengan menghilangkan strategi pendua dan jelas merugikan.

Prosedur untuk menghapus strategi pendua dan jelas tidak semestinya selalu mendahului keputusan permainan. Kes permainan terhingga yang paling mudah yang selalu dapat diselesaikan dengan kaedah asas adalah permainan 2 × 2 dan 2xn.

Pertimbangkan permainan 2 × 2 dengan matriks:

Dua kes boleh berlaku di sini: 1) permainan mempunyai titik pelana; 2) permainan tidak mempunyai titik pelana. Dalam kes pertama, penyelesaiannya jelas: ini adalah sepasang strategi yang bersilang pada titik pelana. By the way, perhatikan bahawa dalam permainan 2 × 2, kehadiran titik pelana selalu sesuai dengan keberadaan strategi yang sengaja menguntungkan yang harus dihapus dalam analisis awal.

Jangan ada titik pelana dan, oleh itu, harga permainan yang lebih rendah tidak sama dengan yang atas: α ≠ β. Diperlukan untuk mencari strategi campuran pemain A yang optimum:

Ia dibezakan oleh harta benda bahawa, apa pun tindakan lawan (kecuali dia melampaui batas strategi "berguna"), hasilnya akan sama dengan harga permainan ν. Dalam permainan 2 × 2, kedua strategi musuh "berguna", jika tidak, permainan akan mempunyai penyelesaian strategi murni (titik pelana). Ini bermaksud bahawa jika kita mematuhi strategi optimum kita (4.1), maka musuh dapat menggunakan salah satu strategi murni B 1, B 2 tanpa mengubah rata-rata hasil v. Oleh itu, kita mempunyai dua persamaan:

dari mana, dengan mengambil kira bahawa p 1 + p 2 = 1, kita memperoleh:

Kami menjumpai nilai permainan ν dengan menggantikan nilai p 1, p 2 ke dalam mana-mana persamaan (4.2).

Sekiranya harga permainan diketahui, maka untuk menentukan strategi lawan yang optimum

satu persamaan sudah cukup, contohnya:

dari mana, dengan mengambil kira bahawa q 1 + q 2 = 1, kita mempunyai:

Contoh 1. Mari kita cari penyelesaian permainan 2 × 2 yang dipertimbangkan dalam Contoh 1 § 1, dengan matriks:

Permainan ini tidak mempunyai titik pelana (α = –1; β = +1), dan oleh itu, penyelesaiannya mesti terletak pada domain strategi campuran:

Anda perlu mencari p 1, p 2, q 1 dan q 2. Untuk p 1 kita mempunyai persamaan

1 * p 1 + (–1) (1 - p 1) = (–1) p 1 + 1 (1 - p 1)

dari mana p 1 = 1/2, p 2 = 1/2.

Begitu juga, kita dapati: q 1 = 1/2, q 2 = 1/2, ν = 0.

Oleh yang demikian, strategi optimum bagi setiap pemain adalah dengan menukar kedua-dua strategi murni mereka secara rawak, dengan menggunakan setiap strategi dengan cara yang sama; dalam kes ini, pembayaran purata akan sama dengan sifar.

Kesimpulan yang dihasilkan cukup jelas sebelumnya. Dalam contoh seterusnya, kita akan melihat lebih banyak lagi permainan yang sukar, penyelesaian yang tidak begitu jelas. Contohnya adalah contoh permainan asas yang dikenali sebagai permainan "menipu" atau "menipu". Dalam praktiknya, dalam situasi konflik, mereka sering digunakan cara yang berbeza menyesatkan musuh (salah maklumat, penempatan sasaran palsu, dll.). Contohnya, walaupun ringkas, cukup memberi pengajaran.

Contoh 2. Permainannya adalah seperti berikut. Terdapat dua kad: ace dan deuce. Pemain A menarik salah satu daripadanya secara rawak; B tidak melihat kad mana yang dikeluarkannya. Jika A mengeluarkan ace, dia menyatakan: "Saya punya ace," dan menuntut dari lawan 1 rubel. Sekiranya A mengambil deuce, maka dia dapat A 1) mengatakan "Saya punya ace" dan menuntut 1 rubel dari lawan, atau A 2) mengakui bahawa dia memiliki deuce dan membayar lawan 1 rubel.

Musuh, jika dia dibayar 1 rubel secara sukarela, hanya dapat menerimanya. Sekiranya 1 rubel dituntut kepadanya, maka dia dapat B 1) mempercayai pemain A bahawa dia memiliki ace dan memberinya 1 rubel, atau B 2) meminta cek untuk memastikan pernyataan A. periksa ternyata A benar-benar mempunyai ace, B mesti membayar A 2 rubel. Sekiranya ternyata A menipu dan dia mempunyai tipu daya, pemain A membayar pemain B 2 rubel. Diperlukan untuk menganalisis permainan dan mencari strategi yang optimum untuk setiap pemain.

Keputusan. Permainan ini mempunyai struktur yang agak kompleks; ia terdiri daripada satu gerakan rawak wajib - pilihan pemain A untuk salah satu daripada dua kad - dan dua pergerakan peribadi, yang, bagaimanapun, tidak semestinya berlaku. Memang, jika A mengeluarkan ace, maka dia tidak melakukan pergerakan peribadi: dia hanya mempunyai satu peluang - untuk menuntut 1 rubel, yang dia lakukan. Dalam kes ini, langkah peribadi - untuk mempercayai atau tidak mempercayai (iaitu membayar atau tidak membayar 1 rubel) - dipindahkan ke pemain B. Sekiranya A sebagai hasil langkah rawak pertama menerima dua, maka dia diberi peribadi bergerak: bayar 1 rubel atau cuba menipu musuh dan menuntut 1 rubel (ringkasnya: "jangan menipu" atau "menipu"). Sekiranya A memilih yang pertama, maka B hanya perlu menerima 1 rubel; jika A memilih yang terakhir, pemain B diberi langkah peribadi: percaya atau tidak percaya A (iaitu, bayar A 1 rubel atau minta pengesahan).

Strategi masing-masing pemain adalah peraturan yang menunjukkan bagaimana pemain harus bertindak ketika dia diberi gerakan peribadi. Jelas, A hanya mempunyai dua strategi: A 1 - untuk menipu, A 2 - untuk tidak menipu. B juga mempunyai dua strategi: B 1 - untuk mempercayai, B 2 - tidak percaya. Mari membina matriks permainan. Untuk melakukan ini, mari hitung rata-rata hasil untuk setiap kombinasi strategi.

1. A 1 B 1 (A menipu, B percaya). Sekiranya A menerima ace (kebarangkalian ini adalah ½, maka dia tidak diberi pergerakan peribadi; dia menuntut 1 rubel, dan pemain B mempercayainya; Keuntungan A dalam rubel adalah 1. Jika A menerima dua (kebarangkalian ini juga ½), menurut strateginya, dia menipu dan memerlukan 1 rubel; Percaya kepadanya dan membayar; pembayaran A juga sama dengan 1. Purata pembayaran: a 11 = ½ * 1 + ½ * 1 = 1.

2. A 1 B 2 (A menipu, B tidak percaya). Sekiranya A mendapat ace, dia tidak mempunyai pergerakan peribadi; dia memerlukan 1 rubel; Menurut strateginya, dia tidak percaya dan, sebagai hasil pemeriksaan itu, membayar 2 rubel (keuntungan A adalah +2). Sekiranya A mendapat tipu daya, menurut strateginya, dia menuntut 1 rubel; B, menurut sendiri, tidak percaya; sebagai hasilnya, A membayar 2 rubel (keuntungan A adalah –2). Bayaran purata ialah: a 12 = ½ * (+ 2) + ½ * (- 2) = 0.

3. A 2 B 1 (A tidak menipu, B percaya). Sekiranya A mengeluarkan ace, dia menuntut 1 rubel; B, mengikut strateginya, membayar; keuntungan A ialah +1. Sekiranya A mengambil tipu daya, dia membayar 1 rubel mengikut strateginya; Yang tinggal untuk B adalah menerima (keuntungan A adalah –1). Bayaran purata ialah: a 21 = ½ * (+ 1) + ½ * (- 1) = 0.

4. A 2 B 2 (A tidak menipu, B tidak percaya). Sekiranya A mengeluarkan ace, dia menuntut 1 rubel; B cek dan, sebagai hasil daripada cek tersebut, membayar 2 rubel (kemenangannya adalah +2). Sekiranya A menipu, dia membayar 1 rubel; Yang tinggal hanyalah menerima (hasilnya adalah 1). Purata pembayaran adalah: a 22 = ½ * (+ 2) + ½ * (- 1) = ½.

Kami membina matriks permainan:

Matriks tidak mempunyai titik pelana. Harga permainan yang lebih rendah adalah α = 0, harga permainan yang lebih tinggi adalah β = ½. Mari cari jalan penyelesaian dalam permainan strategi campuran. Dengan menggunakan formula (4.3), kami mendapat:

mereka. Pemain A mesti menggunakan strategi pertamanya (menipu) dalam satu pertiga daripada semua kes, dan yang kedua (bukan menipu) dalam dua pertiga. Dalam kes ini, dia akan menang secara rata-rata harga permainan ν = 1/3.

Nilai ν = 1/3 menunjukkan bahawa dalam keadaan ini permainan bermanfaat untuk A dan tidak menguntungkan bagi B. Dengan menggunakan strategi optimumnya, A selalu dapat memberikan hasil rata-rata positif kepada dirinya. Perhatikan bahawa jika A menggunakan strategi (maximin) yang paling berhati-hati (dalam kes ini, kedua strategi A 1 dan A 2 adalah maksimin), dia akan mendapat rata-rata hasil sama dengan sifar. Oleh itu, penggunaan strategi campuran memberi peluang kepada A untuk merealisasikan kelebihannya berbanding B, yang timbul berdasarkan peraturan permainan yang diberikan.

Mari tentukan strategi optimum B. Kami mempunyai: q 1 * 1 + q 2 * 0 = 1/3, q 1 = 1/3, q 2 = 2/3. Dari mana

i.e. pemain B mesti mempercayai A pada satu pertiga daripada semua kes dan membayarnya 1 rubel tanpa pemeriksaan, dan dalam dua pertiga kes - periksa. Kemudian, dia rata-rata akan kalah 1/3 untuk setiap permainan. Sekiranya dia menggunakan strategi minimax murni B 2 (tidak percaya), dia akan kalah rata-rata 1/2 untuk setiap permainan.

Penyelesaian untuk permainan 2 × 2 dapat diberikan interpretasi geometri yang mudah. Biarkan ada permainan 2 × 2 dengan matriks

Ambil bahagian paksi absis dengan panjang 1 (Gamb. 4.1). Bahagian kiri bahagian (titik dengan absis x = 0) akan mewakili strategi A 1; hujung bahagian kanan (x = 1) - strategi A 2. Mari kita lukis dua tegak lurus ke paksi absis melalui titik А 1 dan А 2: paksi Saya–I dan paksi II - II... Pada paksi Saya–I kami akan menangguhkan kemenangan untuk strategi A 1; pada paksi II - II-kemenangan dengan strategi A 2. Pertimbangkan strategi lawan B 1; ia memberikan dua titik pada paksi Saya–I dan II - II dengan ordinat 11 dan 21, masing-masing. Mari kita lukis garis lurus B 1 B 1 melalui titik-titik ini. Jelas, jika kita menerapkan strategi campuran untuk strategi musuh B 1

maka hasil purata kami, sama dalam kes ini dengan 11 p 1 + 21 p 2, ditunjukkan oleh titik M pada baris B 1 B 1; abses titik ini sama dengan p 2. Garis lurus В 1 В 1, yang mewakili hasil dalam strategi В 1, secara konvensional akan disebut "strategi В 1".

Jelas, strategi B2 dapat dibangun dengan cara yang sama (Gambar 4.2).

Kita perlu mencari strategi yang optimum S A *, yaitu strategi yang mana minimum pembayaran (untuk tingkah laku B) akan berubah menjadi maksimum. Untuk melakukan ini, kami membina batas bawah untuk pembayaran strategi B 1, B 2, iaitu garis putus B 1 NB 2 ditandakan dalam Rajah. 4.2 dengan garis berani. Had bawah ini akan menyatakan pembayaran minimum pemain A untuk sebarang strategi campurannya; titik N, di mana keuntungan minimum ini mencapai maksimum, menentukan keputusan dan harga permainan. Adalah mudah untuk mengesahkan bahawa titik titik N adalah harga permainan ν, dan absesnya sama dengan p 2 - kekerapan penerapan strategi A 2 dalam strategi campuran S A * yang optimum.

Dalam kes kami, keputusan permainan ditentukan oleh titik persimpangan strategi. Walau bagaimanapun, ini tidak akan selalu berlaku; dalam rajah. 4.3 menunjukkan kes apabila, walaupun terdapat persimpangan strategi, jalan keluarnya memberikan strategi murni untuk kedua pemain (A 2 dan B 2), dan harga permainan ν = a 22. Dalam kes ini, matriks mempunyai titik pelana, dan strategi A 1 jelas tidak menguntungkan, sejak untuk strategi lawan yang murni, ia memberikan keuntungan lebih sedikit daripada A2.

Sekiranya musuh mempunyai strategi yang tidak menguntungkan, penafsiran geometri mempunyai bentuk yang ditunjukkan dalam Gambar. 4.4.

Dalam kes ini, batas bawah pembayaran bertepatan dengan strategi B 1, strategi B 2 jelas tidak menguntungkan lawan.

Tafsiran geometri memungkinkan untuk memvisualisasikan harga permainan yang lebih rendah dan lebih tinggi (Gamb. 4.5).

Untuk menggambarkan, kami membina interpretasi geometri permainan 2 × 2 yang dipertimbangkan dalam contoh 1 dan 2 (Rajah 4.6 dan 4.7).

Kami telah memastikan bahawa mana-mana permainan 2 × 2 dapat diselesaikan dengan trik asas. Sebarang permainan 2xn dapat diselesaikan dengan cara yang sama. di mana kita hanya mempunyai dua strategi, dan musuh mempunyai bilangan sewenang-wenangnya.

Katakan kita mempunyai dua strategi: А 1, А 2, dan strategi musuh - n: В 1, В 2, ..., В n. Matriks ‖a ij ‖ diberikan; ia terdiri daripada dua baris dan tiang n. Sama seperti kes dua strategi, kami memberikan masalah sebagai interpretasi geometri; strategi n musuh dilambangkan oleh garis lurus n (Gamb. 4.8). Kami membina batas kemenangan yang lebih rendah (garis putus B 1 MNB 2) dan menemukan titik N dengan koordinat maksimum. Titik ini memberikan jalan penyelesaian kepada permainan (strategi ) ordinat titik N sama dengan harga permainan ν, dan abses sama dengan frekuensi p 2 strategi A 2.

Dalam kes ini, strategi optimum lawan diperoleh dengan menggunakan campuran dua strategi "berguna": B 2 dan B 4, bersilang pada titik N. Strategi B 3 jelas tidak menguntungkan, dan strategi B 1 tidak menguntungkan untuk strategi optimum SA *. Sekiranya A berpegang pada strategi optimumnya, maka hasilnya tidak akan berubah, mana pun strategi "berguna" B yang digunakan, namun, ia akan berubah jika B beralih ke strategi B 1 atau B 3. Dalam teori permainan, terbukti bahawa setiap permainan mxn terhingga mempunyai penyelesaian di mana bilangan strategi "berguna" di kedua-dua belah pihak tidak melebihi sekurang-kurangnya dua nombor m dan n. Secara khusus, dari itu permainan 2xm selalu mempunyai penyelesaian di mana tidak lebih dari dua strategi "berguna" berpartisipasi di kedua-dua belah pihak.

Dengan menggunakan interpretasi geometri, seseorang dapat memberikan cara mudah untuk menyelesaikan permainan 2xm. Secara langsung dari gambar, kita dapati sepasang strategi "berguna" musuh B j dan B k, bersilang pada titik N (jika lebih dari dua strategi berpotongan di titik N, kita mengambil dua daripadanya). Kami tahu bahawa jika pemain A mematuhi strategi optimumnya, maka pembayarannya tidak bergantung pada perkadaran di mana dia menerapkan B untuk strategi "berguna", oleh itu,

Dari persamaan ini dan keadaan p 2 = 1 - p 1, kita dapati p1, p2 dan harga permainan ν. Mengetahui harga permainan, anda dapat segera menentukan strategi yang optimum pemain B. Untuk ini, sebagai contoh, persamaan diselesaikan: qja 1 j + qka 1 k = ν, di mana qj + qk = 1. Sekiranya kita mempunyai strategi m, dan musuh hanya mempunyai dua, jelas, masalah diselesaikan dengan cara yang sama; sudah cukup untuk memperhatikan bahawa dengan mengubah tanda kemenangan menjadi lawan, seseorang dapat mengubah pemain A dari "menang" menjadi "kalah". Anda boleh menyelesaikan permainan tanpa menukar tanda kemenangan; maka masalah itu diselesaikan secara langsung untuk B, tetapi bukan yang lebih rendah, tetapi hasil atasnya dibina (Gbr. 4.9). Di sempadan, titik N dengan koordinat minimum dicari, yang merupakan harga permainan ν.

Pertimbangkan dan selesaikan beberapa contoh permainan 2 × 2 dan 2xm, yang merupakan contoh permainan ringkas yang penting.

Contoh 3. Sisi A menghantar dua pengebom ke kawasan musuh B Saya dan II; Saya terbang di hadapan, II- belakang. Salah satu pengebom - tidak diketahui terlebih dahulu yang mana - mesti membawa bom, yang lain bertindak sebagai pengiring. Di kawasan musuh, pengebom diserang oleh pejuang sebelah B. Pengebom bersenjatakan meriam dengan pelbagai kadar tembakan. Sekiranya pejuang menyerang pengebom belakang II, kemudian hanya meriam pengebom ini menembaknya; jika dia menyerang pengebom depan, maka meriam kedua pengebom menembak ke arahnya. Kebarangkalian memukul pejuang dalam kes pertama adalah 0.3, pada 0.7 kedua.

Sekiranya pesawat tempur tidak ditembak jatuh oleh tembakan pengebom pertahanan, maka ia menyerang sasaran pilihannya dengan kemungkinan 0.6. Tugas pengebom adalah membawa bom ke sasaran; tugas pejuang adalah untuk mencegah ini, iaitu menembak pengebom pengangkut. Diperlukan untuk memilih strategi pihak yang optimum:

a) untuk sisi A: pengebom mana yang harus digunakan sebagai kapal pengangkut?

b) untuk bahagian B: pengebom mana yang hendak diserang?

Keputusan. Kami mempunyai kes sederhana permainan 2 × 2; kebarangkalian menang kekalahan pembawa. Strategi kami: Pengebom 1 - pengangkut Saya; Pengebom 2 - kapal induk II... Strategi musuh: B 1 - pengebom diserang Saya; B 2 - serangan pengebom II... Mari menyusun matriks permainan, iaitu cari hasil purata bagi setiap kombinasi strategi.

1.A 1 B 1 (pembawa Saya, diserang Saya). Kapal pengangkut tidak akan dilanggar jika pengebom menembak jatuh pejuang, atau tidak menembak jatuh, tetapi ia tidak akan mencapai sasarannya: 11 = 0.7 + 0.3 * 0.4 = 0.82.

2.A 2 B 1 (pembawa II, diserang Saya). a 21 = 1

3.A 1 B 2 (pembawa Saya, diserang II). A 12 = 1

4.A 2 B 2 (pembawa II, diserang II). A 22 = 0.3 + 0.7 * 0.4 = 0.58

Matriks permainan mempunyai bentuk:

Harga bawah permainan adalah 0.82; harga teratas 1. Matrix tidak mempunyai titik pelana; kami mencari jalan penyelesaian dalam bidang strategi campuran. Kami mempunyai:

p 1 * 0.82 + p 2 * 1 = ν

p 1 * 1 + p 2 * 0.58 = ν

p 1 = 0.7; p 2 = 0.3

Strategi optimum kami adalah, sebagai pembawa, anda perlu memilih lebih kerap Saya daripada II... Harga permainan adalah ν = 0.874. Mengetahui ν, kita menentukan q 1 dan q 2 - kekerapan strategi B 1 dan B 2 dalam strategi optimum lawan B B *. Kami mempunyai: q 1 * 0.82 + q 2 * 1 = 0.874 dan q 2 = 1 - q 1, dari mana q 1 = 0.7; q 2 = 0.3, iaitu strategi optimum lawan adalah .

Contoh 4. Sisi A menyerang objek, sisi B mempertahankannya. Bahagian A mempunyai dua satah; sisi B mempunyai tiga senjata anti-pesawat. Setiap pesawat membawa senjata pemusnah yang kuat; agar objek itu terkena, cukup untuk sekurang-kurangnya satu pesawat menerobosnya. Pesawat Side A boleh memilih salah satu daripada tiga arah untuk mendekati kemudahan tersebut: Saya, II, III(rajah 4.10). Musuh (sebelah B) boleh meletakkan senapang ke arah mana pun; pada masa yang sama, setiap senjata hanya menembak kawasan yang berkaitan dengan arah yang diberikan, dan tidak menembak arah yang berdekatan. Setiap senapang hanya dapat menembak satu pesawat; satah yang dilepaskan dipukul dengan kebarangkalian 1. Bahagian A tidak tahu di mana senjata itu berada; sisi B tidak tahu dari mana pesawat akan datang. Tugas Side A adalah memukul objek; tugas pihak B adalah untuk mengelakkan kekalahannya. Cari penyelesaian untuk permainan.

Keputusan. Permainan ini adalah permainan 2 × 3. Hasilnya adalah kebarangkalian memukul objek. Strategi yang mungkin kami lakukan adalah: A 1 - hantar satu pesawat pada satu masa dalam dua arah yang berbeza. Dan 2 - hantar kedua-dua pesawat ke arah yang sama. Strategi musuh: B 1 - letakkan satu senjata ke setiap arah; Dalam 2 - letakkan dua senapang ke satu arah dan satu ke arah lain; Dalam 3 - letakkan ketiga-tiga senjata ke arah yang sama. Kami menyusun matriks permainan.

1.A 1 B 1 (pesawat terbang di sepanjang arah yang berbeza; senapang diletakkan satu demi satu). Jelas, dalam kes ini, tidak satah satah yang akan menerobos objek: a 11 = 0.

2. А 2 В 1 (pesawat terbang bersama dalam arah yang sama; senapang diletakkan satu persatu). Jelas, dalam kes ini, satu satah akan melintas ke objek tanpa menembak: a 21 = 1.

3. А 1 В 2 (pesawat terbang satu demi satu; musuh mempertahankan dua arah dan membiarkan yang ketiga tidak dilindungi). Kebarangkalian sekurang-kurangnya satu pesawat menerobos ke objek sama dengan kebarangkalian bahawa salah satu daripadanya akan memilih arah yang tidak dilindungi: 12 = 2/3.

4. А 2 В 2 (pesawat terbang bersama dalam satu arah; musuh mempertahankan satu arah dengan dua senapang dan satu dengan satu, iaitu, sebenarnya mempertahankan satu arah dan meninggalkan dua yang tidak dilindungi). Kebarangkalian sekurang-kurangnya satu pesawat menerobos objek sama dengan kebarangkalian sepasang satah memilih arah yang sebenarnya tidak dilindungi: 22 = 2/3.

5. A 1 B 3 (pesawat terbang satu demi satu; musuh hanya mempertahankan satu arah dengan tiga senjata): 13 = 1.

6. А 2 В 3 (kedua-dua pesawat terbang bersama; musuh hanya mempertahankan satu arah dengan tiga senjata). Untuk objek yang hendak dilanggar, pesawat mesti memilih arah yang tidak dilindungi: 23 = 2/3.

Matrik Permainan:

Dari matriks dapat dilihat bahawa strategi В 3 jelas tidak menguntungkan dibandingkan dengan В 2 (ini mungkin telah diselesaikan sebelumnya). Strategi mencabar Dalam 3, permainan diturunkan menjadi permainan 2 × 2:

Matriks mempunyai titik pelana: harga bawah permainan 2/3 bertepatan dengan yang teratas. Pada masa yang sama, kami perhatikan bahawa bagi kami (A) strategi A 1 jelas tidak menguntungkan. Kesimpulan: kedua-dua pihak A dan B harus selalu menggunakan strategi murni mereka A 2 dan B 2, iaitu kita harus menghantar pesawat dengan 2, memilih secara rawak arah ke mana pasangan dihantar; musuh harus meletakkan senjatanya dengan cara berikut: dua - dalam satu arah, satu - yang lain, dan pilihan arah ini juga harus dibuat secara rawak (di sini, seperti yang kita lihat, sudah "strategi murni" merangkumi unsur peluang). Dengan menerapkan strategi optimum ini, kita akan selalu mendapat rata-rata pembayaran tetap 2/3 (iaitu objek akan terkena 2/3 kebarangkalian). Perhatikan bahawa penyelesaian yang dijumpai untuk permainan bukan satu-satunya; sebagai tambahan kepada penyelesaian strategi murni, terdapat keseluruhan bahagian strategi campuran pemain A, yang optimum, dari p 1 = 0 hingga p 1 = 1/3 (Gambar 4.11).

Sangat mudah, misalnya, untuk memastikan secara langsung bahawa pembayaran rata-rata yang sama dengan 2/3 akan diperoleh jika kita menerapkan strategi A1 dan A2 dalam perkadaran 1/3 dan 2/3.

Contoh 5. Keadaannya sama seperti pada contoh sebelumnya, tetapi mungkin ada empat arah serangan untuk kita, dan musuh memiliki empat senjata.

Keputusan. Kami masih mempunyai dua strategi yang mungkin: A 1 - hantar pesawat satu demi satu, A 2 - hantar dua pesawat bersama-sama. Musuh mempunyai lima strategi yang mungkin: B 1 - letakkan satu senjata ke setiap arah; Dalam 2 - letakkan dua senjata ke dua arah yang berbeza; Dalam 3 - letakkan dua senapang dalam satu arah dan satu demi satu - pada dua yang lain; Pada 4, letakkan tiga senapang ke satu arah dan satu ke arah lain; Pada 5 - letakkan keempat-empat senjata ke arah yang sama. Strategi B 4, B 5 akan dibuang terlebih dahulu kerana jelas tidak menguntungkan. Beralasan sama dengan contoh sebelumnya, kami membina matriks permainan:

Harga permainan yang lebih rendah adalah 1/2, yang lebih tinggi adalah 3/4. Matriks tidak mempunyai titik pelana; penyelesaiannya terletak pada bidang strategi campuran. Dengan menggunakan tafsiran geometri (Gamb. 4.12), marilah kita memisahkan strategi "berguna" musuh: B 1 dan B 2.

Frekuensi p 1 dan p 2 ditentukan dari persamaan: p 1 * 0 + (1 - p 1) * 1 = ν dan p 1 * 5/6 + (1 - p 1) * 1/2 = ν; dari mana p 1 = 3/8; p 2 = 5/8; ν = 5/8, iaitu strategi optimum kami adalah ... Dengan menggunakannya, kami menjamin kemenangan rata-rata 5/8. Mengetahui harga permainan ν = 5/8, kita dapati frekuensi q 1 dan q 2 strategi "berguna" lawan: q 1 * 0 + (1 - q 1) * 5/6 = 5/8, q 1 = ¼, q 2 = ¾. Strategi optimum musuh adalah: .

Contoh 6. Sisi A mempunyai dua strategi A 1 dan A 2, sisi B mempunyai empat B 1, B 2, B 3 dan B 4. Matriks permainan mempunyai bentuk:

Cari penyelesaian untuk permainan.

Keputusan. Harga bawah permainan adalah 3; atas 4. Tafsiran geometri (rajah 4.13) menunjukkan bahawa strategi berguna pemain B ialah B 1 dan B 2 atau B 2 dan B 4:

Pemain A mempunyai banyak strategi campuran yang optimum: dalam strategi optimum, p 1 dapat bervariasi dari 1/5 hingga 4/5. Harga permainan ν = 4. Pemain B mempunyai strategi optimum murni B 2.

§ lima. Kaedah biasa penyelesaian permainan akhir

Setakat ini, kami hanya mempertimbangkan permainan paling asas dari jenis 2xn, yang dapat diselesaikan dengan sangat mudah dan memungkinkan penafsiran geometri yang mudah dan intuitif. Dalam kes umum, menyelesaikan permainan mxn adalah masalah yang agak sukar, dan kerumitan masalah dan jumlah pengiraan yang diperlukan untuk menyelesaikannya meningkat secara mendadak dengan peningkatan m dan n. Walau bagaimanapun, kesukaran ini tidak bersifat mendasar dan hanya dikaitkan dengan jumlah pengiraan yang sangat besar, yang dalam beberapa kes mungkin tidak praktikal. Aspek asas kaedah untuk mencari penyelesaian tetap sama untuk setiap m.

Mari kita gambarkan ini dengan contoh permainan 3xn. Mari berikan tafsiran geometri - sudah menjadi ruang. Tiga strategi kami A 1, A 2 dan A 3 akan diwakili oleh tiga mata di satah hoy; yang pertama terletak pada asal (Gamb.5.1), yang kedua dan ketiga - pada sumbu Oh dan OU pada jarak 1 dari awal.

Paksi dilukis melalui titik A 1, A 2 dan A 3 SayaSaya, IIII dan IIIIII tegak lurus dengan satah hoy... Pada paksi SayaSaya keuntungan disimpan dengan strategi A 1 pada paksi IIII dan IIIIII- kemenangan dengan strategi A 2, A 3. Setiap strategi musuh B j digambarkan oleh pesawat yang memotong pada sumbu SayaSaya, IIII dan IIIIII segmen sama dengan hasil untuk strategi yang sesuai A 1, A 2 dan A 3 dan strategi B j. Dengan demikian telah membina semua strategi musuh, kita mendapatkan sekelompok pesawat di atas segitiga A 1, A 2 dan A 3 (Gambar 5.2). Untuk keluarga ini, mungkin juga untuk membina batas pembayaran yang lebih rendah, seperti yang kita lakukan dalam kes 2xn, dan temukan di sempadan ini titik N dengan ketinggian maksimum di atas kapal terbang hoy... Ketinggian ini akan menjadi kos permainan ν.

Frekuensi p 1, p 2, p 3 strategi A 1, A 2 dan A 3 dalam strategi optimum SA * akan ditentukan oleh koordinat (x, y) titik N, iaitu: p 2 = x, p 3 = y, p 1 = 1 - p 2 - p 3. Walau bagaimanapun, pembinaan geometri seperti itu, walaupun untuk casing 3xn, tidak mudah dilaksanakan dan memerlukan banyak masa dan usaha imaginasi. Dalam kes umum permainan, bagaimanapun, ia dipindahkan ke ruang m-dimensi dan kehilangan semua kejelasan, walaupun penggunaan terminologi geometri dalam sejumlah kes mungkin berguna. Semasa menyelesaikan permainan mxn, dalam praktiknya lebih mudah menggunakan bukan analogi geometri, tetapi kaedah analisis komputasi, terutamanya kerana kaedah ini adalah satu-satunya kaedah yang sesuai untuk menyelesaikan masalah pada komputer.

Semua kaedah ini pada dasarnya berfungsi untuk menyelesaikan masalah dengan percubaan berturut-turut, tetapi memerintahkan urutan percubaan membolehkan anda membina algoritma yang membawa kepada penyelesaian dengan cara yang paling ekonomik. Di sini kita akan secara ringkas membahas satu kaedah komputasi untuk menyelesaikan permainan mxn - kaedah yang disebut "pengaturcaraan linear". Untuk ini, pertama-tama kami memberikan pernyataan umum mengenai masalah mencari jalan keluar untuk permainan mxn. Biarkan permainan mxn dengan strategi m A 1, A 2,…, A m pemain A dan strategi n B 1, B 2,…, B n pemain B diberikan dan matriks pembayaran ‖a i j ‖ diberikan. Diperlukan untuk mencari jalan keluar untuk permainan, mis. dua strategi campuran optimum pemain A dan B

di mana p 1 + p 2 + ... + p m = 1; q 1 + q 2 +… + q n = 1 (beberapa nombor p i dan q j mungkin sama dengan sifar).

Strategi optimum kita S A * harus memberi kita hasil tidak kurang dari ν untuk tingkah laku lawan, dan hasil sama dengan ν untuk tingkah laku optimumnya (strategi S B *). Begitu juga, strategi S B * mesti memberi lawan dengan kerugian yang tidak melebihi ν untuk tingkah laku kita dan sama dengan ν untuk tingkah laku optimum kita (strategi S A *).

Nilai harga permainan ν dalam kes ini tidak kita ketahui; kita akan menganggap bahawa ia sama dengan beberapa nombor positif... Dengan mempercayainya, kita tidak melanggar kewajaran akal; untuk ν> 0, jelas mencukupi bahawa semua elemen matriks ‖a i j ‖ menjadi tidak negatif. Ini selalu dapat dicapai dengan menambahkan unsur ia i j value nilai positif yang cukup besar L; sementara harga permainan akan meningkat sebanyak L dan keputusannya tidak akan berubah.

Anggaplah kita telah memilih strategi S S * yang optimum. Maka hasil purata kami dengan strategi musuh B j adalah: a j = p 1 a 1j + p 2 a 2j +… + p m a mj. Strategi optimum kami S A * mempunyai sifat bahawa untuk sebarang tingkah laku musuh, ia memberikan hasil tidak kurang dari ν; oleh itu, mana-mana nombor a j tidak boleh kurang dari ν. Kami mendapat beberapa syarat:

Kami membahagikan ketaksamaan (5.1) dengan nilai positif ν dan menunjukkan

Kemudian syarat (5.1) boleh ditulis dalam bentuk

di mana ξ 1, ξ 2,…, ξ m adalah nombor bukan negatif. Oleh kerana р 1 + p 2 +… + p m = 1, maka kuantiti ξ 1, ξ 2,…, ξ m memenuhi syarat

(5.3) ξ 1 + ξ 2 +… + ξ m = 1 / ν.

Kami ingin memastikan kemenangan kami dijamin mungkin; jelas, pada masa yang sama bahagian kanan persamaan (5.3) mengambil nilai minimum. Oleh itu, masalah mencari penyelesaian untuk permainan dikurangkan kepada masalah matematik berikut: tentukan nilai bukan negatif ξ 1, ξ 2,…, ξ m keadaan memuaskan (5.2) sehingga jumlahnya Φ = ξ 1 + ξ 2 +… + ξ m adalah minimum.

Biasanya, ketika menyelesaikan masalah yang berkaitan dengan mencari nilai ekstrem (maksima dan minimum), fungsinya dibezakan dan terbitannya disamakan dengan sifar. Tetapi teknik seperti itu tidak berguna dalam kes ini, kerana fungsi Φ, yang perlu dikurangkan menjadi minimum, adalah linear, dan turunannya berkenaan dengan semua argumen sama dengan kesatuan, i.e. jangan lenyap di mana sahaja. Akibatnya, maksimum fungsi dicapai di suatu tempat di batas rentang variasi argumen, yang ditentukan oleh syarat tidak negatif argumen dan syarat (5.2). Kaedah mencari nilai ekstrim dengan cara pembezaan juga tidak sesuai dalam kes-kes apabila had maksimum (atau minimum atas) ditentukan untuk menyelesaikan permainan, seperti yang kita lakukan, misalnya, ketika menyelesaikan Permainan 2xn. Sesungguhnya, batas bawah terdiri daripada bahagian garis lurus, dan maksimum tidak dicapai pada titik di mana turunannya adalah sifar (tidak ada titik sama sekali), tetapi pada batas selang atau pada titik persilangan bahagian lurus.

Untuk menyelesaikan masalah seperti ini, yang biasa berlaku dalam praktiknya, alat pengaturcaraan linier khas telah dikembangkan dalam matematik. Masalah pengaturcaraan linear dikemukakan seperti berikut. Sistem persamaan linear diberikan:

Diperlukan untuk mencari nilai bukan negatif dari kuantiti ξ 1, ξ 2,…, ξ m yang memuaskan (5.4) dan pada masa yang sama meminimumkan fungsi linear homogen yang diberikan bagi kuantiti ξ 1, ξ 2,…, ξ m (bentuk linier): Φ = c 1 ξ 1 + c 2 ξ 2 +… + cm ξ m

Sangat mudah untuk mengesahkan bahawa masalah teori permainan di atas adalah kes khas dari masalah pengaturcaraan linear untuk c 1 = c 2 =… = cm = 1. Pada pandangan pertama, nampaknya keadaan (5.2) tidak setara dengan keadaan (5.4), kerana bukannya tanda sama, ia mengandungi tanda ketidaksamaan. Walau bagaimanapun, mudah untuk menghilangkan tanda-tanda ketidaksamaan dengan memperkenalkan pemboleh ubah bukan negatif fiktif baru z 1, z 2,…, z n dan keadaan penulisan (5.2) dalam bentuk:

Bentuk Φ yang perlu dikurangkan minimum ialah Φ = ξ 1 + ξ 2 +… + ξ m. Alat pengaturcaraan linier memungkinkan untuk memilih nilai ξ 1, ξ 2,…, ξ m yang memenuhi keperluan yang dinyatakan dengan sebilangan kecil sampel berurutan. Untuk lebih jelas, kami akan menunjukkan di sini penggunaan peranti ini secara langsung pada bahan penyelesaian permainan tertentu.

Contoh 1. Diperlukan untuk mencari penyelesaian untuk permainan 3 × 3, yang diberikan dalam Contoh 2 § 1, dengan matriks:

Untuk membuat semua ij tidak negatif, kita menambah semua elemen matriks L = 5. Kami memperoleh matriks:

Dalam kes ini, harga permainan akan meningkat sebanyak 5, dan keputusannya tidak akan berubah.

Mari kita tentukan strategi optimum S A *. Syarat (5.2) mempunyai bentuk:

di mana ξ 1 = p 1 / ν, ξ 2 = p 2 / ν, ξ 3 = p 3 / ν. Untuk menghilangkan tanda ketidaksamaan, kami memperkenalkan pemboleh ubah dummy z 1, z 2, z 3; syarat (5.6) akan ditulis dalam bentuk:

Bentuk linier Φ mempunyai bentuk: Φ = ξ 1 + ξ 2 + ξ 3 dan hendaklah dibuat sekecil mungkin. Sekiranya ketiga-tiga strategi B "berguna", maka ketiga-tiga pemboleh ubah dummy z 1, z 2, z 3 hilang (iaitu, pembayaran yang sama dengan harga permainan ν akan dicapai untuk setiap strategi B j). Tetapi kita masih tidak mempunyai alasan untuk mengatakan bahawa ketiga-tiga strategi itu "berguna". Untuk memeriksa ini, kami akan cuba menyatakan bentuk Φ dari segi pemboleh ubah dummy z 1, z 2, z 3 dan melihat apakah kami dapat mencapai, dengan anggapan mereka sama dengan sifar, minimum borang. Untuk melakukan ini, kita menyelesaikan persamaan (5.7) berkenaan dengan pemboleh ubah ξ 1, ξ 2, ξ 3 (iaitu, kita menyatakan ξ 1, ξ 2, ξ 3 dari segi pemboleh ubah dummy z 1, z 2, z 3 ):

Menambah ξ 1, ξ 2, ξ 3, kita mendapat: Φ = 1/5 + z 1/20 + z 2/10 + z 3/20. Di sini pekali untuk semua z adalah positif; oleh itu, sebarang kenaikan z 1, z 2, z 3 di atas sifar hanya boleh menyebabkan peningkatan dalam bentuk Φ, dan kami mahu ia minimum. Oleh itu, nilai z 1, z 2, z 3 yang menjadikan bentuk Φ minimum adalah z 1 = z 2 = z 3 = 0. Oleh itu, nilai minimum borang Φ adalah: 1 / ν = 1 / 5, dari mana harga permainan ν = 5. Menggantikan nilai sifar z 1, z 2, z 3 dalam formula (5.8), kita dapati: ξ 1 = 1/20, ξ 2 = 1/10, ξ 3 = 1/20, atau, mengalikannya dengan ν, p 1 = 1/4, p 2 = 1/2, p 3 = 1/4. Oleh itu, strategi optimum A telah dijumpai: , iaitu kita harus menulis nombor 1 dalam satu perempat dari semua kes, 2 dari separuh kes, dan 3 pada suku kes yang selebihnya.

Mengetahui harga permainan ν = 5, seseorang sudah boleh kaedah yang diketahui cari strategi musuh yang optimum ... Untuk melakukan ini, kami akan menggunakan dua strategi "berguna" kami (misalnya, A 2 dan A 3) dan menulis persamaannya:

9q 1 + 11 (1-q 2 -q 1) = 5,

dari mana q 1 = q3 = 1/4; q 2 = 1/2. Strategi optimum musuh akan sama dengan strategi kita: ... Sekarang mari kita kembali ke permainan asal (tidak berubah). Untuk melakukan ini, hanya perlu mengurangkan nilai L = 5 yang ditambahkan pada unsur-unsur matriks dari harga permainan ν = 5. Kami mendapat harga permainan yang asli v 0 = 0. Oleh itu, strategi optimum kedua-dua pihak memberikan rata-rata pembayaran sama dengan sifar; permainan ini sama-sama menguntungkan atau merugikan kedua-dua belah pihak.

Contoh 2. Kelab sukan A mempunyai tiga pilihan untuk komposisi pasukan A 1, A 2 dan A 3. Kelab B - juga dalam tiga pilihan B 1, B 2 dan B 3. Semasa melamar untuk menyertai pertandingan ini, tidak ada kelab yang tahu barisan lawan yang akan dipilih. Kebarangkalian kelab A menang di pilihan yang berbeza barisan, yang hampir diketahui dari pengalaman pertemuan lalu, diberikan oleh matriks:

Ketahui seberapa kerap kelab harus bermain setiap skuad antara satu sama lain untuk mencapai jumlah kemenangan rata-rata tertinggi.

Keputusan. Harga permainan yang lebih rendah ialah 0.4; 0.6 teratas; kami mencari jalan penyelesaian dalam bidang strategi campuran. Agar tidak mengatasi pecahan, kita mengalikan semua elemen matriks dengan 10; dalam kes ini, harga permainan akan meningkat 10 kali ganda, dan keputusannya tidak akan berubah. Kami mendapat matrik:

Syarat (5.5) mempunyai bentuk:

dan keadaan minimum Φ = ξ 1 + ξ 2 + ξ 3 = min.

Periksa sama ada ketiga-tiga strategi lawan "berguna". Sebagai hipotesis, pertama-tama kita menganggap bahawa pemboleh ubah dummy z 1, z 2, z 3 sama dengan sifar, dan untuk pengesahan kita menyelesaikan persamaan (5.10) untuk ξ 1, ξ 2, ξ 3:

(5.12) 136Φ = 30 + 13z 1 + 18z 2 - 51z 3

Rumus (5.12) menunjukkan bahawa peningkatan pemboleh ubah z 1 dan z 2 dibandingkan dengan nilai sifar mereka yang diandaikan hanya dapat meningkatkan Φ, sementara kenaikan z 3 dapat menurunkan Φ. Walau bagaimanapun, kenaikan z 3 mesti dilakukan dengan berhati-hati agar nilai ξ 1, ξ 2, ξ 3, bergantung pada z 3, tidak menjadi negatif dalam kes ini. Oleh itu, di sisi kanan persamaan (5.11), kita meletakkan nilai z 1 dan z 2 sama dengan sifar, dan kita akan meningkatkan nilai z 3 ke had yang boleh diterima (sehingga ada nilai ξ 1, ξ 2, ξ 3 hilang). Dari persamaan kedua (5.11) dilihat bahawa peningkatan z 3 adalah "selamat" untuk nilai ξ 2 - ia hanya meningkat dari ini. Bagi kuantiti ξ 1 dan ξ 3, di sini peningkatan z 3 hanya boleh dilakukan sehingga had tertentu. Kuantiti ξ 1 hilang pada z 3 = 10/23; kuantiti ξ 3 hilang lebih awal, sudah pada z 3 = 1/4. Oleh itu, dengan memberikan z 3 nilai maksimum yang dibenarkan z 3 = 1/4, dalam kes ini kita akan mengehadkan nilai ξ 3.

Untuk memeriksa sama ada bentuk Φ menjadi minimum pada z 1 = 0, z 2 = 0, ξ 3 = 0, kami menyatakan baki (bukan sifar) pemboleh ubah dari segi kononnya sifar z 1, z 2, ξ 3. Menyelesaikan persamaan (5.10) berkenaan dengan ξ 1, ξ 2 dan z 3, kami memperoleh:

(5.13) 32Φ = 7 + Зz 1 + 4z 2 + ξ 3

Dari formula (5.13) dilihat bahawa sebarang kenaikan z 1, z 2, ξ 3 melebihi nilai sifar yang diandaikan hanya dapat meningkatkan bentuk Φ. Oleh itu, penyelesaian untuk permainan telah dijumpai; ia ditentukan oleh nilai-nilai z 1 = z 2 = ξ 3 = 0, dari mana ξ 1 = 1/32, ξ 2 = 3/16, z 3 = 1/4. Dengan menggantikan formula (5.13), kita dapati harga permainan ν: 32Φ = 7 = 32 / ν; ν = 32/7. Strategi optimum kami: ... Strategi "berguna" (komposisi A 1 dan A 2) harus diterapkan pada frekuensi 1/7 dan 6/7; komposisi A 3 - tidak pernah berlaku.

Untuk mencari strategi musuh yang optimum, dalam kes umum, anda boleh melakukan perkara berikut: menukar tanda pembayaran ke sebaliknya, tambahkan nilai tetap L pada elemen matriks untuk menjadikannya tidak negatif, dan selesaikan masalah untuk musuh dengan cara yang sama seperti kita menyelesaikannya untuk diri kita sendiri. Namun, hakikat bahawa kita sudah mengetahui harga permainan ν agak menyederhanakan tugas. Di samping itu, dalam kes ini, tugas ini disederhanakan dengan fakta bahawa hanya dua strategi "berguna" musuh, B 1 dan B 2, yang turut serta dalam penyelesaian, kerana nilai z 3 tidak sama dengan sifar, dan oleh itu, dengan strategi B 3, harga permainan tidak tercapai ... Memilih strategi "berguna" pemain A, misalnya A 1, seseorang dapat mencari frekuensi q 1 dan q 2. Untuk melakukan ini, kita menulis persamaan 8q 1 + 2 (1 - q 1) = 32/7, di mana q 1 = 3/7, q 2 = 4/7; strategi optimum musuh adalah: , iaitu musuh tidak boleh menggunakan komposisi B 3, dan komposisi B 1 dan B2 harus digunakan dengan frekuensi 3/7 dan 4/7.

Kembali ke matriks asal, kita menentukan nilai sebenar permainan ν 0 = 32/7: 10 = 0.457. Ini bermaksud untuk sebilangan besar perjumpaan Jumlah kemenangan untuk Club A adalah 0.457 dari semua perjumpaan

§ 6. Kaedah anggaran untuk menyelesaikan permainan

Selalunya, dalam masalah praktikal, tidak perlu mencari penyelesaian yang tepat untuk permainan; cukup untuk mencari jalan penyelesaian yang memberikan hasil rata-rata hampir dengan harga permainan. Pengetahuan anggaran mengenai nilai permainan ν dapat diberikan dengan analisis sederhana mengenai matriks dan penentuan harga permainan (α) dan atas (β) yang lebih rendah. Sekiranya α dan β dekat, praktikalnya tidak perlu mencari penyelesaian yang tepat, tetapi cukup untuk memilih strategi minimum minimum. Sekiranya α dan β tidak dekat, seseorang boleh mendapatkan penyelesaian praktikal menggunakan kaedah berangka untuk menyelesaikan permainan, dari mana kami secara ringkas menyoroti kaedah lelaran.

Idea di sebalik kaedah lelaran adalah seperti berikut. "Percubaan pemikiran" dimainkan di mana lawan A dan B menggunakan strategi mereka satu sama lain. Eksperimen terdiri daripada urutan permainan dasar, yang masing-masing mempunyai matriks permainan tertentu. Ia bermula dengan kenyataan bahawa kita (pemain A) memilih salah satu strategi kita dengan sewenang-wenangnya, misalnya, A i. Musuh membalasnya dengan strategi B j, yang paling tidak bermanfaat bagi kita, iaitu menjadikan pembayaran strategi A i menjadi minimum. Kami bertindak balas terhadap langkah ini dengan strategi kami А k, yang memberikan hasil rata-rata maksimum ketika lawan menggunakan strategi B j. Lebih jauh lagi - giliran musuh. Dia bertindak balas terhadap sepasang pergerakan kami A i dan A k dengan strateginya B j, yang memberi kami hasil purata terkecil untuk kedua strategi ini (A i, A k), dan seterusnya. Pada setiap langkah proses berulang, setiap pemain menanggapi setiap gerakan pemain lain dengan strategi sendiri yang optimum berbanding semua gerakan sebelumnya, dianggap sebagai semacam strategi campuran, di mana strategi murni disajikan dalam perkadaran yang sesuai dengan kekerapan permohonan mereka.

Kaedah ini, seperti dulu, adalah model "latihan" praktikal para pemain, ketika masing-masing dari mereka memeriksa melalui pengalaman cara lawan bertindak dan berusaha untuk menanggapi dengan cara yang bermanfaat bagi dirinya. Sekiranya peniruan proses pembelajaran seperti itu dilanjutkan cukup lama, maka hasil rata-rata setiap sepasang pergerakan (permainan dasar) cenderung kepada harga permainan, dan frekuensi p 1 ... p m; q 1 ... q n, yang disepakati oleh strategi pemain dalam rali ini, akan mendekati frekuensi yang menentukan strategi yang optimum. Pengiraan menunjukkan bahawa penumpuan kaedah ini sangat perlahan, tetapi ini bukan halangan bagi mesin pengiraan berkelajuan tinggi.

Mari kita gambarkan penerapan kaedah berulang menggunakan contoh permainan 3 × 3 yang diselesaikan dalam Contoh 2 bahagian sebelumnya. Permainan ini diberikan oleh matriks:

Jadual 6.1 menunjukkan 18 langkah pertama proses berulang. Lajur pertama mengandungi bilangan permainan asas (sepasang pergerakan) n; dalam nombor kedua i strategi pilihan pemain A; dalam tiga seterusnya - "kemenangan terkumpul" untuk yang pertama n permainan dengan strategi musuh B 1, B 2, B 3. Nilai terkecil ini digarisbawahi. Seterusnya muncul nombor j strategi yang dipilih oleh musuh, dan, dengan demikian, keuntungan terkumpul untuk n permainan dengan strategi A 1, A 2, A 3 dari nilai-nilai ini, maksimum digarisbawahi dari atas. Nilai yang digarisbawahi menentukan pilihan strategi tindak balas pemain lain. Grafik berikut menunjukkan secara berurutan: minimum minimum pembayaran v, sama dengan minimum terkumpul dibahagi dengan jumlah permainan n; kemenangan purata maksimum sama dengan kemenangan terkumpul maksimum dibahagi dengan n, dan min aritmetiknya ν * = (ν +) / 2. Semasa meningkat n ketiga-tiga kuantiti ν, dan ν * akan menghampiri harga permainan ν, tetapi nilai ν *, secara semula jadi, akan menghampirinya dengan lebih cepat.

Jadual 6.1.

Seperti yang dapat anda lihat dari contoh, konvergensi iterasi sangat lambat, namun demikian, walaupun pengiraan kecil memungkinkan untuk mencari nilai anggaran harga permainan dan mengungkap kelaziman strategi "berguna". Semasa menggunakan mesin pengiraan, nilai kaedah meningkat dengan ketara. Kelebihan kaedah berulang untuk menyelesaikan permainan adalah bahawa jumlah dan kerumitan pengiraan meningkat agak lemah apabila jumlah strategi meningkat. m dan n.

§ 7. Kaedah untuk menyelesaikan beberapa permainan yang tidak terhingga

Permainan yang tidak berkesudahan adalah permainan di mana sekurang-kurangnya satu pihak mempunyai sebilangan strategi. Kaedah umum untuk menyelesaikan permainan seperti itu belum dikembangkan. Walau bagaimanapun, untuk praktik, beberapa kes khas mungkin menarik, yang mengakui penyelesaiannya agak mudah. Pertimbangkan permainan dua lawan A dan B, yang masing-masing mempunyai satu set strategi (tak terhitung) yang tidak terhingga; strategi ini untuk pemain A sesuai makna yang berbeza terus berubah parameter x, dan untuk parameter В - di... Dalam kes ini, bukannya matriks ia ij, permainan ditentukan oleh beberapa fungsi dari dua argumen yang terus berlainan a (x, y), yang akan kita panggil fungsi pembayaran (perhatikan bahawa fungsi itu sendiri a (x, y) tidak perlu berterusan). Fungsi menang a (x, y) boleh dilambangkan secara geometri oleh beberapa permukaan a (x, y) atas kawasan yang berubah-ubah hujah (x, y)(rajah 7.1)

Analisis fungsi pembayaran a (x, y) dilakukan sama dengan analisis matriks pembayaran. Pertama, harga permainan α yang lebih rendah dijumpai; untuk ini ditentukan untuk masing-masing x fungsi minimum a (x, y) untuk semua di:, maka nilai maksimum ini dicari untuk semua x(maksimin):

Harga atas permainan (minimum) ditentukan dengan cara yang sama:

Pertimbangkan kes apabila α = β. Oleh kerana harga permainan ν selalu antara α dan β, nilai keseluruhannya adalah ν. Persamaan α = β bermaksud permukaan a (x, y) mempunyai titik pelana, iaitu titik dengan koordinat x 0, y 0, di mana a (x, y) pada masa yang sama minimum dalam di dan maksimum x(rajah 7.2).

Nilai a (x, y) pada ketika ini adalah harga permainan ν: ν = a (x 0, y 0). Kehadiran titik pelana bermaksud bahawa permainan tanpa batas ini mempunyai penyelesaian strategi murni; x 0, y 0 mewakili strategi murni A dan B. yang optimum. Dalam kes umum, apabila α ≠ β, permainan hanya boleh mempunyai penyelesaian dalam bidang strategi campuran (mungkin bukan satu-satunya). Strategi bercampur untuk permainan tak terbatas ada sebilangan kebarangkalian untuk strategi x dan di dianggap sebagai pemboleh ubah rawak. Taburan ini dapat berterusan dan ditentukan oleh kepadatan f 1 (x) dan f 2 (y); boleh diskrit, dan kemudian strategi optimum terdiri daripada satu set strategi murni yang terpisah yang dipilih dengan beberapa kebarangkalian nol.

Sekiranya permainan tidak terbatas tidak mempunyai titik pelana, dapat diberikan interpretasi geometri visual mengenai harga permainan yang lebih rendah dan lebih tinggi. Pertimbangkan permainan yang tidak terhingga dengan fungsi pembayaran a (x, y) dan strategi x, y mengisi segmen garis secara berterusan (x 1, x 2) dan (y 1, y 2)... Untuk menentukan harga permainan α yang lebih rendah, anda perlu "melihat" permukaannya a (x, y) dari paksi di, iaitu memproyeksikannya ke satah xOa(rajah 7.3). Kami memperoleh angka tertentu yang dibatasi dari sisi dengan garis lurus x = x 1 dan x = x 2, dan dari atas dan bawah oleh lengkung KB dan K N. Harga permainan yang lebih rendah α, jelas, tidak lebih daripada ordinat maksimum lengkung K N.

Begitu juga, untuk mencari harga tertinggi permainan β, seseorang mesti "melihat" di permukaan a (x, y) dari paksi x(permukaan projek ke satah yoa) dan cari ordinat minimum sempadan atas K Dalam unjuran (Gamb, 7.4)

Pertimbangkan dua contoh asas permainan yang tidak berkesudahan.

Contoh 1. Pemain A dan B masing-masing mempunyai satu set strategi yang tidak dapat dikira x dan di, dan 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. Fungsi pembayaran untuk a diberikan oleh ungkapan a (x, y) - (x - y) 2. Cari penyelesaian untuk permainan.

Penyelesaian, Permukaan a (x, y) adalah silinder parabola (Gamb. 7.5) dan tidak mempunyai titik pelana. Tentukan harga permainan yang lebih rendah; jelas kepada semua orang x; oleh itu = 0. Mari kita tentukan harga atas permainan. Untuk melakukan ini, kita mencari yang tetap di

Dalam kes ini, maksimum selalu dicapai pada batas selang (pada x = 0 atau x = 1), iaitu ia sama dengan nilai y 2; (1 - y) 2, yang lebih besar. Mari kita lukiskan grafik fungsi ini (Gamb. 7.6), iaitu unjuran permukaan a (x, y) di atas kapal terbang yoa... Garis tebal dalam Rajah. 7.6 menunjukkan fungsi. Jelas, nilai minimumnya dicapai pada y = 1/2 dan sama dengan 1/4. Oleh itu, harga permainan yang lebih tinggi adalah β = 1/4. Dalam kes ini, harga permainan atas bertepatan dengan harga permainan ν. Memang pemain A dapat menerapkan strategi campuran S A = , di mana nilai ekstrem x = 0 dan x = 1 disertakan dengan frekuensi yang sama; maka untuk sebarang strategi pemain B, pembayaran rata-rata pemain A akan sama dengan: ½y 2 + ½ (1 - y) 2. Sangat mudah untuk mengesahkan bahawa kuantiti ini untuk sebarang nilai di antara 0 dan 1 mempunyai nilai tidak kurang dari ¼: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Oleh itu, pemain A, menggunakan strategi campuran ini, dapat menjamin dirinya hasil yang sama dengan harga permainan atas; kerana harga permainan tidak boleh lebih dari harga yang lebih tinggi, maka strategi ini S A optimum: S A = S A *.

Tetap mencari strategi optimum pemain B. Jelas, jika harga permainan ν sama dengan harga tinggi permainan β, maka strategi optimum pemain B akan selalu menjadi strategi minimumnya yang murni, yang menjamin dia harga permainan yang lebih tinggi. Dalam kes ini, strategi seperti itu ialah y 0 = ½. Memang, dengan strategi ini, tidak kira apa yang dilakukan pemain A, ganjarannya tidak akan lebih besar daripada ¼. Ini berlaku dari ketidaksamaan yang jelas (x - ½) 2 = x (x –1) + ¼ ≤ ¼

Contoh 2. Bahagian A ("kami") menembak pesawat musuh B. Untuk mengelakkan penembakan, musuh dapat melakukan manuver dengan kelebihan beban di, di mana dia, mengikut budi bicaranya, dapat melampirkan nilai dari di= 0 (gerakan lurus) ke di = dimaks(penerbangan dalam lingkaran kelengkungan maksimum). Kami menganggap dimaks unit pengukuran, iaitu letak dimaks= 1. Dalam memerangi musuh, kita dapat menggunakan alat pengintai berdasarkan satu atau lain hipotesis mengenai pergerakan sasaran semasa penerbangan proyektil. Beban berlebihan x dalam manuver hipotetis ini, boleh dianggap sama dengan nilai apa pun dari 0 hingga 1. Tugas kita adalah memukul musuh; tugas musuh adalah agar tidak terjejas. Kebarangkalian kerosakan data x dan di lebih kurang dinyatakan dengan formula: a (x, y) = , Di mana di- beban berlebihan yang digunakan oleh musuh; x - muatan berlebihan dijelaskan pada pandangan. Diperlukan untuk menentukan strategi optimum kedua belah pihak.

Keputusan. Jelas, penyelesaian permainan tidak akan berubah jika kita menetapkan p = 1. Fungsi pembayaran a (x, y) digambarkan oleh permukaan yang ditunjukkan dalam Rajah. 7.7.

Ini adalah permukaan silinder yang generatrisnya selari dengan bahagian dua sudut koordinat hoy, dan bahagian oleh satah yang berserenjang dengan generatrix adalah lengkung dari jenis keluk taburan normal. Dengan menggunakan tafsiran geometri harga rendah dan atas permainan yang dicadangkan di atas, kita dapati β = 1 (Gambar 7.8) dan (Gambar 7.9). Permainan ini tidak mempunyai titik pelana; jalan penyelesaian mesti dicari dalam bidang strategi campuran. Masalahnya agak serupa dengan masalah pada contoh sebelumnya. Sesungguhnya, untuk nilai-nilai kecil k fungsi berkelakuan seperti fungsi - (x - y) 2, dan penyelesaian permainan akan diperoleh sekiranya peranan pemain A dan B diubah dalam penyelesaian contoh sebelumnya; mereka. strategi optimum kita adalah strategi murni x = 1/2, dan strategi optimum SB = musuh adalah dengan menerapkan strategi ekstrem y = 0 dan y = 1 dengan frekuensi yang sama. Ini bermaksud bahawa dalam semua kes kita mesti gunakan crosshair, yang dirancang untuk kelebihan x = 1/2, dan musuh sama sekali tidak boleh menggunakan manuver pada separuh daripada semua kes, dan pada separuh daripada semua kes - manuver maksimum yang mungkin.

Rajah. 7.8 Rajah. 7.9.

Sangat mudah untuk membuktikan bahawa penyelesaian ini akan berlaku untuk nilai k ≤ 2. Sesungguhnya, rata-rata hasil untuk strategi lawan S B = dan untuk strategi kami x dinyatakan oleh fungsi , yang untuk nilai k ≤ 2 mempunyai satu maksimum pada х = 1/2, yang sama dengan harga permainan α yang lebih rendah. Akibatnya, penerapan strategi S B menjamin lawan kehilangan yang tidak melebihi α, dari mana jelas bahawa α - harga permainan yang lebih rendah - adalah harga permainan ν.

Untuk k> 2, fungsi a (x) mempunyai dua maksima (Gambar 7.10), terletak secara simetri berkenaan dengan x = 1/2 pada titik x 0 dan 1 - x 0, dan nilai x 0 bergantung pada k .

Jelas sekali, untuk k= 2 x 0 = 1 - x 0 = ½; semasa meningkat k titik x 0 dan 1 - x 0 berpisah, mendekati titik ekstrim (0 dan 1). Oleh itu, keputusan permainan akan bergantung kepada k. Mari tetapkan nilai khusus untuk k, misalnya, k = 3, dan cari penyelesaian untuk permainan; untuk ini kita menentukan abscissa x 0 maksimum lengkung a (x). Bersamaan dengan nol turunan fungsi a (x), kami menulis persamaan untuk menentukan x 0:

Persamaan ini mempunyai tiga punca: x = 1/2 (di mana minimum dicapai) dan x 0, 1 - x 0, di mana maksimum dicapai. Menyelesaikan persamaan secara berangka, kita dapati kira-kira x 0 ≈ 0,07; 1 - x 0 ≈ 0.93.

Mari kita buktikan bahawa penyelesaian permainan dalam kes ini adalah sepasang strategi berikut:

Dengan strategi dan strategi musuh kita di purata pembayaran adalah

Cari minimum a (y) pada 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Menetapkan y = 1/2, kita dapat

yang lebih daripada 1 (0); oleh itu, harga permainan tidak kurang dari 1 (0):

Sekarang katakan bahawa musuh menggunakan strategi S B *, dan kita menggunakan strategi x. Maka pembayaran rata-rata akan menjadi

Tetapi kita telah memilih x 0 dengan tepat sehingga pada x = x 0 maksimum ungkapan (7.2) tercapai; oleh itu,

mereka. pihak lawan, dengan menggunakan strategi S B *, dapat mencegah kerugian lebih besar dari 0.530; oleh itu, ν = 0.530 adalah harga permainan, dan strategi S A * dan S B * memberikan penyelesaian. Ini bermaksud bahawa kita mesti menggunakan pemandangan dengan x = 0,07 dan x = 0,93 dengan frekuensi yang sama, dan musuh tidak boleh melakukan manuver dengan frekuensi yang sama dan manuver dengan kelebihan maksimum.

Perhatikan bahawa pembayaran ν = 0.530 jauh lebih besar daripada harga permainan yang lebih rendah , yang dapat kami sediakan dengan menerapkan strategi maksimin kami x 0 = 1/2.

Satu daripada cara praktikal penyelesaian untuk permainan yang tidak terhingga adalah pengurangannya kepada permainan yang terbatas. Dalam kes ini, sebilangan besar strategi yang mungkin untuk setiap pemain digabungkan secara konvensional menjadi satu strategi. Dengan cara ini, tentu saja, hanya solusi penyelesaian untuk permainan yang dapat diperoleh, tetapi dalam kebanyakan kasus penyelesaian yang tepat tidak diperlukan.

Namun, harus diingat bahawa ketika menerapkan teknik ini, penyelesaian dalam bidang strategi campuran dapat muncul bahkan dalam hal ketika penyelesaian permainan tak terbatas yang asli dapat dilakukan dengan strategi murni, yaitu apabila permainan tanpa batas mempunyai titik pelana. Sekiranya, dengan mengurangkan permainan tak terbatas menjadi permainan yang terbatas, penyelesaian campuran diperoleh, yang hanya merangkumi dua strategi "berguna" yang berdekatan, maka masuk akal untuk mencoba menerapkan strategi murni perantaraan permainan tak terbatas yang asli di antara mereka.

Sebagai kesimpulan, kami perhatikan bahawa permainan yang tidak terbatas, tidak seperti permainan yang terbatas, mungkin tidak mempunyai penyelesaian. Mari kita berikan contoh permainan tanpa had yang tidak ada penyelesaiannya. Dua pemain menamakan setiap bilangan bulat. Dinamakan lebih banyak lagi menerima dari 1 rubel yang lain. Sekiranya kedua-duanya memanggil nombor yang sama, permainan akan berakhir seri. Permainan ini jelas tidak dapat diselesaikan. Walau bagaimanapun, ada kelas permainan tanpa had yang pasti ada penyelesaiannya.

© 2021 skudelnica.ru - Cinta, pengkhianatan, psikologi, perceraian, perasaan, pertengkaran