Permainan strategi murni. Strategi bercampur

yang utama / Bekas

strategi permainan teori bercampur

Strategi bercampur

Sekiranya dalam permainan matriks tidak ada titik pelana dalam strategi murni, maka harga permainan atas dan bawah dijumpai. Mereka menunjukkan bahawa pemain 1 tidak akan menerima kemenangan yang melebihi harga permainan atas, dan pemain 1 itu dijamin kemenangan yang tidak kurang dari harga permainan yang lebih rendah.

Strategi campuran pemain adalah satu set lengkap strategi murni dengan pelbagai pengulangan permainan dalam keadaan yang sama dengan kebarangkalian yang diberikan. Mari kita ringkaskan apa yang telah diperkatakan dan senaraikan syarat untuk menggunakan strategi campuran:

  • * bermain tanpa titik pelana;
  • * pemain menggunakan campuran strategi murni secara rawak dengan kebarangkalian yang diberikan;
  • * permainan diulang berkali-kali dalam keadaan yang serupa;
  • * pada setiap pergerakan, tidak ada pemain yang diberitahu mengenai pilihan strategi oleh pemain lain;
  • * rata-rata hasil permainan dibenarkan.

Notasi berikut untuk strategi campuran digunakan.

Untuk pemain 1, strategi campuran yang terdiri dalam penerapan strategi murni A 1, A 2, ..., A m dengan kebarangkalian yang sesuai p 1, p 2, ..., p m.

Untuk pemain 2

q j adalah kebarangkalian untuk menerapkan strategi murni B j.

Sekiranya р i = 1, untuk pemain 1 kami mempunyai strategi murni

Strategi murni pemain adalah satu-satunya yang mungkin peristiwa yang tidak konsisten... Dalam permainan matriks, mengetahui matriks A (ia berlaku untuk pemain 1 dan pemain 2), ia dapat ditentukan untuk vektor yang diberi dan purata pembayaran ( nilai jangkaan kesan) pemain 1:

di mana dan vektor;

p i dan q i adalah komponen vektor.

Dengan menerapkan strategi campurannya, pemain 1 berusaha untuk memaksimumkan gaji purata, dan pemain 2 - untuk membawa kesan ini ke nilai minimum yang mungkin. Pemain 1 berusaha untuk mencapai

Pemain 2 memastikan bahawa syarat itu dipenuhi

Mari kita juga menunjukkan vektor yang sesuai dengan strategi campuran pemain 1 dan 2 yang optimum, iaitu vektor sedemikian dan yang mana persamaannya

Harga permainan adalah pembayaran rata-rata pemain 1 apabila kedua-dua pemain menggunakan strategi campuran. Oleh itu, penyelesaian untuk permainan matriks adalah:

  • - strategi campuran pemain 1 yang optimum;
  • - strategi campuran pemain 2 yang optimum;

Harga permainan.

Strategi bercampur akan optimum (dan) jika mereka membentuk titik pelana untuk fungsi tersebut.

Terdapat teorem asas untuk permainan matematik.

Untuk permainan matrik dengan matriks A, kuantiti

wujud dan sama antara satu sama lain: = =.

Harus diingat bahawa ketika memilih strategi yang optimum, pemain 1 akan selalu mendapat imbalan rata-rata, tidak kurang dari harga permainan, untuk strategi tetap pemain 2 (dan, sebaliknya, untuk pemain 2). Strategi aktif pemain 1 dan 2 adalah strategi yang merupakan sebahagian daripada strategi campuran optimum pemain yang sesuai dengan kebarangkalian nol. Ini bermaksud bahawa komposisi strategi campuran pemain yang optimum mungkin tidak merangkumi semua strategi yang telah ditentukan sebelumnya.

Menyelesaikan permainan bermaksud mencari harga permainan dan strategi yang optimum. Kami akan memulakan pertimbangan kaedah untuk mencari strategi campuran optimum untuk permainan matriks dengan permainan termudah yang dijelaskan oleh matriks 22. Permainan titik pelana tidak akan dipertimbangkan secara khusus. Sekiranya titik pelana diperoleh, maka ini bermakna bahawa ada strategi yang tidak menguntungkan yang harus ditinggalkan. Sekiranya tidak ada titik pelana, dua strategi campuran yang optimum dapat diperoleh. Seperti yang dinyatakan, strategi campuran ini ditulis seperti ini:

Ini bermaksud bahawa terdapat matriks pembayaran

a 11 p 1 + a 21 p 2 =; (1.16)

a 12 p 1 + a 22 p 2 =; (1.17)

p 1 + p 2 = 1. (1.18)

a 11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

a 11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1, (1.20)

di mana kita memperoleh nilai optimum dan:

Mengetahui dan, kami dapati:

Setelah dikira, kami dapati dan:

a 11 q 1 + a 12 q 2 =; q 1 + q 2 = 1; (1.24)

a 11 q 1 + a 12 (1 - q 1) =. (1.25)

untuk 11 a 12. (1.26)

Masalahnya diselesaikan, kerana vektor dan harga permainan telah dijumpai. Memiliki matriks pembayaran A, adalah mungkin untuk menyelesaikan masalah secara grafik. Dengan kaedah ini, algoritma penyelesaian sangat mudah (Gamb. 2.1).

  • 1. Segmen panjang unit diplotkan sepanjang paksi absis.
  • 2. ordinat adalah kemenangan strategi A 1.
  • 3. Pada garis selari dengan paksi ordinat, pada titik 1, kemenangan disetkan dengan strategi a 2.
  • 4. Hujung segmen ditetapkan untuk 11 -b 11, 12 -b 21, 22 -b 22, 21 -b 12 dan dua garis lurus b 11 b 12 dan b 21 b 22 dilukis.
  • 5. Tentukan titik persimpangan dengan ditentukan. Ia sama. Abses titik c sama dengan p 2 (p 1 = 1 - p 2).

Rajah. 1.1.

Kaedah ini mempunyai kawasan aplikasi yang cukup luas. Ini berdasarkan harta bersama permainan mn, yang terdiri dari kenyataan bahawa dalam setiap permainan mn setiap pemain memiliki strategi campuran optimum di mana jumlah strategi murni paling banyak min (m, n). Dari harta tanah ini, seseorang dapat memperoleh konsekuensi yang terkenal: dalam permainan 2n dan m2, setiap strategi optimum mengandung paling banyak dua strategi aktif. Oleh itu, permainan 2n dan m2 boleh dikurangkan menjadi permainan 22. Oleh itu, permainan 2n dan m2 dapat diselesaikan secara grafik. Sekiranya matriks permainan terhingga mempunyai dimensi mn, di mana m> 2 dan n> 2, maka pengaturcaraan linear digunakan untuk menentukan strategi campuran yang optimum.

Strategi murni Pemain I memilih salah satu daripada n baris matrik pembayaran A, dan strategi murni pemain II adalah memilih salah satu lajur matriks yang sama.

Optimum strategi bersih pemain berbeza dari pemain campuran dengan adanya unit wajib p i = 1, q i = 1. Contohnya: P (1,0), Q (1,0). Di sini p 1 = 1, q 1 = 1.

Masalah 1
Dengan menggunakan matriks pembayaran, cari strategi bersih yang optimum menggunakan prinsip dominasi yang ketat. Sebagai jawapan, tuliskan vektor P *, Q *.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

Keputusan:

Kami menyelesaikan semua masalah menggunakan kalkulator permainan Matrix.

Kami menganggap bahawa pemain I memilih strateginya untuk mendapatkan hasil maksimumnya, dan pemain II memilih strateginya untuk meminimumkan pembayaran pemain I.

PemainB 1B 2B 3B 4a = min (A i)
A 13 1 2 5 1
A 22 0 0 3 0
A 3-3 -5 -5 -2 -5
A 40 -2 -2 1 -2
b = maks (B i)3 1 2 5
Kami dapati hasil yang dijamin ditentukan oleh harga permainan yang lebih rendah a = max (a i) = 1, yang menunjukkan strategi murni maksimum A 1.
Harga atas permainan adalah b = min (b j) = 1.
Titik pelana (1, 2) menunjukkan penyelesaian untuk sepasang alternatif (A1, B2). Harga permainan adalah 1.
2. Periksa matriks pembayaran untuk baris dominan dan lajur dominan.
Kadang-kadang, berdasarkan pertimbangan sederhana mengenai matriks permainan, kita dapat mengatakan bahawa beberapa strategi murni dapat memasuki strategi campuran yang optimum hanya dengan kebarangkalian sifar.
Mereka mengatakan bahawa i-i strategi pemain pertama menguasai dirinya k-i strategi jika ij ≥ a kj untuk semua j E N dan sekurang-kurangnya satu j a ij> kj. Dalam kes ini, dikatakan juga bahawa i-i strategi (atau garis) - dominan, k-i- dikuasai.
Mereka mengatakan bahawa j-th strategi pemain ke-2 menguasai dirinya l-i strategi jika untuk semua j E M a ij ≤ a il dan sekurang-kurangnya satu ij< a il . В этом случае j-th strategi (lajur) disebut dominan, l-i- dikuasai.
Strategi A 1 mendominasi strategi A 2 (semua elemen baris 1 lebih besar daripada atau sama dengan nilai baris ke-2), oleh itu, kami mengecualikan baris ke-2 matriks. Kebarangkalian p 2 = 0.
Strategi A 1 menguasai strategi A 3 (semua elemen baris 1 lebih besar daripada atau sama dengan nilai baris ke-3), oleh itu, kami mengecualikan baris ke-3 matriks. Kebarangkalian p 3 = 0.
3 1 2 5
0 -2 -2 1

Dari kedudukan kekalahan pemain B, strategi B 1 menguasai strategi B 2 (semua elemen lajur 1 lebih banyak barang lajur 2), oleh itu kami mengecualikan lajur matriks 1. Kebarangkalian q 1 = 0.
Dari kedudukan kekalahan pemain B, strategi B 4 mendominasi strategi B 1 (semua elemen lajur 4 lebih besar daripada elemen lajur 1), oleh itu, kami mengecualikan lajur matriks ke-4. Kebarangkalian q 4 = 0.
1 2
-2 -2

Kami telah mengurangkan permainan 4 x 4 menjadi permainan 2 x 2.



Penyelesaian permainan ( 2 x n


p 1 = 1
p 2 = 0
Harga permainan, y = 1
Sekarang kita dapat mencari strategi minimum pemain B dengan menulis sistem persamaan yang sesuai
q 1 = 1
q 1 + q 2 = 1
Menyelesaikan sistem ini, kami dapati:
q 1 = 1.
Jawapan:
Harga permainan: y = 1, vektor strategi pemain:
Q (1,0), P (1,0)

Ia ij q j ≤ v
Ia ij p i ≥ v
M (P 1; Q) = (1 1) + (2 0) = 1 = v
M (P 2; Q) = (-2 1) + (-2 0) = -2 ≤ v
M (P; Q 1) = (1 1) + (-2 0) = 1 = v
M (P; Q 2) = (2 1) + (-2 0) = 2 ≥ v

Oleh kerana baris dan lajur dikeluarkan dari matriks asal, vektor kebarangkalian yang dijumpai dapat ditulis sebagai:
P (1,0,0,0)
Q (0,1,0,0)

Tugasan 2
Cari harga permainan yang lebih rendah dan lebih tinggi menggunakan matriks pembayaran. Sekiranya terdapat titik pelana, tuliskan vektor strategi murni optimum P *, Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

Keputusan:
1. Periksa sama ada matriks pembayaran mempunyai titik pelana. Sekiranya ya, maka kami akan menulis penyelesaian permainan dengan strategi murni.
PemainB 1B 2B 3a = min (A i)
A 1-6 -5 0 -6
A 2-8 -3 -2 -8
A 3-3 -2 3 -3
b = maks (B i)-3 -2 3

Kami dapati pembayaran yang dijamin ditentukan oleh harga permainan yang lebih rendah a = max (a i) = -3, yang menunjukkan strategi murni maksimum A 3.
Harga atas permainan adalah b = min (b j) = -3.
Titik pelana (3, 1) menunjukkan penyelesaian untuk sepasang alternatif (A3, B1). Harga permainan adalah -3.
Jawapan: P (0,0,1), Q (1,0,0)

Masalah 3
Cari vektor strategi optimum P *, Q * dan harga permainan menggunakan matriks pembayaran. Pemain mana yang menjadi pemenang?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

Keputusan:
1. Periksa sama ada matriks pembayaran mempunyai titik pelana. Sekiranya ya, maka kami akan menulis penyelesaian permainan dengan strategi murni.
Kami menganggap bahawa pemain I memilih strateginya untuk mendapatkan hasil maksimumnya, dan pemain II memilih strateginya untuk meminimumkan pembayaran pemain I.
PemainB 1B 2B 3B 4a = min (A i)
A 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b = maks (B i)2 -2 7 4

Kami dapati hasil yang dijamin ditentukan oleh harga permainan yang lebih rendah a = max (a i) = -2, yang menunjukkan strategi murni maksimum A 2.
Harga atas permainan adalah b = min (b j) = -2.
Titik pelana (2, 2) menunjukkan penyelesaian untuk sepasang alternatif (A2, B2). Harga permainan adalah -2.
3. Cari penyelesaian untuk permainan dalam strategi campuran.
Mari selesaikan masalahnya dengan kaedah geometri, yang merangkumi langkah-langkah berikut:
1. Dalam sistem koordinat Cartesian, segmen diplot sepanjang abses, yang panjangnya adalah 1. Hujung kiri segmen (titik x = 0) sesuai dengan strategi A 1, yang kanan - dengan strategi A 2 (x = 1). Titik pertengahan x sesuai dengan kebarangkalian beberapa strategi campuran S 1 = (p 1, p 2).
2. Menang strategi A 1 ditunjukkan pada paksi ordinat kiri. Pada garis selari dengan paksi ordinat, dari titik 1, kemenangan strategi A 2 digambarkan.
Penyelesaian permainan ( 2 x n) dilakukan dari posisi pemain A, mematuhi strategi maksimin. Tidak ada pemain yang mempunyai strategi dominan dan pendua.

Strategi maksimal pemain A sesuai dengan titik N, yang mana sistem persamaan berikut dapat ditulis:
p 1 = 0
p 2 = 1
Harga permainan, y = -2
Sekarang kita dapat mencari strategi minimum pemain B dengan menuliskan sistem persamaan yang sesuai, tidak termasuk strategi B 1, B 3, B 4, yang jelas memberikan kerugian yang lebih besar kepada pemain B, dan, oleh itu, q 1 = 0, q 3 = 0, q 4 = 0 ...
-2q 2 = -2
q 2 = 1
Menyelesaikan sistem ini, kami dapati:
q 2 = 1.
Jawapan:
Harga permainan: y = -2, vektor strategi pemain:
Q (0, 1, 0, 0), P (0, 1)
4. Mari kita periksa kebenaran penyelesaian permainan dengan menggunakan kriteria optimum strategi.
Ia ij q j ≤ v
Ia ij p i ≥ v
M (P 1; Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M (P 2; Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M (P; Q 1) = (-6 0) + (2 1) = 2 ≥ v
M (P; Q 2) = (-6 0) + (-2 1) = -2 = v
M (P; Q 3) = (2 0) + (7 1) = 7 ≥ v
M (P; Q 4) = (4 0) + (-1 1) = -1 ≥ v
Semua ketaksamaan berpuas hati sebagai persamaan atau ketaksamaan yang ketat, oleh itu, penyelesaian untuk permainan dijumpai dengan betul.

Masalah 4
Berikan jawapan terperinci untuk soalan tersebut

5. TEORI PERMAINAN DAN PENYELESAIAN STATISTIK

5.1. Permainan matriks sifar

Pemodelan ekonomi dan matematik dijalankan dalam keadaan berikut:

Jaminan;

Ketidakpastian.

Pemodelan dalam keadaan kepastian mengandaikan adanya semua data normatif awal yang diperlukan (pemodelan matriks, perancangan dan pengurusan rangkaian).

Pemodelan berisiko dilakukan dengan ketidaktentuan stokastik, ketika nilai-nilai beberapa data awal adalah rawak dan undang-undang taburan kebarangkalian pemboleh ubah rawak ini diketahui (analisis regresi, teori antrian).

Pemodelan dalam menghadapi ketidaktentuan sepadan dengan ketiadaan lengkap beberapa data yang diperlukan untuk ini (teori permainan).

Model matematik untuk membuat keputusan yang optimum dalam situasi konflik dibina dalam keadaan tidak pasti.

Dalam teori permainan, konsep asas berikut digunakan:

Strategi;

Fungsi menang.

Oleh kursus kami akan memanggil pilihan dan pelaksanaan oleh pemain salah satu tindakan yang diperuntukkan oleh peraturan permainan.

Strategi adalah teknologi untuk memilih tindakan pada setiap gerakan, bergantung pada keadaan semasa.

Fungsi menang berfungsi untuk menentukan jumlah pembayaran pemain yang kalah kepada pemenang.

Dalam permainan matriks, fungsi pembayaran ditunjukkan sebagai matrik pembayaran :

di mana jumlah pembayaran kepada pemain I, yang memilih perpindahan, dari pemain II, yang memilih perpindahan.

Dalam permainan pasangan seperti itu, nilai fungsi pembayaran kedua-dua pemain dalam setiap situasi sama besarnya dan bertentangan dalam tanda, iaitu, dan permainan ini dipanggil jumlah sifar .

Proses "bermain permainan matriks" ditunjukkan sebagai berikut:

Matrik pembayaran ditetapkan;

Pemain I, secara bebas dari pemain II, memilih salah satu baris matriks ini, sebagai contoh, yang;

Pemain II, tanpa mengira pemain I, memilih salah satu lajur matriks ini, sebagai contoh, - th;

Elemen matriks menentukan berapa banyak pemain yang akan saya terima daripada pemain II. Sudah tentu, jika, maka ia datang mengenai kehilangan sebenar pemain I.

Permainan pasangan antagonis dengan matriks pembayaran akan dipanggil permainan.

Contohnya

Pertimbangkan permainan.

Matrik pembayaran ditetapkan:

.

Biarkan pemain I, bebas dari pemain II, memilih baris ke-3 matriks ini, dan pemain II, tanpa mengira pemain I, memilih lajur ke-2 matriks ini:

Kemudian pemain saya akan menerima 9 unit dari pemain II.

5.2. Strategi bersih yang optimum dalam permainan matriks

Strategi optimum adalah strategi pemain I sedemikian rupa sehingga dia tidak menurunkan ganjarannya untuk pilihan strategi oleh pemain II, dan strategi pemain II sehingga dia tidak meningkatkan kerugiannya untuk pilihan strategi oleh pemain I.

Memilih baris ke-3 matriks pembayaran sebagai langkahnya, pemain I memberikan dirinya bayaran sekurang-kurangnya nilai dalam keadaan terburuk, apabila pemain II akan berusaha meminimumkan nilai ini. Oleh itu, pemain saya akan memilih barisan yang akan memberikannya kemenangan maksimum:

.

Pemain II berfikir dengan cara yang sama dan pasti dapat menjamin kerugian minimum:

.

Ketidaksamaan itu selalu berlaku:

Kuantiti dipanggil harga bawah permainan .

Kuantiti dipanggil harga teratas permainan .

Strategi optimum dipanggil bersih jika mereka memenuhi persamaan:

,

.

Kuantiti dipanggil harga murni permainan , sekiranya .

Strategi dan bentuk murni yang optimum titik pelana matrik pembayaran.

Untuk titik pelana, syarat berikut dipenuhi:

iaitu elemen paling kecil di baris dan terbesar di lajur.

Oleh itu, jika matriks pembayaran mempunyai titik pelana maka anda boleh mencari strategi bersih yang optimum pemain.

Strategi murni pemain I dapat diwakili oleh satu set nombor (vektor) yang disusun, di mana semua nombor sama dengan sifar, kecuali untuk nombor di tempat ketiga, yang sama dengan satu.

Strategi murni pemain II dapat diwakili oleh set nombor yang disusun (vektor) di mana semua nombor sama dengan sifar, kecuali nombor di tempat ke-3, yang sama dengan satu.

Contohnya

.

Dengan memilih sebagai pindah mana-mana baris matriks pembayaran, pemain saya memastikan dirinya sebagai pembayaran terburuk sekurang-kurangnya nilai di lajur yang ditunjukkan oleh:

Oleh itu, pemain I akan memilih baris ke-2 matriks pembayaran, yang memberikannya pembayaran maksimum tanpa mengira pergerakan pemain II, yang akan berusaha meminimumkan nilai ini:

Pemain II berfikir sama dan memilih lajur pertama sebagai langkahnya:

Oleh itu, terdapat titik pelana matriks pembayaran:

sesuai dengan strategi murni yang optimum untuk pemain I dan untuk pemain II, di mana pemain I tidak menurunkan keuntungannya untuk sebarang perubahan strategi oleh pemain II dan pemain II tidak meningkatkan kerugiannya untuk sebarang perubahan strategi oleh pemain I.

5.3. Strategi campuran optimum dalam permainan matriks

Sekiranya matrik pembayaran tidak mempunyai titik pelana, maka adalah tidak rasional bagi mana-mana pemain untuk menggunakan satu strategi murni. Ia lebih menguntungkan untuk digunakan "campuran probabilistik" strategi murni. Kemudian, strategi yang sudah dicampurkan ditentukan sebagai strategi yang optimum.

Strategi bercampur pemain dicirikan oleh taburan kebarangkalian peristiwa rawak yang terdiri dalam pilihan pemain untuk bergerak.

Strategi campuran pemain I adalah satu set nombor yang disusun (vektor) yang memenuhi dua syarat:

1) kerana, kebarangkalian memilih setiap baris matriks pembayaran tidak negatif;

2), iaitu pilihan setiap baris matriks pembayaran dalam agregat mewakili kumpulan penuh peristiwa.

Strategi campuran pemain II adalah satu set nombor (vektor) yang memenuhi syarat:

Jumlah pembayaran kepada pemain I, yang telah memilih strategi campuran

dari pemain II yang memilih strategi campuran

,

mewakili purata

.

Optimum disebut strategi campuran

dan ,

jika ada strategi campuran yang sewenang-wenang dan syaratnya dipenuhi:

iaitu, di bawah strategi campuran yang optimum, pembayaran pemain I adalah yang paling besar, dan kehilangan pemain II adalah yang paling kecil.

Sekiranya tidak ada titik pelana dalam matriks pembayaran, maka

,

iaitu, terdapat perbezaan positif ( perbezaan yang tidak diperuntukkan )

- ³ 0,

dan pemain perlu mencari peluang tambahan dengan yakin mendapat bahagian yang lebih besar dari perbezaan ini yang mereka pilih.

Contohnya

Pertimbangkan permainan yang diberikan oleh matrik pembayaran:

.

Tentukan jika ada titik pelana:

, .

Ternyata tidak ada titik pelana dalam matriks pembayaran dan perbezaan yang tidak diperuntukkan sama dengan:

.

5.4. Mencari Strategi Campuran yang Optimum

untuk permainan 2 × 2

Penentuan strategi campuran optimum untuk matriks dimensi dilakukan dengan kaedah mencari titik optimum fungsi dua pemboleh ubah.

Biarkan kebarangkalian pemain saya memilih baris pertama matriks pembayaran

sama. Maka kebarangkalian untuk memilih baris kedua adalah.

Biarkan kebarangkalian pemain II memilih lajur pertama sama dengan. Maka kebarangkalian memilih lajur kedua adalah.

Jumlah pembayaran kepada pemain I oleh pemain II adalah sama dengan:

Nilai ekstrem keuntungan pemain I dan kehilangan pemain II sesuai dengan syarat:

;

.

Oleh itu, strategi campuran pemain I dan II yang optimum adalah sama:

5.5. Penyelesaian geometri permainan 2 ×n

Dengan peningkatan dimensi matriks pembayaran dari ke, tidak mungkin lagi untuk mengurangkan penentuan strategi campuran optimum untuk mencari fungsi dua variabel yang optimum. Namun, memandangkan salah satu pemain hanya mempunyai dua strategi, penyelesaian geometri dapat digunakan.

Tahap utama untuk mencari jalan keluar untuk permainan adalah seperti berikut.

Mari kita memperkenalkan sistem koordinat di satah. Lukis segmen pada paksi. Lukis tegak lurus dari hujung kiri dan kanan segmen ini.


Hujung kiri dan kanan segmen unit sesuai dengan dua strategi dan tersedia untuk pemain I. Pada tegak lurus yang dilukis, kami akan menangguhkan kemenangan pemain ini. Contohnya, untuk matrik pembayaran


seperti pembayaran pemain I ketika memilih strategi akan dan, dan ketika memilih strategi akan dan.

Mari kita berhubung dengan segmen garis lurus mata hasil pemain I yang sesuai dengan strategi pemain II. Kemudian garis putus yang terbentuk, mengikat graf dari bawah, menentukan batas bawah pembayaran pemain I.



Cari strategi campuran pemain I yang optimum

,

yang sesuai dengan titik di batas bawah pembayaran pemain I dengan ordinat maksimum.

Perhatikan bahawa dalam contoh yang dipertimbangkan, dengan hanya menggunakan dua strategi dan sesuai dengan garis lurus yang bersilang pada titik yang dijumpai di sempadan bawah pembayaran pemain I, pemain II dapat menghalang pemain I mendapat hasil yang lebih besar.

Oleh itu, permainan dikurangkan menjadi permainan dan strategi campuran pemain II yang optimum dalam contoh yang dipertimbangkan

,

di mana kebarangkaliannya sama seperti dalam permainan:

5.6. Penyelesaian permainanm× n

Sekiranya permainan matriks tidak mempunyai penyelesaian dalam strategi murni (iaitu, tidak ada titik pelana) dan, kerana dimensi matriks pembayaran yang besar, tidak dapat diselesaikan secara grafik, maka untuk mendapatkan penyelesaian, gunakan kaedah pengaturcaraan linear .

Biarkan matriks pembayaran dimensi diberikan:

.

Kebarangkalian perlu dijumpai , dengan pemain mana saya mesti memilih pergerakannya agar strategi campuran ini dapat menjaminnya sekurang-kurangnya hasilnya, tanpa mengira pilihan pergerakan pemain II.

Untuk setiap pergerakan yang dipilih oleh pemain II, pembayaran pemain I ditentukan oleh pergantungan:

Kami membahagikan kedua-dua sisi ketaksamaan dengan dan memperkenalkan notasi baru:

Kesaksamaan

Akan mengambil bentuk:

Oleh kerana pemain saya berusaha untuk memaksimumkan pembayaran, timbal balik mesti diminimumkan. Kemudian masalah pengaturcaraan linear untuk pemain I mengambil bentuk:

dengan sekatan

Begitu juga, masalah untuk pemain II dibina sebagai masalah ganda:

dengan sekatan

Menyelesaikan masalah menggunakan kaedah simplex, kami mendapat:

,

5.7. Ciri penyelesaian permainan matriks

Sebelum menyelesaikan masalah mencari strategi yang optimum, dua syarat harus diperiksa:

Adakah mungkin untuk mempermudah matriks pembayaran;

Sama ada matriks pembayaran mempunyai titik pelana.

Pertimbangkan kemungkinan mempermudah matriks pembayaran:

Kerana kenyataan bahawa pemain yang saya ingin dapatkan kemenangan terbesar, maka anda boleh mencoret garis pertama dari matriks pembayaran, kerana dia tidak akan pernah menggunakan langkah ini jika hubungan berikut dipenuhi dengan baris lain:

Begitu juga, dengan berusaha untuk kerugian terkecil, pemain II tidak akan pernah memilih lajur ith dalam matriks pembayaran sebagai langkah, dan lajur ini dapat dicoret jika hubungan berikut berlaku dengan lajur ith yang lain:

Paling penyelesaian mudah permainan adalah kehadiran dalam matriks pembayaran mudah dari titik pelana yang memenuhi syarat berikut (mengikut definisi):

Contohnya

Matrik pembayaran diberikan:

.

Penyederhanaan matriks pembayaran:

Titik pelana:

5.8. Bermain dengan alam

Berbeza dengan masalah teori permainan di masalah teori keputusan statistik situasi yang tidak menentu tidak mempunyai warna konflik antagonis dan bergantung pada realiti objektif, yang biasanya disebut "alam semula jadi" .

Dalam permainan matriks dengan sifat semula jadi, pemain II dimainkan oleh sekumpulan faktor tidak pasti yang mempengaruhi keberkesanan keputusan yang dibuat.

Permainan matriks dengan sifat berbeza dari permainan matriks biasa hanya kerana, ketika memilih strategi yang optimum, pemain I tidak lagi dapat dibimbing oleh fakta bahawa pemain II akan berusaha untuk mengurangkan kerugiannya. Oleh itu, bersama dengan matrik pembayaran, kami memperkenalkan matriks risiko :

di manakah nilai risiko pemain I ketika menggunakan gerakan dalam keadaan sama dengan perbezaannya antara pembayaran pemain yang akan saya terima sekiranya dia mengetahui bahawa syaratnya akan ditetapkan, iaitu , dan kemenangan yang akan dia terima, tidak tahu bila memilih langkah bahawa syaratnya akan ditetapkan.

Oleh itu, matriks pembayaran secara jelas diubah menjadi matriks risiko, dan penukaran terbalik adalah samar-samar.

Contohnya

Matrik pembayaran:

.

Matrik Risiko:

Kemungkinan dua penyataan masalah mengenai memilih jalan penyelesaian dalam permainan matriks dengan alam semula jadi :

Memaksimumkan kemenangan anda;

Meminimumkan risiko.

Masalah membuat keputusan dapat diajukan untuk salah satu dari dua syarat:

- berisiko apabila fungsi taburan kebarangkalian strategi alam diketahui, misalnya, nilai rawak berlakunya setiap situasi ekonomi tertentu yang diandaikan;

- dalam menghadapi ketidaktentuan apabila fungsi taburan kebarangkalian tidak diketahui.

5.9. Menyelesaikan masalah teori keputusan statistik

berisiko

Semasa membuat keputusan dalam keadaan berisiko, pemain saya tahu kebarangkaliannya permulaan keadaan semula jadi.

Maka adalah wajar bagi pemain I untuk memilih strategi yang mana nilai purata kemenangan, diambil setiap baris, maksimum :

.

Semasa menyelesaikan masalah ini dengan matriks risiko, kami memperoleh penyelesaian yang sama dengan risiko purata minimum :

.

5.10. Menyelesaikan masalah teori keputusan statistik

dalam menghadapi ketidaktentuan

Semasa membuat keputusan dalam keadaan tidak pasti, anda boleh menggunakan yang berikut kriteria :

Kriteria Wald's Maximin;

Kriteria risiko minimum Sevija;

Kriteria untuk pesimisme adalah optimisme Hurwitz;

Prinsip Laplace yang tidak mencukupi.

Pertimbangkan Ujian maksimin Wald .

Permainan dengan alam semula jadi dimainkan seperti musuh agresif yang wajar, iaitu pendekatan reasuransi dilakukan dari posisi pesimisme ekstrim untuk matriks pembayaran:

.

Pertimbangkan Kriteria risiko minimum yang bijak .

Pendekatan yang serupa dengan yang sebelumnya dari kedudukan pesimisme ekstrem untuk matriks risiko:

.

Pertimbangkan kriteria pesimisme - optimisme Hurwitz .

Peluang ditawarkan untuk tidak dipandu oleh pesimisme ekstrem atau optimisme yang melampau:

di mana tahap pesimisme;

pada - optimisme yang melampau,

pada - pesimisme yang melampau.

Pertimbangkan Prinsip Laplace yang tidak mencukupi .

Dipercayai bahawa semua keadaan alam sama mungkin:

,

.

Kesimpulan pada bahagian kelima

Dua pemain mengambil bahagian dalam permainan matriks, dan fungsi pembayaran, yang berfungsi untuk menentukan jumlah pembayaran pemain yang kalah kepada pemenang, diwakili dalam bentuk matriks pembayaran. Kami bersetuju bahawa pemain I memilih salah satu baris matriks pembayaran sebagai langkah, dan pemain II memilih salah satu lajurnya. Kemudian, di persimpangan baris dan lajur matriks yang dipilih ini, terdapat nilai angka pembayaran kepada pemain I dari pemain II (jika nilai ini positif, maka pemain saya benar-benar menang, dan jika negatif, maka pemain II pada dasarnya menang).

Sekiranya terdapat titik pelana dalam matriks pembayaran, maka pemain mempunyai strategi murni yang optimum, iaitu untuk menang, masing-masing dari mereka mesti mengulangi satu langkah optimumnya. Sekiranya tidak ada titik pelana, maka untuk menang, masing-masing harus menggunakan strategi campuran yang optimum, yaitu menggunakan campuran gerakan, yang masing-masing mesti dilakukan dengan kebarangkalian yang optimum.

Pencarian strategi campuran optimum untuk permainan 2 × 2 dilakukan dengan mengira kebarangkalian optimum menggunakan formula yang diketahui. Melalui penyelesaian geometri Untuk permainan 2 × n, definisi strategi campuran optimum di dalamnya dikurangkan untuk mencari strategi campuran optimum untuk permainan 2 × 2. Untuk menyelesaikan permainan m × n, kaedah pengaturcaraan linear digunakan untuk mencari strategi campuran yang optimum di dalamnya.

Sebilangan matriks pembayaran memberi kemudahan kepada penyederhanaan, akibatnya dimensinya dikurangkan dengan membuang baris dan lajur yang sesuai dengan pergerakan tanpa kompromi.

Sekiranya pemain II adalah sekumpulan faktor tidak pasti yang bergantung pada realiti objektif dan tidak mempunyai warna konflik antagonis, maka permainan seperti itu disebut permainan dengan sifat, dan masalah teori keputusan statistik digunakan untuk menyelesaikannya. Kemudian, bersama dengan matriks pembayaran, matriks risiko diperkenalkan dan dua pernyataan mengenai masalah memilih penyelesaian dalam permainan matriks dengan sifat mungkin: memaksimumkan pembayaran dan meminimumkan risiko.

Penyelesaian masalah teori keputusan statistik dalam keadaan risiko menunjukkan bahawa disarankan bagi pemain I untuk memilih strategi yang mana nilai rata-rata (jangkaan matematik) dari pembayaran yang diambil dari baris matriks pembayaran adalah maksimum, atau (yang sama) nilai purata (jangkaan matematik) risiko yang diambil oleh deretan matriks risiko adalah minimum. Semasa membuat keputusan dalam keadaan tidak pasti, gunakan kriteria berikut: Kriteria maksimin Wald, kriteria risiko minimum Sevidge, kriteria pesimisme-optimisme Hurwitz, prinsip Laplace yang tidak mencukupi.

Soalan ujian kendiri

Bagaimanakah konsep asas teori permainan ditentukan: fungsi bergerak, strategi dan pembayaran?

Bagaimana fungsi pembayaran ditunjukkan dalam permainan matriks?

Mengapa permainan matriks disebut jumlah sifar?

Bagaimana proses bermain permainan matriks diwakili?

Permainan apa yang dipanggil permainan m × n?

Apa strategi optimum untuk permainan matriks?

Apa strategi optimum untuk permainan matriks yang disebut tulen?

Apakah maksud titik pelana matrik pembayaran?

Apa strategi optimum untuk permainan matriks yang disebut campuran?

Bagaimana strategi campuran pemain muncul?

Berapakah jumlah pembayaran kepada Pemain I dari Pemain II yang memilih strategi campuran?

Apa strategi campuran yang disebut optimum?

Apakah maksud perbezaan yang tidak diperuntukkan?

Kaedah apa yang digunakan untuk mencari strategi campuran yang optimum untuk permainan 2 × 2?

Bagaimana strategi campuran optimum untuk permainan 2 × n dijumpai?

Kaedah apa yang digunakan untuk mencari strategi campuran yang optimum untuk permainan m × n?

Apakah ciri-ciri menyelesaikan permainan matriks?

Apa maksud penyederhanaan matriks pembayaran dan dalam keadaan apa ia dapat dilakukan?

Permainan matriks mana yang lebih senang diselesaikan apabila matrik pembayaran mempunyai atau tidak mempunyai titik pelana?

Apa masalah dalam teori permainan yang berkaitan dengan masalah dalam teori keputusan statistik?

Bagaimana Matriks Pembayaran Diubah menjadi Matriks Risiko?

Apa dua rumusan masalah memilih penyelesaian yang mungkin berlaku dalam permainan matriks dengan sifat semula jadi?

Untuk dua syarat apa masalah membuat keputusan dapat dibuat dalam permainan matriks dengan alam semula jadi?

Strategi apa yang sesuai untuk dipilih oleh pemain I ketika menyelesaikan masalah teori keputusan statistik dalam keadaan berisiko?

Apa kriteria keputusan yang dapat digunakan dalam menyelesaikan masalah teori keputusan statistik dalam keadaan tidak pasti?

Contoh penyelesaian masalah

1. Matriks pembayaran menunjukkan jumlah keuntungan syarikat semasa ia menjual pelbagai jenis produk (lajur) bergantung pada permintaan yang stabil (baris). Adalah perlu untuk menentukan strategi optimum perusahaan untuk pengeluaran produk dari pelbagai jenis dan pendapatan maksimum (rata-rata) yang sesuai dari penjualan mereka.

Mari kita nyatakan matriks yang diberikan oleh dan memperkenalkan pemboleh ubah. Kami juga akan menggunakan matriks (vektor). Kemudian dan, iaitu

Matriks songsang dikira:

Nilai dijumpai:

.

Kebarangkalian dikira:

Pendapatan purata dari penjualan ditentukan:

.

2. Firma "Ahli Farmasi" adalah pengeluar ubat-ubatan dan produk bioperubatan di rantau ini. Telah diketahui bahawa puncak permintaan untuk beberapa ubat jatuh musim panas(ubat-ubatan kumpulan kardiovaskular, analgesik), untuk yang lain - untuk tempoh musim gugur dan musim bunga (anti-berjangkit, antitusif).

Kos untuk 1 penukaran unit produk untuk bulan September-Oktober adalah: untuk kumpulan pertama (ubat kardiovaskular dan analgesik) - 20 rubel; dalam kumpulan kedua (ubat anti-jangkitan, antitussive) - 15 rubel.

Menurut pemerhatian untuk beberapa beberapa tahun kebelakangan ini perkhidmatan pemasaran syarikat telah membuktikan bahawa ia dapat mewujudkan selama dua bulan yang dipertimbangkan dalam cuaca panas 3050 konv. unit produk kumpulan pertama dan 1100 penukaran unit produk kumpulan kedua; dalam cuaca sejuk - 1525 penukaran unit produk kumpulan pertama dan 3690 penukaran unit kumpulan kedua.

Sehubungan dengan kemungkinan perubahan cuaca, tugas diajukan - untuk menentukan strategi perusahaan dalam pembuatan produk yang memberikan penghasilan maksimum dari penjualan dengan harga penjualan 40 rubel. untuk 1 penukaran unit produk kumpulan pertama dan 30 rubel. - kumpulan kedua.

KEPUTUSAN. Syarikat ini mempunyai dua strategi:

Cuaca akan menjadi panas tahun ini;

Cuaca akan menjadi sejuk.

Sekiranya syarikat menggunakan strategi dan pada kenyataannya akan ada cuaca panas (strategi alam semula jadi), maka produk pembuatan (3050 unit konvensional kumpulan ubat pertama dan 1100 unit konvensional kumpulan kedua) akan dijual sepenuhnya dan pendapatan akan menjadi

3050 × (40-20) + 1100 × (30-15) = 77500 p.

Dalam cuaca sejuk (strategi alam), ubat kumpulan kedua akan dijual sepenuhnya, dan kumpulan pertama hanya dalam jumlah 1525 konv. unit dan beberapa ubat akan tetap tidak disedari. Pendapatan akan

1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 p.

Begitu juga, jika borang itu menggunakan strategi dan cuaca sebenarnya sejuk, maka pendapatannya akan menjadi

1525 × (40-20) + 3690 × (30-15) = 85850 p.

Dalam cuaca panas, pendapatan akan menjadi

1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 p.

Memandangkan syarikat dan cuaca sebagai dua pemain, kami mendapat matrik pembayaran

,

Harga permainan terletak pada jangkauan

Hal ini dapat dilihat dari matriks pembayaran bahawa, dalam semua keadaan, pendapatan syarikat akan sekurang-kurangnya 16.500 rubel, tetapi jika keadaan cuaca bertepatan dengan strategi yang dipilih, maka pendapatan syarikat dapat menjadi 77.500 rubel.

Mari cari jalan penyelesaian untuk permainan.

Mari kita menunjukkan kebarangkalian penerapan strategi syarikat melalui, strategi melalui, dan. Menyelesaikan permainan secara grafik dengan kaedah, kita dapat , sementara harga permainan adalah p.

Rancangan pengeluaran ubat yang optimum adalah

Oleh itu, disarankan syarikat menghasilkan pada bulan September dan Oktober 2379 konv. unit ubat kumpulan pertama dan 2239.6 penukaran unit ubat dari kumpulan kedua, maka dalam cuaca apa pun dia akan mendapat pendapatan sekurang-kurangnya 46986 rubel.

Dalam keadaan ketidakpastian, jika tidak mungkin syarikat menggunakan strategi campuran (kontrak dengan organisasi lain), untuk menentukan strategi optimum syarikat, kami menggunakan kriteria berikut:

Kriteria Walde:

Kriteria Hurwitz: untuk kepastian, kami akan menerima, kemudian untuk strategi syarikat

untuk strategi

disarankan agar firma menggunakan strategi.

Kriteria Savage. Unsur maksimum pada lajur pertama ialah 77500, di lajur kedua ialah 85850.

Unsur-unsur matriks risiko dijumpai dari ungkapan

,

dari mana ,,

Matriks risiko mempunyai bentuk

,

disarankan untuk menggunakan strategi atau.

Oleh itu, disarankan agar firma tersebut menerapkan strategi atau.

Perhatikan bahawa setiap kriteria yang dipertimbangkan tidak boleh dianggap memuaskan sepenuhnya pilihan terakhir keputusan, bagaimanapun, analisis bersama mereka membolehkan anda dengan lebih jelas menunjukkan akibat membuat keputusan pengurusan tertentu.

Dengan sebaran kebarangkalian dari pelbagai keadaan semula jadi yang diketahui, kriteria untuk membuat keputusan adalah jangkaan matematik maksimum untuk menang.

Biarkan diketahui masalah yang dipertimbangkan bahawa kebarangkalian cuaca panas dan sejuk sama dan 0,5, maka strategi optimum syarikat ditentukan seperti berikut:

Sebaiknya firma menggunakan strategi atau.

Tugasan belajar sendiri

1. Perusahaan dapat menghasilkan tiga jenis produk (A, B dan C), sambil menerima keuntungan yang bergantung pada permintaan. Permintaan, pada gilirannya, dapat mengambil salah satu daripada empat keadaan (I, II, III dan IV). Dalam matriks berikut, unsur-unsur mencirikan keuntungan yang akan diterima syarikat ketika menghasilkan produk-dan keadaan permintaan -th:

Sekiranya dalam permainan masing-masing lawan hanya menerapkan strategi yang sama, maka mengenai permainan itu sendiri dalam hal ini mereka mengatakan bahawa itu terjadi dalam strategi murni , dan digunakan oleh pemain TETAPI dan pemain DALAM beberapa strategi dipanggil strategi murni .

Definisi. Dalam permainan antagonis, sepasang strategi ( TETAPI i , DALAM j) dipanggil keseimbangan atau stabil jika tidak menguntungkan bagi mana-mana pemain untuk menyimpang dari strategi mereka.

Adalah masuk akal untuk menggunakan strategi murni ketika pemain TETAPI dan DALAM mempunyai maklumat mengenai tindakan masing-masing dan hasil yang dicapai. Sekiranya kita menganggap bahawa sekurang-kurangnya salah satu pihak tidak mengetahui tentang tingkah laku lawan, maka idea keseimbangan dilanggar, dan permainan ini dimainkan secara sembarangan.

Pertimbangkan permainan matriks G(3x4)

Dalam contoh ini, harga permainan yang lebih rendah sama dengan yang lebih tinggi: == 9, iaitu permainan mempunyai titik pelana.

Ternyata dalam kes ini strategi maksimin TETAPI 2 dan DALAM 2 kehendak lestari berhubung dengan maklumat mengenai tingkah laku musuh.

Betul, biarkan pemain TETAPI mengetahui bahawa musuh menggunakan strategi DALAM 2. Tetapi dalam kes ini pemain TETAPI akan terus mematuhi strategi TETAPI 2, kerana ada penyimpangan dari strategi TETAPI 2 hanya akan mengurangkan kemenangan. Begitu juga dengan maklumat yang diterima oleh pemain DALAM, tidak akan memaksanya untuk menyimpang dari strateginya DALAM 2 .

Beberapa strategi TETAPI 2 dan DALAM 2 memiliki sifat kestabilan, dan hasil (dalam contoh yang dipertimbangkan, ia sama dengan 9), yang dicapai dengan sepasang strategi ini, ternyata menjadi titik pelana matriks pembayaran.

Tanda kestabilan (keseimbangan) pasangan strategi adalah persamaan yang lebih rendah dan harga teratas permainan.

Strategi TETAPI i dan DALAM j(dalam contoh yang dipertimbangkan TETAPI 2 , DALAM 2), di mana harga permainan yang lebih rendah dan atas sama, disebut strategi murni optimum, dan kombinasi mereka disebut penyelesaian permainan. Dalam kes ini, permainan itu sendiri dikatakan dapat diselesaikan dengan strategi murni.

Nilainya disebut kos permainan.

Sekiranya 0, maka permainan ini bermanfaat bagi pemain A, jika 0 - untuk pemain B; untuk = 0 permainan itu adil, iaitu sama bermanfaat untuk kedua-dua peserta.

Namun, kehadiran titik pelana dalam permainan jauh dari peraturan, bukan pengecualian. Sebilangan besar permainan matriks tidak mempunyai titik pelana, dan oleh itu tidak mempunyai strategi murni yang optimum. Walau bagaimanapun, ada jenis permainan yang selalu mempunyai titik pelana dan, oleh itu, diselesaikan dengan strategi murni. Ini adalah permainan dengan maklumat lengkap.

Teorem 2. Setiap permainan dengan maklumat lengkap mempunyai titik pelana, dan, oleh itu, diselesaikan dalam strategi murni, iaitu terdapat sepasang strategi murni yang optimum memberikan hasil yang stabil sama dengan.

Sekiranya permainan seperti itu hanya terdiri dari gerakan peribadi, maka apabila setiap pemain menerapkan strategi murni yang optimum, permainan harus berakhir dengan kemenangan yang sama dengan harga permainan. Sebagai contoh, permainan catur, sebagai permainan dengan maklumat lengkap, baik selalu berakhir dengan kemenangan untuk putih, atau selalu dengan kemenangan untuk hitam, atau selalu dengan keputusan seri (apa sebenarnya - kita belum tahu, kerana jumlahnya kemungkinan strategi dalam permainan catur sangat besar).

Sekiranya matriks permainan mengandungi titik pelana, maka penyelesaiannya segera dijumpai mengikut prinsip maksimin.

Persoalannya timbul: bagaimana mencari penyelesaian untuk permainan yang matriks pembayarannya tidak mempunyai titik pelana? Penerapan prinsip maksimin oleh setiap pemain memberikan pemain A sekurang-kurangnya keuntungan, dan kerugian bagi pemain paling banyak. Memandangkan adalah wajar bagi pemain A untuk meningkatkan kemenangannya, dan pemain B mengurangkan kerugiannya. Pencarian penyelesaian seperti itu membawa kepada perlunya menerapkan strategi campuran: untuk mengganti strategi murni dengan beberapa frekuensi.

Definisi. Pemboleh ubah rawak yang nilainya adalah strategi murni pemain dipanggil miliknya strategi campuran .

Oleh itu, tugas strategi campuran pemain terdiri dalam menunjukkan kebarangkalian dengan mana strategi murni dipilih.

Kami akan menunjukkan strategi campuran pemain TETAPI dan DALAM masing-masing

S A = || p 1, p 2, ..., p m ||,

S B = || q 1, q 2, ..., q n ||,

di mana p i adalah kebarangkalian pemain menggunakan TETAPI bersih dari strategi TETAPI saya; ; q j adalah kebarangkalian pemain B menggunakan strategi murni B j; ...

Dalam kes khas, apabila semua kebarangkalian, kecuali satu, sama dengan sifar, dan ini sama dengan satu, strategi campuran berubah menjadi yang murni.

Penerapan strategi campuran dilakukan, misalnya, dengan cara ini: permainan diulang berkali-kali, tetapi dalam setiap permainan pemain menerapkan strategi murni yang berbeda dengan frekuensi relatif aplikasi mereka sama dengan hlm i dan q j .

Strategi campuran dalam teori permainan adalah model taktik yang lancar dan fleksibel, di mana tidak ada pemain yang tahu strategi bersih mana yang akan dipilih lawan dalam permainan tertentu.

Sekiranya pemain TETAPI menerapkan strategi campuran S A = || p 1, p 2, ..., p m ||, dan pemain DALAM strategi campuran S B = || q 1, q 2, ..., q n ||, maka rata-rata pembayaran (jangkaan matematik) pemain TETAPI ditentukan oleh nisbah

Secara semula jadi, jangkaan kehilangan pemain DALAM sama dengan nilai yang sama.

Oleh itu, jika permainan matriks tidak mempunyai titik pelana, maka pemain harus menggunakan strategi campuran optimum yang akan memberikan hasil maksimum.

Persoalannya secara semula jadi timbul: pertimbangan apa yang harus diikuti ketika memilih strategi campuran? Ternyata prinsip maksimin mengekalkan maksudnya dalam kes ini juga. Lebih-lebih lagi, penting untuk memahami penyelesaian permainan, mainkan teori asas teori permainan.

Kaedah dan model matematik dalam ekonomi

Permainan matriks

Pengenalan

Dalam amalan ekonomi, situasi sering timbul di mana pihak yang berbeza mengejar tujuan yang berbeza. Contohnya, hubungan antara penjual dan pembeli, pembekal dan pengguna, bank dan pendeposit, dll. Situasi konflik seperti itu tidak hanya timbul dalam ekonomi, tetapi juga dalam aktiviti lain. Contohnya, semasa bermain catur, kotak-kotak, domino, loto, dll.

Permainan- ini adalah model matematik situasi konflik melibatkan sekurang-kurangnya dua orang yang menggunakan beberapa cara yang berbeza untuk mencapai matlamat anda. Permainan dipanggil bilik wap, sekiranya dua pemain mengambil bahagian di dalamnya. Permainan dipanggil antagonis, jika keuntungan satu pemain sama dengan kerugian yang lain. Oleh itu, untuk mengatur permainan, cukup untuk menetapkan nilai-nilai pembayaran satu pemain dalam situasi yang berbeza.

Sebarang kaedah tindakan pemain, bergantung pada keadaan, dipanggil strategi. Setiap pemain mempunyai strategi tertentu. Sekiranya bilangan strategi adalah terbatas, maka permainan akan dipanggil muktamad, jika tidak - tidak berkesudahan . Strategi dipanggil bersih, sekiranya setiap pemain memilih satu strategi hanya dengan cara tertentu dan bukan secara rawak.

Penyelesaian permainan adalah memilih strategi yang memuaskan keadaan optimum. Keadaan ini adalah satu pemain mendapat kemenangan maksimum, sekiranya yang kedua mematuhi strateginya. Sebaliknya, pemain kedua menerima kerugian minimum, sekiranya pemain pertama berpegang pada strateginya. Strategi sedemikian disebut optimum . Dengan cara ini, tujuan permainan adalah untuk menentukan strategi optimum bagi setiap pemain.

Permainan strategi murni

Pertimbangkan permainan dengan dua pemain TETAPI dan DALAM. Andaikan pemain TETAPI Ia mempunyai m strategi А 1, А 2, ..., А m dan pemain DALAM Ia mempunyai n strategi B 1, B 2, ..., B n. Kami akan menganggap bahawa pilihan pemain TETAPI strategi A i, dan pemain DALAM strategi B j menentukan hasil permainan secara unik, iaitu memperoleh sebuah ij pemain TETAPI dan menang b ij pemain DALAM. Di sini i = 1,2, ..., m, j = 1,2, ..., n.

Permainan paling mudah dengan dua pemain adalah permainan antagonis , mereka. permainan di mana kepentingan pemain bertentangan. Dalam kes ini, pembayaran pemain berkaitan dengan persamaan

b ij = -a ij

Persamaan ini bermaksud bahawa keuntungan salah satu pemain sama dengan kerugian yang lain. Dalam kes ini, memadai untuk mempertimbangkan hanya pembayaran salah satu pemain, misalnya pemain TETAPI.

Setiap pasangan strategi A i dan B j sepadan dengan kemenangan sebuah ij pemain TETAPI. Adalah senang untuk menulis semua kemenangan ini dalam bentuk matrik pembayaran

Baris matriks ini sesuai dengan strategi pemain TETAPI, dan lajur adalah untuk strategi pemain DALAM. Secara umum, permainan seperti itu disebut (m × n)-permainan.


Contoh 1. Dua pemain TETAPI dan DALAM buang duit syiling. Sekiranya sisi duit syiling bertepatan, maka menang TETAPI, iaitu pemain DALAM membayar pemain TETAPI sejumlah wang sama dengan 1, dan jika tidak bertepatan, maka pemain B menang, iaitu sebaliknya, pemain TETAPI membayar pemain DALAM jumlah yang sama , sama 1. Bentuk matrik pembayaran.

Keputusan. Dengan keadaan masalah

© 2021 skudelnica.ru - Cinta, pengkhianatan, psikologi, perceraian, perasaan, pertengkaran