Permainan dalam strategi tulen. Elena Wentzel

rumah / bergaduh

strategi permainan teori bercampur

Strategi Campuran

Jika tiada titik pelana dalam strategi tulen dalam permainan matriks, maka harga atas dan bawah permainan ditemui. Mereka menunjukkan bahawa pemain 1 tidak akan menerima bayaran yang lebih besar daripada harga atas permainan, dan pemain 1 itu dijamin ganjaran tidak kurang daripada harga permainan yang lebih rendah.

Strategi campuran pemain ialah set lengkap strategi tulennya apabila permainan diulang berkali-kali dalam keadaan yang sama dengan kebarangkalian yang diberikan. Mari kita ringkaskan apa yang telah diperkatakan dan senaraikan syarat-syarat permohonan strategi bercampur:

  • * permainan tanpa mata pelana;
  • * pemain menggunakan campuran rawak strategi tulen dengan kebarangkalian yang diberikan;
  • * permainan diulang berkali-kali dalam keadaan yang sama;
  • * pada setiap gerakan, tiada pemain dimaklumkan tentang pilihan strategi oleh pemain lain;
  • * purata keputusan permainan dibenarkan.

Notasi berikut untuk strategi campuran digunakan.

Untuk pemain 1, strategi campuran yang terdiri daripada menggunakan strategi tulen A 1 , A 2 , ..., A t dengan kebarangkalian yang sepadan p 1 , p 2, ..., p t.

Untuk pemain 2

q j ialah kebarangkalian untuk menggunakan strategi tulen B j .

Dalam kes di mana p i = 1, untuk pemain 1 kita mempunyai strategi tulen

Strategi murni pemain adalah satu-satunya acara yang tidak serasi yang mungkin. Dalam permainan matriks, mengetahui matriks A (ia terpakai kepada kedua-dua pemain 1 dan pemain 2), kita boleh menentukan bila vektor yang diberikan dan keuntungan purata ( nilai yang dijangkakan kesan) pemain 1:

di mana dan adalah vektor;

p i dan q i ialah komponen vektor.

Dengan menggunakan strategi campurannya, pemain 1 berusaha untuk memaksimumkan pulangan puratanya, dan pemain 2 berusaha untuk membawa kesan ini kepada nilai minimum yang mungkin. Pemain 1 bertujuan untuk mencapai

Pemain 2 cuba memenuhi syarat

Mari kita juga menyatakan vektor yang sepadan dengan strategi campuran optimum pemain 1 dan 2, iaitu, vektor tersebut dan yang mana persamaan

Kos permainan ialah bayaran purata pemain 1 apabila kedua-dua pemain menggunakan strategi campuran. Oleh itu, penyelesaian kepada permainan matriks ialah:

  • - strategi campuran optimum pemain 1;
  • - strategi campuran optimum pemain 2;

Harga permainan.

Strategi campuran akan menjadi optimum (u) jika ia membentuk titik pelana untuk fungsi i.e.

Terdapat teorem asas permainan matematik.

Untuk permainan matriks dengan mana-mana matriks A, nilainya

wujud dan sama antara satu sama lain: = = .

Perlu diingatkan bahawa apabila memilih strategi optimum, pemain 1 akan sentiasa dijamin bayaran purata tidak kurang daripada kos permainan untuk mana-mana strategi tetap pemain 2 (dan sebaliknya untuk pemain 2). Strategi aktif pemain 1 dan 2 ialah strategi yang merupakan sebahagian daripada strategi campuran optimum pemain sepadan dengan kebarangkalian selain sifar. Ini bermakna bahawa komposisi strategi campuran optimum pemain mungkin tidak termasuk semua strategi a priori mereka yang diberikan.

Untuk menyelesaikan permainan bermakna mencari harga permainan dan strategi yang optimum. Mempertimbangkan kaedah untuk mencari strategi campuran optimum untuk permainan matriks, kita mulakan dengan permainan yang paling mudah, diterangkan oleh matriks 22. Permainan dengan mata pelana tidak akan dipertimbangkan secara khusus. Jika titik pelana diperoleh, maka ini bermakna terdapat strategi yang tidak menguntungkan yang harus ditinggalkan. Sekiranya tiada titik pelana, dua strategi campuran optimum boleh diperolehi. Seperti yang telah dinyatakan, strategi campuran ini ditulis seperti berikut:

Jadi terdapat matriks bayaran

a 11 p 1 + a 21 p 2 = ; (1.16)

a 12 p 1 + a 22 p 2 =; (1.17)

p 1 + p 2 = 1. (1.18)

a 11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

a 11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1 , (1.20)

di mana kita mendapat nilai optimum:

Mengetahui dan, kami dapati:

Pengkomputeran, kami dapati:

a 11 q 1 + a 12 q 2 = ; q 1 + q 2 \u003d 1; (1.24)

a 11 q 1 + a 12 (1 - q 1) = . (1.25)

untuk 11 a 12 . (1.26)

Masalahnya diselesaikan, kerana vektor dan harga permainan ditemui. Mempunyai matriks pembayaran A, kita boleh menyelesaikan masalah secara grafik. Dengan kaedah ini, algoritma penyelesaian adalah sangat mudah (Rajah 2.1).

  • 1. Segmen unit panjang diplot di sepanjang absis.
  • 2. Pada paksi-y, keuntungan diplot dengan strategi A 1 .
  • 3. Pada garisan selari dengan paksi-y, pada titik 1, bayaran diplot untuk strategi a 2 .
  • 4. Hujung segmen ditunjukkan untuk a 11 -b 11, a 12 -b 21, a 22 -b 22, a 21 -b 12 dan dua garis lurus dilukis b 11 b 12 dan b 21 b 22.
  • 5. Ordinasi titik persilangan dengan ditentukan. Dia sama rata. Abscissa titik c adalah sama dengan p 2 (p 1 \u003d 1 - p 2).

nasi. 1.1.

Kaedah ini mempunyai kawasan aplikasi yang agak luas. Ini berdasarkan harta bersama permainan tn, yang terdiri daripada fakta bahawa dalam mana-mana permainan tn setiap pemain mempunyai strategi campuran optimum di mana bilangan strategi tulen adalah paling banyak min(m, n). Akibat yang terkenal boleh diperoleh daripada harta ini: dalam mana-mana permainan 2n dan m2 setiap strategi optimum u mengandungi paling banyak dua strategi aktif. Oleh itu, mana-mana permainan 2n dan m2 boleh dikurangkan kepada permainan 22. Oleh itu, permainan 2n dan m2 boleh diselesaikan secara grafik. Jika matriks permainan terhingga mempunyai dimensi mn, di mana m > 2 dan n > 2, maka pengaturcaraan linear digunakan untuk menentukan strategi campuran yang optimum.

5. TEORI PERMAINAN DAN PENYELESAIAN STATISTIK

5.1. Permainan matriks jumlah sifar

Pemodelan ekonomi dan matematik dijalankan di bawah keadaan berikut:

Kepastian;

Ketidakpastian.

Permodelan dalam keadaan yang pasti menganggap ketersediaan semua data pengawalseliaan awal yang diperlukan untuk ini (pemodelan matriks, perancangan rangkaian dan pengurusan).

Permodelan berisiko dijalankan di bawah ketidakpastian stokastik, apabila nilai beberapa data awal adalah rawak dan undang-undang taburan kebarangkalian pembolehubah rawak ini diketahui (analisis regresi, teori baris gilir).

Permodelan dalam keadaan tidak menentu sepadan ketiadaan total beberapa data yang diperlukan untuk ini (teori permainan).

Model matematik untuk membuat keputusan yang optimum dalam situasi konflik dibina dalam keadaan tidak menentu.

Dalam teori permainan, konsep asas berikut digunakan:

Strategi;

fungsi menang.

bergerak kami akan memanggil pilihan dan pelaksanaan oleh pemain salah satu tindakan yang diperuntukkan oleh peraturan permainan.

Strategi - Ini adalah teknologi untuk memilih tindakan untuk setiap langkah, bergantung pada situasi.

fungsi menang berfungsi untuk menentukan jumlah bayaran pemain yang kalah kepada pemenang.

Dalam permainan matriks, fungsi bayaran diwakili sebagai matriks pembayaran :

di manakah jumlah bayaran kepada pemain I, yang memilih perpindahan itu, daripada pemain II, yang memilih perpindahan itu.

Dalam permainan berpasangan sedemikian, nilai fungsi pembayaran kedua-dua pemain dalam setiap situasi adalah sama dalam magnitud dan bertentangan dalam tanda, i.e. dan permainan ini dipanggil jumlah sifar .

Proses "bermain permainan matriks" diwakili seperti berikut:

Matriks pembayaran ditetapkan;

Pemain I, tanpa mengira pemain II, memilih salah satu daripada baris matriks ini, contohnya, -th;

Pemain II, tanpa mengira pemain I, memilih salah satu lajur matriks ini, sebagai contoh, - ke;

Elemen matriks menentukan jumlah pemain yang saya akan terima daripada pemain II. Sudah tentu, jika , maka kita bercakap tentang kehilangan sebenar pemain I.

Permainan pasangan antagonis dengan matriks bayaran akan dipanggil permainan .

Contoh

Mari kita pertimbangkan permainan.

Matriks pembayaran diberikan:

.

Biarkan pemain I, tanpa mengira pemain II, memilih baris ke-3 matriks ini, dan pemain II, tanpa mengira pemain I, memilih lajur ke-2 matriks ini:

Kemudian pemain I akan menerima 9 unit daripada pemain II.

5.2. Strategi tulen yang optimum dalam permainan matriks

Strategi optimum Strategi pemain I dipanggil sedemikian rupa sehingga dia tidak mengurangkan bayarannya untuk sebarang pilihan strategi oleh pemain II, dan strategi pemain II sedemikian sehingga dia tidak meningkatkan kerugiannya untuk sebarang pilihan strategi oleh pemain I.

Dengan memilih baris ke-i matriks hasil sebagai satu langkah, pemain I memperoleh bayaran sekurang-kurangnya nilai dalam kes yang paling teruk, apabila pemain II cuba meminimumkan nilai ini. Oleh itu, pemain saya akan memilih barisan ke-1 yang akan diberikan kepadanya kemenangan maksimum:

.

Pemain II berhujah dengan cara yang sama dan boleh menjamin dirinya kerugian minimum pasti:

.

Ketaksamaan berikut sentiasa benar:

Nilai itu dipanggil harga lebih rendah permainan .

Nilai itu dipanggil harga permainan teratas .

Strategi optimum dipanggil bersih , jika kesamaan dipenuhi untuk mereka:

,

.

Nilai itu dipanggil harga bersih permainan , jika .

Strategi dan bentuk tulen yang optimum titik pelana matriks pembayaran.

Untuk titik pelana, syarat berikut dipenuhi:

iaitu, elemen adalah yang terkecil dalam satu baris dan yang terbesar dalam lajur.

Oleh itu, jika matriks bayaran mempunyai titik pelana , maka anda boleh mencari strategi murni yang optimum pemain.

Strategi tulen pemain I boleh diwakili oleh set nombor tersusun (vektor) di mana semua nombor adalah sama dengan sifar, kecuali nombor di tempat ke-, yang sama dengan satu.

Strategi tulen Pemain II boleh diwakili oleh set nombor tersusun (vektor) di mana semua nombor adalah sama dengan sifar, kecuali nombor di tempat ke-, yang sama dengan satu.

Contoh

.

Dengan memilih beberapa baris matriks bayaran sebagai satu langkah, pemain saya memperoleh bayaran dalam kes terburuk tidak kurang daripada nilai dalam lajur bertanda :

Oleh itu, pemain I akan memilih baris ke-2 matriks bayaran, yang memberikannya bayaran maksimum, tanpa mengira pergerakan pemain II, yang akan cuba meminimumkan nilai ini:

Pemain II berhujah sama dan memilih lajur pertama sebagai langkah:

Oleh itu, terdapat titik pelana matriks hasil:

sepadan dengan strategi tulen yang optimum untuk pemain I dan untuk pemain II supaya pemain I tidak mengurangkan ganjarannya untuk sebarang perubahan dalam strategi oleh pemain II dan pemain II tidak meningkatkan kerugiannya untuk sebarang perubahan dalam strategi oleh pemain I.

5.3. Strategi campuran optimum dalam permainan matriks

Jika matriks bayaran tidak mempunyai titik pelana, maka adalah tidak rasional untuk mana-mana pemain menggunakan satu strategi tulen. Lebih menguntungkan untuk digunakan "campuran kemungkinan" strategi murni. Kemudian strategi yang sudah bercampur ditakrifkan sebagai yang optimum.

Strategi Campuran seorang pemain dicirikan oleh taburan kebarangkalian peristiwa rawak yang terdiri daripada pilihan pergerakan oleh pemain ini.

Strategi campuran pemain I adalah satu set nombor yang teratur (vektor) yang memenuhi dua syarat:

1) untuk , iaitu, kebarangkalian memilih setiap baris matriks hasil adalah bukan negatif;

2) , iaitu, pilihan setiap baris matriks bayaran dalam agregat mewakili kumpulan penuh peristiwa.

Strategi campuran Pemain II ialah set nombor tersusun (vektor) memenuhi syarat:

Jumlah pembayaran kepada pemain I, yang memilih strategi campuran

daripada pemain II, yang memilih strategi campuran

,

ialah purata

.

Optimum dipanggil strategi campuran

dan ,

jika bagi mana-mana strategi campuran sewenang-wenangnya dan syarat berikut dipenuhi:

iaitu, di bawah strategi campuran yang optimum, ganjaran pemain I adalah yang terbesar, dan kehilangan pemain II adalah yang terkecil.

Jika tiada titik pelana dalam matriks bayaran, maka

,

iaitu terdapat perbezaan positif ( perbezaan yang dikekalkan )

- ³ 0,

dan pemain perlu mencari peluang tambahan untuk yakin mendapat bahagian yang lebih besar daripada perbezaan ini yang memihak kepada mereka.

Contoh

Pertimbangkan permainan yang diberikan oleh matriks hasil:

.

Tentukan jika terdapat titik pelana:

, .

Ternyata tiada titik pelana dalam matriks hasil dan perbezaan yang tidak teragih ialah:

.

5.4. Mencari strategi campuran yang optimum

untuk permainan 2×2

Penentuan strategi campuran optimum untuk matriks hasil dengan dimensi dijalankan dengan kaedah mencari titik optimum fungsi dua pembolehubah.

Biarkan kebarangkalian pemain saya memilih baris pertama matriks hasil

adalah sama dengan . Maka kebarangkalian untuk memilih baris kedua ialah .

Biarkan kebarangkalian pemain II memilih lajur pertama sama dengan . Maka kebarangkalian untuk memilih lajur kedua ialah .

Jumlah bayaran kepada pemain I oleh pemain II adalah sama dengan:

Nilai melampau keuntungan pemain I dan kerugian pemain II sepadan dengan syarat:

;

.

Oleh itu, strategi campuran optimum pemain I dan II, masing-masing, adalah:

5.5. Penyelesaian geometri 2× permainann

Dengan peningkatan dalam dimensi matriks hasil daripada kepada, tidak mungkin lagi untuk mengurangkan takrifan strategi campuran optimum untuk mencari optimum fungsi dua pembolehubah. Walau bagaimanapun, memandangkan salah seorang pemain hanya mempunyai dua strategi, penyelesaian geometri boleh digunakan.

Peringkat utama mencari penyelesaian kepada permainan adalah seperti berikut.

Kami memperkenalkan sistem koordinat pada pesawat. Mari letakkan segmen garisan pada paksi. Dari hujung kiri dan kanan segmen ini kita lukis serenjang.


Hujung kiri dan kanan segmen unit sepadan dengan dua strategi dan , tersedia untuk pemain I. Pada serenjang yang dilukis, kami akan menangguhkan pembayaran pemain ini. Contohnya, untuk matriks bayaran


ganjaran seperti pemain I apabila memilih strategi akan menjadi dan , dan apabila memilih strategi mereka akan menjadi dan .

Mari kita sambungkan mata ganjaran pemain I, sepadan dengan strategi pemain II, dengan segmen garis lurus. Kemudian garis putus yang terbentuk yang membatasi carta dari bawah menentukan batas bawah pada bayaran pemain I.



Mencari strategi campuran optimum untuk pemain I

,

yang sepadan dengan titik pada sempadan bawah bayaran pemain I dengan ordinat maksimum.

Marilah kita memberi perhatian kepada fakta bahawa dalam contoh yang sedang dipertimbangkan, hanya menggunakan dua strategi dan , sepadan dengan garis lurus yang bersilang pada titik yang ditemui pada sempadan bawah bayaran pemain I, pemain II boleh menghalang pemain I daripada mendapat yang lebih besar. imbuhan.

Oleh itu, permainan dikurangkan kepada permainan dan strategi campuran optimum pemain II dalam contoh yang dipertimbangkan ialah

,

di mana kebarangkalian adalah sama seperti dalam permainan:

5.6. Penyelesaian permainanm× n

Jika permainan matriks tidak mempunyai penyelesaian dalam strategi tulen (iaitu, tiada titik pelana) dan, disebabkan oleh dimensi besar matriks hasil, tidak dapat diselesaikan secara grafik, maka untuk mendapatkan penyelesaian, gunakan kaedah pengaturcaraan linear .

Biarkan matriks pembayaran dimensi diberikan:

.

Kita perlu mencari kebarangkalian , dengan pemain mana saya mesti memilih pergerakannya agar strategi campuran ini menjamin dia ganjaran sekurang-kurangnya , tanpa mengira pilihan gerakan oleh pemain II.

Untuk setiap pergerakan yang dipilih oleh pemain II, bayaran pemain I ditentukan oleh kebergantungan:

Kami membahagikan kedua-dua belah ketaksamaan dengan dan memperkenalkan tatatanda baharu:

Kesaksamaan

Akan mengambil borang:

Memandangkan pemain saya ingin memaksimumkan hasil, timbal balik mesti diminimumkan. Kemudian masalah pengaturcaraan linear untuk pemain saya akan mengambil bentuk:

di bawah sekatan

Masalah untuk pemain II dibina dengan cara yang sama sebagai dua:

di bawah sekatan

Menyelesaikan masalah dengan kaedah simplex, kami memperoleh:

,

5.7. Ciri-ciri menyelesaikan permainan matriks

Sebelum menyelesaikan masalah mencari strategi optimum, dua syarat harus diperiksa:

Adakah mungkin untuk memudahkan matriks pembayaran;

Adakah matriks bayaran mempunyai titik pelana.

Pertimbangkan kemungkinan memudahkan matriks pembayaran:

Kerana fakta bahawa pemain yang saya ingin dapatkan kemenangan terbesar, maka baris -th boleh dipadamkan daripada matriks hasil, kerana dia tidak akan sekali-kali menggunakan langkah ini jika hubungan berikut berpuas hati dengan mana-mana baris -th yang lain:

Begitu juga, berusaha untuk mendapatkan kerugian yang paling sedikit, pemain II tidak akan sekali-kali memilih lajur ke- dalam matriks hasil sebagai satu pergerakan, dan lajur ini boleh dicoret jika hubungan berikut dipegang dengan mana-mana lajur ke- yang lain:

Paling penyelesaian mudah permainan ialah kehadiran dalam matriks bayaran yang dipermudahkan bagi titik pelana yang memenuhi syarat berikut (mengikut takrifan):

Contoh

Memandangkan matriks bayaran:

.

Permudahkan matriks pembayaran:

Kehadiran titik pelana:

5.8. Bermain dengan alam semula jadi

Berbeza dengan masalah teori permainan dalam teori keputusan statistik situasi yang tidak pasti tidak mempunyai pewarnaan konflik antagonis dan bergantung kepada realiti objektif, yang biasa dipanggil "alam semula jadi" .

Dalam permainan matriks dengan alam semula jadi, pemain II ialah satu set faktor tidak pasti yang mempengaruhi kecekapan keputusan yang dibuat.

Permainan matriks dengan alam semula jadi berbeza daripada permainan matriks biasa hanya kerana apabila pemain I memilih strategi yang optimum, ia tidak mungkin lagi bergantung pada fakta bahawa pemain II akan berusaha untuk meminimumkan kerugiannya. Oleh itu, bersama dengan matriks hasil, kami memperkenalkan matriks risiko :

di manakah nilai risiko pemain I apabila menggunakan langkah dalam keadaan, sama dengan perbezaan antara bayaran yang pemain akan saya terima jika dia tahu bahawa syarat itu akan ditetapkan, i.e. , dan ganjaran, yang akan diterimanya, tidak mengetahui apabila memilih langkah bahawa syarat itu akan ditetapkan.

Oleh itu, matriks bayaran diubah secara unik menjadi matriks risiko, dan transformasi terbalik adalah samar-samar.

Contoh

Matriks Menang:

.

Matriks Risiko:

mungkin dua pernyataan masalah tentang memilih penyelesaian dalam permainan matriks dengan alam semula jadi :

memaksimumkan keuntungan;

Pengurangan risiko.

Masalah keputusan boleh ditetapkan untuk salah satu daripada dua syarat:

- berisiko apabila fungsi taburan kebarangkalian bagi strategi alam semula jadi diketahui, sebagai contoh, pembolehubah rawak kejadian setiap situasi ekonomi khusus yang dicadangkan;

- dalam keadaan tidak menentu apabila fungsi taburan kebarangkalian sedemikian tidak diketahui.

5.9. Menyelesaikan masalah dalam teori penyelesaian statistik

berisiko

Apabila membuat keputusan di bawah risiko, pemain saya tahu kebarangkalian bermulanya keadaan alam semula jadi.

Maka adalah wajar bagi pemain I untuk memilih strategi yang mana nilai purata bayaran, diambil sepanjang garis, adalah maksimum :

.

Apabila menyelesaikan masalah ini dengan matriks risiko, kami memperoleh penyelesaian yang sama sepadan dengannya risiko purata minimum :

.

5.10. Menyelesaikan masalah dalam teori penyelesaian statistik

dalam keadaan tidak menentu

Apabila membuat keputusan di bawah ketidakpastian, anda boleh menggunakan yang berikut kriteria :

Kriteria maksimin Wald;

kriteria risiko minimum Buas;

Kriteria pesimisme - keyakinan Hurwitz;

Prinsip alasan tidak mencukupi Laplace.

Pertimbangkan kriteria maximin Wald .

Permainan dengan alam semula jadi dimainkan seperti dengan lawan agresif yang munasabah, iaitu, pendekatan insurans semula dijalankan dari kedudukan pesimisme yang melampau untuk matriks hasil:

.

Pertimbangkan Kriteria risiko minimum yang liar .

Sama seperti pendekatan sebelumnya dari kedudukan pesimisme yang melampau untuk matriks risiko:

.

Pertimbangkan kriteria pesimisme - optimisme Hurwitz .

Ia menawarkan peluang untuk tidak dipandu oleh pesimisme yang melampau atau keyakinan yang melampau:

di manakah tahap pesimisme;

pada - keyakinan yang melampau,

pada - pesimisme yang melampau.

Pertimbangkan Prinsip alasan tidak mencukupi Laplace .

Diandaikan bahawa semua keadaan alam adalah kemungkinan yang sama:

,

.

Kesimpulan pada bahagian kelima

Dua pemain mengambil bahagian dalam permainan matriks, dan fungsi pembayaran, yang berfungsi untuk menentukan jumlah pembayaran daripada pemain yang kalah kepada pemenang, diwakili sebagai matriks hasil. Telah dipersetujui bahawa pemain I memilih salah satu daripada baris matriks hasil sebagai langkah, dan pemain II memilih salah satu lajurnya. Kemudian di persimpangan baris dan lajur yang dipilih matriks ini adalah nilai berangka pembayaran kepada pemain I dari pemain II (jika nilai ini positif, maka pemain saya benar-benar menang, dan jika negatif, maka pemain II pada dasarnya menang).

Sekiranya terdapat titik pelana dalam matriks pembayaran, maka pemain mempunyai strategi tulen yang optimum, iaitu, untuk menang, setiap daripada mereka mesti mengulangi satu gerakan optimumnya. Sekiranya tiada titik pelana, maka untuk menang, setiap daripada mereka mesti menggunakan strategi campuran yang optimum, iaitu, menggunakan campuran gerakan yang setiap satu mesti dilakukan dengan kebarangkalian yang optimum.

Mencari strategi campuran optimum untuk permainan 2×2 dilakukan dengan mengira kebarangkalian optimum menggunakan formula yang diketahui. Melalui penyelesaian geometri Permainan 2×n, definisi strategi campuran optimum di dalamnya dikurangkan kepada mencari strategi campuran optimum untuk permainan 2×2. Untuk menyelesaikan permainan m×n, kaedah pengaturcaraan linear digunakan untuk mencari strategi campuran yang optimum di dalamnya.

Sesetengah matriks hasil meminjamkan diri kepada penyederhanaan, akibatnya dimensinya dikurangkan dengan memadamkan baris dan lajur yang sepadan dengan pergerakan yang tidak menjanjikan.

Jika pemain II adalah satu set faktor tidak pasti yang bergantung pada realiti objektif dan tidak mempunyai pewarnaan konflik antagonis, maka permainan sedemikian dipanggil permainan dengan alam semula jadi, dan masalah teori keputusan statistik digunakan untuk menyelesaikannya. Kemudian, bersama dengan matriks hasil, matriks risiko diperkenalkan dan dua rumusan masalah memilih penyelesaian dalam permainan matriks dengan alam semula jadi adalah mungkin: memaksimumkan keuntungan dan meminimumkan risiko.

Menyelesaikan masalah teori keputusan statistik di bawah keadaan risiko menunjukkan bahawa adalah suai manfaat bagi pemain I untuk memilih strategi yang mana nilai purata (jangkaan) bayaran, diambil sepanjang garis matriks bayaran, adalah maksimum, atau ( yang sama) nilai purata (jangkaan) risiko , yang diambil oleh garis matriks risiko, adalah minimum. Apabila membuat keputusan dalam keadaan ketidakpastian, kriteria berikut: Kriteria maksimum Wald, kriteria risiko minimum Savage, kriteria pesimisme-optimum Hurwitz, prinsip alasan Laplace yang tidak mencukupi.

Soalan untuk pemeriksaan diri

Bagaimanakah konsep asas teori permainan ditakrifkan: pergerakan, strategi dan fungsi hasil?

Bagaimanakah fungsi hasil diwakili dalam permainan matriks?

Mengapakah permainan matriks dipanggil sifar-sum?

Apakah proses bermain permainan matriks?

Apakah permainan yang dipanggil permainan m×n?

Apakah strategi permainan matriks yang optimum?

Apakah strategi optimum untuk permainan matriks yang dipanggil tulen?

Apakah yang dimaksudkan dengan titik pelana matriks hasil?

Apakah strategi optimum untuk permainan matriks yang dipanggil campuran?

Apakah strategi campuran pemain?

Apakah ganjaran kepada pemain I daripada pemain II yang memilih strategi campuran?

Apakah strategi campuran yang dipanggil optimum?

Apakah maksud perbezaan tidak teragih?

Apakah kaedah yang digunakan untuk mencari strategi campuran optimum untuk permainan 2×2?

Bagaimanakah strategi campuran optimum ditemui untuk permainan 2×n?

Apakah kaedah yang digunakan untuk mencari strategi campuran optimum untuk permainan m×n?

Apakah ciri-ciri menyelesaikan permainan matriks?

Apakah maksud penyederhanaan matriks pembayaran dan dalam keadaan apa ia boleh dilaksanakan?

Permainan matriks yang manakah lebih mudah diselesaikan apabila matriks hasil mempunyai atau tidak mempunyai titik pelana?

Apakah masalah teori permainan yang berkaitan dengan masalah teori keputusan statistik?

Bagaimanakah matriks bayaran diubah menjadi matriks risiko?

Apakah dua rumusan masalah memilih penyelesaian yang mungkin dalam permainan matriks dengan alam semula jadi?

Untuk apakah dua syarat masalah membuat keputusan boleh ditetapkan dalam permainan matriks dengan alam semula jadi?

Apakah strategi yang sesuai untuk dipilih oleh pemain I apabila menyelesaikan masalah teori keputusan statistik di bawah risiko?

Apakah kriteria membuat keputusan yang boleh digunakan semasa menyelesaikan masalah teori keputusan statistik di bawah ketidakpastian?

Contoh penyelesaian masalah

1. Matriks pembayaran menunjukkan jumlah keuntungan perusahaan apabila ia menjual jenis yang berbeza produk (lajur) bergantung kepada permintaan yang ditetapkan (baris). Adalah perlu untuk menentukan strategi optimum perusahaan untuk pengeluaran produk pelbagai jenis dan pendapatan maksimum (secara purata) yang sepadan daripada jualan mereka.

Nyatakan matriks yang diberi dengan dan perkenalkan pembolehubah . Kami juga akan menggunakan matriks (vektor) . Kemudian dan , iaitu.

Matriks songsang dikira:

Nilai didapati:

.

Kebarangkalian dikira:

Purata pendapatan daripada jualan ditentukan:

.

2. Firma "Pharmatsevt" - pengeluar ubat-ubatan dan produk bioperubatan di rantau ini. Adalah diketahui bahawa permintaan untuk beberapa ubat memuncak tempoh musim panas(ubat kumpulan kardiovaskular, analgesik), untuk yang lain - untuk musim luruh dan musim bunga (anti-berjangkit, antitusif).

Kos setiap 1 penukaran unit produk untuk September-Oktober adalah: untuk kumpulan pertama (ubat kardiovaskular dan analgesik) - 20 rubel; untuk kumpulan kedua (anti-berjangkit, ubat antitusif) - 15 rubel.

Menurut pemerhatian ke atas beberapa tahun kebelakangan ini Perkhidmatan pemasaran syarikat mendapati ia boleh menjual 3050 unit konvensional dalam tempoh dua bulan yang dipertimbangkan dalam keadaan cuaca panas. unit produk kumpulan pertama dan 1100 penukaran. unit produk kumpulan kedua; dalam keadaan cuaca sejuk - 1525 arb. unit produk kumpulan pertama dan 3690 penukaran. unit kumpulan kedua.

Sehubungan dengan kemungkinan perubahan cuaca, tugasnya adalah untuk menentukan strategi syarikat dalam pengeluaran produk yang memberikan pendapatan maksimum daripada jualan pada harga jualan 40 rubel. untuk 1 penukaran unit produk kumpulan pertama dan 30 p. - kumpulan kedua.

PENYELESAIAN. Firma mempunyai dua strategi:

Cuaca akan menjadi panas tahun ini;

Cuaca akan menjadi sejuk.

Jika syarikat mengamalkan strategi dan cuaca sebenarnya panas (strategi alam semula jadi), maka produk perkilangan (3050 unit konvensional ubat kumpulan pertama dan 1100 unit konvensional kumpulan kedua) akan direalisasikan sepenuhnya dan pendapatan akan jadilah

3050×(40-20)+1100×(30-15)=77500 r.

Dalam keadaan cuaca sejuk (strategi alam semula jadi), ubat-ubatan kumpulan kedua akan dijual sepenuhnya, dan kumpulan pertama akan dijual hanya dalam jumlah 1525 unit konvensional. unit dan beberapa ubat akan kekal tidak terjual. Pendapatan akan menjadi

1525×(40-20)+1100×(30-15)-20×()=16500 r.

Begitu juga, jika borang itu mengamalkan strategi dan cuaca sebenarnya sejuk, maka hasil akan menjadi

1525×(40-20)+3690×(30-15)=85850 r.

Dalam cuaca panas, pendapatan akan menjadi

1525×(40-20)+1100×(30-15)-() ×15=8150 r.

Memandangkan firma dan cuaca sebagai dua pemain, kami mendapat matriks hasil

,

Harga permainan adalah dalam julat

Ia dapat dilihat dari matriks hasil bahawa dalam semua keadaan, pendapatan syarikat akan menjadi sekurang-kurangnya 16,500 rubel, tetapi jika keadaan cuaca bertepatan dengan strategi yang dipilih, maka pendapatan syarikat boleh menjadi 77,500 rubel.

Mari cari penyelesaian kepada permainan.

Mari kita nyatakan kebarangkalian untuk menggunakan strategi oleh firma sebagai , strategi melalui , dan . Menyelesaikan permainan secara grafik, kami dapat , manakala harga permainan r.

Pelan optimum untuk pengeluaran ubat-ubatan adalah

Oleh itu, adalah wajar bagi firma itu mengeluarkan 2379 unit konvensional pada bulan September dan Oktober. unit ubat kumpulan pertama dan 2239.6 unit konvensional. unit dadah kumpulan kedua, maka dalam apa jua cuaca dia akan menerima pendapatan sekurang-kurangnya 46,986 rubel.

Di bawah keadaan ketidakpastian, jika syarikat tidak mungkin menggunakan strategi campuran (kontrak dengan organisasi lain), kami menggunakan kriteria berikut untuk menentukan strategi optimum syarikat:

Kriteria Walde:

Kriteria Hurwitz: untuk kepastian, kami menerima , kemudian untuk strategi syarikat

untuk strategi

adalah dinasihatkan untuk firma menggunakan strategi tersebut.

Kriteria Savage. Elemen maksimum dalam lajur pertama ialah 77500, dalam lajur kedua ialah 85850.

Unsur-unsur matriks risiko didapati daripada ungkapan

,

mana , ,

Matriks risiko mempunyai bentuk

,

adalah dinasihatkan untuk menggunakan strategi atau .

Oleh itu, adalah dinasihatkan bagi firma untuk menggunakan strategi atau .

Ambil perhatian bahawa setiap kriteria yang dipertimbangkan tidak boleh dianggap memuaskan sepenuhnya pilihan muktamad keputusan, tetapi analisis bersama mereka memungkinkan untuk membentangkan dengan lebih jelas akibat daripada membuat keputusan pengurusan tertentu.

Dengan taburan kebarangkalian yang diketahui bagi pelbagai keadaan alam, kriteria keputusan ialah jangkaan matematik maksimum bagi hasil.

Biarkan diketahui masalah yang sedang dipertimbangkan bahawa kebarangkalian cuaca panas dan sejuk adalah sama dan sama dengan 0.5, maka strategi optimum firma ditentukan seperti berikut:

Adalah dinasihatkan untuk firma menggunakan strategi atau.

Tugas untuk kerja bebas

1. Perusahaan boleh mengeluarkan tiga jenis produk (A, B dan C), sambil menerima keuntungan yang bergantung kepada permintaan. Permintaan pula boleh mengambil satu daripada empat keadaan (I, II, III dan IV). Dalam matriks berikut, elemen mencirikan keuntungan yang akan diterima oleh perusahaan apabila mengeluarkan produk ke- dan keadaan permintaan ke-:

Secara umum, V * ≠ V * - tiada titik pelana. Juga tiada penyelesaian optimum dalam strategi tulen. Walau bagaimanapun, jika kita mengembangkan konsep strategi tulen dengan memperkenalkan konsep strategi campuran, maka kita boleh melaksanakan algoritma untuk mencari penyelesaian optimum kepada masalah permainan yang tidak jelas. Dalam keadaan sedemikian, adalah dicadangkan untuk menggunakan pendekatan statistik (kebarangkalian) untuk mencari penyelesaian optimum kepada permainan antagonis. Bagi setiap pemain, bersama-sama dengan set strategi yang mungkin untuknya, vektor kebarangkalian yang tidak diketahui (frekuensi relatif) diperkenalkan yang mana satu atau strategi lain harus digunakan.

Mari kita nyatakan vektor kebarangkalian (frekuensi relatif) pilihan strategi pemain A yang diberikan seperti berikut:
P = (p 1 , p 2 ,…, p m),
di mana p i ≥ 0, p 1 + p 2 +…+ p m = 1. Nilai p i dipanggil kebarangkalian (frekuensi relatif) untuk menggunakan strategi A i .

Begitu juga, untuk pemain B, vektor kebarangkalian yang tidak diketahui (frekuensi relatif) diperkenalkan, yang mempunyai bentuk:
Q = (q 1 , q 2 ,…, q n),
di mana q j ≥ 0, q 1 + q 2 +…+ q n = 1. Kuantiti q j dipanggil kebarangkalian (kekerapan relatif) untuk menggunakan strategi B j . Set (gabungan) strategi tulen A 1 , A 2 , …A m dan B 1, B 2, …B n dalam kombinasi dengan vektor kebarangkalian memilih setiap daripadanya dipanggil strategi bercampur.

Teorem utama dalam teori permainan antagonis terhingga ialah Teorem Von Neumann: setiap permainan matriks terhingga mempunyai, oleh sekurang-kurangnya, satu penyelesaian optimum, mungkin antara strategi bercampur.
Ia berikutan daripada teorem ini bahawa permainan yang tidak jelas mempunyai sekurang-kurangnya satu penyelesaian optimum dalam strategi campuran. Dalam permainan sedemikian, penyelesaiannya ialah sepasang strategi campuran optimum P * dan Q * , supaya jika salah seorang pemain mematuhi strategi optimumnya, maka tidak menguntungkan bagi pemain lain untuk menyimpang daripada strategi optimumnya.
Purata bayaran pemain A ditentukan oleh jangkaan matematik:

Jika kebarangkalian (kekerapan relatif) untuk menggunakan strategi adalah berbeza daripada sifar, maka strategi sedemikian dipanggil aktif.

Strategi P * , Q * dipanggil bercampur optimum strategi jika M A (P, Q *) ≤ M A (P * , Q *) ≤ M A (P * , Q) (1)
Dalam kes ini, M A (P * , Q *) dipanggil pada harga permainan dan dilambangkan dengan V (V * ≤ V ≤ V *). Yang pertama daripada ketaksamaan (1) bermaksud bahawa sisihan pemain A daripada strategi campuran optimumnya dengan syarat pemain B berpegang pada strategi campuran optimumnya, membawa kepada penurunan dalam keuntungan purata pemain A. Ketaksamaan kedua bermaksud bahawa sisihan pemain B daripada strategi campuran optimumnya dengan syarat pemain A berpegang pada strategi campuran optimumnya, membawa kepada peningkatan purata kehilangan pemain B.

Dalam kes umum, masalah sedemikian berjaya diselesaikan oleh kalkulator ini.

Contoh.

4 7 2
7 3 2
2 1 8

1. Semak sama ada matriks bayaran mempunyai titik pelana. Jika ya, maka kami menulis penyelesaian permainan dalam strategi tulen.

Kami menganggap bahawa pemain I memilih strateginya sedemikian rupa untuk memaksimumkan hasilnya, dan pemain II memilih strateginya sedemikian rupa untuk meminimumkan hasil pemain I.

Pemain B1 B2 B3 a = min(Ai)
A 1 4 7 2 2
A2 7 3 2 2
A 3 2 1 8 1
b = maks(Bi) 7 7 8

Kami mendapati ganjaran terjamin ditentukan oleh harga yang lebih rendah bagi permainan a = max(a i) = 2, yang menunjukkan strategi tulen maksimum A 1 .
Harga atas permainan b = min(bj) = 7. Ini menunjukkan ketiadaan mata pelana, kerana a ≠ b, maka harga permainan adalah dalam lingkungan 2 ≤ y ≤ 7. Kami mencari penyelesaian permainan dalam strategi campuran. Ini dijelaskan oleh fakta bahawa pemain tidak boleh mengumumkan strategi tulen mereka kepada pihak lawan: mereka harus menyembunyikan tindakan mereka. Permainan ini boleh diselesaikan dengan membiarkan pemain memilih strategi mereka secara rawak(campurkan strategi murni).

2. Semak matriks hasil untuk baris dominan dan lajur dominan.
Tiada baris dominan dan lajur dominan dalam matriks hasil.

3. Mencari penyelesaian kepada permainan dalam strategi campuran.
Mari kita tuliskan sistem persamaan.
Untuk Pemain I
4p1 +7p2 +2p3 = y
7p1 +3p2 +p3 = y
2p 1 +2p 2 +8p 3 = y
p1 +p2 +p3 = 1

Untuk Pemain II
4q1 +7q2 +2q3 = y
7q1 +3q2 +2q3 = y
2q1 +q2 +8q3 = y
q 1 + q 2 + q 3 = 1

Menyelesaikan sistem ini dengan kaedah Gauss, kita dapati:

y=4 1/34
p 1 = 29/68 (kebarangkalian menggunakan strategi pertama).
p 2 = 4/17 (kebarangkalian menggunakan strategi ke-2).
p 3 = 23/68 (kebarangkalian menggunakan strategi ke-3).

Strategi campuran optimum pemain I: P = (29 / 68 ; 4 / 17 ; 23 / 68)
q 1 = 6 / 17 (kebarangkalian menggunakan strategi pertama).
q 2 = 9/34 (kebarangkalian menggunakan strategi ke-2).
q 3 = 13/34 (kebarangkalian menggunakan strategi ke-3).

Strategi campuran optimum Pemain II: Q = (6 / 17 ; 9 / 34 ; 13 / 34)
Harga permainan: y = 4 1 / 34

Jika permainan tidak mempunyai titik pelana, maka terdapat kesukaran dalam menentukan harga permainan dan strategi optimum pemain. Pertimbangkan, sebagai contoh, permainan:

Dalam permainan ini dan . Oleh itu, pemain pertama boleh menjamin dirinya ganjaran bersamaan dengan 4, dan pemain kedua boleh mengehadkan kerugiannya kepada 5. Kawasan antara dan, seolah-olah, seri, dan setiap pemain boleh cuba memperbaiki keputusannya dengan mengorbankan kawasan ini. Apakah strategi optimum pemain dalam kes ini?

Jika setiap pemain menggunakan strategi yang ditandakan dengan asterisk ( dan ), maka keuntungan pemain pertama dan kehilangan pemain kedua akan bersamaan dengan 5. Ini adalah merugikan untuk pemain kedua, kerana yang pertama menang lebih daripada dia. boleh menjamin dirinya. Walau bagaimanapun, jika pemain kedua mendedahkan dalam beberapa cara niat pemain pertama untuk menggunakan strategi , maka dia boleh menggunakan strategi dan mengurangkan ganjaran pemain pertama kepada 4. Walau bagaimanapun, jika pemain pertama mendedahkan niat pemain kedua untuk menggunakan strategi , kemudian menggunakan strategi itu, dia akan meningkatkan ganjarannya kepada 6 Oleh itu, situasi timbul apabila setiap pemain mesti merahsiakan strategi yang akan dia gunakan. Namun, bagaimana untuk melakukannya? Lagipun, jika permainan dimainkan berkali-kali dan pemain kedua menggunakan strategi a sepanjang masa, maka pemain pertama tidak lama lagi akan mengetahui niat kedua dan, setelah menggunakan strategi, akan mendapat ganjaran tambahan. Jelas sekali, pemain kedua mesti mengubah strategi dalam setiap permainan baru, tetapi dia mesti melakukan ini sedemikian rupa sehingga pemain pertama tidak meneka strategi yang akan dia gunakan dalam setiap kes.

Untuk mekanisme pemilihan rawak, keuntungan dan kerugian pemain adalah pembolehubah rawak. Keputusan permainan dalam kes ini boleh dianggarkan dengan purata kerugian pemain kedua. Mari kita kembali kepada contoh. Jadi, jika pemain kedua menggunakan strategi dan secara rawak dengan kebarangkalian 0.5; 0.5, maka dengan strategi pemain pertama, nilai purata kerugiannya ialah:

dan dengan strategi pemain pertama

Oleh itu, pemain kedua boleh mengehadkan purata kerugiannya kepada 4.5 tanpa mengira strategi yang digunakan oleh pemain pertama.

Oleh itu, dalam beberapa kes ternyata lebih baik untuk tidak menggariskan strategi terlebih dahulu, tetapi untuk memilih satu atau yang lain secara rawak, menggunakan beberapa jenis mekanisme pemilihan rawak. Strategi berdasarkan pilihan rawak dipanggil strategi campuran, berbeza dengan strategi yang dimaksudkan, yang dipanggil strategi murni.

Marilah kita memberikan definisi yang lebih ketat tentang strategi tulen dan campuran.



Biarkan ada permainan tanpa titik pelana:

Mari kita nyatakan kekerapan menggunakan strategi tulen pemain pertama dengan , (kebarangkalian menggunakan strategi ke-i). Begitu juga, kita menandakan kekerapan menggunakan strategi tulen pemain kedua dengan , (kebarangkalian menggunakan strategi ke-j). Terdapat penyelesaian strategi tulen untuk permainan mata pelana. Untuk permainan tanpa mata pelana, terdapat penyelesaian dalam strategi campuran, iaitu, apabila pilihan strategi berdasarkan kebarangkalian. Kemudian

Banyak strategi pemain pertama yang tulen;

Banyak strategi campuran pemain pertama;

Banyak strategi pemain ke-2 tulen;

Banyak strategi campuran pemain ke-2.

Pertimbangkan contoh: biarkan ada permainan

Pemain kedua memilih kebarangkalian . Mari kita anggarkan purata kerugian pemain kedua apabila menggunakan strategi dan , masing-masing.

Terdapat strategi tulen dan bercampur. Strategi Tulen
pemain pertama (strategi tulen
pemain kedua) ialah kemungkinan pergerakan pemain pertama (kedua), dipilih olehnya dengan kebarangkalian sama dengan 1.

Jika pemain pertama mempunyai m strategi dan pemain kedua mempunyai n strategi, maka bagi mana-mana pasangan strategi pemain pertama dan kedua, strategi tulen boleh diwakili sebagai vektor unit. Sebagai contoh, untuk sepasang strategi
,
Strategi tulen pemain pertama dan kedua boleh ditulis sebagai:
,
. Untuk beberapa strategi ,strategi tulen boleh ditulis sebagai:

,

.

Teorem: Dalam permainan matriks, nilai bersih permainan yang lebih rendah tidak melebihi nilai bersih atas permainan, i.e.
.

Definisi: Jika untuk strategi murni ,pemain A dan B, masing-masing, kesaksamaan berlaku
, kemudian sepasang strategi tulen ( ,) dipanggil titik pelana permainan matriks, unsur matriks, berdiri di persimpangan baris ke-i dan lajur ke-j - elemen pelana matriks hasil, dan nombor
- harga bersih permainan.

Contoh: Cari harga bersih yang lebih rendah dan atas, wujudkan kehadiran mata pelana permainan matriks

.

Mari kita tentukan harga bersih yang lebih rendah dan atas permainan: , ,
.

Dalam kes ini, kita mempunyai satu titik pelana (A 1 ; B 2), dan elemen pelana ialah 5. Unsur ini ialah yang terkecil dalam baris pertama dan yang terbesar dalam lajur ke-2. Sisihan pemain A daripada strategi maksimin A 1 membawa kepada penurunan keuntungannya, dan sisihan pemain B daripada strategi minimax B 2 membawa kepada peningkatan dalam kerugiannya. Dengan kata lain, jika permainan matriks mempunyai elemen pelana, maka yang terbaik untuk pemain adalah strategi minimax mereka. Dan strategi tulen ini yang membentuk titik pelana dan menonjolkan elemen pelana a 12 =5 dalam matriks permainan adalah strategi tulen yang optimum dan pemain A dan B masing-masing.

Jika permainan matriks tidak mempunyai titik pelana, maka penyelesaian permainan menjadi lebih sukar. Dalam permainan ini
. Penggunaan strategi minimax dalam permainan tersebut membawa kepada hakikat bahawa bagi setiap pemain bayaran tidak melebihi , dan kerugian juga tidak kurang . Bagi setiap pemain, timbul persoalan untuk meningkatkan keuntungan (mengurangkan kerugian). Penyelesaiannya didapati menggunakan strategi campuran.

Definisi: Strategi campuran pemain pertama (kedua) ialah vektor
, di mana
dan
(
, di mana
dan
).

Vektor p(q) bermaksud kebarangkalian menggunakan strategi tulen ke-i oleh pemain pertama (strategi tulen ke-j oleh pemain kedua).

Memandangkan pemain memilih strategi tulen mereka secara rawak dan bebas antara satu sama lain, permainan adalah rawak dan jumlah keuntungan (kerugian) menjadi rawak. Dalam kes ini, nilai purata keuntungan (kerugian) - jangkaan matematik - adalah fungsi strategi campuran p, q:

.

Definisi: Fungsi f(p, q) dipanggil fungsi bayaran bagi permainan dengan matriks
.

Definisi: strategi
,
dipanggil optimum jika untuk strategi sewenang-wenangnya
,
syarat itu

Penggunaan strategi campuran optimum dalam permainan memberikan pemain pertama bayaran tidak kurang daripada jika dia menggunakan strategi lain p; pemain kedua kalah tidak lebih daripada jika dia menggunakan strategi lain q.

Set strategi optimum dan nilai permainan membentuk penyelesaian permainan.

© 2022 skudelnica.ru -- Cinta, pengkhianatan, psikologi, perceraian, perasaan, pertengkaran