Təmiz və qarışıq strategiyalar. Təmiz strategiya oyunları

ev / Mübahisə

Praktiki əhəmiyyət kəsb edən sonlu oyunlar arasında yəhər nöqtəsi oyunları nisbətən nadirdir; daha tipik bir hal "aşağı və yuxarı qiymətlərin fərqli olduğu zaman. Belə oyunların matrislərini təhlil edərək belə nəticəyə gəldik ki, əgər hər bir oyunçuya seçim imkanı verilsə

biri - yeganə strategiyadır., onda ağlabatan hərəkət edən rəqibə arxalanaraq, bu seçim minimax prinsipi ilə müəyyən edilməlidir. Maksimum strategiyamıza sadiq qalaraq, rəqibin hər hansı bir davranışı üçün, əlbəttə ki, özümüzə oyunun aşağı qiymətinə bərabər bir qələbəyə zəmanət veririk a. Təbii bir sual yaranır: tək bir "təmiz" strategiyadan deyil, alternativ strategiyadan istifadə etsəniz, özünüzə birdən çox orta qazanc təmin etmək mümkündürmü? təsadüfiçoxlu strategiyalar?

Müəyyən tezlik nisbəti ilə təsadüfi qanuna uyğun olaraq bir-birini əvəz edən bir neçə xalis strategiyanın tətbiqindən ibarət belə birləşmiş strategiyalar oyun nəzəriyyəsində qarışıq strategiyalar adlanır.

Aydındır ki, hər bir təmiz strategiya qarışıq strategiyanın xüsusi halıdır, birindən başqa bütün strategiyalar sıfır tezliklərlə, bu isə 1 tezliyi ilə tətbiq olunur.

Məlum oldu ki, yalnız təmiz deyil, həm də istifadə olunur qarışıq strategiyalar, hər bir sonlu oyun üçün həll yolu, yəni belə (ümumi halda, qarışıq) bir cüt strategiya əldə etmək mümkündür ki, hər iki oyunçu onları tətbiq etdikdə qazanc oyunun qiymətinə bərabər olsun və hər hansı optimal strategiyadan birtərəfli yayınma, qazanc yalnız doğru dəyişə bilər, deviant üçün əlverişsizdir.

Yuxarıdakı ifadə oyun nəzəriyyəsinin əsas teoreminin məzmununu təşkil edir. Bu teorem ilk dəfə 1928-ci ildə fon Neyman tərəfindən sübut edilmişdir. Teoremin məlum sübutları nisbətən mürəkkəbdir; ona görə də biz yalnız onun formulunu təqdim edirik.

Hər bir son oyunun ən azı bir həlli var (bəlkə də qarışıq strategiyalar sahəsində).

Qərar nəticəsində əldə edilən qazanc oyunun dəyəri adlanır. Əsas teorem hər sonlu oyunun bir qiyməti olduğunu nəzərdə tutur. Aydındır ki, v oyununun qiyməti həmişə a oyununun aşağı qiyməti ilə oyunun yuxarı qiyməti arasında olur:

Həqiqətən, yalnız təmiz strategiyalarımızdan istifadə edərək özümüzə təmin edə biləcəyimiz maksimum zəmanətli uduşlar var. Qarışıq strategiyalara, xüsusi hal kimi, bütün təmiz olanlar daxil olduğundan, təmiz olanlara əlavə olaraq, qarışıq strategiyalara da icazə verilir.

strategiyalar, biz, heç bir halda, imkanlarımızı pisləşdirmirik; deməli,

Eynilə, rəqibin imkanlarını nəzərə alsaq, bunu göstərəcəyik

buradan (3.1) sübut olunmuş bərabərsizlik yaranır.

Qarışıq strategiyalar üçün xüsusi qeyd təqdim edək. Məsələn, qarışıq strategiyamız AL strategiyalarının tətbiqindən ibarətdirsə, biz bu strategiyanı tezliklərlə ifadə edəcəyik.

Eynilə, düşmənin qarışıq strategiyası ilə işarələnəcək:

strategiyaların qarışdırıldığı tezliklər haradadır

Tutaq ki, biz S, S iki optimal qarışıq strategiyadan ibarət oyunun həllini tapdıq. Ümumi halda, verilmiş oyunçu üçün mövcud olan bütün xalis strategiyalar onun optimal qarışıq strategiyasına daxil deyil, yalnız bəziləri. Biz oyunçunun optimal qarışıq strategiyasına daxil olan strategiyaları onun “faydalı” strategiyaları adlandıracağıq.

Məlum oldu ki, oyunun həlli daha bir var gözəl mülk: oyunçulardan biri optimal qarışıq strategiyasına əməl edərsə 5 (5). onda qazanc dəyişməz və digər oyunçunun nə etməsindən asılı olmayaraq, əgər o, v oyunun qiymətinə bərabər qalır. sadəcə onların “faydalı” strategiyalarından kənara çıxmır. O, məsələn, öz "faydalı" strategiyalarından hər hansı birini təmiz formada istifadə edə bilər, həmçinin onları istənilən nisbətdə qarışdıra bilər.

Gəlin bu ifadəni sübut edək. Qoy oyunun bir həlli olsun. Konkret olmaq üçün, optimal qarışıq strategiyanın üçünün qarışığından ibarət olduğunu güman edəcəyik

“Faydalı” strategiyalar müvafiq olaraq üç “faydalı” strategiyanın qarışığından ibarətdir.

üstəlik, iddia edilir ki, əgər biz S strategiyasına əməl etsək, o zaman düşmən istənilən nisbətdə strategiya tətbiq edə bilər və qazanc dəyişməz qalacaq və yenə də oyunun qiymətinə bərabər olacaqdır.

Fizika-texnika fakültəsini bitirsəm də, universitetdə mənə oyun nəzəriyyəsi öyrədilməyib. Amma mən daxil olduğum üçün tələbəlik illəriÇox oynadım, əvvəlcə üstünlük, sonra körpü, oyun nəzəriyyəsi məni maraqlandırdı və kiçik bir dərsliyi mənimsədim. Və bu yaxınlarda saytın oxucusu Mixail oyun nəzəriyyəsi problemini həll etdi. Tapşırığın mənə dərhal verilmədiyini anlayaraq, yaddaşımda oyun nəzəriyyəsi ilə bağlı biliklərimi təzələmək qərarına gəldim. Mən sizə kiçik bir kitab təqdim edirəm - oyun nəzəriyyəsi elementlərinin məşhur ekspozisiyası və matris oyunlarının həllinin bəzi üsulları. O, demək olar ki, heç bir sübut ehtiva etmir və nəzəriyyənin əsas məqamlarını misallarla göstərir. Kitab riyaziyyatçı və elmin populyarlaşdırıcısı Elena Sergeevna Ventzel tərəfindən yazılmışdır. Sovet mühəndislərinin bir neçə nəsli onun "Ehtimal nəzəriyyəsi" dərsliyindən öyrənmişdir. Elena Sergeevna da bir neçə yazdı ədəbi əsərlərİ.Qrekovun təxəllüsü ilə.

Elena Ventzel. Oyun nəzəriyyəsinin elementləri. - M .: Fizmətqız, 1961 .-- 68 s.

Yüklə qısa konspekt formatda və ya

§ 1. Oyun nəzəriyyəsinin mövzusu. Əsas anlayışlar

Bir sıra praktiki problemlərin (iqtisadiyyat, hərbi işlər və s. sahəsində) həlli zamanı əks məqsədlər güdən iki (və ya daha çox) döyüşən tərəfin mövcud olduğu və hər bir hadisənin nəticəsini təhlil etmək lazımdır. tərəflər düşmənin hansı hərəkət yolunu seçəcəyindən asılıdır. Belə halları “münaqişə vəziyyətləri” adlandıracağıq.

Təcrübənin müxtəlif sahələrindən münaqişə vəziyyətlərinə dair çoxsaylı nümunələr var. Döyüş əməliyyatları zamanı yaranan istənilən vəziyyət münaqişəli vəziyyətlərə aiddir: döyüşən tərəflərin hər biri düşmənin uğur qazanmasının qarşısını almaq üçün əlində olan bütün tədbirləri görür. Münaqişə vəziyyətlərinə silah sistemi, onun döyüş istifadə üsulları və ümumiyyətlə, hərbi əməliyyatların planlaşdırılması zamanı yaranan vəziyyətlər də daxildir: bu sahədə qərarların hər biri düşmənin ən az faydalı olan hərəkətlərini nəzərə alaraq qəbul edilməlidir. bizə. İqtisadiyyat sahəsində bir sıra situasiyalar (xüsusilə azad rəqabətin mövcud olduğu şəraitdə) konfliktli situasiyalara aiddir; ticarət firmaları döyüşən tərəf kimi çıxış edir, sənaye müəssisələri və s.

Belə vəziyyətlərin təhlili zərurəti xüsusi riyazi aparatın yaranmasına səbəb oldu. Oyun nəzəriyyəsi əslində münaqişə vəziyyətlərinin riyazi nəzəriyyəsindən başqa bir şey deyil. Nəzəriyyənin məqsədi münaqişə vəziyyətində rəqiblərin hər biri üçün rasional hərəkət kursu ilə bağlı tövsiyələr hazırlamaqdır. Təcrübədən birbaşa götürülmüş hər bir münaqişə vəziyyəti çox mürəkkəbdir və onun təhlilinə çoxsaylı köməkçi amillərin mövcudluğu mane olur. Vəziyyətin riyazi təhlilini mümkün etmək üçün ikinci dərəcəli, təsadüfi amillərdən mücərrəd çıxarmaq və vəziyyətin sadələşdirilmiş, rəsmiləşdirilmiş modelini qurmaq lazımdır. Biz bu modeli “oyun” adlandıracağıq.

Oyun real konflikt vəziyyətindən onun dəqiq müəyyən edilmiş qaydalara uyğun oynanması ilə fərqlənir. Bəşəriyyət uzun müddətdir ki, sözün hərfi mənasında oyun olan münaqişə vəziyyətlərinin belə rəsmiləşdirilmiş modellərindən istifadə edir. Məsələn, şahmat, dama, kart oyunları və s. Bütün bu oyunlar, məlum qaydalar əsasında gedən və bu və ya digər oyunçunun “qələbəsi” (qazanması) ilə bitən yarış xarakteri daşıyır.

Bu cür formal tənzimlənmiş, süni şəkildə təşkil edilmiş oyunlar ən çox təmsil olunur uyğun material oyun nəzəriyyəsinin əsas anlayışlarını təsvir etmək və mənimsəmək. Bu cür oyunların təcrübəsindən götürülmüş terminologiya digər münaqişəli vəziyyətlərin təhlilində də istifadə olunur: onlarda iştirak edən tərəflər şərti olaraq "oyunçular" adlanır və toqquşmanın nəticəsi tərəflərdən birinin "qalibiyyəti" olur.

Oyunda iki və ya daha çox rəqibin maraqları toqquşa bilər; birinci halda, oyun "ikiqat", ikincisi - "çox" adlanır. Çoxlu oyunun iştirakçıları koalisiya yarada bilərlər - daimi və ya müvəqqəti. İki daimi koalisiyanın iştirakı ilə çoxlu oyun bir cütə çevrilir. Cüt oyunlar ən böyük praktik əhəmiyyətə malikdir; burada özümüzü yalnız belə oyunları nəzərdən keçirməklə məhdudlaşdıracağıq.

Biz elementar oyun nəzəriyyəsinin təqdimatına bəzi əsas anlayışları formalaşdırmaqla başlayırıq. Qarşılıqlı maraqları olan iki A və B oyunçusunun iştirak etdiyi cütlük oyununu nəzərdən keçirəcəyik. “Oyun” dedikdə biz A və B tərəflərinin bir sıra hərəkətlərindən ibarət hadisəni nəzərdə tuturuq. Oyunun riyazi təhlilə məruz qalması üçün oyunun qaydaları dəqiq şəkildə tərtib edilməlidir. “Oyun qaydaları” dedikdə, hər iki tərəfin hərəkətlərinin mümkün variantlarını tənzimləyən şərtlər sistemi, hər bir tərəfin digərinin davranışı haqqında malik olduğu məlumatların miqdarı, alternativ “hərəkətlərin” ardıcıllığı (fərdi qərarlar qəbul edilir) başa düşülür. oyun zamanı), həmçinin verilən hərəkətlər dəstinin hərəkət etdiyi oyunun nəticəsi və ya nəticəsi. Bu nəticə (qazanc və ya itki) həmişə kəmiyyət ifadəsinə malik olmur, lakin adətən müəyyən ölçü şkalası təyin etməklə onu müəyyən sayda ifadə etmək mümkündür. Məsələn, şahmat oyununda qazanc şərti olaraq +1, itki -1, heç-heçə 0 dəyəri ilə təyin edilə bilər.

Bir oyunçu digərinin itirdiyini qazanırsa, oyun sıfır məbləğli oyun adlanır, yəni. hər iki tərəfin uduşlarının cəmi sıfıra bərabərdir. Sıfır məbləğli oyunda oyunçuların maraqları tam əksinədir. Burada yalnız belə oyunları nəzərdən keçirəcəyik.

Sıfır məbləğli oyunda oyunçulardan birinin qazancı digərinin qazancı ilə bərabər olduğu üçün əks işarə, onda, açıq-aydın, belə bir oyunu təhlil edərkən, oyunçulardan yalnız birinin qazancını nəzərə almaq olar. Məsələn, A oyunçusu olsun. Bundan sonra rahatlıq üçün şərti olaraq A tərəfini “biz”, B tərəfini isə “düşmən” adlandıracağıq.

Bu halda A tərəfi (“biz”) həmişə “qalib”, B tərəfi (“rəqib”) isə “uduzmuş” hesab olunacaq. Bu formal şərt ilk oyunçu üçün heç bir real üstünlük nəzərdə tutmur; qalib işarəsi əksinə dəyişdirildikdə onun əksi ilə əvəz olunduğunu görmək asandır.

Zamanla oyunun inkişafını bir sıra ardıcıl mərhələlərdən və ya “hərəkətlərdən” ibarət kimi təsəvvür edəcəyik. Oyun nəzəriyyəsində hərəkət oyun qaydaları ilə nəzərdə tutulmuş variantlardan birinin seçilməsidir. Hərəkətlər şəxsi və təsadüfi bölünür. Şəxsi hərəkət, müəyyən bir vəziyyətdə mümkün hərəkətlərdən birinin oyunçulardan birinin şüurlu seçimi və onun həyata keçirilməsidir. Şəxsi hərəkətə misal olaraq şahmat oyununda istənilən hərəkəti göstərmək olar. Növbəti hərəkəti yerinə yetirən oyunçu, lövhədə parçaların müəyyən bir düzülüşü ilə mümkün olan variantlardan birini şüurlu şəkildə seçir. Hər bir şəxsi gediş üçün mümkün variantlar toplusu oyun qaydaları ilə tənzimlənir və hər iki tərəfin əvvəlki hərəkətlərinin cəmindən asılıdır.

Təsadüfi hərəkət oyunçunun qərarı ilə deyil, təsadüfi seçim mexanizmi ilə (bir sikkə, zər atmaq, kartları qarışdırmaq və paylamaq və s.) həyata keçirilən bir sıra imkanlar arasından seçimdir. Məsələn, ilk kartı üstünlük verilən oyunçulardan birinə vermək 32 bərabər mümkün variantla təsadüfi bir hərəkətdir. Oyunun riyazi olaraq müəyyən edilməsi üçün oyunun qaydaları hər bir təsadüfi gediş üçün mümkün nəticələrin ehtimal paylanmasını göstərməlidir.

Bəzi oyunlar yalnız təsadüfi hərəkətlərdən (sırf qumar deyilən) və ya yalnız şəxsi hərəkətlərdən (şahmat, dama) ibarət ola bilər. Əksəriyyət kart oyunları oyunlara aiddir qarışıq tip, yəni. həm təsadüfi, həm də şəxsi hərəkətləri ehtiva edir.

Oyunlar yalnız hərəkətlərinin təbiətinə (şəxsi, təsadüfi) görə deyil, həm də digərinin hərəkətləri ilə bağlı hər bir oyunçu üçün mövcud olan məlumatların xarakterinə və miqdarına görə təsnif edilir. Oyunların xüsusi sinfi "oyunlar" adlanan oyunlardan ibarətdir tam məlumat". Tam məlumatı olan oyun, hər bir oyunçunun şəxsi və təsadüfi bütün əvvəlki hərəkətlərin nəticələrini bildiyi bir oyundur. Tam məlumatı olan oyunlara misal olaraq şahmat, dama və məşhur “noughts and crosses” oyununu göstərmək olar.

Düşmənin hərəkətləri ilə bağlı qeyri-müəyyənlik adətən münaqişə vəziyyətlərinin vacib elementi olduğundan praktiki əhəmiyyət kəsb edən oyunların əksəriyyəti tam məlumatı olan oyunlar sinfinə aid deyil.

Oyun nəzəriyyəsinin əsas anlayışlarından biri “strategiya” anlayışıdır. Oyunçunun strategiyası oyunun gedişində yaranmış vəziyyətdən asılı olaraq verilmiş oyunçunun hər bir şəxsi hərəkəti üçün seçimi unikal şəkildə müəyyən edən qaydalar toplusudur. Adətən, hər bir şəxsi hərəkət üçün qərar (seçim) mövcud konkret vəziyyətdən asılı olaraq, oyunun özü tərəfindən oyunçu tərəfindən verilir. Ancaq nəzəri olaraq bütün bu qərarların oyunçu tərəfindən əvvəlcədən verildiyini təsəvvür etsək, hər şey dəyişməyəcək. Bunun üçün oyunçu əvvəlcədən oyun zamanı mümkün olan bütün vəziyyətlərin siyahısını tərtib etməli və onların hər biri üçün öz həllini təqdim etməli idi. Prinsipcə (praktik olaraq deyilsə) bu, istənilən oyun üçün mümkündür. Əgər belə bir qərar sistemi qəbul olunarsa, bu, oyunçunun müəyyən strategiya seçməsi demək olacaq.

Strategiya seçmiş oyunçu indi oyunda şəxsən iştirak edə bilməz, lakin iştirakını hansısa maraqsız şəxsin (hakim) onun üçün müraciət edəcəyi qaydalar siyahısı ilə əvəz edə bilər. Strategiya avtomata konkret proqram şəklində də verilə bilər. Bu gün kompüterlər şahmatı belə oynayır. “Strategiya” anlayışının məna kəsb etməsi üçün oyunda şəxsi hərəkətlər olmalıdır; yalnız təsadüfi hərəkətlərdən ibarət oyunlarda strategiyalar yoxdur.

Mümkün strategiyaların sayından asılı olaraq oyunlar “sonlu” və “sonsuz”a bölünür. Sonlu oyun, hər bir oyunçunun yalnız məhdud sayda strategiyaya malik olduğu bir oyundur. A oyunçusunun oynadığı son oyun m strategiyalar və oyunçu B - n strategiyalar mxn oyunu adlanır.

A və B ("biz" və "rəqib") olan iki oyunçunun mxn oyununa nəzər salaq. Strategiyalarımızı A 1, A 2,…, A m düşmənin B 1, B 2,…, B n strategiyalarını göstərəcəyik. Qoy hər tərəf konkret strategiya seçsin; bizim üçün A i, düşmən üçün B j olacaq. Əgər oyun yalnız şəxsi hərəkətlərdən ibarətdirsə, onda A i, B j strategiyalarının seçimi oyunun nəticəsini - bizim uduşlarımızı müəyyən edir. Onu ij kimi işarə edək. Əgər oyunda şəxsi, təsadüfi hərəkətlərə əlavə olaraq, A i, B j strategiyaları üçün qazanc bütün təsadüfi hərəkətlərin nəticələrindən asılı olan təsadüfi dəyərdir. Bu halda gözlənilən gəlirin təbii qiymətləndirilməsi onun orta dəyəridir ( gözlənilən dəyər). Eyni işarə ilə həm qazancın özünü (təsadüfi hərəkətlər olmayan oyunda), həm də onun orta dəyərini (təsadüfi hərəkətlərlə oyunda) qeyd edəcəyik.

Hər bir strategiya cütü üçün ij qazanc (və ya orta gəlir) dəyərlərini bizə bildirin. Dəyərlər düzbucaqlı cədvəl (matris) şəklində yazıla bilər, onun sətirləri bizim strategiyalarımıza (A i), sütunlar isə düşmənin strategiyalarına (B j) uyğun gəlir. Belə bir cədvəl ödəniş matrisi və ya sadəcə oyun matrisi adlanır. mxn oyun matrisi Şəkildə göstərilmişdir. bir.

düyü. 1. Matris mxn

Bir sözlə, oyunun matrisini ‖а ij ‖ işarələyəcəyik. Oyunların bəzi elementar nümunələrinə baxaq.

Misal 1.İki oyunçu A və B, bir-birlərinə baxmadan masanın, emblemin və ya quyruğun üstünə öz seçdikləri bir sikkəni tərs yerə qoyurlar. Əgər oyunçular eyni tərəfləri seçiblərsə (hər ikisinin gerbi və ya hər ikisinin quyruğu var), onda A oyunçusu hər iki sikkəni götürür; əks halda onları B oyunçusu götürür. Oyunu təhlil etmək və onun matrisini tərtib etmək tələb olunur. Həll. Oyun yalnız iki hərəkətdən ibarətdir: bizim hərəkətimiz və rəqibin hər ikisi şəxsi. Oyun tam məlumatı olan oyunlara aid deyil, çünki dönmə anında onu yerinə yetirən oyunçu digərinin nə etdiyini bilmir. Oyunçuların hər birinin yalnız bir şəxsi hərəkəti olduğundan, oyunçunun strategiyası bu tək şəxsi hərəkətlə seçimdir.

Bizim iki strategiyamız var: A 1 - gerb seçmək və A 2 - quyruq seçmək; rəqib eyni iki strategiyaya malikdir: B 1 - gerb və B 2 - quyruq. Beləliklə, bu oyun 2 × 2 oyunudur. Bir sikkənin uduşunu +1 hesab edək. Oyun Matrisi:

Bu oyunun timsalında, ibtidai olsa da, siz oyun nəzəriyyəsinin bəzi əsas ideyalarını dərk edə bilərsiniz. Əvvəlcə fərz edək ki, verilmiş oyun yalnız bir dəfə yerinə yetirilir. O zaman, açıq-aydın, oyunçuların başqalarından daha ağlabatan hər hansı “strategiya”ları haqqında danışmağın mənası yoxdur. Eyni səbəbdən oyunçuların hər biri istənilən qərarı verə bilər. Ancaq oyun təkrarlananda vəziyyət dəyişir.

Həqiqətən, deyək ki, biz (A oyunçusu) özümüz üçün hansısa strategiya seçmişik (məsələn, A1) və biz ona sadiqik. Sonra ilk bir neçə gedişin nəticələrinə görə, düşmən bizim strategiyamızı təxmin edəcək və ona bizim üçün ən az sərfəli şəkildə cavab verəcək, yəni. quyruqları seçin. Hər hansı bir strategiyadan istifadə etmək bizim üçün açıq-aydın faydasızdır; uduzan olmamaq üçün bəzən gerbi, bəzən də quyruqları seçməliyik. Ancaq gerbləri və quyruqları müəyyən ardıcıllıqla (məsələn, birdən sonra) növbə ilə versək, düşmən də bu barədə təxmin edə və bu strategiyaya bizim üçün ən pis şəkildə cavab verə bilər. Aydındır ki, düşmənin strategiyamızı bilməməsini təmin etməyin etibarlı yolu, özümüzün əvvəlcədən bilmədiyi hər bir hərəkətdə seçimi təşkil etməkdir (bu, məsələn, sikkə atmaqla təmin edilə bilər). Beləliklə, biz oyun nəzəriyyəsinin əsas anlayışlarından birinə - "qarışıq strategiya" konsepsiyasına yaxınlaşmaq üçün intuitiv əsaslandırmadan istifadə edirik, yəni. belə ki, "saf" strategiyalar - bu halda A 1 və A 2 - müəyyən tezliklərlə təsadüfi olaraq dəyişdikdə. Bu misalda, simmetriya mülahizələrindən əvvəlcədən aydın olur ki, A 1 və A 2 strategiyaları eyni tezliklə növbələşməlidir; daha mürəkkəb oyunlarda həll mənasızlıqdan uzaq ola bilər.

Misal 2. A və B oyunçuları eyni vaxtda və bir-birindən asılı olmayaraq üç rəqəmin hər birini yazır: 1, 2 və ya 3. Yazılan rəqəmlərin cəmi cütdürsə, B A-ya bu məbləği rublla ödəyir; əgər təkdirsə, onda əksinə, A bu məbləği B-yə ödəyir. Oyunu təhlil etmək və onun matrisini tərtib etmək tələb olunur.

Həll. Oyun iki hərəkətdən ibarətdir; hər ikisi şəxsidir. Bizim (A) üç strategiyamız var: A 1 - 1 yaz; Və 2 - 2 yazın; Və 3 - yazın 3. Rəqibin (B) eyni üç strategiyası var. Oyun 3 × 3 oyundur:

Aydındır ki, əvvəlki vəziyyətdə olduğu kimi, seçdiyimiz istənilən strategiyaya düşmən bizim üçün ən pis şəkildə cavab verə bilər. Doğrudan da, məsələn, A1 strategiyasını seçsək, düşmən həmişə ona B2 strategiyası ilə cavab verəcək; A 2 strategiyası üzrə - B 3 strategiyası ilə; A 3 strategiyası üzrə - B 2 strategiyası ilə; beləliklə, müəyyən strategiyanın istənilən seçimi bizi istər-istəməz itkiyə aparacaq (lakin unutmaq olmaz ki, düşmən də eyni ağır vəziyyətdədir). Bu oyunun həlli (yəni, hər iki oyunçunun ən sərfəli strategiyaları toplusu) § 5-də veriləcəkdir.

Misal 3. Bizim ixtiyarımızda üç növ silah var: А 1, А 2, А 3; Düşmənin üç növ təyyarəsi var: B 1, B 2, B 3. Bizim vəzifəmiz təyyarəni vurmaqdır; düşmənin vəzifəsi onu təsirsiz saxlamaqdır. A 1 silahından istifadə edərkən, B 1, B 2, B 3 təyyarələri müvafiq olaraq 0,9, 0,4 və 0,2 ehtimalları ilə vurulur; silahlanma A 2 ilə - 0,3, 0,6 və 0,8 ehtimalları ilə; A 3 silahı ilə - 0,5, 0,7 və 0,2 ehtimallarla. Vəziyyəti oyun nəzəriyyəsi baxımından formalaşdırmaq tələb olunur.

Həll. Vəziyyəti iki şəxsi hərəkət və bir təsadüfi hərəkətlə 3 × 3 oyun kimi düşünmək olar. Bizim şəxsi hərəkətimiz silah növünün seçimidir; düşmənin şəxsi hərəkəti - döyüşdə iştirak üçün təyyarə seçimi. Təsadüfi hərəkət - silahdan istifadə; bu gediş təyyarənin məğlubiyyəti və ya məğlub olmaması ilə başa çata bilər. Təyyarə vurulduqda qazancımız bir, əks halda isə sıfırdır. Strategiyalarımız üç silah variantıdır; düşmən strategiyaları - üç təyyarə variantı. Verilmiş hər bir strategiya cütü üçün qazancın orta dəyəri verilmiş silahla müəyyən bir təyyarəni vurma ehtimalından başqa bir şey deyil. Oyun Matrisi:

Oyun nəzəriyyəsinin məqsədi tövsiyələr verməkdir ağlabatan davranış oyunçular münaqişə vəziyyətləri, yəni. onların hər biri üçün “optimal strategiya”nın müəyyən edilməsi. Oyun nəzəriyyəsində oyunçunun optimal strategiyası oyun dəfələrlə təkrar edildikdə verilmiş oyunçuya maksimum mümkün orta qazanc (və ya minimum mümkün orta itki) təmin edən strategiyadır. Bu strategiyanı seçərkən mülahizənin əsasını düşmənin ən azı bizim qədər ağıllı olması və məqsədimizə çatmağımıza mane olmaq üçün hər şeyi etdiyi fərziyyəsi dayanır.

Oyun nəzəriyyəsində bütün tövsiyələr bu prinsiplər əsasında hazırlanır; buna görə də hər bir real strategiyada qaçılmaz olaraq mövcud olan risk elementlərini, həmçinin oyunçuların hər birinin mümkün səhv hesablamalarını və səhvlərini nəzərə almır. Hər hansı bir oyun nəzəriyyəsi riyazi model mürəkkəb hadisənin öz məhdudiyyətləri var. Onlardan ən əsası gəlirin süni şəkildə birə endirilməsidir tək... Əksər praktiki münaqişə vəziyyətlərində ağlabatan strategiya hazırlayarkən bir deyil, bir neçə ədədi parametrləri - tədbirin uğurunun meyarlarını nəzərə almaq lazımdır. Bir meyar üzrə optimal olan strategiya digərləri üçün mütləq optimal deyil. Bununla belə, bu məhdudiyyətlərdən xəbərdar olmaqla və buna görə də oyun üsulları ilə əldə edilən tövsiyələrə kor-koranə riayət etməməklə, oyun nəzəriyyəsinin riyazi aparatından hələ də əsaslı şəkildə istifadə edə bilərsiniz, əgər tam olaraq "optimal" olmasa da, istənilən halda "məqbuldur". strategiya.

§ 2. Oyunun aşağı və yuxarı qiyməti. Minimax prinsipi

Şəkildəki kimi matrisli mxn oyununu nəzərdən keçirək. 1. Strategiyamızın nömrəsini i hərfi ilə işarə edək; j hərfi rəqibin strategiyasının nömrəsidir. Gəlin özümüzə vəzifə qoyaq: optimal strategiyamızı müəyyən edək. Gəlin A 1-dən başlayaraq hər bir strategiyamızı ardıcıl olaraq təhlil edək.

A i strategiyasını seçərkən biz həmişə ona arxalanmalıyıq ki, düşmən ona bizim a ij qazancımız minimal olan В j strategiyası ilə cavab verəcək. Ödənişin bu dəyərini müəyyən edək, yəni. a ij in ədədlərinin minimumu i ci xətt. Onu α i ilə işarə edək:

Burada min işarəsi (j-də minimum) bütün mümkün j üçün bu parametrin dəyərlərinin minimumunu bildirir. α i ədədlərini yazaq; əlavə sütun kimi sağdakı matrisin yanında:

Hər hansı bir A i strategiyasını seçərkən, rəqibin ağlabatan hərəkətləri nəticəsində α i-dən çox qalib gəlməyəcəyimizə arxalanmalıyıq. Təbii ki, ən ehtiyatlı davranaraq və ən ağlabatan rəqibə arxalanaraq (yəni hər hansı riskdən qaçaraq) biz α i sayının maksimum olduğu strategiyaya diqqət yetirməliyik. Bu maksimum dəyəri α ilə işarə edək:

və ya (2.1) düsturu nəzərə alınmaqla,

α dəyəri oyunun aşağı qiyməti, başqa sözlə, maksimum qazanma və ya sadəcə olaraq maksimum adlanır. α ədədi matrisin müəyyən sətirində yerləşir; Bu xəttə uyğun gələn A oyunçusunun strategiyasına maksimal strategiya deyilir. Aydındır ki, maksimum strategiyaya əməl etsək, düşmənin hər hansı bir davranışı üçün ən azı α-dan az olmayan bir nəticəyə zəmanət verilir. Buna görə də, α dəyəri "aşağı oyun qiyməti" adlanır. Bu, ən ehtiyatlı (“təkrarsığorta”) strategiyasına riayət etməklə özümüzü təmin edə biləcəyimiz zəmanətli minimumdur.

Aydındır ki, oxşar mülahizə rəqib B üçün də aparıla bilər. Düşmən bizim uduşlarımızı minimuma endirməkdə maraqlı olduğundan o, öz strategiyalarının hər birinə nöqteyi-nəzərdən baxmalıdır. maksimum qalibiyyət bu strategiya ilə. Buna görə də, matrisin altındakı hər bir sütun üçün maksimum dəyərləri yazacağıq:

və β j minimumunu tapın:

β dəyəri oyunun yuxarı qiyməti, başqa sözlə, “minimax” adlanır. Rəqibin minimaks qazancına uyğun strategiyası onun “minimax strategiyası” adlanır. Ən ehtiyatlı minimaks strategiyasına sadiq qalaraq, rəqib özünə aşağıdakıları təmin edir: ona qarşı nə etsək də, o, istənilən halda β-dan çox olmayan məbləği itirəcək. Oyunçular üçün uyğun strategiyaların (maksimin və minimaks) seçilməsini diktə edən ehtiyatlılıq prinsipi oyun nəzəriyyəsində və onun tətbiqlərində çox vaxt “minimax prinsipi” adlanır. Oyunçuların ən diqqətli maksimum və minimum strategiyaları bəzən işarələnir ümumi termin"Minimaks strategiyaları".

Nümunələr olaraq, § 1-in 1, 2 və 3-cü misalları üçün aşağı və yuxarı oyun qiymətlərini və minimaks strategiyalarını müəyyən edirik.

Misal 1. Nümunə 1 § 1 aşağıdakı matrisə malik oyunu verir:

α i və β j dəyərləri sabit və müvafiq olaraq –1 və +1-ə bərabər olduğundan, aşağı və yuxarı oyun qiymətləri də –1 və +1-dir: α = –1, β = +1. A oyunçusunun istənilən strategiyası onun maksimumu, B oyunçusunun istənilən strategiyası isə onun minimaks strategiyasıdır. Nəticə mənasızdır: hər hansı strategiyasına sadiq qalaraq, oyunçu A 1-dən çox itirməyəcəyinə zəmanət verə bilər; eyni şey B oyunçusu tərəfindən təmin edilə bilər.

Misal 2. Misal 2 § 1 matrisli bir oyun verir:

Oyunun aşağı qiyməti α = –3; oyunun yuxarı qiyməti β = 4. Maksimum strategiyamız A 1-dir; sistematik şəkildə tətbiq etməklə, ən azı –3 (ən çox 3 uduzmaq) qazanacağımızı qətiyyətlə gözləyə bilərik. Rəqibin minimaks strategiyası B 1 və B 2 strategiyalarından hər hansı birisidir; onları sistemli şəkildə tətbiq etməklə, o, istənilən halda, 4-dən çox itirməyəcəyinə zəmanət verə bilər. Maksimin strategiyamızdan yayınsaq (məsələn, A2 strategiyasını seçin), rəqib B strategiyasını tətbiq etməklə bizi buna görə "cəzalandıra" bilər. 3 və uduşlarımızı azaltmaq -5; Eynilə, rəqibin minimaks strategiyasından geri çəkilməsi onun itkisini 6-ya çatdıra bilər.

Misal 3. Misal 3 § 1 matrisli bir oyun verir:

Oyunun aşağı qiyməti α = 0,3; oyunun yuxarı dəyəri β = 0,7. Bizim ən mühafizəkar (maksimin) strategiyamız A 2-dir; A 2 silahından istifadə edərək, bütün hallarda təyyarəni orta hesabla ən azı 0,3 vuracağımıza zəmanət veririk. Ən ehtiyatlı (minimax) düşmən strategiyası B 2-dir; bu təyyarədən istifadə edərək düşmən bütün hallarda 0,7-dən çox olmamaqla vurulacağına əmin ola bilər.

Sonuncu nümunə birini nümayiş etdirmək üçün əlverişlidir mühüm əmlak minimax strategiyaları - onların qeyri-sabitliyi. Tutaq ki, biz ən ehtiyatlı (maksiminal) strategiyamız A 2, rəqib isə onun ən ehtiyatlı (minimax) strategiyası В 2-dən istifadə edir. Hər iki rəqib bu strategiyalara əməl etdikcə, orta qazanc 0,6; aşağı qiymətdən çoxdur, lakin oyunun yuxarı qiymətindən azdır. İndi tutaq ki, rəqib A 2 strategiyasından istifadə etdiyimizi öyrəndi; o, dərhal ona B 1 strategiyası ilə cavab verəcək və uduşları 0,3-ə endirəcək. Öz növbəsində, B 1 strategiyasına yaxşı cavabımız var: strategiya A 1, bizə 0,9 qazanc verir və s.

Beləliklə, hər iki oyunçunun minimaks strategiyalarından istifadə etdiyi mövqe qeyri-sabitdir və qarşı tərəfin strategiyası haqqında alınan məlumatla pozula bilər. Bununla belə, minimax strategiyalarının sabit olduğu bəzi oyunlar var. Aşağı qiymətin yuxarı qiymətə bərabər olduğu oyunlar bunlardır: α = β. Əgər oyunun aşağı qiyməti yuxarı qiymətə bərabərdirsə, onda onların ümumi dəyəri oyunun xalis qiyməti adlanır (bəzən sadəcə oyunun qiyməti), biz onu ν hərfi ilə işarə edəcəyik.

Bir nümunəyə baxaq. 4 × 4 oyunu matrislə verilsin:

Oyunun aşağı qiymətini tapaq: α = 0,6. Oyunun yuxarı qiymətini tapaq: β = 0,6. Onların eyni olduğu ortaya çıxdı, buna görə oyunun α = β = ν = 0,6-a bərabər xalis qiyməti var. Ödəniş matrisində vurğulanan 0.6 elementi həm öz cərgəsində minimum, həm də sütununda maksimumdur. Həndəsədə oxşar xüsusiyyətə malik olan səthdəki nöqtə (bir koordinat boyunca eyni vaxtda minimum və digəri boyunca maksimum) yəhər nöqtəsi adlanır; analogiyaya görə, bu termin oyun nəzəriyyəsində də istifadə olunur. Bu xassə ilə matrisin elementi matrisin yəhər nöqtəsi adlanır və oyunun yəhər nöqtəsi olduğu deyilir.

Yəhər nöqtəsi bir cüt minimaks strategiyasına uyğun gəlir (bu misalda A 3 və B 2). Bu strategiyalar optimal adlanır və onların birləşməsi oyunun həlli adlanır. Oyunun həlli aşağıdakı əlamətdar xüsusiyyətlərə malikdir. Əgər oyunçulardan biri (məsələn, A) öz optimal strategiyasına əməl edirsə, digər oyunçu (B) isə hər hansı şəkildə öz optimal strategiyasından kənara çıxırsa, kənara çıxan oyunçu üçün bu heç vaxt faydalı ola bilməz, belə bir sapma oyunçu B ən yaxşı halda uduşları dəyişməz, ən pis halda isə artıra bilər. Əksinə, əgər B öz optimal strategiyasına əməl edirsə, A isə özündən kənara çıxarsa, bu heç bir halda A üçün faydalı ola bilməz.

Bu ifadə asanlıqla nəzərdən keçirilən yəhər nöqtəsi ilə oyun nümunəsi ilə təsdiqlənə bilər. Biz görürük ki, yəhər nöqtəsi olan oyunda minimaks strategiyaları bir növ “sabitlik”ə malikdir: əgər bir tərəf özünün minimaks strategiyasına əməl edirsə, o zaman digər tərəfin özündən kənara çıxması yalnız faydasız ola bilər. Qeyd edək ki, bu zaman hər hansı oyunçunun düşmənin öz optimal strategiyasını seçdiyini bilməsi oyunçunun öz davranışını dəyişə bilməz: əgər o, öz maraqlarına zidd hərəkət etmək istəmirsə, öz optimal strategiyasına əməl etməlidir. Yəhər nöqtəsi oyununda bir cüt optimal strategiya, sanki, “tarazlıq mövqeyidir”: optimal strategiyadan hər hansı bir sapma sapan oyunçunu əlverişsiz nəticələrə gətirib çıxarır və onu ilkin vəziyyətinə qayıtmağa məcbur edir.

Beləliklə, yəhər nöqtəsi olan hər oyun üçün hər iki tərəf üçün aşağıdakı xüsusiyyətlərə malik olan bir cüt optimal strategiya müəyyən edən bir həll var.

1) Əgər hər iki tərəf öz optimal strategiyalarına əməl edərsə, o zaman orta qazanc oyunun xalis qiymətinə ν bərabərdir ki, bu da eyni zamanda onun aşağı və yuxarı qiymətləridir.

2) Əgər tərəflərdən biri öz optimal strategiyasına əməl edərsə, digəri isə özündən kənara çıxarsa, o zaman sapan tərəf bundan ancaq uduzur və heç bir halda qazancını artıra bilməz.

Yəhər nöqtəli oyunlar sinfi həm nəzəri, həm də praktiki baxımdan böyük maraq doğurur. Oyun nəzəriyyəsində sübut edilmişdir ki, xüsusən də tam məlumatı olan hər bir oyunun yəhər nöqtəsi var və buna görə də hər bir belə oyunun həlli var, yəni. oyun qiymətinə bərabər orta gəlir verən hər iki tərəfin bir cüt optimal strategiyası var. Əgər tam məlumatı olan oyun yalnız şəxsi hərəkətlərdən ibarətdirsə, onda hər bir tərəf öz optimal strategiyasını tətbiq etdikdə, o, həmişə tam müəyyən nəticə ilə, yəni oyunun qiymətinə tam bərabər olan qələbə ilə başa çatmalıdır.

Tam məlumatı olan bir oyun nümunəsi olaraq veririk məşhur oyunüst-üstə yığılmış sikkələr ilə dəyirmi masa... İki oyunçu növbə ilə eyni sikkələri dəyirmi masaya qoyur, hər dəfə sikkənin mərkəzinin ixtiyari mövqeyini seçir; sikkələrin üst-üstə düşməsinə icazə verilmir. Son sikkəni qoyan oyunçu qalib gəlir (başqaları üçün yer olmadıqda). Aydındır ki, bu oyunun nəticəsi həmişə gözlənilməz bir nəticədir və sikkəni birinci yerə qoyan oyunçunun etibarlı qələbəsini təmin edən dəqiq müəyyən edilmiş strategiya var. Məhz, o, əvvəlcə masanın mərkəzinə bir sikkə qoymalı, sonra hər bir rəqibin hərəkətinə simmetrik bir hərəkətlə cavab verməlidir. Bu zaman ikinci oyunçu oyunun əvvəlcədən müəyyən edilmiş nəticəsini dəyişmədən özünü istədiyi kimi apara bilər. Buna görə də, bu oyun yalnız optimal strategiyanı bilməyən oyunçular üçün məna kəsb edir. Şahmat və tam məlumatı olan digər oyunlarda da vəziyyət oxşardır; bu oyunlardan hər hansı birinin yəhər nöqtəsi və oyunçuların hər birinə onun optimal strategiyasını göstərən həlli var; şahmat oyununun həlli yalnız ona görə tapılmadı ki, şahmatda mümkün hərəkətlərin kombinasiyalarının sayı ödəniş matrisini qurmaq və orada yəhər nöqtəsi tapmaq üçün çox böyükdür.

§ 3. Saf və qarışıq strategiyalar. Qarışıq strategiyalarda oyunun həlli

Praktiki əhəmiyyət kəsb edən sonlu oyunlar arasında yəhər nöqtəsi oyunları nisbətən nadirdir; oyunun aşağı və yuxarı qiymətlərinin fərqli olduğu hal daha tipikdir. Belə oyunların matrislərini təhlil edərək belə nəticəyə gəldik ki, əgər hər bir oyunçuya vahid strategiya seçimi verilirsə, o zaman ağlabatan hərəkət edən rəqibə arxalanaraq, bu seçim minimax prinsipi ilə müəyyən edilməlidir. Maksimin strategiyamıza sadiq qalaraq, rəqibin hər hansı bir davranışı üçün, əlbəttə ki, özümüzə oyunun α-nın aşağı qiymətinə bərabər bir qazanc təmin edirik. Təbii sual yaranır: tək bir "təmiz" strategiyadan istifadə etsəniz, təsadüfi olaraq bir neçə strategiyanı əvəz etsəniz, özünüzə α-dan daha çox orta qazanc təmin etmək mümkündürmü? Müəyyən tezlik nisbəti ilə təsadüfi qanuna uyğun olaraq bir-birini əvəz edən bir neçə xalis strategiyanın tətbiqindən ibarət belə birləşmiş strategiyalar oyun nəzəriyyəsində qarışıq strategiyalar adlanır.

Aydındır ki, hər bir təmiz strategiya qarışıq strategiyanın xüsusi halıdır, burada birindən başqa bütün strategiyalar sıfır tezliklərlə, bu isə 1 tezliyi ilə tətbiq olunur. Məlum olur ki, təkcə təmiz deyil, həm də tətbiq edilir. qarışıq strategiyalar, hər bir sonlu oyun həlli üçün əldə edilə bilər, yəni. bir cüt (ümumiyyətlə qarışıq) strategiyalar ki, hər iki oyunçu onları tətbiq etdikdə, qazanc oyunun qiymətinə bərabər olacaq və optimal strategiyadan hər hansı birtərəfli yayınma üçün qazanc yalnız əlverişsiz olan istiqamətdə dəyişə bilər. deviant.

Yuxarıdakı ifadə oyun nəzəriyyəsinin əsas teoreminin məzmununu təşkil edir. Bu teorem ilk dəfə 1928-ci ildə fon Neyman tərəfindən sübut edilmişdir. Teoremin məlum sübutları nisbətən mürəkkəbdir; ona görə də biz yalnız onun formulunu təqdim edirik.

Hər bir son oyunun ən azı bir həlli var (bəlkə də qarışıq strategiyalar sahəsində).

Qərar nəticəsində əldə edilən qazanc oyunun dəyəri adlanır. Əsas teorem hər sonlu oyunun bir qiyməti olduğunu nəzərdə tutur. Aydındır ki, ν oyununun qiyməti həmişə oyunun aşağı qiyməti α ilə oyunun yuxarı qiyməti β arasında olur:

(3.1) α ≤ ν ≤ β

Həqiqətən, α yalnız təmiz strategiyalarımızdan istifadə edərək özümüzə təmin edə biləcəyimiz maksimum zəmanətli gəlirdir. Qarışıq strategiyalara, xüsusi hal kimi, bütün təmiz olanlar daxil olduğundan, təmiz olanlarla yanaşı, qarışıq strategiyaları da qəbul edərək, biz, hər halda, imkanlarımızı pisləşdirmirik; deməli, ν ≥ α. Eynilə, rəqibin imkanlarını nəzərə alaraq göstəririk ki, ν ≤ β, buradan sübut olunmuş bərabərsizlik (3.1) gəlir.

Qarışıq strategiyalar üçün xüsusi qeyd təqdim edək. Məsələn, qarışıq strategiyamız p 1, p 2, p 3 və p 1 + p 2 + p 3 = 1 tezlikləri ilə A 1, A 2, A 3 strategiyalarının tətbiqindən ibarətdirsə, biz bu strategiyanı işarə edəcəyik.

Eynilə, düşmənin qarışıq strategiyası ilə işarələnəcək:

burada q 1, q 2, q 3 B 1, B 2, B 3 strategiyalarının qarışdırıldığı tezliklərdir; q 1 + q 2 + q 3 = 1.

Tutaq ki, S A *, S B * optimal iki qarışıq strategiyadan ibarət oyunun həllini tapdıq. Ümumi halda, müəyyən bir oyunçu üçün mövcud olan bütün təmiz strategiyalar onun optimal qarışıq strategiyasına daxil edilir, ancaq bəziləri. Biz oyunçunun optimal qarışıq strategiyasına daxil olan strategiyaları onun “faydalı” strategiyaları adlandıracağıq. Məlum oldu ki, oyunun həlli daha bir diqqətəlayiq xüsusiyyətə malikdir: əgər oyunçulardan biri SA * (SB *) optimal qarışıq strategiyasına əməl edərsə, o zaman qazanc dəyişməz və oyunun qiymətinə bərabər qalır ν digər oyunçu onun "faydalı" strategiyalarından kənara çıxmadığı təqdirdə nə edir. O, məsələn, öz "faydalı" strategiyalarından hər hansı birini təmiz formada istifadə edə bilər, həmçinin onları istənilən nisbətdə qarışdıra bilər.

§ 4. Oyunların həlli üçün elementar üsullar. Oyunlar 2x2 və 2xn

Əgər mxn oyununda yəhər nöqtəsi yoxdursa, onda bir həll tapmaq ümumiyyətlə, xüsusilə böyük m və n üçün kifayət qədər çətin işdir. Bəzən bu vəzifəni əvvəlcə bəzi lazımsızları silməklə strategiyaların sayını azaltmaqla sadələşdirmək olar. Həddindən artıq strategiyalar a) dublikatdır və b) açıq-aşkar faydasızdır. Məsələn, matrisli bir oyunu nəzərdən keçirək:

A 3 strategiyasının A 1 strategiyasını tam olaraq təkrarladığına ("dublikat") əmin olmaq asandır, buna görə də bu iki strategiyadan hər hansı birini silmək olar. Bundan əlavə, A 1 və A 2 sətirlərini müqayisə edərək, A2 xəttinin hər bir elementinin A 1 xəttinin müvafiq elementindən az (və ya ona bərabər) olduğunu görürük. Aydındır ki, biz heç vaxt A2 strategiyasından istifadə etməməliyik, bu, bilərəkdən sərfəli deyil. A 3 və A 2-ni silməklə matrisi daha da artırırıq sadə ağıl... Bundan əlavə, qeyd edirik ki, B 3 strategiyası açıq şəkildə rəqib üçün sərfəli deyil; onu silməklə matrisi son formasına gətiririk:

Beləliklə, 4 × 4 oyunu dublikat və açıq-aydın əlverişsiz strategiyaları aradan qaldıraraq 2 × 3 oyununa endirilir.

Dublikat və açıq-aydın əlverişsiz strategiyaların silinməsi proseduru həmişə oyunun qərarından əvvəl olmalıdır. Həmişə elementar üsullarla həll edilə bilən sonlu oyunların ən sadə halları 2 × 2 və 2xn oyunlarıdır.

Matrisli 2 × 2 oyunu nəzərdən keçirin:

Burada iki hal baş verə bilər: 1) oyunun yəhər nöqtəsi var; 2) oyunun yəhər nöqtəsi yoxdur. Birinci halda, həll yolu aydındır: bu, yəhər nöqtəsində kəsişən bir cüt strategiyadır. Yeri gəlmişkən, qeyd edək ki, 2 × 2 oyununda yəhər nöqtəsinin olması həmişə ilkin təhlildə silinməli olan qəsdən əlverişsiz strategiyaların mövcudluğuna uyğun gəlir.

Heç bir yəhər nöqtəsi olmasın və buna görə də oyunun aşağı qiyməti yuxarıya bərabər deyil: α ≠ β. A oyunçusunun optimal qarışıq strategiyasını tapmaq lazımdır:

Rəqibin hərəkətləri nə olursa olsun ("faydalı" strategiyalarının hüdudlarından kənara çıxmazsa), qazanc oyunun ν qiymətinə bərabər olacaq xüsusiyyəti ilə fərqlənir. 2 × 2 oyununda hər iki düşmən strategiyası "faydalıdır", əks halda oyunun təmiz strategiya həlli (yəhər nöqtəsi) olardı. Bu o deməkdir ki, əgər biz optimal strategiyamıza (4.1) əməl etsək, o zaman rəqib özünün B 1, B 2 xalis strategiyalarından hər hansı birini orta qazancı ν dəyişmədən istifadə edə bilər. Beləliklə, iki tənliyimiz var:

ondan p 1 + p 2 = 1 olduğunu nəzərə alaraq əldə edirik:

P 1, p 2 dəyərlərini (4.2) hər hansı bir tənlikdə əvəz etməklə oyunun ν dəyərini tapırıq.

Əgər oyunun qiyməti məlumdursa, o zaman rəqibin optimal strategiyasını müəyyən etmək

bir tənlik kifayətdir, məsələn:

buradan, q 1 + q 2 = 1 olduğunu nəzərə alsaq, əldə edirik:

Misal 1. Nümunə 1 § 1-də nəzərdən keçirilən 2 × 2 oyunun həllini matrislə tapaq:

Oyunun yəhər nöqtəsi yoxdur (α = –1; β = +1) və buna görə də həll qarışıq strategiyalar sahəsində olmalıdır:

Siz p 1, p 2, q 1 və q 2-ni tapmaq lazımdır. p 1 üçün tənliyimiz var

1 * p 1 + (–1) (1 - p 1) = (–1) p 1 + 1 (1 - p 1)

buradan p 1 = 1/2, p 2 = 1/2.

Eynilə, tapırıq: q 1 = 1/2, q 2 = 1/2, ν = 0.

Nəticə etibarilə, oyunçuların hər biri üçün optimal strategiya, hər ikisini eyni dərəcədə tez-tez istifadə edərək, hər iki təmiz strategiyasını təsadüfi olaraq dəyişməkdir; bu halda orta gəlir sıfıra bərabər olacaqdır.

Nəticə əvvəlcədən kifayət qədər aydın idi. Növbəti nümunədə daha çox baxacağıq çətin oyun, bunun həlli o qədər də aydın deyil. Nümunə "aldadıcı" və ya "aldadıcı" oyunlar kimi tanınan oyunların ibtidai nümunəsidir. Praktikada, münaqişə vəziyyətlərində onlardan tez-tez istifadə olunur fərqli yollar düşməni çaşdırmaq (dezinformasiya, yalançı hədəflərin yerləşdirilməsi və s.). Nümunə, sadəliyinə baxmayaraq, olduqca ibrətamizdir.

Misal 2. Oyun aşağıdakı kimidir. İki kart var: bir ace və bir ikili. Oyunçu A onlardan birini təsadüfi çəkir; B hansı kartı çıxardığını görmür. Əgər A eys çıxarıbsa, o, deyir: “Mənim asım var” və rəqibdən 1 rubl tələb edir. Əgər A ikili çıxarıbsa, o zaman ya A 1) “Mənim acem var” deyib rəqibdən 1 rubl tələb edə bilər, ya da A 2) ikilisi olduğunu etiraf edib rəqibə 1 rubl ödəyə bilər.

Düşmən, əgər ona könüllü olaraq 1 rubl ödənilirsə, yalnız onu qəbul edə bilər. Əgər ondan 1 rubl tələb olunursa, o, ya B 1) A oyunçusunun ace olduğuna inanıb ona 1 rubl verə bilər, ya da B 2) A ifadəsinə əmin olmaq üçün çek tələb edə bilər. A həqiqətən ace var, B A 2 rubl ödəməlidir. Əgər A xəyanət edirsə və onun ikilisi varsa, A oyunçusu B oyunçusuna 2 rubl ödəyir. Oyunu təhlil etmək və oyunçuların hər biri üçün optimal strategiya tapmaq tələb olunur.

Həll. Oyun nisbətən mürəkkəb quruluşa malikdir; o, bir məcburi təsadüfi gedişdən - oyunçu A-nın iki kartdan birini seçməsindən və iki şəxsi hərəkətdən ibarətdir, lakin bu, mütləq baş tutmur. Həqiqətən, əgər A ace çıxarsa, o, heç bir şəxsi hərəkət etmir: ona yalnız bir fürsət verilir - 1 rubl tələb etmək, bunu edir. Bu halda, şəxsi hərəkət - inanmaq və ya inanmamaq (yəni 1 rubl ödəmək və ya verməmək) - oyunçu B-yə ötürülür. Əgər A ilk təsadüfi gediş nəticəsində iki aldısa, o zaman ona şəxsi hərəkət verilir. köçmək: 1 rubl ödəyin və ya düşməni aldatmağa çalışın və 1 rubl tələb edin (qısaca: "aldatmayın" və ya "aldatmayın"). Əgər A birincini seçirsə, onda B yalnız 1 rubl qəbul etməlidir; Əgər A sonuncunu seçibsə, onda B oyunçusuna şəxsi hərəkət verilir: A-ya inanın və ya inanmayın (yəni A 1 rubl ödəyin və ya yoxlama tələb edin).

Oyunçuların hər birinin strategiyaları oyunçuya şəxsi hərəkət verildikdə onun necə hərəkət etməli olduğunu göstərən qaydalardır. Aydındır ki, A-nın yalnız iki strategiyası var: A 1 - aldatmaq, A 2 - aldatmamaq. B-nin də iki strategiyası var: B 1 - inanmaq, B 2 - inanmamaq. Oyun matrisini quraq. Bunun üçün strategiyaların hər bir kombinasiyası üçün orta gəliri hesablayaq.

1. A 1 B 1 (A aldadır, B inanır). A ace aldısa (bunun ehtimalı ½-dir, onda ona şəxsi gediş verilmir; o, 1 rubl tələb edir və B oyunçusu ona inanır; A-nın rublda qazancı 1-dir. Əgər A iki aldısa (bunun ehtimalı) həm də ½), strategiyasına uyğun olaraq fırıldaq edir və 1 rubl tələb edir; İnanır və ödəyir; A qazancı da 1-ə bərabərdir. Orta qazanc: a 11 = ½ * 1 + ½ * 1 = 1.

2. A 1 B 2 (A aldadır, B inanmır). A ace alırsa, onun şəxsi hərəkəti yoxdur; ona 1 rubl tələb olunur; Strategiyasına görə, o, inanmır və çek nəticəsində 2 rubl ödəyir (A-nın qazancı +2). A deuce alırsa, strategiyasına uyğun olaraq, 1 rubl tələb edir; B, öz fikrincə, inanmır; nəticədə A 2 rubl ödəyir (A-nın qazancı –2). Orta gəlir: a 12 = ½ * (+ 2) + ½ * (- 2) = 0.

3. A 2 B 1 (A aldatmaz, B inanır). A ace çıxarsa, o, 1 rubl tələb edir; B, öz strategiyasına uyğun olaraq, ödəyir; A-nın qazancı +1-dir. A ikili çıxardısa, strategiyasına uyğun olaraq 1 rubl ödəyir; Qalan yalnız qəbul etməkdir (A-nın qazancı -1). Orta gəlir: a 21 = ½ * (+ 1) + ½ * (- 1) = 0.

4. A 2 B 2 (A aldatmaz, B inanmaz). A ace çıxarsa, o, 1 rubl tələb edir; B çek edir və çek nəticəsində 2 rubl ödəyir (qalibiyyət +2). A ikili çıxardısa, o, 1 rubl ödəyir; Qalan yalnız qəbul etməkdir (gəliş 1-dir). Orta gəlir: a 22 = ½ * (+ 2) + ½ * (- 1) = ½.

Oyun matrisini qururuq:

Matrisdə yəhər nöqtəsi yoxdur. Oyunun aşağı qiyməti α = 0, oyunun yuxarı qiyməti β = ½-dir. Qarışıq strategiyalar sahəsində oyunun həllini tapaq. Düsturu (4.3) tətbiq edərək, əldə edirik:

olanlar. Oyunçu A bütün halların üçdə birində ilk strategiyasını (fırıldaq), ikincisini (fırıldaqçı deyil) üçdə ikisində istifadə etməlidir. Bu halda o, orta hesabla oyunun qiymətini ν = 1/3 qazanacaq.

ν = 1/3 dəyəri bu şərtlərdə oyunun A üçün faydalı, B üçün isə əlverişsiz olduğunu göstərir. Optimal strategiyasından istifadə edərək, A həmişə özünü müsbət orta gəlirlə təmin edə bilər. Nəzərə alın ki, əgər A ən ehtiyatlı (maksiminal) strategiyasından istifadə etsəydi (bu halda hər iki strategiya A 1 və A 2 maksimumdur), onun sıfıra bərabər orta gəliri olacaq. Beləliklə, qarışıq strategiyadan istifadə A-ya verilmiş oyun qaydaları çərçivəsində yaranan B-dən üstünlüyünü reallaşdırmaq imkanı verir.

Optimal strategiyanı müəyyən edək B. Bizdə: q 1 * 1 + q 2 * 0 = 1/3, q 1 = 1/3, q 2 = 2/3. Harada

yəni. oyunçu B bütün halların üçdə birində A-ya etibar etməli və ona yoxlamadan 1 rubl, halların üçdə ikisində isə çek ödəməlidir. Sonra o, hər oyun üçün orta hesabla 1/3 itirəcək. Əgər o, xalis minimax strategiyası B 2-dən istifadə etsəydi (inanmıram), hər oyun üçün orta hesabla 1/2 itirərdi.

2 × 2 oyununun həllinə sadə bir həndəsi şərh verilə bilər. Matrislə 2 × 2 oyun olsun

Uzunluğu 1 olan absis oxunun bir hissəsini götürün (şəkil 4.1). Bölmənin sol ucu (abscissa x = 0 olan nöqtə) A 1 strategiyasını təmsil edəcək; bölmənin sağ ucu (x = 1) - strategiya A 2. A 1 və А 2 nöqtələri vasitəsilə absis oxuna iki perpendikulyar çəkək: ox I– İ və ox II – II... Oxda I– İ A 1 strategiyası üçün uduşları təxirə salacağıq; oxda II – II- A 2 strategiyası ilə qalib gəlir. Rəqibin B 1 strategiyasını nəzərdən keçirin; oxlarda iki xal verir I– İII – II müvafiq olaraq a 11 və 21 ordinatları ilə. Bu nöqtələrdən B 1 B 1 düz xətti çəkin. Aydındır ki, düşmənin B 1 strategiyası üçün qarışıq strategiya tətbiq etsək

onda bu halda 11 p 1 + a 21 p 2-yə bərabər olan orta gəlirimiz B 1 B 1 xəttində M nöqtəsi ilə təmsil olunur; bu nöqtənin absisi p 2-ə bərabərdir. B 1 strategiyasının nəticəsini təmsil edən B 1 B 1 düz xətti şərti olaraq “strategiya B 1” adlandırılacaqdır.

Aydındır ki, B2 strategiyası da eyni şəkildə qurula bilər (Şəkil 4.2).

Biz optimal S A * strategiyasını, yəni minimum qazancın (B-nin istənilən davranışı üçün) maksimuma çevriləcəyi strategiyanı tapmalıyıq. Bunu etmək üçün B 1, B 2 strategiyaları üçün qazancın aşağı sərhədini qururuq, yəni. kəsik xətt B 1 NB 2 şəkildə qeyd edilmişdir. 4.2 qalın xətt ilə. Bu aşağı hədd A oyunçusunun hər hansı qarışıq strategiyası üçün minimum qazancını ifadə edəcək; bu minimum qazancın maksimuma çatdığı N nöqtəsi oyunun qərarını və qiymətini müəyyən edir. N nöqtəsinin ordinatının oyunun ν qiyməti olduğunu və onun absissasının p 2-yə bərabər olduğunu yoxlamaq asandır - optimal qarışıq strategiya S A *-da A 2 strategiyasının tətbiqi tezliyi.

Bizim vəziyyətimizdə oyunun qərarı strategiyaların kəsişmə nöqtəsi ilə müəyyən edilirdi. Lakin bu, həmişə belə olmayacaq; şək. 4.3, strategiyaların kəsişməsinin olmasına baxmayaraq, həllin hər iki oyunçu üçün təmiz strategiyalar (A 2 və B 2) və oyunun qiymətinin ν = a 22 olduğu halı göstərir. Bu halda, matrisin yəhər nöqtəsi var və A 1 strategiyası açıq-aydın gəlirsizdir, çünki Düşmənin istənilən təmiz strategiyası üçün A2-dən daha az qazanc verir.

Rəqibin qəsdən əlverişsiz bir strategiyası olduğu halda, həndəsi şərh Şəkil 1-də göstərilən formaya malikdir. 4.4.

Bu halda, qazancın aşağı həddi B 1 strategiyası ilə üst-üstə düşür, B 2 strategiyası açıq şəkildə rəqib üçün sərfəli deyil.

Həndəsi şərh oyunun aşağı və yuxarı qiymətlərini də vizuallaşdırmağa imkan verir (Şəkil 4.5).

Təsvir üçün 1 və 2-ci misallarda nəzərdən keçirilən 2 × 2 oyunlarının həndəsi şərhlərini qururuq (Şəkil 4.6 və 4.7).

İstənilən 2 × 2 oyunun elementar fəndlərlə həll oluna biləcəyinə əmin olduq. İstənilən 2xn oyunu eyni şəkildə həll edilə bilər. burada bizim cəmi iki strategiyamız var və düşmənin özbaşına sayı var.

Tutaq ki, bizim iki strategiyamız var: А 1, А 2 və düşmənin - n strategiyası: В 1, В 2, ..., В n. ‖a ij ‖ matrisi verilmişdir; iki sətir və n sütundan ibarətdir. İki strategiya vəziyyətində olduğu kimi, problemə həndəsi şərh veririk; Düşmənin n strategiyası n düz xəttlə təmsil olunur (şək. 4.8). Qazanmanın aşağı sərhədini (sınıq xətti B 1 MNB 2) qururuq və onun üzərində maksimum ordinatı olan N nöqtəsini tapırıq. Bu nöqtə oyunun həllini verir (strategiya ) N nöqtəsinin ordinatı oyunun qiymətinə ν, absis isə A 2 strategiyasının p 2 tezliyinə bərabərdir.

Bu halda rəqibin optimal strategiyası iki “faydalı” strategiyanın qarışığından istifadə etməklə əldə edilir: N nöqtəsində kəsişən B 2 və B 4. Strategiya B 3 açıq-aydın gəlirsizdir və B 1 strategiyası SA optimal strategiyası üçün sərfəli deyil. *. Əgər A optimal strategiyasına sadiq qalırsa, B-nin “faydalı” strategiyalarından hansını istifadə etməsindən asılı olmayaraq, qazanc dəyişməyəcək, lakin B B 1 və ya B 3 strategiyalarına keçərsə, dəyişəcək. Oyun nəzəriyyəsində sübut edilmişdir ki, hər hansı sonlu oyun mxn-nin hər iki tərəfin “faydalı” strategiyalarının sayı iki ədəd m və n-dən ən azı çox olmayan bir həll var. Xüsusilə, bundan belə çıxır ki, 2xm oyununda həmişə hər iki tərəfdən ikidən çox "faydalı" strategiyanın iştirak etdiyi bir həll var.

Həndəsi şərhdən istifadə edərək, istənilən 2xm oyununu həll etmək üçün asan bir yol verə bilərsiniz. Birbaşa rəsmdən biz N nöqtəsində kəsişən düşmən B j və B k cütünün "faydalı" strategiyalarını tapırıq (əgər ikidən çox strategiya N nöqtəsində kəsişirsə, onlardan hər hansı ikisini götürürük). Biz bilirik ki, əgər A oyunçusu optimal strategiyasına əməl edərsə, onda qazanc onun B-ni “faydalı” strategiyalarına tətbiq etdiyi nisbətdən asılı deyildir.

Bu tənliklərdən və p 2 = 1 - p 1 şərtindən p1, p2 və oyunun ν qiymətini tapırıq. Oyunun qiymətini bilməklə, siz dərhal optimal strategiyanı təyin edə bilərsiniz oyunçu B. Bunun üçün, məsələn, tənlik həll edilir: qja 1 j + qka 1 k = ν, burada qj + qk = 1. Bizim m strategiyamız olduqda və düşmənin yalnız ikisi olduğu halda, açıq-aydın, problem tamamilə oxşar şəkildə həll edilir; Qeyd etmək kifayətdir ki, qalibiyyət işarəsini əksinə dəyişdirməklə A oyunçusunu “qazanmaqdan” “uduzmağa” çevirmək olar. Siz qalib işarəsini dəyişmədən oyunu həll edə bilərsiniz; onda problem birbaşa B üçün həll edilir, lakin aşağı deyil, yuxarı nəticə qurulur (şək. 4.9). Sərhəddə minimum ordinata malik N nöqtəsi axtarılır ki, bu da oyunun ν qiymətidir.

Praktiki dəyəri olan oyunların sadələşdirilmiş nümunələri olan 2 × 2 və 2xm oyunlarının bir neçə nümunəsini nəzərdən keçirək və həll edək.

Misal 3. A tərəfi düşmən B bölgəsinə iki bombardmançı göndərir III; Iönündə uçur, II- arxada. Bombardmançılardan biri - hansının bomba daşımalı olduğu əvvəlcədən məlum deyil, digəri müşayiətçi kimi çıxış edir. Düşmən bölgəsində bombardmançı təyyarələrə B tərəfinin qırıcısı hücum edir.Bombardmançılar müxtəlif atəş dərəcələrində toplarla silahlanıblar. Qırıcı arxa bombardmançıya hücum edərsə II, onda ancaq bu bombardmançının topları ona atəş açır; ön bombardmançıya hücum edərsə, deməli hər iki bombardmançının toplarından ona atəş açılır. Birinci halda döyüşçünün vurulma ehtimalı 0,3, ikinci halda isə 0,7-dir.

Əgər qırıcı müdafiə bombardmanı atəşi ilə vurulmayıbsa, o zaman seçdiyi hədəfi 0,6 ehtimalla vurur. Bombardmançıların vəzifəsi bombanı hədəfə aparmaqdır; döyüşçünün vəzifəsi bunun qarşısını almaqdır, yəni. bombardmançı təyyarəni vurmaq. Tərəflərin optimal strategiyalarını seçmək tələb olunur:

a) A tərəfi üçün: daşıyıcı kimi hansı bombardmançıdan istifadə edilməlidir?

b) B tərəfi üçün: hansı bombardmançı hücuma keçməlidir?

Həll. Bizdə 2 × 2 oyununun sadə bir işi var; qazanma ehtimalı daşıyıcının məğlub olmaması. Strategiyalarımız: A 1 - daşıyıcı - bombardmançı I; 2 - daşıyıcı - bombardmançı II... Düşmən strategiyaları: B 1 - bombardmançı hücuma məruz qalır I; B 2 - bombardmançı hücumlar II... Oyun matrisini tərtib edək, yəni. strategiyaların hər bir kombinasiyası üçün orta gəliri tapın.

1.A 1 B 1 (daşıyıcı I, hücuma məruz qalır I). Bombardmançılar qırıcını vursalar və ya vurmasalar, daşıyıcı vurulmayacaq, lakin hədəfinə çatmayacaq: a 11 = 0,7 + 0,3 * 0,4 = 0,82.

2.A 2 B 1 (daşıyıcı II, hücuma məruz qalır I). a 21 = 1

3.A 1 B 2 (daşıyıcı I, hücuma məruz qalır II). A 12 = 1

4.A 2 B 2 (daşıyıcı II, hücuma məruz qalır II). A 22 = 0,3 + 0,7 * 0,4 = 0,58

Oyun matrisinin forması var:

Oyunun aşağı qiyməti 0,82; ən yüksək qiymət 1. Matrisin yəhər nöqtəsi yoxdur; qarışıq strategiyalar sahəsində həll axtarırıq. Bizdə:

p 1 * 0,82 + p 2 * 1 = ν

p 1 * 1 + p 2 * 0,58 = ν

p 1 = 0,7; p 2 = 0,3

Bizim optimal strategiyamız yəni daşıyıcı olaraq daha tez-tez seçməlisiniz I, Necə II... Oyunun qiyməti ν = 0,874-dür. ν-i bilərək, biz q 1 və q 2 - rəqibin S B * optimal strategiyasında B 1 və B 2 strategiyalarının tezliklərini təyin edirik. Bizdə: q 1 * 0,82 + q 2 * 1 = 0,874 və q 2 = 1 - q 1, buradan q 1 = 0,7; q 2 = 0,3, yəni rəqibin optimal strategiyasıdır .

Misal 4. A tərəfi obyektə hücum edir, B tərəfi onu müdafiə edir. A tərəfində iki təyyarə var; B tərəfində üç zenit silahı var. Hər bir təyyarə güclü dağıdıcı silah daşıyır; obyektin vurulması üçün ona ən azı bir təyyarənin keçməsi kifayətdir. Yan tərəf Təyyarə obyektə yaxınlaşmaq üçün üç istiqamətdən hər hansı birini seçə bilər: I, II, III(şək. 4.10). Düşmən (B tərəfi) öz silahlarından hər hansı birini istənilən istiqamətə yerləşdirə bilər; bu halda, hər bir silah yalnız əlaqəli kosmos sahəsini vurur bu istiqamət, və qonşu istiqamətləri vurmur. Hər bir silah yalnız bir təyyarəyə atəş edə bilər; atəşə tutulan təyyarə 1 ehtimalı ilə vurulur. A tərəfi silahların harada olduğunu bilmir; B tərəfi təyyarələrin haradan gələcəyini bilmir. A tərəfinin vəzifəsi obyekti vurmaqdır; B tərəfinin vəzifəsi onun məğlubiyyətinin qarşısını almaqdır. Oyun üçün bir həll tapın.

Həll. Oyun 2 × 3 oyunudur. Ödəniş obyektə dəymə ehtimalıdır. Mümkün strategiyalarımız bunlardır: A 1 - iki fərqli istiqamətə bir təyyarə göndərin. Və 2 - hər iki təyyarəni eyni istiqamətə göndərin. Düşmən strategiyaları: B 1 - hər istiqamətə bir silah qoyun; 2-də - iki silahı bir istiqamətə, birini isə digərinə qoyun; 3-də - hər üç silahı eyni istiqamətə qoyun. Oyunun matrisini tərtib edirik.

1.A 1 B 1 (təyyarələr boyunca uçur müxtəlif istiqamətlər; silahlar bir-bir yerləşdirilir). Aydındır ki, bu halda obyektə heç bir təyyarə keçməyəcək: a 11 = 0.

2. А 2 В 1 (təyyarələr eyni istiqamətdə uçur; silahlar bir-bir yerləşdirilir). Aydındır ki, bu halda bir təyyarə atəş etmədən obyektə keçəcək: a 21 = 1.

3. А 1 В 2 (təyyarələr bir-bir uçur; düşmən iki istiqaməti müdafiə edir, üçüncüsü isə müdafiəsiz qoyur). Ən azı bir təyyarənin cismə keçməsi ehtimalı onlardan birinin qorunmayan istiqamət seçməsi ehtimalına bərabərdir: a 12 = 2/3.

4. А 2 В 2 (təyyarələr bir istiqamətdə uçur; düşmən bir istiqaməti iki, birini isə bir silahla müdafiə edir, yəni faktiki olaraq bir istiqaməti müdafiə edir və ikisini müdafiəsiz qoyur). Ən azı bir təyyarənin obyektə keçməsi ehtimalı bir cüt təyyarənin həqiqətən qorunmayan istiqaməti seçmə ehtimalına bərabərdir: a 22 = 2/3.

5. A 1 B 3 (təyyarələr bir-bir uçur; düşmən üç silahla yalnız bir istiqaməti müdafiə edir): a 13 = 1.

6. А 2 В 3 (hər iki təyyarə birlikdə uçur; düşmən üç silahla yalnız bir istiqaməti müdafiə edir). Vurulan obyekt üçün təyyarə qorunmayan istiqamət seçməlidir: a 23 = 2/3.

Oyun Matrisi:

Matris göstərir ki, V 3 strategiyası V 2 ilə müqayisədə açıq şəkildə əlverişsizdir (bunu əvvəlcədən həll etmək olardı). Vuruş strategiyası 3-də oyun 2 × 2 oyuna endirilir:

Matrisdə yəhər nöqtəsi var: oyunun aşağı qiyməti 2/3 üst qiymətlə üst-üstə düşür. Eyni zamanda qeyd edirik ki, bizim üçün (A) A 1 strategiyası açıq-aydın gəlirsizdir. Nəticə: A və B tərəflərinin hər ikisi həmişə öz təmiz A 2 və B 2 strategiyalarından istifadə etməlidirlər, yəni. cütün göndərildiyi istiqaməti təsadüfi seçərək təyyarələri 2-yə göndərməliyik; düşmən silahlarını bu şəkildə yerləşdirməlidir: iki - bir istiqamətdə, biri - digər tərəfə və bu istiqamətlərin seçimi də təsadüfi aparılmalıdır (burada, gördüyümüz kimi, artıq "saf strategiyalar" bir element daxildir. şans). Bu optimal strategiyaları tətbiq etməklə biz həmişə 2/3 sabit orta gəlir əldə edəcəyik (yəni obyekt 2/3 ehtimalla vurulacaq). Qeyd edək ki, oyunun tapılan həlli yeganə deyil; qərarından başqa təmiz strategiyalar, p 1 = 0-dan p 1 = 1/3-ə qədər optimal olan A oyunçusunun qarışıq strategiyalarının bütöv bir bölməsi var (şək. 4.11).

Məsələn, A1 və A2 strategiyalarımızı 1/3 və 2/3 nisbətində tətbiq etsək, eyni orta gəlirin 2/3 nisbətində əldə ediləcəyini birbaşa görmək asandır.

Misal 5.Şərtlər əvvəlki nümunədəki kimidir, lakin bizim üçün dörd hücum istiqaməti mümkündür və düşmənin dörd silahı var.

Həll. Hələ iki mümkün strategiyamız var: A 1 - təyyarələri bir-bir göndərin, A 2 - iki təyyarəni birlikdə göndərin. Düşmənin beş mümkün strategiyası var: B 1 - hər istiqamətə bir silah qoyun; B 2 - iki silahı iki fərqli istiqamətə qoyun; 3-də - iki silahı bir istiqamətə, birini isə digər ikisinə qoyun; 4-də üç silahı bir istiqamətə, birini isə digərinə qoyun; 5-də - dörd silahın hamısını eyni istiqamətə qoyun. B 4, B 5 strategiyaları açıq-aşkar faydasız olduğu üçün əvvəlcədən ləğv ediləcək. Əvvəlki nümunəyə bənzər şəkildə düşünərək, oyun matrisini qururuq:

Aşağı oyun qiyməti 1/2, yuxarısı 3/4-dür. Matrisdə yəhər nöqtəsi yoxdur; həll qarışıq strategiyalar sahəsindədir. Həndəsi şərhdən istifadə edərək (Şəkil 4.12) düşmənin "faydalı" strategiyalarını ayırırıq: B 1 və B 2.

P 1 və p 2 tezlikləri tənliklərdən müəyyən edilir: p 1 * 0 + (1 - p 1) * 1 = ν və p 1 * 5/6 + (1 - p 1) * 1/2 = ν; buradan p 1 = 3/8; p 2 = 5/8; ν = 5/8, yəni. optimal strategiyamızdır ... Ondan istifadə edərək, özümüzə 5/8 nisbətində orta uduşlara zəmanət veririk. Oyunun qiymətini ν = 5/8 bilərək, rəqibin “faydalı” strategiyalarının q 1 və q 2 tezliklərini tapırıq: q 1 * 0 + (1 - q 1) * 5/6 = 5/8, q 1 = ¼, q 2 = ¾. Düşmənin optimal strategiyası: .

Misal 6. A tərəfində iki A 1 və A 2 strategiyası var, B tərəfində dörd B 1, B 2, B 3 və B 4 var. Oyun matrisinin forması var:

Oyun üçün bir həll tapın.

Həll. Aşağı oyun qiyməti 3; yuxarı 4. Həndəsi şərh (şək. 4.13) göstərir ki, B 1 və B 2 və ya B 2 və B 4 faydalı strategiyalardır:

Oyunçu A sonsuz sayda optimal qarışıq strategiyaya malikdir: optimal strategiyada p 1 1/5 ilə 4/5 arasında dəyişə bilər. Oyunun qiyməti ν = 4. Oyunçu B xalis optimal B 2 strategiyasına malikdir.

§ 5. Sonlu oyunların həllinin ümumi üsulları

İndiyə qədər biz çox asanlıqla həll edilə bilən və rahat və intuitiv həndəsi şərhə imkan verən 2xn tipli ən elementar oyunları nəzərdən keçirdik. Ümumi halda mxn oyununun həlli kifayət qədər çətin məsələdir və məsələnin mürəkkəbliyi və onun həlli üçün tələb olunan hesablamaların miqdarı m və n-in artması ilə kəskin şəkildə artır. Bununla belə, bu çətinliklər fundamental xarakter daşımır və yalnız bəzi hallarda praktiki olaraq mümkün olmayan çox böyük həcmli hesablamalarla əlaqələndirilir. Həll tapmaq metodunun əsas cəhəti istənilən m üçün eyni qalır.

Bunu 3xn oyununun nümunəsi ilə izah edək. Gəlin ona həndəsi bir şərh verək - artıq məkandır. Üç strategiyamız A 1, A 2 və A 3 təyyarədə üç nöqtə ilə təsvir olunacaq hoy; birincisi koordinatların başlanğıcında yerləşir (Şəkil 5.1), ikinci və üçüncü - oxlarda OhOUəvvəldən 1 məsafədə.

Baltalar A 1, A 2 və A 3 nöqtələri vasitəsilə çəkilir II, IIIIIIIIII müstəviyə perpendikulyar hoy... Oxda II qazanclar oxlarda A 1 strategiyası ilə yatırılır IIIIIIIIII- A 2, A 3 strategiyaları ilə uduşlar. Düşmən B j-nin hər bir strategiyası baltalar üzərində kəsilən bir təyyarə ilə təsvir edilmişdir II, IIIIIIIIII müvafiq A 1, A 2 və A 3 strategiyaları və B j strategiyası üçün ödənişlərə bərabər seqmentlər. Beləliklə, düşmənin bütün strategiyalarını quraraq, A 1, A 2 və A 3 üçbucağının üzərindən bir təyyarə ailəsi alırıq (şək. 5.2). Bu ailə üçün siz həmçinin 2xn vəziyyətində etdiyimiz kimi daha aşağı ödəniş sərhədi qura bilərsiniz və bu sərhəd nöqtəsində təyyarənin üzərində maksimum hündürlüyə malik N nöqtəsini tapa bilərsiniz. hoy... Bu hündürlük oyunun qiyməti olacaq ν.

SA * optimal strategiyasında A 1, A 2 və A 3 strategiyalarının p 1, p 2, p 3 tezlikləri N nöqtəsinin koordinatları (x, y) ilə müəyyən ediləcək, yəni: p 2 = x, p 3 = y, p 1 = 1 - p 2 - p 3. Bununla belə, belə bir həndəsi konstruksiya, hətta 3xn işi üçün belə, həyata keçirmək asan deyil və çox vaxt və təxəyyül səylərini tələb edir. Oyunun ümumi vəziyyətində o, m-ölçülü fəzaya köçürülür və bütün aydınlığını itirir, baxmayaraq ki, bir sıra hallarda həndəsi terminologiyanın istifadəsi faydalı ola bilər. Mxn oyunlarını həll edərkən praktikada həndəsi analogiyalardan deyil, hesablama analitik metodlarından istifadə etmək daha rahatdır, xüsusən də bu üsullar kompüterlərdə problemin həlli üçün uyğun olan yeganə üsuldur.

Bütün bu üsullar mahiyyət etibarı ilə problemi ardıcıl sınaqlarla həll etməyə imkan verir, lakin sınaqların ardıcıllığını sifariş etmək ən qənaətcil şəkildə həllə aparan alqoritm qurmağa imkan verir. Burada mxn oyunlarının həlli üçün bir hesablama metodu - sözdə "xətti proqramlaşdırma" metodu üzərində qısaca dayanacağıq. Bunun üçün əvvəlcə mxn oyununun həllini tapmaq probleminin ümumi açıqlamasını veririk. m A 1, A 2,…, A m strategiyası və B oyunçusunun n strategiyası B 1, B 2,…, B n strategiyası olan mxn oyunu verilsin və ‖a i j gəlir matrisi verilsin. Oyunun həllini tapmaq tələb olunur, yəni. A və B oyunçularının iki optimal qarışıq strategiyası

burada p 1 + p 2 + ... + p m = 1; q 1 + q 2 +… + q n = 1 (p i və q j ədədlərinin bəziləri sıfıra bərabər ola bilər).

Optimal strategiyamız S A * bizə rəqibin hər hansı davranışı üçün ν-dən az olmayan, onun optimal davranışı üçün isə ν-ə bərabər gəlir təmin etməlidir (strategiya S B *). Eynilə, S B * strategiyası rəqibi heç bir davranışımız üçün ν-dən çox olmayan və optimal davranışımız üçün ν-ə bərabər olan itki ilə təmin etməlidir (strategiya S A *).

Bu halda oyunun qiymətinin dəyəri ν bizə məlum deyil; bəzilərinə bərabər olduğunu fərz edəcəyik müsbət rəqəm... Buna inanaraq, biz əsaslandırmanın ümumiliyini pozmuruq; ν> 0 üçün ‖a i j ‖ matrisinin bütün elementlərinin qeyri-mənfi olması açıq-aydın kifayətdir. Buna həmişə ‖a i j ‖ elementlərinə kifayət qədər böyük müsbət qiymət əlavə etməklə nail olmaq olar. L; isə oyunun qiyməti artacaq L və qərar dəyişməyəcək.

Tutaq ki, biz optimal strategiyamızı S A * seçmişik. O zaman düşmənin B j strategiyası ilə orta qazancımız belə olacaq: a j = p 1 a 1j + p 2 a 2j +… + p m a mj. Optimal strategiyamız S A * düşmənin hər hansı davranışı üçün ν-dən az olmayan bir qazanc təmin edən xüsusiyyətə malikdir; buna görə də a j ədədlərindən hər hansı biri ν-dən kiçik ola bilməz. Bir sıra şərtlər alırıq:

(5.1) bərabərsizlikləri müsbət qiymət ν ilə bölürük və işarə edirik

Sonra (5.1) şərtləri formada yazmaq olar

burada ξ 1, ξ 2,…, ξ m mənfi olmayan ədədlərdir. р 1 + p 2 +… + p m = 1 olduğundan, ξ 1, ξ 2,…, ξ m kəmiyyətləri şərti ödəyir.

(5.3) ξ 1 + ξ 2 +… + ξ m = 1 / ν.

Biz mümkün qədər zəmanətli uduşlarımızı etmək istəyirik; aydındır, eyni zamanda sağ hissə bərabərlik (5.3) minimum qiymət alır. Beləliklə, oyunun həllini tapmaq problemi aşağıdakı riyazi məsələyə endirilir: ξ 1, ξ 2,…, ξ m şərtlərini ödəyən qeyri-mənfi dəyərləri (5.2) müəyyən edin ki, onların cəmi Φ = ξ 1 olsun. + ξ 2 +… + ξ m minimal idi.

Adətən, ekstremal dəyərlərin (maksima və minimum) tapılması ilə bağlı problemləri həll edərkən funksiya diferensiallaşdırılır və törəmələr sıfıra bərabər tutulur. Ancaq bu vəziyyətdə belə bir texnika faydasızdır, çünki minimuma endirilməsi lazım olan Φ funksiyası xəttidir və bütün arqumentlərə münasibətdə onun törəmələri birliyə bərabərdir, yəni. heç yerdə yoxa çıxmasın. Nəticə etibarilə, funksiyanın maksimumuna arqumentlərin və şərtlərin qeyri-mənfilik tələbi ilə müəyyən edilən arqumentlərin dəyişmə diapazonunun hüdudunda haradasa çatılır (5.2). Fərqləndirmə yolu ilə ekstremal dəyərləri tapmaq üsulu, məsələn, oyunun həlli zamanı etdiyimiz kimi, oyunun həlli üçün aşağı (və ya minimum yuxarı) ödəmə həddinin maksimumu müəyyən edildiyi hallarda uyğun deyil. 2xn oyunlar. Həqiqətən də, aşağı sərhəd düz xətlərin kəsiklərindən ibarətdir və maksimuma törəmənin sıfır olduğu nöqtədə deyil (belə nöqtə ümumiyyətlə yoxdur), intervalın sərhəddində və ya nöqtəsində çatılır. düz hissələrin kəsişməsi.

Təcrübədə kifayət qədər tez-tez rast gəlinən belə məsələləri həll etmək üçün riyaziyyatda xüsusi xətti proqramlaşdırma aparatı hazırlanmışdır. Xətti proqramlaşdırma problemi aşağıdakı kimi qoyulur. Xətti tənliklər sistemi verilmişdir:

ξ 1, ξ 2,…, ξ m şərtləri ödəyən (5.4) və eyni zamanda ξ 1, ξ 2,…, ξ kəmiyyətlərin verilmiş homojen xətti funksiyasını minimuma endirməklə kəmiyyətlərin qeyri-mənfi qiymətlərini tapmaq tələb olunur. m (xətti forma): Φ = c 1 ξ 1 + c 2 ξ 2 +… + sm ξ m

Oyun nəzəriyyəsinin yuxarıdakı probleminin c 1 = c 2 = ... = sm = 1 üçün xətti proqramlaşdırma probleminin xüsusi halı olduğunu yoxlamaq asandır. İlk baxışdan belə görünə bilər ki, şərtlər (5.2) uyğun deyil. (5.4) şərtlərinə ekvivalentdir, çünki bərabər işarələrin əvəzinə bərabərsizlik işarələrini ehtiva edir. Bununla belə, yeni uydurma qeyri-mənfi dəyişənlər z 1, z 2,…, z n və (5.2) formada yazmaqla bərabərsizlik işarələrindən xilas olmaq asandır:

Minimum səviyyəyə endirilməsi lazım olan Φ forması Φ = ξ 1 + ξ 2 +… + ξ m-dir. Xətti proqramlaşdırma aparatı nisbətən az sayda ardıcıl nümunələr vasitəsilə qeyd olunan tələblərə cavab verən ξ 1, ξ 2,…, ξ m dəyərlərini seçməyə imkan verir. Daha aydınlıq üçün burada biz bu cihazın istifadəsini birbaşa konkret oyunların həlli materialında nümayiş etdirəcəyik.

Misal 1. Misal 2 § 1-də verilmiş 3 × 3 oyununa matrislə həll tapmaq tələb olunur:

Bütün ij-i mənfi olmayan etmək üçün L = 5 matrisinin bütün elementlərinə əlavə edirik. Matrisi alırıq:

Bu halda oyunun qiyməti 5 artacaq və qərar dəyişməyəcək.

Optimal strategiya S A * müəyyən edək. Şərtlər (5.2) formaya malikdir:

burada ξ 1 = p 1 / ν, ξ 2 = p 2 / ν, ξ 3 = p 3 / ν. Bərabərsizlik işarələrindən xilas olmaq üçün z 1, z 2, z 3 dummy dəyişənlərini təqdim edirik; (5.6) şərtləri aşağıdakı formada yazılır:

Xətti Φ formasının forması var: Φ = ξ 1 + ξ 2 + ξ 3 və mümkün qədər kiçik olmalıdır. Əgər hər üç B strategiyası “faydalıdır”sa, onda hər üç dummy dəyişən z 1, z 2, z 3 yox olur (yəni, hər bir strategiya B j üçün oyun qiymətinə ν bərabər olan gəlir əldə ediləcək). Amma hələ də hər üç strategiyanın “faydalı” olduğunu söyləməyə əsasımız yoxdur. Bunu yoxlamaq üçün Φ formasını z 1, z 2, z 3 dummy dəyişənləri ilə ifadə etməyə çalışacağıq və onların sıfıra bərabər olduğunu fərz etsək, formanın minimumunu əldə edə bildiyimizi görəcəyik. Bunun üçün ξ 1, ξ 2, ξ 3 dəyişənlərinə münasibətdə (5.7) tənlikləri həll edirik (yəni ξ 1, ξ 2, ξ 3-ü z 1, z 2, z 3 dummy dəyişənləri ilə ifadə edirik) :

ξ 1, ξ 2, ξ 3 əlavə edərək, alırıq: Φ = 1/5 + z 1/20 + z 2/10 + z 3/20. Burada bütün z üçün əmsallar müsbətdir; deməli, z 1, z 2, z 3-ün sıfırdan yuxarı istənilən artımı yalnız Φ formasının artmasına səbəb ola bilər və biz onun minimal olmasını istəyirik. Buna görə də, Φ formasını minimuma endirən z 1, z 2, z 3 qiymətləri z 1 = z 2 = z 3 = 0-dır. Buna görə də, Φ formasının minimum qiyməti: 1 / ν = 1-dir. /5, oyunun qiyməti haradan ν = 5. (5.8) düsturlarında z 1, z 2, z 3 sıfır dəyərlərini əvəz edərək, tapırıq: ξ 1 = 1/20, ξ 2 = 1/10, ξ 3 = 1/20 və ya onları ν-ə vuraraq, p 1 = 1/4, p 2 = 1/2, p 3 = 1/4. Beləliklə, optimal A strategiyası tapıldı: , yəni. bütün halların dörddə birində 1 rəqəmini, halların yarısında 2, qalan dörddə birində isə 3 rəqəmini yazmalıyıq.

Oyunun qiymətini ν = 5 bilərək, rəqibin optimal strategiyasını tapmaq üçün artıq məlum olan üsullardan istifadə edə bilərik. ... Bunu etmək üçün hər hansı iki "faydalı" strategiyamızdan (məsələn, A 2 və A 3) istifadə edəcəyik və tənlikləri yazacağıq:

9q 1 + 11 (1-q 2 -q 1) = 5,

buradan q 1 = q3 = 1/4; q 2 = 1/2. Düşmənin optimal strategiyası bizimlə eyni olacaq: ... İndi orijinal (çevrilməmiş) oyuna qayıdaq. Bunun üçün sadəcə oyunun qiymətindən matrisin elementlərinə əlavə olunan L = 5 dəyərini ν = 5 çıxarmaq lazımdır. Biz orijinal oyunun qiymətini alırıq v 0 = 0. Buna görə də, hər iki tərəfin optimal strategiyaları sıfıra bərabər orta gəlir təmin edir; oyun hər iki tərəf üçün eyni dərəcədə faydalı və ya zərərlidir.

Misal 2. A idman klubunun A 1, A 2 və A 3 komandasının tərkibi üçün üç variantı var. Club B - həmçinin üç variantda B 1, B 2 və B 3. Yarışda iştirak etmək üçün müraciət edəndə heç bir klub rəqibin hansı heyəti seçəcəyini bilmir. Keçmiş görüşlərin təcrübəsindən təqribən məlum olan komandaların heyətlərinin müxtəlif variantları üzrə A klubunun qalib gəlmə ehtimalları matrislə verilmişdir:

Ən yüksək orta qələbə sayına nail olmaq üçün klubların hər bir heyəti bir-birinə qarşı nə qədər tez-tez oynamalı olduğunu öyrənin.

Həll. Oyunun aşağı qiyməti 0,4; yuxarı 0,6; qarışıq strategiyalar sahəsində həll axtarırıq. Kəsrlərlə məşğul olmamaq üçün matrisin bütün elementlərini 10-a vururuq; bu halda oyunun qiyməti 10 dəfə artacaq və qərar dəyişməyəcək. Matrisi alırıq:

Şərtlər (5.5) formaya malikdir:

və minimum şərt Φ = ξ 1 + ξ 2 + ξ 3 = min.

Rəqibin hər üç strategiyasının “faydalı” olub olmadığını yoxlayın. Bir fərziyyə olaraq əvvəlcə z 1, z 2, z 3 dummy dəyişənlərinin sıfıra bərabər olduğunu fərz edirik və yoxlama üçün ξ 1, ξ 2, ξ 3 üçün (5.10) tənliklərini həll edirik:

(5.12) 136Φ = 30 + 13z 1 + 18z 2 - 51z 3

Formula (5.12) göstərir ki, z 1 və z 2 dəyişənlərinin onların qəbul edilən sıfır dəyəri ilə müqayisədə artması yalnız Φ-ni artıra bilər, z 3-ün artması isə Φ-ni azalda bilər. Bununla belə, z 3-də artım diqqətlə aparılmalıdır ki, z 3-dən asılı olaraq ξ 1, ξ 2, ξ 3 dəyərləri bu halda mənfi olmasın. Buna görə də, bərabərliklərin sağ tərəflərində (5.11) z 1 və z 2 dəyərlərini sıfıra bərabər qoyuruq və z 3 dəyərini icazə verilən hədlərə qədər artıracağıq (ξ dəyərlərindən hər hansı birinə qədər) 1, ξ 2, ξ 3 yox olur). İkinci bərabərlikdən (5.11) görünür ki, z 3 artımı ξ 2 dəyəri üçün "təhlükəsiz"dir - yalnız bundan artır. ξ 1 və ξ 3 dəyərlərinə gəldikdə, burada z 3-də artım yalnız müəyyən bir həddə qədər mümkündür. ξ 1 kəmiyyəti z 3 = 10/23-də yox olur; ξ 3 kəmiyyəti daha əvvəl yox olur, artıq z 3 = 1/4-də. Buna görə də, z 3-ə maksimum icazə verilən dəyəri z 3 = 1/4 verərək, bu halda ξ 3-ün qiymətini sıfırlayacağıq.

Φ formasının z 1 = 0, z 2 = 0, ξ 3 = 0 olduqda minimuma çevrilib-olmamasını yoxlamaq üçün biz qalan (sıfırdan fərqli) dəyişənləri guya sıfır z 1, z 2, ξ 3 ifadəsində ifadə edirik. ξ 1, ξ 2 və z 3 ilə bağlı (5.10) tənliklərini həll edərək əldə edirik:

(5.13) 32Φ = 7 + Зz 1 + 4z 2 + ξ 3

(5.13) düsturundan görünə bilər ki, z 1, z 2, ξ 3-də onların qəbul edilmiş sıfır dəyərlərindən artıq hər hansı bir artım yalnız Φ formasını artıra bilər. Beləliklə, oyunun həlli tapıldı; z 1 = z 2 = ξ 3 = 0 qiymətləri ilə müəyyən edilir, buradan ξ 1 = 1/32, ξ 2 = 3/16, z 3 = 1/4. (5.13) düsturu ilə əvəz edərək, oyunun qiymətini tapırıq ν: 32Φ = 7 = 32 / ν; ν = 32/7. Bizim optimal strategiyamız: ... "Faydalı" strategiyalar (A 1 və A 2 kompozisiyaları) 1/7 və 6/7 tezliklərində tətbiq edilməlidir; tərkibi A 3 - heç vaxt tətbiq olunmur.

Rəqibin optimal strategiyasını tapmaq üçün, ümumi halda, aşağıdakıları edə bilərsiniz: qazancın işarəsini əksinə dəyişdirin, matrisin elementlərinə qeyri-mənfi olması üçün sabit L dəyəri əlavə edin və həll edin. düşmən üçün problemi özümüz həll etdiyimiz kimi. Ancaq oyunun qiymətini artıq bilməyimiz ν problemi bir qədər asanlaşdırır. Üstəlik, bunda konkret hal Vəzifə daha da sadələşdirilir ki, rəqibin yalnız iki "faydalı" strategiyası, B 1 və B 2 həlldə iştirak edir, çünki z 3 dəyəri sıfıra bərabər deyil və buna görə də B 3 strategiyası ilə, oyunun qiymətinə çatmayıb. A oyunçusunun istənilən "faydalı" strategiyasını, məsələn, A 1 seçərək, q 1 və q 2 tezliklərini tapmaq olar. Bunun üçün 8q 1 + 2 (1 - q 1) = 32/7 tənliyini yazırıq, buradan q 1 = 3/7, q 2 = 4/7; düşmənin optimal strategiyası belə olacaq: , yəni. düşmən B 3 kompozisiyasından istifadə etməməli, B 1 və B2 kompozisiyaları isə 3/7 və 4/7 tezlikləri ilə istifadə edilməlidir.

Orijinal matrisə qayıdaraq, oyunun həqiqi dəyərini müəyyən edək ν 0 = 32/7: 10 = 0,457. Bu o deməkdir ki, üçün böyük rəqəm görüşlər A Klubu üçün qələbələrin sayı bütün görüşlərin 0,457-si olacaq.

§ 6. Oyunların həlli üçün təxmini üsullar

Çox vaxt praktiki məsələlərdə oyunun dəqiq həllini tapmağa ehtiyac yoxdur; oyunun qiymətinə yaxın orta gəlir verən təxmini həll tapmaq kifayətdir. ν oyununun dəyəri haqqında təxmini məlumatı matrisin sadə təhlilindən və oyunun aşağı (α) və yuxarı (β) qiymətlərinin müəyyən edilməsindən əldə etmək olar. α və β yaxındırsa, praktiki olaraq dəqiq həll axtarmağa ehtiyac yoxdur, lakin təmiz minimax strategiyalarını seçmək kifayətdir. α və β-nın yaxın olmadığı hallarda, oyunların həlli üçün ədədi üsullardan istifadə edərək praktik həll əldə etmək olar, buradan iterasiya metodunu qısaca vurğulayırıq.

İterasiya metodunun ideyası aşağıdakı kimidir. A və B rəqiblərinin bir-birlərinə qarşı strategiyalarından istifadə etdikləri "fikir təcrübəsi" oynanılır. Təcrübə hər birində verilmiş oyunun matrisinə malik elementar oyunlar ardıcıllığından ibarətdir. Bu onunla başlayır ki, biz (oyunçu A) özbaşına strategiyalarımızdan birini seçirik, məsələn, A i. Düşmən buna bizim üçün ən az sərfəli olan B j strategiyası ilə cavab verir, yəni. A i strategiyasının qazancını minimuma çevirir. Biz bu hərəkətə A k strategiyamızla cavab veririk ki, bu da rəqib B j strategiyasından istifadə etdikdə maksimum orta gəliri verir. Daha sonra - yenə düşmənin növbəsidir. O, bizim A i və A k cüt hərəkətlərimizə B j strategiyası ilə cavab verir ki, bu da bizə bu iki strategiya (A i, A k) üçün ən kiçik orta gəliri verir və s. İterativ prosesin hər bir addımında hər bir oyunçu digər oyunçunun hər hansı bir hərəkətinə əvvəlki bütün hərəkətlərinə nisbətən optimal olan strategiyası ilə cavab verir, bir növ qarışıq strategiya kimi qəbul edilir və burada xalis strategiyalar müəyyən nisbətlərə uyğun nisbətlərdə təqdim olunur. onların tətbiqi tezliyi.

Bu üsul, sanki, oyunçuların əsl praktiki “məşq” modelidir, o zaman ki, onların hər biri təcrübə ilə rəqibin davranışını yoxlayır və ona özünə sərfəli şəkildə cavab verməyə çalışır. Öyrənmə prosesinin bu təqlidi kifayət qədər uzun müddət davam edərsə, onda bir cüt hərəkətə (ibtidai oyun) orta qazanc oyunun qiymətinə meylli olacaq və tezliklər p 1 ... p m; Bu rallidə oyunçuların strategiyalarının qarşılaşdığı q 1 ... q n optimal strategiyaları müəyyən edən tezliklərə yaxınlaşacaq. Hesablamalar göstərir ki, metodun yaxınlaşması çox yavaşdır, lakin bu, yüksək sürətli hesablama maşınları üçün maneə deyil.

Əvvəlki bölmənin 2-ci Nümunəsində həll edilmiş 3 × 3 oyun nümunəsindən istifadə edərək, iterativ metodun tətbiqini təsvir edək. Oyun matrislə verilir:

Cədvəl 6.1 təkrarlama prosesinin ilk 18 addımını göstərir. Birinci sütunda elementar oyunun nömrəsi var (bir cüt hərəkət) n; ikincidə - nömrə i oyunçu A-nın seçilmiş strategiyası; növbəti üçlükdə - birinci üçün "yığılmış uduşlar" n B 1, B 2, B 3 düşmən strategiyaları ilə oyunlar. Bu dəyərlərin ən kiçiyi vurğulanır. Sonrakı nömrə gəlir j düşmənin seçdiyi strategiya və müvafiq olaraq üçün yığılmış qazanc n A 1, A 2, A 3 strategiyalı oyunlarda bu dəyərlərin maksimumu yuxarıdan vurğulanır. Vurğulanmış dəyərlər digər oyunçunun cavab strategiyasının seçimini müəyyənləşdirir. Aşağıdakı qrafiklər ardıcıl olaraq göstərir: minimum orta gəlir ν, minimum yığılmış qazancın oyunların sayına bölünməsinə bərabərdir. n; maksimum toplanmış uduşlara bərabər olan maksimum orta uduşlar bölünür n, və onların arifmetik ortası ν * = (ν +) / 2. Artan zaman n hər üç dəyər ν və ν * oyunun qiymətinə ν yaxınlaşacaq, lakin ν * dəyəri, təbii ki, ona nisbətən daha sürətli yaxınlaşacaq.

Cədvəl 6.1.

Nümunədən göründüyü kimi, iterasiyaların yaxınlaşması çox yavaşdır, lakin buna baxmayaraq, belə kiçik bir hesablama belə oyunun qiymətinin təxmini dəyərini tapmağa və "faydalı" strategiyaların yayılmasını aşkar etməyə imkan verir. Hesablama maşınlarından istifadə edərkən metodun dəyəri əhəmiyyətli dərəcədə artır. Oyunların həlli üçün iterativ metodun üstünlüyü ondan ibarətdir ki, strategiyaların sayı artdıqca hesablamaların həcmi və mürəkkəbliyi nisbətən zəif artır. mn.

§ 7. Bəzi sonsuz oyunların həlli üsulları

Sonsuz oyun, ən azı bir tərəfin sonsuz sayda strategiyaya sahib olduğu bir oyundur. Bu cür oyunları həll etmək üçün ümumi üsullar hələ kifayət qədər işlənməmişdir. Bununla belə, təcrübə üçün nisbətən sadə həlli qəbul edən bəzi xüsusi hallar maraq doğura bilər. Hər birində sonsuz (hesabsız) strategiyalar dəstinə malik olan iki rəqib A və B-nin oyununu nəzərdən keçirək; oyunçu A üçün bu strategiyalar uyğun gəlir müxtəlif mənalar davamlı dəyişən parametr X, və V üçün - parametr saat... Bu halda, ‖a ij matrisi əvəzinə oyun iki davamlı dəyişən arqumentin bəzi funksiyası ilə müəyyən edilir. a (x, y), biz bunu ödəmə funksiyası adlandıracağıq (qeyd edək ki, funksiyanın özü a (x, y) davamlı olması lazım deyil). Win funksiyası a (x, y) həndəsi şəkildə hansısa səthlə təmsil oluna bilər a (x, y) arqumentlərin dəyişdirilməsi sahəsi üzərində (x, y)(şək. 7.1)

Ödəniş funksiyasının təhlili a (x, y)ödəniş matrisinin təhlilinə bənzər şəkildə həyata keçirilir. Birincisi, oyunun aşağı qiyməti α tapılır; bunun üçün hər biri üçün müəyyən edilir X minimum funksiya a (x, y) hamı üçün saat:, sonra bu dəyərlərin maksimumu hamısı üçün axtarılır X(maksimum):

Üst oyun qiyməti (minimax) eyni şəkildə müəyyən edilir:

α = β olduqda vəziyyəti nəzərdən keçirək. Oyunun qiyməti ν həmişə α ilə β arasında olduğundan, onların ümumi dəyəri ν-dir. α = β bərabərliyi səthi ifadə edir a (x, y) yəhər nöqtəsi var, yəni koordinatları x 0, y 0 olan bir nöqtə var, burada a (x, y) eyni zamanda minimaldır saat və maksimum X(şək. 7.2).

Məna a (x, y) bu nöqtədə oyunun qiyməti ν: ν = a (x 0, y 0). Yəhər nöqtəsinin olması o deməkdir ki, bu sonsuz oyunun təmiz strategiya həlli var; x 0, y 0 optimal xalis strategiyaları A və B təmsil edir. Ümumi halda, α ≠ β olduqda, oyunun yalnız qarışıq strategiyalar sahəsində həlli ola bilər (bəlkə də yeganə deyil). Sonsuz oyunlar üçün qarışıq strategiya, strategiyalar üçün bəzi ehtimal paylanması var Xsaat təsadüfi dəyişənlər kimi qəbul edilir. Bu paylanma davamlı ola bilər və sıxlıqlarla müəyyən edilə bilər f 1 (X)f 2 (y); diskret ola bilər və sonra optimal strategiyalar bəzi sıfırdan fərqli ehtimallarla seçilmiş ayrı-ayrı xalis strategiyalar toplusundan ibarətdir.

Sonsuz oyunun yəhər nöqtəsi olmadığı halda, oyunun aşağı və yuxarı qiymətlərinin vizual həndəsi şərhi verilə bilər. Ödəniş funksiyası olan sonsuz bir oyunu nəzərdən keçirək a (x, y) və strategiyalar x, y xətt seqmentlərini davamlı olaraq doldurmaq (x 1, x 2)(y 1, y 2)... Oyunun α aşağı qiymətini müəyyən etmək üçün səthə "baxmaq" lazımdır a (x, y) oxdan saat, yəni. onu bir təyyarəyə proyeksiya edin xOa(şək. 7.3). Biz tərəflərdən x = x 1 və x = x 2 düz xətləri ilə və yuxarıdan və aşağıdan - KB və K N əyriləri ilə məhdudlaşan müəyyən bir rəqəm əldə edirik. Oyunun α aşağı qiyməti, açıq-aydın, maksimumdan başqa bir şey deyil. əyrisinin ordinatı K N.

Eynilə, β oyununun yuxarı qiymətini tapmaq üçün səthə “baxmaq” lazımdır a (x, y) oxdan X(layihə səthindən müstəviyə yaa) və yuxarı sərhəd K-nin minimum ordinatını proyeksiyada tapın (Şəkil, 7.4).

Sonsuz oyunların iki elementar nümunəsini nəzərdən keçirək.

Misal 1. A və B oyunçularının hər birinin saysız-hesabsız mümkün strategiyalar dəsti var Xsaat, və 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. a üçün ödəmə funksiyası a (x, y) - (x - y) 2 ifadəsi ilə verilir. Oyun üçün bir həll tapın.

Həlli, Səth a (x, y) parabolik silindrdir (Şəkil 7.5) və yəhər nöqtəsi yoxdur. Oyunun aşağı qiymətini müəyyənləşdirin; hamıya aydındır X; deməli = 0. Oyunun yuxarı qiymətini müəyyən edək. Bunu etmək üçün, biz sabit üçün tapa bilərsiniz saat

Bu halda, maksimum həmişə intervalın sərhəddində (x = 0 və ya x = 1-də) əldə edilir, yəni. y 2 dəyərlərinə bərabərdir; (1 - y) 2, daha böyükdür. Bu funksiyaların qrafiklərini çəkək (şək. 7.6), yəni. səthin proyeksiyası a (x, y) təyyarədə yaa... Şəkildəki qalın xətt. 7.6 funksiyanı göstərir. Aydındır ki, onun minimum dəyəri y = 1/2-də əldə edilir və 1/4-ə bərabərdir. Buna görə oyunun yuxarı qiyməti β = 1/4-dir. Bu halda oyunun yuxarı qiyməti ν oyunun qiyməti ilə üst-üstə düşür. Həqiqətən, A oyunçusu qarışıq strategiya S A = tətbiq edə bilər , x = 0 və x = 1 həddindən artıq dəyərləri eyni tezliklərə daxil edilir; onda B oyunçusunun istənilən strategiyası üçün A oyunçusunun orta qazancı bərabər olacaq: ½y 2 + ½ (1 - y) 2. Bu kəmiyyətin hər hansı bir dəyər üçün olduğunu yoxlamaq asandır saat 0 və 1 arasında ¼-dən az olmayan dəyər var: ½y 2 + ½ (1 - y) 2 ≥ ¼.

Beləliklə, bu qarışıq strategiyadan istifadə etməklə, oyunçu A özünə yuxarı oyun qiymətinə bərabər bir qazanc təmin edə bilər; çünki oyunun qiyməti yuxarı qiymətdən çox ola bilməz bu strategiya S A optimal: S A = S A *.

B oyunçusunun optimal strategiyasını tapmaq qalır. Aydındır ki, əgər ν oyununun qiyməti β oyununun yuxarı qiymətinə bərabərdirsə, B oyunçusunun optimal strategiyası həmişə onun xalis minimaks strategiyası olacaqdır ki, bu da ona möcüzəni təmin edir. oyunun yuxarı qiyməti. Bu halda belə bir strategiya y 0 = ½-dir. Həqiqətən də, bu strategiya ilə A oyunçusu nə edirsə etsin, onun qazancı ¼-dən çox olmayacaq. Bu, aşkar bərabərsizlikdən (x - ½) 2 = x (x –1) + ¼ ≤ ¼ gəlir.

Misal 2. A tərəfi ("biz") düşmənin B təyyarəsinə atəş açır. Atəşdən yayınmaq üçün düşmən bir qədər yüklənmə ilə manevr edə bilər saat, öz mülahizəsinə görə dəyərləri əlavə edə bilər saat= 0 (düz hərəkət) üçün saat = saatmaks(maksimum əyrilik dairəsində uçuş). güman edirik saatmaksölçü vahidi, yəni. qoy saatmaks= 1. Düşmənlə mübarizədə mərminin uçuşu zamanı hədəfin hərəkəti ilə bağlı bu və ya digər fərziyyələrə əsaslanan nişangahlardan istifadə edə bilərik. Həddindən artıq yükləmə X bu hipotetik manevrdə onun 0-dan 1-ə qədər istənilən qiymətə bərabər olduğunu qəbul etmək olar. Bizim vəzifəmiz düşməni vurmaqdır; düşmənin vəzifəsi təsirsiz qalmaqdır. Verilənlər şansı vurdu Xsaat təqribən düsturla ifadə olunur: a (x, y) = , harada saat- düşmən tərəfindən istifadə edilən həddindən artıq yük; x - görmədə nəzərə alınan həddindən artıq yük. Hər iki tərəfin optimal strategiyalarını müəyyən etmək tələb olunur.

Həll. Aydındır ki, p = 1 təyin etsək, oyunun həlli dəyişmir. Ödəniş funksiyası a (x, y)Şəkildə göstərilən səthlə təsvir edilmişdir. 7.7.

Bu silindrik bir səthdir, generatrisi koordinat bucağının bissektrisasına paraleldir. hoy, və generatrisə perpendikulyar olan bir müstəvi ilə kəsişmə normal paylanma əyrisi növünün əyrisidir. Yuxarıda təklif olunan oyunun aşağı və yuxarı qiymətlərinin həndəsi şərhindən istifadə edərək, β = 1 (Şəkil 7.8) və (Şəkil 7.9) tapırıq. Oyunun yəhər nöqtəsi yoxdur; həlli qarışıq strategiyalar sahəsində axtarmaq lazımdır. Problem əvvəlki nümunədəki problemə bir qədər bənzəyir. Həqiqətən, kiçik dəyərlər üçün k funksiya funksiya kimi davranır - (x - y) 2, və əvvəlki nümunənin həllində A və B oyunçularının rolları dəyişdirilərsə, oyunun həlli alınacaq; olanlar. bizim optimal strategiyamız xalis strategiya x = 1/2 olacaq və düşmən SB = optimal strategiyası y = 0 və y = 1 ekstremal strategiyalarını eyni tezliklərdə tətbiq etmək olacaq.Bu o deməkdir ki, bütün hallarda biz x = 1/2 həddindən artıq yükləmə üçün nəzərdə tutulmuş çarpazdan istifadə edin və düşmən bütün halların yarısında heç bir manevrdən istifadə etməməlidir və yarısında - maksimum mümkün manevr.

düyü. 7.8 Şek. 7.9.

Bu həllin k ≤ 2 dəyərləri üçün etibarlı olacağını sübut etmək asandır. Həqiqətən də, rəqibin strategiyası üçün orta gəlir S B = və bizim strategiyamız üçün X funksiyası ilə ifadə edilir , k ≤ 2 dəyərləri üçün x = 1/2-də bir maksimuma malikdir, bu da oyunun α aşağı qiymətinə bərabərdir. Nəticə etibarilə, S B strategiyasının tətbiqi rəqibə α-dan çox olmayan itkiyə zəmanət verir, buradan aydın olur ki, α - oyunun aşağı qiyməti - oyunun qiyməti ν-dir.

k> 2 üçün a (x) funksiyası x 0 və 1 - x 0 nöqtələrində x = 1/2-yə nisbətən simmetrik olaraq yerləşən iki maksimuma malikdir (şək. 7.10) və x 0-ın qiyməti k-dən asılıdır. .

Aydındır ki, üçün k= 2 x 0 = 1 - x 0 = ½; artdıqda k x 0 və 1 - x 0 nöqtələri bir-birindən uzaqlaşır, həddindən artıq nöqtələrə (0 və 1) yaxınlaşır. Buna görə də oyunun qərarı k-dan asılı olacaq. Gəlin k üçün konkret qiymət təyin edək, məsələn, k = 3 və oyunun həllini tapaq; bunun üçün a (x) əyrisinin maksimumunun x 0 absisini təyin edirik. a (x) funksiyasının törəməsini sıfıra bərabər tutaraq, x 0-ı təyin etmək üçün tənlik yazırıq:

Bu tənliyin üç kökü var: x = 1/2 (minimuma çatdığı yer) və maksimuma çatdığı x 0, 1 - x 0. Tənliyi ədədi olaraq həll edərək, təxminən x 0 ≈ 0,07 tapırıq; 1 - x 0 ≈ 0,93.

Bu vəziyyətdə oyunun həllinin aşağıdakı strategiya cütü olduğunu sübut edək:

Bizim strategiyamız və düşmənin strategiyası ilə saat orta gəlirdir

0-da minimum a 1 (y) tapın< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

y = 1/2 təyin etdikdə, alırıq

1-dən çox olan (0); buna görə də oyunun qiyməti 1 (0)-dan az deyil:

İndi deyək ki, rəqib S B * strategiyasından, biz isə x strategiyasından istifadə edirik. Sonra orta qazanc olacaq

Amma biz x 0-ı elə seçmişik ki, x = x 0-da ifadənin maksimumuna (7.2) çatsın; deməli,

olanlar. rəqib S B * strategiyasından istifadə edərək 0,530-dan çox itkinin qarşısını ala bilər; buna görə də ν = 0,530 oyunun qiymətidir və S A * və S B * strategiyaları həll yolu verir. Bu o deməkdir ki, biz eyni tezlikdə x = 0,07 və x = 0,93 nişangahlardan istifadə etməliyik və düşmən eyni tezlikdə və maksimum yüklənmə ilə manevr etməməlidir.

Qeyd edək ki, qazanc ν = 0.530 oyunun aşağı qiymətindən nəzərəçarpacaq dərəcədə böyükdür maksimum strategiyamızı x 0 = 1/2 tətbiq etməklə özümüz təmin edə bilərik.

Biri praktik yollar sonsuz oyunları həll etmək onların sonlulara təxmini endirilməsidir. Bu halda, hər bir oyunçu üçün bütün mümkün strategiyalar şərti olaraq bir strategiyada birləşdirilir. Bu yolla, əlbəttə ki, oyunun yalnız təxmini həlli əldə edilə bilər, lakin əksər hallarda dəqiq bir həll tələb olunmur.

Bununla belə, nəzərə almaq lazımdır ki, bu texnikanı tətbiq edərkən qarışıq strategiyalar sahəsində həllər hətta orijinal sonsuz oyunun həllinin xalis strategiyalarda mümkün olduğu hallarda da görünə bilər, yəni. sonsuz oyunun yəhər nöqtəsi olduqda. Əgər sonsuz oyunu sonluya endirməklə, yalnız iki bitişik "faydalı" strategiyanı özündə birləşdirən qarışıq həll əldə edilirsə, onda onların arasında orijinal sonsuz oyunun aralıq təmiz strategiyasını tətbiq etməyə çalışmağın mənası var.

Sonda qeyd edirik ki, sonlu oyunlardan fərqli olaraq sonsuz oyunların həlli olmaya bilər. Heç bir həlli olmayan sonsuz bir oyuna misal verək. İki oyunçu hər bir tam ədədi adlandırır. adlı daha çox digərindən 1 rubl alır. Hər ikisi eyni nömrəyə zəng edərsə, oyun heç-heçə ilə bitər. Oyunun bir həll yolu ola bilməz. Bununla belə, həlli mütləq mövcud olan sonsuz oyun sinifləri var.

A oyunçusunun qarışıq strategiyası SA p1, p2, ..., pi, ..., pm ehtimalları ilə A1, A2, ..., Am xalis strategiyalarının tətbiqidir və ehtimalların cəmi 1-ə bərabərdir: A oyunçusunun qarışıq strategiyaları matris şəklində və ya sətir şəklində yazılır SA = (p1, p2, ..., pi, ..., pm) Eynilə, B oyunçusunun qarışıq strategiyaları ilə işarələnir:, və ya, SB = (q1, q2, ..., qi, ..., qn ), burada strategiyaların görünmə ehtimallarının cəmi 1-ə bərabərdir: Təmiz strategiyalar qarışıq olanların xüsusi halı hesab edilə bilər və 1-in xalis strategiyaya uyğun olduğu sətirlə verilir. Minimax prinsipinə əsasən, oyunun optimal həlli (və ya həlli) müəyyən edilir: bu, S * A, S * B, ümumi halda, qarışıq, sahib olan optimal strategiyalar cütüdür. aşağıdakı əmlak: əgər oyunçulardan biri öz optimal strategiyasına əməl edirsə, o zaman digərinin öz strategiyasından kənara çıxması sərfəli ola bilməz. Optimal həllə uyğun gəlir oyunun qiyməti v adlanır. Oyunun qiyməti bərabərsizliyi ödəyir:? ? v? ? (3.5) harada? və? - alt və yüksək qiymətlər oyunlar. Oyun nəzəriyyəsinin aşağıdakı əsas teoremi doğrudur - Neyman teoremi. Hər bir son oyunun, ehtimal ki, qarışıq strategiyalar arasında ən azı bir optimal həlli var. S * A = (p * 1, p * 2, ..., p * i, ..., p * m) və S * B = (q * 1, q * 2, ..., q * olsun. i, ..., q * n) optimal strategiyalar cütüdür. Əgər xalis strategiya sıfırdan fərqli ehtimalla optimal qarışıq strategiyaya daxil edilirsə, o zaman aktiv adlanır. Aktiv strategiyalar haqqında teorem etibarlıdır: əgər oyunçulardan biri öz optimal qarışıq strategiyasına əməl edərsə, ikinci oyunçu öz aktiv strategiyalarının hüdudlarından kənara çıxmasa, qazanc dəyişməz və v oyunun qiymətinə bərabər qalır. Bu teorem böyük praktik əhəmiyyətə malikdir - yəhər nöqtəsi olmadıqda optimal strategiyaları tapmaq üçün xüsusi modellər təqdim edir. Sonlu oyunun ən sadə halı olan 2 × 2 oyununu nəzərdən keçirək. Belə bir oyunun yəhər nöqtəsi varsa, optimal həll bu nöqtəyə uyğun gələn bir cüt təmiz strategiyadır. Yəhər nöqtəsi olmayan bir oyun, oyun nəzəriyyəsinin əsas teoreminə uyğun olaraq, optimal həll mövcuddur və S * A = (p * 1, p * 2) və S * B = (q) bir cüt qarışıq strategiya ilə müəyyən edilir. * 1, q * 2) ... Onları tapmaq üçün biz aktiv strategiyalar haqqında teoremdən istifadə edəcəyik. Əgər A oyunçusu optimal S "A strategiyasına əməl edərsə, B oyunçusunun hansı aktiv strategiyadan istifadə etməsindən asılı olmayaraq, onun orta qazancı v oyunun qiymətinə bərabər olacaqdır. 2 × 2 oyun üçün rəqibin istənilən xalis strategiyası yəhər nöqtəsi olmadıqda aktivdir.A oyunçusunun qazancı (B oyunçusunun itkisi) - təsadüfi dəyər, riyazi gözləntisi (ortası) oyunun qiymətidir. Buna görə də, A oyunçusunun orta qazancı (optimal strategiya) rəqibin həm 1-ci, həm də 2-ci strategiyaları üçün v-yə bərabər olacaqdır. Qoy oyun qazanc matrisi ilə verilsin. A oyunçusunun orta gəliri optimal qarışıq strategiyadan, B oyunçusu isə B1 strategiyasından istifadə edirsə (bu, P qazanc matrisinin 1-ci sütununa uyğundur) bərabərdir. oyunun qiyməti v: a11 p * 1 + a21 p * 2 = v. 2-ci oyunçu B2 strategiyasını tətbiq edərsə, A oyunçusu eyni orta gəlir əldə edir, yəni. a12 p * 1 + a22 p * 2 = v. p * 1 + p * 2 = 1 olduğunu nəzərə alaraq, optimal strategiya S "A və oyunun qiymətini təyin etmək üçün tənliklər sistemi alırıq v: (3.6) Bu sistemi həll edərək, optimal strategiyanı əldə edirik (3.7). ) və oyunun qiyməti (3.8) SB * taparkən aktiv strategiyalar - B oyunçusunun optimal strategiyası, biz əldə edirik ki, A oyunçusunun hər hansı təmiz strategiyası üçün (A1 və ya A2) B oyunçusunun orta itkisi bərabərdir. oyunun qiyməti v, yəni (3.9) Onda optimal strategiya düsturlarla müəyyən edilir: (3.10 )

"Təmiz" strategiyalar

Biz artıq tıxaclarla tanışıq. Ancaq hər hansı bir strategiyanın zəncirindən tıxaclar çıxarılsa nə olar? Biz “təmiz strategiya” əldə edəcəyik. Təmiz strategiyalar, kökündən tutmuş məhsuldar hissəyə qədər heç bir təsirsiz alt-strategiyaların (tıxacların) olmadığı hərəkətlər zəncirində olanlardır və bunu çox vaxt yalnız şüurda bütün halqaların olması ilə sübut etmək olar.

Əlbəttə ki, strategiyanın tətbiqinin bütün mümkün nəticələri nöqteyi-nəzərindən ən təsirlisi haqqında danışmaq bizim üçün çətindir, çünki bizim sadəcə olaraq müəyyən təcrübəmiz və buna görə də müəyyən aralıq strategiyamız olmaya bilər, lakin bu, strategiyanın mümkün qədər təsirli olması ilə bağlı təcrübəmiz.

Təmiz strategiyalar konsepsiyası da bu materiallarda əsas olanlardan biridir, ona görə də bir nümunə verəcəyəm:

Axşam. Siz öz ərazinizdə evə tələsirsiniz. Süd qaçır. "Bir növ şübhəli növün" yanından uçaraq, ünvanınızda "Hey, sən, [senzura ilə kəsilmiş]" eşidirsən. Bura getmə, baş qar yağacaq!”

Nə edəcəksən? Bir çox variant ola bilər. Kimsə işi düzəltməyə gedəcək, kimsə qorxaraq tempini sürətləndirəcək, kimsə nəsə qışqıracaq. Bununla belə, gəlin düşünək, bu halda davranışın təmiz strategiyası nədir?

Küçədə bir qərib sizə nəsə qışqırır. Sənin öz işin var, onun üzərində həqiqətən gedirsən. Mətnə əsasən, bu şəxslə ünsiyyətdən sizin üçün müsbət fayda əldə etmək şansı azdır. Məntiqi nəticə: sakitcə işinizə davam edin. Diqqətinizi “sakit”, kölgəsiz olduğuna cəlb edirəm mənfi emosiyalar, lakin baş verənlərə sağlam biganəliklə. Bunu neçə nəfər edərdi? Güman edirəm ki, böyük azlıq. Niyə?

Çünki insanların çoxu aşağı təbəqələrdə özünü qorumaqla bağlı bütöv bir şüuraltı strategiyaya malikdir, xüsusən də bunlar ola bilər: “Hər zaman kobudluğa kobudluqla cavab verin”, “Kimsə pis sözlər deyirsə, qaçmalısan”, "Kimsə kobuddursa - üzünü doldurmaq lazımdır", "Kimsə kobuddursa, təhlükə var" və bu kimi müxtəlif varyasyonlarda. Əlbəttə ki, hər kəs bir növ aktiv hərəkət etməyəcək, lakin emosional olaraq demək olar ki, hər kəsə təsir edəcəkdir. Və bu, bir şeydir.

Təmiz strategiyalar həmişə emosional olaraq neytral və ya müsbətdir və bu, beyninizə xasdır, sadəcə ondan istifadə etməlisiniz.

“Niyə saf strategiyalar lazımdır?” qeydlərində təmiz strategiyalar haqqında bir az oxuya bilərsiniz. və House, Hopkins və s.

Dahilərin strategiyaları kitabından. Albert Eynşteyn müəllif Dilts Robert

Strategiyalar 1. “Strategiya” termininin tərifi: a) Yunanca “strategos” sözündən olub, mənası: “hərbi rəhbər”, “elm, döyüş sənəti”, “sosial, siyasi mübarizəyə rəhbərlik sənəti”.

Dahilərin strategiyaları kitabından (Aristotel Şerlok Holms Walt Disney Wolfgang Amadeus Motsart) müəllif Dilts Robert

Kitabdan Yaxşı oxumağı bilirsənmi ?! Faydalı kitab diqqətsiz tələbələr üçün müəllif Karpov Aleksey

STRATEGİYALAR Əgər düşünüb fəaliyyət strategiyası seçsəniz, öyrənməniz tamamilə fərqli keyfiyyət səviyyəsinə yüksələcək.Strategiya ümumi plandır. Bu verilən ümumi xəttdir real şərait... Bunlar gözlənilməzlik və müxtəlifliyi nəzərə alan məqsədlər, son tarixlərdir... Nəbzin hissiyyatı budur.

Ağıl və Uğur Strategiyası kitabından Müəllif Antipov Anatoli

Emosional İntellekt kitabından Goleman Daniel tərəfindən

Əmsal zehni inkişafemosional intellekt: saf tiplər IQ və emosional zəka bir-birinə zidd deyil, əksinə, ayrı-ayrı səlahiyyətlərdir. Biz hamımız kəşfiyyatı təcrübənin kəskinliyi ilə birləşdiririk; yüksək olan insanlar

Sizi dəli edə biləcək 12 xristian inancından ibarət kitabdan Townsend John tərəfindən

Düzgün niyyətlər və ya təmiz düşüncələr Düzgün niyyət doğru şeyi etmək qərarıdır. Biz, adətən, həqiqətən bunu etmək istəyib-istəmədiyimizi düşünmədən, Allaha xoş gələn bir yaxşı işi seçirik. Biz sadəcə bunu edirik və bu qədər. Bir çox evangelist təbliğatçılar

Həyata girmək kitabından: Kolleksiya Müəllif müəllifi naməlum

Rudolf İvanoviç ABEL: “DZERJINSKİNİN DEYİLDİĞİ KİMİ YADINDA OLUN:” TƏMİZ ƏLLƏR, SOYUQ BAŞ VƏ İSTİ ÜRƏK... “Rudolf İvanoviç Abel otuz ildən çox vaxtını sovet kəşfiyyatında işləməyə həsr edib. Lenin ordeni, iki Qırmızı Bayraq, Əmək ordeni ilə təltif edilmişdir

Kitabdan Homo sapiens 2.0 [Homo sapiens 2.0 http://hs2.me] Sapiens Homo tərəfindən

Strategiya

Homo Sapiens 2.0 kitabından Sapiens 2.0 Homo tərəfindən

"Təmiz" strategiyaları Biz artıq tıxaclarla tanışıq. Ancaq hər hansı bir strategiyanın zəncirindən tıxaclar çıxarılsa nə olar? Biz “təmiz strategiya” əldə edəcəyik. Təmiz strategiyalar, kökündən tutmuş təsirli hissəsinə qədər fəaliyyət zəncirində olmayan strategiyalardır.

Başlanğıc kitabından. Qorxunun üzünə yumruq vurun, "normal" olmağı dayandırın və dəyərli bir şey edin müəllif Aykaff John

İnsan heyvan kimi kitabından Müəllif Nikonov Aleksandr Petroviç

Strategiyalar Strategiyaların ümumi konsepsiyası Prinsipcə, hər kəs bu və ya digər dərəcədə strategiyanın nə olduğunu başa düşür. Təcrübə əldə etmək və emal etmək nəticəsində əldə edilmiş müəyyən biliklər toplusuna malik olmaqla biz müəyyən davranış modellərini qururuq.Strategiya məqsədə çatmaq üçün bir modeldir.

İş yaddaşınızı tam gücə çevirin kitabından Elloway Tracy tərəfindən

Niyə Təmiz Strategiyalar? Bu layihədəki materialın aslan payı daima yenidən yazmaq üçün təmiz strategiyalardan istifadə etməyin lazım olduğunu və onlara əsaslanan bir tıxac axtarmağın vacib olduğunu göstərir. Bu an ilk baxışdan aydın deyil və

Ekstrovert dünyada introvert kitabından Müəllif Romantseva Elizaveta

Müəllifin kitabından

Müəllifin kitabından

Strategiyalar Kompüter strategiyaları oyunçudan diqqətini cəmləşdirməyi, hərəkətlərini planlaşdırmağı və müxtəlif problemləri həll etməyi tələb edir. Son tədqiqatlar göstərir ki, strategiyalar hər yaşda olan oyunçuların idrak bacarıqlarını inkişaf etdirə bilər. görə

Müəllifin kitabından

Saf tiplər Belə bir anlayış var - “saf psixoloji növü". Əslində bir konsepsiya var, amma praktiki olaraq heç bir obyekt, yəni bu konsepsiyaya ideal uyğun gələn insanlar yoxdur. Təmiz introvertlər və birmənalı ekstrovertlər yoxdur. Üstəlik, sizinlə razılaşdıq

Oyunçunun hərəkət seçimi adlanır hərəkət... Hərəkətlər var şəxsi(oyunçu qəsdən bu və ya digər qərarı verir) və təsadüfi(oyunun nəticəsi oyunçunun iradəsindən asılı deyil). Oyunçunun hansı hərəkəti etməli olduğunu müəyyən edən qaydalar toplusu adlanır strategiya... Strategiyalardır təmiz(oyunçuların təsadüfi olmayan qərarları) və qarışıq(strategiya təsadüfi dəyişən kimi qəbul edilə bilər).

Yəhər nöqtəsi

V oyun nəzəriyyəsi S. t. ( yəhər elementi) sütunun ən böyük elementidir oyun matrisləri, eyni zamanda müvafiq sıranın ən kiçik elementidir (in sıfır cəmi iki nəfərlik oyun). Bu nöqtədə, buna görə də, bir oyunçunun maksimumu digərinin minimumuna bərabərdir; S. t. Bir məqam var tarazlıq.

Minimaks teoremi

Minimaksa uyğun strategiya deyilir Minimax strategiyası.

Oyunçulara ən "diqqətli" maksimum və minimum strategiyaların seçimini diktə edən prinsip adlanır. Minimax prinsipi... Bu prinsip, hər bir oyunçunun düşmənin məqsədinə zidd olan məqsədə çatmağa çalışdığı ağlabatan fərziyyədən irəli gəlir.

Oyunçu, rəqibin əlverişsiz bir şəkildə hərəkət edəcəyini güman edərək, öz hərəkətlərini seçir, yəni. “zərər” verməyə çalışacaq.

Zərər funksiyası

Zərər funksiyası- nəzəri olaraq bir funksiya statistik qərarlar müşahidə oluna bilən məlumatlar əsasında zəif qərar qəbuletmə qabiliyyətinin itirilməsini xarakterizə edir. Əgər səs-küyün fonunda siqnal parametrinin qiymətləndirilməsi problemi həll edilirsə, itki funksiyası arasında uyğunsuzluğun ölçüsüdür. əsl məna təxmin edilən parametr və parametr qiymətləndirməsi

Optimal Qarışıq Oyunçu Strategiyası verilmiş ehtimallarla eyni şəraitdə oyunun çoxsaylı təkrarları ilə onun xalis strategiyalarının tətbiqlərinin tam dəstidir.

Oyunçunun qarışıq strategiyası verilmiş ehtimallarla eyni şərtlər altında oyunun bir neçə dəfə təkrarlanması ilə öz xalis strategiyalarının tətbiqinin tam dəstidir.

1. Əgər cərgənin bütün elementləri başqa sətrin müvafiq elementlərindən böyük deyilsə, o zaman ilkin cərgə ödəniş matrisindən silinə bilər. Sütunlar üçün də eynilə.

2. Oyunun qiyməti unikaldır.

Sənəd: tutaq ki, 2 oyunun qiyməti var v və bir cütə çatan və müvafiq olaraq, sonra

3. Əgər qazanc matrisinin bütün elementlərinə eyni ədəd əlavə olunarsa, o zaman optimal qarışıq strategiyalar dəyişməyəcək və oyunun qiyməti bu rəqəmə yüksələcək.

Sənəd:
, harada

4. Ödəniş matrisinin bütün elementləri eyni sıfırdan fərqli rəqəmə vurularsa, oyunun qiyməti bu rəqəmə vurulacaq və optimal strategiyalar dəyişməyəcək.

© 2022 skudelnica.ru - Sevgi, xəyanət, psixologiya, boşanma, hisslər, mübahisələr