खेल मॉडल की अवधारणा। भुगतान मैट्रिक्स

घर / दगाबाज पति

एक युग्मित परिमित खेल पर विचार करें। खिलाड़ी को चलो लेकिनहै टीव्यक्तिगत रणनीतियाँ, जिन्हें हम निरूपित करते हैं

खिलाड़ी को चलो मेंउपलब्ध पीव्यक्तिगत रणनीतियाँ, आइए उन्हें निरूपित करें। वे कहते हैं कि खेल का एक आयाम है टीएक्स पी।

किसी भी जोड़ी रणनीति के खिलाड़ियों द्वारा पसंद के परिणामस्वरूप, खेल का परिणाम विशिष्ट रूप से निर्धारित होता है, अर्थात। जीत लेकिन;. खिलाड़ी लेकिन(सकारात्मक या नकारात्मक) और हारना (-ए)खिलाड़ी में।आइए मान लें कि मान लेकिन..रणनीतियों की किसी भी जोड़ी के लिए जाना जाता है (ए:, बी;.) साँचा पी =(ए..), मैं == 1, 2, ..., एमजे = 1, 2, ..., पी,जिनके तत्व रणनीतियों के अनुरूप अदायगी हैं लेकिन।और बीजे,बुलाया भुगतान मैट्रिक्स,या खेल मैट्रिक्स। सामान्य फ़ॉर्मऐसा मैट्रिक्स तालिका में प्रस्तुत किया गया है। 12.1. इस तालिका की पंक्तियाँ खिलाड़ी की रणनीतियों के अनुरूप हैं लेकिन,और कॉलम खिलाड़ी की रणनीतियाँ हैं में।

तालिका 12.1

आइए अगले गेम के लिए पेऑफ मैट्रिक्स बनाएं।

12.1. खोज खेल।

खिलाड़ी लेकिनदो आश्रयों (I और II) में से एक में छिप सकते हैं; खिलाड़ी मेंएक खिलाड़ी की तलाश में लेकिन,और यदि वह पाता है, तो उसे 1 मांद का जुर्माना मिलता है। इकाइयों से लेकिन,अन्यथा खिलाड़ी को भुगतान करता है लेकिनएक दिन इकाइयों खेल के भुगतान मैट्रिक्स का निर्माण करना आवश्यक है।

डी ई एस एच ई एन आई एस। अदायगी मैट्रिक्स को संकलित करने के लिए, प्रत्येक खिलाड़ी के व्यवहार का विश्लेषण करना आवश्यक है। खिलाड़ी लेकिनआश्रय में छिप सकते हैं I - हम इस रणनीति को दर्शाते हैं v या तो आश्रय II में - रणनीति लेकिन।जी प्लेयर मेंआश्रय I में पहले खिलाड़ी की तलाश कर सकते हैं I - रणनीति में(या आश्रय II में - रणनीति में।,।अगर खिलाड़ी लेकिनठिकाने I में है और खिलाड़ी द्वारा वहां खोजा गया है में,वे। कुछ रणनीतियों को लागू किया जा रहा है ν में{), फिर खिलाड़ी लेकिनजुर्माना अदा करता है, अर्थात्। लेकिनएन = -1। इसी प्रकार, हम प्राप्त करते हैं लेकिन।एन = -1 (लेकिन 2, में।,)।जाहिर है, रणनीतियों (ए, में।,)और (R2, /1,) खिलाड़ी को दें लेकिनजीत 1, तो लेकिनपी = ए. n = I। इस प्रकार, आकार 2x2 के खेल "खोज" के लिए, हमें भुगतान मैट्रिक्स मिलता है:

खेल पर विचार करें टीएक्स पीमैट्रिक्स के साथ पी = एजे) , मैं = 1,2, ..., ; जे= 1, 2, ..., और रणनीतियों में से सबसे अच्छा निर्धारित करें लेकिनपर वी..., लेकिनएम. एक रणनीति चुनना जय खिलाड़ी लेकिनखिलाड़ी से उम्मीद करनी चाहिए मेंकिसी एक रणनीति के साथ इसका उत्तर देंगे में।,जिसके लिए खिलाड़ी के लिए अदायगी लेकिनन्यूनतम (खिलाड़ी मेंखिलाड़ी को "नुकसान" पहुंचाना चाहता है लेकिन)।

ए द्वारा निरूपित करें; खिलाड़ी का सबसे कम भुगतान लेकिनजब वह रणनीति एल चुनता है; सभी संभावित खिलाड़ी रणनीतियों के लिए में(सबसे छोटी संख्या in आई-वें लाइनपेऑफ मैट्रिक्स), यानी।

सभी संख्याओं में a (r = 1,2,..., टी)सबसे बड़ा चुनें: . चलो कॉल करो और खेल की कम कीमत,या अधिकतम अदायगी (अधिकतम)।इस खिलाड़ी बी की किसी भी रणनीति के लिए खिलाड़ी ए की गारंटीकृत अदायगी।फलस्वरूप,

(12.2)

मैक्सिमिन के अनुरूप रणनीति को कहा जाता है अधिकतम रणनीति।खिलाड़ी मेंखिलाड़ी के भुगतान को कम करने में रुचि लेकिन;एक रणनीति चुनना में।,यह के लिए अधिकतम संभव भुगतान को ध्यान में रखता है लेकिन।निरूपित

सभी नंबरों के बीच β. सबसे छोटा चुनें

और कॉल करें β शीर्ष खेल मूल्य, या मिनिमैक्स अदायगी (मिनीमैक्स)।इस खिलाड़ी बी की हार की गारंटीफलस्वरूप,

(12.4)

मिनिमैक्स रणनीति को कहा जाता है मिनिमैक्स रणनीति।

वह सिद्धांत जो खिलाड़ियों को सबसे "सतर्क" मिनिमैक्स और मैक्सिमम रणनीतियों के चुनाव को निर्देशित करता है, सिद्धांत कहलाता है मिनिमैक्सयह सिद्धांत उचित धारणा से चलता है कि प्रत्येक खिलाड़ी प्रतिद्वंद्वी के विपरीत लक्ष्य को प्राप्त करना चाहता है। आइए समस्या 12.1 में खेल की निचली और ऊपरी कीमतों और संबंधित रणनीतियों का निर्धारण करें। अदायगी मैट्रिक्स पर विचार करें

समस्या 12.1 से। रणनीति ए चुनते समय, (मैट्रिक्स की पहली पंक्ति), न्यूनतम भुगतान ए, = मिनट (-एल; 1) = -1 के बराबर होता है और खिलाड़ी की रणनीति β1 से मेल खाता है में।रणनीति चुनते समय ली 2 (मैट्रिक्स की दूसरी पंक्ति) न्यूनतम अदायगी है लेकिन 2 = मिनट (एल; -1) = -1, यह रणनीति के साथ हासिल किया जाता है में।,।

खुद की गारंटी अधिकतम जीतखिलाड़ी की किसी भी रणनीति के लिए में, अर्थात। खेल की कम कीमत ए = अधिकतम (ए, ए 2) = अधिकतम (-एल; -1) = -1, खिलाड़ी लेकिनकोई भी रणनीति चुन सकते हैं: अज या लेकिन 2, अर्थात उनकी कोई भी रणनीति मैक्सिमम है।

रणनीति बी चुनना, (कॉलम 1), खिलाड़ी मेंसमझता है कि खिलाड़ी लेकिनरणनीति के साथ जवाब देंगे लेकिन 2 अपने लाभ को अधिकतम करने के लिए (हानि .) में)।इसलिए, खिलाड़ी का अधिकतम नुकसान मेंजब वह रणनीति बी चुनता है, तो β, = अधिकतम (-1; 1) = 1 के बराबर होता है।

इसी प्रकार, खिलाड़ी B की अधिकतम हानि (लाभ .) लेकिन) जब वह रणनीति चुनता है तो बी2 (स्तंभ 2) β2 = अधिकतम (एल; -1) = 1 के बराबर होता है।

इस प्रकार, खिलाड़ी की किसी भी रणनीति के लिए लेकिनखिलाड़ी बी की गारंटीकृत न्यूनतम हानि β = (β1, β2) = मिनट (एल; 1) = 1- खेल की शीर्ष कीमत के बराबर है।

खिलाड़ी बी की कोई भी रणनीति न्यूनतम है। तालिका जोड़कर। 12.1 लाइन β; और कॉलम ए;, हमें टेबल मिलती है। 12.2 अतिरिक्त पंक्तियों और स्तंभों के चौराहे पर, हम खेलों की ऊपरी और निचली कीमतों को रिकॉर्ड करेंगे।

तालिका 12.2

उपरोक्त समस्या 12.1 में, खेल की ऊपरी और निचली लागतें भिन्न हैं: ए एफ β.

यदि खेल की ऊपरी और निचली कीमतें समान हैं, तो सामान्य अर्थऊपर और कम कीमतखेल α = β = कहा जाता है खेल की शुद्ध कीमत,या खेल की कीमत।खेल की कीमत के अनुरूप न्यूनतम रणनीतियाँ हैं इष्टतम रणनीतियाँऔर उनकी समग्रता इष्टतम समाधानया फैसलाखेल इस मामले में खिलाड़ी लेकिनअधिकतम गारंटी प्राप्त करता है (खिलाड़ी के व्यवहार से स्वतंत्र) में)अदायगी है, और खिलाड़ी मेंन्यूनतम गारंटी प्राप्त करता है (खिलाड़ी एल के व्यवहार की परवाह किए बिना) नुकसान । कहा जाता है कि खेल का समाधान है स्थिरता,वे। यदि खिलाड़ियों में से एक अपनी इष्टतम रणनीति पर कायम रहता है, तो दूसरे के लिए अपनी इष्टतम रणनीति से विचलित होना फायदेमंद नहीं हो सकता है।

जोड़ा शुद्ध रणनीतियाँ लेकिन।और बी खेल के लिए एक इष्टतम समाधान देता है यदि और केवल तभी जब संबंधित तत्व r अपने कॉलम में सबसे बड़ा और अपनी पंक्ति में सबसे छोटा हो। ऐसी स्थिति, यदि मौजूद हो, कहलाती है लादने की सीमा(एक काठी की सतह के समान, जो एक दिशा में ऊपर और दूसरी में नीचे की ओर झुकती है)।

निरूपित लेकिन*और में*शुद्ध रणनीतियों की एक जोड़ी है जिस पर एक सैडल पॉइंट के साथ समस्या में खेल का समाधान प्राप्त किया जाता है। आइए हम प्रत्येक जोड़ी रणनीतियों पर पहले खिलाड़ी के अदायगी समारोह का परिचय दें: पी(ए:, में-) = और कम से. तब काठी बिंदु पर इष्टतमता की स्थिति दोहरी असमानता को संतुष्ट करती है: पी(अज, बी*)<Р(А*, В*)<Р(А", В ), जो सबके लिए सच है मैं = 1, 2, ..., एम; जे = 1, 2, ..., पी।दरअसल, रणनीति का चुनाव लेकिन* इष्टतम रणनीति के तहत पहला खिलाड़ी में"दूसरा खिलाड़ी न्यूनतम संभव भुगतान को अधिकतम करता है: पी(ए*, बी")> पी(एजी में"),और रणनीति का चुनाव बी"दूसरा खिलाड़ी, पहले की इष्टतम रणनीति के साथ, अधिकतम नुकसान को कम करता है: P(D , में*)<Р(А", В).

12.2 अदायगी मैट्रिक्स द्वारा दिए गए खेल के निचले और ऊपरी मूल्य का निर्धारण करें

क्या खेल में एक काठी बिंदु है?

तालिका 12 3

समाधान।सभी गणनाएं आसानी से एक तालिका में की जाती हैं, जिसमें मैट्रिक्स के अलावा आर,कॉलम ए दर्ज किया गया; और रेखा)

© 2022 skudelnica.ru -- प्यार, विश्वासघात, मनोविज्ञान, तलाक, भावनाएं, झगड़े