खेल मॉडल की अवधारणा। भुगतान मैट्रिक्स

घर / मनोविज्ञान

व्यावहारिक कार्य संख्या 3

गेम थ्योरी मॉडल

गेम मॉडल को समझना

गेम थ्योरी परिस्थितियों में निर्णय लेने के लिए विभिन्न प्रकार की सिफारिशों के विकास में लगी हुई है संघर्ष की स्थिति... गणितीय रूप से संघर्ष की स्थितियों का निर्माण करते हुए, उन्हें दो, तीन या अधिक खिलाड़ियों के खेल के रूप में दर्शाया जा सकता है, जिनमें से प्रत्येक का लक्ष्य दूसरे खिलाड़ी की कीमत पर अपने लाभ को अधिकतम करना है। संघर्ष की स्थिति के गणितीय मॉडल को कहा जाता है खेल, संघर्ष के पक्ष - खिलाड़ियों, और संघर्ष का परिणाम है जीत... प्रत्येक औपचारिक खेल के लिए, हम परिचय देते हैं नियमों, अर्थात। शर्तों की प्रणाली जो निर्धारित करती है:

1. खिलाड़ियों के कार्यों के लिए विकल्प;

2. भागीदारों के व्यवहार के बारे में प्रत्येक खिलाड़ी के पास कितनी जानकारी है;

3. वह लाभ जिससे प्रत्येक कार्य समुच्चय की ओर ले जाता है।

एक नियम के रूप में, जीत को मात्रात्मक रूप से निर्दिष्ट किया जा सकता है (उदाहरण के लिए, नुकसान - 0, जीत - 1, ड्रा - ½)। खेल कहा जाता है भाप से भरा कमरायदि दो खिलाड़ी इसमें भाग लेते हैं, और विभिन्नयदि खिलाड़ियों की संख्या दो से अधिक है। खेल कहा जाता है एक शून्य-राशि का खेलयदि एक खिलाड़ी का लाभ दूसरे के नुकसान के बराबर है। नियमों द्वारा प्रदान की गई क्रियाओं में से किसी एक का चुनाव और कार्यान्वयन कहलाता है कदमखिलाड़ी। चालें व्यक्तिगत या यादृच्छिक हो सकती हैं। व्यक्तिगत चाल- संभावित कार्यों में से एक के खिलाड़ी द्वारा एक सचेत विकल्प (शतरंज के खेल में एक चाल), यादृच्छिक चाल- बेतरतीब ढंग से चुनी गई कार्रवाई (फेरबदल किए गए डेक से कार्ड चुनना)।

खिलाड़ी की रणनीतिनियमों का एक समूह कहा जाता है जो वर्तमान स्थिति के आधार पर प्रत्येक व्यक्तिगत चाल के लिए उसकी कार्रवाई का विकल्प निर्धारित करता है। खेल कहा जाता है अंतिमयदि खिलाड़ी के पास सीमित संख्या में रणनीतियाँ हैं, और अनंत- अन्यथा।

खेल को हल करने के लिए, या खोजने के लिए खेल समाधान, प्रत्येक खिलाड़ी के लिए एक रणनीति चुननी चाहिए जो इष्टतमता की स्थिति को संतुष्ट करती है, अर्थात। खिलाड़ियों में से एक को प्राप्त करना चाहिए अधिकतम जीतजब दूसरा अपनी रणनीति पर अड़ा रहता है। उसी समय, दूसरे खिलाड़ी के पास होना चाहिए न्यूनतम नुकसानयदि पूर्व अपनी रणनीति पर कायम रहता है। ऐसी रणनीतियों को इष्टतम कहा जाता है। उद्देश्य गेम थ्योरी प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है... इष्टतम रणनीति चुनते समय, यह मान लेना स्वाभाविक है कि दोनों खिलाड़ी अपने हितों के दृष्टिकोण से यथोचित व्यवहार करते हैं।

भुगतान मैट्रिक्स। निचले और ऊपरी खेल की कीमतें

एक जोड़ी अंत खेल पर विचार करें। खिलाड़ी को चलो है एमव्यक्तिगत रणनीतियाँ, जिन्हें हम निर्दिष्ट करेंगे ए 1, ए 2, ..., ए एम।खिलाड़ी को चलो बीवहाँ है एनव्यक्तिगत रणनीतियाँ, आइए उन्हें नामित करें बी 1, बी 2, ..., बी एन।वे कहते हैं कि खेल का एक आयाम है एम नहीं... किसी भी जोड़ी रणनीति के खिलाड़ियों द्वारा पसंद के परिणामस्वरूप एक मैंतथा बी जेखेल का परिणाम विशिष्ट रूप से निर्धारित होता है, अर्थात। बढ़त एक आईजेयूखिलाड़ी (सकारात्मक या नकारात्मक) और हानि (- एक आईजेयूखिलाड़ी वी... आव्यूह = (एक आईजे), जिसके तत्व रणनीतियों के अनुरूप अदायगी हैं एक मैंतथा बी जेकहा जाता है भुगतान मैट्रिक्सया खेल मैट्रिक्स.

बी जे एक मैं बी 1 बी 2 बी नहीं
ए 1 एक 11 एक 12 एक 1n
ए 2 एक 21 एक 22 एक 2n
पूर्वाह्न एक एम1 एक एम 2 एक एमएन

उदाहरण - खेल "खोज"

खिलाड़ी तिजोरी 1 में छिपा सकते हैं - हम इस रणनीति को इस रूप में नामित करेंगे ए 1या तिजोरी 2 में - रणनीति ए 2... खिलाड़ी वीतिजोरी 1 में पहले खिलाड़ी की तलाश कर सकते हैं - रणनीति पहले में, या तिजोरी 2 में - रणनीति मे 2... अगर खिलाड़ी तिजोरी 1 में है और खिलाड़ी द्वारा वहां खोजा गया है वी, अर्थात। कुछ रणनीतियों को अंजाम दिया जाता है (ए 1, बी 1), फिर खिलाड़ी जुर्माना अदा करता है, अर्थात्। एक 11= -1। इसी प्रकार, हम प्राप्त करते हैं एक 22= -1। जाहिर है, रणनीतियों (ए 1, बी 2)तथा (ए 2, बी 1)खिलाड़ी दे अदायगी 1 है, इसलिए एक 12=एक 21= 1. इस प्रकार, हमें भुगतान मैट्रिक्स मिलता है

खेल पर विचार करें एम नहींमैट्रिक्स के साथ = (एक आईजे)और खिलाड़ी की रणनीतियों में से सर्वश्रेष्ठ का निर्धारण करें ... रणनीति चुनना एक मैंखिलाड़ी मानना ​​चाहिए कि खिलाड़ी वीकिसी एक रणनीति का जवाब देंगे जू मेंजिसके लिए खिलाड़ी के लिए लाभ न्यूनतम (खिलाड़ी वीखिलाड़ी को "नुकसान" पहुंचाना चाहता है ).

आइए हम द्वारा निरूपित करें एक मैंएक खिलाड़ी का सबसे छोटा भुगतान रणनीति चुनते समय एक मैंसभी संभावित खिलाड़ी रणनीतियों के लिए वी(सबसे छोटी संख्या in मैं- भुगतान मैट्रिक्स की पंक्ति), अर्थात। ...

सभी नंबरों के बीच एक मैंसबसे बड़ा चुनें:। चलो एक कॉल करते हैं खेल की निचली कीमत , या अधिकतम जीत (मैक्सिमिन ) यह खिलाड़ी बी की किसी भी रणनीति के लिए खिलाड़ी ए की गारंटीकृत अदायगी... अत, .

मैक्सिमिन के अनुरूप रणनीति को कहा जाता है अधिकतम रणनीति... खिलाड़ी वीखिलाड़ी की जीत को कम करने में दिलचस्पी ; एक रणनीति चुनना बी जे, यह ए के लिए अधिकतम संभव लाभ को ध्यान में रखता है। निरूपित करें।

सभी संख्याओं में से, हम सबसे छोटी संख्या को चुनते हैं और कॉल करते हैं बी खेल की शीर्ष कीमत , या मिनिमैक्स जीत (अल्पमहिष्ठ ) यह खिलाड़ी ए की किसी भी रणनीति के लिए खिलाड़ी बी की गारंटीकृत हानि... अत, .

मिनिमैक्स के अनुरूप कार्यनीति कहलाती है मिनिमैक्स रणनीति... खिलाड़ियों को सबसे सावधान मिनिमैक्स और मैक्सिमम रणनीतियों के चुनाव को निर्धारित करने वाले सिद्धांत को कहा जाता है न्यूनतम सिद्धांत.

सांख्यिकीय खेल

कई कार्यों में जो खेलने की ओर ले जाते हैं, अनिश्चितता उन परिस्थितियों के बारे में जानकारी की कमी के कारण होती है जिनमें कार्रवाई की जाती है। ये स्थितियां किसी अन्य खिलाड़ी के सचेत कार्यों पर निर्भर नहीं करती हैं, बल्कि वस्तुनिष्ठ वास्तविकता पर निर्भर करती हैं, जिसे आमतौर पर "प्रकृति" कहा जाता है। ऐसे खेलों को प्रकृति खेल (सांख्यिकीय खेल) कहा जाता है।

टास्क

कई वर्षों के संचालन के बाद, औद्योगिक उपकरण निम्नलिखित राज्यों में से एक में निकलते हैं: बी 1 - निवारक रखरखाव के बाद अगले वर्ष उपकरण का उपयोग किया जा सकता है; 2 - उपकरण के परेशानी से मुक्त संचालन के लिए, इसके अलग-अलग हिस्सों और विधानसभाओं को भविष्य में बदला जाना चाहिए; बी 3 - उपकरण को बड़ी मरम्मत या प्रतिस्थापन की आवश्यकता होती है।

वर्तमान स्थिति बी 1, बी 2, बी 3 के आधार पर, उद्यम का प्रबंधन निम्नलिखित निर्णय ले सकता है: ए 1 - कारखाने के विशेषज्ञों द्वारा उपकरण की मरम्मत के लिए, जिसके लिए संबंधित लागत की आवश्यकता होती है 1 = 6, ए 2 = 10 , और 3 = 15 मौद्रिक इकाइयाँ; और 2 - मरम्मत करने वालों की एक विशेष टीम को बुलाओ, इस मामले में लागत बी 1 = 15, बी 2 = 9, बी 3 = 18 मौद्रिक इकाइयाँ होंगी; और 3 - उपकरणों को नए के साथ बदलने के लिए, पुराने उपकरणों को इसके अवशिष्ट मूल्य पर बेचना। इस गतिविधि के परिणामों की कुल लागत क्रमशः 1 = 13 के साथ, 2 = 24 के साथ, 3 = 12 मौद्रिक इकाइयों के साथ समान होगी।

व्यायाम

1. वर्णित स्थिति को एक खेल योजना देते हुए, इसके प्रतिभागियों की पहचान करें, पार्टियों की संभावित शुद्ध रणनीतियों को इंगित करें।

2. मैट्रिक्स के तत्वों का अर्थ समझाते हुए भुगतान मैट्रिक्स बनाएं (वे नकारात्मक क्यों हैं?)।

3. यह पता लगाने के लिए कि आने वाले वर्ष में उपकरण के संचालन पर कौन सा निर्णय उद्यम के प्रबंधन को सिफारिश करने की सलाह दी जाती है ताकि निम्नलिखित मान्यताओं के तहत नुकसान को कम किया जा सके: ए) समान उपकरण के संचालन में उद्यम में प्राप्त अनुभव दिखाता है कि उपकरण की संकेतित अवस्थाओं की प्रायिकताएँ क्रमशः q 1 = 0.15 हैं; क्यू 2 = 0.55; क्यू 3 = 0.3 (बेयस मानदंड लागू करें); बी) अनुभव से पता चलता है कि उपकरण के सभी तीन संभावित राज्य समान रूप से संभावित हैं (लाप्लास मानदंड लागू करें); ग) उपकरणों की संभावना के बारे में कुछ भी निश्चित नहीं कहा जा सकता है (वाल्ड, सैवेज, हर्विट्ज़ के मानदंड लागू करें)। हर्विट्ज़ मानदंड में पैरामीटर जी = 0.8 का मान दिया गया है।

समाधान

1) वर्णित स्थिति एक सांख्यिकीय खेल है।

सांख्यिकीविद् उद्यम का प्रबंधन है, जो निम्नलिखित में से कोई एक निर्णय ले सकता है: उपकरण की मरम्मत स्वयं करें (रणनीति A1), मरम्मत करने वालों को बुलाएं (रणनीति A2); उपकरण को एक नए से बदलें (रणनीति ए 3)।

दूसरा खेल पक्ष - प्रकृति, हम उपकरणों की स्थिति को प्रभावित करने वाले कारकों के एक समूह पर विचार करेंगे: उपकरण का उपयोग निवारक मरम्मत (राज्य बी 1) के बाद किया जा सकता है; व्यक्तिगत विधानसभाओं और उपकरणों के कुछ हिस्सों को बदलना आवश्यक है (राज्य बी 2): आवश्यक ओवरहालया उपकरण का प्रतिस्थापन (राज्य बी 3)।

2) आइए खेल के भुगतान मैट्रिक्स की रचना करें:

भुगतान मैट्रिक्स a ij का तत्व उद्यम के प्रबंधन की लागत को दर्शाता है यदि, चुनी गई रणनीति A i के साथ, उपकरण राज्य B j में निकला हो। भुगतान मैट्रिक्स के तत्व नकारात्मक हैं, क्योंकि किसी भी चुनी हुई रणनीति के लिए, उद्यम के प्रबंधन को लागत वहन करनी होगी।

ए) उपकरण के समान संचालन के लिए उद्यम में प्राप्त अनुभव से पता चलता है कि उपकरण की स्थिति की संभावनाएं q 1 = 0.15 के बराबर हैं; क्यू 2 = 0.55; क्यू 3 = 0.3।

हम फॉर्म में भुगतान मैट्रिक्स का प्रतिनिधित्व करते हैं:

रणनीति सांख्यिकी, ए आई प्रकृति के राज्य बी जे
बी 1 बी 2 बी 3
ए 1 -6 -10 -15 -10,9
ए 2 -15 -9 -18 -12,6
ए 3 -13 -24 -12 -18,75
क्यू जे 0,15 0,55 0,3

जहां, (i = 1,3)

बेयस की कसौटी के अनुसार, इष्टतम रणनीति शुद्ध रणनीति है i, जो सांख्यिकीविद् के औसत भुगतान को अधिकतम करती है, अर्थात। प्रदान किया गया = अधिकतम।

इष्टतम बायेसियन रणनीति रणनीति ए 1 है।

बी) उपलब्ध अनुभव इंगित करता है कि उपकरण के सभी तीन संभावित राज्य समान रूप से संभावित हैं, अर्थात। = 1/3।

औसत जीत बराबर हैं:

1/3 * (- 6-10-15) = -31/3 "-10.33;

1/3*(-15-9-18) = -42/3 = -14;

1/3 * (- 13-24-12) = -49/3 "-16.33.

इष्टतम लाप्लास रणनीति रणनीति ए 1 है।

ग) उपकरणों की संभावनाओं के बारे में निश्चित रूप से कुछ नहीं कहा जा सकता है।

वाल्ड की कसौटी के अनुसार, इष्टतम रणनीति को एक शुद्ध रणनीति के रूप में लिया जाता है जो सबसे खराब परिस्थितियों में अधिकतम भुगतान की गारंटी देता है, अर्थात।

.

= अधिकतम (-15, -18, -24) = -15।

इस प्रकार, इष्टतम रणनीति А 1 है।

आइए एक जोखिम मैट्रिक्स का निर्माण करें, जहां।

एक खिलाड़ी की रणनीति एक योजना है जिसके अनुसार वह किसी भी संभावित स्थिति में और किसी भी संभावित तथ्यात्मक जानकारी के साथ चुनाव करता है। स्वाभाविक रूप से, खिलाड़ी खेल के दौरान निर्णय लेता है। हालाँकि, सिद्धांत रूप में, यह माना जा सकता है कि ये सभी निर्णय खिलाड़ी द्वारा पहले से किए गए थे। तब इन निर्णयों की समग्रता उसकी रणनीति बनाती है। संभावित रणनीतियों की संख्या के आधार पर, खेलों को परिमित और अनंत में विभाजित किया जाता है। गेम थ्योरी का कार्य खिलाड़ियों के लिए सिफारिशें विकसित करना है, अर्थात उनके लिए इष्टतम रणनीति निर्धारित करना है। एक इष्टतम रणनीति एक ऐसी रणनीति है जो खेल के कई दोहराव के साथ, किसी दिए गए खिलाड़ी को अधिकतम संभव औसत भुगतान प्रदान करती है।

सबसे सरल प्रकार का रणनीतिक खेल शून्य राशि वाले दो खिलाड़ियों का खेल है (पार्टियों की जीत का योग शून्य के बराबर है)। खेल में दो चालें होती हैं: खिलाड़ी ए अपनी संभावित रणनीतियों में से एक चुनता है एआई (i = 1, 2, एम), और खिलाड़ी बी रणनीति चुनता है बीजे (जे = 1, 2,।, एन), और प्रत्येक विकल्प के साथ बनाया जाता है किसी अन्य खिलाड़ी की पसंद से पूर्ण अज्ञानता।

खिलाड़ी ए का लक्ष्य फ़ंक्शन φ (एआई, बीजे) को अधिकतम करना है, बदले में, खिलाड़ी बी का लक्ष्य उसी फ़ंक्शन को कम करना है। प्रत्येक खिलाड़ी उन चरों में से एक चुन सकता है जिस पर फ़ंक्शन का मान निर्भर करता है। यदि खिलाड़ी ए कुछ रणनीतियों एआई को चुनता है, तो यह अपने आप में फ़ंक्शन φ (एआई, बीजे) के मूल्य को प्रभावित नहीं कर सकता है।

मूल्य (ऐ, बीजे) के मूल्य पर एआई का प्रभाव अनिश्चित है; चर Bj के किसी अन्य खिलाड़ी द्वारा न्यूनतमकरण (Ai, Bj) के सिद्धांत के आधार पर, चुनाव के बाद ही निश्चितता होती है। इस मामले में, बीजे किसी अन्य खिलाड़ी द्वारा निर्धारित किया जाता है। मान लीजिए (ऐ, बीजे) = aij। आइए मैट्रिक्स ए की रचना करें:

मैट्रिक्स की पंक्तियाँ एआई रणनीतियों के अनुरूप हैं, कॉलम रणनीतियों Bj के अनुरूप हैं। मैट्रिक्स ए को भुगतान या गेम मैट्रिक्स कहा जाता है। मैट्रिक्स का तत्व ऐज खिलाड़ी ए का भुगतान है यदि उसने रणनीति एआई को चुना और खिलाड़ी बी ने रणनीति बीजे को चुना।

खिलाड़ी A को कुछ रणनीति A चुनने दें; तो सबसे खराब स्थिति में (जैसे अगर चुनाव हो जाता है खिलाड़ी के लिए जाना जाता हैसी) उसे न्यूनतम एइज के बराबर भुगतान प्राप्त होगा। ऐसी संभावना का अनुमान लगाते हुए, खिलाड़ी ए को अपनी न्यूनतम अदायगी को अधिकतम करने के लिए ऐसी रणनीति चुननी चाहिए:

a = अधिकतम न्यूनतम aij

मान ए - खिलाड़ी ए की गारंटीकृत अदायगी - को खेल की कम कीमत कहा जाता है। i0 रणनीति, जो a प्राप्त करना सुनिश्चित करती है, मैक्सिमिन कहलाती है।

खिलाड़ी बी, एक रणनीति का चयन, निम्नलिखित सिद्धांत से आगे बढ़ता है: एक निश्चित रणनीति बीजी चुनते समय, उसका नुकसान मैट्रिक्स के जे-वें कॉलम के तत्वों के अधिकतम मूल्यों से अधिक नहीं होगा, अर्थात। अधिकतम aij . से कम या उसके बराबर

अधिकतम aij for . के सेट को ध्यान में रखते हुए विभिन्न अर्थ j, खिलाड़ी B स्वाभाविक रूप से j का ऐसा मान चुनता है जिस पर उसका अधिकतम नुकसान β कम से कम हो:

β = मिनट miax aij

मान β को खेल का ऊपरी मूल्य कहा जाता है, और भुगतान β के अनुरूप रणनीति Bj0 को मिनीमैक्स कहा जाता है।

भागीदारों के उचित कार्यों के साथ खिलाड़ी ए का वास्तविक लाभ निचले और ऊपरी खेल की कीमतों से सीमित है। यदि ये व्यंजक समान हैं, अर्थात्।

गेम थ्योरी एक गणितीय अनुशासन है, जिसका विषय संघर्ष की स्थितियों में निर्णय लेने के तरीके हैं।

स्थिति कहा जाता है टकरावयदि विपरीत लक्ष्यों का पीछा करने वाले कई (आमतौर पर दो) व्यक्तियों के हित इसमें टकराते हैं। प्रत्येक पक्ष अपने लक्ष्यों को प्राप्त करने के लिए कई गतिविधियों को अंजाम दे सकता है, एक पक्ष की सफलता का अर्थ है दूसरे की विफलता।

अर्थशास्त्र में, संघर्ष की स्थितियां बहुत आम हैं (आपूर्तिकर्ता और उपभोक्ता, खरीदार और विक्रेता, बैंकर और ग्राहक के बीच संबंध)। कई अन्य क्षेत्रों में भी संघर्ष की स्थिति उत्पन्न होती है।

भागीदारों के हितों में अंतर और उनमें से प्रत्येक की इच्छा से इष्टतम निर्णय लेने के लिए एक संघर्ष की स्थिति उत्पन्न होती है जो निर्धारित लक्ष्यों को सबसे बड़ी सीमा तक महसूस करती है। इस मामले में, सभी को न केवल अपने लक्ष्यों के साथ, बल्कि साथी के लक्ष्यों के साथ भी विचार करना होगा, और पहले से अज्ञात निर्णयों को ध्यान में रखना होगा जो साझेदार करेंगे।

आम तौर पर, कई माध्यमिक कारकों के कारण संघर्ष की स्थितियों का सीधे विश्लेषण करना मुश्किल होता है। संघर्ष की स्थिति के गणितीय विश्लेषण को संभव बनाने के लिए, केवल मुख्य कारकों को ध्यान में रखते हुए इसे सरल बनाया जाना चाहिए। संघर्ष की स्थिति का एक सरलीकृत औपचारिक मॉडल कहलाता है खेल, संघर्ष के पक्ष - खिलाड़ियों, और संघर्ष का परिणाम है जीतआमतौर पर, लाभ (या हानि) की मात्रा निर्धारित की जा सकती है; उदाहरण के लिए, आप शून्य के रूप में हानि, एक के रूप में लाभ और 1/2 के रूप में एक ड्रा का अनुमान लगा सकते हैं।

खेल एक संग्रह है नियमोंखिलाड़ियों के व्यवहार का वर्णन खेल को शुरू से अंत तक किसी विशेष तरीके से खेलने का प्रत्येक उदाहरण है खेल की पार्टी।नियमों द्वारा प्रदान की गई क्रियाओं में से किसी एक का चुनाव और कार्यान्वयन कहलाता है कदमखिलाड़ी। चालें व्यक्तिगत या यादृच्छिक हो सकती हैं। व्यक्तिगत चालसंभावित कार्यों में से एक के खिलाड़ी द्वारा एक सचेत विकल्प है (उदाहरण के लिए, शतरंज के खेल में एक चाल)। यादृच्छिक चाल- यह भी कई विकल्पों में से एक का विकल्प है, लेकिन यहां विकल्प खिलाड़ी द्वारा नहीं चुना जाता है, लेकिन यादृच्छिक चयन के कुछ तंत्र द्वारा (सिक्कों को फेंकना, एक फेरबदल डेक से एक कार्ड चुनना)।

रणनीतिखिलाड़ी नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक व्यक्तिगत चाल के लिए उसके कार्यों की पसंद निर्धारित करता है।



यदि खेल में केवल व्यक्तिगत चालें होती हैं, तो खेल का परिणाम निर्धारित किया जाता है यदि प्रत्येक खिलाड़ी ने अपनी रणनीति चुनी है। हालाँकि, यदि खेल में यादृच्छिक चालें हैं, तो खेल संभाव्य होगा और खिलाड़ियों की रणनीतियों का चुनाव अभी तक खेल के परिणाम को निर्धारित नहीं करेगा।

प्रति निर्णय करनाखेल, या खेल का समाधान खोजने के लिए, प्रत्येक खिलाड़ी के लिए एक रणनीति चुननी चाहिए जो शर्त को पूरा करे इष्टतमता,वे। खिलाड़ियों में से एक को प्राप्त करना चाहिए अधिकतम जीत,जब दूसरा अपनी रणनीति पर अड़ा रहता है। उसी समय, दूसरे खिलाड़ी के पास होना चाहिए न्यूनतम नुकसानयदि पूर्व अपनी रणनीति पर कायम रहता है। ऐसी रणनीतियों को इष्टतम कहा जाता है। इष्टतम रणनीतियों को स्थिरता की स्थिति को पूरा करना चाहिए, अर्थात। किसी भी खिलाड़ी के लिए इस खेल में अपनी रणनीति को छोड़ना लाभहीन होना चाहिए।

गेम थ्योरी का लक्ष्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है.

एक जोड़ी अंत खेल पर विचार करें। खिलाड़ी को चलो है एम व्यक्तिगत रणनीतियाँ, जिन्हें हम निर्दिष्ट करेंगे ए 1 , ए 2 , ..., पूर्वाह्न ... खिलाड़ी को चलो वी वहाँ है एन व्यक्तिगत रणनीतियाँ, आइए उन्हें नामित करें बी 1 , बी 2 , ..., बी एम ... वे कहते हैं कि खेल का एक आयाम है एम × एन ... किसी भी जोड़ी रणनीति के खिलाड़ियों द्वारा पसंद के परिणामस्वरूप



ए और बी जे (आई = 1, 2, ..., एम; जे = 1, 2, ..., एन)

खेल का परिणाम विशिष्ट रूप से निर्धारित होता है, अर्थात। बढ़त एक आईजेयू खिलाड़ी (सकारात्मक या नकारात्मक) और हानि ( - एक इजी खिलाड़ी वी ... मान लीजिए मान कहां रणनीतियों की किसी भी जोड़ी के लिए जाना जाता है (ए मैं, बी जे ) आव्यूह , जिसके तत्व रणनीतियों के अनुरूप अदायगी हैं एक मैं तथा बी जे कहा जाता है भुगतान मैट्रिक्सया खेल मैट्रिक्स. सामान्य फ़ॉर्मऐसा मैट्रिक्स तालिका 3.1 में प्रस्तुत किया गया है।

तालिका 3.1

इस तालिका की पंक्तियाँ खिलाड़ी की रणनीतियों के अनुरूप हैं , और कॉलम खिलाड़ी की रणनीतियों के लिए हैं वी ... आइए अगले गेम के लिए भुगतान मैट्रिक्स बनाएं।

खेल पर विचार करें एम × एन मैट्रिक्स के साथ पी = (ए आईजे), आई = 1, 2, ..., एम; जे = 1, 2, ..., एन और रणनीतियों में से सर्वश्रेष्ठ का निर्धारण करें ए 1 , ए 2 , ..., पूर्वाह्न ... रणनीति चुनना एक मैं खिलाड़ी मानना ​​चाहिए कि खिलाड़ी वी किसी एक रणनीति का जवाब देंगे बी जे जिसके लिए खिलाड़ी के लिए लाभ न्यूनतम (खिलाड़ी वी खिलाड़ी को "नुकसान" पहुंचाना चाहता है ) आइए हम द्वारा निरूपित करें α मैं , खिलाड़ी की सबसे छोटी अदायगी रणनीति चुनते समय एक मैं सभी संभावित खिलाड़ी रणनीतियों के लिए वी (सबसे छोटी संख्या in मैं- भुगतान मैट्रिक्स की पंक्ति), अर्थात।

मैक्सिमिन के अनुरूप रणनीति को कहा जाता है अधिकतम रणनीति... खिलाड़ी वी खिलाड़ी की जीत को कम करने में दिलचस्पी ; एक रणनीति चुनना बी जे , यह के लिए अधिकतम संभव लाभ को ध्यान में रखता है ... हम निरूपित करते हैं

मिनिमैक्स के अनुरूप रणनीति को मिनिमैक्स रणनीति कहा जाता है। खिलाड़ियों को सबसे "सावधान" मिनिमैक्स और मैक्सिमम रणनीतियों के चुनाव को निर्धारित करने वाला सिद्धांत कहलाता है न्यूनतम सिद्धांत... यह सिद्धांत उचित धारणा से चलता है कि प्रत्येक खिलाड़ी दुश्मन के विपरीत लक्ष्य हासिल करना चाहता है। आइए हम खेल की निचली और ऊपरी कीमतों और समस्या में संबंधित रणनीतियों का निर्धारण करें।

यदि ऊपरी और निचले खेल की कीमतें समान हैं, तो कुल मूल्यऊपर और न्यूनतम मूल्यखेल α = β = वी बुलाया खेल की शुद्ध कीमत , या खेल की कीमत पर ... खेल की कीमत के अनुरूप न्यूनतम रणनीतियाँ हैं इष्टतम रणनीतियाँ, और उनकी समग्रता है सर्वोतम उपाय , या खेल निर्णय... इस मामले में, खिलाड़ी अधिकतम गारंटी प्राप्त करता है (खिलाड़ी के व्यवहार से स्वतंत्र वी ) जीत वी और खिलाड़ी वी न्यूनतम गारंटी प्राप्त करता है (खिलाड़ी के व्यवहार की परवाह किए बिना) ) हारना वी ... कहा जाता है कि खेल का समाधान है स्थिरता , अर्थात। यदि खिलाड़ियों में से एक अपनी इष्टतम रणनीति का पालन करता है, तो दूसरे के लिए अपनी इष्टतम रणनीति से विचलित होना लाभदायक नहीं हो सकता है।

जोड़ा स्वच्छ रणनीति एक मैं तथा बी जे खेल के लिए एक इष्टतम समाधान देता है यदि और केवल यदि संबंधित तत्व एक आईजेयू , अपने कॉलम में सबसे बड़ा और अपनी पंक्ति में सबसे छोटा दोनों है। ऐसी स्थिति, यदि मौजूद हो, कहलाती है लादने की सीमा (एक काठी की सतह के समान जो एक दिशा में ऊपर और दूसरी में नीचे की ओर झुकती है)।

इन्वेंट्री प्रबंधन मॉडल की बुनियादी अवधारणाएं।

व्यापार और निर्माण दोनों में, निरंतरता सुनिश्चित करने के लिए भौतिक संसाधनों या घटकों की उचित सूची बनाए रखना आम बात है। उत्पादन की प्रक्रिया... परंपरागत रूप से, स्टॉक को एक अपरिहार्य लागत के रूप में देखा जाता है, जब बहुत कम स्तर से महंगा उत्पादन रुकावटें आती हैं, और बहुत अधिक "सुन्न" पूंजी होती है। इन्वेंट्री प्रबंधन के लिए चुनौती इन्वेंट्री के स्तर को निर्धारित करना है जो दो उल्लिखित किनारे के मामलों को संतुलित करता है।

आइए इन्वेंट्री प्रबंधन मॉडल की मुख्य विशेषताओं पर विचार करें।

मांग... संग्रहीत उत्पाद की मांग हो सकती है नियतात्मक(सरलतम स्थिति में, समय में स्थिर) या यादृच्छिक रूप से।मांग की यादृच्छिकता का वर्णन या तो मांग के एक यादृच्छिक क्षण द्वारा किया जाता है, या समय के नियतात्मक या यादृच्छिक क्षणों में मांग की एक यादृच्छिक मात्रा द्वारा किया जाता है।

गोदाम की पुनःपूर्ति।वेयरहाउस की पुनःपूर्ति या तो समय-समय पर निश्चित अंतरालों पर की जा सकती है, या जैसे ही स्टॉक समाप्त हो जाता है, अर्थात। उन्हें एक निश्चित स्तर तक कम करना।

आदेश मात्रा।स्टॉक की आवधिक पुनःपूर्ति और आकस्मिक कमी के साथ, ऑर्डर की मात्रा उस स्थिति पर निर्भर हो सकती है जो ऑर्डर देते समय देखी जाती है। ऑर्डर आमतौर पर उसी राशि के लिए जमा किया जाता है जब स्टॉक किसी दिए गए स्तर पर पहुंच जाता है - तथाकथित आदेश के बिंदु।

डिलीवरी का समय।आदर्श इन्वेंट्री प्रबंधन मॉडल में, यह माना जाता है कि ऑर्डर की गई पुनःपूर्ति तुरंत स्टोर पर पहुंचा दी जाती है। अन्य मॉडल एक निश्चित या यादृच्छिक समय अंतराल के लिए प्रसव में देरी पर विचार करते हैं।

वितरण लागत।एक नियम के रूप में, यह माना जाता है कि प्रत्येक डिलीवरी की लागत दो घटकों से बनी होती है - एकमुश्त लागत जो ऑर्डर किए गए बैच की मात्रा पर निर्भर नहीं करती है, और लागत जो बैच आकार पर निर्भर करती है (अक्सर रैखिक रूप से)।

भंडारण लागत।इन्वेंट्री प्रबंधन के अधिकांश मॉडलों में, गोदाम की मात्रा को व्यावहारिक रूप से असीमित माना जाता है, और संग्रहीत इन्वेंट्री की मात्रा एक नियंत्रित मूल्य के रूप में कार्य करती है। इस मामले में, यह माना जाता है कि समय की प्रति यूनिट स्टॉक की प्रत्येक इकाई के भंडारण के लिए एक निश्चित शुल्क लिया जाता है।

कमी दंड।कमी को रोकने के लिए कोई भी गोदाम बनाया जाता है एक निश्चित प्रकार कासेवित प्रणाली में उत्पाद। सही समय पर स्टॉक की कमी से उपकरण डाउनटाइम, उत्पादन की अनियमितता आदि से जुड़े नुकसान होते हैं। इन नुकसानों को कहा जाता है घाटे का दंड।

स्टॉक नामकरण।सरलतम मामलों में, यह माना जाता है कि एक ही प्रकार के उत्पाद या एक सजातीय उत्पाद का स्टॉक गोदाम में संग्रहीत किया जाता है। अधिक में मुश्किल मामलेमाना जाता है विविध स्टॉक।

गोदाम प्रणाली संरचना।सबसे पूर्ण विकसित गणितीय मॉडलएकल स्लेड। हालांकि, व्यवहार में, अधिक जटिल संरचनाएं भी हैं: अलग-अलग अवधियों के साथ दासों की पदानुक्रमित प्रणालियां और ऑर्डर की डिलीवरी का समय, समान पदानुक्रम स्तर के गोदामों के बीच स्टॉक के आदान-प्रदान की संभावना के साथ, आदि।

अपनाई गई इन्वेंट्री प्रबंधन रणनीति की प्रभावशीलता का मानदंड है: लागत समारोह (लागत),स्टॉक किए गए उत्पाद की आपूर्ति की कुल लागत, उसके भंडारण और दंड की लागत का प्रतिनिधित्व करना।

इन्वेंट्री प्रबंधन में इन्वेंट्री के साथ पुनःपूर्ति और खपत की ऐसी रणनीति खोजने में शामिल है, जिसमें लागत फ़ंक्शन न्यूनतम मूल्य लेता है।

कार्य करने दें, और क्रमशः व्यक्त करें:

स्टॉक की पुनःपूर्ति,

इन्वेंटरी खपत,

संग्रहीत उत्पाद की मांग

कुछ समय के लिए।

इन्वेंट्री प्रबंधन मॉडल में, इन कार्यों के समय व्युत्पन्न आमतौर पर उपयोग किए जाते हैं, जिन्हें क्रमशः कहा जाता है,

खेल कहा जाता है एक शून्य-राशि का खेल, या विरोधीयदि एक खिलाड़ी का लाभ दूसरे के नुकसान के बराबर है, अर्थात। खेल के पूर्ण कार्य के लिए, उनमें से एक के मूल्य को इंगित करना पर्याप्त है। अगर हम निरूपित करते हैं - खिलाड़ियों में से एक की जीत, बी- दूसरे का भुगतान, फिर शून्य-राशि के खेल के लिए बी = - ए, इसलिए यह विचार करने के लिए पर्याप्त है, उदाहरण के लिए, .

नियमों द्वारा प्रदान की गई क्रियाओं में से किसी एक का चुनाव और कार्यान्वयन कहलाता है कदमखिलाड़ी। चालें व्यक्तिगत या यादृच्छिक हो सकती हैं।

व्यक्तिगत चालसंभावित कार्यों में से एक के खिलाड़ी द्वारा एक सचेत विकल्प है (उदाहरण के लिए, शतरंज के खेल में एक चाल)।

यादृच्छिक चालएक बेतरतीब ढंग से चुनी गई क्रिया है (उदाहरण के लिए, फेरबदल किए गए डेक से कार्ड चुनना)। अपने काम में मैं केवल खिलाड़ियों की व्यक्तिगत चालों पर विचार करूंगा।

रणनीतिएक खिलाड़ी नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक व्यक्तिगत चाल के लिए उसकी कार्रवाई का विकल्प निर्धारित करता है। आमतौर पर, खेल के दौरान, प्रत्येक व्यक्तिगत चाल के साथ, खिलाड़ी विशिष्ट स्थिति के आधार पर चुनाव करता है। हालांकि, सिद्धांत रूप में, यह संभव है कि सभी निर्णय खिलाड़ी द्वारा अग्रिम रूप से किए जाते हैं (किसी भी स्थिति के उत्पन्न होने के जवाब में)। इसका मतलब है कि खिलाड़ी ने एक निश्चित रणनीति चुनी है, जिसे नियमों की सूची या कार्यक्रम के रूप में सेट किया जा सकता है। (इस तरह आप कंप्यूटर से गेम खेल सकते हैं)। खेल कहा जाता है अंतिमयदि प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ हों, और अनंत- अन्यथा।

खेल को हल करने के लिए, या खेल का समाधान खोजने के लिए, प्रत्येक खिलाड़ी के लिए यह आवश्यक है कि वह ऐसी रणनीति चुने जो शर्त को पूरा करे इष्टतमता, अर्थात। खिलाड़ियों में से एक को प्राप्त करना चाहिए अधिकतम जीतजब दूसरा अपनी रणनीति पर अड़ा रहता है। उसी समय, दूसरे खिलाड़ी के पास होना चाहिए न्यूनतम नुकसानयदि पूर्व अपनी रणनीति पर कायम रहता है। ऐसा रणनीतिकहा जाता है इष्टतम... इष्टतम रणनीतियों को भी संतुष्ट करना चाहिए स्थिरता की स्थिति, अर्थात। किसी भी खिलाड़ी के लिए इस खेल में अपनी रणनीति को छोड़ना लाभहीन होना चाहिए।

गेम थ्योरी का उद्देश्य: प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति का निर्धारण। इष्टतम रणनीति चुनते समय, यह मान लेना स्वाभाविक है कि दोनों खिलाड़ी अपने हितों के दृष्टिकोण से यथोचित व्यवहार करते हैं।

विरोधी खेल जिसमें प्रत्येक खिलाड़ी के पास रणनीतियों का एक सीमित सेट होता है, कहलाते हैं मैट्रिक्स खेल... इस नाम को इस तरह के खेलों का वर्णन करने की निम्नलिखित संभावना द्वारा समझाया गया है। हम एक आयताकार तालिका बनाते हैं जिसमें पंक्तियाँ पहले खिलाड़ी की रणनीतियों के अनुरूप होती हैं, स्तंभ दूसरे की रणनीतियों के अनुरूप होते हैं, और पंक्तियों और स्तंभों के चौराहे पर तालिका की कोशिकाएँ खेल की स्थितियों के अनुरूप होती हैं। . यदि हम प्रत्येक सेल में पहले खिलाड़ी के भुगतान को इसी स्थिति में डालते हैं, तो हमें कुछ मैट्रिक्स के रूप में खेल का विवरण मिलता है। इस मैट्रिक्स को कहा जाता है खेल मैट्रिक्सया अदायगी मैट्रिक्स.

एक और एक ही अंतिम विरोधी खेल को अलग-अलग मैट्रिक्स द्वारा वर्णित किया जा सकता है, जो केवल पंक्तियों और स्तंभों के क्रम में एक दूसरे से भिन्न होते हैं।

खेल पर विचार करें एम एक्स एन मैट्रिक्स के साथ = (एक ij), मैं = 1,2, ..., एम; जे = 1,2, ..., एन और रणनीतियों में से सर्वश्रेष्ठ का निर्धारण करें ए 1, ए 2, ..., ए एम... रणनीति चुनना एक मैंखिलाड़ी मानना ​​चाहिए कि खिलाड़ी वीकिसी एक रणनीति का जवाब देंगे बी जेजिसके लिए खिलाड़ी के लिए लाभ न्यूनतम (खिलाड़ी वीखिलाड़ी को "नुकसान" पहुंचाना चाहता है ) आइए हम द्वारा निरूपित करें मैं, खिलाड़ी की सबसे छोटी अदायगी रणनीति चुनते समय एक मैंसभी संभावित खिलाड़ी रणनीतियों के लिए वी(सबसे छोटी संख्या in i-वें पे मैट्रिक्स रो), यानी।

एक मैं = एक आईजेयू , जे = 1, ..., एन.

सभी नंबरों के बीच मैं (मैं = 1,2, ..., एम ) सबसे बड़ा चुनें। चलो कॉल करो खेल की निचली कीमतया अधिकतम अदायगी (अधिकतम)। यह खिलाड़ी की जीत की गारंटी है। किसी भी खिलाड़ी की रणनीति के लिए वी... अत, , मैं = 1, ..., एम; जे = 1, ..., एन

मैक्सिमिन के अनुरूप रणनीति को कहा जाता है अधिकतम रणनीति... खिलाड़ी वीखिलाड़ी की जीत को कम करने में दिलचस्पी ; एक रणनीति चुनना बी जे, यह के लिए अधिकतम संभव लाभ को ध्यान में रखता है .

आइए निरूपित करें: β मैं = एक आईजेयू , मैं = 1, ..., एम

सभी नंबरों के बीच बी जेसबसे छोटा चुनें और कॉल करें β खेल की शीर्ष कीमतया मिनिमैक्स जीत (मिनीमैक्स)। यह खिलाड़ी के लिए एक गारंटीकृत नुकसान है वी.

अत, मैं = 1, ..., एम; जे = 1, ..., एन।

मिनिमैक्स के अनुरूप कार्यनीति कहलाती है मिनिमैक्स रणनीति.

खिलाड़ियों को सबसे "सावधान" मिनिमैक्स और मैक्सिमम रणनीतियों के चुनाव को निर्धारित करने वाला सिद्धांत कहलाता है न्यूनतम सिद्धांत।यह सिद्धांत उचित धारणा से चलता है कि प्रत्येक खिलाड़ी दुश्मन के विपरीत लक्ष्य हासिल करना चाहता है।

व्याख्यान 9.खेल मॉडल की अवधारणा। भुगतान मैट्रिक्स।

§ खेल सिद्धांत के 6 तत्व

6.1 खेल मॉडल की अवधारणा।

संघर्ष की स्थिति के गणितीय मॉडल को कहा जाता है खेल , संघर्ष के पक्ष - खिलाड़ियों, और संघर्ष का परिणाम है जीत .

प्रत्येक औपचारिक खेल के लिए, हम परिचय देते हैं नियमों , वे। शर्तों की एक प्रणाली जो निर्धारित करती है: 1) खिलाड़ियों के कार्यों के लिए विकल्प; 2) प्रत्येक खिलाड़ी के पास भागीदारों के व्यवहार के बारे में कितनी जानकारी है; 3) वह लाभ जिससे प्रत्येक कार्य समूह की ओर जाता है। आमतौर पर, लाभ (या हानि) की मात्रा निर्धारित की जा सकती है; उदाहरण के लिए, आप शून्य के रूप में हानि, एक के रूप में लाभ और 1/2 के रूप में एक ड्रा का अनुमान लगा सकते हैं। खेल के परिणामों के मात्रात्मक मूल्यांकन को कहा जाता है भुगतान .

खेल कहा जाता है भाप से भरा कमरा , यदि दो खिलाड़ी इसमें भाग लेते हैं, और विभिन्न , यदि खिलाड़ियों की संख्या दो से अधिक है। हम केवल युग्मित खेलों पर विचार करेंगे। इनमें दो खिलाड़ी शामिल हैं तथा वी,जिनके हित विपरीत हैं, और खेल से हमारा तात्पर्य पक्ष से क्रियाओं की एक श्रृंखला से है तथा वी

खेल कहा जाता है एक शून्य-राशि का खेल, या विरोधी आकाश , यदि एक खिलाड़ी का लाभ दूसरे के नुकसान के बराबर है, अर्थात। दोनों पक्षों की जीत का योग शून्य के बराबर है। खेल के पूर्ण कार्य के लिए, उनमें से किसी एक के मूल्य को इंगित करना पर्याप्त है . अगर हम निरूपित करते हैं - खिलाड़ियों में से एक की जीत, बीदूसरे का भुगतान, फिर शून्य-राशि के खेल के लिए बी =, इसलिए यह विचार करने के लिए पर्याप्त है, उदाहरण के लिए ए।

नियमों द्वारा प्रदान की गई क्रियाओं में से किसी एक का चुनाव और कार्यान्वयन कहलाता है कदम खिलाड़ी। चालें हो सकती हैं व्यक्तिगत तथा यादृच्छिक रूप से . व्यक्तिगत चाल यह संभावित कार्यों में से एक के खिलाड़ी द्वारा एक सचेत विकल्प है (उदाहरण के लिए, शतरंज के खेल में एक चाल)। प्रत्येक व्यक्तिगत चाल के लिए संभावित विकल्पों का सेट खेल के नियमों द्वारा नियंत्रित होता है और दोनों पक्षों के पिछले चालों के पूरे सेट पर निर्भर करता है।

यादृच्छिक चाल यह एक बेतरतीब ढंग से चुनी गई क्रिया है (उदाहरण के लिए, फेरबदल किए गए डेक से कार्ड चुनना)। खेल को गणितीय रूप से परिभाषित करने के लिए, खेल के नियमों को प्रत्येक यादृच्छिक चाल के लिए इंगित करना चाहिए संभावना वितरण संभावित नतीजे।

कुछ खेलों में केवल यादृच्छिक चालें (तथाकथित विशुद्ध रूप से जुआ) या केवल व्यक्तिगत चालें (शतरंज, चेकर्स) शामिल हो सकती हैं। अधिकांश ताश के खेल मिश्रित खेल होते हैं, अर्थात उनमें यादृच्छिक और व्यक्तिगत दोनों चालें होती हैं। भविष्य में, हम केवल खिलाड़ियों की व्यक्तिगत चालों पर विचार करेंगे।

खेलों को न केवल उनकी चाल (व्यक्तिगत, यादृच्छिक) की प्रकृति से वर्गीकृत किया जाता है, बल्कि प्रकृति और प्रत्येक खिलाड़ी को दूसरे के कार्यों के बारे में जानकारी की मात्रा से भी वर्गीकृत किया जाता है। खेलों का एक विशेष वर्ग तथाकथित "गेम्स विथ ." से बना है पूरी जानकारी». पूरी जानकारी वाला गेम एक खेल कहा जाता है जिसमें प्रत्येक खिलाड़ी प्रत्येक व्यक्तिगत चाल पर व्यक्तिगत और यादृच्छिक दोनों, पिछली सभी चालों के परिणामों को जानता है। पूरी जानकारी वाले खेलों के उदाहरण हैं शतरंज, चेकर्स और प्रसिद्ध खेल"गाठें और चौराहें"। व्यावहारिक महत्व के अधिकांश खेल पूरी जानकारी वाले खेलों के वर्ग से संबंधित नहीं होते हैं, क्योंकि दुश्मन के कार्यों के बारे में अनिश्चितता आमतौर पर संघर्ष की स्थितियों का एक अनिवार्य तत्व है।

गेम थ्योरी की मूल अवधारणाओं में से एक अवधारणा है रणनीति .

रणनीति एक खिलाड़ी नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक व्यक्तिगत चाल के लिए उसकी कार्रवाई का विकल्प निर्धारित करता है। आमतौर पर, खेल के दौरान, प्रत्येक व्यक्तिगत चाल के साथ, खिलाड़ी विशिष्ट स्थिति के आधार पर चुनाव करता है। हालांकि, सिद्धांत रूप में, यह संभव है कि सभी निर्णय खिलाड़ी द्वारा अग्रिम रूप से किए जाते हैं (किसी भी स्थिति के उत्पन्न होने के जवाब में)। इसका मतलब है कि खिलाड़ी ने एक निश्चित रणनीति चुनी है, जिसे नियमों की सूची या कार्यक्रम के रूप में सेट किया जा सकता है। (इस तरह आप कंप्यूटर से गेम खेल सकते हैं)। खेल कहा जाता है अंतिम , यदि प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ हों, और अनंत .– अन्यथा।

प्रति निर्णय करना खेल , या ढूँढो खेल समाधान , प्रत्येक खिलाड़ी के लिए एक रणनीति चुननी चाहिए जो शर्त को पूरा करे इष्टतमता , वे। खिलाड़ियों में से एक को प्राप्त करना चाहिए अधिकतम जीत, जब दूसरा खिलाड़ी अपनी रणनीति का पालन करता है, उसी समय, दूसरे खिलाड़ी के पास होना चाहिए न्यूनतम नुकसान , यदि पूर्व अपनी रणनीति पर कायम रहता है। ऐसी रणनीतियों को कहा जाता है इष्टतम . इष्टतम रणनीतियों को भी शर्त को पूरा करना चाहिए स्थिरता , वे। किसी भी खिलाड़ी के लिए इस खेल में अपनी रणनीति को छोड़ना लाभहीन होना चाहिए।

यदि खेल को कई बार दोहराया जाता है, तो खिलाड़ियों को प्रत्येक विशेष खेल में जीतने और हारने में रुचि नहीं हो सकती है, औसत लाभ (हानि) सभी पार्टियों में।

गेम थ्योरी का लक्ष्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है।

6.2. भुगतान मैट्रिक्स। निचले और ऊपरी खेल की कीमतें

अंतिम खेल जिसमें खिलाड़ी यह है टीरणनीति, और खिलाड़ी बी - पीरणनीतियों को खेल कहा जाता है।

खेल पर विचार करें
दो खिलाड़ी तथा वी("हम" और "दुश्मन")।

खिलाड़ी को चलो है टीव्यक्तिगत रणनीतियाँ, जिन्हें हम निर्दिष्ट करेंगे
... खिलाड़ी को चलो वीवहाँ है एनव्यक्तिगत रणनीतियाँ, आइए उन्हें नामित करें
.

प्रत्येक पक्ष को एक विशिष्ट रणनीति चुनने दें; हमारे लिए यह होगा , दुश्मन के लिए ... किसी भी जोड़ी रणनीति के खिलाड़ियों द्वारा पसंद के परिणामस्वरूप तथा (
) खेल का परिणाम विशिष्ट रूप से निर्धारित होता है, अर्थात। बढ़त खिलाड़ी (सकारात्मक या नकारात्मक) और हारना
खिलाड़ी वी

मान लीजिए मान रणनीतियों की किसी भी जोड़ी के लिए जाने जाते हैं ( ,). आव्यूह
,
, जिसके तत्व रणनीतियों के अनुरूप जीत हैं तथा , बुलाया भुगतान मैट्रिक्स या खेल का मैट्रिक्स। इस मैट्रिक्स की पंक्तियाँ खिलाड़ी की रणनीतियों के अनुरूप होती हैं ए,और कॉलम खिलाड़ी की रणनीतियों के लिए हैं बी... इन रणनीतियों को स्वच्छ रणनीति कहा जाता है।

गेम मैट्रिक्स
की तरह लगता है:

खेल पर विचार करें
मैट्रिक्स के साथ

और रणनीतियों में से सर्वश्रेष्ठ का निर्धारण करें
. रणनीति चुनना , खिलाड़ी मानना ​​चाहिए कि खिलाड़ी वीकिसी एक रणनीति का जवाब देंगे , जिसके लिए खिलाड़ी के लिए लाभ न्यूनतम (खिलाड़ी वीखिलाड़ी को "नुकसान" पहुंचाना चाहता है ).

आइए हम द्वारा निरूपित करें एक खिलाड़ी का सबसे छोटा भुगतान रणनीति चुनते समय सभी संभावित खिलाड़ी रणनीतियों के लिए वी(सबसे छोटी संख्या in मैं- भुगतान मैट्रिक्स की पंक्ति), अर्थात।

(1)

सभी नंबरों के बीच (
) सबसे बड़ा चुनें:
.

चलो कॉल करो
एनग्रा की निचली कीमत, या अधिकतम जीत (अधिकतम)। खिलाड़ी बी की किसी भी रणनीति के लिए खिलाड़ी ए के लिए यह गारंटीकृत जीत है। अत,

. (2)

मैक्सिमिन के अनुरूप रणनीति को कहा जाता है अधिकतम रणनीति . खिलाड़ी वीखिलाड़ी की जीत को कम करने में दिलचस्पी ए,एक रणनीति चुनना , वह इस मामले में अधिकतम संभव लाभ को ध्यान में रखता है ए।हम निरूपित करते हैं

. (3)

सभी नंबरों के बीच सबसे छोटा चुनें

और बुलाओ खेल की शीर्ष कीमत या मिनिमैक्स जीत (मिनीमैक्स)। खिलाड़ी बी को खोने के लिए अहंकार की गारंटी है . फलस्वरूप,

. (4)

मिनिमैक्स के अनुरूप कार्यनीति कहलाती है मिनिमैक्स रणनीति।

खिलाड़ियों को सबसे "सावधान" मिनिमैक्स और मैक्सिमम रणनीतियों के चुनाव को निर्धारित करने वाला सिद्धांत कहलाता है न्यूनतम सिद्धांत . यह सिद्धांत उचित धारणा से चलता है कि प्रत्येक खिलाड़ी दुश्मन के विपरीत लक्ष्य हासिल करना चाहता है।

प्रमेय।खेल की कम कीमत हमेशा खेल की ऊपरी कीमत से अधिक नहीं होती है
.

यदि खेल के ऊपरी और निचले मूल्य समान हैं, तो खेल की ऊपरी और निचली कीमतों का कुल मूल्य
बुलाया खेल की शुद्ध कीमत, या खेल की कीमत पर। खेल की कीमत के अनुरूप न्यूनतम रणनीतियाँ हैं इष्टतम रणनीतियाँ , और उनकी समग्रता - सर्वोतम उपाय या खेल के निर्णय से। इस मामले में, खिलाड़ी अधिकतम गारंटी प्राप्त करता है (खिलाड़ी के व्यवहार से स्वतंत्र वी)बढ़त वीऔर खिलाड़ी वीन्यूनतम गारंटी प्राप्त करता है (खिलाड़ी के व्यवहार की परवाह किए बिना) ए)हारी वी... कहा जाता है कि खेल का समाधान है स्थिरता , वे। यदि खिलाड़ियों में से एक अपनी इष्टतम रणनीति का पालन करता है, तो दूसरे के लिए अपनी इष्टतम रणनीति से विचलित होना लाभदायक नहीं हो सकता है।

यदि खिलाड़ियों में से एक (उदाहरण के लिए ए)अपनी इष्टतम रणनीति और दूसरे खिलाड़ी पर टिका रहता है (वी)किसी भी तरह से अपनी इष्टतम रणनीति से विचलित हो जाएगा, तब विचलन करने वाले खिलाड़ी के लिए यह कभी भी लाभदायक नहीं हो सकता है;ऐसे खिलाड़ी विचलन वीजीत को अपरिवर्तित छोड़ सकते हैं। और सबसे खराब स्थिति में, इसे बढ़ाएं।

इसके विपरीत यदि वीअपनी इष्टतम रणनीति का पालन करता है, और अपने आप से विचलित हो जाता है, तो यह किसी भी स्थिति में फायदेमंद नहीं हो सकता है ए।

स्वच्छ रणनीतियों की एक जोड़ी तथा खेल के लिए एक इष्टतम समाधान देता है यदि और केवल यदि संबंधित तत्व अपने कॉलम में सबसे बड़ा और अपनी पंक्ति में सबसे छोटा दोनों है। ऐसी स्थिति, यदि मौजूद हो, कहलाती है लादने की सीमा। ज्यामिति में, एक सतह पर एक बिंदु जिसमें एक निर्देशांक के साथ-साथ न्यूनतम और दूसरे के साथ अधिकतम का गुण होता है, कहलाता है सैडल बिंदु, सादृश्य द्वारा इस शब्द का प्रयोग गेम थ्योरी में किया जाता है।

एक खेल जिसके लिए
,
बुलाया काठी बिंदु खेल। तत्त्व इस संपत्ति को रखने, मैट्रिक्स का सैडल पॉइंट।

इसलिए, सैडल पॉइंट वाले प्रत्येक गेम के लिए, एक समाधान होता है जो दोनों पक्षों के लिए इष्टतम रणनीतियों की एक जोड़ी को परिभाषित करता है, जिसमें निम्नलिखित गुण होते हैं।

1) यदि दोनों पक्ष अपनी इष्टतम रणनीतियों का पालन करते हैं, तो औसत अदायगी शुद्ध खेल मूल्य के बराबर होती है वी, जो एक ही समय में इसकी निचली और ऊपरी कीमत है।

2) यदि एक पक्ष अपनी इष्टतम रणनीति का पालन करता है, और दूसरा अपने से विचलित होता है, तो विचलित पक्ष केवल इससे हार सकता है और किसी भी स्थिति में अपने लाभ को नहीं बढ़ा सकता है।

सैडल पॉइंट वाले खेलों का वर्ग सैद्धांतिक और व्यावहारिक दोनों ही दृष्टिकोण से बहुत रुचि रखता है।

गेम थ्योरी में, यह साबित होता है कि, विशेष रूप से, पूरी जानकारी वाले प्रत्येक गेम में एक सैडल पॉइंट होता है, और इसलिए, ऐसे प्रत्येक गेम का समाधान होता है, यानी औसत भुगतान देने वाले दोनों पक्षों की इष्टतम रणनीतियों की एक जोड़ी होती है। खेल की कीमत के बराबर। यदि पूरी जानकारी वाले खेल में केवल व्यक्तिगत चालें होती हैं, तो जब प्रत्येक पक्ष अपनी इष्टतम रणनीति लागू करता है, तो उसे हमेशा पूरी तरह से निश्चित परिणाम में समाप्त होना चाहिए, अर्थात् एक जीत जो खेल की कीमत के बराबर है।

© 2021 skudelnica.ru - प्यार, विश्वासघात, मनोविज्ञान, तलाक, भावनाएं, झगड़े