शुद्ध रणनीति खेल। मिश्रित रणनीतियाँ

घर / भूतपूर्व

सिद्धांत खेल रणनीति मिश्रित

मिश्रित रणनीतियाँ

यदि मैट्रिक्स गेम में शुद्ध रणनीतियों में कोई सैडल पॉइंट नहीं है, तो गेम की ऊपरी और निचली कीमतें मिलती हैं। वे दिखाते हैं कि खिलाड़ी 1 को ऊपरी गेम की कीमत से अधिक जीत नहीं मिलेगी, और उस खिलाड़ी 1 को जीत की गारंटी है जो कम गेम मूल्य से कम नहीं है।

एक खिलाड़ी की मिश्रित रणनीति दी गई संभावनाओं के साथ समान परिस्थितियों में खेल के कई दोहराव के साथ उसकी शुद्ध रणनीतियों का एक पूरा सेट है। आइए संक्षेप में कहें कि क्या कहा गया है और मिश्रित रणनीतियों का उपयोग करने के लिए शर्तों को सूचीबद्ध करें:

  • * एक काठी बिंदु के बिना खेलें;
  • * खिलाड़ी दी गई संभावनाओं के साथ शुद्ध रणनीतियों के यादृच्छिक मिश्रण का उपयोग करते हैं;
  • * खेल समान परिस्थितियों में कई बार दोहराया जाता है;
  • * प्रत्येक चाल में, किसी भी खिलाड़ी को किसी अन्य खिलाड़ी द्वारा रणनीति के चुनाव के बारे में सूचित नहीं किया जाता है;
  • * खेल के परिणामों के औसत की अनुमति है।

मिश्रित रणनीतियों के लिए निम्नलिखित संकेतन का उपयोग किया जाता है।

खिलाड़ी 1 के लिए, एक मिश्रित रणनीति जिसमें शुद्ध रणनीति ए 1, ए 2, ..., ए एम के साथ संबंधित संभावनाएं पी 1, पी 2, ..., पी एम के आवेदन शामिल हैं।

खिलाड़ी 2 . के लिए

q j शुद्ध रणनीति B j को लागू करने की प्रायिकता है।

मामले में जब р i = 1, खिलाड़ी 1 के लिए हमारे पास एक शुद्ध रणनीति है

खिलाड़ी की शुद्ध रणनीति ही संभव है असंगत घटनाएं... मैट्रिक्स गेम में, मैट्रिक्स ए को जानना (यह खिलाड़ी 1 और खिलाड़ी 2 दोनों पर लागू होता है), इसे निर्धारित किया जा सकता है दिए गए वैक्टरऔर औसत अदायगी ( अपेक्षित मूल्यप्रभाव) खिलाड़ी 1 का:

वेक्टर कहां और हैं;

p i और q i सदिशों के घटक हैं।

अपनी मिश्रित रणनीतियों को लागू करके, खिलाड़ी 1 अपने औसत भुगतान को अधिकतम करने का प्रयास करता है, और खिलाड़ी 2 - इस प्रभाव को न्यूनतम संभव मूल्य पर लाने के लिए। प्लेयर 1 हासिल करना चाहता है

प्लेयर 2 सुनिश्चित करता है कि शर्त पूरी हो गई है

आइए हम खिलाड़ियों 1 और 2 की इष्टतम मिश्रित रणनीतियों के संगत सदिशों को भी निरूपित करें, अर्थात्। ऐसे वैक्टर और जिनके लिए समानता

खेल की कीमत खिलाड़ी 1 की औसत अदायगी है जब दोनों खिलाड़ी मिश्रित रणनीतियों का उपयोग करते हैं। इसलिए, मैट्रिक्स गेम का समाधान है:

  • - खिलाड़ी 1 की इष्टतम मिश्रित रणनीति;
  • - खिलाड़ी 2 की इष्टतम मिश्रित रणनीति;

खेल की कीमत।

मिश्रित रणनीतियाँइष्टतम होगा (और) यदि वे फ़ंक्शन के लिए एक सैडल पॉइंट बनाते हैं यानी।

गणितीय खेलों के लिए एक बुनियादी प्रमेय है।

किसी भी मैट्रिक्स ए के साथ मैट्रिक्स गेम के लिए, मात्रा

मौजूद हैं और एक दूसरे के बराबर हैं: = =।

यह ध्यान दिया जाना चाहिए कि इष्टतम रणनीतियों का चयन करते समय, खिलाड़ी 1 को हमेशा औसत भुगतान की गारंटी दी जाएगी, जो कि खिलाड़ी 2 की किसी भी निश्चित रणनीति (और, इसके विपरीत, खिलाड़ी 2 के लिए) के लिए खेल की कीमत से कम नहीं होगी। खिलाड़ियों 1 और 2 की सक्रिय रणनीतियां गैर-शून्य संभावनाओं वाले संबंधित खिलाड़ियों की इष्टतम मिश्रित रणनीतियों में शामिल रणनीतियां हैं। इसका मतलब यह है कि खिलाड़ियों की इष्टतम मिश्रित रणनीतियों की संरचना में उनकी सभी प्राथमिकता निर्दिष्ट रणनीतियां शामिल नहीं हो सकती हैं।

खेल को हल करने का अर्थ है खेल की कीमत और इष्टतम रणनीतियों का पता लगाना। हम मैट्रिक्स गेम के लिए इष्टतम मिश्रित रणनीतियों को खोजने के तरीकों पर विचार करना शुरू करेंगे, मैट्रिक्स 22 द्वारा वर्णित सबसे सरल गेम के साथ। सैडल पॉइंट गेम पर विशेष रूप से विचार नहीं किया जाएगा। यदि एक काठी बिंदु प्राप्त किया जाता है, तो इसका मतलब है कि लाभहीन रणनीतियाँ हैं जिन्हें छोड़ दिया जाना चाहिए। एक काठी बिंदु की अनुपस्थिति में, दो इष्टतम मिश्रित रणनीतियाँ प्राप्त की जा सकती हैं। जैसा कि उल्लेख किया गया है, ये मिश्रित रणनीतियाँ इस प्रकार लिखी गई हैं:

इसका मतलब है कि एक भुगतान मैट्रिक्स है

ए 11 पी 1 + ए 21 पी 2 =; (1.16)

ए 12 पी 1 + ए 22 पी 2 =; (1.17)

पी 1 + पी 2 = 1. (1.18)

ए 11 पी 1 + ए 21 (1 - पी 1) = ए 12 पी 1 + ए 22 (1 - पी 1); (1.19)

ए 11 पी 1 + ए 21 - ए 21 पी 1 = ए 12 पी 1 + ए 22 - ए 22 पी 1, (1.20)

जहाँ से हम इष्टतम मान प्राप्त करते हैं और:

जानने और, हम पाते हैं:

गणना करने के बाद, हम पाते हैं और:

ए 11 क्यू 1 + ए 12 क्यू 2 =; क्यू 1 + क्यू 2 = 1; (1.24)

ए 11 क्यू 1 + ए 12 (1 - क्यू 1) =। (1.25)

11 ए 12 के लिए। (1.26)

समस्या हल हो गई है, क्योंकि वैक्टर और खेल की कीमत मिल गई है। भुगतान ए का मैट्रिक्स होने से समस्या को ग्राफिक रूप से हल करना संभव है। इस पद्धति के साथ, समाधान एल्गोरिथ्म बहुत सरल है (चित्र। 2.1)।

  • 1. इकाई लंबाई का एक खंड भुज अक्ष के अनुदिश आलेखित किया जाता है।
  • 2. रणनीति ए 1 के लिए ऑर्डिनेट जीत है।
  • 3. कोर्डिनेट अक्ष के समानांतर एक रेखा पर, बिंदु 1 पर, जीत को रणनीति a 2 के साथ जमा किया जाता है।
  • 4. खंडों के सिरों को 11-बी 11, ए 12-बी 21, ए 22-बी 22, ए 21-बी 12 और दो सीधी रेखाएं बी 11 बी 12 और बी 21 बी 22 के लिए नामित किया गया है।
  • 5. प्रतिच्छेदन बिंदु की कोटि निर्धारित की जाती है। यह बराबर है। बिंदु c का भुज p 2 (p 1 = 1 - p 2) के बराबर है।

चावल। 1.1.

इस पद्धति में आवेदन का काफी व्यापक क्षेत्र है। यह पर आधारित है सामान्य सम्पतिखेल एमएन, जिसमें यह तथ्य शामिल है कि किसी भी खेल एमएन में प्रत्येक खिलाड़ी के पास एक इष्टतम मिश्रित रणनीति होती है जिसमें शुद्ध रणनीतियों की संख्या अधिकतम न्यूनतम (एम, एन) होती है। इस संपत्ति से, कोई एक प्रसिद्ध परिणाम प्राप्त कर सकता है: किसी भी खेल 2n और m2 में, प्रत्येक इष्टतम रणनीति में अधिकतम दो सक्रिय रणनीतियाँ होती हैं। इसलिए, किसी भी खेल 2n और m2 को खेल 22 में घटाया जा सकता है। इसलिए, खेल 2n और m2 को आलेखीय रूप से हल किया जा सकता है। यदि एक परिमित खेल के मैट्रिक्स का आयाम mn है, जहाँ m> 2 और n> 2 है, तो इष्टतम मिश्रित रणनीतियों को निर्धारित करने के लिए रैखिक प्रोग्रामिंग का उपयोग किया जाता है।

शुद्ध रणनीतिखिलाड़ी I, अदायगी मैट्रिक्स A की n पंक्तियों में से एक को चुन रहा है, और खिलाड़ी II की शुद्ध रणनीति उसी मैट्रिक्स के स्तंभों में से एक को चुन रही है।

इष्टतम स्वच्छ रणनीतिखिलाड़ी मिश्रित खिलाड़ियों से एक अनिवार्य इकाई p i = 1, q i = 1 की उपस्थिति से भिन्न होते हैं। उदाहरण के लिए: P (1,0), Q (1,0)। यहां पी 1 = 1, क्यू 1 = 1।

समस्या 1
भुगतान मैट्रिक्स का उपयोग करते हुए, सख्त प्रभुत्व के सिद्धांत का उपयोग करके इष्टतम स्वच्छ रणनीतियों का पता लगाएं। उत्तर के रूप में, सदिश P*, Q* लिखिए।



आर 1

R2

R3

आर4

एस 1

3

1

2

5

एस 2

2

0

0

3

S3

-3

-5

-5

-2

एस 4

0

-2

-2

1

समाधान:

हम मैट्रिक्स गेम कैलकुलेटर का उपयोग करके सभी समस्याओं का समाधान करते हैं।

हम मानते हैं कि खिलाड़ी I अपनी रणनीति चुनता है ताकि उसका अधिकतम भुगतान प्राप्त हो सके, और खिलाड़ी II अपनी रणनीति चुनता है ताकि खिलाड़ी I के भुगतान को कम किया जा सके।

खिलाड़ियोंबी 1बी 2बी 3बी 4ए = मिनट (ए मैं)
ए 13 1 2 5 1
ए 22 0 0 3 0
ए 3-3 -5 -5 -2 -5
ए 40 -2 -2 1 -2
बी = अधिकतम (बी मैं)3 1 2 5
हम खेल की कम कीमत a = अधिकतम (a) = 1 द्वारा निर्धारित गारंटीकृत भुगतान पाते हैं, जो अधिकतम शुद्ध रणनीति A 1 को इंगित करता है।
खेल की ऊपरी कीमत b = min (b j) = 1 है।
सैडल पॉइंट (1, 2) विकल्पों की एक जोड़ी (ए 1, बी 2) के समाधान को इंगित करता है। खेल की कीमत 1 है।
2. प्रमुख पंक्तियों और प्रमुख स्तंभों के लिए पेआउट मैट्रिक्स की जाँच करना।
कभी-कभी, गेम मैट्रिक्स के एक साधारण विचार के आधार पर, हम कह सकते हैं कि कुछ शुद्ध रणनीतियाँ केवल शून्य संभावना के साथ इष्टतम मिश्रित रणनीति में प्रवेश कर सकती हैं।
वे कहते हैं कि i-वेंपहले खिलाड़ी की रणनीति उस पर हावी है k- वांरणनीति अगर सभी के लिए एक ij एक kj जे ई नऔर कम से कम एक जेएक ij> एक kj. इस मामले में यह भी कहा जाता है कि i-वेंरणनीति (या रेखा) - प्रमुख, k- वां- प्रभुत्व।
वे कहते हैं कि j-वेंदूसरे खिलाड़ी की रणनीति उस पर हावी है एल-थूरणनीति अगर सभी के लिए जेई मीटर a ij a il और कम से कम एक i a ij . के लिए< a il . В этом случае j-वेंरणनीति (स्तंभ) को प्रमुख कहा जाता है, एल-थू- प्रभुत्व।
रणनीति ए 1 रणनीति ए 2 पर हावी है (पंक्ति 1 के सभी तत्व दूसरी पंक्ति के मूल्यों से अधिक या बराबर हैं), इसलिए, हम मैट्रिक्स की दूसरी पंक्ति को बाहर करते हैं। प्रायिकता p 2 = 0.
रणनीति ए 1 रणनीति ए 3 पर हावी है (पंक्ति 1 के सभी तत्व तीसरी पंक्ति के मूल्यों से अधिक या बराबर हैं), इसलिए, हम मैट्रिक्स की तीसरी पंक्ति को बाहर करते हैं। संभावना पी 3 = 0।
3 1 2 5
0 -2 -2 1

खिलाड़ी बी के नुकसान की स्थिति से, रणनीति बी 1 रणनीति बी 2 (स्तंभ 1 के सभी तत्व) पर हावी है ज्यादा वस्तुएंकॉलम 2), इसलिए हम मैट्रिक्स के पहले कॉलम को बाहर कर देते हैं। प्रायिकता q 1 = 0.
खिलाड़ी बी के नुकसान की स्थिति से, रणनीति बी 4 रणनीति बी 1 पर हावी है (स्तंभ 4 के सभी तत्व कॉलम 1 के तत्वों से अधिक हैं), इसलिए, हम मैट्रिक्स के चौथे कॉलम को बाहर करते हैं। प्रायिकता q 4 = 0.
1 2
-2 -2

हमने 4 x 4 गेम को 2 x 2 गेम में घटा दिया है।



खेल समाधान ( 2 एक्स एन


पी 1 = 1
पी 2 = 0
खेल मूल्य, y = 1
अब हम समीकरणों की संगत प्रणाली को लिखकर खिलाड़ी B की न्यूनतम अधिकतम रणनीति का पता लगा सकते हैं
क्यू 1 = 1
क्यू 1 + क्यू 2 = 1
इस प्रणाली को हल करते हुए, हम पाते हैं:
क्यू 1 = 1.
उत्तर:
गेम की कीमत: y = 1, खिलाड़ियों की रणनीति वैक्टर:
क्यू (1,0), पी (1,0)

a ij q j v
a ij p i v
एम (पी 1; क्यू) = (1 1) + (2 0) = 1 = वी
एम (पी 2; क्यू) = (-2 1) + (-2 0) = -2 ≤ वी
एम (पी; क्यू 1) = (1 1) + (-2 0) = 1 = वी
एम (पी; क्यू 2) = (2 1) + (-2 0) = 2 ≥ वी

चूंकि पंक्तियों और स्तंभों को मूल मैट्रिक्स से हटा दिया गया था, इसलिए पाए गए संभाव्यता वैक्टर को इस प्रकार लिखा जा सकता है:
पी (1,0,0,0)
क्यू (0,1,0,0)

टास्क 2
भुगतान मैट्रिक्स का उपयोग करके खेल की निचली और ऊपरी कीमतों का पता लगाएं। एक काठी बिंदु की उपस्थिति में, इष्टतम शुद्ध रणनीतियों पी *, क्यू * के वैक्टर लिखें।



आर 1

R2

R3

एस 1

-6

-5

0

एस 2

-8

-3

-2

S3

-3

-2

3

समाधान:
1. जांचें कि क्या पेऑफ मैट्रिक्स में एक सैडल पॉइंट है। यदि हाँ, तो हम शुद्ध रणनीतियों में खेल का समाधान लिखते हैं।
खिलाड़ियोंबी 1बी 2बी 3ए = मिनट (ए मैं)
ए 1-6 -5 0 -6
ए 2-8 -3 -2 -8
ए 3-3 -2 3 -3
बी = अधिकतम (बी मैं)-3 -2 3

हम खेल की कम कीमत a = अधिकतम (a i) = -3 द्वारा निर्धारित गारंटीकृत भुगतान पाते हैं, जो अधिकतम शुद्ध रणनीति A 3 को इंगित करता है।
खेल की ऊपरी कीमत b = min (b j) = -3 है।
सैडल प्वाइंट (3, 1) विकल्पों की एक जोड़ी (ए 3, बी 1) के समाधान को इंगित करता है। खेल की कीमत -3 है।
उत्तर: पी (0,0,1), क्यू (1,0,0)

समस्या 3
भुगतान मैट्रिक्स का उपयोग करके इष्टतम रणनीतियों पी *, क्यू * और गेम की कीमत के वैक्टर खोजें। कौन सा खिलाड़ी विजेता है?



आर 1

R2

R3

आर4

एस 1

-6

-6

2

4

एस 2

2

-2

7

-1

समाधान:
1. जांचें कि क्या पेऑफ मैट्रिक्स में एक सैडल पॉइंट है। यदि हाँ, तो हम शुद्ध रणनीतियों में खेल का समाधान लिखते हैं।
हम मानते हैं कि खिलाड़ी I अपनी रणनीति चुनता है ताकि उसका अधिकतम भुगतान प्राप्त हो सके, और खिलाड़ी II अपनी रणनीति चुनता है ताकि खिलाड़ी I के भुगतान को कम किया जा सके।
खिलाड़ियोंबी 1बी 2बी 3बी 4ए = मिनट (ए मैं)
ए 1-6 -6 2 4 -6
ए 22 -2 7 -1 -2
बी = अधिकतम (बी मैं)2 -2 7 4

हम खेल की कम कीमत a = अधिकतम (a i) = -2 द्वारा निर्धारित गारंटीकृत भुगतान पाते हैं, जो अधिकतम शुद्ध रणनीति A 2 को इंगित करता है।
खेल की ऊपरी कीमत b = min (b j) = -2 है।
सैडल प्वाइंट (2, 2) विकल्पों की एक जोड़ी (ए 2, बी 2) के समाधान को इंगित करता है। खेल की कीमत -2 है।
3. मिश्रित रणनीतियों में खेल का समाधान खोजें।
आइए समस्या को ज्यामितीय विधि से हल करें, जिसमें निम्नलिखित चरण शामिल हैं:
1. कार्टेशियन समन्वय प्रणाली में, एब्सिस्सा अक्ष के साथ एक खंड प्लॉट किया जाता है, जिसकी लंबाई 1 है। खंड का बायां छोर (बिंदु x = 0) रणनीति ए 1 से मेल खाता है, दायां एक - रणनीति के लिए ए 2 (एक्स = 1)। मध्यवर्ती बिंदु x कुछ मिश्रित रणनीतियों S 1 = (p 1, p 2) की संभावनाओं के अनुरूप हैं।
2. रणनीति ए 1 की जीत को बाएं कोटि अक्ष पर प्लॉट किया जाता है। कोर्डिनेट अक्ष के समानांतर एक रेखा पर, बिंदु 1 से, रणनीति A 2 की जीत को प्लॉट किया जाता है।
खेल समाधान ( 2 एक्स एन) अधिकतम रणनीति का पालन करते हुए खिलाड़ी ए की स्थिति से किया जाता है। किसी भी खिलाड़ी के पास प्रभावी और डुप्लीकेट रणनीति नहीं है।

खिलाड़ी ए की अधिकतम इष्टतम रणनीति बिंदु एन से मेल खाती है, जिसके लिए समीकरणों की निम्नलिखित प्रणाली लिखी जा सकती है:
पी 1 = 0
पी 2 = 1
खेल मूल्य, y = -2
अब हम रणनीति बी 1, बी 3, बी 4 को छोड़कर, समीकरणों की संबंधित प्रणाली को लिखकर खिलाड़ी बी की न्यूनतम रणनीति पा सकते हैं, जो स्पष्ट रूप से खिलाड़ी बी को अधिक नुकसान देता है, और इसलिए, क्यू 1 = 0, क्यू 3 = 0, क्यू 4 = 0 ...
-2q 2 = -2
क्यू 2 = 1
इस प्रणाली को हल करते हुए, हम पाते हैं:
क्यू 2 = 1.
उत्तर:
खेल मूल्य: y = -2, खिलाड़ियों की रणनीति वैक्टर:
क्यू (0, 1, 0, 0), पी (0, 1)
4. आइए रणनीति इष्टतमता मानदंड का उपयोग करके खेल समाधान की शुद्धता की जांच करें।
a ij q j v
a ij p i v
एम (पी 1; क्यू) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ वी
एम (पी 2; क्यू) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = वी
एम (पी; क्यू 1) = (-6 0) + (2 1) = 2 ≥ वी
एम (पी; क्यू 2) = (-6 0) + (-2 1) = -2 = वी
एम (पी; क्यू 3) = (2 0) + (7 1) = 7 ≥ वी
एम (पी; क्यू 4) = (4 0) + (-1 1) = -1 ≥ वी
सभी असमानताओं को समानता या सख्त असमानताओं के रूप में संतुष्ट किया जाता है, इसलिए, खेल का समाधान सही पाया जाता है।

समस्या 4
प्रश्न का विस्तृत उत्तर दें

5. खेलों का सिद्धांत और सांख्यिकीय समाधान

5.1. जीरो-सम मैट्रिक्स गेम

आर्थिक और गणितीय मॉडलिंग निम्नलिखित स्थितियों में की जाती है:

निश्चितता;

अनिश्चितताएं।

मोडलिंग निश्चितता की शर्तों में सभी आवश्यक प्रारंभिक मानक डेटा (मैट्रिक्स मॉडलिंग, नेटवर्क योजना और प्रबंधन) की उपलब्धता मानता है।

मोडलिंग खतरे में स्टोकेस्टिक अनिश्चितता के साथ किया जाता है, जब कुछ प्रारंभिक डेटा के मान यादृच्छिक होते हैं और इन यादृच्छिक चर के संभाव्यता वितरण कानून ज्ञात होते हैं (प्रतिगमन विश्लेषण, कतार सिद्धांत)।

मोडलिंग अनिश्चितता के सामने से मेल खाती है पूर्ण अनुपस्थितिइसके लिए आवश्यक कुछ डेटा (गेम थ्योरी)।

संघर्ष की स्थितियों में इष्टतम निर्णय लेने के लिए गणितीय मॉडल अनिश्चितता की स्थितियों में बनाए जाते हैं।

खेल सिद्धांत में, निम्नलिखित बुनियादी अवधारणाओं का उपयोग किया जाता है:

रणनीति;

जीत समारोह।

पाठ्यक्रम के अनुसार हम खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक के खिलाड़ी द्वारा पसंद और कार्यान्वयन को बुलाएंगे।

रणनीति वर्तमान स्थिति के आधार पर प्रत्येक कदम पर कार्रवाई का एक कोर्स चुनने की एक तकनीक है।

जीतना समारोह जीतने वाले को हारने वाले खिलाड़ी के भुगतान की राशि निर्धारित करने का कार्य करता है।

मैट्रिक्स गेम में, अदायगी फ़ंक्शन को इस प्रकार दर्शाया जाता है भुगतान मैट्रिक्स :

खिलाड़ी I को भुगतान की राशि कहां है, जिसने चाल को चुना, खिलाड़ी II से, जिसने चाल को चुना।

इस तरह के एक जोड़ी खेल में, प्रत्येक स्थिति में दोनों खिलाड़ियों के अदायगी कार्यों के मूल्य परिमाण में बराबर और संकेत में विपरीत होते हैं, अर्थात, और इस खेल को कहा जाता है शून्य राशि .

"मैट्रिक्स गेम खेलने" की प्रक्रिया को इस प्रकार दर्शाया गया है:

भुगतान मैट्रिक्स सेट है;

खिलाड़ी I, खिलाड़ी II से स्वतंत्र, इस मैट्रिक्स की पंक्तियों में से एक को चुनता है, उदाहरण के लिए, वें;

खिलाड़ी II, खिलाड़ी I की परवाह किए बिना, इस मैट्रिक्स के किसी एक कॉलम को चुनता है, उदाहरण के लिए, - वें;

मैट्रिक्स तत्व निर्धारित करता है कि खिलाड़ी II से मुझे कितना खिलाड़ी मिलेगा। बेशक, अगर, तो वह आता हैखिलाड़ी I के वास्तविक नुकसान के बारे में।

पेऑफ़ मैट्रिक्स के साथ एक विरोधी जोड़ी गेम को गेम कहा जाएगा।

उदाहरण

एक खेल पर विचार करें।

भुगतान मैट्रिक्स सेट है:

.

खिलाड़ी I को, खिलाड़ी II से स्वतंत्र रूप से, इस मैट्रिक्स की तीसरी पंक्ति चुनने दें, और खिलाड़ी II, खिलाड़ी I से स्वतंत्र रूप से, इस मैट्रिक्स का दूसरा कॉलम चुनें:

तब खिलाड़ी I को खिलाड़ी II से 9 इकाइयाँ प्राप्त होंगी।

5.2. मैट्रिक्स गेम में इष्टतम स्वच्छ रणनीति

इष्टतम रणनीति खिलाड़ी I की एक रणनीति है कि वह खिलाड़ी II द्वारा रणनीति के किसी भी विकल्प के लिए अपने भुगतान में कमी नहीं करता है, और खिलाड़ी II की रणनीति इस तरह से है कि वह खिलाड़ी I द्वारा रणनीति के किसी भी विकल्प के लिए अपना नुकसान नहीं बढ़ाता है।

अपनी चाल के रूप में अदायगी मैट्रिक्स की वें पंक्ति को चुनना, खिलाड़ी I सबसे खराब स्थिति में खुद को कम से कम मूल्य का लाभ सुनिश्चित करता है, जब खिलाड़ी II इस मूल्य को कम करने की कोशिश करता है। इसलिए, खिलाड़ी I ऐसी -th पंक्ति चुनता है जो उसे प्रदान करेगी अधिकतम जीत:

.

प्लेयर II इसी तरह से सोचता है और निश्चित रूप से खुद को कम से कम नुकसान पहुंचा सकता है:

.

असमानता हमेशा सत्य होती है:

मात्रा कहलाती है खेल की निचली कीमत .

मात्रा कहलाती है खेल की शीर्ष कीमत .

इष्टतम रणनीतियों को कहा जाता है साफ अगर समानताएं उनके लिए हैं:

,

.

मात्रा कहलाती है खेल की शुद्ध कीमत , अगर ।

इष्टतम शुद्ध रणनीतियाँ और रूप लादने की सीमा भुगतान मैट्रिक्स।

काठी बिंदु के लिए, निम्नलिखित शर्तें पूरी होती हैं:

अर्थात तत्व पंक्ति में सबसे छोटा और स्तम्भ में सबसे बड़ा है।

इस प्रकार, यदि अदायगी मैट्रिक्स है लादने की सीमा तब तुम पा सकते हो इष्टतम स्वच्छ रणनीतियाँ खिलाड़ियों।

खिलाड़ी I की शुद्ध रणनीति को संख्याओं के एक क्रमबद्ध सेट (वेक्टर) द्वारा दर्शाया जा सकता है, जिसमें वें स्थान की संख्या को छोड़कर, सभी संख्याएं शून्य के बराबर होती हैं, जो एक के बराबर होती है।

प्लेयर II की शुद्ध रणनीति को संख्याओं के एक क्रमबद्ध सेट (वेक्टर) द्वारा दर्शाया जा सकता है जिसमें वें स्थान की संख्या को छोड़कर, जो एक के बराबर है, सभी संख्याएं शून्य के बराबर हैं।

उदाहरण

.

अदायगी मैट्रिक्स की किसी भी पंक्ति को एक चाल के रूप में चुनकर, खिलाड़ी I खुद को निम्न द्वारा दर्शाए गए कॉलम में कम से कम मूल्य का सबसे खराब स्थिति वाला भुगतान सुनिश्चित करता है:

इसलिए, खिलाड़ी I पेऑफ मैट्रिक्स की दूसरी पंक्ति का चयन करेगा, जो उसे खिलाड़ी II की चाल की परवाह किए बिना अधिकतम भुगतान प्रदान करता है, जो इस मान को कम करने का प्रयास करेगा:

प्लेयर II भी ऐसा ही सोचता है और अपनी चाल के रूप में पहला कॉलम चुनता है:

इस प्रकार, भुगतान मैट्रिक्स का एक काठी बिंदु है:

खिलाड़ी I और खिलाड़ी II के लिए इष्टतम शुद्ध रणनीति के अनुरूप, जिसमें खिलाड़ी I द्वारा रणनीति में किसी भी बदलाव के लिए खिलाड़ी I अपने लाभ को कम नहीं करता है और खिलाड़ी II खिलाड़ी I द्वारा रणनीति में किसी भी बदलाव के लिए अपने नुकसान को नहीं बढ़ाता है।

5.3. मैट्रिक्स गेम में इष्टतम मिश्रित रणनीति

यदि अदायगी मैट्रिक्स में एक काठी बिंदु नहीं है, तो किसी भी खिलाड़ी के लिए एक शुद्ध रणनीति का उपयोग करना तर्कहीन है। इसका उपयोग करना अधिक लाभदायक है "संभाव्य मिश्रण" शुद्ध रणनीतियाँ। फिर, पहले से ही मिश्रित रणनीतियों को इष्टतम के रूप में निर्धारित किया जाता है।

मिश्रित रणनीति खिलाड़ी को एक यादृच्छिक घटना के संभाव्यता वितरण की विशेषता है जिसमें इस खिलाड़ी द्वारा एक चाल की पसंद शामिल है।

खिलाड़ी I की मिश्रित रणनीति संख्याओं का एक ऐसा क्रमबद्ध सेट है (वेक्टर) जो दो शर्तों को पूरा करता है:

1) के लिए, अर्थात्, भुगतान मैट्रिक्स की प्रत्येक पंक्ति को चुनने की संभावना गैर-नकारात्मक है;

2), यानी, कुल में भुगतान मैट्रिक्स की प्रत्येक पंक्ति की पसंद का प्रतिनिधित्व करता है पूरा समूहआयोजन।

प्लेयर II की मिश्रित रणनीति संख्याओं का एक क्रमबद्ध सेट है (वेक्टर) शर्तों को पूरा करना:

भुगतान राशि खिलाड़ी I के लिए, जिसने मिश्रित रणनीति चुनी है

खिलाड़ी II से जिसने मिश्रित रणनीति चुनी

,

औसत का प्रतिनिधित्व करता है

.

इष्टतम मिश्रित रणनीति कहा जाता है

तथा ,

यदि किसी मनमानी मिश्रित रणनीति के लिए और शर्त संतुष्ट है:

यानी, इष्टतम मिश्रित रणनीति के तहत, खिलाड़ी I का भुगतान सबसे बड़ा है, और खिलाड़ी II का नुकसान सबसे छोटा है।

यदि अदायगी मैट्रिक्स में कोई काठी बिंदु नहीं है, तो

,

यानी, एक सकारात्मक अंतर है ( आवंटित अंतर )

- ³ 0,

और खिलाड़ियों को अपने पक्ष में इस अंतर का एक बड़ा हिस्सा आत्मविश्वास से प्राप्त करने के लिए अतिरिक्त अवसरों की तलाश करने की आवश्यकता है।

उदाहरण

अदायगी मैट्रिक्स द्वारा दिए गए खेल पर विचार करें:

.

निर्धारित करें कि क्या कोई काठी बिंदु है:

, .

यह पता चला है कि अदायगी मैट्रिक्स में कोई काठी बिंदु नहीं है और असंबद्ध अंतर इसके बराबर है:

.

5.4. इष्टतम मिश्रित रणनीतियाँ ढूँढना

खेलों के लिए 2 × 2

आयाम के पेऑफ मैट्रिक्स के लिए इष्टतम मिश्रित रणनीतियों का निर्धारण दो चर के एक फ़ंक्शन के इष्टतम बिंदुओं को खोजने की विधि द्वारा किया जाता है।

भुगतान मैट्रिक्स की पहली पंक्ति चुनने वाले खिलाड़ी की संभावना दें

बराबर है। तब दूसरी पंक्ति को चुनने की प्रायिकता है।

मान लें कि खिलाड़ी II द्वारा पहला कॉलम चुनने की प्रायिकता बराबर है। तो दूसरा कॉलम चुनने की प्रायिकता है।

खिलाड़ी I द्वारा खिलाड़ी II को भुगतान की राशि बराबर है:

खिलाड़ी I के लाभ और खिलाड़ी II के नुकसान का चरम मूल्य शर्तों से मेल खाता है:

;

.

इस प्रकार, I और II खिलाड़ियों की इष्टतम मिश्रित रणनीतियाँ क्रमशः समान हैं:

5.5. खेलों का ज्यामितीय समाधान 2 ×एन

पेऑफ मैट्रिक्स के आयाम में वृद्धि के साथ, दो चर के फ़ंक्शन के इष्टतम को खोजने के लिए इष्टतम मिश्रित रणनीतियों के निर्धारण को कम करना अब संभव नहीं है। हालांकि, यह देखते हुए कि खिलाड़ियों में से एक के पास केवल दो रणनीतियाँ हैं, एक ज्यामितीय समाधान का उपयोग किया जा सकता है।

खेल का समाधान खोजने के मुख्य चरण इस प्रकार हैं।

आइए हम समतल पर एक समन्वय प्रणाली का परिचय दें। अक्ष पर एक खंड बनाएं। इस खंड के बाएँ और दाएँ सिरों से लंब खींचिए।


इकाई खंड के बाएँ और दाएँ छोर दो रणनीतियों के अनुरूप हैं और, खिलाड़ी I के लिए उपलब्ध हैं। खींचे गए लंबवत पर, हम इस खिलाड़ी की जीत को स्थगित कर देंगे। उदाहरण के लिए, भुगतान मैट्रिक्स के लिए


खिलाड़ी I की ऐसी अदायगी जब एक रणनीति चुनती है और होगी, और रणनीति चुनते समय और होगी।

आइए हम खिलाड़ी II की रणनीतियों के अनुरूप खिलाड़ी I के भुगतान बिंदुओं को सीधी रेखा के खंडों से जोड़ते हैं। फिर गठित टूटी हुई रेखा, नीचे से ग्राफ को बांधते हुए, खिलाड़ी I के भुगतान की निचली सीमा को परिभाषित करती है।



खिलाड़ी I की इष्टतम मिश्रित रणनीति खोजें

,

जो अधिकतम कोटि के साथ खिलाड़ी I के भुगतान की निचली सीमा पर स्थित बिंदु से मेल खाती है।

ध्यान दें कि विचाराधीन उदाहरण में, केवल दो रणनीतियों का उपयोग करके और खिलाड़ी I के भुगतान की निचली सीमा पर पाए गए बिंदु पर सीधी रेखाओं के अनुरूप, खिलाड़ी II खिलाड़ी I को बड़ा भुगतान प्राप्त करने से रोक सकता है।

इस प्रकार, खेल को एक खेल में बदल दिया जाता है और माना उदाहरण में खिलाड़ी II की इष्टतम मिश्रित रणनीति होगी

,

जहां संभावना खेल के समान ही है:

5.6. खेल समाधानएम× एन

यदि मैट्रिक्स गेम का शुद्ध रणनीतियों में कोई समाधान नहीं है (यानी, कोई सैडल पॉइंट नहीं है) और, भुगतान मैट्रिक्स के बड़े आयाम के कारण, ग्राफिक रूप से हल नहीं किया जा सकता है, तो समाधान प्राप्त करने के लिए, उपयोग करें रैखिक प्रोग्रामिंग विधि .

मान लें कि आयाम का अदायगी मैट्रिक्स दिया गया है:

.

संभावनाओं को खोजने की जरूरत है , इस मिश्रित रणनीति के लिए मुझे किस खिलाड़ी के साथ उसकी चालों का चयन करना चाहिए ताकि उसे कम से कम परिमाण के भुगतान की गारंटी मिल सके, खिलाड़ी II द्वारा चालों की पसंद की परवाह किए बिना।

खिलाड़ी II द्वारा चुने गए प्रत्येक चाल के लिए, खिलाड़ी I का भुगतान निर्भरताओं द्वारा निर्धारित किया जाता है:

हम असमानताओं के दोनों पक्षों को विभाजित करते हैं और नई संकेतन पेश करते हैं:

समानता

फॉर्म लेंगे:

चूंकि खिलाड़ी मैं भुगतान को अधिकतम करना चाहता हूं, पारस्परिक को कम से कम किया जाना चाहिए। फिर खिलाड़ी I के लिए रैखिक प्रोग्रामिंग समस्या का रूप लेती है:

प्रतिबंधों के साथ

इसी तरह, खिलाड़ी II के लिए समस्या दोहरी के रूप में बनाई गई है:

प्रतिबंधों के साथ

सिंप्लेक्स विधि का उपयोग करके समस्याओं को हल करना, हम प्राप्त करते हैं:

,

5.7. मैट्रिक्स गेम को हल करने की विशेषताएं

इष्टतम रणनीतियों को खोजने की समस्या को हल करने से पहले, दो स्थितियों की जाँच की जानी चाहिए:

क्या भुगतान मैट्रिक्स को सरल बनाना संभव है;

क्या भुगतान मैट्रिक्स में एक सैडल बिंदु है।

भुगतान मैट्रिक्स को सरल बनाने की संभावना पर विचार करें:

इस तथ्य के कारण कि मैं जिस खिलाड़ी को प्राप्त करना चाहता हूं सबसे बड़ी जीत, तो आप भुगतान मैट्रिक्स से th लाइन को पार कर सकते हैं, क्योंकि वह कभी भी इस कदम का उपयोग नहीं करेगा यदि निम्नलिखित संबंध किसी अन्य से संतुष्ट है - th लाइन:

इसी तरह, सबसे छोटे नुकसान के लिए प्रयास करते हुए, खिलाड़ी II कभी भी पेआउट मैट्रिक्स में ith कॉलम को एक चाल के रूप में नहीं चुनता है, और इस कॉलम को पार किया जा सकता है यदि निम्नलिखित संबंध किसी अन्य ith कॉलम के साथ है:

अधिकांश सरल उपाय game एक काठी बिंदु के सरलीकृत भुगतान मैट्रिक्स में उपस्थिति है जो निम्नलिखित शर्त को पूरा करता है (परिभाषा के अनुसार):

उदाहरण

एक भुगतान मैट्रिक्स दिया गया है:

.

भुगतान मैट्रिक्स का सरलीकरण:

लादने की सीमा:

5.8. प्रकृति के साथ खेलना

गेम थ्योरी की समस्याओं के विपरीत सिद्धांत की समस्याएं सांख्यिकीय निर्णय एक अनिश्चित स्थिति में एक विरोधी संघर्ष रंग नहीं होता है और यह वस्तुनिष्ठ वास्तविकता पर निर्भर करता है, जिसे आमतौर पर कहा जाता है "प्रकृति" .

प्रकृति के साथ मैट्रिक्स गेम में, खिलाड़ी II अनिश्चित कारकों के एक समूह द्वारा खेला जाता है जो किए गए निर्णयों की प्रभावशीलता को प्रभावित करते हैं।

प्रकृति के साथ मैट्रिक्स गेम केवल सामान्य मैट्रिक्स गेम से भिन्न होते हैं, जब खिलाड़ी I द्वारा इष्टतम रणनीति चुनते हैं, तो इस तथ्य से निर्देशित होना संभव नहीं है कि खिलाड़ी II अपने नुकसान को कम करने का प्रयास करेगा। इसलिए, भुगतान मैट्रिक्स के साथ, हम परिचय देते हैं जोखिम मैट्रिक्स :

अंतर के बराबर शर्तों के तहत चाल का उपयोग करते समय खिलाड़ी I के जोखिम का मूल्य कहां है उस खिलाड़ी के भुगतान के बीच जो मुझे प्राप्त होता अगर वह जानता कि शर्त स्थापित हो जाएगी, यानी। , और वह जीत जो उसे प्राप्त होगी, यह नहीं जानते हुए कि एक चाल चुनते समय कि शर्त स्थापित हो जाएगी।

इस प्रकार, अदायगी मैट्रिक्स स्पष्ट रूप से एक जोखिम मैट्रिक्स में परिवर्तित हो जाता है, और रिवर्स रूपांतरण अस्पष्ट है।

उदाहरण

अदायगी मैट्रिक्स:

.

जोखिम मैट्रिक्स:

संभव दो समस्या बयान समाधान चुनने के बारे में प्रकृति के साथ एक मैट्रिक्स गेम में :

अपनी जीत को अधिकतम करना;

जोखिम कम करना।

निर्णय लेने की समस्या को दो स्थितियों में से एक के लिए प्रस्तुत किया जा सकता है:

- खतरे में जब प्रकृति की रणनीतियों का संभाव्यता वितरण कार्य ज्ञात होता है, उदाहरण के लिए, प्रत्येक कल्पित विशिष्ट आर्थिक स्थितियों की घटना का यादृच्छिक मूल्य;

- अनिश्चितता के सामने जब ऐसा प्रायिकता बंटन फलन अज्ञात हो।

5.9. सांख्यिकीय निर्णयों के सिद्धांत की समस्याओं का समाधान

खतरे में

जोखिम की स्थिति में निर्णय लेते समय, खिलाड़ी मैं संभावनाओं को जानता हूं प्रकृति की अवस्थाओं की शुरुआत।

फिर खिलाड़ी I के लिए यह समीचीन है कि वह रणनीति चुनें जिसके लिए जीत का औसत मूल्य, प्रति पंक्ति लिया गया, अधिकतम :

.

जोखिम मैट्रिक्स के साथ इस समस्या को हल करते समय, हम उसी के अनुरूप समाधान प्राप्त करते हैं न्यूनतम औसत जोखिम :

.

5.10. सांख्यिकीय निर्णयों के सिद्धांत की समस्याओं का समाधान

अनिश्चितता के सामने

अनिश्चितता की स्थिति में निर्णय लेते समय, आप निम्न का उपयोग कर सकते हैं: मानदंड :

वाल्ड का मैक्सिमिन मानदंड;

मापदंड न्यूनतम जोखिमसेविजा;

निराशावाद की कसौटी हर्विट्ज़ का आशावाद है;

लाप्लास का अपर्याप्त आधार का सिद्धांत।

विचार करना वाल्ड का मैक्सिमिन टेस्ट .

प्रकृति के साथ खेल एक उचित आक्रामक विरोधी के रूप में खेला जाता है, अर्थात, भुगतान मैट्रिक्स के लिए अत्यधिक निराशावाद की स्थिति से पुनर्बीमा दृष्टिकोण किया जाता है:

.

विचार करना सैवेज न्यूनतम जोखिम मानदंड .

जोखिम मैट्रिक्स के लिए अत्यधिक निराशावाद की स्थिति से पिछले एक के समान दृष्टिकोण:

.

विचार करना निराशावाद की कसौटी - हर्विट्ज़ का आशावाद .

अत्यधिक निराशावाद या अत्यधिक आशावाद द्वारा निर्देशित नहीं होने का एक अवसर प्रदान किया जाता है:

निराशावाद की डिग्री कहाँ है;

पर - अत्यधिक आशावाद,

पर - अत्यधिक निराशावाद।

विचार करना लाप्लास का अपर्याप्त आधार का सिद्धांत .

यह माना जाता है कि प्रकृति के सभी राज्य समान रूप से संभावित हैं:

,

.

पांचवें खंड पर निष्कर्ष

मैट्रिक्स गेम में दो खिलाड़ी भाग लेते हैं, और पेऑफ़ फ़ंक्शन, जो विजेता को हारने वाले खिलाड़ी के भुगतान की राशि निर्धारित करने का कार्य करता है, को पेऑफ़ मैट्रिक्स के रूप में दर्शाया जाता है। हम सहमत थे कि खिलाड़ी I एक चाल के रूप में अदायगी मैट्रिक्स की पंक्तियों में से एक को चुनता है, और खिलाड़ी II इसके कॉलम में से एक को चुनता है। फिर, इस मैट्रिक्स की चयनित पंक्ति और कॉलम के चौराहे पर, खिलाड़ी II से खिलाड़ी I को भुगतान का एक संख्यात्मक मूल्य होता है (यदि यह मान सकारात्मक है, तो खिलाड़ी I वास्तव में जीता है, और यदि यह नकारात्मक है, तो खिलाड़ी II अनिवार्य रूप से जीता)।

यदि अदायगी मैट्रिक्स में एक काठी बिंदु है, तो खिलाड़ियों के पास इष्टतम शुद्ध रणनीतियाँ हैं, अर्थात जीतने के लिए, उनमें से प्रत्येक को अपने एक इष्टतम कदम को दोहराना होगा। यदि कोई काठी बिंदु नहीं है, तो जीतने के लिए, उनमें से प्रत्येक को इष्टतम मिश्रित रणनीति का उपयोग करना चाहिए, अर्थात चालों के मिश्रण का उपयोग करना चाहिए, जिनमें से प्रत्येक को इष्टतम संभावना के साथ किया जाना चाहिए।

ज्ञात सूत्रों का उपयोग करके इष्टतम संभावनाओं की गणना करके 2 × 2 खेलों के लिए इष्टतम मिश्रित रणनीतियों की खोज की जाती है। का उपयोग करके ज्यामितीय समाधान 2 × n खेलों के लिए, उनमें इष्टतम मिश्रित रणनीतियों की परिभाषा 2 × 2 खेलों के लिए इष्टतम मिश्रित रणनीतियों को खोजने के लिए कम कर दी गई है। एम × एन खेलों को हल करने के लिए, उनमें इष्टतम मिश्रित रणनीतियों को खोजने के लिए एक रैखिक प्रोग्रामिंग विधि का उपयोग किया जाता है।

कुछ भुगतान मैट्रिक्स खुद को सरलीकरण के लिए उधार देते हैं, जिसके परिणामस्वरूप अप्रतिष्ठित चालों के अनुरूप पंक्तियों और स्तंभों को हटाकर उनका आयाम कम हो जाता है।

यदि खिलाड़ी II अनिश्चित कारकों का एक समूह है जो वस्तुनिष्ठ वास्तविकता पर निर्भर करता है और एक विरोधी संघर्ष रंग नहीं है, तो ऐसे खेल को प्रकृति के साथ एक खेल कहा जाता है, और इसे हल करने के लिए सांख्यिकीय निर्णयों के सिद्धांत की समस्याओं का उपयोग किया जाता है। फिर, अदायगी मैट्रिक्स के साथ, एक जोखिम मैट्रिक्स पेश किया जाता है और प्रकृति के साथ एक मैट्रिक्स गेम में समाधान चुनने की समस्या के दो बयान संभव हैं: भुगतान को अधिकतम करना और जोखिम को कम करना।

जोखिम की स्थिति में सांख्यिकीय निर्णयों के सिद्धांत की समस्याओं के समाधान से पता चलता है कि खिलाड़ी I के लिए यह सलाह दी जाती है कि वह उस रणनीति का चयन करे जिसके लिए अदायगी मैट्रिक्स की पंक्ति पर ली गई अदायगी का औसत मूल्य (गणितीय अपेक्षा) अधिकतम हो, या (जो समान है) जोखिम मैट्रिक्स की पंक्ति द्वारा लिए गए जोखिम का औसत मूल्य (गणितीय अपेक्षा) न्यूनतम है। अनिश्चितता की स्थिति में निर्णय लेते समय, उपयोग करें निम्नलिखित मानदंड: वाल्ड का अधिकतम मानदंड, सेविज का न्यूनतम जोखिम मानदंड, हर्विट्ज़ का निराशावाद-आशावाद मानदंड, लाप्लास का अपर्याप्त आधार का सिद्धांत।

आत्म परीक्षण प्रश्न

गेम थ्योरी की बुनियादी अवधारणाओं को कैसे परिभाषित किया गया है: चाल, रणनीति और भुगतान कार्य?

मैट्रिक्स गेम में पेऑफ फ़ंक्शन का प्रतिनिधित्व कैसे किया जाता है?

मैट्रिक्स गेम को जीरो सम क्यों कहा जाता है?

मैट्रिक्स गेम खेलने की प्रक्रिया का प्रतिनिधित्व कैसे किया जाता है?

किस खेल को एम × एन खेल कहा जाता है?

मैट्रिक्स गेम के लिए इष्टतम रणनीति क्या है?

शुद्ध नामक मैट्रिक्स गेम के लिए इष्टतम रणनीति क्या है?

अदायगी मैट्रिक्स के सैडल बिंदु का क्या अर्थ है?

मिश्रित नामक मैट्रिक्स गेम के लिए इष्टतम रणनीति क्या है?

खिलाड़ी की मिली-जुली रणनीति कैसी दिखती है?

मिश्रित रणनीति चुनने वाले खिलाड़ी II से खिलाड़ी I को भुगतान की राशि कितनी है?

किस मिश्रित रणनीति को इष्टतम कहा जाता है?

असंबद्ध अंतर का क्या अर्थ है?

2 × 2 खेलों के लिए इष्टतम मिश्रित रणनीतियों को खोजने के लिए किस विधि का उपयोग किया जाता है?

2 × n खेलों के लिए इष्टतम मिश्रित रणनीतियाँ कैसे पाई जाती हैं?

एम × एन खेलों के लिए इष्टतम मिश्रित रणनीति खोजने के लिए किस विधि का उपयोग किया जाता है?

मैट्रिक्स गेम को हल करने की विशेषताएं क्या हैं?

भुगतान मैट्रिक्स के सरलीकरण का क्या अर्थ है और यह किन परिस्थितियों में किया जा सकता है?

पेऑफ़ मैट्रिक्स में सैडल पॉइंट होने या न होने पर कौन सा मैट्रिक्स गेम हल करना आसान होता है?

गेम थ्योरी में कौन सी समस्याएं सांख्यिकीय निर्णयों के सिद्धांत में समस्याओं से संबंधित हैं?

भुगतान मैट्रिक्स को जोखिम मैट्रिक्स में कैसे बदला जाता है?

प्रकृति के साथ मैट्रिक्स गेम में समाधान चुनने की समस्या के कौन से दो सूत्र संभव हैं?

प्रकृति के साथ मैट्रिक्स गेम में निर्णय लेने की समस्याओं को किन दो स्थितियों के लिए निर्धारित किया जा सकता है?

जोखिम की स्थिति में सांख्यिकीय निर्णयों के सिद्धांत की समस्या को हल करते समय खिलाड़ी I के लिए कौन सी रणनीति चुनना समीचीन है?

अनिश्चितता की स्थिति में सांख्यिकीय निर्णयों के सिद्धांत की समस्याओं को हल करने में कौन से निर्णय लेने के मानदंड का उपयोग किया जा सकता है?

समस्या समाधान के उदाहरण

1. भुगतान मैट्रिक्स उद्यम के लाभ की मात्रा को दिखाता है जब वह बेचता है विभिन्न प्रकारस्थिर मांग (पंक्तियों) के आधार पर उत्पाद (कॉलम)। विभिन्न प्रकार के उत्पादों के उत्पादन और उनकी बिक्री से संबंधित अधिकतम (औसतन) आय के लिए उद्यम की इष्टतम रणनीति निर्धारित करना आवश्यक है।

आइए दिए गए मैट्रिक्स को चरों द्वारा निरूपित करें और परिचय दें। हम एक मैट्रिक्स (वेक्टर) का भी उपयोग करेंगे। तब और, अर्थात्।

उलटा मैट्रिक्स की गणना की जाती है:

मान पाए जाते हैं:

.

संभावनाओं की गणना की जाती है:

बिक्री से औसत आय निर्धारित की जाती है:

.

2. फर्म "फार्मासिस्ट" इस क्षेत्र में दवाओं और बायोमेडिकल उत्पादों का निर्माता है। यह ज्ञात है कि कुछ दवाओं की मांग चरम पर होती है गर्मी की अवधि(हृदय समूह की दवाएं, एनाल्जेसिक), दूसरों के लिए - शरद ऋतु और वसंत की अवधि के लिए (संक्रामक विरोधी, एंटीट्यूसिव)।

1 रूपा की लागत इकाइयों सितंबर-अक्टूबर के लिए उत्पाद थे: पहले समूह (हृदय दवाओं और दर्दनाशक दवाओं) के लिए - 20 रूबल; दूसरे समूह में (संक्रामक विरोधी, एंटीट्यूसिव ड्रग्स) - 15 रूबल।

कई के लिए टिप्पणियों के अनुसार हाल के वर्षकंपनी की मार्केटिंग सेवा ने यह स्थापित किया है कि यह विचाराधीन दो महीनों के दौरान गर्म मौसम में 3050 रूपान्तरण का एहसास कर सकती है। इकाइयों पहले समूह के उत्पाद और 1100 रूपा. इकाइयों दूसरे समूह के उत्पाद; ठंड के मौसम में - 1525 रूपांतरण इकाइयों पहले समूह के उत्पाद और 3690 रूपा. इकाइयों दूसरा समूह।

मौसम में संभावित परिवर्तनों के संबंध में, कार्य प्रस्तुत किया जाता है - उत्पादों के उत्पादन में कंपनी की रणनीति निर्धारित करने के लिए जो 40 रूबल की बिक्री मूल्य पर बिक्री से अधिकतम आय प्रदान करता है। 1 रूपा के लिए इकाइयों पहले समूह के उत्पाद और 30 रूबल। - दूसरा समूह।

समाधान। फर्म की दो रणनीतियाँ हैं:

इस साल मौसम गर्म रहेगा;

मौसम ठंडा रहेगा।

यदि कंपनी एक रणनीति अपनाती है और वास्तव में गर्म मौसम (प्रकृति की रणनीति) होगी, तो निर्मित उत्पाद (दवाओं के पहले समूह की 3050 पारंपरिक इकाइयाँ और दूसरे समूह की 1100 पारंपरिक इकाइयाँ) पूरी तरह से बेची जाएंगी और आय होगी होना

3050 × (40-20) + 1100 × (30-15) = 77500 पी।

ठंड के मौसम में (प्रकृति रणनीति) दूसरे समूह की दवाएं पूरी तरह से बेची जाएंगी, और पहले समूह को केवल 1525 रूपए की मात्रा में बेचा जाएगा। इकाइयों और कुछ दवाएं अवास्तविक रह जाएंगी। आय होगी

1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 पी।

इसी तरह, यदि फॉर्म एक रणनीति अपनाता है और मौसम वास्तव में ठंडा है, तो आय होगी

1525 × (40-20) + 3690 × (30-15) = 85850 पी।

गर्म मौसम में होगी आमदनी

1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 पी।

फर्म और मौसम को दो खिलाड़ियों के रूप में देखते हुए, हमें भुगतान मैट्रिक्स मिलता है

,

खेल की कीमत सीमा में है

भुगतान मैट्रिक्स से यह देखा जा सकता है कि, सभी परिस्थितियों में, फर्म की आय कम से कम 16,500 रूबल होगी, लेकिन अगर मौसम की स्थिति चुनी हुई रणनीति के साथ मेल खाती है, तो फर्म की आय 77,500 रूबल हो सकती है।

आइए इस खेल का समाधान खोजें।

आइए हम रणनीति के माध्यम से, रणनीति के माध्यम से, और के माध्यम से फर्म के आवेदन की संभावना को निरूपित करें। विधि द्वारा खेल को आलेखीय रूप से हल करने पर, हम प्राप्त करते हैं , जबकि खेल की कीमत p है।

इष्टतम दवा उत्पादन योजना होगी

इस प्रकार, कंपनी के लिए सितंबर और अक्टूबर 2379 के दौरान उत्पादन करने की सलाह दी जाती है। इकाइयों पहले समूह की दवाएं और 2239.6 रूपा. इकाइयों दूसरे समूह की दवाएं, फिर किसी भी मौसम में उसे कम से कम 46986 रूबल की आय प्राप्त होगी।

अनिश्चितता की स्थिति में, यदि फर्म के लिए मिश्रित रणनीति (अन्य संगठनों के साथ अनुबंध) का उपयोग करना संभव नहीं है, तो फर्म की इष्टतम रणनीति निर्धारित करने के लिए, हम निम्नलिखित मानदंडों का उपयोग करते हैं:

वाल्डे मानदंड:

हर्विट्ज़ मानदंड: निश्चितता के लिए, हम स्वीकार करेंगे, फिर फर्म की रणनीति के लिए

रणनीति के लिए

फर्म के लिए रणनीति का उपयोग करना उचित है।

बर्बर मानदंड। पहले कॉलम में अधिकतम तत्व 77500 है, दूसरे कॉलम में यह 85850 है।

जोखिम मैट्रिक्स के तत्व अभिव्यक्ति से पाए जाते हैं

,

कहां , ,

जोखिम मैट्रिक्स का रूप है

,

रणनीति का उपयोग करना उचित है या।

इसलिए, फर्म के लिए यह सलाह दी जाती है कि वह रणनीति को लागू करे या।

ध्यान दें कि विचार किए गए प्रत्येक मानदंड को के लिए पूरी तरह से संतोषजनक नहीं माना जा सकता है अंतिम विकल्पनिर्णय, हालांकि, उनका संयुक्त विश्लेषण आपको कुछ प्रबंधकीय निर्णय लेने के परिणामों का अधिक स्पष्ट रूप से प्रतिनिधित्व करने की अनुमति देता है।

प्रकृति के विभिन्न राज्यों की संभावनाओं के ज्ञात वितरण के साथ, निर्णय लेने की कसौटी भुगतान की अधिकतम गणितीय अपेक्षा है।

विचाराधीन समस्या के लिए ज्ञात हो कि गर्म और ठंडे मौसम की संभावनाएं समान और 0.5 के बराबर हैं, तो कंपनी की इष्टतम रणनीति निम्नानुसार निर्धारित की जाती है:

एक फर्म के लिए यह सलाह दी जाती है कि वह एक रणनीति का उपयोग करे या।

स्व-अध्ययन कार्य

1. एक उद्यम मांग पर निर्भर लाभ प्राप्त करते हुए तीन प्रकार के उत्पादों (ए, बी और सी) का उत्पादन कर सकता है। मांग, बदले में, चार राज्यों (I, II, III और IV) में से एक ले सकती है। निम्नलिखित मैट्रिक्स में, तत्व उस लाभ को दर्शाते हैं जो उद्यम को -वें उत्पाद और मांग की -वीं स्थिति का उत्पादन करते समय प्राप्त होगा:

यदि खेल में प्रत्येक विरोधी केवल एक ही रणनीति लागू करता है, तो खेल के बारे में ही इस मामले में वे कहते हैं कि यह हो रहा है शुद्ध रणनीतियों में , और खिलाड़ी द्वारा उपयोग किया जाता है और खिलाड़ी वीकुछ रणनीतियों को कहा जाता है शुद्ध रणनीति .

परिभाषा। एक विरोधी खेल में, रणनीतियों की एक जोड़ी ( मैं , वीजे) को संतुलन या स्थिर कहा जाता है यदि किसी भी खिलाड़ी के लिए अपनी रणनीति से विचलित होना लाभदायक नहीं है।

शुद्ध रणनीतियों का उपयोग करना समझ में आता है जब खिलाड़ी तथा वीएक दूसरे के कार्यों और प्राप्त परिणामों के बारे में जानकारी रखते हैं। यदि हम मान लें कि कम से कम एक पक्ष प्रतिद्वंद्वी के व्यवहार के बारे में नहीं जानता है, तो संतुलन के विचार का उल्लंघन होता है, और खेल बेतरतीब ढंग से खेला जाता है।

मैट्रिक्स गेम पर विचार करें जी(3x4)

इस उदाहरण में, खेल की निचली कीमत ऊपरी एक के बराबर है: == 9, यानी। खेल में एक काठी बिंदु है।

यह पता चला है कि इस मामले में अधिकतम रणनीतियाँ 2 और वी 2 विल टिकाऊ दुश्मन के व्यवहार के बारे में जानकारी के संबंध में।

दरअसल, खिलाड़ी को पता चला कि दुश्मन एक रणनीति का उपयोग कर रहा था वी 2. लेकिन इस मामले में खिलाड़ी रणनीति का पालन करना जारी रखेंगे 2, क्योंकि रणनीति से कोई विचलन 2 केवल जीत को कम करेगा। इसी तरह खिलाड़ी को मिली जानकारी वी, उसे अपनी रणनीति से विचलित होने के लिए मजबूर नहीं करेगा वी 2 .

रणनीतियों की एक जोड़ी 2 और वी 2 में स्थिरता की संपत्ति है, और अदायगी (माना गया उदाहरण में यह 9 के बराबर है), रणनीतियों की इस जोड़ी के साथ हासिल की, अदायगी मैट्रिक्स का काठी बिंदु बन जाता है।

रणनीति जोड़ी की स्थिरता (संतुलन) का संकेत निचले और . की समानता है शीर्ष मूल्यखेल

रणनीतियाँ मैंतथा वी जे(माना गया उदाहरण में 2 , वी 2), जिस पर निचले और ऊपरी गेम की कीमतें बराबर होती हैं, इष्टतम शुद्ध रणनीतियां कहलाती हैं, और उनके संयोजन को गेम समाधान कहा जाता है। इस मामले में, खेल को ही शुद्ध रणनीतियों में हल करने के लिए कहा जाता है।

मूल्य को खेल की लागत कहा जाता है।

यदि 0 है, तो खिलाड़ी A के लिए खेल फायदेमंद है, यदि 0 - खिलाड़ी B के लिए; के लिए = 0 खेल उचित है, अर्थात। दोनों प्रतिभागियों के लिए समान रूप से फायदेमंद है।

हालांकि, एक खेल में एक काठी बिंदु की उपस्थिति एक नियम से बहुत दूर है, बल्कि एक अपवाद है। अधिकांश मैट्रिक्स गेम में सैडल पॉइंट नहीं होता है, और इसलिए उनमें इष्टतम शुद्ध रणनीतियाँ नहीं होती हैं। हालांकि, एक प्रकार का खेल है जिसमें हमेशा एक काठी बिंदु होता है और इसलिए, शुद्ध रणनीतियों में हल किया जाता है। ये गेम हैं पूरी जानकारी.

प्रमेय 2। पूरी जानकारी वाले प्रत्येक गेम में एक सैडल पॉइंट होता है, और इसलिए, शुद्ध रणनीतियों में हल किया जाता है, यानी। के बराबर स्थिर अदायगी देने वाली इष्टतम शुद्ध रणनीतियों की एक जोड़ी है।

यदि इस तरह के खेल में केवल व्यक्तिगत चालें होती हैं, तो जब प्रत्येक खिलाड़ी अपनी इष्टतम शुद्ध रणनीति लागू करता है, तो उसे खेल की कीमत के बराबर जीत में समाप्त होना चाहिए। उदाहरण के लिए, एक शतरंज का खेल, पूरी जानकारी के साथ एक खेल के रूप में, या तो हमेशा सफेद के लिए जीत के साथ समाप्त होता है, या हमेशा काले के लिए जीत के साथ, या हमेशा ड्रॉ के साथ (बस क्या - हम अभी तक नहीं जानते हैं, क्योंकि संख्या शतरंज के खेल में संभावित रणनीतियों की संख्या बहुत बड़ी है)।

यदि गेम मैट्रिक्स में एक सैडल पॉइंट होता है, तो इसका समाधान तुरंत मैक्सिमिन सिद्धांत के अनुसार मिल जाता है।

प्रश्न उठता है: ऐसे खेल का समाधान कैसे खोजा जाए जिसके भुगतान मैट्रिक्स में काठी बिंदु नहीं है? प्रत्येक खिलाड़ी द्वारा मैक्सिमिन सिद्धांत का अनुप्रयोग खिलाड़ी ए को कम से कम लाभ और अधिकतम खिलाड़ी के लिए नुकसान प्रदान करता है। यह देखते हुए कि खिलाड़ी ए के लिए अपनी जीत में वृद्धि करना स्वाभाविक है, और खिलाड़ी बी के लिए अपने नुकसान को कम करना स्वाभाविक है। इस तरह के समाधान की खोज मिश्रित रणनीतियों को लागू करने की आवश्यकता की ओर ले जाती है: कुछ आवृत्तियों के साथ शुद्ध रणनीतियों को वैकल्पिक करने के लिए।

परिभाषा। एक यादृच्छिक चर जिसका मान खिलाड़ी की शुद्ध रणनीति है, उसे कहा जाता है मिश्रित रणनीति .

इस प्रकार, खिलाड़ी की मिश्रित रणनीति का कार्य उन संभावनाओं को इंगित करना है जिनके साथ उसकी शुद्ध रणनीतियाँ चुनी जाती हैं।

हम खिलाड़ियों की मिश्रित रणनीतियों को निरूपित करेंगे तथा वीक्रमश

एस ए = || पी 1, पी 2, ..., पी एम ||,

एस बी = || क्यू 1, क्यू 2, ..., क्यू एन ||,

जहाँ p i का उपयोग करने वाले खिलाड़ी की प्रायिकता है रणनीति से साफ मैं; ; q j शुद्ध रणनीति B j का उपयोग करने वाले खिलाड़ी B की प्रायिकता है; ...

विशेष मामले में, जब एक को छोड़कर सभी संभावनाएं शून्य के बराबर होती हैं, और यह एक के बराबर होती है, तो मिश्रित रणनीति एक शुद्ध में बदल जाती है।

मिश्रित रणनीतियों का उपयोग किया जाता है, उदाहरण के लिए, इस तरह से: खेल को कई बार दोहराया जाता है, लेकिन प्रत्येक खेल में खिलाड़ी अपने आवेदन की सापेक्ष आवृत्तियों के साथ अलग-अलग शुद्ध रणनीतियों को लागू करता है। पी मैं तथा क्यू जे .

गेम थ्योरी में मिश्रित रणनीति तरल, लचीली रणनीति का एक मॉडल है, जिसमें न तो खिलाड़ी जानता है कि प्रतिद्वंद्वी किसी दिए गए गेम में कौन सी स्वच्छ रणनीति चुनेगा।

अगर खिलाड़ी मिश्रित रणनीति लागू करता है एस ए = || पी 1, पी 2, ..., पी एम ||, और खिलाड़ी वीमिश्रित रणनीति S B = || q 1, q 2, ..., q n ||, फिर खिलाड़ी की औसत अदायगी (गणितीय अपेक्षा) अनुपात द्वारा निर्धारित किया जाता है

स्वाभाविक रूप से, खिलाड़ी का अपेक्षित नुकसान वीसमान मान के बराबर है।

इसलिए, यदि मैट्रिक्स गेम में सैडल पॉइंट नहीं है, तो खिलाड़ी को इष्टतम मिश्रित रणनीति का उपयोग करना चाहिए जो अधिकतम भुगतान प्रदान करेगा।

प्रश्न स्वाभाविक रूप से उठता है: मिश्रित रणनीतियों का चयन करते समय किन बातों का पालन किया जाना चाहिए? यह पता चला है कि इस मामले में भी अधिकतम सिद्धांत अपना अर्थ बरकरार रखता है। के अतिरिक्त, आवश्यकखेल के समाधान को समझने के लिए, खेल सिद्धांत के मूल प्रमेयों को खेलें।

अर्थशास्त्र में गणितीय तरीके और मॉडल

मैट्रिक्स गेम्स

परिचय

आर्थिक व्यवहार में, अक्सर ऐसी स्थितियां उत्पन्न होती हैं जिनमें विभिन्न दल अलग-अलग लक्ष्यों का पीछा करते हैं। उदाहरण के लिए, एक विक्रेता और एक खरीदार, एक आपूर्तिकर्ता और एक उपभोक्ता, एक बैंक और एक जमाकर्ता, आदि के बीच संबंध। ऐसी संघर्ष स्थितियां न केवल अर्थव्यवस्था में, बल्कि अन्य गतिविधियों में भी उत्पन्न होती हैं। उदाहरण के लिए, शतरंज खेलते समय, चेकर्स, डोमिनोज़, लोटो आदि।

खेल- यह है गणित का मॉडल संघर्ष की स्थितिकई . का उपयोग करते हुए कम से कम दो व्यक्तियों को शामिल करना विभिन्न तरीकेअपने लक्ष्यों को प्राप्त करने के लिए। खेल कहा जाता है भाप से भरा कमरा, यदि इसमें दो खिलाड़ी भाग लेते हैं। खेल कहा जाता है विरोधी, यदि एक खिलाड़ी का लाभ दूसरे के नुकसान के बराबर है। इसलिए, खेल को सेट करने के लिए, विभिन्न स्थितियों में एक खिलाड़ी के भुगतान के मूल्यों को निर्धारित करना पर्याप्त है।

वर्तमान स्थिति के आधार पर खिलाड़ी की क्रिया का कोई भी तरीका कहलाता है रणनीति। प्रत्येक खिलाड़ी के पास रणनीतियों का एक विशिष्ट सेट होता है। यदि रणनीतियों की संख्या सीमित है, तो खेल को कहा जाता है परम, अन्यथा - अनंत . रणनीतियाँ कहलाती हैं साफ, यदि प्रत्येक खिलाड़ी एक निश्चित तरीके से केवल एक रणनीति चुनता है और यादृच्छिक तरीके से नहीं।

खेल समाधानएक ऐसी रणनीति चुनना है जो संतुष्ट हो इष्टतमता की स्थिति। यह शर्त है कि एक खिलाड़ी को मिलता है अधिकतम जीत, अगर दूसरा उसकी रणनीति का पालन करता है। इसके विपरीत, दूसरा खिलाड़ी प्राप्त करता है न्यूनतम नुकसान, अगर पहला खिलाड़ी अपनी रणनीति पर कायम रहता है। ऐसी रणनीतियों को कहा जाता है इष्टतम . इस प्रकार, खेल का लक्ष्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है।

शुद्ध रणनीति खेल

दो खिलाड़ियों के साथ एक खेल पर विचार करें तथा वीमान लीजिए खिलाड़ी यह है एमरणनीतियाँ 1, 2, ..., मीऔर खिलाड़ी वीयह है एनरणनीतियाँ बी 1, बी 2, ..., बी एन।हम मान लेंगे कि खिलाड़ी की पसंद रणनीति ए मैं,और खिलाड़ी वीरणनीति बी जेविशिष्ट रूप से खेल के परिणाम को निर्धारित करता है, अर्थात। बढ़त एक आईजेयूखिलाड़ी और जीतो बी आईजेओखिलाड़ी वीयहां मैं = 1,2, ..., एम, जे = 1,2, ..., एन।

सबसे सरल खेलदो खिलाड़ियों के साथ एक विरोधी खेल है , वे। एक ऐसा खेल जिसमें खिलाड़ियों के हित सीधे विपरीत होते हैं। इस मामले में, खिलाड़ियों की अदायगी समानता से संबंधित है

बी आईजे = -ए आईजे

इस समानता का अर्थ है कि एक खिलाड़ी का लाभ दूसरे के नुकसान के बराबर है। इस मामले में, खिलाड़ियों में से केवल एक के भुगतान पर विचार करना पर्याप्त है, उदाहरण के लिए, खिलाड़ी ए।

रणनीतियों की प्रत्येक जोड़ी एक मैंतथा बी जेजीत का मिलान करें एक आईजेयूखिलाड़ी ए।इन सभी जीतों को तथाकथित . के रूप में लिखना सुविधाजनक है भुगतान मैट्रिक्स

इस मैट्रिक्स की पंक्तियाँ खिलाड़ी की रणनीतियों के अनुरूप होती हैं ए,और कॉलम खिलाड़ी की रणनीतियों के लिए हैं वीसामान्य तौर पर, ऐसे खेल को कहा जाता है (एम × एन) -खेल।


उदाहरण 1।दो खिलाड़ी तथा वीएक सिक्का फेंको। यदि सिक्के के पहलू मेल खाते हैं, तो जीतता है , अर्थात। खिलाड़ी वीखिलाड़ी को भुगतान करता है 1 के बराबर कुछ योग, और यदि वे मेल नहीं खाते हैं, तो खिलाड़ी बी जीतता है, अर्थात। इसके विपरीत, खिलाड़ी खिलाड़ी को भुगतान करता है वीसमान राशि , बराबरी का 1. भुगतान मैट्रिक्स तैयार करें।

समाधान।समस्या की स्थिति से

© 2021 skudelnica.ru - प्यार, विश्वासघात, मनोविज्ञान, तलाक, भावनाएं, झगड़े