शुद्ध धोरणांमध्ये खेळ. मिश्रित रणनीती

घर / माजी

मिश्रित धोरण गेम सिद्धांत

मिश्रित रणनीती

मॅट्रिक्स गेममध्ये शुद्ध धोरणामध्ये कोणतेही कडवे बिंदू नसल्यास, त्यास गेमची उच्च आणि निम्न किंमत मिळते. ते दर्शविते की खेळाडूला गेमच्या वरच्या किंमतीपेक्षाही एक विजय मिळणार नाही आणि त्या खेळाडूला 1 ची हमी मिळते जी खेळाच्या निम्न किंमतीपेक्षा कमी नाही.

एक मिश्रित खेळाडू धोरण त्याच्या शुद्ध धोरणांचा एक संपूर्ण संच आहे ज्याच्या खेळाच्या एकाधिक पुनरावृत्त्यांसह समान संभाव्यतेसह समान परिस्थितीत समावेश आहे. आपण वरील सारांश सारांशित करा आणि मिश्रित धोरणांच्या वापरासाठी अटी सूचीबद्ध करा:

  • * एक कडवा बिंदू न खेळ;
  • * खेळाडू दिलेल्या संभाव्यतेसह शुद्ध धोरणांचे यादृच्छिक मिश्रण वापरतात;
  • * गेम समान परिस्थितीत अनेक वेळा पुनरावृत्ती होते;
  • * प्रत्येक हालचालीवर, दुसर्या खेळाडूने धोरणाच्या निवडीविषयी कोणत्याही खेळाडूला माहिती दिली नाही;
  • * गेमच्या परिणामांची सरासरी परवानगी आहे.

मिश्रित धोरणांसाठी खालील सूचना वापरल्या जातात.

खेळाडू 1 साठी, शुद्ध धोरणे लागू करण्यात मिश्रित मिश्रित योजना А 1, А 2, ..., आणि संबंधित संगतता р 1, р 2, ..., आणि.

खेळाडू 2 साठी

q जे शुद्ध धोरण बी जे लागू करण्याची शक्यता आहे.

जेव्हा जेव्हा प्लेअर 1 साठी p i = 1 असेल तेव्हा आपल्याकडे एक स्पष्ट धोरण असेल.

नेट प्लेअर रणनीती ही फक्त संभाव्य असंगत घटना आहेत. मॅट्रिक्स गेममध्ये, मॅट्रिक्स ए (हे प्लेअर 1 आणि प्लेअर 2 वर लागू होते) जाणून घेतल्यास, आपण दिलेल्या व्हेक्टर आणि प्लेअर 1 ची सरासरी वाढ (प्रभाव अपेक्षित मूल्य) निर्धारित करू शकता.

कोठे आणि वेक्टर आहेत;

पी आय आणि क्यू मी वेक्टरचे घटक आहेत.

मिश्रित धोरणे लागू करून, खेळाडू 1 त्याच्या सरासरी विजयासाठी आणि खेळाडू 2 - जास्तीत जास्त संभाव्य मूल्यावर आणण्यासाठी इच्छिते वाढवण्याचा प्रयत्न करतो. खेळाडू 1 पर्यंत पोहोचण्याचा हेतू आहे

प्लेअर 2 ही स्थिती पूर्ण झाल्याची खात्री करते

खेळाडू 1 आणि 2 च्या सर्वोत्कृष्ट मिश्रित धोरणांशी संबंधित व्हेक्टर्स म्हणजे, होय. अशा व्हॅक्टर आणि ज्यासाठी समानता असते

गेमची किंमत ही खेळाडू 1 ची सरासरी विजय असते जेव्हा दोन्ही खेळाडू मिश्रित धोरणे वापरतात. म्हणून, मॅट्रिक्स गेमचे निराकरण हे आहे:

  • - खेळाडू 1 ची सर्वोत्कृष्ट मिश्रित धोरण;
  • - खेळाडू 2 ची सर्वोत्कृष्ट मिश्रित धोरण;

खेळाची किंमत

मिश्रित कार्ये (आणि) फंक्शनसाठी सॅडल पॉइंट तयार करतात तर इष्टतम असतील.

गणिती खेळांचे मूलभूत प्रमेय आहे.

कोणत्याही मॅट्रिक्स ए सह मॅट्रिक्स गेमसाठी

अस्तित्वात आहेत आणि एकमेकांना समान आहेत: = =.

हे लक्षात ठेवावे की सर्वोत्कृष्ट धोरणे निवडताना, खेळाडू 1 च्या (व 2 च्या विरुद्ध, खेळाडू 2) कोणत्याही निश्चित धोरणासह, गेमच्या किंमतीपेक्षा कमी, सरासरी लाभ नेहमी गॅरंट केला जाईल. खेळाडू 1 आणि 2 च्या सक्रिय धोरणांना रणनीती असे म्हटले जाते जे विना-शून्य संभाव्यतेसह संबंधित प्लेयर्सच्या सर्वोत्कृष्ट मिश्रित धोरणांचा भाग असतात. म्हणूनच, खेळाडूंच्या सर्वोत्कृष्ट मिश्रित धोरणांच्या रचनांमध्ये त्यांच्या धोरणांपूर्वी सर्व प्रा priorी समाविष्ट नसू शकतात.

गेमचे निराकरण म्हणजे गेमची किंमत आणि सर्वोत्तम कार्ये शोधणे. मॅट्रिक्स गेम्ससाठी सर्वोत्कृष्ट मिश्रित रणनीती शोधण्याच्या पद्धतींचा विचार करणे मॅट्रिक्स 22 द्वारे वर्णित सोप्या गेमसह सुरू होईल. कडव्या बिंदूसह गेम विशेषतः मानले जाणार नाहीत. जर काठीचा बिंदू प्राप्त झाला तर याचा अर्थ असा आहे की हानीकारक धोरणे आहेत जी काढून टाकली पाहिजेत. कड्याच्या बिंदूच्या अनुपस्थितीत, दोन सर्वोत्कृष्ट मिश्रित कार्ये मिळू शकतात. आधीच नमूद केल्याप्रमाणे, या मिश्रित धोरणे पुढीलप्रमाणे लिहिल्या आहेत:

तर, पेमेंट मॅट्रिक्स आहे

एक 11 पी 1 + एक 21 पी 2 =; (1.16)

एक 12 पी 1 + एक 22 पी 2 =; (1.17)

पी 1 + पी 2 = 1. (1.18)

एक 11 पी 1 + एक 21 (1 - पी 1) = एक 12 पी 1 + एक 22 (1 - पी 1); (1.1 9)

एक 11 पी 1 + 21 - एक 21 पी 1 = एक 12 पी 1 + एक 22 - एक 22 पी 1, (1.20)

आम्हाला इष्टतम मूल्य कोठे मिळतात?

जाणून घेणे आणि शोधणे:

गणना करत आहे, आम्ही शोधतो आणि:

एक 11 क्यू 1 + एक 12 क्यू 2 =; क्यू 1 + क्यू 2 = 1; (1.24)

एक 11 क्यू 1 + एक 12 (1 - क्यू 1) =. (1.25)

11 एक 12 सह. (1.26)

समस्या सोडवली गेली कारण व्हॅक्टर आणि खेळाची किंमत सापडली. पेमेंट मॅट्रिक्स ए असणे, आपण ग्राफिकदृष्ट्या समस्या सोडवू शकता. या पद्धतीसह, सोल्यूशन अल्गोरिदम एकदम सोपा आहे (आकृती 2.1).

  • 1. फरक असलेल्या अक्षांवर एकक लांबीचा एक भाग तयार केला जातो.
  • 2. ऑर्डिनेट अक्ष स्ट्रेटेजी ए 1 वर बक्षीस जमा केले आहे.
  • 3. ऑर्डिनिट्सच्या अक्षाच्या समांतर असलेल्या बिंदूवर, बिंदू 1 वर, विजय 2 धोरणाने जमा केली जाते.
  • 4. विभागाचा शेवट 11-बी 11, 12-बी 21, 22-बी 22, 21-बी 12 आणि दोन थेट रेषा बी 11 बी 12 आणि बी 21 बी 22 काढल्या जातात.
  • 5. छेदनबिंदू बिंदू च्या ordinate निर्धारित केले आहे. ती समान आहे. पॉईंट सीचा फरक पी 2 च्या समान आहे (पी 1 = 1 - पी 2).

अंजीर 1.1.

या पद्धतीमध्ये अनुप्रयोगाचा एक विस्तृत विस्तृत क्षेत्र आहे. हे खेळ टीपीच्या सामान्य मालमत्तेवर आधारित आहे, जे कोणत्याही गेम टीपीमध्ये आहे, प्रत्येक प्लेअरमध्ये एक उत्तम मिश्रित धोरण आहे, ज्यामध्ये शुद्ध धोरणे संख्या किमान (एम, एन) पेक्षा जास्त नाही. या मालमत्तेवरून, एखादी व्यक्ती ज्ञात परिणाम मिळवू शकते: कोणत्याही गेम 2 एन आणि टी 2 मध्ये, प्रत्येक सर्वोत्कृष्ट धोरणामध्ये दोन सक्रिय धोरणे नाहीत. याचा अर्थ असा की गेम 2 पी आणि टी 2 हा गेम 22 वर कमी केला जाऊ शकतो. म्हणून गेम 2 पी आणि टी 2 ग्राफिक पद्धतीने सोडवता येऊ शकतात. अंतिम गेमच्या मॅट्रिक्समध्ये मीटरचे परिमाण असल्यास, जेथे एम\u003e 2 आणि एन\u003e 2, नंतर सर्वोत्कृष्ट मिश्रित धोरण निर्धारित करण्यासाठी रेषीय प्रोग्रामिंग वापरले जाते.

शुद्ध धोरण  प्लेअर मी ए विजय मॅट्रिक्सच्या एन पंक्तींपैकी एक निवडत आहे आणि प्लेअर दुसरा ची शुद्ध योजना समान मॅट्रिक्सच्या स्तंभांपैकी एक निवडत आहे.

प्लेयर्सची सर्वोत्कृष्ट निव्वळ धोरण मिश्रितांकडून एक अनिवार्य एकक, i = 1, क्यू i = 1. च्या उपस्थितीद्वारे वेगळे असते. उदाहरणार्थ: पी (1.0), क्यू (1.0). येथे पी 1 = 1, क्यू 1 = 1.

कार्य 1
पेमेंट मॅट्रिक्सच्या मते, कठोर वर्चस्वाचा सिद्धांत वापरून सर्वोत्कृष्ट शुद्ध धोरणे शोधा. प्रतिसादाच्या रूपात, व्हॅक्टर * पी *, प्रश्न * लिहा.



आर 1

आर 2

आर 3

आर 4

एस 1

3

1

2

5

एस 2

2

0

0

3

एस 3

-3

-5

-5

-2

एस 4

0

-2

-2

1

उपायः

मॅट्रिक्स गेम कॅल्क्युलेटरच्या मदतीने सर्व समस्या सोडविल्या जातात.

आमचा विश्वास आहे की मी सर्वोत्तम खेळाडू मिळविण्यासाठी खेळाडू निवडतो आणि दुसरा खेळाडू त्याच्या रणनीतीची निवड करतो जेणेकरून खेळाडू प्रथम जिंकतो.

खेळाडूबी 1बी 2बी 3बी 4अ = किमान (ए मी)
अ 13 1 2 5 1
अ 22 0 0 3 0
अ 3-3 -5 -5 -2 -5
अ 40 -2 -2 1 -2
बी = कमाल (बी मी)3 1 2 5
  आम्हाला गेमच्या निम्न किंमतीद्वारे निश्चित केलेल्या गॅरंटिड पेऑफची संख्या = एक (अधिकतम) (i) = 1, जी जास्तीत जास्त निव्वळ धोरण ए 1 दर्शवते.
खेळाची सर्वोच्च किंमत बी = मिनि (बी जे) = 1 आहे.
खोड्याचा बिंदू (1, 2) दोन पर्यायांचा (ए 1, बी 2) निराकरण दर्शवितो. खेळाची किंमत 1 आहे.
2. आम्ही प्रभावी पंक्ती आणि प्रभावी स्तंभांसाठी देयक मेट्रिक्स तपासतो.
कधीकधी, गेमच्या मॅट्रिक्सच्या सोप्या विचारावर आधारित, असे म्हटले जाऊ शकते की काही शुद्ध धोरणे चांगल्या मिश्रित धोरणामध्ये केवळ शून्य संभाव्यतेसह प्रवेश करू शकतात.
असे म्हटले जाते i-th  प्रथम खेळाडू धोरण त्याला प्रभुत्व देतो के-वें  आयजे ≥ a kj सर्व असल्यास जे ई एन  आणि किमान एक साठी जे  एक ij\u003e एक कि.जे. या प्रकरणात असेही म्हटले आहे i-th  धोरण (किंवा ओळ) - प्रभावी, के-आय  - वर्चस्व.
असे म्हटले जाते jth  द्वितीय खेळाडू धोरण त्याला प्रभुत्व देतो एलएच  जर सर्वांसाठी धोरण असेल तर जे ओ एम  आयजे ≤ आयएल आणि कमीतकमी एक ij साठी< a il . В этом случае जे-वें  धोरण (स्तंभ) प्रभावी होते, एलएच  - वर्चस्व.
स्ट्रॅटेजी ए 1 स्ट्रॅटेजी ए वर वर्चस्व ठेवतो (2 पंक्तीचे सर्व घटक द्वितीय पंक्तीच्या मूल्यांपेक्षा मोठे किंवा समान असतात), म्हणून आम्ही मॅट्रिक्सची द्वितीय पंक्ती वगळतो. शक्यता पी 2 = 0.
स्ट्रॅटेजी ए 1 स्ट्रॅटेजी ए वर वर्चस्व राखतो (3 पंक्तीचे सर्व घटक तिसऱ्या पंक्तीच्या मूल्यांपेक्षा मोठे किंवा समान असतात), म्हणून आम्ही मॅट्रिक्सच्या तिसर्या पंक्तीस वगळतो. शक्यता पी 3 = 0.
3 1 2 5
0 -2 -2 1

खेळाडू गमावण्याच्या धोरणाची स्थिती पासून, रणनीती बी 1 धोरण बी 2 वर वर्चस्व ठेवते (स्तंभ 1 चे सर्व घटक स्तंभ 2 च्या घटकांपेक्षा मोठे असतात), म्हणून आम्ही मॅट्रिक्सच्या प्रथम स्तंभाला वगळतो. संभाव्यता q 1 = 0.
खेळाडू गमावण्याच्या धोरणाची स्थिती पासून, रणनीति बी 4 रणनीती बी 1 वर प्रभाव टाकतो (स्तंभ 4 मधील सर्व घटक स्तंभ 1 च्या घटकांपेक्षा अधिक असतात), म्हणून आम्ही मॅट्रिक्सच्या चौथ्या स्तंभाला वगळतो. संभाव्यता q 4 = 0.
1 2
-2 -2

आम्ही 4 x 4 गेममध्ये 2 x 2 गेम कमी केले.



खेळाचा निर्णय ( 2 एक्स एन


पी 1 = 1
पी 2 = 0
खेळाची किंमत, y = 1
आता आपण समीकरणाची संबंधित प्रणाली लिहिून प्लेअर बी ची मिनिमॅक्स धोरण शोधू शकता
क्यू 1 = 1
क्यू 1 + क्यू 2 = 1
या प्रणालीचे निराकरण करताना आम्हाला आढळते:
क्यू 1 = 1.
उत्तरः
खेळाची किंमत: y = 1, खेळाडूची रणनीति व्हॅक्टरः
प्रश्न (1, 0), पी (1, 0)

आयए आयजे क्यू जे ≤ वी
आयए आयजे पी आय ≥ वी
एम (पी 1; क्यू) = (1 1) + (2 0) = 1 = वी
एम (पी 2; क्यू) = (-2 -1) + (-2 0) = -2 ≤ वी
एम (पी; क्यू 1) = (1 1) + (-2 0) = 1 = वी
एम (पी; क्यू 2) = (2 1) + (-2 0) = 2 ≥ व्

मूळ मॅट्रिक्समधून पंक्ती आणि स्तंभ हटविले गेले असल्याने, संभाव्य संभाव्यता व्हॅक्टर लिहिल्या जाऊ शकतात:
पी (1,0,0,0)
प्रश्न (0,1,0,0)

कार्य 2
गेमच्या निम्न आणि उच्च किंमती शोधण्यासाठी पेमेंट मैट्रिक्सवर. जर काठीचा बिंदू असेल तर, पी *, क्यू * मधील सर्वोत्कृष्ट शुद्ध धोरणांचे वेक्टर लिहा.



आर 1

आर 2

आर 3

एस 1

-6

-5

0

एस 2

-8

-3

-2

एस 3

-3

-2

3

उपायः
1. पेमेंट मॅट्रिक्समध्ये सॅडल पॉइंट आहे का ते तपासा. होय असल्यास, शुद्ध धोरणात गेमचे निर्णय लिहा.
खेळाडूबी 1बी 2बी 3अ = किमान (ए मी)
अ 1-6 -5 0 -6
अ 2-8 -3 -2 -8
अ 3-3 -2 3 -3
बी = कमाल (बी मी)-3 -2 3

आम्ही गेमच्या निम्न किंमतीद्वारे निश्चित केलेल्या गॅरंटिड पेऑफचा एक = अधिकतम (एक i) = 3, जो जास्तीत जास्त निव्वळ धोरण ए 3 सूचित करतो.
खेळाची सर्वोच्च किंमत बी = मिनि (बी जे) = -3 आहे.
काठी बिंदू (3, 1) दोन पर्यायांचा (ए 3, बी 1) निराकरण दर्शवितो. खेळाची किंमत 3 आहे.
उत्तरः पी (0,0,1), प्रश्न (1,0,0)

कार्य 3
पेमेंट मॅट्रिक्सच्या मते, * पी *, क्यू * आणि खेळाच्या किंमती इष्टतम धोरणांचे वेक्टर शोधा. विजेता कोणता खेळाडू आहे?



आर 1

आर 2

आर 3

आर 4

एस 1

-6

-6

2

4

एस 2

2

-2

7

-1

उपायः
1. पेमेंट मॅट्रिक्समध्ये सॅडल पॉइंट आहे का ते तपासा. होय असल्यास, शुद्ध धोरणात गेमचे निर्णय लिहा.
आमचा विश्वास आहे की मी सर्वोत्तम खेळाडू मिळविण्यासाठी खेळाडू निवडतो आणि दुसरा खेळाडू त्याच्या रणनीतीची निवड करतो जेणेकरून खेळाडू प्रथम जिंकतो.
खेळाडूबी 1बी 2बी 3बी 4अ = किमान (ए मी)
अ 1-6 -6 2 4 -6
अ 22 -2 7 -1 -2
बी = कमाल (बी मी)2 -2 7 4

आम्हाला ए = मॅक्स (एक i) = -2 गेमच्या निम्न किंमतीद्वारे निश्चित केलेले गॅरंटीड पेऑफ आढळते जे जास्तीत जास्त निव्वळ धोरण ए 2 दर्शवते.
खेळाची सर्वोच्च किंमत बी = मिनि (बी जे) = -2 आहे.
सॅडल पॉइंट (2, 2) हे समाधान दोन पर्यायांना (ए 2, बी 2) दर्शवते. खेळाची किंमत -2 आहे.
3. मिश्रित रणनीतींमध्ये गेमचे निराकरण शोधा.
आम्ही भौमितिक पद्धतीद्वारे समस्येचे निराकरण करतो, ज्यात खालील चरण समाविष्ट आहेत:
1. कार्टेसियन समन्वय प्रणालीमध्ये, फरसबंदीच्या बाजूला एक विभाग घातला जातो, ज्याची लांबी 1 असते. विभागाचा डावा शेवट (पॉइंट x = 0) स्ट्रॅटेजी ए 1 शी संबंधित असतो आणि ए 2 (x = 1) च्या धोरणाचा उजवा शेवट असतो. इंटरमीडिएट पॉइंट्स एक्स काही मिश्रित धोरणांच्या संभाव्यतेशी जुळते S1 = (पी 1, पी 2).
2. डावी ऑर्डिनेट अक्षरावर, स्ट्रॅटेजी ए 1 ची विजया घातली आहेत. ऑर्डिनेट्सच्या अक्ष्याशी समांतर रेषेवर, स्ट्रॅटेजी ए 2 मधील फायदे पॉइंट 1 पासून तयार केले गेले आहेत.
खेळाचा निर्णय ( 2 एक्स एन) मॅक्सिमिन स्ट्रॅटेजीचे पालन करून, प्लेअर ए च्या स्थानापासून दूर रहा. कोणत्याही खेळाडूला प्रभावी आणि प्रतिकूल धोरण नाहीत.

मॅक्सिमिन प्लेअरची इष्टतम कार्यनीति A बिंदूशी संबंधित आहे, ज्यासाठी खालील समीकरणांची रचना केली जाऊ शकते:
पी 1 = 0
पी 2 = 1
खेळाची किंमत, y = -2
आता आपणास प्लेअर बी ची मिनीमॅक्स स्ट्रॅटेजी शोधून काढू शकते, ज्यामुळे समीकरणांची संबंधित प्रणाली लिहिते, रणनीती बी 1, बी 3, बी 4 नष्ट होईल, जे प्लेअर बीला स्पष्टपणे मोठे नुकसान देते आणि म्हणून, q 1 = 0, q 3 = 0, q 4 = 0 .
-2 क्यू 2 = -2
क्यू 2 = 1
या प्रणालीचे निराकरण करताना आम्हाला आढळते:
क्यू 2 = 1.
उत्तरः
गेमची किंमत: y = -2, खेळाडूंचे धोरण वॅक्टर:
प्रश्न (0, 1, 0, 0), पी (0, 1)
4. धोरण अनुकूलता निकष वापरून गेमच्या निर्णयाची शुद्धता तपासा.
आयए आयजे क्यू जे ≤ वी
आयए आयजे पी आय ≥ वी
एम (पी 1; क्यू) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ वी
एम (पी 2; क्यू) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = वी
एम (पी; क्यू 1) = (-6 0) + (2 1) = 2 ≥ व्
एम (पी; क्यू 2) = (-6 0) + (-2 1) = -2 = वी
एम (पी; क्यू 3) = (2 0) + (7 1) = 7 ≥ वी
एम (पी; क्यू 4) = (4 0) + (-1 1) = -1 ≥ वी
सर्व असमानता समानता किंवा कठोर असमानता म्हणून पूर्ण केली जातात, म्हणूनच गेमचे निराकरण सत्य असल्याचे दिसून येते.

कार्य 4
प्रश्नाचे तपशीलवार उत्तर द्या

5. खेळ आणि सांख्यिकी निर्णय सिद्धांत

5.1. शून्य-बेरीज मॅट्रिक्स गेम

खालील परिस्थितीत आर्थिक आणि गणिती मॉडेलिंग केले जाते:

निश्चितता;

अनिश्चितता

मॉडेलिंग निश्चितपणे   या (मॅट्रिक्स मॉडेलिंग, नेटवर्क नियोजन आणि व्यवस्थापन) यासाठी आवश्यक सर्व नियामक डेटाची उपलब्धता पूर्ववत करते.

मॉडेलिंग धोका आहे   जेव्हा काही प्रारंभिक डेटाची मूल्ये यादृच्छिक असतात आणि या यादृच्छिक चलनांच्या संभाव्य वितरणाचे कायदे ज्ञात असतात (स्ट्रेसस्टॅस्टिक विश्लेषण, क्यूईंग थिअरी) तेव्हा स्टोकस्टिक अनिश्चिततेच्या अंतर्गत चालते.

मॉडेलिंग अनिश्चिततेच्या बाबतीत   या (गेम थ्योरी) साठी काही आवश्यक डेटाची पूर्ण अनुपस्थितीशी जुळते.

विरोधाभासांच्या परिस्थितीत योग्य निर्णय घेण्याकरिता गणितीय मॉडेल अनिश्चिततेच्या स्थितीत तयार केले जातात.

गेम सिद्धांतानुसार, ते खालील मूलभूत कल्पनांसह कार्य करतात:

धोरण

विन कार्य.

अभ्यासक्रम   आम्ही खेळाच्या नियमांद्वारे केलेल्या कृतींपैकी एकाच्या खेळाडूद्वारे निवड आणि अंमलबजावणी करू.

धोरण   - परिस्थितीनुसार, प्रत्येक हालचालीवर कारवाईचा मार्ग निवडण्याचे हे तंत्रज्ञान आहे.

विन कार्य   विजेत्या खेळाडूस पराभूत झालेल्या लोकांच्या देय मूल्याचे मूल्य निर्धारित करते.

मॅट्रिक्स गेममध्ये, विजय कार्य म्हणून प्रतिनिधित्व केले जाते पेमेंट मॅट्रिक्स :

खेळाडू प्रथम, ज्याने हलवा निवडल्यास, दुसरा खेळाडू कडून हलविलेला रक्कम, रक्कम कुठे आहे.

अशा दुहेरी खेळामध्ये, प्रत्येक परिस्थितीतील दोन्ही खेळाडूंच्या विजयी फंक्शन्सचे मूल्य प्रमाण आणि परिमाणापेक्षा समान असतात.   आणि हा गेम म्हणतात शून्य-योग .

खालील प्रमाणे "मॅट्रिक्स गेम खेळणे" ची प्रक्रिया आहे:

पेमेंट मॅट्रिक्स सेट करा;

प्लेअर दुसरा, प्लेअर II न घेता, या मॅट्रिक्सच्या पंक्तींपैकी एक निवडते, उदाहरणार्थ, -th;

प्लेअर I वगळता प्लेअर दुसरा, या मॅट्रिक्सच्या स्तंभांपैकी एक निवडतो, उदाहरणार्थ, - ओह;

मॅट्रिक्स घटक हे मी ठरवितो की प्लेअर 2 कडून मला किती खेळाडू प्राप्त होतील. नक्कीच, जर आपण खेळाडू आयच्या वास्तविक नुकसानीबद्दल बोलत आहोत.

पेमेंट मेट्रिक्ससह एक विरोधी जोडी गेमला एक गेम म्हटले जाईल.

उदाहरण

खेळ विचारात घ्या.

पे मेट्रिक्स सेट आहे:

.

प्लेअर I ला न घेता प्लेयर I ला परवानगी द्या, या मॅट्रिक्सची तिसरी पंक्ती निवडा आणि प्लेअर I ला न घेता प्लेयर II, या मॅट्रिक्सचा दुसरा स्तंभ निवडा:

मग खेळाडूला मी द्वितीय खेळाडूकडून 9 एकके प्राप्त करू.

5.2. मॅट्रिक्स गेममध्ये सर्वोत्कृष्ट नेट धोरण

सर्वोत्कृष्ट धोरण   खेळाडू प्रथम अशा धोरणास म्हटले जाते, ज्यामध्ये त्याने प्लेअर 2 च्या कोणत्याही निवडीच्या धोरणासह त्याच्या पगाराची कमतरता कमी केली नाही आणि खेळाडू 2 च्या अशा धोरणासह तो कमी करीत नाही, ज्यामध्ये त्याने प्रथम खेळाडूद्वारे धोरणाची निवड केली नाही.

पेमेंट मॅट्रिक्सची पंक्ती म्हणून निवडल्यास, प्लेअर दुसरा हा मूल्य कमी करण्याचा प्रयत्न करतो तेव्हा मी सर्वात वाईट प्रकरणात कमीतकमी परिमाण मिळवण्याचा सुनिश्चित करतो. म्हणून, मी अशी एक ओळ निवडणार आहे, जो त्याला जास्तीत जास्त मिळवून देईल:

.

प्लेअर 2 सारख्याच कारणास्तव आणि स्वतःसाठी कमीतकमी तोटा सुरक्षित करू शकतो:

.

असमानता नेहमीच न्याय्य असते.

परिमाण म्हणतात खेळ कमी किंमत .

परिमाण म्हणतात शीर्ष गेम किंमत .

सर्वोत्तम धोरणे म्हणतात स्वच्छ त्यांच्यासाठी समानता धारण केल्यास:

,

.

परिमाण म्हणतात नेट गेम किंमत जर

उत्कृष्ट नेट धोरण आणि फॉर्म काठी बिंदू   पेमेंट मॅट्रिक्स

कडव्या बिंदूसाठी खालील अटी पूर्ण झाल्या आहेत:

म्हणजेच, पंक्तीमधील सर्वात लहान आणि स्तंभातील सर्वात मोठा घटक आहे.

तर, पे मॅट्रिक्स असल्यास काठी बिंदू मग आपण शोधू शकता उत्तम स्वच्छ धोरणे   खेळाडू

प्लेअरच्या शुद्ध धोरणाची संख्या (वेक्टर) च्या क्रमाने सेटद्वारे दर्शविली जाऊ शकते ज्यामध्ये सर्व संख्या शून्य आहेत, त्याऐवजी जो एकसारखा आहे तो सोडून.

प्लेअर II चे शुद्ध धोरण संख्या (वेक्टर) च्या क्रमाने सेटद्वारे दर्शविले जाऊ शकते, ज्यामध्ये सर्व संख्या शून्यांप्रमाणे आहेत, प्रथम स्थानावर असलेल्या संख्येशिवाय, जे एकसारखे आहे.

उदाहरण

.

पेमेंट मॅट्रिक्सची कोणतीही ओळ हलवून निवडल्यास, खेळाडू मी खात्री करतो की सर्वात वाईट प्रकरणात, त्याने सूचित केलेल्या कॉलममधील किमान मूल्य जिंकला जाईल:

म्हणूनच मी प्लेयर्स पेमेंट मॅट्रिक्सची दुसरी ओळ निवडू शकेन, जो खेळाडू 2 च्या मुद्यावर जास्तीत जास्त विजय निश्चित करेल, जो या मूल्यास कमी करण्याचा प्रयत्न करेल:

खेळाडू दुसरा एकसारखाच विचार करतो आणि पहिल्या स्तंभाला हलवा म्हणून निवडतो:

अशा प्रकारे, पेमेंट मॅट्रिक्सचा सट्टा बिंदू आहे:

प्लेअर I आणि प्लेअर दुसरा यांच्यासाठी सर्वोत्कृष्ट शुद्ध धोरणानुसार, मी कोणत्या खेळाडूस प्लेअर 2 आणि प्लेअर 2 मधील धोरणातील कोणत्याही बदलांमुळे त्याच्या जिंकण्या कमी करीत नाही. यामुळे खेळाडू I मधील धोरणातील कोणत्याही बदलासह त्याचे नुकसान वाढते नाही.

5.3. मॅट्रिक्स गेममध्ये सर्वोत्कृष्ट मिश्रित धोरण

जर पेमेंट मॅट्रिक्समध्ये सॅडल पॉईंट नसेल तर कोणत्याही खेळाडूने एक शुद्ध धोरण वापरणे अयोग्य आहे. वापरण्यासाठी अधिक फायदेशीर "संभाव्य मिश्रण" स्वच्छ धोरणे मग, आधीच मिश्रित धोरणे सर्वोत्कृष्ट म्हणून निर्धारित केली जातात.

मिश्रित धोरण   खेळाडूला हलविण्याच्या निवडीमध्ये समाविष्ट असलेल्या यादृच्छिक कार्यक्रमाची शक्यता वितरणाद्वारे वैशिष्ट्यीकृत केले जाते.

प्लेअर I च्या मिश्रित धोरणास अशा क्रमवारीचा क्रम म्हणून सेट केला जातो.   (वेक्टर), जे दोन अटी पूर्ण करते:

1) यासाठी, म्हणजे, पेमेंट मेट्रिक्सची प्रत्येक पंक्ती निवडण्याची संभाव्यता नॉन-नेगेटिव्ह आहे;

2) म्हणजे, एकत्रितपणे देयक मॅट्रिक्सच्या प्रत्येक पंक्तीची निवड इव्हेंटच्या संपूर्ण गटास दर्शवते.

खेळाडू द्वितीय मिश्रित धोरण क्रमांकांची ऑर्डर दिलेली असेल.   (वेक्टर) अटी पूर्ण करीत आहे:

देय रक्कम   खेळाडू मी, जो मिश्रित धोरण निवडला

दुसरा खेळाडू जो मिश्रित धोरण निवडतो

,

सरासरी प्रतिनिधित्व करते

.

इष्टतम   मिश्रित धोरणे म्हणतात

  आणि ,

कोणत्याही अनियंत्रित मिश्रित धोरणे आणि अटसाठी:

म्हणजे, सर्वोत्कृष्ट मिश्रित धोरणानुसार, मी जिंकलेला खेळाडू महान आहे आणि दुसरा खेळाडू कमीतकमी गमावतो.

जर पेमेंट मॅट्रिक्समध्ये कोणतेही कडवे बिंदू नसेल तर

,

म्हणजे एक सकारात्मक फरक आहे ( न वाटलेला फरक )

- ³ 0,

आणि खेळाडूंनी त्यांच्या फरकाने मोठ्या प्रमाणात फरक मिळविण्यासाठी अतिरिक्त संधी शोधण्याची गरज आहे.

उदाहरण

पेमेंट मॅट्रिक्सद्वारे दिले गेलेले गेम विचारात घ्या:

.

एक काठी बिंदू असल्याचे निश्चित करा:

, .

पेमेंट मॅट्रिक्समध्ये कोणतेही कडवे बिंदू नाही आणि हे वाटप केलेले फरक हे असे दर्शविते की:

.

5.4. सर्वोत्कृष्ट मिश्रित रणनीती शोधत आहे

2 × 2 खेळांसाठी

पेमेंट मॅट्रिक्ससाठी आयामानुसार सर्वोत्कृष्ट मिश्रित धोरणांचे निर्धारण दोन चलनांच्या फंक्शनचे इष्टतम बिंदू शोधून काढले जाते.

पेमेंट मॅट्रिक्सच्या पहिल्या ओळीच्या प्लेअरच्या निवडीची संभाव्यता द्या

समान आहे मग दुसरी ओळ निवडण्याची शक्यता आहे.

प्लेअर दुसरा पहिला स्तंभ निवडण्याची शक्यता समान आहे. मग दुसरा स्तंभ निवडण्याची शक्यता आहे.

खेळाडू द्वितीय द्वारे प्लेअरला रक्कम देय रक्कम समान आहे:

प्लेअर I च्या फायद्याचे आणि व्हॅल्यू II च्या हानीचे महत्त्वपूर्ण मूल्य अटींच्या अनुरूप आहे:

;

.

अशा प्रकारे, प्रथम आणि द्वितीय खेळाडूंचे सर्वोत्कृष्ट मिश्रित धोरण अनुक्रमे समान आहे:

5.5. गेम 2 × भौमितिक समाधानएन

पेमेंट मॅट्रिक्स सीच्या आयातीत वाढ झाल्यामुळे, दोन चलनांच्या कार्यक्षमतेची सर्वोत्कृष्ट कार्यक्षमता शोधण्यासाठी सर्वोत्कृष्ट मिश्रित धोरणांचे निर्धारण कमी करणे शक्य नाही. तथापि, खेळाडूंपैकी एकात फक्त दोन रणनीती आहेत, आपण एक भौमितीय निराकरण वापरू शकता.

खालील प्रकारचे गेम शोधण्याचे मुख्य चरण आहेत.

विमानात आम्ही समन्वय प्रणाली सादर करतो. अक्षावर एक सेगमेंट सेट करा. या सेगमेंटच्या डाव्या आणि उजव्या बाजूकडील आम्ही लंबमंडळ काढतो.


एका सेगमेंटचा डावा आणि उजवा भाग दोन रणनीती आणि प्लेअर I शी संबंधित असतो. लंबवर्गाच्या शेवटी, आम्ही या प्लेअरच्या विजयाची परतफेड करू. उदाहरणार्थ, पेमेंट मॅट्रिक्ससाठी


  जेव्हा मी एक धोरण निवडत असतो तेव्हा मी जिंकतो आणि एक धोरण निवडताना.

खेळाडू 2 च्या रणनीतीशी संबंधित, प्लेअर I च्या विजयी पॉइंटच्या बिंदूशी संबंधित विभागांशी कनेक्ट करा. त्यानंतर परिणामी तुटलेली ओळ, खालील आलेख मर्यादित करते, प्लेअर I ची मर्यादा निश्चित करते.



  सर्वोत्कृष्ट मिश्रित खेळाडू धोरण I शोधा

,

जे अधिकतम विजेते असलेल्या विजयी खेळाडूच्या तळाशी असलेल्या बिंदूशी संबंधित आहे.

लक्षात घ्या की या उदाहरणात, केवळ दोन रणनीती आणि प्रत्यक्षशी संबंधित, प्लेअर I च्या विजयाच्या खाली मर्यादेत सापडलेल्या बिंदूंवर आंतरसंकेत करून, दुसरा खेळाडू विजयी होण्यापासून खेळाडूला प्रतिबंधित करू शकतो.

अशा प्रकारे, गेम हा गेममध्ये कमी केला जातो आणि या उदाहरणात प्लेअर 2 ची सर्वोत्कृष्ट मिश्रित धोरण असेल

,

जेथे संभाव्यता गेममध्ये सारखीच असते:

5.6. निर्णय गेम्समी× एन

जर मॅट्रिक्स गेमचे शुद्ध धोरणांमध्ये कोणतेही निराकरण नसेल (म्हणजे तेथे सॅडल पॉईंट नाही) आणि पेमेंट मॅट्रिक्सच्या मोठ्या परिमाणमुळे ग्राफिकपणे निराकरण केले जाऊ शकत नाही, तर रेखीय प्रोग्रामिंग पद्धत .

आयाम मॅट्रिक्स सेट करू द्या:

.

संभाव्यता शोधण्यासाठी आवश्यक आहे , कोणत्या खेळाडूने मी त्याच्या हालचाली निवडणे आवश्यक आहे जेणेकरुन या मिश्रित धोरणामुळे त्याला खेळाडू द्वितीय स्थानांतरित करण्याच्या निवडीकडे दुर्लक्ष करून कमीतकमी मूल्य मिळविण्याची हमी मिळेल.

प्लेअर दुसरा द्वारे निवडलेल्या प्रत्येक वळणासाठी, प्लेअर I ची जिंकणे अवलंबित्वांद्वारे निर्धारित केली जाते:

आम्ही असमानतेच्या दोन्ही भागांमध्ये विभाजित करतो आणि नवीन सूचना सादर करतो:

समानता

हे असे दिसेल:

खेळाडू म्हणून मी जिंकलेली रक्कम जास्तीत जास्त वाढवण्याचा प्रयत्न करीत असल्याने, पारंपारिक कमी करणे आवश्यक आहे. नंतर प्लेअर I साठी रेखीय प्रोग्रामिंग समस्या असे दिसेल:

निर्बंधांतर्गत

त्याचप्रमाणे, प्लेअर II ची रचना ड्युअल म्हणून केली गेली आहे:

निर्बंधांतर्गत

साध्या पद्धतीद्वारे समस्यांचे निराकरण करणे, आम्हाला मिळते:

,

5.7. मॅट्रिक्स गेम्स सोडविण्याची वैशिष्ट्ये

सर्वोत्कृष्ट धोरण शोधण्याच्या समस्येचे निराकरण करण्यापूर्वी आपण दोन अटी तपासाव्या:

पेमेंट मॅट्रिक्स सुलभ करणे शक्य आहे काय?

पेमेंट मॅट्रिक्समध्ये सट्टा बिंदू आहे का?

पेमेंट मॅट्रिक्स सरलीकृत करण्याची शक्यता विचारात घ्या:

मी ज्या खेळाडूला सर्वात मोठा विजय मिळवण्याचा प्रयत्न करतो त्यानुसार, पेलाइन लाईनमधून हटविले जाऊ शकते कारण कोणत्याही अन्य ओळखालील पुढील संबंध पूर्ण झाल्यास ते या हलवाचा कधीही वापर करणार नाही:

त्याचप्रमाणे, कमीतकमी नुकसान टाळण्यासाठी, प्लेअर दुसरा कधीही पेमेंट मॅट्रिक्समधील कॉलम हलवणार नाही आणि कोणत्याही स्तंभासह पुढील संबंध समाधानी असल्यास हा स्तंभ पार केला जाऊ शकतो:

सरलीकृत पेमेंट मॅट्रिक्समध्ये सॅडल पॉइंट असणे हा गेमचा सर्वात सोपा उपाय आहे जो खालील अटी (परिभाषेनुसार) पूर्ण करतो:

उदाहरण

पेमेंट मॅट्रिक्स दिलेलेः

.

पेमेंट मॅट्रिक्सची सरलीकरण

खोड्याच्या बिंदूची उपस्थिती:

5.8. निसर्गाने खेळा

गेम थियोरी इन समस्यांमधील फरक सांख्यिकीय समाधानाच्या सिद्धांतांची समस्या   अनिश्चित परिस्थितीत विरोध करणारे रंग नसतात आणि त्या वस्तुस्थितीवर अवलंबून असतात ज्याला म्हटले जाते "निसर्ग" .

निसर्गासह मॅट्रिक्स गेममध्ये, प्लेअर दुसरा अनिश्चित घटकांचा एक संयोजन आहे ज्यामुळे निर्णय घेण्याच्या परिणामकारकता प्रभावित होतात.

प्रकृतीसह मॅट्रिक्स खेळ फक्त सामान्य मॅट्रिक्स गेम्सपेक्षा भिन्न असतात जेव्हा मी सर्वोत्कृष्ट धोरण निवडतो, खेळाडू यापुढे मी त्याच्या हानी कमी करण्याचा प्रयत्न करणार्या खेळाडूवर यापुढे अवलंबून राहू शकत नाही. म्हणून, पेमेंट मॅट्रिक्स सोबत सादर केले आहे जोखीम मॅट्रिक्स :

फरक समान परिस्थितीत अभ्यासक्रम वापरताना खेळाडू प्रथम जोखीम किंमत आहे   जर एखाद्या खेळाडूची स्थिती स्थापित केली असेल तर मला माहित असेल की मी जिंकलेल्या खेळाडूंपैकी एक. , आणि त्याला मिळालेली मिळकत, एखादी हालचाल निवडताना हे माहित नाही की स्थिती स्थापित केली जाईल.

अशा प्रकारे, पेमेंट मॅट्रिक्स निःसंकोचपणे जोखीम मॅट्रिक्समध्ये रुपांतरीत होते आणि व्यस्त परिवर्तन अस्पष्ट आहे.

उदाहरण

मॅट्रिक्स जिंकणे:

.

जोखीम मॅट्रिक्स

शक्य आहे दोन समस्या विधान   निर्णय घेण्यावर निसर्गासह मॅट्रिक्स गेममध्ये :

विजय वाढवा;

धोका कमी करा.

निर्णय घेण्याच्या दोन अटींपैकी एक सेट करणे शक्य आहे:

- धोका आहे जेव्हा निसर्गाच्या रणनीतींची संभाव्यता वितरण कार्य ज्ञात आहे, उदाहरणार्थ, प्रत्येक अपेक्षित विशिष्ट आर्थिक परिस्थितीच्या स्वरुपाचे यादृच्छिक मूल्य;

- अनिश्चिततेच्या बाबतीत जेव्हा अशी संभाव्य वितरण कार्य अज्ञात असते.

5.9. सांख्यिकीय समाधानाच्या सिद्धांताची समस्या सोडवणे

धोका आहे

जोखीम अंतर्गत निर्णय घेताना, खेळाडू मला संभाव्यता माहित आहे   निसर्गाच्या अवस्थांची सुरुवात.

मग मी खेळाडूसाठी कोणत्या धोरणाची निवड करावी याबद्दल सल्ला दिला जातो ओळवर घेतलेल्या वाढीचे सरासरी मूल्य :

.

जोखीम मॅट्रिक्ससह या समस्येचे निराकरण करताना, आम्हाला समान समाधान प्राप्त होते किमान सरासरी जोखीम :

.

5.10. सांख्यिकीय समाधानाच्या सिद्धांताची समस्या सोडवणे

अनिश्चिततेच्या बाबतीत

अनिश्चिततेत निर्णय घेताना आपण खालील गोष्टींचा वापर करू शकता निकष :

मॅक्सिमिन वॉल्ड निकष;

सेव्हेजसाठी किमान जोखीम निकष;

निराशाची निकष - आशावाद हर्विट्झ;

Laplace अपुरी प्रमाणात सिद्धांत.

विचार करेल मॅक्समिन वॉल्ड चाचणी .

निसर्गासह खेळ वाजवी आक्रमक प्रतिस्पर्ध्यासह आयोजित केला जातो, म्हणजे, रीइन्श्युरन्स पध्दत पेमेंट मॅट्रिक्ससाठी अत्यंत निराशाजनक स्थितीपासून चालविली जाते:

.

विचार करेल   सेव्हेज किमान जोखीम निकष .

जोखीम मॅट्रिक्ससाठी अत्यंत निराशाजनक स्थितीपेक्षा मागील एकासारखे दृष्टिकोण:

.

विचार करेल   निराशाची निकष - आशावाद हर्विट्झ .

अत्यंत निराशावाद आणि अत्यंत आशावादाने या मार्गावर मार्गदर्शन करण्याची संधी दिली जात नाही.

निराशाची पदवी कुठे आहे;

प्राई - अत्यंत आशावाद,

प्राई - अत्यंत निराशावाद.

विचार करेल   अपुरा बेस लेपलेसचा सिद्धांत .

असे मानले जाते की निसर्गाचे सर्वच राज्य समान प्रमाणात आहेत:

,

.

पाचव्या विभागातील निष्कर्ष

दोन खेळाडू मॅट्रिक्स गेममध्ये सहभागी होतात आणि विजय कार्य, जे विजेत्या खेळाडूस गमावलेला देयक मूल्य निर्धारित करते, ते देयक मॅट्रिक्स म्हणून दर्शविले जाते. आम्ही सहमत झालो की मी पेमेंट मॅट्रिक्सच्या एका ओळीस हलवून प्लेअर निवडतो आणि दुसरा खेळाडू त्याच्या कॉलमपैकी एक निवडतो. नंतर निवडलेल्या पंक्तीच्या आणि या मॅट्रिक्सच्या स्तंभाच्या चौरसावर द्वितीय खेळाडूकडून प्लेअर I च्या पेमेंटचे संख्यात्मक मूल्य आहे (जर हा मूल्य सकारात्मक असेल तर मी खरोखरच जिंकलेला खेळाडू आणि तो नकारात्मक असेल तर दुसरा खेळाडू अनिवार्यपणे जिंकला जाईल).

जर पेमेंट मॅट्रिक्समध्ये सॅडल पॉईंट असेल तर, खेळाडूंना सर्वोत्कृष्ट स्वच्छ धोरणे म्हणजे जिंकण्यासाठी, त्यांच्यापैकी प्रत्येकाने त्याच्या सर्वोत्कृष्ट हालचालीची पुनरावृत्ती करणे आवश्यक आहे. जर सँडल पॉईंट नसेल तर जिंकण्यासाठी प्रत्येकास अनुकूल मिश्रित धोरण वापरणे आवश्यक आहे, म्हणजे हलके मिश्रण वापरणे आवश्यक आहे, त्यापैकी प्रत्येक संभाव्य संभाव्यतेसह तयार करणे आवश्यक आहे.

2 × 2 गेमसाठी सर्वोत्कृष्ट मिश्रित धोरणांची शोध ज्ञात सूत्रांनी वापरुन इष्टतम संभाव्यतेची गणना करून केली जाते. 2 × एन गेमचे ज्यामितीय सोल्यूशनचा वापर करून, त्यामध्ये सर्वोत्कृष्ट मिश्रित धोरणांचे निर्धारण 2 × 2 गेमसाठी सर्वोत्कृष्ट मिश्रित धोरण शोधण्यासाठी कमी केले आहे. एम × एन गेम सोडवण्यासाठी, त्यामध्ये सर्वोत्कृष्ट मिश्रित रणनीती शोधण्यासाठी ते रेषीय प्रोग्रामिंग पद्धत वापरतात.

काही पेमेंट मेट्रिसिस सरलीकरणसाठी सक्षम आहेत, ज्याच्या परिणामी अनाकलनीय हालचालींशी संबंधित पंक्ती आणि स्तंभ काढण्यामुळे त्यांची आयाम कमी होते.

जर दुसरा खेळाडू हा अनिश्चित घटकांचा एक सेट आहे जो वस्तुस्थितीवर अवलंबून असतो आणि विरोधक रंग नसतो तर हा खेळ निसर्गासह खेळ म्हटला जातो आणि त्यास सोडवण्यासाठी, सांख्यिकीय समाधानाच्या सिद्धांताची समस्या वापरतात. मग, पेमेंट मॅट्रिक्ससह, जोखीम मॅट्रिक्स सादर केला जातो आणि निसर्गाने मॅट्रिक्स गेममध्ये समाधान निवडण्याची समस्या दोन फॉर्म्युलेशन्स शक्य आहेत: लाभ वाढविणे आणि जोखीम कमी करणे.

जोखीम परिस्थितीच्या अंतर्गत सांख्यिकीय समाधानांच्या सिद्धांतातील समस्या सोडवणे, मी दाखवितो की खेळाडूने मी पध्दती निवडली पाहिजे जी पे लाइन लाइन पंक्तीवर घेतलेली मिळकत सरासरी मूल्य (गणिती अपेक्षा) जास्तीत जास्त किंवा (जो समान आहे) जोखीम सरासरी मूल्य (गणिती अपेक्षा) जोखीम मॅट्रिक्सच्या पंक्तीसह घेतलेले किमान आहे. अनिश्चिततेखालील निर्णय घेताना, खालील निकषांचा वापर केला जातो: कमाल मर्यादा वॉल्ड निकष, साव्हीगचा किमान जोखीम निकष, हूर्विट्झ निराशावाद-आशावाद निकष, लेपलेसचा अपर्याप्त पायाभूत सिद्धांत.

स्व-चाचणीसाठी प्रश्न

गेमच्या सिद्धांताची मूलभूत संकल्पना कशी आहेत: विजय, धोरण आणि जिंकण्याचे कार्य?

मॅट्रिक्स गेममध्ये स्कोअरिंग फंक्शन कोणत्या स्वरूपात दिसून येते?

एक मॅट्रिक्स गेम शून्य-योग म्हणतात का?

मॅट्रिक्स गेम खेळण्याची प्रक्रिया काय आहे?

एम × एन गेम कोणत्या खेळास म्हणतात?

इष्टतम मॅट्रिक्स गेम धोरण काय आहे?

निव्वळ नामक इष्टतम मॅट्रिक्स गेम स्ट्रॅटेजी म्हणजे काय?

पेमेंट मॅट्रिक्सच्या सॅडल पॉईंटचा अर्थ काय आहे?

मिट्रीक्स गेमची सर्वोत्कृष्ट धोरण म्हणजे मिश्रित काय आहे?

एक मिश्रित खेळाडू धोरण काय आहे?

मिश्रित रणनीती निवडणार्या खेळाडू 2 कडून खेळाडू प्रथमपर्यंत देय मूल्य काय आहे?

कोणत्या मिश्रित धोरणांना सर्वोत्कृष्ट म्हटले जाते?

वाटप न केलेले फरक काय आहे?

2 × 2 गेमसाठी सर्वोत्तम मिश्रित धोरण कोणती पद्धत आहे?

2 × n गेमसाठी सर्वोत्कृष्ट मिश्रित रणनीती कशी आढळली?

एम × एन गेम्ससाठी सर्वोत्कृष्ट मिश्रित रणनीती कोणत्या पद्धतीने मिळतात?

मॅट्रिक्स गेम्स सोडविण्याची वैशिष्ट्ये कोणती आहेत?

पेमेंट मेट्रिक्सचा अर्थ काय सुलभ करते आणि ते कोणत्या परिस्थितीत लागू केले जाऊ शकते?

वेतन मॅट्रिक्सकडे कडवे बिंदू असताना किंवा नसल्यास कोणता मॅट्रिक्स गेम अधिक सुलभ आहे?

सांख्यिक समाधानाच्या सिद्धांताशी संबंधित गेम थ्योरीचे कोणते कार्य संबंधित आहेत?

पेमेंट मॅट्रिक्स एखाद्या जोखीम मॅट्रिक्समध्ये रूपांतरित कसे होते?

निसर्गासह मॅट्रिक्स गेममध्ये निर्णय समस्येचे दोन सूत्र कोणते आहेत?

निसर्गाने मॅट्रिक्स गेममध्ये कोणत्या दोन अटींसाठी निर्णय घेण्याची समस्या सेट केली जाऊ शकते?

जोखीम परिस्थितीत सांख्यिकीय समाधानाच्या सिद्धांताची समस्या सोडवित असताना मी कोणती खेळाडू निवडली पाहिजे?

अनिश्चिततेच्या अंतर्गत सांख्यिकीय निर्णयाच्या सिद्धांतांमध्ये समस्या सोडविण्यासाठी कोणते निर्णय निकष वापरले जाऊ शकतात?

समस्या सोडविण्याचे उदाहरण

1. स्थिर मागणी (पंक्ती) आधारावर विविध प्रकारचे उत्पादने (स्तंभ) लागू करतेवेळी देय मॅट्रिक्स एंटरप्राइझच्या नफ्याचे आकार दर्शवते. विविध प्रकारच्या उत्पादनांच्या उत्पादनासाठी आणि त्यांच्या विक्रीमधून मिळणार्या संबंधित कमाल (सरासरी) उत्पन्नासाठी एंटरप्राइजची सर्वोत्कृष्ट धोरण निर्धारित करणे आवश्यक आहे.

व्हेरिएबल्सद्वारे दिलेल्या मॅट्रिक्सचा उल्लेख करा आणि परिचय द्या. आम्ही मॅट्रिक्स (वेक्टर) देखील वापरु. मग तू, मी

व्यस्त मॅट्रिक्सची गणना करा:

मूल्ये ही आहेत:

.

संभाव्यतांची गणना केली आहे:

विक्रीतून मिळणार्या सरासरी उत्पन्नाद्वारे निर्धारित केले जाते:

.

2. कंपनी "फार्मासिस्ट" - या क्षेत्रातील औषधे आणि बायोमेडिकल उत्पादनांचा निर्माता. शरद ऋतूतील आणि वसंत ऋतु (विरोधी-संक्रमक, विरोधी) वर काही औषधींच्या मागणीची उन्हाळ्यात उन्हाळ्याच्या काळात (हृदयविकाराच्या गट, एनालजेक्सचे औषध), इतरांवर येते.

1 कोंडसाठी किंमत एकक सप्टेंबर-ऑक्टोबरसाठी उत्पादनांची संख्या: पहिल्या गटात (कार्डिओव्हास्कुलर आणि अॅनाल्जेसिक औषधे) - 20 पी .; दुसर्या गटात (अॅन्टी-संक्रामक, अँटिट्यूसिव्ह ड्रग्स) - 15 पी.

गेल्या काही वर्षांच्या निरीक्षणानुसार, कंपनीच्या मार्केटिंग सेवेने असे निश्चित केले आहे की उबदार हवामानाच्या परिस्थितीत दोन महिन्यांनी 3050 सेवा लक्षात येऊ शकतात. एकक पहिल्या गटाचे उत्पादन आणि 1,100 सेवा. एकक दुसऱ्या गटाचे उत्पादन; थंड हवामानाच्या परिस्थितीत - 1525 सेवा. एकक पहिल्या ग्रुपची उत्पादने आणि 36 9 0 सेवा. एकक दुसरा गट

हवामानातील संभाव्य बदलांच्या संबंधात, 40 रूबल्सच्या विक्री किंमतीवर जास्तीत जास्त विक्री उत्पन्न प्रदान करून उत्पादनातील कंपनीची योजना निर्धारित करण्यासाठी - कार्य तयार केले गेले आहे. 1 वा. एकक पहिल्या गटाचे उत्पादन आणि 30 पी. दुसरा गट

निराकरण कंपनीची दोन धोरणे आहेत:

या वर्षी उबदार हवामान होईल;

हवामान थंड असेल.

जर कंपनी एक धोरण घेते आणि प्रत्यक्षात उबदार हवामान (निसर्गाचे धोरण) असेल तर त्या सोडल्या जाणार्या उत्पादनांमध्ये (औषधाच्या पहिल्या गटाच्या 3050 रूपयांच्या युनिट्स आणि दुसर्या गटाच्या 1100 पारंपरिक युनिट्स) पूर्णपणे समजू शकतील आणि मिळकत

3050 × (40-20) + 1100 × (30-15) = 77500 पी.

थंड हवामानाच्या स्थितीत (निसर्गाची धोरणे), औषधांचा दुसरा गट पूर्णपणे विकला जाईल आणि प्रथम समूह केवळ 1525 सेवांमध्ये असेल. एकक आणि औषधांचा भाग अपूर्ण राहतील. उत्पन्न होईल

1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 पी.

त्याचप्रमाणे, जर फॉर्म एक धोरण घेते आणि प्रत्यक्षात थंड हवामान असेल तर उत्पन्न होईल

1525 × (40-20) + 36 9 0 × (30-15) = 85,850 पी.

उबदार हवामानात, उत्पन्न होईल

1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 आर.

कंपनी आणि हवामान दोन खेळाडूंच्या रूपात लक्षात घेऊन आम्हाला पेमेंट मेट्रिक्स मिळतो

,

खेळ किंमत श्रेणीत आहे

पेमेंट मॅट्रिक्स कडून हे स्पष्ट आहे की सर्व परिस्थितींमध्ये फर्मची उत्पन्ना 16,500 पट कमी असेल, परंतु जर हवामान परिस्थिती निवडलेल्या धोरणाशी जुळली तर फर्मची मिळकत 77500 पी असू शकते.

गेमचे निराकरण शोधा.

आम्ही धोरणाच्या माध्यमातून धोरणाद्वारे, धोरणाद्वारे - द्वारे आणि वापराद्वारे संभाव्यतेची संभाव्यता सूचित करतो. ग्राफिक पद्धतीने गेम सोडवणे, आम्हाला मिळते खेळ आर किंमत सह.

औषधाच्या उत्पादनाची सर्वोत्कृष्ट योजना असेल

अशा प्रकारे सप्टेंबर आणि ऑक्टोबर 237 9 दरम्यान कंपनीने उत्पादनासाठी सल्ला दिला आहे. एकक पहिल्या गटातील औषधे आणि 223 9 .6 एसआर. एकक दुसऱ्या गटातील औषधे, नंतर कोणत्याही हवामानात त्यांना कमीतकमी 46 9 86 रुपये मिळतील.

अनिश्चिततेच्या बाबतीत, एखाद्या फर्मची उत्तम धोरण निर्धारित करण्यासाठी मिश्रित धोरण (इतर संस्थांशी करार) वापरणे शक्य नसल्यास खालील निकषांचा वापर करा:

वाल्दे निकष

निकष ह्युविट्झ: निश्चितपणासाठी, आम्ही कंपनीच्या धोरणासाठी नंतर स्वीकारतो

धोरणासाठी

एक धोरण वापरण्याची कंपनी सल्ला देते.

सेव्हेज मापदंड पहिल्या स्तंभात अधिकतम संख्या 77500 आहे, दुसर्या स्तंभात 85850 आहे.

जोखीम मॅट्रिक्सच्या घटकांमधून मिळते

,

कुठून

जोखीम मॅट्रिक्स आहे

,

एक धोरण किंवा वापरण्यासाठी सल्ला दिला जातो.

म्हणूनच कंपनीला धोरण लागू करण्याची सल्ला दिला जातो.

आम्ही लक्षात ठेवतो की विचाराधीन प्रत्येक निकष निर्णयाच्या अंतिम निवडीसाठी बर्यापैकी समाधानकारक मानले जाऊ शकत नाही; तथापि, त्यांचे संयुक्त विश्लेषण आपल्याला काही व्यवस्थापन निर्णय घेण्याच्या परिणामाबद्दल अधिक स्पष्टपणे स्पष्ट करण्यास अनुमती देते.

निसर्गाच्या विविध राज्यांच्या ज्ञात संभाव्यतेच्या वितरणासह, निर्णय घेण्याचा निकष अधिकतम अपेक्षित पेऑफ आहे.

या कामासाठी विचारात घ्या की उबदार आणि थंड हवामानाची शक्यता 0.5 च्या बरोबरीची आणि त्या बरोबर आहे, तर फर्मची उत्तम कार्यनीति खालीलप्रमाणे निर्धारित केली जाते:

कंपनीने या धोरणाचा वापर करावा.

स्वतंत्र कार्यासाठी कार्य

1. मागणीनुसार, नफा प्राप्त करताना कंपनी तीन प्रकारच्या उत्पादनांची (ए, बी आणि सी) निर्मिती करू शकते. बदल्यात मागणी चारपैकी एक राज्य (I, II, III आणि IV) घेवू शकते. खालील मॅट्रिक्समध्ये, घटक त्यांच्या उत्पादनाची आणि मागणीची मागणी जारी करते तेव्हा एक एंटरप्राइझ प्राप्त होणार्या नफ्याचे वैशिष्ट्य दर्शविते:

जर गेममधील प्रत्येक प्रतिस्पर्धी फक्त एकच धोरण लागू करतो, तर गेम स्वतःच या प्रकरणात असल्याचे सांगितले जाते शुद्ध धोरणांमध्ये , आणि खेळाडू द्वारे वापरले   आणि खेळाडू मध्ये  दोन रणनीती म्हणतात शुद्ध धोरण .

व्याख्या   विरोधी खेळांत, दोन रणनीती ( मी , मध्ये  जे) कोणत्याही खेळाडूला त्यांच्या धोरणांपासून विचलित होण्यास फायदेशीर नसल्यास समतोल किंवा स्थिर म्हणतात.

जेव्हा खेळाडू शुद्ध असतात तेव्हा शुद्ध धोरणे लागू होतात   आणि मध्ये  एकमेकांच्या क्रिया आणि प्राप्त झालेल्या परिणामांबद्दल माहिती मिळवा. जर आपण गृहीत धरले की पक्षातील कमीतकमी एक पक्ष शत्रूच्या वर्तनाबद्दल माहिती देत ​​नसेल तर शिल्लक कल्पना संकटात टाकली जाते आणि खेळ अपात्रपणे खेळला जातो.

मॅट्रिक्स गेमचा विचार करा जी  (3x4)

या उदाहरणात, गेमची निम्न किंमत शीर्षस्थानी आहे: == 9, म्हणजे. खेळ एक खोड बिंदू आहे.

हे दिसून येते की या प्रकरणात maximin रणनीती   2 आणि मध्ये  2 असेल लवचिक   शत्रूच्या वर्तनाविषयी माहितीच्या संबंधात.

खरंच खेळाडू द्या   शिकलो की शत्रू एक धोरण लागू करीत आहे मध्ये  2 पण या प्रकरणात खेळाडू   अद्याप धोरण राहतील   2, कारण धोरण पासून कोणत्याही विचलन   2 केवळ फायदा कमी करेल. त्याचप्रमाणे, खेळाडूकडून मिळालेली माहिती मध्येत्याला त्याच्या धोरणापासून मागे जाण्यास भाग पाडणार नाही मध्ये 2 .

धोरणे जोडी   2 आणि मध्ये  2 मध्ये स्थिरतेची मालमत्ता असते आणि मिळकत (या उदाहरणात, 9 इतकी असते), या जोडीच्या रणनीतीसह मिळविलेले, पेमेंट मॅट्रिक्सचे कडवे बिंदू आहे.

रणनीती जोडीची स्थिरता (समतोल) चिन्ह म्हणजे खेळाच्या निम्न आणि उच्च किंमतीची समानता होय.

रणनीती मी  आणि मध्ये जे  (या उदाहरणात 2 , मध्ये  2), ज्यामध्ये खेळाच्या खालच्या आणि वरच्या किंमतींची समानता पूर्ण होते, त्यास सर्वोत्कृष्ट शुद्ध धोरण म्हटले जाते आणि त्यांच्या संयोजनाला हा गेमचा निर्णय म्हणतात. या प्रकरणात, गेम स्वत: शुद्ध धोरणांमध्ये सोडवले जाईल असे म्हटले जाते.

मूल्याला खेळाची किंमत असे म्हटले जाते.

0 असल्यास, गेम ए प्लेयरसाठी फायदेशीर असेल तर 0 - खेळाडू बी साठी; येथे = 0 गेम चांगला आहे, म्हणजे दोन्ही सहभागींसाठी तितकेच फायदेशीर आहे.

तथापि, गेममधील सट्टा बिंदूची उपस्थिती नियम नव्हे तर अपवाद आहे. बर्याच मॅट्रिक्स गेममध्ये कड्या नसतात आणि त्यामुळे सर्वोत्कृष्ट शुद्ध कार्यप्रणाली नाहीत. तथापि, अशा प्रकारचे गेम असतात ज्यात नेहमीच खोड्याचा मुद्दा असतो आणि म्हणूनच, शुद्ध धोरणांमध्ये सोडविले जातात. ही संपूर्ण माहिती असलेली गेम आहेत.

प्रमेय 2.   संपूर्ण माहिती असलेल्या प्रत्येक गेममध्ये कडवे बिंदू असते आणि म्हणूनच शुद्ध धोरणामध्ये निराकरण केले जाते, म्हणजे. चांगल्या शुद्ध पध्दतींचा एक जोडी आहे, स्थिर मिळवून देणे, समान.

अशा खेळामध्ये फक्त वैयक्तिक हालचाली असतील, तर जेव्हा प्रत्येक खेळाडू त्याच्या सर्वोत्तम शुद्ध धोरणास लागू करेल, तो खेळाच्या किंमतीच्या बरोबरीने जिंकला पाहिजे. उदाहरणार्थ, संपूर्ण माहिती असलेल्या खेळासारख्या शतरंज गेम, नेहमीच व्हाइट विजेते, किंवा नेहमीच ब्लॅक विजेतेने किंवा नेहमी ड्रॉसह (नेहमी काय - अद्याप माहित नाही कारण शतरंज गेममध्ये संभाव्य रणनीतींची संख्या प्रचंड असते) सहसा संपूर्ण माहितीसह गेम नेहमीच समाप्त होते.

गेम मॅट्रिक्समध्ये सॅडल पॉईंट असेल तर त्याचे समाधान त्वरीत मॅक्सिमिनच्या तत्त्वावर आढळते.

प्रश्न उद्भवतो: एका गेमचे निराकरण कसे मिळवावे ज्याच्या देय मॅट्रिक्समध्ये सॅडल पॉईंट नसते? प्रत्येक खेळाडूला मॅक्सिमिन तत्त्वज्ञानाचा अनुप्रयोग प्लेअर ए ला कमी मिळवून देणारा खेळाडू प्रदान करतो, जो कोणत्याही प्रकारचे नुकसान नाही. हे लक्षात घेता, स्वाभाविकपणे, खेळाडू ए, फायदे वाढविण्याची इच्छा आणि खेळाडू बी साठी, तोटा कमी करण्यासाठी. अशा सोल्यूशनसाठी शोध मिश्रित रणनीती लागू करण्याची आवश्यकता निर्माण करते: काही फ्रिक्वेन्सीजसह वैकल्पिक शुद्ध धोरणे.

व्याख्या   एक यादृच्छिक चलन ज्याचे मूल्य शुद्ध खेळाडू धोरण आहेत असे म्हटले जाते मिश्रित धोरण .

अशा प्रकारे, खेळाडूच्या मिश्रित धोरणाची कार्ये तिच्या शुद्ध धोरणांची निवड करण्याच्या संभाव्यते दर्शवितात.

आम्ही खेळाडूंचे मिश्रित रणनीती दर्शवितो.   आणि मध्ये  त्यानुसार

एस ए = पी 1, पी 2, ..., पी एम ||,

एस बी = || क्यू 1, क्यू 2, ..., क्यू एन ||

जेथे पी मी - खेळाडू संभाव्यता   प्रक्षेपणासह स्वच्छ   इ; ; q जे - खेळाडूद्वारे वापरण्याची संभाव्यता शुद्ध धोरणात बी जे; .

विशिष्ट परिस्थितीत जेव्हा एखादी व्यक्ती वगळता सर्व संभाव्यता शून्य असते आणि ती एक आहे, मिश्रित धोरण स्वच्छतेमध्ये बदलते.

मिश्रित रणनीतींचा वापर, उदाहरणार्थ, खालील प्रकारे केला जातो: खेळ बर्याच वेळा पुनरावृत्ती केला जातो, परंतु प्रत्येक गेममध्ये खेळाडू आपल्या अनुप्रयोगाच्या संबंधित फ्रिक्वेन्सीजसह विविध शुद्ध धोरणे लागू करतो. पी मी   आणि क्यू जे .

गेम थ्योरीतील मिश्रित रणनीती बदलण्यायोग्य, लवचिक युक्त्या आहेत, जेव्हा खेळाडूंना या गेममध्ये विरोधी कोणता शुद्ध निवडतो हे माहित नसते.

जर खेळाडू असेल तर   एस ए = = पी 1, पी 2, ..., पी एम ||, आणि खेळाडू मिश्रित धोरण लागू करते मध्ये  मिश्रित रणनीती एस बी = || क्यू 1, क्यू 2, ..., क्यू एन || नंतर, खेळाडूची सरासरी वाढ (गणिती अपेक्षा)   गुणोत्तर द्वारे निर्धारित

स्वाभाविकच, खेळाडूची अपेक्षित तोटा मध्ये  समान मूल्याच्या समान.

म्हणून, जर मॅट्रिक्स गेममध्ये सडल पॉईंट नसेल तर, खेळाडूने सर्वोत्कृष्ट मिश्रित धोरण वापरणे आवश्यक आहे जे अधिकतम विजयाची खात्री करेल.

नैसर्गिकरित्या प्रश्न उठला आहे: मिश्रित धोरणांच्या निवडीचे काय मार्गदर्शन करावे? या प्रकरणात मॅक्सिमिनचे तत्त्व त्याचे मूल्य टिकवून ठेवते. याव्यतिरिक्त, गेमच्या सिद्धांताचे मूलभूत सिद्धांत गेमचे निराकरण समजण्यात महत्त्वपूर्ण भूमिका बजावतात.

अर्थशास्त्र मध्ये गणितीय पद्धती आणि मॉडेल

मॅट्रिक्स गेम्स

परिचय

आर्थिक व्यवहारात, परिस्थिती अनेकदा उद्भवते ज्यामध्ये भिन्न पक्ष वेगवेगळे उद्दीष्ट चालवतात. उदाहरणार्थ, विक्रेता आणि खरेदीदार, पुरवठादार आणि ग्राहक, बँक आणि ठेवीदार, इ. मधील संबंध अशा संघर्ष परिस्थिती केवळ अर्थव्यवस्थेतच नव्हे तर इतर क्रियाकलापांमध्येही उद्भवतात. उदाहरणार्थ, शतरंज, चेकर्स, डोमिनोज, लॉटो इत्यादी खेळताना.

खेळ- हे त्यांच्या उद्दिष्टांचे लक्ष्य प्राप्त करण्यासाठी वेगवेगळ्या पद्धती वापरुन कमीतकमी दोन लोक समाविष्ट असलेल्या संघर्ष परिस्थितीचा गणितीय मॉडेल आहे. खेळ म्हणतात स्टीम रूम जर त्यात दोन खेळाडू सहभागी होतात. खेळ म्हणतात विरोधक जर एक खेळाडूचा फायदा दुसर्याच्या तोटाच्या समान असेल. परिणामी, गेम सेट करण्यासाठी, भिन्न परिस्थितींमध्ये एका प्लेअरच्या विजयाचे मूल्य सेट करणे पुरेसे आहे.

कोणत्याही परिस्थितीनुसार खेळाडू परिस्थितीवर अवलंबून कार्य करतो धोरण प्रत्येक खेळाडूकडे निश्चित रणनीती असतात. जर रणनीतींची संख्या मर्यादित असेल तर गेम खेळला जातो अंतिम अन्यथा - अनंत .   धोरणे म्हणतात स्वच्छ जर प्रत्येक खेळाडू निश्चितपणे केवळ एक धोरण निवडतो आणि यादृच्छिक नसतो तर.

गेम सोल्यूशनसमाधानकारक असलेली एक धोरण निवडणे आहे इष्टतम स्थिती ही परिस्थिती अशी आहे की एक खेळाडू मिळतो जास्तीत जास्त विजय, जर दुसरा त्याच्या धोरणांना चिकटून असेल तर. उलट, दुसरा खेळाडू मिळतो किमान नुकसान,   जर पहिला खेळाडू त्याच्या धोरणानुसार असेल तर. अशा धोरणे म्हणतात इष्टतम . अशा प्रकारे, खेळाचा ध्येय म्हणजे प्रत्येक खेळाडूसाठी उत्तम धोरण निश्चित करणे.

शुद्ध धोरण गेम

दोन खेळाडूंसह खेळ विचारा.   आणि व्ही.समजा एक खेळाडू आहे मीधोरणे ए 1, ए 2, ..., एमआणि खेळाडू मध्येआहे एनधोरणे बी 1, बी 2, ..., बी एन.आम्ही मानतो की एका खेळाडूची निवड धोरणे आणि मीखेळाडू म्हणून मध्येधोरणे बी जेअनन्यपणे गेमचे परिणाम ठरवते, म्हणजे. जिंकणे एक आयजेखेळाडू आणि जिंकणे   बी आयजेखेळाडू व्ही.येथे मी = 1,2, ..., एम, जे = 1,2, ..., एन.

सर्वात साधा दोन-खेळाडू गेम हा विरोधी पक्ष आहे. , म्हणजे एक खेळ ज्यामध्ये खेळाडूंचा स्वभाव थेटपणे विरोध केला जातो. या बाबतीत, खेळाडूंचे जिंकणे संबंधित आहेत

बी आयजे = -ए आयजे

या समानतेचा अर्थ असा आहे की खेळाडूंपैकी एकचा फायदा इतरांच्या तोटाइतकाच आहे. या प्रकरणात, खेळाडूंपैकी फक्त एक खेळाडू म्हणून जिंकणे पुरेसे आहे, उदाहरणार्थ, खेळाडू ए.

रणनीती प्रत्येक जोडी आणि   बी जेवाढीशी संबंधित आहे एक आयजेखेळाडू ए.या सर्व विजयांना सोयीस्कर स्वरूपात लिहिलेले आहे पेमेंट मॅट्रिक्स

या मॅट्रिक्सची पंक्ती खेळाडूंच्या धोरणांशी जुळतात. आणि स्तंभ - खेळाडू रणनीती व्ही.सर्वसाधारणपणे, हा गेम म्हणतात (एम × एन) -गॅम.


उदाहरण 1दोन खेळाडू   आणि मध्येएक नाणे फेकून द्या. नाणेच्या बाजूचे बाजू तर जिंकतात. म्हणजे खेळाडू मध्येखेळाडू देते 1 च्या समान रक्कम आणि ते एकत्र येत नसल्यास, खेळाडू बी जिंकतो, म्हणजे उलट, खेळाडू खेळाडू देते मध्येसमान रक्कम , समान 1. पेमेंट मॅट्रिक्स तयार करण्यासाठी

निर्णयसमस्येच्या स्थितीमुळे

© 201 9 skudelnica.ru - प्रेम, धर्मद्रोही, मनोविज्ञान, घटस्फोट, भावना, झगडा