ألعاب استراتيجية خالصة. استراتيجيات مختلطة

الصفحة الرئيسية / سابق

لعبة استراتيجية نظرية مختلطة

استراتيجيات مختلطة

إذا لم تكن هناك نقطة سرج في الإستراتيجيات البحتة في لعبة المصفوفة ، فسيتم العثور على الأسعار الأعلى والأدنى للعبة. لقد أظهروا أن اللاعب 1 لن يحصل على فوز يتجاوز سعر اللعبة الأعلى ، وأن هذا اللاعب 1 يضمن فوزًا لا يقل عن سعر اللعبة الأدنى.

الإستراتيجية المختلطة للاعب هي مجموعة كاملة من إستراتيجياته الخالصة ذات التكرار المتعدد للعبة تحت نفس الظروف مع احتمالات معينة. دعونا نلخص ما قيل وسرد شروط استخدام الاستراتيجيات المختلطة:

  • * العب بدون سرج ؛
  • * يستخدم اللاعبون مزيجًا عشوائيًا من الاستراتيجيات البحتة مع احتمالات معينة ؛
  • * تتكرر اللعبة عدة مرات في ظروف مماثلة ؛
  • * في كل من الحركات ، لا يتم إبلاغ أي لاعب باختيار الإستراتيجية من قبل لاعب آخر ؛
  • * يُسمح بحساب متوسط ​​نتائج اللعبة.

تم استخدام الترميز التالي للاستراتيجيات المختلطة.

بالنسبة للاعب 1 ، استراتيجية مختلطة تتكون من تطبيق استراتيجيات خالصة A 1 ، A 2 ، ... ، A m مع الاحتمالات المقابلة ص 1 ، ص 2 ، ... ، ف م.

للاعب 2

q j هو احتمال تطبيق الإستراتيجية البحتة B j.

في الحالة التي يكون فيها р i = 1 ، لدينا استراتيجية خالصة للاعب 1

استراتيجيات اللاعب الخالصة هي الوحيدة الممكنة أحداث غير متسقة... في لعبة المصفوفة ، معرفة المصفوفة A (تنطبق على كل من اللاعب 1 واللاعب 2) ، يمكن تحديدها من أجل نواقل معينةومتوسط ​​العائد ( القيمة المتوقعةتأثير) للاعب 1:

أين و هي نواقل.

p i و q i هما مكونان للمتجهات.

من خلال تطبيق استراتيجياته المختلطة ، يسعى اللاعب 1 إلى زيادة متوسط ​​أرباحه إلى الحد الأقصى ، واللاعب 2 - لتحقيق هذا التأثير إلى أدنى قيمة ممكنة. يسعى اللاعب 1 إلى تحقيقه

يتأكد اللاعب 2 من تلبية الشرط

دعنا نشير أيضًا إلى المتجهات المقابلة للاستراتيجيات المختلطة المثلى للاعبين 1 و 2 ، أي هذه النواقل والتي من أجلها المساواة

سعر اللعبة هو متوسط ​​العائد للاعب 1 عندما يستخدم كلا اللاعبين استراتيجيات مختلطة. لذلك ، فإن حل لعبة المصفوفة هو:

  • - الإستراتيجية المختلطة المثلى للاعب 1 ؛
  • - الإستراتيجية المختلطة المثلى للاعب 2 ؛

سعر اللعبة.

استراتيجيات مختلطةستكون مثالية (و) إذا كانت تشكل نقطة سرج للوظيفة ، أي

هناك نظرية أساسية للألعاب الرياضية.

بالنسبة للعبة المصفوفة مع أي مصفوفة A ، فإن الكميات

موجودة ومتساوية مع بعضها البعض: = =.

تجدر الإشارة إلى أنه عند اختيار الاستراتيجيات المثلى ، سيضمن اللاعب 1 دائمًا متوسط ​​العائد ، لا يقل عن سعر اللعبة ، لأي إستراتيجية ثابتة للاعب 2 (وعلى العكس ، بالنسبة للاعب 2). الاستراتيجيات النشطة للاعبين 1 و 2 هي الاستراتيجيات المضمنة في الاستراتيجيات المختلطة المثلى للاعبين المتوافقين مع الاحتمالات غير الصفرية. هذا يعني أن تركيبة الاستراتيجيات المختلطة المثلى للاعبين قد لا تشمل جميع الاستراتيجيات المحددة مسبقًا الخاصة بهم.

حل اللعبة يعني إيجاد سعر اللعبة والاستراتيجيات المثلى. سنبدأ بحثنا في طرق إيجاد الإستراتيجيات المختلطة المثلى لألعاب المصفوفة مع أبسط لعبة موصوفة في المصفوفة 22. لن يتم النظر في ألعاب سادل بوينت بشكل خاص. إذا تم الحصول على نقطة سرج ، فهذا يعني أن هناك استراتيجيات غير مربحة يجب التخلي عنها. في حالة عدم وجود نقطة سرج ، يمكن الحصول على استراتيجيتين مختلطتين مثلى. كما لوحظ ، تتم كتابة هذه الاستراتيجيات المختلطة على النحو التالي:

هذا يعني أن هناك مصفوفة دفع

أ 11 ص 1 + أ 21 ص 2 = ؛ (1.16)

أ 12 ص 1 + أ 22 ص 2 = ؛ (1.17)

ص 1 + ص 2 = 1. (1.18)

أ 11 ص 1 + أ 21 (1 - ع 1) = أ 12 ف 1 + أ 22 (1 - ص 1) ؛ (1.19)

أ 11 ص 1 + أ 21 - أ 21 ف 1 = أ 12 ف 1 + أ 22 - أ 22 ف 1 ، (1.20)

من أين نحصل على القيم المثلى و:

علم ووجدنا:

بعد الحساب ، نجد و:

أ 11 س 1 + أ 12 س 2 = ؛ س 1 + س 2 = 1 ؛ (1.24)

أ 11 س 1 + أ 12 (1 - ف 1) =. (1.25)

لـ 11 a 12. (1.26)

تم حل المشكلة ، حيث تم العثور على المتجهات وسعر اللعبة. بوجود مصفوفة المدفوعات أ ، من الممكن حل المشكلة بيانياً. بهذه الطريقة ، تكون خوارزمية الحل بسيطة للغاية (الشكل 2.1).

  • 1. يتم رسم جزء من طول الوحدة على طول محور الإحداثي.
  • 2. الإحداثي هو مكاسب الإستراتيجية أ 1.
  • 3. على خط موازٍ للمحور الإحداثي ، عند النقطة 1 ، يتم رسم المكاسب للإستراتيجية أ 2.
  • 4. تم تحديد نهايات المقاطع لـ 11 -b 11 ، و 12 -b 21 ، و 22 -b 22 ، و 21 -b 12 ، وخطوطان مستقيمة b 11 b 12 و b 21 b 22 مرسومة.
  • 5. يتم تحديد إحداثيات نقطة التقاطع مع. إنها متساوية. الحد الفاصل للنقطة ج يساوي ص 2 (ص 1 = 1 - ص 2).

أرز. 1.1.

هذه الطريقة لها مجال تطبيق واسع إلى حد ما. هذا يعتمد على الملكية المشتركة games mn ، والتي تتكون من حقيقة أنه في أي لعبة ، يمتلك كل لاعب إستراتيجية مختلطة مثالية يكون فيها عدد الاستراتيجيات الصرفة بحد أقصى (م ، ن). من هذه الخاصية ، يمكن للمرء الحصول على نتيجة معروفة: في أي لعبة 2n و m2 ، تحتوي كل استراتيجية مثالية على استراتيجيتين فعالتين على الأكثر. وبالتالي ، يمكن اختزال أي لعبة 2n و m2 إلى لعبة 22. لذلك ، يمكن حل الألعاب 2n و m2 بيانيا. إذا كانت مصفوفة لعبة محدودة لها بعد mn ، حيث m> 2 و n> 2 ، فسيتم استخدام البرمجة الخطية لتحديد الاستراتيجيات المختلطة المثلى.

استراتيجية خالصةيختار اللاعب الأول أحد صفوف n من مصفوفة المكافآت A ، والاستراتيجية الخالصة للاعب II هي اختيار أحد أعمدة المصفوفة نفسها.

أفضل استراتيجيات نظيفةيختلف اللاعبون عن اللاعبين المختلطين من خلال وجود وحدة إلزامية p i = 1 ، q i = 1. على سبيل المثال: P (1،0) ، Q (1،0). هنا ص 1 = 1 ، ف 1 = 1.

المشكلة 1
باستخدام مصفوفة الدفع ، ابحث عن الاستراتيجيات النظيفة المثلى باستخدام مبدأ الهيمنة الصارمة. كإجابة ، اكتب المتجهات P * ، Q *.



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

4 س

0

-2

-2

1

حل:

نقوم بحل جميع المشاكل باستخدام حاسبة لعبة Matrix.

نفترض أن اللاعب الذي اختار استراتيجيته ليحصل على أقصى قدر من المكاسب ، ويختار اللاعب II استراتيجيته لتقليل أرباح اللاعب الأول.

لاعبينب 1ب 2ب 3ب 4أ = دقيقة (أ ط)
أ 13 1 2 5 1
أ 22 0 0 3 0
أ 3-3 -5 -5 -2 -5
أ 40 -2 -2 1 -2
ب = ماكس (ب ط)3 1 2 5
نجد المكاسب المضمونة التي يحددها السعر الأدنى للعبة a = max (a i) = 1 ، مما يشير إلى الحد الأقصى للاستراتيجية الخالصة A 1.
أعلى سعر للعبة هو b = min (b j) = 1.
تشير نقطة السرج (1 ، 2) إلى حل لزوج من البدائل (A1 ، B2). سعر اللعبة 1.
2. تحقق من مصفوفة الدفع للصفوف السائدة والأعمدة السائدة.
في بعض الأحيان ، بناءً على اعتبار بسيط لمصفوفة اللعبة ، يمكننا القول أن بعض الاستراتيجيات البحتة يمكن أن تدخل الإستراتيجية المختلطة المثلى فقط مع احتمال صفر.
ويقولون ان طاستراتيجية اللاعب الأول تهيمن عليه ك الاستراتيجية إذا كان ij ≥ a kj للجميع ي ه نوواحد على الأقل ي a ij> a kj. في هذه الحالة ، يقال أيضًا أن طاستراتيجية (أو خط) - مهيمن ، ك ال- سيطر.
ويقولون ان ي-التهيمن عليه استراتيجية اللاعب الثاني ل الاستراتيجية للجميع ي ه م a ij ≤ a il ولمدة واحدة على الأقل i a ij< a il . В этом случае ي-الالإستراتيجية (العمود) تسمى المهيمنة ، ل ال- سيطر.
تهيمن الإستراتيجية A 1 على الإستراتيجية A 2 (جميع عناصر الصف 1 أكبر من أو تساوي قيم الصف الثاني) ، لذلك نستبعد الصف الثاني من المصفوفة. الاحتمال ص 2 = 0.
تهيمن الإستراتيجية A 1 على الإستراتيجية A 3 (جميع عناصر الصف 1 أكبر من أو تساوي قيم الصف الثالث) ، لذلك نستبعد الصف الثالث من المصفوفة. الاحتمال ص 3 = 0.
3 1 2 5
0 -2 -2 1

من موقع خسائر اللاعب B ، تهيمن الإستراتيجية B 1 على الإستراتيجية B 2 (جميع عناصر العمود 1 المزيد من العناصرالعمود 2) ، لذلك نستبعد العمود الأول من المصفوفة. الاحتمال q 1 = 0.
من موقع خسائر اللاعب B ، تهيمن الإستراتيجية B 4 على الإستراتيجية B 1 (جميع عناصر العمود 4 أكبر من عناصر العمود 1) ، لذلك نستبعد العمود الرابع من المصفوفة. الاحتمال q 4 = 0.
1 2
-2 -2

لقد اختزلنا لعبة 4 × 4 إلى لعبة 2 × 2.



حل اللعبة ( 2 × ن


ص 1 = 1
ص 2 = 0
سعر اللعبة ، ص = 1
الآن يمكننا إيجاد استراتيجية minimax للاعب B بكتابة نظام المعادلات المقابل
ف 1 = 1
س 1 + س 2 = 1
لحل هذا النظام نجد:
ف 1 = 1.
إجابة:
سعر اللعبة: y = 1 ، ناقلات استراتيجية اللاعبين:
ق (1،0) ، ف (1،0)

∑a ij q j ≤ v
∑a ij p i ≥ v
م (ف 1 ؛ س) = (1 1) + (2 0) = 1 = ت
م (ف 2 ؛ س) = (-2 1) + (-2 0) = -2 ≤ الخامس
م (ف ؛ س 1) = (1 1) + (-2 0) = 1 = ت
م (ف ؛ س 2) = (2 1) + (-2 0) = 2 ≥ الخامس

نظرًا لأنه تمت إزالة الصفوف والأعمدة من المصفوفة الأصلية ، يمكن كتابة متجهات الاحتمالية الموجودة على النحو التالي:
ف (1،0،0،0)
س (0،1،0،0)

المهمة 2
ابحث عن الأسعار الدنيا والعليا للعبة باستخدام مصفوفة الدفع. في وجود نقطة سرج ، اكتب نواقل الاستراتيجيات البحتة المثلى P * ، Q *.



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

حل:
1. تحقق مما إذا كانت مصفوفة المكافأة بها نقطة سرج. إذا كانت الإجابة بنعم ، فإننا نكتب حل اللعبة في استراتيجيات خالصة.
لاعبينب 1ب 2ب 3أ = دقيقة (أ ط)
أ 1-6 -5 0 -6
أ 2-8 -3 -2 -8
أ 3-3 -2 3 -3
ب = ماكس (ب ط)-3 -2 3

نجد المكاسب المضمونة التي يحددها السعر الأدنى للعبة a = max (a i) = -3 ، مما يشير إلى الحد الأقصى للاستراتيجية الصافية A 3.
أعلى سعر للعبة هو b = min (b j) = -3.
تشير نقطة السرج (3 ، 1) إلى حل لزوج من البدائل (A3 ، B1). سعر اللعبة -3.
الجواب: P (0،0،1) Q (1،0،0)

مشكلة 3
ابحث عن متجهات للاستراتيجيات المثلى P * و Q * وسعر اللعبة باستخدام مصفوفة الدفع. من هو اللاعب الفائز؟



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

حل:
1. تحقق مما إذا كانت مصفوفة المكافأة بها نقطة سرج. إذا كانت الإجابة بنعم ، فإننا نكتب حل اللعبة في استراتيجيات خالصة.
نفترض أن اللاعب الذي اختار استراتيجيته ليحصل على أقصى قدر من المكاسب ، ويختار اللاعب II استراتيجيته لتقليل أرباح اللاعب الأول.
لاعبينب 1ب 2ب 3ب 4أ = دقيقة (أ ط)
أ 1-6 -6 2 4 -6
أ 22 -2 7 -1 -2
ب = ماكس (ب ط)2 -2 7 4

نجد المكاسب المضمونة التي يحددها السعر الأدنى للعبة a = max (a i) = -2 ، مما يشير إلى الحد الأقصى للاستراتيجية الصرفة A 2.
أعلى سعر للعبة هو b = min (b j) = -2.
تشير نقطة السرج (2 ، 2) إلى حل لزوج من البدائل (A2 ، B2). سعر اللعبة -2.
3. إيجاد الحل للعبة في استراتيجيات مختلطة.
لنحل المشكلة بالطريقة الهندسية والتي تتضمن الخطوات التالية:
1. في نظام الإحداثيات الديكارتية ، يتم رسم مقطع على طول محور الإحداثي ، ويبلغ طوله 1. الطرف الأيسر من المقطع (النقطة x = 0) يتوافق مع الإستراتيجية A 1 ، الجزء الأيمن - مع الإستراتيجية أ 2 (س = 1). النقاط الوسيطة x تتوافق مع احتمالات بعض الاستراتيجيات المختلطة S 1 = (p 1، p 2).
2. يتم رسم مكاسب الإستراتيجية A 1 على المحور الإحداثي الأيسر. على الخط الموازي للمحور الإحداثي ، من النقطة 1 ، يتم رسم مكاسب الإستراتيجية A 2.
حل اللعبة ( 2 × ن) من موقع اللاعب A ، مع الالتزام باستراتيجية maximin. ليس لدى أي من اللاعبين استراتيجيات مهيمنة ومكررة.

تتوافق الاستراتيجية المثلى القصوى للاعب A مع النقطة N ، والتي من أجلها يمكن كتابة نظام المعادلات التالي:
ص 1 = 0
ص 2 = 1
سعر اللعبة ، ص = -2
الآن يمكننا إيجاد استراتيجية الحد الأدنى للاعب B من خلال كتابة نظام المعادلات المقابل ، باستثناء الإستراتيجية B 1 ، B 3 ، B 4 ، والتي تعطي بوضوح خسارة أكبر للاعب B ، وبالتالي ، q 1 = 0 ، ف 3 = 0 ، ف 4 = 0 ...
-2q 2 = -2
ف 2 = 1
لحل هذا النظام نجد:
ف 2 = 1.
إجابة:
سعر اللعبة: ص = -2 ، نواقل استراتيجية اللاعبين:
ق (0 ، 1 ، 0 ، 0) ، ف (0 ، 1)
4. دعنا نتحقق من صحة حل اللعبة باستخدام معيار الإستراتيجية المثلى.
∑a ij q j ≤ v
∑a ij p i ≥ v
م (ف 1 ؛ س) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ الخامس
م (ف 2 ؛ س) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = ت
م (ف ؛ س 1) = (-6 0) + (2 1) = 2 ≥ الخامس
م (ف ؛ س 2) = (-6 0) + (-2 1) = -2 = ت
م (ف ؛ س 3) = (2 0) + (7 1) = 7 ≥ الخامس
م (ف ؛ س 4) = (4 0) + (-1 1) = -1 ≥ الخامس
يتم استيفاء جميع حالات عدم المساواة باعتبارها مساواة أو عدم مساواة صارمة ، وبالتالي ، يتم العثور على حل اللعبة بشكل صحيح.

المشكلة 4
أعط إجابة مفصلة على السؤال

5. نظرية الألعاب والحلول الإحصائية

5.1 لعبة مصفوفة محصلتها صفر

يتم تنفيذ النمذجة الاقتصادية والرياضية في الحالات التالية:

اليقين

شكوك.

النمذجة في ظروف اليقين يفترض توافر جميع البيانات المعيارية الأولية الضرورية (نمذجة المصفوفة ، تخطيط الشبكة وإدارتها).

النمذجة في خطر يتم تنفيذه مع عدم اليقين العشوائي ، عندما تكون قيم بعض البيانات الأولية عشوائية وتكون قوانين التوزيع الاحتمالي لهذه المتغيرات العشوائية معروفة (تحليل الانحدار ، نظرية الطابور).

النمذجة في مواجهة عدم اليقين يتوافق مع الغياب التامبعض البيانات المطلوبة لهذا (نظرية اللعبة).

يتم بناء النماذج الرياضية لاتخاذ القرارات المثلى في حالات الصراع في ظل ظروف عدم اليقين.

في نظرية اللعبة ، يتم استخدام المفاهيم الأساسية التالية:

إستراتيجية؛

وظيفة الفوز.

من خلال الدورة سوف نطلق على اللاعب اختيار وتنفيذ أحد الإجراءات المنصوص عليها في قواعد اللعبة.

إستراتيجية هي تقنية لاختيار مسار العمل في كل خطوة ، اعتمادًا على الوضع الحالي.

وظيفة الفوز يعمل على تحديد مبلغ دفع اللاعب الخاسر للاعب الفائز.

في لعبة المصفوفة ، يتم تمثيل وظيفة المكافأة كـ مصفوفة الدفع :

أين مقدار الدفع للاعب الأول الذي اختار النقلة من اللاعب الثاني الذي اختار النقلة.

في مثل هذه اللعبة الزوجية ، تكون قيم وظائف المكافآت لكل من اللاعبين في كل موقف متساوية في الحجم ومعاكسة في الإشارة ، أي. وهذه اللعبة تسمى مجموع الصفر .

تتمثل عملية "لعب لعبة المصفوفة" على النحو التالي:

تم تعيين مصفوفة الدفع ؛

يختار اللاعب I ، بشكل مستقل عن اللاعب II ، أحد صفوف هذه المصفوفة ، على سبيل المثال ، th ؛

اللاعب II ، بغض النظر عن اللاعب الأول ، يختار أحد أعمدة هذه المصفوفة ، على سبيل المثال ، - th ؛

يحدد عنصر المصفوفة مقدار اللاعب الذي سأستلمه من اللاعب II. بالطبع ، إذا ، إذن يأتيحول الخسارة الفعلية للاعب I.

لعبة زوجية معادية مع مصفوفة المكافآت ستسمى لعبة.

مثال

ضع في اعتبارك لعبة.

تم تعيين مصفوفة الدفع:

.

دع اللاعب I ، بشكل مستقل عن اللاعب II ، يختار الصف الثالث من هذه المصفوفة ، واللاعب II ، بغض النظر عن اللاعب I ، يختار العمود الثاني من هذه المصفوفة:

ثم سأحصل على 9 وحدات من اللاعب الثاني.

5.2 استراتيجية نظيفة مثالية في لعبة مصفوفة

الإستراتيجية المثلى هي إستراتيجية للاعب الأول بحيث لا يقلل من مكافأته لأي اختيار للإستراتيجية من قبل اللاعب الثاني ، وإستراتيجية اللاعب الثاني بحيث لا يزيد خسارته لأي اختيار للإستراتيجية من قبل اللاعب الأول.

باختيار الصف i من مصفوفة المكافآت كحركته ، يقدم اللاعب الأول لنفسه مكافأة لا تقل عن القيمة في أسوأ الحالات ، عندما يحاول اللاعب II تقليل هذه القيمة إلى أدنى حد. لذلك ، سأختار اللاعب مثل هذا الصف الذي سيوفره له أقصى فوز:

.

يفكر اللاعب الثاني بطريقة مماثلة ويمكنه بالتأكيد أن يؤمن لنفسه أقل خسارة:

.

التفاوت صحيح دائمًا:

الكمية تسمى أدنى سعر للعبة .

الكمية تسمى أعلى سعر للعبة .

تسمى الاستراتيجيات المثلى ينظف إذا كانت المساواة صحيحة بالنسبة لهم:

,

.

الكمية تسمى السعر الخالص للعبة ، لو .

استراتيجيات وشكل نقي مثالي نقطة سرج مصفوفة الدفع.

بالنسبة لنقطة السرج ، يتم استيفاء الشروط التالية:

أي أن العنصر هو الأصغر في الصف والأكبر في العمود.

وهكذا ، إذا كانت مصفوفة المكافآت نقطة سرج ثم يمكنك أن تجد إستراتيجيات النظافة المثلى اللاعبين.

يمكن تمثيل الإستراتيجية الخالصة للاعب الأول بمجموعة مرتبة من الأرقام (المتجه) ، حيث تكون جميع الأرقام مساوية للصفر ، باستثناء الرقم الموجود في المكان الرابع ، والذي يساوي واحدًا.

يمكن تمثيل استراتيجية اللاعب II الصافية بمجموعة مرتبة من الأرقام (المتجه) حيث تكون جميع الأرقام مساوية للصفر ، باستثناء الرقم الموجود في المكان الرابع ، والذي يساوي واحدًا.

مثال

.

باختيار أي صف من مصفوفة المكافآت كخطوة ، يضمن اللاعب لنفسه عائدًا في أسوأ الحالات لا يقل عن القيمة الواردة في العمود المشار إليه بواسطة:

لذلك ، سيختار اللاعب الصف الثاني من مصفوفة المكافآت ، والتي توفر له أقصى عائد بغض النظر عن حركة اللاعب II ، الذي سيحاول تقليل هذه القيمة إلى الحد الأدنى:

يفكر اللاعب الثاني بشكل مشابه ويختار العمود الأول كحركته:

وبالتالي ، هناك نقطة سرج لمصفوفة الدفع:

تتوافق مع الإستراتيجية البحتة المثلى للاعب I ولللاعب II ، حيث لا يقلل اللاعب I من مكاسبه لأي تغيير في الإستراتيجية بواسطة اللاعب II ولا يزيد اللاعب II من خسارته لأي تغيير في الإستراتيجية بواسطة اللاعب الأول.

5.3 الإستراتيجية المختلطة المثلى في لعبة المصفوفة

إذا كانت مصفوفة المكافآت لا تحتوي على نقطة سرج ، فمن غير المنطقي لأي لاعب أن يستخدم استراتيجية واحدة فقط. إنه أكثر ربحية للاستخدام "مخاليط احتمالية" استراتيجيات خالصة. بعد ذلك ، يتم تحديد الاستراتيجيات المختلطة بالفعل باعتبارها الاستراتيجيات المثلى.

استراتيجية مختلطة يتميز اللاعب بالتوزيع الاحتمالي لحدث عشوائي يتمثل في اختيار نقلة بواسطة هذا اللاعب.

الإستراتيجية المختلطة للاعب الأول هي مجموعة مرتبة من الأرقام (ناقل) يستوفي شرطين:

1) على سبيل المثال ، فإن احتمال اختيار كل صف من مصفوفة الدفع غير سالب ؛

2) ، أي اختيار كل من صفوف مصفوفة الدفع في المجموع يمثل مجموعة كاملةالأحداث.

استراتيجية اللاعب الثاني المختلطة هي مجموعة مرتبة من الأرقام (ناقل) مستوفي الشروط:

مبلغ الدفع للاعب الأول الذي اختار استراتيجية مختلطة

من اللاعب الثاني الذي اختار استراتيجية مختلطة

,

يمثل المتوسط

.

أفضل تسمى الاستراتيجيات المختلطة

و ,

إذا تم استيفاء أي من الاستراتيجيات المختلطة التعسفية والشرط:

أي ، في ظل الإستراتيجية المختلطة المثلى ، تكون مكافأة اللاعب الأول هي الأكبر ، وخسارة اللاعب الثاني هي الأصغر.

إذا لم تكن هناك نقطة سرج في مصفوفة المكافأة ، إذن

,

أي أن هناك فرق موجب ( فرق غير مخصص )

- ³ 0,

ويحتاج اللاعبون إلى البحث عن فرص إضافية للحصول بثقة على نصيب أكبر من هذا الاختلاف لصالحهم.

مثال

ضع في اعتبارك اللعبة التي قدمتها مصفوفة المكافآت:

.

حدد ما إذا كانت هناك نقطة سرج:

, .

اتضح أنه لا توجد نقطة سرج في مصفوفة المكافآت والفرق غير المخصص يساوي:

.

5.4. إيجاد الإستراتيجيات المختلطة المثلى

للألعاب 2 × 2

يتم تحديد الاستراتيجيات المختلطة المثلى لمصفوفة المكافأة للأبعاد من خلال طريقة إيجاد النقاط المثلى لوظيفة من متغيرين.

دع احتمالية اختيار اللاعب للصف الأول من مصفوفة الدفع

يساوي. ثم احتمال اختيار الصف الثاني.

دع احتمال اختيار اللاعب الثاني للعمود الأول يساوي. ثم احتمال اختيار العمود الثاني.

المبلغ المدفوع للاعب I من قبل اللاعب II يساوي:

القيمة القصوى لمكاسب اللاعب I وخسارة اللاعب II تتوافق مع الشروط:

;

.

وبالتالي ، فإن الاستراتيجيات المختلطة المثلى للاعبين الأول والثاني متساوية على التوالي:

5.5 الحل الهندسي للألعاب 2 ×ن

مع زيادة أبعاد مصفوفة المكافآت من إلى ، لم يعد من الممكن تقليل تحديد الاستراتيجيات المختلطة المثلى لإيجاد الوظيفة المثلى لمتغيرين. ومع ذلك ، نظرًا لأن أحد اللاعبين لديه استراتيجيتان فقط ، يمكن استخدام حل هندسي.

المراحل الرئيسية لإيجاد حل للعبة هي كما يلي.

دعونا نقدم نظام إحداثيات على المستوى. ارسم مقطعًا على المحور. ارسم الخطوط العمودية من الطرفين الأيمن والأيسر لهذا المقطع.


يتوافق الطرفان الأيسر والأيمن من مقطع الوحدة مع الاستراتيجيتين المتاحتين للاعب الأول. على الخطوط العمودية المرسومة ، سنؤجل مكاسب هذا اللاعب. على سبيل المثال ، لمصفوفة الدفع


مثل هذه المكافآت للاعب عند اختيار الإستراتيجية ستكون و ، وعند اختيار الإستراتيجية ستكون و.

دعونا نربط من خلال مقاطع الخط المستقيم نقاط المكافأة للاعب الأول المقابلة لاستراتيجيات اللاعب الثاني. ثم يحدد الخط المكسور المتشكل ، الذي يحيط بالرسم البياني من الأسفل ، الحد الأدنى لمكافأة اللاعب الأول.



ابحث عن الإستراتيجية المختلطة المثلى للاعب الأول

,

والتي تتوافق مع النقطة الموجودة على الحد الأدنى لمكافأة اللاعب الأول بأقصى إحداثي.

لاحظ أنه في المثال قيد النظر ، باستخدام استراتيجيتين فقط والمطابقة للخطوط المستقيمة المتقاطعة عند النقطة الموجودة على الحد السفلي لمكافأة اللاعب الأول ، يمكن للاعب II منع اللاعب الأول من الحصول على مكاسب أكبر.

وبالتالي ، يتم اختزال اللعبة إلى لعبة والاستراتيجية المختلطة المثلى للاعب II في المثال المدروس ستكون

,

حيث يكون الاحتمال هو نفسه الموجود في اللعبة:

5.6 حل اللعبةم× ن

إذا لم يكن للعبة المصفوفة حل في الاستراتيجيات البحتة (أي ، لا توجد نقطة سرج) ، وبسبب البعد الكبير لمصفوفة المكافآت ، لا يمكن حلها بيانياً ، ثم للحصول على حل ، استخدم طريقة البرمجة الخطية .

دع مصفوفة المردود للبعد تُعطى:

.

يجب إيجاد الاحتمالات ، مع أي لاعب يجب أن أختار تحركاته لكي تضمن له هذه الإستراتيجية المختلطة ربحًا على الأقل من حيث الحجم ، بغض النظر عن اختيار الحركات من قبل اللاعب الثاني.

لكل نقلة يختارها اللاعب II ، يتم تحديد مكافأة اللاعب الأول من خلال التبعيات:

نقسم كلا جانبي عدم المساواة من خلال تقديم ترميز جديد:

المساواة

سوف يأخذ النموذج:

نظرًا لأنني أسعى إلى زيادة العائد إلى الحد الأقصى ، يجب تقليل المعاملة بالمثل. ثم تأخذ مشكلة البرمجة الخطية للاعب الشكل:

مع قيود

وبالمثل ، فإن مشكلة اللاعب الثاني مبنية على أنها مشكلة مزدوجة:

مع قيود

في حل المشكلات باستخدام طريقة simplex ، نحصل على:

,

5.7 ميزات حل ألعاب المصفوفة

قبل حل مشكلة إيجاد الاستراتيجيات المثلى ، يجب التحقق من شرطين:

هل من الممكن تبسيط مصفوفة الدفع ؛

ما إذا كانت مصفوفة الدفع بها نقطة سرج.

ضع في اعتبارك إمكانية تبسيط مصفوفة الدفع:

بسبب حقيقة أن اللاعب الذي أسعى للحصول عليه أكبر فوز، ثم يمكنك شطب السطر الرابع من مصفوفة الدفع ، لأنه لن يستخدم هذه الحركة أبدًا إذا تحققت العلاقة التالية مع أي صف آخر:

وبالمثل ، يسعى اللاعب II إلى تحقيق أقل خسارة ، ولن يختار أبدًا العمود i في مصفوفة الدفع كحركة ، ويمكن شطب هذا العمود إذا كانت العلاقة التالية صحيحة مع أي عمود ith آخر:

عظم حل بسيطاللعبة هي التواجد في مصفوفة الدفع المبسطة لنقطة السرج التي تفي بالشرط التالي (حسب التعريف):

مثال

يتم تقديم مصفوفة الدفع:

.

تبسيط مصفوفة الدفع:

نقطة سرج:

5.8 اللعب مع الطبيعة

على عكس مشاكل نظرية اللعبة في مشاكل النظرية القرارات الإحصائية لا يحتوي الموقف غير المؤكد على تلوين صراع عدائي ويعتمد على الواقع الموضوعي ، والذي يُطلق عليه عادةً "طبيعة سجية" .

في ألعاب المصفوفة ذات الطبيعة ، يلعب اللاعب II مجموعة من العوامل غير المؤكدة التي تؤثر على فعالية القرارات المتخذة.

تختلف ألعاب Matrix ذات الطبيعة عن ألعاب المصفوفة العادية فقط في ذلك ، عند اختيار الإستراتيجية المثلى ، لم يعد بإمكاني الاسترشاد بحقيقة أن اللاعب II سيحاول تقليل خسارته. لذلك ، جنبا إلى جنب مع مصفوفة الدفع ، نقدم مصفوفة المخاطر :

أين هي قيمة مخاطرة اللاعب الأول عند استخدام النقلة في ظل ظروف مساوية للفرق بين المكافأة التي كنت سأحصل عليها من ذلك اللاعب إذا علم أن الشرط سيؤسس ، أي والمكاسب التي سيحصل عليها ، مع العلم عند اختيار الحركة أن الشرط سيتحقق.

وبالتالي ، يتم تحويل مصفوفة المكافآت بشكل لا لبس فيه إلى مصفوفة مخاطر ، ويكون التحويل العكسي غامضًا.

مثال

مكافأة مصفوفة:

.

مصفوفة المخاطر:

المستطاع بيانين مشكلة حول اختيار الحل في لعبة مصفوفة مع الطبيعة :

تعظيم أرباحك ؛

تقليل المخاطر.

يمكن طرح مشكلة اتخاذ القرار لواحد من شرطين:

- في خطر عندما تكون دالة التوزيع الاحتمالي لاستراتيجيات الطبيعة معروفة ، على سبيل المثال ، القيمة العشوائية لحدوث كل حالة من الحالات الاقتصادية المحددة المفترضة ؛

- في مواجهة عدم اليقين عندما تكون دالة التوزيع الاحتمالية هذه غير معروفة.

5.9. حل مشاكل نظرية القرارات الإحصائية

في خطر

عند اتخاذ القرارات في ظل ظروف المخاطرة ، أعرف الاحتمالات بداية حالات الطبيعة.

ثم من المناسب للاعب الأول أن يختار الإستراتيجية التي من أجلها متوسط ​​قيمة المكاسب ، المأخوذة في كل سطر ، كحد أقصى :

.

عند حل هذه المشكلة باستخدام مصفوفة المخاطر ، نحصل على نفس الحل المقابل الحد الأدنى لمتوسط ​​المخاطر :

.

5.10. حل مشاكل نظرية القرارات الإحصائية

في مواجهة عدم اليقين

عند اتخاذ القرارات في ظل ظروف عدم اليقين ، يمكنك استخدام ما يلي المعايير :

معيار والد ماكسيمين ؛

معيار الحد الأدنى من المخاطرسيفيجا.

معيار التشاؤم هو تفاؤل هورويتز.

مبدأ لابلاس القائل بعدم كفاية الأساس.

انصح اختبار والد ماكسيمين .

يتم لعب اللعبة مع الطبيعة كما هو الحال مع خصم عدواني معقول ، أي يتم تنفيذ نهج إعادة التأمين من موقع التشاؤم الشديد لمصفوفة الدفع:

.

انصح معيار الحد الأدنى من المخاطر سافاج .

نهج مشابه للنهج السابق من موقف التشاؤم الشديد لمصفوفة المخاطر:

.

انصح معيار التشاؤم - تفاؤل هورويتز .

يتم تقديم فرصة لعدم الاسترشاد بالتشاؤم الشديد أو التفاؤل الشديد:

اين درجة التشاؤم.

في - التفاؤل الشديد ،

في - التشاؤم الشديد.

انصح مبدأ لابلاس القائل بعدم كفاية الأساس .

يُعتقد أن جميع حالات الطبيعة متساوية في الاحتمال:

,

.

استنتاجات القسم الخامس

يشارك لاعبان في لعبة المصفوفة ، ويتم تمثيل وظيفة المكافأة ، التي تعمل على تحديد مبلغ الدفع للاعب الخاسر للفائز ، في شكل مصفوفة المكافآت. اتفقنا على أن اللاعب الأول يختار أحد صفوف مصفوفة المكافآت كحركة ، ويختار اللاعب II أحد أعمدةها. بعد ذلك ، عند تقاطع الصف والعمود المحددين من هذه المصفوفة ، توجد قيمة عددية للدفع للاعب الأول من اللاعب الثاني (إذا كانت هذه القيمة موجبة ، فزت حقًا باللاعب ، وإذا كانت سالبة ، فإن اللاعب أنا فاز بشكل أساسي).

إذا كانت هناك نقطة سرج في مصفوفة المكافآت ، فإن اللاعبين لديهم استراتيجيات نقية مثالية ، أي للفوز ، يجب على كل منهم تكرار حركته المثالية. إذا لم يكن هناك نقطة سرج ، فمن أجل الفوز ، يجب على كل منهم استخدام الإستراتيجية المختلطة المثلى ، أي استخدام مزيج من الحركات ، كل منها يجب أن يتم تنفيذ كل منها باحتمال أمثل.

يتم إجراء البحث عن الاستراتيجيات المختلطة المثلى للألعاب 2 × 2 عن طريق حساب الاحتمالات المثلى باستخدام الصيغ المعروفة. باستخدام حل هندسيبالنسبة للألعاب 2 × n ، يتم تقليل تعريف الاستراتيجيات المختلطة المثلى فيها لإيجاد استراتيجيات مختلطة مثالية للألعاب 2 × 2. لحل ألعاب m × n ، يتم استخدام طريقة البرمجة الخطية للعثور على الاستراتيجيات المختلطة المثلى فيها.

بعض مصفوفات الدفع قابلة للتبسيط ، ونتيجة لذلك يتم تقليل أبعادها عن طريق إزالة الصفوف والأعمدة المقابلة للحركات غير الواعدة.

إذا كان اللاعب II عبارة عن مجموعة من العوامل غير المؤكدة التي تعتمد على الواقع الموضوعي وليس لها تلوين صراع عدائي ، فإن هذه اللعبة تسمى لعبة مع الطبيعة ، ويتم استخدام مشاكل نظرية القرارات الإحصائية لحلها. بعد ذلك ، جنبًا إلى جنب مع مصفوفة المكافآت ، يتم تقديم مصفوفة المخاطر ، ومن الممكن وجود بيانين لمشكلة اختيار حل في لعبة مصفوفة مع الطبيعة: تعظيم العائد وتقليل المخاطر.

يوضح حل المشكلات في نظرية القرارات الإحصائية في ظل ظروف المخاطرة أنه من المستحسن للاعب الأول أن يختار الاستراتيجية التي يكون متوسط ​​قيمة (التوقع الرياضي) للمكافأة المأخوذة على صف مصفوفة المكافآت هو الحد الأقصى ، أو (وهو نفس الشيء) متوسط ​​القيمة (التوقع الرياضي) للمخاطر التي يتعرض لها صف مصفوفة المخاطر هو الحد الأدنى. عند اتخاذ القرارات في ظل ظروف عدم اليقين ، استخدم المعايير التالية: معيار والد ماكسيمين ، ومعيار الحد الأدنى من المخاطر في سيفيدج ، ومعيار هورويتز للتشاؤم والتفاؤل ، ومبدأ لابلاس القائل بعدم كفاية الأساس.

أسئلة الاختبار الذاتي

كيف يتم تحديد المفاهيم الأساسية لنظرية اللعبة: وظيفة الحركة والاستراتيجية والمكافأة؟

كيف يتم تمثيل وظيفة المكافأة في لعبة المصفوفة؟

لماذا تسمى لعبة مصفوفة مجموع الصفر؟

كيف يتم تمثيل عملية لعب لعبة ماتريكس؟

ما اللعبة التي تسمى لعبة m × n؟

ما هي الاستراتيجية المثلى للعبة ماتريكس؟

ما هي الإستراتيجية المثلى للعبة ماتريكس تسمى نقية؟

ماذا تعني نقطة السرج لمصفوفة المكافأة؟

ما هي الاستراتيجية المثلى للعبة ماتريكس تسمى مختلطة؟

كيف تظهر الإستراتيجية المختلطة للاعب؟

ما هو مبلغ الدفع للاعب الأول من اللاعب الثاني ، الذي اختار استراتيجيات مختلطة؟

ما هي الاستراتيجيات المختلطة التي تسمى الأمثل؟

ماذا يعني الاختلاف غير المخصص؟

ما الطريقة المستخدمة للعثور على الاستراتيجيات المختلطة المثلى للألعاب 2 × 2؟

كيف يتم العثور على الاستراتيجيات المختلطة المثلى للألعاب 2 × ن؟

ما الطريقة المستخدمة لإيجاد الاستراتيجيات المختلطة المثلى لألعاب m × n؟

ما هي ميزات حل ألعاب المصفوفة؟

ماذا يعني تبسيط مصفوفة الدفع وتحت أي شروط يمكن إجراؤها؟

ما هي لعبة المصفوفة التي يسهل حلها عندما تحتوي مصفوفة المكافآت أو لا تحتوي على نقطة سرج؟

ما هي المشاكل في نظرية اللعبة المتعلقة بالمشاكل في نظرية القرارات الإحصائية؟

كيف يتم تحويل مصفوفة المدفوعات إلى مصفوفة مخاطر؟

ما صيغتان لمشكلة اختيار الحلول ممكنتين في لعبة مصفوفة مع الطبيعة؟

لأي شرطين يمكن وضع مشاكل اتخاذ القرار في لعبة مصفوفة مع الطبيعة؟

ما هي الإستراتيجية المناسبة للاعب الأول ليختارها عند حل مشكلة نظرية القرارات الإحصائية في ظل ظروف المخاطرة؟

ما هي معايير القرار التي يمكن استخدامها في حل مشاكل نظرية القرارات الإحصائية في ظل عدم اليقين؟

أمثلة على حل المشكلات

1. توضح مصفوفة الدفع مقدار ربح المشروع عندما تبيع أنواع مختلفةالمنتجات (الأعمدة) حسب الطلب المستمر (الصفوف). من الضروري تحديد الاستراتيجية المثلى للمؤسسة لإنتاج منتجات من أنواع مختلفة والحد الأقصى المقابل (في المتوسط) للدخل من بيعها.

دعنا نشير إلى المصفوفة المعطاة ونقدم المتغيرات. سنستخدم أيضًا مصفوفة (متجه). ثم ، أي

يتم حساب المصفوفة المعكوسة:

تم العثور على القيم:

.

يتم حساب الاحتمالات:

يتم تحديد متوسط ​​الدخل من المبيعات:

.

2. شركة "فارماسيست" هي شركة مصنعة للأدوية والمنتجات الطبية الحيوية في المنطقة. من المعروف أن ذروة الطلب على بعض الأدوية تقع فترة الصيف(أدوية مجموعة القلب والأوعية الدموية ، المسكنات) ، للآخرين - لفترتي الخريف والربيع (مضاد للعدوى ، مضاد للسعال).

تكاليف إحالة واحدة الوحدات كانت منتجات سبتمبر وأكتوبر: للمجموعة الأولى (أدوية القلب والأوعية الدموية والمسكنات) - 20 روبل ؛ في المجموعة الثانية (الأدوية المضادة للعدوى والسعال) - 15 روبل.

حسب ملاحظات عدة السنوات الأخيرةأثبتت الخدمة التسويقية للشركة أنها تستطيع تحقيقها خلال الشهرين قيد الدراسة في الطقس الدافئ 3050 تحويل. الوحدات منتجات المجموعة الأولى و 1100 تحويل. الوحدات منتجات المجموعة الثانية. في الطقس البارد - 1525 تحويلاً. الوحدات منتجات المجموعة الاولى و 3690 تحويل. الوحدات المجموعة الثانية.

فيما يتعلق بالتغيرات المحتملة في الطقس ، تم طرح المهمة - لتحديد استراتيجية الشركة في إنتاج المنتجات التي توفر أقصى دخل من المبيعات بسعر بيع 40 روبل. لتحويل واحد الوحدات منتجات المجموعة الأولى و 30 روبل. - المجموعة الثانية.

المحلول. لدى الشركة استراتيجيتان:

سيكون الطقس دافئ هذا العام.

سيكون الطقس باردا.

إذا تبنت الشركة إستراتيجية وفي الواقع سيكون هناك طقس دافئ (إستراتيجية الطبيعة) ، فإن المنتجات المصنعة (3050 وحدة تقليدية من المجموعة الأولى من الأدوية و 1100 وحدة تقليدية من المجموعة الثانية) سيتم بيعها بالكامل وسيتم الدخل يكون

3050 × (40-20) + 1100 × (30-15) = 77500 ص.

في الظروف الجوية الباردة (إستراتيجية الطبيعة) تباع أدوية المجموعة الثانية كاملة ، والمجموعة الأولى فقط بمبلغ 1525 تحويل. الوحدات وستبقى بعض الأدوية غير محققة. سيكون الدخل

1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 ص.

وبالمثل ، إذا اعتمد النموذج إستراتيجية وكان الطقس باردًا بالفعل ، فسيكون الدخل

1525 × (40-20) + 3690 × (30-15) = 85850 ص.

في الطقس الحار ، سيكون الدخل

1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 ص.

بالنظر إلى الشركة والطقس كلاعبين ، نحصل على مصفوفة الدفع

,

سعر اللعبة يقع في النطاق

يمكن أن نرى من مصفوفة الدفع أنه في ظل جميع الظروف ، سيكون دخل الشركة على الأقل 16500 روبل ، ولكن إذا تزامنت الظروف الجوية مع الاستراتيجية المختارة ، فيمكن أن يكون دخل الشركة 77500 روبل.

دعونا نجد حلا للعبة.

دعونا نشير إلى احتمال تطبيق الشركة للاستراتيجية من خلال الاستراتيجية من خلال و و. نحصل على حل اللعبة بيانياً بالطريقة بينما سعر اللعبة p.

ستكون خطة إنتاج الدواء الأمثل

وعليه ، فمن المستحسن أن تقوم الشركة بالإنتاج خلال شهري سبتمبر وأكتوبر 2379. الوحدات أدوية المجموعة الأولى و 2239.6 تحويل. الوحدات أدوية المجموعة الثانية ، ثم في أي طقس ستحصل على دخل لا يقل عن 46986 روبل.

في ظروف عدم اليقين ، إذا لم يكن من الممكن لشركة ما استخدام استراتيجية مختلطة (عقود مع منظمات أخرى) ، لتحديد الاستراتيجية المثلى للشركة ، فإننا نستخدم المعايير التالية:

معيار Walde:

معيار هورويتز: من أجل الوضوح ، فإننا نقبل ، ثم لاستراتيجية الشركة

للاستراتيجية

من المستحسن أن تستخدم الشركة استراتيجية.

معيار سافاج. الحد الأقصى للعنصر في العمود الأول هو 77500 ، وفي العمود الثاني 85850.

تم العثور على عناصر مصفوفة المخاطر من التعبير

,

أين ، ،

مصفوفة المخاطر لها الشكل

,

يُنصح باستخدام الإستراتيجية أو.

لذلك ، من المستحسن أن تقوم الشركة بتطبيق الإستراتيجية أو.

لاحظ أن كل معيار من المعايير المدروسة لا يمكن اعتباره مرضيًا تمامًا الاختيار النهائيالقرارات ، ومع ذلك ، فإن تحليلهم المشترك يسمح لك بتمثيل عواقب اتخاذ قرارات إدارية معينة بشكل أوضح.

مع التوزيع المعروف للاحتمالات لحالات الطبيعة المختلفة ، فإن معيار اتخاذ القرار هو الحد الأقصى للتوقع الرياضي للمكافأة.

وليكن معروفًا بالمشكلة قيد النظر أن احتمالات الطقس الدافئ والبارد متساوية وتساوي 0.5 ، ثم يتم تحديد الإستراتيجية المثلى للشركة على النحو التالي:

من المستحسن أن تستخدم الشركة استراتيجية أو.

مهام الدراسة الذاتية

1. يمكن للمؤسسة أن تنتج ثلاثة أنواع من المنتجات (أ ، ب ، ج) ، بينما تحصل على ربح يعتمد على الطلب. الطلب ، بدوره ، يمكن أن يأخذ واحدة من أربع حالات (الأول والثاني والثالث والرابع). في المصفوفة التالية ، تميز العناصر الربح الذي ستحصل عليه المؤسسة عند إنتاج المنتج رقم -th وحالة الطلب-:

إذا طبق كل من الخصوم في اللعبة نفس الإستراتيجية واحدة فقط ، فعندئذ فيما يتعلق باللعبة نفسها في هذه الحالة يقولون إنها تحدث في الاستراتيجيات البحتة ، ويستخدمه اللاعب أواللاعب الخامسيتم استدعاء بضع استراتيجيات استراتيجيات خالصة .

تعريف. في لعبة معادية ، هناك زوج من الإستراتيجيات ( أ أنا , الخامسي) يسمى التوازن أو الاستقرار إذا لم يكن من المربح لأي من اللاعبين أن ينحرفوا عن استراتيجيتهم.

من المنطقي استخدام استراتيجيات خالصة عند اللاعبين أو الخامسالحصول على معلومات حول تصرفات بعضهم البعض والنتائج التي تم تحقيقها. إذا افترضنا أن أحد الأطراف على الأقل لا يعرف سلوك الخصم ، فإن فكرة التوازن تنتهك ، ويتم لعب اللعبة عشوائياً.

ضع في اعتبارك لعبة المصفوفة جي(3 × 4)

في هذا المثال ، السعر الأدنى للعبة يساوي السعر العلوي: == 9 ، أي اللعبة لديها نقطة سرج.

اتضح أنه في هذه الحالة استراتيجيات الحد الأقصى أ 2 و الخامس 2 سوف مستدام فيما يتعلق بالمعلومات حول سلوك العدو.

في الواقع ، دع اللاعب أعلمت أن العدو يستخدم استراتيجية الخامس 2. لكن في هذه الحالة اللاعب أستواصل الالتزام بالاستراتيجية أ 2 ، لأن أي انحراف عن الاستراتيجية أ 2 سيقلل فقط من المكاسب. وبالمثل ، المعلومات التي يتلقاها اللاعب الخامسلن يجبره على الخروج عن استراتيجيته الخامس 2 .

زوجان من الاستراتيجيات أ 2 و الخامس 2 يمتلك خاصية الاستقرار ، والمكافأة (في المثال المدروس ، تساوي 9) ، التي تم تحقيقها باستخدام هذا الزوج من الاستراتيجيات ، تبين أنها نقطة السرج لمصفوفة المكافأة.

علامة الاستقرار (التوازن) لزوج الإستراتيجية هي المساواة بين الأدنى و أعلى سعرألعاب.

الاستراتيجيات أ أناو الخامس ي(في المثال المدروس أ 2 , الخامس 2) ، التي يتم فيها استيفاء المساواة بين الأسعار الدنيا والعليا للعبة ، تسمى الاستراتيجيات البحتة المثلى ، ويطلق على الجمع بينهما اسم حل اللعبة. في هذه الحالة ، يُقال أن اللعبة نفسها قد تم حلها باستراتيجيات خالصة.

تسمى القيمة تكلفة اللعبة.

إذا كانت القيمة 0 ، فستكون اللعبة مفيدة للاعب A ، إذا كانت 0 - للاعب B ؛ ل = 0 اللعبة عادلة ، أي هو مفيد بنفس القدر لكلا المشاركين.

ومع ذلك ، فإن وجود نقطة سرج في اللعبة بعيد كل البعد عن كونه قاعدة ، بل هو استثناء. لا تحتوي معظم ألعاب المصفوفة على نقطة سرج ، وبالتالي ليس لديها استراتيجيات خالصة مثالية. ومع ذلك ، هناك نوع من الألعاب التي لها دائمًا نقطة سرج ، وبالتالي يتم حلها في استراتيجيات خالصة. هذه هي الألعاب ذات معلومات كاملة.

نظرية 2. كل لعبة تحتوي على معلومات كاملة لها نقطة سرج ، وبالتالي يتم حلها في استراتيجيات خالصة ، أي هناك زوج من الاستراتيجيات البحتة المثلى تعطي عائدًا ثابتًا يساوي.

إذا كانت هذه اللعبة تتكون من حركات شخصية فقط ، فعندئذ عندما يطبق كل لاعب استراتيجيته البحتة المثلى ، يجب أن تنتهي بفوز مساوٍ لسعر اللعبة. على سبيل المثال ، لعبة الشطرنج ، باعتبارها لعبة تحتوي على معلومات كاملة ، إما تنتهي دائمًا بفوز أبيض ، أو دائمًا بفوز أسود ، أو دائمًا بالتعادل (بالضبط بالضبط - لا نعرف حتى الآن ، منذ الرقم من الاستراتيجيات الممكنة في لعبة الشطرنج ضخمة).

إذا كانت مصفوفة اللعبة تحتوي على نقطة سرج ، فسيتم إيجاد حلها على الفور وفقًا لمبدأ maximin.

السؤال الذي يطرح نفسه: كيف تجد حلًا للعبة لا تحتوي مصفوفة المكافآت على نقطة سرج؟ يوفر تطبيق مبدأ الحد الأقصى من قبل كل لاعب للاعب "أ" ربحًا على الأقل وخسارة للاعب على الأكثر. مع الأخذ في الاعتبار أنه من الطبيعي أن يرغب اللاعب "أ" في زيادة أرباحه ، وأن يقلل اللاعب "ب" من خسارته. البحث عن مثل هذا الحل يؤدي إلى الحاجة إلى تطبيق استراتيجيات مختلطة: لتبديل الاستراتيجيات البحتة ببعض الترددات.

تعريف. يسمى المتغير العشوائي الذي تكون قيمه استراتيجيات خالصة للاعب هو استراتيجية مختلطة .

وبالتالي ، فإن مهمة الاستراتيجية المختلطة للاعب تتمثل في الإشارة إلى الاحتمالات التي يتم من خلالها اختيار استراتيجياته البحتة.

سوف نشير إلى الاستراتيجيات المختلطة للاعبين أو الخامسعلى التوالى

S A = || p 1، p 2، ...، p m ||،

S B = || q 1، q 2، ...، q n ||،

حيث p i هو احتمال استخدام اللاعب أنظيفة من الاستراتيجية أأنا؛ ؛ q j هو احتمال أن يستخدم اللاعب B الإستراتيجية البحتة B j ؛ ...

في الحالة الخاصة ، عندما تكون جميع الاحتمالات ، باستثناء واحد ، مساوية للصفر ، وهذا الواحد يساوي واحدًا ، تتحول الإستراتيجية المختلطة إلى واحدة فقط.

يتم تطبيق الاستراتيجيات المختلطة ، على سبيل المثال ، بهذه الطريقة: تتكرر اللعبة عدة مرات ، ولكن في كل لعبة يطبق اللاعب استراتيجيات نقية مختلفة مع ترددات نسبية لتطبيقهم تساوي ص أنا و ف ي .

الاستراتيجيات المختلطة في نظرية اللعبة هي نموذج للتكتيكات المرنة المرنة ، حيث لا يعرف أي من اللاعبين الاستراتيجية النظيفة التي سيختارها الخصم في لعبة معينة.

إذا كان اللاعب أيطبق الإستراتيجية المختلطة S A = || p 1، p 2، ...، p m || واللاعب الخامسالإستراتيجية المختلطة S B = || q 1، q 2، ...، q n || ثم متوسط ​​العائد (التوقع الرياضي) للاعب أيتحدد من خلال النسبة

بطبيعة الحال ، الخسارة المتوقعة للاعب الخامسيساوي نفس القيمة.

لذلك ، إذا كانت لعبة المصفوفة لا تحتوي على نقطة سرج ، فيجب على اللاعب استخدام الإستراتيجية المختلطة المثلى التي ستوفر أقصى عائد.

السؤال الذي يطرح نفسه بشكل طبيعي: ما هي الاعتبارات التي يجب اتباعها عند اختيار الاستراتيجيات المختلطة؟ اتضح أن مبدأ maximin يحتفظ بمعناه في هذه الحالة أيضًا. بجانب، أساسلفهم حل الألعاب ، قم بتشغيل النظريات الأساسية لنظرية الألعاب.

الأساليب والنماذج الرياضية في الاقتصاد

ألعاب ماتريكس

مقدمة

في الممارسة الاقتصادية ، غالبًا ما تنشأ المواقف التي تسعى فيها الأطراف المختلفة إلى تحقيق أهداف مختلفة. على سبيل المثال ، العلاقة بين البائع والمشتري ، والمورد والمستهلك ، والبنك والمودع ، إلخ. تنشأ حالات الصراع هذه ليس فقط في الاقتصاد ، ولكن في الأنشطة الأخرى. على سبيل المثال ، عند لعب الشطرنج ، لعبة الداما ، الدومينو ، اللوتو ، إلخ.

اللعبة- هذا هو نموذج رياضي حالة الصراعتنطوي على شخصين على الأقل باستخدام عدة طرق مختلفةلتحقيق أهدافك. اللعبة تسمى غرفة البخار، إذا شارك فيها لاعبان. اللعبة تسمى عدائي إذا كان ربح أحد اللاعبين يساوي خسارة الآخر. لذلك ، لضبط اللعبة ، يكفي تعيين قيم مكافآت لاعب واحد في مواقف مختلفة.

يتم استدعاء أي طريقة لعمل اللاعب ، اعتمادًا على الموقف الحالي إستراتيجية. كل لاعب لديه مجموعة محددة من الاستراتيجيات. إذا كان عدد الاستراتيجيات محدودًا ، فسيتم استدعاء اللعبة ذروة، خلاف ذلك - بلا نهاية . يتم استدعاء الاستراتيجيات ينظف، إذا اختار كل لاعب إستراتيجية واحدة فقط بطريقة معينة وليست عشوائية.

حل اللعبةهو اختيار استراتيجية مرضية حالة الأمثل. هذا الشرط هو أن يحصل لاعب واحد أقصى فوز, إذا التزم الثاني باستراتيجيته. على العكس من ذلك ، يتلقى اللاعب الثاني الحد الأدنى من الخسارة, إذا تمسك اللاعب الأول باستراتيجيته. تسمى هذه الاستراتيجيات أفضل . هكذا، الهدف من اللعبة هو تحديد الإستراتيجية المثلى لكل لاعب.

لعبة استراتيجية خالصة

فكر في لعبة مع لاعبين أو الخامس.افترض لاعب ألديها مالاستراتيجيات А 1، А 2، ...، А مواللاعب الخامسلديها نالاستراتيجيات ب 1 ، ب 2 ، ... ، ب ن.سنفترض أن اختيار اللاعب أإستراتيجية أنا ،واللاعب الخامسإستراتيجية ب ييحدد بشكل فريد نتيجة اللعبة ، أي ربح ijلاعب أوالفوز ب ijلاعب الخامس.هنا أنا = 1،2 ، ... ، م ، ي = 1،2 ، ... ، ن.

أبسط لعبةمع لاعبين هي لعبة عدائية , أولئك. لعبة تتعارض فيها مصالح اللاعبين بشكل مباشر. في هذه الحالة ، ترتبط مكافآت اللاعبين بالمساواة

ب ij = -a ij

هذه المساواة تعني أن ربح أحد اللاعبين يساوي خسارة الآخر. في هذه الحالة ، يكفي أن تؤخذ في الاعتبار فقط مكافآت أحد اللاعبين ، على سبيل المثال ، اللاعب أ.

كل زوج من الاستراتيجيات او ب يتطابق الفوز ijلاعب أ.من المريح كتابة كل هذه المكاسب في شكل ما يسمى مصفوفة الدفع

تتوافق صفوف هذه المصفوفة مع استراتيجيات اللاعب أ،والأعمدة لاستراتيجيات اللاعب الخامس.بشكل عام ، تسمى هذه اللعبة (م × ن) -لعبة.


مثال 1.لاعبان أو الخامسرمي قطعة نقود. إذا تزامنت جوانب العملة ، فستفوز أ، بمعنى آخر. لاعب الخامسيدفع للاعب أبعض المبلغ يساوي 1 ، وإذا لم يتطابقوا ، يفوز اللاعب B ، أي على العكس من ذلك ، اللاعب أيدفع للاعب الخامسنفس المبلغ , مساو 1. تشكيل مصفوفة الدفع.

حل.حسب حالة المشكلة

© 2021 skudelnica.ru - الحب والخيانة وعلم النفس والطلاق والمشاعر والمشاجرات