ألعاب استراتيجية خالصة. ايلينا فينتزل

بيت / تشاجر

لعبة استراتيجية نظرية مختلطة

استراتيجيات مختلطة

إذا لم تكن لعبة المصفوفة تحتوي على نقطة سرج في الاستراتيجيات البحتة، فسيتم العثور على الأسعار العلوية والسفلية للعبة. لقد أظهروا أن اللاعب 1 لن يحصل على مكافأة أكبر من السعر الأعلى للعبة، وأن اللاعب 1 يضمن مكافأة لا تقل عن السعر الأدنى للعبة.

الإستراتيجية المختلطة للاعب هي مجموعة كاملة من إستراتيجياته النقية عندما تتكرر اللعبة عدة مرات في نفس الظروف مع احتمالات معينة. دعونا نلخص ما قيل وندرج شروط الاستخدام استراتيجيات مختلطة:

  • * لعبة بدون نقطة سرج.
  • * يستخدم اللاعبون مزيجًا عشوائيًا من الاستراتيجيات النقية ذات الاحتمالات المحددة؛
  • * تتكرر اللعبة عدة مرات في ظل ظروف مماثلة؛
  • * خلال كل نقلة، لا يتم إعلام أي لاعب باختيار اللاعب الآخر للاستراتيجية؛
  • * يُسمح بحساب متوسط ​​نتائج اللعبة.

يتم استخدام التسميات التالية للاستراتيجيات المختلطة.

بالنسبة للاعب 1، تتمثل الإستراتيجية المختلطة في استخدام الاستراتيجيات النقية A 1، A 2، ...، A t مع الاحتمالات المقابلة p 1، p 2، ...، p t.

للاعب 2

q j هو احتمال استخدام استراتيجية خالصة B j .

في حالة p i = 1، بالنسبة للاعب 1 لدينا استراتيجية نقية

استراتيجيات اللاعب النقية هي الأحداث الوحيدة الممكنة غير المتوافقة. في لعبة المصفوفة، بمعرفة المصفوفة A (وهي تنطبق على كل من اللاعب 1 واللاعب 2)، يمكننا تحديد متى ناقلات معينةومتوسط ​​المكاسب ( القيمة المتوقعةتأثير) لاعب 1:

أين و هي المتجهات؟

p i و q i عبارة عن مكونات للمتجهات.

من خلال تطبيق استراتيجياتهم المختلطة، يسعى اللاعب 1 إلى زيادة متوسط ​​عائده إلى الحد الأقصى، ويسعى اللاعب 2 إلى تقليل هذا التأثير إلى أدنى قيمة ممكنة. يسعى اللاعب 1 للوصول

يضمن اللاعب 2 استيفاء الشرط

دعونا نشير أيضًا إلى المتجهات المقابلة للاستراتيجيات المختلطة المثالية للاعبين 1 و 2، أي. مثل هذه المتجهات والتي سيتم تحقيق المساواة لها

تكلفة اللعبة هي متوسط ​​العائد الذي يحصل عليه اللاعب رقم 1 عندما يستخدم كلا اللاعبين استراتيجيات مختلطة. وبالتالي فإن حل لعبة المصفوفة هو:

  • - الإستراتيجية المختلطة المثالية للاعب 1؛
  • - الإستراتيجية المختلطة المثالية للاعب 2؛

سعر اللعبة.

ستكون الاستراتيجيات المختلطة هي الأمثل (و) إذا شكلت نقطة سرج للوظيفة، أي.

هناك نظرية أساسية للألعاب الرياضية.

بالنسبة إلى لعبة مصفوفة تحتوي على أي مصفوفة A ذات حجم

موجودة ومتساوية مع بعضها البعض: = = .

تجدر الإشارة إلى أنه عند اختيار الاستراتيجيات المثلى، سيضمن للاعب 1 دائمًا عائدًا متوسطًا، لا يقل عن سعر اللعبة، لأي إستراتيجية ثابتة للاعب 2 (والعكس صحيح، للاعب 2). الاستراتيجيات النشطة للاعبين 1 و 2 هي إستراتيجيات تشكل جزءًا من الاستراتيجيات المختلطة المثالية للاعبين المناظرين ذوي الاحتمالات غير الصفر. وهذا يعني أن الاستراتيجيات المختلطة المثالية للاعبين قد لا تشمل جميع استراتيجياتهم المسبقة.

حل اللعبة يعني العثور على سعر اللعبة والاستراتيجيات المثلى. لنبدأ بدراسة طرق العثور على إستراتيجيات مختلطة مثالية لألعاب المصفوفة أبسط لعبة، الموصوفة في المصفوفة 22. لن يتم النظر في الألعاب ذات نقطة السرج على وجه التحديد. إذا تم الحصول على نقطة السرج، فهذا يعني أن هناك استراتيجيات غير مربحة ينبغي التخلي عنها. في حالة عدم وجود نقطة سرج، يمكن الحصول على استراتيجيتين مختلطتين مثاليتين. وكما ذكرنا سابقًا، تتم كتابة هذه الاستراتيجيات المختلطة على النحو التالي:

وهذا يعني أن هناك مصفوفة الدفع

أ 11 ع 1 + أ 21 ع 2 = ; (1.16)

أ 12 ع 1 + أ 22 ع 2 = ; (1.17)

ص 1 + ص 2 = 1. (1.18)

أ 11 ع 1 + أ 21 (1 - ع 1) = أ 12 ع 1 + أ 22 (1 - ع 1)؛ (1.19)

أ 11 ع 1 + أ 21 - أ 21 ع 1 = أ 12 ع 1 + أ 22 - أ 22 ع 1 , (1.20)

حيث نحصل على القيم المثلى:

وبمعرفة نجد:

وبعد الحساب نجد:

أ 11 ف 1 + أ 12 ف 2 = ; ف 1 + ف 2 = 1؛ (1.24)

أ 11 ف 1 + أ 12 (1 - ف 1) = . (1.25)

في 11 إلى 12 . (1.26)

تم حل المشكلة، حيث تم العثور على المتجهات وسعر اللعبة. بوجود مصفوفة الدفع A، يمكنك حل المشكلة بيانياً. باستخدام هذه الطريقة، تكون خوارزمية الحل بسيطة جدًا (الشكل 2.1).

  • 1. يتم رسم جزء من طول الوحدة على طول محور الإحداثي السيني.
  • 2. يوضح المحور y مكاسب الإستراتيجية A 1 .
  • 3. على خط موازٍ للمحور الإحداثي، عند النقطة 1، يتم رسم المكاسب الخاصة بالاستراتيجية أ 2.
  • 4. يتم تعيين نهايات المقاطع لـ أ 11 - ب 11، أ 12 - ب 21، أ 22 - ب 22، أ 21 - ب 12 ويتم رسم خطين مستقيمين ب 11 ب 12 و ب 21 ب 22.
  • 5. يتم تحديد إحداثيات نقطة التقاطع مع. إنها متساوية. حدود النقطة c تساوي p 2 (p 1 = 1 - p 2).

أرز. 1.1.

هذه الطريقة لها مجال تطبيق واسع إلى حد ما. هذا على أساس الملكية العامةألعاب TP، والتي تتكون من حقيقة أنه في أي لعبة TP، يتمتع كل لاعب بإستراتيجية مختلطة مثالية لا يزيد فيها عدد الاستراتيجيات النقية عن min(m, n). من هذه الخاصية يمكننا الحصول على نتيجة طبيعية معروفة: في أي لعبة 2n وm2، تحتوي كل استراتيجية مثالية على استراتيجيتين نشطتين على الأكثر. هذا يعني أنه يمكن اختزال أي لعبة 2n وm2 إلى اللعبة 22. وبالتالي، يمكن حل اللعبتين 2n وm2 بيانيًا. إذا كانت مصفوفة اللعبة المحدودة ذات بُعد mn، حيث m > 2 و n > 2، فسيتم استخدام البرمجة الخطية لتحديد الاستراتيجيات المختلطة المثالية.

5. نظرية الألعاب والقرارات الإحصائية

5.1. لعبة مصفوفة مجموعها صفر

يتم تنفيذ النمذجة الاقتصادية والرياضية في ظل الشروط التالية:

بالتاكيد؛

عدم اليقين.

النمذجة في شروط اليقين يفترض توافر جميع البيانات التنظيمية الأولية اللازمة لذلك (نمذجة المصفوفة وتخطيط الشبكات وإدارتها).

النمذجة في خطر يتم تنفيذها في ظل عدم اليقين العشوائي، عندما تكون قيم بعض البيانات الأولية عشوائية وتكون قوانين التوزيع الاحتمالي لهذه المتغيرات العشوائية معروفة (تحليل الانحدار، نظرية الطابور).

النمذجة في ظروف عدم اليقين يتوافق الغياب التامبعض البيانات اللازمة لذلك (نظرية اللعبة).

النماذج الرياضية لاتخاذ القرارات الأمثل في حالات الصراعيتم بناؤها في ظل ظروف من عدم اليقين.

تعمل نظرية اللعبة بالمفاهيم الأساسية التالية:

إستراتيجية؛

وظيفة الفوز.

يتحرك سنسمي اختيار اللاعب وتنفيذه لأحد الإجراءات المنصوص عليها في قواعد اللعبة.

إستراتيجية - هذه تقنية لاختيار خيار الإجراء في كل خطوة، اعتمادًا على الوضع الحالي.

وظيفة الفوز يعمل على تحديد مبلغ الدفع من اللاعب الخاسر إلى اللاعب الفائز.

في لعبة المصفوفة، يتم تمثيل وظيفة المردود على النحو التالي: مصفوفة الدفع :

أين هو مبلغ الدفع للاعب الأول الذي اختار النقلة من اللاعب الثاني الذي اختار النقلة.

في مثل هذه اللعبة المزدوجة، تكون قيم وظائف المردود لكلا اللاعبين في كل موقف متساوية في الحجم ومتعاكسة في الإشارة، أي. وهذه اللعبة تسمى مجموع صفر .

يتم تمثيل عملية "لعب لعبة المصفوفة" على النحو التالي:

تم ضبط مصفوفة الدفع؛

يختار اللاعب الأول، بغض النظر عن اللاعب الثاني، أحد صفوف هذه المصفوفة، على سبيل المثال، -th؛

يختار اللاعب الثاني، بغض النظر عن اللاعب الأول، أحد أعمدة هذه المصفوفة، على سبيل المثال، - ث؛

يحدد عنصر المصفوفة مقدار اللاعب الذي سأتلقاه من اللاعب II. بالطبع إذا نحن نتحدث عنحول الخسارة الفعلية للاعب I.

سوف نطلق على اللعبة المزدوجة العدائية ذات مصفوفة المردود اسم "لعبة".

مثال

دعونا نفكر في اللعبة.

تم تعيين مصفوفة الدفع:

.

دع اللاعب الأول، بشكل مستقل عن اللاعب الثاني، يختار الصف الثالث من هذه المصفوفة، واللاعب الثاني، بشكل مستقل عن اللاعب الأول، يختار العمود الثاني من هذه المصفوفة:

ثم اللاعب سأحصل على 9 وحدات من اللاعب الثاني.

5.2. الإستراتيجية النقية المثالية في لعبة المصفوفة

الإستراتيجية المثالية تسمى استراتيجية اللاعب الأول التي لن يقلل فيها من مكاسبه مقابل أي اختيار للاستراتيجية من قبل اللاعب الثاني، وتسمى استراتيجية اللاعب الثاني التي لن يزيد فيها خسارته لأي اختيار استراتيجية من قبل اللاعب الأول.

من خلال اختيار الصف الرابع من مصفوفة العائد كحركة، يضمن اللاعب الأول أنه سيفوز بما لا يقل عن القيمة في أسوأ الحالات، عندما يحاول اللاعب الثاني تقليل هذه القيمة. ولذلك سأختار اللاعب الصف الرابع الذي سيوفر له الحد الأقصى للفوز:

.

يجادل اللاعب الثاني بالمثل ويمكنه بالتأكيد ضمان الحد الأدنى من الخسارة:

.

إن عدم المساواة صحيح دائمًا:

الكمية تسمى سعر منخفضألعاب .

الكمية تسمى أعلى سعر للعبة .

تسمى الاستراتيجيات المثلى ينظف ، إذا كانت المساواة تنطبق عليهم:

,

.

الكمية تسمى بالسعر النقي للعبة ، لو .

نموذج الاستراتيجيات النقية الأمثل نقطة سرج مصفوفة الدفع.

بالنسبة لنقطة السرج يتم استيفاء الشروط التالية:

أي أن العنصر هو الأصغر في الصف والأكبر في العمود.

وبالتالي، إذا كانت مصفوفة المردود لديها نقطة سرج ، ثم يمكنك أن تجد استراتيجيات نقية الأمثل اللاعبين.

يمكن تمثيل الإستراتيجية النقية للاعب I بمجموعة مرتبة من الأرقام (المتجه)، حيث تكون جميع الأرقام تساوي الصفر، باستثناء الرقم الموجود في المكان -th، والذي يساوي واحدًا.

يمكن تمثيل الإستراتيجية النقية للاعب II من خلال مجموعة مرتبة من الأرقام (متجه) حيث تكون جميع الأرقام تساوي الصفر، باستثناء الرقم الموجود في المكان -th، والذي يساوي واحدًا.

مثال

.

من خلال اختيار أي صف من مصفوفة المردود كحركة، يضمن اللاعب الأول أنه في أسوأ الحالات، لا تقل المكاسب عن القيمة الموجودة في العمود المحدد:

لذلك، سأختار اللاعب الأول الصف الثاني من مصفوفة الدفع، والذي يوفر له الحد الأقصى من المكاسب بغض النظر عن حركة اللاعب الثاني، والذي سيحاول تقليل هذه القيمة:

يفكر اللاعب الثاني بالمثل ويختار العمود الأول كحركته:

وبالتالي، هناك نقطة سرج لمصفوفة الدفع:

تتوافق مع الإستراتيجية النقية المثالية للاعب الأول ولللاعب الثاني، حيث لن يقوم اللاعب الأول بتقليل مكاسبه مقابل أي تغيير في الإستراتيجية بواسطة اللاعب الثاني ولن يزيد اللاعب الثاني خسارته مقابل أي تغيير في الإستراتيجية بواسطة اللاعب الأول.

5.3. الإستراتيجية المختلطة المثالية في لعبة المصفوفة

إذا لم تكن مصفوفة المردود تحتوي على نقطة سرج، فمن غير المنطقي لأي لاعب أن يستخدم استراتيجية نقية واحدة. إنه أكثر ربحية للاستخدام "المخاليط الاحتمالية" استراتيجيات نقية. ثم يتم تحديد الاستراتيجيات المختلطة على أنها الأمثل.

استراتيجية مختلطة يتميز اللاعب بالتوزيع الاحتمالي لحدث عشوائي يتكون من اختيار نقلة من قبل هذا اللاعب.

الإستراتيجية المختلطة للاعب الأول هي عبارة عن مجموعة مرتبة من الأرقام (المتجه) الذي يحقق شرطين:

1) لـ، أي أن احتمال اختيار كل صف من مصفوفة الدفع غير سالب؛

2) أي أن اختيار كل صف من صفوف مصفوفة الدفع يمثل بشكل جماعي مجموعة كاملةالأحداث.

ستكون الإستراتيجية المختلطة للاعب II عبارة عن مجموعة مرتبة من الأرقام (ناقل) مستوفي الشروط:

مبلغ الدفع للاعب الأول، الذي اختار استراتيجية مختلطة

من اللاعب الثاني الذي اختار استراتيجية مختلطة

,

يمثل القيمة المتوسطة

.

أفضل تسمى الاستراتيجيات المختلطة

و ,

إذا كان لأي استراتيجيات مختلطة تعسفية وتم استيفاء الشرط التالي:

أي أنه مع وجود استراتيجية مختلطة مثالية، يكون ربح اللاعب الأول هو الأكبر، وخسارة اللاعب الثاني هي الأقل.

إذا لم يكن هناك نقطة سرج في مصفوفة الدفع، إذن

,

أي أن هناك فرق إيجابي ( فرق غير مخصص )

- ³ 0,

ويحتاج اللاعبون إلى البحث عن فرص إضافية للحصول بثقة على حصة أكبر من هذا الفارق لصالحهم.

مثال

خذ بعين الاعتبار اللعبة التي حددتها مصفوفة المردود:

.

دعونا نحدد ما إذا كانت هناك نقطة سرج:

, .

اتضح أنه لا توجد نقطة سرج في مصفوفة الدفع وأن الفرق غير الموزع يساوي:

.

5.4. العثور على استراتيجيات مختلطة الأمثل

للألعاب 2x2

يتم تحديد الاستراتيجيات المختلطة المثالية لمصفوفة دفع الأبعاد من خلال إيجاد النقاط المثالية لدالة لمتغيرين.

دع احتمالية اختيار اللاعب للصف الأول من مصفوفة الدفع

يساوي . ثم احتمال اختيار الصف الثاني يساوي .

دع احتمال اختيار اللاعب II للعمود الأول يساوي . ثم احتمال اختيار العمود الثاني يساوي .

مبلغ الدفع للاعب الأول من قبل اللاعب الثاني يساوي:

تتوافق القيمة القصوى لربح اللاعب الأول وخسارة اللاعب الثاني مع الشروط التالية:

;

.

وبالتالي، فإن الاستراتيجيات المختلطة المثالية للاعبين الأول والثاني تساوي على التوالي:

5.5. الحل الهندسي للألعاب 2×ن

ومع زيادة أبعاد مصفوفة الدفع من إلى، لم يعد من الممكن تقليل تحديد الاستراتيجيات المختلطة المثالية لإيجاد أفضل دالة لمتغيرين. ومع ذلك، نظرًا لأن أحد اللاعبين لديه استراتيجيتين فقط، فيمكن استخدام الحل الهندسي.

المراحل الرئيسية لإيجاد حل للعبة هي كما يلي.

دعونا نقدم نظام الإحداثيات على المستوى. دعونا نرسم القطعة على المحور. نرسم خطوطًا متعامدة من الطرفين الأيسر والأيمن لهذا الجزء.


يتوافق الطرفان الأيسر والأيمن لقطاع الوحدة مع استراتيجيتين ومتاحتين للاعب الأول. وسنرسم مكاسب هذا اللاعب على الخطوط المتعامدة المرسومة. على سبيل المثال، لمصفوفة الدفع


مثل هذه المكاسب للاعب الأول عند اختيار الإستراتيجية ستكون و، وعند اختيار الإستراتيجية ستكون و.

دعونا نربط النقاط الفائزة للاعب الأول عبر مقاطع مستقيمة، بما يتوافق مع استراتيجيات اللاعب الثاني. ثم يحدد الخط المكسور الذي يحد الرسم البياني من الأسفل الحد الأدنى لمكافأة اللاعب الأول.



العثور على الإستراتيجية المختلطة المثالية للاعب I

,

والذي يتوافق مع النقطة الموجودة في الحد الأدنى لمكافأة اللاعب الأول مع الحد الأقصى للإحداثيات.

دعونا ننتبه إلى حقيقة أنه في المثال قيد النظر، باستخدام استراتيجيتين فقط و، تتوافق مع الخطوط المستقيمة المتقاطعة عند النقطة الموجودة على الحد السفلي لمكافأة اللاعب الأول، يمكن للاعب الثاني منع اللاعب الأول من الحصول على مبلغ أكبر سدد دينك.

وبالتالي، يتم تقليل اللعبة إلى لعبة وستكون الإستراتيجية المختلطة المثالية للاعب II في المثال قيد النظر

,

حيث الاحتمال هو نفسه كما في اللعبة:

5.6. حل اللعبةم× ن

إذا لم يكن لدى لعبة المصفوفة حل في الاستراتيجيات البحتة (أي لا توجد نقطة سرج)، ونظرًا للبعد الكبير لمصفوفة المردود، لا يمكن حلها بيانيًا، للحصول على الحل، استخدم طريقة البرمجة الخطية .

دع مصفوفة الدفع ذات البعد تعطى:

.

بحاجة إلى العثور على الاحتمالات ، مع أي لاعب يجب أن أختار حركاته بحيث تضمن له هذه الإستراتيجية المختلطة فوزًا لا يقل عن القيمة بغض النظر عن اختيار الحركات من قبل اللاعب الثاني.

لكل خطوة يختارها اللاعب II، يتم تحديد مكافأة اللاعب I حسب التبعيات:

دعونا نقسم طرفي المتباينتين ونقدم رموزًا جديدة:

المساواة

سوف تأخذ النموذج:

نظرًا لأن اللاعب الأول يسعى إلى تحقيق أقصى قدر من المردود، فيجب تقليل العكس. ثم مشكلة البرمجة الخطية للاعب سأأخذ الشكل:

تحت القيود

تم إنشاء مشكلة اللاعب II بشكل مشابه للمشكلة المزدوجة:

تحت القيود

حل المسائل باستخدام الطريقة البسيطة نحصل على:

,

5.7. مميزات حل ألعاب المصفوفات

قبل حل مشكلة إيجاد الاستراتيجيات الأمثل، يجب التحقق من شرطين:

هل من الممكن تبسيط مصفوفة الدفع؟

هل تحتوي مصفوفة الدفع على نقطة سرج؟

دعونا نفكر في إمكانية تبسيط مصفوفة الدفع:

نظرا لحقيقة أن اللاعب الذي أسعى للحصول عليه أكبر فوز، فيمكن حذف الصف الرابع من مصفوفة الدفع، لأنه لن يستخدم هذه الخطوة أبدًا إذا كانت العلاقة التالية راضية عن أي صف آخر:

وبالمثل، في سعيه لتحقيق أقل خسارة، لن يختار اللاعب الثاني أبدًا العمود -th في مصفوفة المردود كحركة، ويمكن شطب هذا العمود إذا كانت العلاقة التالية راضية عن أي عمود -th آخر:

معظم حل بسيطاللعبة هي وجود نقطة سرج في مصفوفة الدفع المبسطة، والتي تستوفي الشرط التالي (حسب التعريف):

مثال

يتم إعطاء مصفوفة الدفع:

.

تبسيط مصفوفة الدفع:

وجود نقطة سرج:

5.8. اللعب مع الطبيعة

على عكس مشاكل نظرية اللعبة في مشاكل النظرية الحلول الإحصائية الوضع غير المؤكد ليس له دلالة صراع عدائية ويعتمد على الواقع الموضوعي، وهو ما يسمى عادة "طبيعة" .

في ألعاب المصفوفة ذات الطبيعة، يمثل اللاعب الثاني مجموعة من العوامل غير المؤكدة التي تؤثر على فعالية القرارات المتخذة.

تختلف ألعاب المصفوفة ذات الطبيعة عن ألعاب المصفوفة العادية فقط في أنه عند اختيار الإستراتيجية المثالية للاعب الأول، لم يعد من الممكن الاعتماد على حقيقة أن اللاعب الثاني سيسعى جاهداً لتقليل خسارته. لذلك، جنبا إلى جنب مع مصفوفة الدفع، نقدم مصفوفة المخاطر :

أين يكون مقدار مخاطرة اللاعب I عند استخدام الحركة في الظروف مساويًا للفرق بين المكافأة التي سأحصل عليها ذلك اللاعب إذا علم أن الشرط سيتحقق، أي. ، والمكاسب التي سيحصل عليها، دون أن يعلم عند اختيار الحركة أن الشرط سيتحقق.

وهكذا تتحول مصفوفة الدفع بشكل فريد إلى مصفوفة مخاطر، لكن التحول العكسي غامض.

مثال

مصفوفة الفوز:

.

مصفوفة المخاطر:

ممكن بيانين المشكلة حول اختيار الحل في لعبة المصفوفة مع الطبيعة :

تعظيم المكاسب.

التقليل من المخاطر.

يمكن طرح مشكلة اتخاذ القرار بأحد شرطين:

- في خطر وذلك عندما تعرف دالة التوزيع الاحتمالي لاستراتيجيات الطبيعة، على سبيل المثال المتغير العشوائي لحدوث كل حالة من المواقف الاقتصادية المحددة المتوقعة؛

- في ظروف عدم اليقين ، عندما تكون دالة التوزيع الاحتمالي غير معروفة.

5.9. حل المشاكل في نظرية القرار الإحصائي

في خطر

عند اتخاذ القرارات في ظل ظروف المخاطرة، يعرف اللاعب الاحتمالات بداية حالات الطبيعة.

ثم يُنصح اللاعب الأول باختيار الإستراتيجية التي تناسبه متوسط ​​​​القيمة الفائزة التي يتم الحصول عليها عن طريق الخط هو الحد الأقصى :

.

عند حل هذه المشكلة باستخدام مصفوفة المخاطر، نحصل على نفس الحل المقابل الحد الأدنى من متوسط ​​المخاطر :

.

5.10. حل المشاكل في نظرية القرار الإحصائي

في ظروف عدم اليقين

عند اتخاذ القرارات في ظل ظروف عدم اليقين، يمكنك استخدام ما يلي معايير :

الحد الأقصى لمعيار والد.

معيار الحد الأدنى من المخاطرمتوحش؛

معيار هورويتز للتشاؤم - التفاؤل؛

مبدأ لابلاس لعدم كفاية السبب.

دعونا نفكر اختبار ماكسيمين والد .

يتم لعب اللعبة مع الطبيعة كما هو الحال مع خصم عدواني معقول، أي أن نهج إعادة التأمين مأخوذ من موقف التشاؤم الشديد لمصفوفة الدفع:

.

دعونا نفكر معيار الحد الأدنى للمخاطر في سافاج .

نهج مشابه للمنهج السابق من موقف التشاؤم الشديد لمصفوفة المخاطر:

.

دعونا نفكر معيار هورويتز للتشاؤم هو التفاؤل .

تُتاح الفرصة لعدم الاسترشاد بالتشاؤم الشديد أو التفاؤل الشديد:

أين درجة التشاؤم؟

في - التفاؤل الشديد ،

في - التشاؤم الشديد.

دعونا نفكر مبدأ لابلاس لعدم كفاية السبب .

من المفترض أن جميع حالات الطبيعة محتملة على قدم المساواة:

,

.

استنتاجات القسم الخامس

في لعبة المصفوفة، يشارك لاعبان ويتم تمثيل وظيفة الدفع، التي تعمل على تحديد مبلغ الدفع من اللاعب الخاسر إلى اللاعب الفائز، في شكل مصفوفة دفع. تم الاتفاق على أن يختار اللاعب الأول أحد صفوف مصفوفة الدفع كحركة، ويختار اللاعب الثاني أحد أعمدتها. ثم عند تقاطع الصفوف والأعمدة المحددة في هذه المصفوفة توجد قيمة عددية للدفعة للاعب الأول من اللاعب الثاني (إذا كانت هذه القيمة موجبة، فهذا يعني أن اللاعب الذي فزت به حقًا، وإذا كانت سلبية، فإن اللاعب الثاني أساسًا فاز).

إذا كانت هناك نقطة سرج في مصفوفة المردود، فإن اللاعبين لديهم استراتيجيات نقية مثالية، أي للفوز، يجب على كل منهم تكرار حركته المثالية. إذا لم تكن هناك نقطة سرج، فمن أجل الفوز، يجب على كل منهم استخدام الإستراتيجية المختلطة المثالية، أي استخدام مزيج من الحركات، كل منها يجب أن يتم باحتمالية مثالية.

يتم العثور على الاستراتيجيات المختلطة المثالية لألعاب 2x2 عن طريق حساب الاحتمالات المثلى باستخدام الصيغ المعروفة. باستخدام الحل الهندسيمن ألعاب 2×n، فإن تحديد الاستراتيجيات المختلطة المثالية فيها يعود إلى إيجاد استراتيجيات مختلطة مثالية للألعاب 2×2. لحل ألعاب m×n، تم استخدام طريقة البرمجة الخطية لإيجاد الاستراتيجيات المختلطة المثلى فيها.

يمكن تبسيط بعض مصفوفات الدفع، ونتيجة لذلك يتم تقليل أبعادها عن طريق إزالة الصفوف والأعمدة المقابلة للحركات غير الواعدة.

إذا كان اللاعب الثاني عبارة عن مجموعة من العوامل غير المؤكدة التي تعتمد على الواقع الموضوعي وليس لها دلالات صراع عدائي، فإن مثل هذه اللعبة تسمى لعبة مع الطبيعة، ويتم استخدام المشكلات من نظرية القرارات الإحصائية لحلها. بعد ذلك، إلى جانب مصفوفة الدفع، يتم تقديم مصفوفة المخاطر ومن الممكن صيغتين لمشكلة اختيار الحل في لعبة المصفوفة مع الطبيعة: تعظيم المكاسب وتقليل المخاطر.

يوضح حل مشاكل نظرية القرارات الإحصائية في ظل ظروف المخاطرة أنه من المستحسن للاعب الأول أن يختار الإستراتيجية التي يكون فيها متوسط ​​قيمة (التوقع الرياضي) للمكاسب، المأخوذة من صف من مصفوفة الدفع، هو الحد الأقصى، أو (التي هو نفس الشيء) متوسط ​​قيمة (التوقع الرياضي) للمخاطرة، مأخوذة حسب صف مصفوفة المخاطر، هو الحد الأدنى. عند اتخاذ القرارات في ظل ظروف عدم اليقين يستخدمونها المعايير التالية: معيار والد ماكسيمين، معيار الحد الأدنى للمخاطرة سافاج، معيار التشاؤم والتفاؤل لهرويتز، مبدأ لابلاس لعدم كفاية السبب.

أسئلة الاختبار الذاتي

كيف يتم تعريف المفاهيم الأساسية لنظرية اللعبة: الحركة والاستراتيجية ووظيفة المردود؟

ما هي دالة المردود الممثلة في لعبة المصفوفة؟

لماذا تسمى لعبة المصفوفة محصلتها صفر؟

كيف تبدو عملية لعب لعبة المصفوفة؟

ما هي اللعبة التي تسمى لعبة m×n؟

ما هي استراتيجية لعبة المصفوفة التي تسمى الأمثل؟

ما هي الاستراتيجية المثلى للعبة مصفوفة تسمى نقية؟

ماذا تعني نقطة السرج لمصفوفة الدفع؟

ما هي الإستراتيجية المثالية للعبة المصفوفة التي تسمى مختلطة؟

كيف تبدو الإستراتيجية المختلطة للاعب؟

ما هو مبلغ الدفع للاعب الأول من اللاعب الثاني الذي اختار استراتيجيات مختلطة؟

ما هي الاستراتيجيات المختلطة التي تسمى الأمثل؟

ماذا يعني الفرق غير الموزع؟

ما هي الطريقة المستخدمة للعثور على الاستراتيجيات المختلطة المثالية لألعاب 2x2؟

كيف يتم العثور على الاستراتيجيات المختلطة المثالية لألعاب 2×n؟

ما هي الطريقة المستخدمة للعثور على الاستراتيجيات المختلطة المثالية لألعاب m×n؟

ما هي مميزات حل ألعاب المصفوفة؟

ماذا يعني تبسيط مصفوفة الدفع وتحت أي ظروف يمكن تنفيذها؟

ما هي لعبة المصفوفة التي يسهل حلها عندما تحتوي مصفوفة المردود على نقطة سرج أو لا تحتوي عليها؟

ما هي مشاكل نظرية اللعبة المرتبطة بمشاكل نظرية القرار الإحصائي؟

كيف تترجم مصفوفة الدفع إلى مصفوفة المخاطر؟

ما هي الصيغتان الممكنتان لمشكلة اختيار الحلول في لعبة المصفوفة مع الطبيعة؟

لأي شرطين يمكن طرح مشاكل اتخاذ القرار في لعبة المصفوفة مع الطبيعة؟

ما هي الإستراتيجية المناسبة للاعب الذي أختاره عند حل مشكلة نظرية القرار الإحصائي في ظل ظروف المخاطرة؟

ما هي معايير اتخاذ القرار التي يمكن استخدامها عند حل مشاكل نظرية القرار الإحصائي في ظل ظروف عدم اليقين؟

أمثلة على حل المشكلات

1. تشير مصفوفة الدفع إلى مقدار ربح المؤسسة عند البيع أنواع مختلفةالمنتجات (الأعمدة) حسب الطلب المحدد (الصفوف). من الضروري تحديد الإستراتيجية المثلى للمؤسسة لإنتاج أنواع مختلفة من المنتجات والحد الأقصى المقابل (في المتوسط) للدخل من مبيعاتها.

دعونا نشير إلى المصفوفة المعطاة ونقدم المتغيرات. سوف نستخدم أيضًا المصفوفة (المتجه). ثم و، أي.

يتم حساب المصفوفة العكسية:

تم العثور على القيم:

.

يتم حساب الاحتمالات:

يتم تحديد متوسط ​​دخل المبيعات:

.

2. شركة الصيدلي هي شركة تصنيع الأدوية والمنتجات الطبية الحيوية في المنطقة. ومن المعروف أن ذروة الطلب على بعض الأدوية تحدث خلال فترة الصيف(أدوية القلب والأوعية الدموية، المسكنات)، للآخرين - لفترتي الخريف والربيع (مضاد للعدوى، مضاد للسعال).

التكاليف لكل وحدة قياسية واحدة وحدات المنتجات لشهر سبتمبر وأكتوبر هي: للمجموعة الأولى (أدوية القلب والأوعية الدموية والمسكنات) – 20 روبل؛ للمجموعة الثانية (الأدوية المضادة للعدوى ومضادات السعال) – 15 روبل.

وفقا لملاحظات على عدة السنوات الأخيرةوأثبت قسم التسويق بالشركة أنه بإمكانه بيع 3050 وحدة تقليدية خلال الشهرين قيد النظر في الظروف الجوية الدافئة. وحدات منتجات المجموعة الأولى و1100 وحدة تقليدية. وحدات منتجات المجموعة الثانية في الظروف الجوية الباردة - 1525 ب. وحدات منتجات المجموعة الأولى و3690 وحدة تقليدية. وحدات المجموعة الثانية.

فيما يتعلق بالتغيرات المحتملة في الطقس، تم تعيين المهمة لتحديد استراتيجية إنتاج منتجات الشركة، والتي تضمن أقصى دخل من المبيعات بسعر بيع قدره 40 روبل. لوحدة قياسية واحدة وحدات منتجات المجموعة الأولى و 30 فرك. - المجموعة الثانية.

حل. لدى الشركة استراتيجيتين:

سيكون الطقس دافئاً هذا العام؛

سيكون الطقس باردا.

إذا تبنت الشركة الإستراتيجية وفي الواقع هناك طقس دافئ (إستراتيجية الطبيعة)، فسيتم بيع المنتجات المصنعة (3050 وحدة قياسية من أدوية المجموعة الأولى و1100 وحدة قياسية من المجموعة الثانية) بالكامل وسيكون الدخل

3050×(40-20)+1100×(30-15)=77500 فرك.

في الظروف الجوية الباردة (استراتيجية الطبيعة)، سيتم بيع أدوية المجموعة الثانية بالكامل، والمجموعة الأولى فقط بمبلغ 1525 وحدة تقليدية. وحدات وستبقى بعض الأدوية غير مباعة. الدخل سيكون

1525×(40-20)+1100×(30-15)-20×()=16500 فرك.

وبالمثل، إذا كان النموذج يتبنى الإستراتيجية وكان الطقس باردًا بالفعل، فسيكون الدخل كذلك

1525×(40-20)+3690×(30-15)=85850 فرك.

في الطقس الدافئ، سيكون الدخل

1525×(40-20)+1100×(30-15)-() ×15=8150 فرك.

وبالنظر إلى الشركة والطقس كلاعبين، نحصل على مصفوفة الدفع

,

سعر اللعبة في النطاق

يتضح من مصفوفة الدفع أنه في جميع الظروف لن يقل دخل الشركة عن 16500 روبل، ولكن إذا تزامنت الظروف الجوية مع الإستراتيجية المختارة، فيمكن أن يصل دخل الشركة إلى 77500 روبل.

دعونا نجد حلا للعبة.

دعونا نشير إلى احتمال استخدام الشركة لاستراتيجية بواسطة واستراتيجية بواسطة و. حل اللعبة بيانيا، نحصل على بينما سعر اللعبة هو ص.

ستكون الخطة المثلى لإنتاج الأدوية

وبالتالي، فمن المستحسن أن تنتج الشركة 2379 وحدة تقليدية خلال شهري سبتمبر وأكتوبر. وحدات أدوية المجموعة الأولى و 2239.6 وحدة تقليدية. وحدات أدوية المجموعة الثانية، ثم في أي طقس، ستحصل على دخل لا يقل عن 46986 روبل.

في ظروف عدم اليقين، إذا لم يكن من الممكن لشركة ما استخدام استراتيجية مختلطة (اتفاقيات مع منظمات أخرى)، فإننا نستخدم المعايير التالية لتحديد الإستراتيجية المثلى للشركة:

معيار فالد:

معيار هورويتز: للتحديد الذي نقبله، ثم لاستراتيجية الشركة

للاستراتيجية

من المستحسن أن تستخدم الشركة استراتيجية.

المعيار الوحشي. الحد الأقصى للعنصر في العمود الأول هو 77500، في العمود الثاني - 85850.

تم العثور على عناصر مصفوفة المخاطر من التعبير

,

أين ، ،

تبدو مصفوفة المخاطر

,

من المستحسن استخدام الاستراتيجية أو.

ولذلك، فمن المستحسن للشركة استخدام الاستراتيجية أو.

لاحظ أن كل معيار من المعايير التي تم النظر فيها لا يمكن اعتباره مرضيًا تمامًا الاختيار النهائيالقرارات، لكن تحليلها المشترك يسمح لنا بتخيل عواقب اتخاذ قرارات إدارية معينة بشكل أكثر وضوحًا.

بالنظر إلى التوزيع الاحتمالي المعروف لمختلف حالات الطبيعة، فإن معيار القرار هو الحد الأقصى للتوقع الرياضي للفوز.

وليعلم للمشكلة قيد البحث أن احتمالات الطقس الدافئ والبارد متساوية وتبلغ 0.5، ومن ثم يتم تحديد الاستراتيجية الأمثل للشركة على النحو التالي:

من المستحسن أن تستخدم الشركة الإستراتيجية أو.

مهام العمل المستقل

1. يمكن للمؤسسة إنتاج ثلاثة أنواع من المنتجات (أ، ب، ج)، مع الحصول على ربح حسب الطلب. ويمكن للطلب بدوره أن يتخذ إحدى الحالات الأربع (الأولى والثانية والثالثة والرابعة). في المصفوفة التالية، تحدد العناصر الربح الذي ستحصل عليه المؤسسة عند إطلاق المنتج -th وحالة الطلب -th:

بشكل عام، V * ≠ V * - لا توجد نقطة سرج. كما لا يوجد حل أمثل في الاستراتيجيات البحتة. ومع ذلك، إذا قمنا بتوسيع مفهوم الإستراتيجية البحتة من خلال تقديم مفهوم الإستراتيجية المختلطة، فمن الممكن تنفيذ خوارزمية لإيجاد الحل الأمثل لمشكلة لعبة غير محددة جيدًا. في مثل هذه الحالة، يقترح استخدام النهج الإحصائي (الاحتمالي) لإيجاد الحل الأمثل للعبة محصلتها صفر. لكل لاعب، إلى جانب مجموعة معينة من الاستراتيجيات الممكنة له، يتم تقديم ناقل غير معروف للاحتمالات (الترددات النسبية) التي يجب من خلالها تطبيق هذه الإستراتيجية أو تلك.

دعونا نشير إلى متجه الاحتمالات (الترددات النسبية) لاختيار استراتيجيات معينة للاعب A على النحو التالي:
ف = (ع 1، ص 2،…، ع م)،
حيث p i ≥ 0، p 1 + p 2 +…+ p m = 1. تسمى القيمة p i بالاحتمال (التكرار النسبي) لاستخدام الإستراتيجية A i.

وبالمثل، بالنسبة للاعب B، يتم تقديم ناقل غير معروف للاحتمالات (الترددات النسبية) وله الشكل:
س = (ف 1، س 2،…، ف ن)،
حيث q j ≥ 0, q 1 + q 2 +…+ q n = 1. تسمى القيمة q j بالاحتمال (التكرار النسبي) لاستخدام الإستراتيجية B j. تسمى مجموعة (مجموعة) الاستراتيجيات النقية A 1، A 2، …A m و B 1، B 2، …B n مع ناقلات احتمالات اختيار كل منها استراتيجيات مختلطة.

النظرية الرئيسية في نظرية الألعاب ذات المحصلة الصفرية المحدودة هي نظرية فون نيومان: تحتوي كل لعبة مصفوفة محدودة على، على الأقل، أحد الحلول الأمثل، ربما بين الاستراتيجيات المختلطة.
ويترتب على هذه النظرية أن اللعبة غير المحددة جيدًا لها حل أمثل واحد على الأقل في الاستراتيجيات المختلطة. في مثل هذه الألعاب، سيكون الحل هو زوج من الاستراتيجيات المختلطة المثالية P * و Q *، بحيث إذا التزم أحد اللاعبين باستراتيجيته المثالية، فلن يكون من المربح للاعب الآخر أن ينحرف عن استراتيجيته المثالية.
يتم تحديد متوسط ​​مكافأة اللاعب A من خلال التوقع الرياضي:

إذا كان الاحتمال (التكرار النسبي) لاستخدام الإستراتيجية يختلف عن الصفر، فسيتم استدعاء هذه الإستراتيجية نشيط.

يتم استدعاء الاستراتيجيات P*، Q* مختلط الأمثلالاستراتيجيات إذا MA (P, Q *) ≥ M A (P *, Q *) ≥ M A (P *, Q) (1)
في هذه الحالة يتم استدعاء MA (P * , Q *). على حسابالألعاب ويشار إليها بالرمز V (V * ≥ V ≥ V *). والأول من المتباينات (١) يعني ذلك انحراف اللاعب "أ" عن إستراتيجيته المختلطة المثاليةبشرط أن يلتزم اللاعب B بإستراتيجيته المختلطة المثالية، يؤدي إلى انخفاض في متوسط ​​المكاسباللاعب أ. ثاني المتباينات يعني ذلك انحراف اللاعب B عن إستراتيجيته المختلطة المثاليةبشرط أن يلتزم اللاعب "أ" بإستراتيجيته المختلطة المثالية، يؤدي إلى زيادة متوسط ​​خسارة اللاعب ب.

بشكل عام، يمكن حل هذه المشكلات بنجاح باستخدام هذه الآلة الحاسبة.

مثال.

4 7 2
7 3 2
2 1 8

1. تحقق مما إذا كانت مصفوفة الدفع تحتوي على نقطة سرج. إذا كانت الإجابة بنعم، فإننا نكتب حل اللعبة في استراتيجيات خالصة.

نحن نفترض أن اللاعب الأول يختار إستراتيجيته بطريقة تؤدي إلى تعظيم مردوده، ويختار اللاعب الثاني إستراتيجيته بطريقة تقلل من مردود اللاعب الأول.

اللاعبين ب 1 ب 2 ب 3 أ = دقيقة (أ ط)
أ 1 4 7 2 2
أ2 7 3 2 2
أ 3 2 1 8 1
ب = الحد الأقصى (ب ط) 7 7 8

نجد العائد المضمون يحدده السعر الأقل للعبة a = max(a i) = 2، مما يشير إلى الحد الأقصى للاستراتيجية النقية A 1 .
السعر الأعلى للعبة هو b = min(b j) = 7. مما يدل على عدم وجود نقطة سرج، حيث أن a ≠ b فإن سعر اللعبة يقع ضمن النطاق 2 ≥ y ≥ 7. نجد الحل للعبة في استراتيجيات مختلطة. ويفسر ذلك حقيقة أن اللاعبين لا يستطيعون الإعلان عن استراتيجياتهم النقية للعدو: يجب عليهم إخفاء أفعالهم. يمكن حل اللعبة من خلال السماح للاعبين باختيار استراتيجياتهم بشكل عشوائي(مزيج من الاستراتيجيات النقية).

2. التحقق من مصفوفة الدفع للصفوف والأعمدة السائدة.
لا توجد صفوف سائدة أو أعمدة سائدة في مصفوفة الدفع.

3. إيجاد حل للعبة باستراتيجيات مختلطة.
دعونا نكتب نظام المعادلات.
للاعب I
4ع 1 +7ع 2 +2ع 3 = ص
7ع 1 +3ع 2 +ص 3 = ص
2ع 1 +2ع 2 +8ف 3 = ص
ص 1 + ص 2 + ص 3 = 1

للاعب الثاني
4q 1 +7q 2 +2q 3 = ص
7q 1 +3q 2 +2q 3 = ص
2ق 1 +ف 2 +8ف 3 = ص
ف 1 + ف 2 + ف 3 = 1

وبحل هذه الأنظمة باستخدام طريقة غاوس نجد:

ص = 4 1 / 34
ع 1 = 29 / 68 (احتمال استخدام الاستراتيجية الأولى).
ع 2 = 4 / 17 (احتمال استخدام الاستراتيجية الثانية).
ع 3 = 23 / 68 (احتمال استخدام الاستراتيجية الثالثة).

الإستراتيجية المختلطة المثالية للاعب الأول: P = (29/68; 4/17; 23/68)
س 1 = 6 / 17 (احتمال استخدام الاستراتيجية الأولى).
س 2 = 9 / 34 (احتمال استخدام الاستراتيجية الثانية).
س 3 = 13 / 34 (احتمال استخدام الاستراتيجية الثالثة).

الإستراتيجية المختلطة المثالية للاعب II: س = (6/17; 9/34; 13/34)
سعر اللعبة: ص = 4 1/34

إذا لم يكن لدى اللعبة نقطة سرج، فستنشأ صعوبات في تحديد سعر اللعبة والاستراتيجيات المثلى للاعبين. خذ على سبيل المثال اللعبة:

في هذه اللعبة و. لذلك يمكن للاعب الأول أن يضمن لنفسه فوزًا يساوي 4، ويمكن للثاني أن يحد خسارته إلى 5. المنطقة الواقعة بين و هي كما كانت تعادل ويمكن لكل لاعب أن يحاول تحسين نتيجته على حساب هذا. منطقة. ما هي الاستراتيجيات المثالية للاعبين في هذه الحالة؟

إذا استخدم كل لاعب الإستراتيجية المميزة بعلامة النجمة (و)، فإن مكاسب اللاعب الأول وخسارة الثاني ستكون مساوية لـ 5. وهذا غير مناسب للاعب الثاني، حيث أن الأول يفوز بأكثر مما يمكنه ضمانه. بحد ذاتها. ومع ذلك، إذا كشف اللاعب الثاني بطريقة ما عن نية اللاعب الأول في استخدام الإستراتيجية، فيمكنه تطبيق الإستراتيجية وتقليل مكافأة اللاعب الأول إلى 4. ومع ذلك، إذا كشف اللاعب الأول عن نية اللاعب الثاني في استخدام الإستراتيجية، إذن، باستخدام الإستراتيجية، سيزيد مكافأته إلى 6. وبالتالي، ينشأ موقف حيث يجب على كل لاعب أن يحافظ على سرية الإستراتيجية التي سيستخدمها. ومع ذلك، كيف نفعل هذا؟ بعد كل شيء، إذا تم لعب اللعبة عدة مرات وكان اللاعب الثاني يستخدم الإستراتيجية دائمًا، فسيكتشف اللاعب الأول قريبًا خطة اللاعب الثاني، وبعد تطبيق الإستراتيجية، سيحصل على فوز إضافي. من الواضح أنه يجب على اللاعب الثاني تغيير الإستراتيجية في كل لعبة جديدة، لكن يجب عليه القيام بذلك بطريقة لا يخمن فيها اللاعب الأول الإستراتيجية التي سيستخدمها في كل حالة.

بالنسبة لآلية الاختيار العشوائي، ستكون انتصارات وخسائر اللاعبين المتغيرات العشوائية. يمكن تقدير نتيجة اللعبة في هذه الحالة بمتوسط ​​خسارة اللاعب الثاني. دعنا نعود إلى المثال. لذلك، إذا كان اللاعب الثاني يستخدم استراتيجية وبشكل عشوائي مع احتمالات 0.5؛ 0.5، فمع استراتيجية اللاعب الأول سيكون متوسط ​​قيمة خسارته:

ومع استراتيجية اللاعب الأول

لذلك، يمكن للاعب الثاني أن يحد من متوسط ​​خسارته إلى 4.5 بغض النظر عن الإستراتيجية التي يستخدمها اللاعب الأول.

وبالتالي، في بعض الحالات، يكون من المستحسن عدم تحديد استراتيجية مسبقًا، ولكن اختيار واحدة أو أخرى بشكل عشوائي، باستخدام نوع من آلية الاختيار العشوائي. تسمى الإستراتيجية القائمة على الاختيار العشوائي استراتيجية مختلطة، على عكس الاستراتيجيات المقصودة، والتي تسمى استراتيجيات نقية.

دعونا نعطي تعريفا أكثر صرامة للاستراتيجيات النقية والمختلطة.



يجب أن تكون هناك لعبة بدون نقطة سرج:

دعونا نشير إلى تكرار استخدام الإستراتيجية النقية للاعب الأول بواسطة (احتمال استخدام الإستراتيجية i-th). وبالمثل، دعونا نشير إلى تكرار استخدام الإستراتيجية النقية للاعب الثاني بواسطة (احتمال استخدام الإستراتيجية j). بالنسبة للعبة ذات نقطة السرج، هناك حل في الاستراتيجيات البحتة. بالنسبة للعبة بدون نقطة سرج، يوجد حل في الاستراتيجيات المختلطة، أي عندما يعتمد اختيار الإستراتيجية على الاحتمالات. ثم

الكثير من إستراتيجيات اللاعب الأول الخالصة؛

الكثير من استراتيجيات اللاعب الأول المختلطة؛

الكثير من إستراتيجيات اللاعب الثاني الخالصة؛

الكثير من استراتيجيات اللاعب الثاني المختلطة.

لنفكر في مثال: لتكن هناك لعبة

اللاعب الثاني يختار الاحتمال . دعونا نقدر متوسط ​​خسارة اللاعب الثاني عندما يستخدم الاستراتيجيات، على التوالي.

هناك استراتيجيات نقية ومختلطة. استراتيجية نقية
اللاعب الأول (إستراتيجية خالصة
اللاعب الثاني) هي حركة محتملة للاعب الأول (الثاني)، الذي اختاره باحتمال يساوي 1.

إذا كان اللاعب الأول لديه استراتيجيات m، واللاعب الثاني لديه استراتيجيات n، فبالنسبة لأي زوج من استراتيجيات اللاعبين الأول والثاني، يمكن تمثيل الاستراتيجيات النقية كمتجهات وحدة. على سبيل المثال، لزوج من الاستراتيجيات
,
سيتم كتابة الاستراتيجيات النقية للاعبين الأول والثاني على النحو التالي:
,
. لزوج من الاستراتيجيات ,يمكن كتابة الاستراتيجيات النقية على النحو التالي:

,

.

نظرية: في لعبة المصفوفة، لا يتجاوز صافي السعر الصافي للعبة السعر الصافي العلوي للعبة، أي.
.

تعريف:إذا كان لاستراتيجيات نقية ,اللاعبين A و B، على التوالي، هناك مساواة
، ثم زوج من الاستراتيجيات البحتة ( ,) تسمى نقطة السرج في لعبة المصفوفة، العنصر المصفوفة التي تقف عند تقاطع الصف i والعمود j هي عنصر السرج لمصفوفة الدفع، والرقم
- السعر الصافي للعبة.

مثال:ابحث عن صافي الأسعار الدنيا والعليا، وحدد وجود نقاط السرج في لعبة المصفوفة

.

دعونا نحدد صافي أسعار اللعبة الدنيا والعليا: , ,
.

في هذه الحالة، لدينا نقطة سرج واحدة (أ 1؛ ب 2)، وعنصر السرج هو 5. هذا العنصر هو الأصغر في الصف الأول والأكبر في العمود الثاني. يؤدي انحراف اللاعب أ عن استراتيجية الحد الأقصى أ 1 إلى انخفاض مكاسبه، كما يؤدي انحراف اللاعب ب عن استراتيجية الحد الأقصى ب 2 إلى زيادة خسارته. بمعنى آخر، إذا كانت لعبة المصفوفة تحتوي على عنصر سرج، فإن أفضل الاستراتيجيات للاعبين هي استراتيجيات الحد الأدنى الخاصة بهم. وهذه الاستراتيجيات النقية، التي تشكل نقطة سرج وتسلط الضوء على عنصر السرج 12 = 5 في مصفوفة اللعبة، هي استراتيجيات نقية مثالية و اللاعبين A و B على التوالي.

إذا كانت لعبة المصفوفة لا تحتوي على نقطة سرج، يصبح حل اللعبة صعبًا. في هذه الألعاب
. يؤدي استخدام استراتيجيات الحد الأدنى في مثل هذه الألعاب إلى حقيقة أن المكافأة لا تتجاوز كل لاعب والخسارة لا تقل عن ذلك . بالنسبة لكل لاعب، يطرح السؤال حول زيادة المكاسب (تقليل الخسائر). تم العثور على الحل باستخدام استراتيجيات مختلطة.

تعريف:الإستراتيجية المختلطة للاعب الأول (الثاني) هي ناقل
، أين
و
(
، أين
و
).

المتجه p(q) يعني احتمالية استخدام إستراتيجية i-th النقية من قبل اللاعب الأول (استراتيجية j-th النقية من قبل اللاعب الثاني).

وبما أن اللاعبين يختارون استراتيجياتهم النقية بشكل عشوائي ومستقل عن بعضهم البعض، فإن اللعبة تكون عشوائية ويصبح مقدار المكاسب (الخسائر) عشوائيًا. في هذه الحالة، فإن متوسط ​​قيمة الربح (الخسارة) - التوقع الرياضي - هو دالة للاستراتيجيات المختلطة p، q:

.

تعريف:تسمى الدالة f(п, q) بوظيفة المردود في لعبة المصفوفة
.

تعريف:الاستراتيجيات
,
تسمى الأمثل إذا كانت للاستراتيجيات التعسفية
,
تم استيفاء الشرط

يوفر استخدام الاستراتيجيات المختلطة المثالية في اللعبة للاعب الأول عائدًا لا يقل عن العائد الذي يحصل عليه عندما يستخدم أي إستراتيجية أخرى؛ اللاعب الثاني لا يخسر أكثر مما لو استخدم أي استراتيجية أخرى س.

يشكل الجمع بين الاستراتيجيات المثالية وسعر اللعبة حلاً للعبة.

© 2023 skudelnica.ru -- الحب، الخيانة، علم النفس، الطلاق، المشاعر، المشاجرات