استراتيجيات نظيفة ومختلطة. ألعاب في استراتيجيات نقية

الرئيسية / التشاجر

من بين الألعاب النهائية ذات أهمية عملية، هناك ألعاب نادرة نسبيا مع نقطة السرج؛ الحالة هي أكثر نموذجية. "عندما يكون السعر السفلي والأعلى ألعابا مختلفة. تحليل مصفوفة هذه الألعاب، خلصنا إلى أنه إذا تم تخرج كل لاعب

واحد هو الاستراتيجية الوحيدة.، في حساب العدو المعقول، يجب تحديد هذا الاختيار بمبدأ MiniMax. التمسك باستراتيجية ماكسيمين، في أي سلوك من العدو ضمان كأس عن كوبينغز تساوي السعر الأدنى للعبة. السؤال الطبيعي ينشأ: سواء كان من المستحيل ضمان أرباحا متوسطة، أكبر، إذا كان تطبيق استراتيجية واحدة "نظيفة"، والبديل بطريقة عشوائية عدة استراتيجيات؟

هذه الاستراتيجيات المشتركة التي تتكون في تطبيق العديد من الاستراتيجيات الخالصة بالتناوب من قبل قانون عشوائي مع نسبة تردد معينة في نظرية الألعاب تسمى الاستراتيجيات المختلطة.

من الواضح أن كل استراتيجية صافية هي حالة خاصة مختلطة، حيث تستخدم كل الاستراتيجيات، باستثناء واحد، مع ترددات صفرية، وهذا - بتردد 1.

اتضح أنه، تطبيق ليس نظيفا فقط، ولكن أيضا استراتيجيات مختلطة، من الممكن بالنسبة لكل لعبة أخيرة للحصول على حل، أي استراتيجيات من هذا (بشكل عام، مختلط) التي عند تطبيقها على كلا اللاعبين، ستكون المكاسب تساوي اللعبة، ومع أي انحراف أحادي الجانب عن الإستراتيجية المثلى، لا يمكن تغيير المكاسب إلا إلى جانب، غير مربحة للانحراف.

تم تقديم الموافقة هو محتوى ما يسمى نخري الأساسي لنظرية الألعاب. أثبت هذا النظري لأول مرة من قبل خلفية نيومانان في عام 1928، الأدلة المعروفة على نظرية نظرية نسبيا؛ لذلك، نحن نعطي صياغة فقط.

كل لعبة أخيرة لديها حل واحد على الأقل (ربما في مجال الاستراتيجيات المختلطة).

المكاسب التي تم الحصول عليها نتيجة للحل تسمى سعر اللعبة. من النظرية الرئيسية، يتبع أن كل لعبة أخيرة لديها سعر. من الواضح أن سعر اللعبة الخامس يكمن دائما بين سعر اللعبة السفلي للعبة A والثمن العالي للعبة:

في الواقع، هناك كسب كحد أقصى مضمون، يمكننا أن نقدم لنفسك، وتطبيق استراتيجياتك الخالصة فقط. نظرا لأن الاستراتيجيات المختلطة تشمل كحالة خاصة وكلها نظيفة، فإن السماح، باستثناء نظيفة، مختلطة أيضا

استراتيجيات، نحن، في أي حال، لا تفاقم قدراتنا؛ بالتالي،

وبالمثل، بالنظر إلى قدرة العدو، سنظهر ذلك

من حيث أثبت عدم المساواة (3.1).

نقدم تسمية خاصة للاستراتيجيات المختلطة. على سبيل المثال، على سبيل المثال، تتكون استراتيجيتنا المختلطة في استخدام استراتيجيات Al، مع الترددات، وسنلن هذه الاستراتيجية

وبالمثل، سيتم الإشارة إلى استراتيجية العدو المختلطة:

حيث - الترددات التي يتم فيها خلط الاستراتيجيات

نفترض أننا وجدنا حلا للعبة، وتتألف من استراتيجيتين مثبتين مثبتين S، S. بشكل عام، لا يتم تضمين جميع الاستراتيجيات الصافية لهذا اللاعب في استراتيجيتها المختلطة الأمثل، ولكن بعضها فقط. سنقوم باستدعاء الاستراتيجيات المدرجة في استراتيجية اللاعب المختلط الأمثل، واستراتيجياتها "المفيدة".

اتضح أن قرار اللعبة لديه واحد آخر خاصية رائعة: إذا ارتفع أحد اللاعبين استراتيجيتها المختلطة المثالية 5 (5). لا يزال هذا الفوز دون تغيير ومساوي لسعر اللعبة الخامس، بغض النظر عما يجعل لاعب آخر إذا كان. فقط لا تتجاوز استراتيجيات "مفيدة". على سبيل المثال، يمكن استخدام أي من استراتيجياتها "المفيدة" في شكلها النقي، ويمكن أن تختلطها أيضا في أي أبعاد.

نثبت هذا البيان. دعنا سيكون هناك قرار من اللعبة. للحصول على محددة، نفترض أن الإستراتيجية المختلطة الأمثل تتكون من مزيج من ثلاثة

استراتيجيات "مفيدة" تتكون وفقا لمزيج من ثلاثة استراتيجيات "مفيدة"

ويقال أنه إذا ارتدى استراتيجية S، فإن العدو يمكن أن يطبق استراتيجيات في أي أبعاد، وسيظل الفوز دون تغيير، وسوف تظل اللعبة متساويا

على الرغم من أنني انتهيت من كلية الفيزياء الفنية، إلا أنني لم أقرأ نظرية الألعاب في الجامعة. ولكن لأنني في سنوات الطالب لقد لعبت الكثير أولا في التفضيل، ثم في الجسر، كنت مهتما بنظرية الألعاب، وأقيت برنامج تعليمي صغير. وفي الآونة الأخيرة قارئ الموقع ميخائيل لحل مهمة نظرية الألعاب. أدركت أن المهمة لم تعطيني، قررت تحديث معرفتي على نظرية الألعاب. أقدم لك كتابا صغيرا - بيان شعبي لعناصر نظرية اللعبة وبعض الطرق لحل ألعاب مصفوفة. لا يحتوي تقريبا على أدلة ويوضح الأحكام الرئيسية لنظرية الأمثلة. كتب الكتاب رياضيات رياضيات وشهرة إيلينا سيرجيفنا فينسل. درس عدة أجيال من المهندسين السوفيتي على كتابي كتابي "نظرية الاحتمالات". كما كتبت إيلينا سيرجيفنا عدة أعمال أدبية تحت اسم مستعار I. Grekov.

إيلينا فينسل. عناصر نظرية اللعبة. - م: fizmatgiz، 1961. - 68 ص.

تحميل مجردة قصيرة بالتنسيق أو

§ 1. موضوع نظرية اللعبة. مفاهيم أساسية

عند حل عدد من المهام العملية (في مجال الاقتصاد، والقضية العسكرية، وما إلى ذلك)، من الضروري تحليل الوضع حيث يوجد طرفان متحاربتان (أو أكثر)، ومتابعة الأهداف المعاكسة، ونتيجة كل حدث أحد الأطراف يعتمد على صورة العمل اختيار الخصم. سوف ندعو هذه الحالات إلى "حالات الصراع".

يمكن إحضار العديد من الأمثلة على حالات الصراع من مختلف الممارسين. أي موقف ينتمي أثناء الأعمال العدائية ينتمي إلى حالات الصراع: تتخذ كل أطراف قتال جميع التدابير المتاحة لها من أجل منع العدو لتحقيق النجاح. ينتمي الصراع أو المواقف الناشئة عن اختيار نظام الأسلحة، وطرق تطبيقها القتالي، وبشكل عام، عند التخطيط للعمليات العسكرية: يجب مراعاة كل حلول من الحلول في هذا المجال على أداء الأدوات الأقل فائدة من العدو. ينتمي عدد من المواقف في مجال الاقتصاد (خاصة في وجود المنافسة المجانية) إلى حالات الصراع؛ في دور الأطراف المتعثرة هي الشركات التجارية، المؤسسات الصناعية إلخ.

تسببت الحاجة إلى تحليل مثل هذه الحالات جهاز رياضي خاص في الحياة. نظرية الألعاب ليست في الأساس سوى نظرية رياضية لحالات الصراع. الهدف من النظرية هو وضع توصيات بشأن العمل العقلاني لكل من المعارضين خلال حالة الصراع. يتم اتخاذه مباشرة من ممارسة وضع الصراع معقدا للغاية، ويعيق تحليلها بحضور العديد من المواقف. لإجراء تحليل رياضي محتمل للموقف، من الضروري صرف انتباهك عن العوامل الثانوية، وجلب العوامل وبناء نموذج وضع مطلق إضافي. سوف نتصل بمثل هذه اللعبة "لعبة".

من وضع الصراع الحقيقي، تتميز اللعبة بحقيقة أنه يجري وفقا لقواعد محددة للغاية. لطالما كانت الإنسانية تستخدم هذه النماذج الرسمية لحالات الصراع التي هي الألعاب في الإحساس الحرفي بالكلمة. أمثلة يمكن أن تخدم الشطرنج والرسومات وألعاب البطاقات، إلخ. كل هذه الألعاب هي طبيعة المنافسة التي تدفق وفقا للقواعد المعروفة وإنهاء "النصر" (الفوز) لاعب معين.

مثل هذه الألعاب المنظمة بشكل رسمي هي الأكثر مواد مناسبة لتوضيح وإتقان المفاهيم الأساسية لنظرية اللعبة. المصطلحات، المقترضة من ممارسة هذه الألعاب، تنطبق وعند تحليل حالات الصراع الأخرى: يشار إليها الأطراف المعنية بها مشرويا باسم "اللاعبين"، ونتيجة التصادم "الفوز" أحد الطرفين.

قد تواجه اللعبة خصومين أو أكثر؛ في الحالة الأولى، تسمى اللعبة "الزوج"، في الثانية - "متعددة". قد يشكل المشاركون في لعبة متعددة من الائتلافات في الدورة التدريبية الدائمة أو المؤقتة. إذا كان هناك حائينان دائمان، فإن لعبة متعددة تعتمد على الزوج. أعظم أهمية عملية مقترنة. هنا سنقوم بتقييد أنفسنا للنظر في هذه الألعاب فقط.

دعنا نبدأ عرض النظرية الأولية للألعاب مع صياغة بعض المفاهيم الأساسية. سننظر في اللعبة المقترنة التي يشارك فيها لاعبان A و B مع المصالح المعاكسة. ضمن "لعبة" سنفهم الحدث الذي يتكون من عدد من تصرفات الأطراف A و V. من أجل التعرض لهذه اللعبة للتحليل الرياضي، يجب صياغة قواعد اللعبة بدقة. ضمن "قواعد اللعبة"، هناك نظام من الشروط التي تنظم الخيارات الممكنة لعمل الطرفين، مبلغ المعلومات لكل جانب من سلوك آخر، تسلسل التناوب "التحركات" (القرارات الفردية المتخذة في عملية اللعبة)، وكذلك النتيجة أو نتيجة اللعبة التي هذه مجموعة من التحركات. هذه النتيجة (الفوز أو الخسارة) لا تحتوي دائما على تعبير كمي، ولكن عادة ما يمكنك، وضع مقياس قياس معين، للتعبير عنه برقم معين. على سبيل المثال، في لعبة الشطرنج، يمكن أن يعزى الفوز مشروطا إلى +1 وخسارة -1 ورسم 0.

تسمى اللعبة اللعبة بمبلغ صفر، إذا فاز أحد اللاعبين بما يفقده الآخر، مجموع أرباح كلا الجانبين هو الصفر. في مبلغ الصفر، فإن مصالح اللاعبين عكسية مباشرة. هنا سننظر فقط في مثل هذه الألعاب.

منذ في اللعبة مع مبلغ صفر للفوز لأحد اللاعبين يساوي الآخر مقابل مألوفةمن الواضح، عند تحليل هذه اللعبة، يمكنك التفكير في الفوز فقط من اللاعبين فقط. فليكن، على سبيل المثال، لاعب أ. في المستقبل، نحن لراحة الجانب وسوف نقوم بالتقليد والاتصال ب "نحن"، والجانب في الخصم.

في الوقت نفسه، سيتم دائما اعتبار الجانب A ("نحن") دائما "فائز"، والجانب في ("الخصم") ك "خسارة". هذه الحالة الرسمية، من الواضح، لا تعني أي ميزة حقيقية للاعب الأول؛ من السهل أن نرى أنه يتم استبداله بالعكس إذا تم تغيير علامة الفوز إلى العكس.

تطوير اللعبة في الوقت المناسب سيتم تقديمه يتكون من عدد من المراحل المتتالية أو "التحركات". تسمى الحركة الموجودة في نظرية الألعاب اختيار أحد الخيارات التي توفرها قواعد الخيارات. تنقسم التحركات إلى شخصي وعشوائي. وتسمى خطوة شخصية خيارا واعيا أحد اللاعبين من أحد التحركات الممكنة في هذه الحالة وتنفيذها. مثال على خطوة شخصية - أي من التحركات في لعبة الشطرنج. إجراء خطوة أخرى، يقوم اللاعب بإجراء اختيار واع من أحد الخيارات الممكنة في موقع الشخصيات على اللوحة. يتم تنظيم مجموعة من الخيارات الممكنة لكل تقدم شخصي من خلال قواعد اللعبة وتعتمد على كامل مجمل التحركات السابقة لكلا الطرفين.

تسمى التقدم العشوائي الاختيار من عدد من الفرص، التي قامت بعدم اتخاذ قرار لاعب، ولكن من خلال أي آلية اختيار عشوائية (رمي العملات المعدنية، لعب العظام، Tastovka وتسليم الخرائط، إلخ). على سبيل المثال، تحتوي البطاقة الأولى مع أحد اللاعبين في الأفضلية على دورة عشوائية مع 32 خيارات التكافؤ. بالنسبة للعبة إلى أن تكون محددة رياضيا، تشير قواعد اللعبة إلى كل ضربة عرضية إلى توزيع احتمالات النتائج المحتملة.

يمكن أن تتكون بعض الألعاب فقط من التحركات العشوائية (ما يسمى المقامرة النقية) أو فقط من التحركات الشخصية (الشطرنج، لعبة الداما). معظم لعب الورق ينتمي إلى الألعاب نوع مختلطةوبعد يحتوي على كل من التحركات العشوائية والشخصية.

يتم تصنيف الألعاب ليس فقط بطبيعة التحركات (الشخصية، عشوائية)، ولكن أيضا بطبيعتها وكمية المعلومات المتاحة لكل لاعب فيما يتعلق بأفعال أخرى. الفئة الخاصة من الألعاب هي ما يسمى "الألعاب مع معلومات كاملة" تسمى اللعبة مع المعلومات الكاملة اللعبة التي يعرف فيها كل لاعب كل شخص نتائج جميع التحركات السابقة، الشخصية والعشوائية. يمكن أن تخدم أمثلة الألعاب الكاملة للمعلومات الشطرنج والرسومات، بالإضافة إلى اللعبة الشهيرة "Cross and Noliki".

لا تنتمي معظم الألعاب ذات الأهمية العملي إلى فئة الألعاب ذات المعلومات الكاملة، حيث عادة ما يكون الموحد حول تصرفات العدو عنصرا مهما في حالات الصراع.

واحدة من المفاهيم الأساسية لنظرية اللعبة هي مفهوم "الإستراتيجية". تسمى إستراتيجية اللاعب مجموعة من القواعد التي تحدد الاختيار بشكل لا لبس فيه مع كل تقدم شخصي لهذا اللاعب، اعتمادا على الوضع في عملية اللعبة. عادة، يتم أخذ الحل (الاختيار) لكل تقدم شخصي من قبل المشغل خلال اللعبة نفسها، اعتمادا على الوضع المحدد الحالي. ومع ذلك، لا يتغير نظريا، إذا أتصور أن جميع هذه القرارات مقبولة من قبل اللاعب مقدما. لهذا، سيضطر اللاعب إلى تقديم قائمة بجميع المواقف الممكنة في سياق اللعبة وتوفر لكل منها. من حيث المبدأ (إن لم يكن عمليا)، فمن الممكن لأي لعبة. إذا تم قبول نظام الحلول هذا، فسيتعني أن اللاعب قد اختار إستراتيجية محددة.

قد لا يشارك اللاعب الذي اختار الاستراتيجية الآن في اللعبة شخصيا، لكنه يحل محل مشاركته إلى قائمة القواعد التي ستطبق أي شخص غير مهتم (القاضي) بالنسبة له. يمكن أيضا طرح الاستراتيجية آلة آلة في شكل برنامج معين. هذا هو ما يتم تشغيله حاليا في EMM Chess. أن مفهوم "الاستراتيجية" المنطقي، فمن الضروري أن يكون في لعبة التحركات الشخصية؛ في الألعاب التي تتكون من خطوات عشوائية واحدة، لا توجد استراتيجيات.

اعتمادا على عدد الاستراتيجيات المحتملة، تنقسم اللعبة إلى "نهائي" و "لا نهاية لها". يطلق عليه النهائي اللعبة التي بها كل لاعب لديه سوى عدد محدود من الاستراتيجيات. اللعبة النهائية التي لدى اللاعب م. استراتيجيات، ولاعب في - ن. استراتيجيات تسمى لعبة MXN.

النظر في لعبة MXN لاعبين A و B ("نحن" و "الخصم"). سنشن استراتيجياتنا 1 و 2، ...، و M من استراتيجية العدو ب 1، 2، ...، في N. دع كل جانب اختار استراتيجية محددة؛ بالنسبة لنا، سيكون أنا، لأعلى B j. إذا كانت اللعبة تتألف فقط من التحركات الشخصية، فإن اختيار الاستراتيجيات A I، B J يحدد نتائج اللعبة - فوزنا. تشير إليه و IJ. إذا كانت اللعبة تحتوي، بالإضافة إلى التحركات الشخصية والعشوائية، فإن زوج الاستراتيجيات الفائز A I، B J هي قيمة عشوائية، اعتمادا على نتائج جميع التحركات العشوائية. في هذه الحالة، فإن التقدير الطبيعي للفصل المتوقع هو متوسط \u200b\u200bالقيمة ( القيمة المتوقعة). سنشير إلى نفس الإشارة كملابس نفسك (في اللعبة دون تحركات عشوائية) وقيمتها المتوسطة (في اللعبة مع تحركات عشوائية).

اسمحوا لنا أن نعرف قيم IJ للفوز (أو الفوز المتوسط) بكل زوج من الاستراتيجيات. يمكن كتابة القيم كجدول مستطيل (مصفوفة)، والسلاسل التي تتوافق مع استراتيجياتنا (A I)، والأعمدة - استراتيجيات العدو (B J). يسمى مثل هذا الجدول مصفوفة الدفع أو مجرد مصفوفة لعبة. يتم تقديم MXN Game Matrix في FIG. واحد.

تين. 1. Matric MXN.

اختصر أننا سنشن مصفوفة اللعبة ‖a ij ‖. النظر في العديد من الأمثلة الأولية للألعاب.

مثال 1. اثنين من اللاعبين أ، دون النظر إلى بعضهم البعض، وضعوا على الطاولة على عملة الشعار أو واسعة، حسب تقديرها. إذا اختار اللاعبون نفس الجانبين (في كل من الذراعين أو كل من الاندفاع)، فإن اللاعب يأخذ كلا من العملات المعدنية؛ خلاف ذلك، يأخذها لاعبهم لتحليل اللعبة وجعلها مصفوفة. قرار. تتكون اللعبة فقط من خطابين: حركنا ونقل العدو، شخصيا. اللعبة لا تنتمي إلى الألعاب ذات المعلومات الكاملة، لأن في وقت الدورة التدريبية التي يؤديها لاعبه لا يعرف ما فعله آخر. نظرا لأن كل من اللاعبين لديهم خطوة شخصية واحدة فقط، فإن استراتيجية اللاعب هي خيار في نفس الوقت.

لدينا استراتيجيتان: و 1 - اختيار معطف الأسلحة و 2 - لاختيار قرار؛ لدى الخصم نفس الاستراتيجيتين: في 1 - معطف من الأسلحة وفي 2 - الاندفاع. وبالتالي، هذه اللعبة هي 2 × 2 لعبة. سنفكر في عملات حبة ل +1. ألعاب مصفوفة:

على سبيل المثال هذه اللعبة، كما لو أنها ليست أولية، يمكنك فهم بعض الأفكار الأساسية لنظرية الألعاب. لنفترض أولا أن هذه اللعبة يتم تنفيذها مرة واحدة فقط. ثم، من الواضح أنه من غير المجدي التحدث عن أي "استراتيجيات" للاعبين، معقولين أكثر من غيرها. كل من اللاعبين الذين لديهم نفس القاعدة يمكن أن يأخذوا أي حل. ومع ذلك، عند تكرار اللعبة، يتغير الموقف.

في الواقع، نفترض أننا (لاعب أ) اختار نوعا من الاستراتيجية (دعنا نقول، و 1) والالتزام به. ثم، وفقا لنتائج التحركات القليلة الأولى، تخمين الخصم عن استراتيجيتنا وسوف تستجيب لها من الأقل مواتية بالنسبة لنا، I.E. اختيار قبضة. نحن غير مربون بوضوح أننا دائما تطبيق استراتيجية واحدة؛ حتى لا تكون في الخسارة، يجب أن نختار في بعض الأحيان معطف الأسلحة، وأحيانا - عقد. ومع ذلك، إذا استوعبنا معطف الأسلحة والضوج في تسلسل معين (على سبيل المثال، بعد واحد)، يمكن للعدو أيضا تخمين ذلك والاستجابة لهذه الاستراتيجية للأسوأ بالنسبة لنا. من الواضح أن الطريقة الآمنة التي تضمن أن العدو لن يعرف استراتيجيتنا، ستكون هناك مثل هذه منظمة الاختيار في كل مرة، عندما لا نعرف ذلك بنفسك (يمكن ضمان ذلك، على سبيل المثال، رمي عملة عملة). وبالتالي، نحن، من خلال التفكير البديهي، يتعامل مع أحد المفاهيم الأساسية لنظرية الألعاب - لمفهوم "استراتيجية مختلطة"، أي مثل استراتيجيات "نقية" - في هذه الحالة، 1 و 2 - بديل عن طريق الخطأ مع بعض الترددات. في هذا المثال، فإن اعتبارات التماثل واضحة مقدما أن الاستراتيجيات 1 و 2 ينبغي أن تكون بالتناوب مع نفس التردد؛ في الألعاب الأكثر تعقيدا، قد يكون القرار بعيدا عن تافهة.

مثال 2. اللاعبون A وفي كل من الأرقام الثلاثة بشكل مستقل عن بعضها البعض: 1 أو 2 أو 3. إذا كان مجموع الأرقام المكتوبة هو حتى في دفع هذا المبلغ في روبل؛ إذا كان غريبا، إذن، على العكس من ذلك، ودفع هذا المبلغ. مطلوب لتحليل اللعبة وجعلها مصفوفة.

قرار. تتكون اللعبة من خطين؛ كلاهما شخصي. (أ) ثلاثة استراتيجيات: 1 - الكتابة 1؛ و 2 - الكتابة 2؛ و 3 - اكتب 3. الخصم (ب) هو نفس الاستراتيجيات الثلاث. اللعبة هي لعبة 3 × 3:

من الواضح، كما هو الحال في الحالة السابقة، يمكن لعدو الخصم الذي اختاره الولايات المتحدة الإجابة على الأسوأ بالنسبة لنا. في الواقع، إذا اخترنا، على سبيل المثال، استراتيجية واحدة 1، سيستجيب العدو دائما لاستراتيجية في 2؛ في استراتيجية 2 - استراتيجية في 3؛ في استراتيجية استراتيجية 3 في 2؛ وبالتالي، فإن أي خيار من استراتيجية معينة سيقودنا حتما إلى الخسارة (غير ضروري، ومع ذلك، ننسى أن الخصم موجودا أيضا في نفس المؤامرة). سيعطى حل هذه اللعبة (أي مجموعة من أعلى استراتيجيات لكل من اللاعبين) في الفقرة 5.

مثال 3.لدينا ثلاثة أنواع من الأسلحة تحت تصرفنا: A 1، A 2، A 3؛ لدى الخصم ثلاثة أنواع من الطائرات: ب 1، 2، في 3. مهمتنا هي ضرب الطائرة؛ مهمة الخصم هي الحفاظ عليها لا تتأثر. عند تطبيق أرمينات A 1، تتأثر الطائرات B 1، B 2، في 3 من الاحتمالات 0.9، 0.4 و 0.2؛ في الخدمة مع 2 - مع الاحتمالات 0.3، 0.6 و 0.8؛ في التسلح و 3 - مع الاحتمالات 0.5، 0.7 و 0.2. مطلوب لصياغة الموقف من حيث نظرية الألعاب.

قرار. يمكن اعتبار الوضع بمثابة لعبة تبلغ 3 × 3 مع اثنين من التحركات الشخصية والعشوائية. خطوتنا الشخصية هي اختيار نوع الأسلحة؛ التحرك الشخصي للخصم - اختيار الطائرة للمشاركة في المعركة. خطوة عشوائية - استخدام الأسلحة؛ قد تنهي هذه الخطوة هزيمة الطائرات أو خلافها. فوزنا يساوي واحد إذا كانت الطائرة مندهشة، ومساوي صفر خلاف ذلك. استراتيجياتنا هي ثلاثة أسلحة؛ استراتيجيات العدو هي ثلاثة خيارات للطائرات. إن متوسط \u200b\u200bقيمة المكاسب لكل زوج محدد من الاستراتيجيات ليس سوى احتمال تلف هذه الطائرة بهذا السلاح. ألعاب مصفوفة:

الغرض من نظرية الألعاب هو تطوير توصيات ل سلوك معقول اللاعبين ب. حالات الصراعوبعد تعريف "الاستراتيجية المثلى" لكل منها. تسمى إستراتيجية اللاعب المثلى في نظرية الألعاب هذه الاستراتيجية التي توفر هذه الاستراتيجية، مع التكرار المتكرر للعبة، هذا اللاعب بأعلى متوسط \u200b\u200bأرباح (أو الحد الأدنى من متوسط \u200b\u200bالخسارة المحتملة). عند اختيار هذه الاستراتيجية، فإن أساس المنطق هو افتراض أن العدو هو معقول على الأقل لأننا أنفسنا، ويفعل كل شيء من أجل منعنا من تحقيق هدفهم.

في نظرية الألعاب، يتم إنشاء جميع التوصيات، بناء على هذه المبادئ؛ لذلك، فإنه لا يأخذ في الاعتبار عناصر المخاطر، الموجودة حتما في كل استراتيجية حقيقية، وكذلك سوء تقدير وأخطاء من كل من اللاعبين. نظرية اللعبة مثل الجميع نموذج رياضي ظاهرة معقدة لديها قيود لها. الأهم من ذلك هو أن المكاسب تقلص بشكل مصطنع إلى واحد رقم واحدوبعد في معظم حالات الصراع العملي، عند تطوير استراتيجية معقولة، من الضروري أن تأخذ في الاعتبار وليس واحدة، ولكن العديد من المعلمات العددية - معايير نجاح الحدث. لن تكون الإستراتيجية التي هي معيار واحد مثالي بالضرورة الأمثل على الآخرين. ومع ذلك، وعيا لهذه القيود، وبالتالي، دون الالتزام بالتوصيات العمياء التي تلقتها أساليب اللعبة، فمن الممكن أن لا تزال تستخدم بشكل معقول الجهاز الرياضي لنظرية اللعبة لتطوير إن لم يكن بالضبط "الأمثل"، ثم، في أي حال " استراتيجية مقبولة ".

§ 2. لعبة أقل وأعلى الأسعار. مبدأ "Minimax"

النظر في لعبة MXN مع مصفوفة، كما هو الحال في الشكل. 1. سنشن الرسالة الأولى عدد استراتيجيتنا؛ الحرف J هو رقم استراتيجية العدو. سنقوم مهمة مهمة: لتحديد استراتيجيتك الأمثل. نحن نحلل باستمرار كل من استراتيجياتنا، بدءا من 1.

من خلال اختيار استراتيجية أ I، يجب أن نعول دائما على حقيقة أن العدو سيستجيب له في ذلك الاستراتيجيات في J، التي تكون بها أرباحنا و IJ ضئيلة. نحدد هذه القيمة المكثف، أي الحد الأدنى من الأرقام و IJ في أنا.خط. تشير إلى α i:

هنا يشار إلى علامة دقيقة (الحد الأدنى من J) بحد أدنى قيم هذه المعلمة لجميع J. صد الأرقام α I؛ بجانب المصفوفة على اليمين في شكل عمود إضافي:

عن طريق اختيار أي استراتيجية أ، يجب أن نتوقع ذلك نتيجة لأعمال معقولة للعدو، لن نقوم بفوزنا أكثر من α i. بطبيعة الحال، تتصرف الأكثر حذرا وعدد العدو الأكثر معقولة (أي تجنب أي خطر)، يجب علينا أن نستفيد في تلك الاستراتيجية التي يكون لها عدد α i الحد الأقصى. تشير إلى هذه القيمة القصوى α:

أو مع الأخذ في الاعتبار الصيغة (2.1)،

يطلق على قيمة α السعر القاع من اللعبة، وإلا - الحد الأقصى للفصائل أو ماكسيما ببساطة. الأكذب رقم α في خط معين من المصفوفة؛ تسمى تلك الإستراتيجية لاعب A، التي تتوافق مع هذا الخط، استراتيجية أقصى حد. من الواضح، إذا ارتلمنا الحد الأقصى للاستراتيجية، إذن، مع أي سلوك عدو، فإن المكاسب مضمونة، على أي حال، ليس أقل α. لذلك، فإن قيمة α وتسمى "السعر السفلي للعبة". هذا هو الحد الأدنى المضمون الذي يمكننا أن نقدمه لأنفسهم، والالتزام بأكثر من استراتيجية "إعادة التأمين" الأكثر حذرا.

من الواضح أن التفكير المماثل يمكن تنفيذه للعدو الخامس. لأن العدو مهتم بدفع أرباحنا بحد أدنى، يجب عليه عرض كل استراتيجية من حيث أقصى فوز مع هذه الاستراتيجية. لذلك، في أسفل المصفوفة، نقوم بإعادة صد القيم القصوى لكل عمود:

وابحث عن الحد الأدنى من β J:

تسمى قيمة β السعر العلوي للعبة، وإلا - "minimax". تسمى إستراتيجية MiniMax المقابلة للعدو "استراتيجية Minimax". بعد الالتزام باستراتيجية MiniMax الأكثر حذرا، يضمن العدو نفسه ما يلي: كل ما أخذناه ضده، فسيخسره المبلغ غير أكبر من β. غالبا ما يشار إلى مبدأ الحذر، الإملاء اللاعبين في اختيار الاستراتيجيات ذات الصلة (الحد الأقصى والثني)، في نظرية الألعاب وتطبيقاتها إلى "مبدأ Minimax". تشير معظم استراتيجيات الأقصى والحد الأدنى للاعبين في بعض الأحيان مصطلح عام "استراتيجيات Minimax".

كأمثلة، نحدد السعر الأدنى والأعالي من استراتيجيات اللعبة و MiniMax للأمثلة 1 و 2 و 3 § 1.

مثال 1.في سبيل المثال 1 § 1 لعبة دانا مع المصفوفة التالية:

نظرا لأن قيم α I و β J ثابتة ومتساوية، على التوالي، -1 و +1، فإن السعر الأدنى والأعلى من اللعبة يساوي أيضا -1 و +1: α \u003d -1، β \u003d + 1. أي استراتيجية لاعب هي Maximin لها، وأي إستراتيجية لاعب هي استراتيجية MiniMax الخاصة بها. انسحاب Trivilen: الالتزام بأي من استراتيجياته، لاعب ويمكن أن يضمن أنه لن يفقد أكثر من 1؛ نفس الشيء يمكن أن يضمن اللاعب الخامس

مثال 2. في المثال 2 § 1 لعبة دانا مع مصفوفة:

انخفاض سعر اللعبة α \u003d -3؛ أفضل الأسعار لعبة β \u003d 4. استراتيجية ماكسيمين لدينا هي 1؛ تطبيقه بشكل منهجي، يمكننا الاعتماد بقوة على عدم الفوز على الأقل -3 (لا تفقد أكثر من 3). استراتيجية Minimax للعدو هي أي من الاستراتيجيات في 1 وفي 2؛ تطبيقها بشكل منهجي، هو، في أي حال، يمكن أن يضمن أنه لن يفقد أكثر من 4. إذا تراجعنا من استراتيجية مكسيمين (على سبيل المثال، اختر استراتيجية A 2)، يمكن للعدو "معاقبة" لهذا من خلال تطبيق استراتيجية إلى 3 وتقليل أرباحنا إلى -5؛ على قدم المساواة، فإن اضطهاد العدو من استراتيجيتها Minimax يمكن أن يزيد من خسارته إلى 6.

مثال 3.في المثال 3 § 1 لعبة دانا مع مصفوفة:

انخفاض سعر اللعبة α \u003d 0.3؛ أعلى قيمة الألعاب β \u003d 0.7. استراتيجيتنا الأكثر حذرا (الحد الأقصى) هي 2؛ باستخدام التسلح A 2، نحن نضمن أننا سنؤثر على الطائرات في المتوسط \u200b\u200bدون أقل من 0.3 من جميع الحالات. الاستراتيجية الأكثر حذرا (Minimax) للعدو في 2؛ تطبيق هذه الطائرة، يمكن أن يكون العدو متأكدا من أن الأمر سوف يتأثر بأكثر من 0.7 كل الحالات.

على سبيل المثال الأخير، من المناسب إظهار واحد الممتلكات المهمة استراتيجيات Minimax هي عدم استقرارها. دعنا نطبق استراتيجيتنا الأكثر حذرا (الحد الأقصى) A 2، والعدو هو استراتيجيةها الأكثر حذرا (MINIMAX) في 2. طالما أن كلا الأعداء يلتزمون هذه الاستراتيجيات، فإن الفوز المتوسط \u200b\u200bهو 0.6؛ إنه أطول، ولكن أقل من لعبة أفضل الأسعار. الآن دعونا نقول أن العدو أصبح معروفا أننا نطبق استراتيجية A 2؛ سوف يستجيب على الفور لاستراتيجيتها في 1 وسيعطي فوزا لمدة 0.3. بدوره، على الإستراتيجية B 1 لدينا إجابة جيدة: الإستراتيجية A 1، مما يتيح لنا فوز 0.9، إلخ.

وبالتالي، فإن الموقف الذي يتمتع به كلا اللاعبين يستمتعون باستراتيجياتهم في الحد الأدنى غير مستقر ويمكن أن ينتهك المعلومات حول استراتيجية خصم الخصم. ومع ذلك، هناك بعض الألعاب التي تكون استراتيجيات minimax مستدامة. هذه هي هذه الألعاب التي يساوي السعر أقل من الأعلى: α \u003d β. إذا كان السعر الساعم للعبة يساوي القمة، فإن قيمتها الشائعة تسمى سعر نظيف للعبة (أحيانا فقط سعر اللعبة)، وسوف نشير إليها بالحرف ν.

النظر في مثال. دع اللعبة 4 × 4 تم تعيينها بواسطة المصفوفة:

العثور على سعر أقل من اللعبة: α \u003d 0.6. العثور على أعلى سعر اللعبة: β \u003d 0.6. لقد كانت هي نفسها، لذلك، تتمتع اللعبة بسعر نقي يساوي α \u003d β \u003d ν \u003d 0.6. العنصر 0.6، المميز في مصفوفة الدفع، هو الحد الأدنى في الوقت نفسه في صفها والحد الأقصى في عموده. في الهندسة، تسمى النقطة الموجودة على السطح بممتلكات مماثلة (الحد الأدنى المتزامن على إحداثيات واحدة والحد الأقصى على الآخر) نقطة السرج، عن طريق القياس، ينطبق هذا المصطلح في نظرية الألعاب. يسمى عنصر مصفوفة مع هذه الخاصية نقطة السرج للمصفوفة، وعن اللعبة يقولون أنه لديه نقطة السرج.

تتوافق نقطة السرج مع زوج من استراتيجيات Minimax (في هذا المثال و 3 وفي 2). تسمى هذه الاستراتيجيات الأمثل، ومجموعتها هي حل اللعبة. قرار اللعبة لديه الممتلكات الرائعة التالية. إذا كان أحد اللاعبين (على سبيل المثال، أ) يلتزمون استراتيجيتها المثلى، وستنحرف لاعب آخر (ج) بأي شكل من الأشكال للانحراف عن استراتيجيتها المثلى، ثم لاعب قدم انحرافا، لا يمكن أن يكون مفيدا أبدا مثل هذا الرفض للاعب يمكن في أحسن الأحوال ترك الأرباح دون تغيير، وفي أسوأ الحالات - زيادة ذلك. على العكس من ذلك، إذا كان في استراتيجيته المثلى، ولكن ينحرف عن نفسه، فإن هذا لا يمكن أن يكون مفيدا ل A.

هذا البيان سهل التحقق من مثال اللعبة قيد النظر مع نقطة السرج. نرى أنه في حالة لعبة مع نقطة السرج، تتمتع استراتيجيات MiniMax ب "استقرار" غريبة: إذا ارتدي جانب واحد إلى استراتيجية MiniMax الخاصة به، فيمكن أن تنحرف فقط إلى الآخر فقط. لاحظ أنه في هذه الحالة وجود أي معلومات لاعب أن العدو اختار استراتيجيته المثلى لا يمكنه تغيير سلوك اللاعب الخاص: إذا كان لا يريد التصرف ضد مصالحه الخاصة، يجب أن يلتزم باستراتيجيته الأمثل. إن زوج الاستراتيجيات المثلى في اللعبة مع نقطة السرج هو كما كان عليه، كما كان، "موقف التوازن": أي انحراف من الاستراتيجية المثلى يؤدي لاعب منحرف للآثار غير المواتية التي فرضها على العودة إلى موقعها الأصلي وبعد

لذلك، لكل لعبة مع نقطة السرج هناك حل يحدد بضع استراتيجيات مثالية لكلا الطرفين، والتي تتميز بالخصائص التالية.

1) إذا انضم كلا الجانبين إلى استراتيجياتهم المثلى، فإن الفوز المتوسط \u200b\u200bيساوي سعر صافي اللعبة ν، وهو سعره السفلي والعلوي.

2) إذا كان أحد الأطراف يحمل إستراتيجيته الأمثل، والآخر ينحرف عن نفسه، فإن الجانب المنحرف لا يمكن إلا أن تخسره وفي أي حال يمكن أن يزيد من مكاسبه.

فئة الألعاب التي لها نقطة السرج هي فائدة كبيرة على حد سواء مع النظرية ومن وجهة نظر عملية. من الناحية النظرية للألعاب، ثبت أنه على وجه الخصوص، فإن كل لعبة مع معلومات كاملة لها نقطة السرج، وبالتالي، فإن كل لعبة مثل هذه اللعبة لها حل، أي هناك زوج من الاستراتيجيات المثلى من ناحية أخرى، مما يعطي زيادة مكاسب تساوي اللعبة. إذا كانت اللعبة ذات المعلومات الكاملة تتألف فقط من التحركات الشخصية، فمن عند تطبيق كل جانب من إستراتيجيتها المثلى، يجب أن تتصل دائما بنتيجة معينة تماما، وهي أرباحا، بسعر متساو تماما للعبة.

كمثال على اللعبة مع المعلومات الكاملة هنا لعبة الشهيرة مع وضع العملات المعدنية على طاوله دائريه الشكلوبعد اثنين من اللاعبين بالتناوب وضع نفس العملات المعدنية على المائدة المستديرة، واختيار كل مرة موقف تعسفي من مركز العملة؛ لا يسمح بالغطاء المتبادل للعملات المعدنية. يفوز أحد اللاعبين الذين سيضعون العملة الأخيرة (عندما لا توجد أماكن للآخرين). من الواضح أن نتائج هذه اللعبة محددة سلفا دائما، وهناك استراتيجية محددة تماما توفر مكسبا موثوقا به من اللاعبين الذين وضعوا العملة الأولى. وهي أنه يجب عليه أولا وضع العملة المعدنية في وسط الطاولة، ثم في كل خطوة من خطوة العدو للرد بنقل متماثل. في الوقت نفسه، يمكن للاعب الثاني أن يتصرف بأي شيء، دون تغيير النتيجة المحددة مسبقا للعبة. لذلك، فإن هذه اللعبة منطقية فقط للاعبين الذين لا يعرفون الاستراتيجية المثلى. يشبه الوضع الشطرنج وغيرها من الألعاب مع المعلومات الكاملة؛ تحتوي أي لعبة على نقطة سرج وحل يشير إلى كل من اللاعبين الإستراتيجية المثلى؛ لم يتم العثور على قررة لعبة الشطرنج فقط لأن عدد مجموعات التحركات الممكنة في الشطرنج كبيرة جدا حتى تتمكن من بناء مصفوفة الدفع وإيجاد نقطة السرج فيه.

§ 3. استراتيجيات نظيفة ومختلطة. حل اللعبة في الاستراتيجيات المختلطة

من بين الألعاب النهائية ذات أهمية عملية، هناك ألعاب نادرة نسبيا مع نقطة السرج؛ أكثر نموذجية هي الحالة عندما يكون السعر السفلي والأعلى من اللعبة مختلفة. خلص مصفوفة هذه الألعاب، خلصنا إلى أنه إذا تم إعطاء كل لاعب اختيار استراتيجية واحدة، فيجب تحديد هذا الاختيار من خلال مبدأ الميكانيك في كل لاعب. التمسك باستراتيجيتها في الحد الأقصى، في أي سلوك من العدو ضمان كأس عن كأس المساواة في انخفاض سعر اللعبة α. هناك سؤال طبيعي: سؤال طبيعي: ما إذا كان من المستحيل ضمان نفسه متوسط \u200b\u200bالمكاسب، وزيادة α، إذا كنت لا تطبق استراتيجية واحدة واحدة "نظيفة"، والبيلة من الاستراتيجيات عشوائيا عدة استراتيجيات؟ هذه الاستراتيجيات المشتركة التي تتكون في تطبيق العديد من الاستراتيجيات الخالصة بالتناوب من قبل قانون عشوائي مع نسبة تردد معينة في نظرية الألعاب تسمى الاستراتيجيات المختلطة.

من الواضح أن كل استراتيجية صافية هي مناسبة خاصة مختلطة، والتي تستخدم فيها جميع الاستراتيجيات، باستثناء واحدة، مع ترددات صفرية، وهذا - بتردد 1. اتضح أنه لا ينظف فقط، ولكن أيضا استراتيجيات مختلطة، أنت أيضا يمكن الحصول على قرار كل نهاية اللعبة، أي بضع استراتيجيات (بشكل عام، مختلط) استراتيجيات عند تطبيقها على كلا اللاعبين، ستكون المكاسب تساوي سعر اللعبة، ومع أي انحراف من جانب واحد من الاستراتيجية المثلى، لا يمكن تغيير المكاسب فقط إلى الجانب، غير المربح للانحراف.

تم تقديم الموافقة هو محتوى ما يسمى نخري الأساسي لنظرية الألعاب. أثبت هذا النظري لأول مرة من قبل خلفية نيومانان في عام 1928، الأدلة المعروفة على نظرية نظرية نسبيا؛ لذلك، نحن نعطي صياغة فقط.

كل لعبة أخيرة لديها حل واحد على الأقل (ربما في مجال الاستراتيجيات المختلطة).

المكاسب التي تم الحصول عليها نتيجة للحل تسمى سعر اللعبة. من النظرية الرئيسية، يتبع أن كل لعبة أخيرة لديها سعر. من الواضح أن سعر اللعبة ν يكمن دائما بين سعر أقل لعبة α والسعر العلوي للعبة β:

(3.1) α ≤ ν ≤ β

في الواقع، α هو كسب كحد أقصى مضمون، والتي يمكننا تقديمها لنفسك، وتطبيق استراتيجياتك الخالصة فقط. نظرا لأن الاستراتيجيات المختلطة تشمل كحالة خاصة وكلها نظيفة، فإن السماح، باستثناء استراتيجيات مختلفة، أيضا، ونحن، في أي حال، لا تفاقم قدراتهم؛ وبالتالي، ν ≥ α. وبالمثل، بالنظر إلى إمكانيات العدو، سنظهر أن ν ≤ β، والتي يجب أن تكون فيها عدم المساواة دليلا (3.1).

نقدم تسمية خاصة للاستراتيجيات المختلطة. على سبيل المثال، على سبيل المثال، تتكون استراتيجيتنا المختلطة في تطبيق استراتيجيات A 1، A 2 و 3 مع ترددات P 1، P 2، P 3، مع P 1 + P 2 + P 3 \u003d 1، سنشن هذه الاستراتيجية

وبالمثل، سيتم الإشارة إلى استراتيجية العدو المختلطة:

حيث س 1، س 2، س 3 - الترددات التي تكون فيها الاستراتيجيات ب 1، في 2، في 3 مختلطة؛ س 1 + Q 2 + Q 3 \u003d 1.

لنفترض أننا وجدنا حلا للعبة التي تتكون من استراتيجيتين مثبتين مثبتين S A *، S B *. بشكل عام، لا يتم تضمين جميع الاستراتيجيات النقية المتاحة لهذا اللاعب في استراتيجيتها المختلطة المثلى، وبعضها فقط. سنقوم باستدعاء الاستراتيجيات المدرجة في استراتيجية اللاعب المختلط الأمثل، واستراتيجياتها "المفيدة". اتضح أن قرار اللعبة لديه عقار رائع آخر: إذا كان أحد اللاعبين يحملون استراتيجية SA * المختلطة الأمثل (SB *)، فستظل الفوز دون تغيير ومساوي لسعر اللعبة ν، بغض النظر عن ما لاعب آخر يفعل، إن لم يكن فقط يتجاوز استراتيجيات "مفيدة". على سبيل المثال، يمكن استخدام أي من استراتيجياتها "المفيدة" في شكلها النقي، ويمكن أن تختلطها أيضا في أي أبعاد.

§ 4. الأساليب الأولية لحل الألعاب. العاب 2.عاشر2 و 2.عاشرن.

إذا لم يكن لدى لعبة MXN نقطة السرج، فإن العثور على حل هو عموما مهمة صعبة إلى حد ما، خاصة مع حجم M و N كبير. في بعض الأحيان تكون هذه المهمة من الممكن أن تبسط، إذا قلت أولا عدد الاستراتيجيات عن طريق عبور بعض غير الضرورية. الاستراتيجيات غير الضرورية هي) مكررة و B) غير مربحة بوضوح. النظر، على سبيل المثال، اللعبة مع المصفوفة:

من السهل التأكد من أن الإستراتيجية A 3 تكرر بالضبط ("التكرارات") استراتيجية واحدة 1، لذلك يمكن حذف أي من هاتين الاستراتيجيتين. علاوة على ذلك، مقارنة الأسطر A 1 و A 2، نرى أن كل عنصر من السلسلة A 2 أقل (أو متساوية) من العنصر المقابل في السلسلة A 1. من الواضح أنه لا ينبغي لنا أبدا استخدام استراتيجية A2، من الواضح أنه من الواضح. رسم 3 و 2، جلب المصفوفة إلى أكثر بساطةوبعد بعد ذلك، نلاحظ أنه بالنسبة للعدو، الاستراتيجية في 3 غير مربحة عن علم؛ بعد رسمها، أحضر المصفوفة إلى النموذج النهائي:

وبالتالي، يتم تخفيض اللعبة 4 × 4 من خلال عبور استراتيجيات مكررة وغير مربحة عن قصد إلى اللعبة 2 × 3.

يجب أن تسبق إجراءات الإفراط في التكرار والاستراتيجيات غير المواتية بشكل مخيف قرار اللعبة دائما. أهم حالات الألعاب النهائية التي يمكن أن تحل الطرق الأولية دائما هي ألعاب 2 × 2 و 2xn.

النظر في اللعبة 2 × 2 مع مصفوفة:

يمكن أن تلبي حالتان هنا: 1) اللعبة لديها نقطة السرج؛ 2) اللعبة لا تملك نقطة السرج. في الحالة الأولى، الحل واضح: هذا هو زوج من الاستراتيجيات تتقاطع في نقطة السرج. ملاحظة بالمناسبة، أنه في اللعبة 2 × 2، فإن وجود نقطة السرج يتوافق دائما مع وجود استراتيجيات غير مواتية من الواضح يجب حذفها في التحليل الأولية.

دع نقطة السرج، وبالتالي، فإن السعر الأقل من اللعبة لا يساوي الجزء العلوي: α ≠ β. مطلوب للعثور على استراتيجية اللاعب المختلط الأمثل A:

تتميز بممتلكات ذلك، ما هي أفعال العدو (إذا لم تتجاوز فقط استراتيجيات "مفيدة")، فإن الفوز سيكون مساويا لسعر اللعبة ν. في اللعبة 2 × 2، كلا استراتيجيات العدو "مفيدة"، - وإلا فإن اللعبة ستكون لها حل في مجال الاستراتيجيات الخالصة (نقطة السرج). وهذا يعني أنه إذا ارتزمنا استراتيجيتنا الأمثل (4.1)، فيمكن للعدو استخدام أي من استراتيجياتها الخالصة B 1، في 2، دون تغيير متوسط \u200b\u200bالفوز ν. من هنا لدينا اثنين من المعادلات:

منها، مع الأخذ في الاعتبار أن P 1 + P 2 \u003d 1، نحصل على:

تم العثور على سعر اللعبة ν من خلال استبدال قيم P 1، P 2 إلى أي من المعادلات (4.2).

إذا كانت اللعبة معروفة، ثم تحديد استراتيجية العدو الأمثل

هناك معادلة كافية، على سبيل المثال:

من أين، بالنظر إلى أن Q 1 + Q 2 \u003d 1، لدينا:

مثال 1. نجد حل اللعبة 2 × 2، يعتبر في المثال 1. 1، مع المصفوفة:

اللعبة لا تحتوي على نقطة سرج (α \u003d -1؛ β \u003d +1)، وبالتالي، يجب أن يكمن الحل في مجال الاستراتيجيات المختلطة:

من الضروري العثور على P 1، P 2 و Q 1 و Q 2. ل P 1 لدينا معادلة

1 * p 1 + (-1) (1 - p 1) \u003d (-1) ص 1 + 1 (1 - ص 1)

من حيث P 1 \u003d 1/2، ص 2 \u003d 1/2.

وبالمثل، نجد: Q 1 \u003d 1/2، Q 2 \u003d 1/2، ν \u003d 0.

وبالتالي، فإن الاستراتيجية المثلى لكل من اللاعبين هي بالتناوب بشكل عشوائي استراتيجياتها الصافية، باستخدام نفسها في كثير من الأحيان كل منها؛ في هذه الحالة، سيكون متوسط \u200b\u200bأرباحا صفرية.

كان الناتج الناتج واضحا جدا مقدما. في المثال التالي، سننظر إلى أكثر لعبة معقدة، الحل الذي ليس واضحا جدا. مثال على ذلك هو عينة ابتدائية من الألعاب المعروفة باسم الألعاب مع "الخداع" أو "مضللة". في الممارسة العملية، غالبا ما تنطبق حالات الصراع طرق مختلفة يتم تخفيف إدخال العدو (تضليل، محاذاة الأغراض الخاطئة، إلخ). مثال على الرغم من بساطته، مفيدة للغاية.

مثال 2. تتكون اللعبة بعد ذلك. هناك بطاقتان: الآس ومرتين. لاعب وعند عشوائي يأخذ أحدهم؛ لا يرى ما أخرجه. إذا أخذت الآس، فإنه يعلن: "لدي ACE،" ويتطلب خصم 1 روبل. إذا أخذت مؤشرا، فيمكنه إما 1) يقول "لدي ACE" والطلب من العدو 1 روبل، أو 2) للاعتراف بأن لديه مرتين، ودفع العدو 1 روبل.

العدو، إذا دفع طوعا 1 روبل، يمكن أن يأخذها فقط. إذا احتاج إلى 1 روبل، فيمكنه إما في 1) أن نصدق اللاعب، لكن لديه توز، ومنحه 1 روبل، أو في 2) للمطالبة بالتحقق من أجل التأكد من ما إذا كان بيان A. صحيح أنه نتيجة لذلك، سوف تتحول الشيكات إلى أنك حقا ACE، في يجب أن تدفع 2 روبل. إذا اتضح أنه يخدع ولاعب مرتين ودفع اللاعب في 2 روبل. مطلوب لتحليل اللعبة والعثور على الإستراتيجية المثلى لكل من اللاعبين.

قرار. اللعبة لديها هيكل معقد نسبيا؛ يتكون من خطوة عشوائية إلزامية واحدة - اختيار لاعب وواحد من بطاقتين - واثنين من التحركات الشخصية، والتي، ومع ذلك، لا تنفذ بالضرورة. في الواقع، إذا أخذت ACE، فهو لا يقدم أي خطوة شخصية: لقد حصل على إمكانية واحدة فقط - الطلب على روبل واحد، وهو ما يفعله. في هذه الحالة، خطوة شخصية - للاعتقاد أو عدم الاعتقاد بها (أي الدفع أو عدم الدفع 1 روبل،) - يتم إرسالها بواسطة اللاعب V. إذا كان، نتيجة لنقل عشوائي الأول، تلقى مرتين، ثم يتم تزويد بنقل شخصي: لدفع 1 روبل أو محاولة خداع العدو والطلب 1 روبل (باختصار: "لا تخدع" أو "خداع"). إذا واختر الأول، ثم لا يزال فقط لاتخاذ 1 روبل؛ إذا اخترت الثانية، فسيتم تزويد المشغل بنقل شخصي: للاعتقاد به أم لا تصدق (أي روبل أو يتطلب التحقق).

تعد استراتيجيات كل من اللاعبين القواعد التي تشير إلى كيفية إدخال المشغل عندما يتم تزويده بنقل شخصي. من الواضح أن استراتيجيتين فقط: و 1 - خداع و 2 - عدم الخداع. في ب - أيضا استراتيجيتان: ب 1 - الاعتقاد في 2 - عدم الاعتقاد. بناء مصفوفة لعبة. لهذا، نحسب متوسط \u200b\u200bالأرباح في كل مجموعة من الاستراتيجيات.

1. 1 في 1 (والخداع، في الاعتقاد). إذا حصلت على ACE (احتمالية هذا، فلا تمنح خطوة شخصية؛ يتطلب 1 روبل، واللاعب يعتقده؛ الأرباح وفي روبل يساوي 1. إذا حصل على اثنين (احتمال ذلك كذلك)، فهو يخدع وفقا لاستراتيجيته ويتطلب 1 روبل؛ يؤمن به ويدفع؛ المكاسب وتساوى أيضا 1. متوسط \u200b\u200bالأرباح: 11 \u003d * 1 + 1 \u003d 1 \u003d 1.

2. 1 في 2 (والخداع، لا يعتقد ذلك). إذا حصلت على الآس، فلن يكون لديه خطوة شخصية؛ يتطلب 1 روبل؛ وفقا لاستراتيجيته، فإنه لا يؤمن ونتيجة للتفتيش يدفع 2 روبل (الأرباح A +2). إذا حصلت على اثنين، فإنه يتطلب 1 روبل وفقا لاستراتيجيته؛ في، وفقا له، فإنه لا يؤمن؛ نتيجة لذلك، يدفع 2 روبل (أرباحا يساوي -2). الفوز المتوسط \u200b\u200bيساوي: 12 \u003d ½ * (+ 2) + ½ * (- 2) \u003d 0.

3. 2 في 1 (وليس الخداع، يؤمن). إذا أخرجت الآس، فإنه يتطلب 1 روبل؛ وفقا لاستراتيجيته، يدفع؛ الفوز A +1. إذا أخذت مرتين، فهو يدفع 1 روبل وفقا لاستراتيجيته؛ لا يزال فقط قبول (الفوز A يساوي -1). متوسط \u200b\u200bالمكاسب هي: 21 \u003d ½ * (+ 1) + ½ * (- 1) \u003d 0.

4. و 2 في 2 (وليس الخداع، B لا يصدق). إذا أخرجت الآس، فإنه يتطلب 1 روبل؛ في الشيكات وعلى نتيجة التحقق، يدفع 2 روبل (الفوز +2). إذا أخذت مرتين، فإنه يدفع 1 روبل؛ يبقى فقط قبول (الفوز 1). الفوز المتوسط \u200b\u200bيساوي: 22 \u003d ½ * (+ 2) + ½ * (- 1) \u003d.

بناء مصفوفة اللعبة:

المصفوفة لا تملك نقطة السرج. انخفاض سعر اللعبة α \u003d 0، أعلى سعر اللعبة β \u003d. ابحث عن حل للعبة في مجال الاستراتيجيات المختلطة. باستخدام الفورمولا (4.3)، نحصل على:

أولئك. يجب على اللاعب A في ثلث جميع الحالات استخدام إستراتيجيته الأولى (خداع)، وفي ثلثي - الثاني (وليس الخدع). في الوقت نفسه، سيفوز في متوسط \u200b\u200bسعر اللعبة ν \u003d 1/3.

تشير قيمة ν \u003d 1/3 إلى أن اللعبة مفيدة في هذه الشروط مفيدة ل B. باستخدام استراتيجيتها المثلى، ويمكنها دائما توفير مكاسب متوسطة إيجابية. لاحظ أنه إذا كنت قد استخدمت استراتيجيتي الأكثر حذرا (في هذه الحالة، فستكون كلا الاستراتيجيتين ألف 1 و 2 أقصى قدر من الاستراتيجية)، فسيكون لها متوسط \u200b\u200bمكاسب يساوي صفر. وبالتالي، فإن استخدام استراتيجية مختلطة يعطي والقدرة على تحقيق مصلحتها أكثر من ب، والذي يحدث أثناء قواعد البيانات للعبة.

نحدد الإستراتيجية المثلى V. نحن: Q 1 * 1 + Q 2 * 0 \u003d 1/3، Q 1 \u003d 1/3، Q 2 \u003d 2/3. من عند

tE. يجب أن يؤمن اللاعب في ثلث جميع الحالات، ودفعها 1 روبل دون فحص، وفي ثلثي الحالات - تحقق. ثم سيكون في المتوسط \u200b\u200bلكل لعبة تفقد 1/3. إذا استخدم استراتيجيته الخالصة ل Minimax ل 2 (لا تصدق)، فسوف يخسر كل لعبة في المتوسط \u200b\u200b1/2.

حل اللعبة 2 × 2 يمكن إعطاء تفسير هندسي بسيط. دع هناك 2 × 2 مع مصفوفة

خذ قسم ABSCISSA AXIS 1 (الشكل 4.1). ستصور الطرف الأيسر من القسم (النقطة مع ABSCISSA X \u003d 0) الإستراتيجية A 1؛ الطرف الأيمن من الموقع (x \u003d 1) هو استراتيجية A 2. قطع من خلال نقاط 1 و 2 2 عموديا إلى محور الأبقاس: المحور أنا.-أنا. ومحور II-II.وبعد على محور أنا.-أنا. سنقوم بتأجيل المكاسب عند الاستراتيجية 1؛ على محور II-II. - طرق مع الاستراتيجية A 2. النظر في استراتيجية العدو ب 1؛ إنه يعطي نقطتين على المحاور أنا.-أنا. و II-II. مع مرسوم، على التوالي، و 11 و 21. سنقضي مباشرة ب 1 B 1 من خلال هذه النقاط. من الواضح، إذا كنا، مع استراتيجية العدو ب 1، سنقوم بتطبيق استراتيجية مختلطة

ثم يصور متوسط \u200b\u200bأرباحنا المتساوي في هذه الحالة A 11 P 1 + A 21 P 2 بنقطة م على خط في 1 ب 1؛ ABSCISSA من هذه النقطة يساوي P 2. سيتم تكريس الدخول المباشر في 1 في 1، تصور المكاسب الاستراتيجية في 1، لاستدعاء "الاستراتيجية في 1".

من الواضح أن استراتيجية في 2 يمكن بناؤها بنفس الطريقة بالضبط (الشكل 4.2).

نحتاج إلى إيجاد الاستراتيجية المثلى S A *، I.E.، من هذا القبيل، سيتم دفع الحد الأدنى للفوز (مع أي سلوك ب) إلى الحد الأقصى. للقيام بذلك، نبني الحد الأدنى من المكاسب قيد الاستراتيجيات في 1، في 2، أي كسر B 1 NB 2 ملحوظ في الشكل. 4.2 خط الدهون. ستعبر هذا الحد الأدنى من الحد الأدنى للاعب الفوز بأي استراتيجيات مختلطة؛ Point N، حيث يصل هذا الحد الأدنى إلى أرباح الحد الأقصى، وتحديد حل وسعر اللعبة. من السهل التأكد من أن تنسيق النقطة ن هو سعر اللعبة ν، والفجل الخارجي يساوي P 2 - وتيرة تطبيق الاستراتيجية A 2 في الإستراتيجية المختلطة المثالية S A *.

في حالتنا، تم تحديد محلول اللعبة بنقطة تقاطع الاستراتيجيات. ومع ذلك، لن يكون هذا دائما كذلك؛ في التين. 4.3 يدل على القضية عندما، على الرغم من وجود تقاطع الاستراتيجيات، فإن الحل يعطي استراتيجيات نظيفة لكلا اللاعبين (2 وفي 2)، وسعر اللعبة ν \u003d a 22. في هذه الحالة، يحتوي المصفوفة على نقطة السرج، والاستراتيجية A 1 غير مربحة، لأن مع أي استراتيجية عدو نقية، فإنه يعطي مكاسب أصغر من و 2.

في الحالة عندما يكون لدى استراتيجية غير مواتية من الواضح الخصم، فإن التفسير الهندسي لديه مظهر مقدم في الشكل. 4.4.

في هذه الحالة، يتزامن الحدود السفلية للفصل مع الاستراتيجية في 1، من الواضح أن الإستراتيجية في 2 للعدو غير مؤات.

تفسير هندسي يجعل من الممكن تخيل السعر القاع والأعلى من اللعبة بصريا (الشكل 4.5).

لتوضيح، سنقوم بإنشاء تفسيرات هندسية من ألعاب 2 × 2 التي تمت مناقشتها في الأمثلة 1 و 2 (الشكل 4.6 و 4.7).

تأكدنا من أن أي لعبة 2 × 2 يمكن حلها بالتقنيات الأولية. أي لعبة 2xn يمكن حلها بشكل مشابه تماما. حيث لدينا استراتيجيتين فقط، والخصم لديه رقم تعسفي.

دعونا لدينا استراتيجيتان: استراتيجيات 1 و 2 وخصم - ن: في 1، في 2، ...، في ن. تم تعيين مصفوفة ‖a ij ‖؛ يتكون من سطرين و N أعمدة. على غرار حالة استراتيجيتين، سنقدم مشكلة تفسير هندسية؛ ترد N مستقيم (الشكل 4.8). نحن نبني الحد الأدنى للمثبتين (كسر B 1 MNB 2) ونجد النقطة ن مع أقصى قدر من الإقامة. هذه النقطة تعطي لعبة اللعبة (الاستراتيجية ) نقطة تنسيق N يساوي سعر اللعبة ν، والفتح الصحي يساوي تواتر P 2 من الاستراتيجية A 2.

في هذه الحالة، يتم الحصول على استراتيجية العدو المثلى باستخدام مزيج من الاستراتيجيات "المفيدة": في 2 وفي 4 تقاطع في النقطة N. الاستراتيجية غير مربحة بشكل واضح، والاستراتيجية B 1 غير مربحة باستراتيجية مثالية SA *. إذا كانت ستتضم إلى استراتيجيتها المثلى، فلن تتغير المكاسب، بغض النظر عن مدى استراتيجياتها "المفيدة" إما أنها ستتغير إذا ذهبت إلى الاستراتيجيات ب 1 أو 3. في نظرية النظرية، ثبت أن أي لعبة MXN النهائية لها حل يتم فيه أن يتجاوز عدد استراتيجيات "مفيدة" للجانب الآخر أصغر رقمين م و N. على وجه الخصوص، يتبع ذلك من هذا أن لعبة 2xm تحتوي دائما على حل لا يوجد به أكثر من استراتيجية "مفيدة" من الجانب الآخر.

باستخدام التفسير الهندسي، يمكنك إعطاء طريقة سهلة لحل أي لعبة 2xm. مباشرة وفقا للرسومات التي نجد فيها زوج من استراتيجيات "مفيدة" للأعدين B J و K، تتقاطع في النقطة ن (إذا كان عند النقطة N تعبر أكثر من استراتيجيتين، خذ أي منهم). نحن نعلم أنه إذا كان اللاعب وتلتزم باستراتيجيته الأمثل، فإن الفوز لا يعتمد على نسبة تنطبق على استراتيجيات "مفيدة"، وبالتالي

من هذه المعادلات والشروط P 2 \u003d 1 - P 1، نجد P1، P2 وسعر اللعبة ν. معرفة سعر اللعبة، يمكنك تحديد الاستراتيجية المثلى على الفور تم حل المشغل مقابل القيام بذلك، على سبيل المثال، المعادلة: QJA 1 J + QKA 1 K \u003d ν، حيث QJ + QK \u003d 1. في الحالة عندما يكون لدينا استراتيجيات م، والعداء هو اثنين فقط، من الواضح ، يتم حل المهمة بطريقة مشابهة تماما. يكفي أن تلاحظ أنه عن طريق تغيير علامة الفوز على العكس، يمكنك تشغيل المشغل ومن "الفوز" في "الخسارة". يمكنك حل اللعبة ودون تغيير علامة Wisness؛ ثم تم حل المهمة مباشرة ل B، ولكن ليس أقل، ولكن الحد الأعلى للمثنين (الشكل 4.9). على الحدود تبحث عن نقطة ن مع التنسيق الحد الأدنى، وهو سعر اللعبة ν.

النظر وحل عدة أمثلة من ألعاب 2 × 2 و 2xm التي هي عينات مبسطة من الألعاب العملية.

مثال 3.الحزب ويرسل عدو إلى اثنين من المهاجم أنا. و II.; أنا. الذباب في الجبهة II. - مؤخرة. أحد المفجرين - ليس معروفا مقدما ما - يجب أن يكون هناك قنبلة، والآخر يؤدي وظيفة مرافقة. في منطقة الخصم، تهاجم المهاجم من قبل مقاتلة V. Bombarders المسلحة ببنادق من السرعة المختلفة. إذا كان المقاتل يهاجم المهاجم الخلفي II.، ثم نار هذا القنبلة فقط يؤدي إليها؛ إذا هاجم المهاجم الأمامي، فإن البنادق من كلا المفجرين تؤدي إليها. احتمال آفة المقاتلة في الحالة الأولى هو 0.3، في الثانية 0.7.

إذا لم يتم إسقاط المقاتل من خلال نيران الدفاعية من المفجرين، فهو يضرب الهدف الذي تم اختياره لهم باحتمال 0.6. مهمة المهاجم - لنقل قنبلة إلى الهدف؛ مهمة المقاتل هي منع هذا، أي تحميل مهاجم الناقل. مطلوب اختيار الاستراتيجيات المثلى للأطراف:

أ) للحزب A: ما هو المهاجم لجعل الناقل؟

ب) للحزب س: ما مهاجم المهاجم؟

قرار. لدينا حالة بسيطة من اللعب 2 × 2؛ الفوز الاحتمالية الناقل المتاح. استراتيجياتنا: 1 - الناقل - مهاجم أنا.؛ و 2 - الناقل - منفذها II.وبعد الإستراتيجية الشاقة: في 1 - هجمات المهاجم أنا.؛ في 2 تدرس II.وبعد دعونا نجعل مصفوفة اللعبة، أي نجد متوسط \u200b\u200bالربح مع كل مزيج من الاستراتيجيات.

1. 1 في 1 (الناقل أنا.مهاجمة أنا.). لن يتم دهش الناقل إذا كان المفجرون يجمعون مقاتلا أو لا تصرفوا، لكن لن يضرب هدفه: 11 \u003d 0.7 + 0.3 * 0.4 \u003d 0.82.

2. 2 في 1 (الناقل II.مهاجمة أنا.). 21 \u003d 1

3. 1 في 2 (الناقل أنا.مهاجمة II.). 12 \u003d 1

4. 2 في 2 (الناقل II.مهاجمة II.). 22 \u003d 0.3 + 0.7 * 0.4 \u003d 0.58

مصفوفة اللعبة لديها النموذج:

انخفاض سعر اللعبة 0.82؛ أعلى السعر 1. المصفوفة لا تملك نقطة السرج؛ الحل الذي نبحث عنه في مجال الاستراتيجيات المختلطة. نحن لدينا:

p 1 * 0.82 + P 2 * 1 \u003d ν

p 1 * 1 + P 2 * 0،58 \u003d ν

ص 1 \u003d 0.7؛ ص 2 \u003d 0.3

استراتيجيتنا الأمثل هناك I.E. كشركة حاملة تحتاج إلى اختيار المزيد أنا.من II.وبعد سعر اللعبة يساوي ν \u003d 0.874. معرفة ν، نقرر Q 1 و Q 2 - ترددات الاستراتيجيات في 1 وفي 2 في استراتيجية العدو الأمثل S B *. لدينا: Q 1 * 0.82 + Q 2 * 1 \u003d 0.874 و Q 2 \u003d 1 - Q 1، من حيث Q 1 \u003d 0.7؛ س 2 \u003d 0.3، أي استراتيجية العدو الأمثل .

مثال 4.الحزب يهاجم الكائن، والحزب في - يدافع عنه. من الجانب أ - طائرتين؛ على جانب ب - ثلاثة مدافع زنجة. كل طائرة هي شركة حاملة قوية؛ من أجل دهش الكائن، يكفي لكسر طائرة واحدة على الأقل. حفلات الطائرات ويمكن أن تختار أي من الاتجاهات الثلاثة للتعامل مع الكائن: أنا., II., ثالثا (الشكل 4.10). يمكن للعدو (الجانب ج) استيعاب أي من بنادقها في أي اتجاه؛ في هذه الحالة، يتم تصوير كل صك فقط عن طريق مساحة الفضاء التي تنتمي إليها هذا الاتجاهولا يطلق النار على الاتجاهات القريبية. يمكن لكل سلاح إطلاق طائرة واحدة فقط؛ يتم دهشت الطائرة النار من احتمال 1. الطرف ولا يعرف مكان وضع البنادق؛ الحزب في لا يعرف أين تأتي الطائرات. مهمة جزء من أ هو ضرب الكائن؛ الهدف من الأطراف لدعم هزيمته. العثور على حل للعبة.

قرار. اللعبة هي 2 × 3 لعبة. الفوز هو احتمال تلف الكائنات. استراتيجياتنا المحتملة: 1 - إرسال طائرة واحدة إلى اتجاهين مختلفين. 2 - أرسل كل الطائرة في اتجاه واحد. الاستراتيجية الشاقة: في 1 - ضع واحدة إلى أداة واحدة لكل اتجاه؛ في 2 - ضع سلاحين على اتجاه واحد وآخر - إلى آخر؛ في 3 - ضع جميع البنادق الثلاثة على اتجاه واحد. اصنع مصفوفة اللعبة.

1. و 1 في 1 (تطير الطائرة مجالات مختلفة؛ البنادق مرتبة واحدة). من الواضح أنه لا تنفجر أي طائرة على الكائن: 11 \u003d 0.

2. 2 في 1 (تطير الطائرة معا في اتجاه واحد؛ يتم وضع البنادق واحدا تلو الآخر). من الواضح، في نفس الوقت سوف تمر طائرة واحدة إلى الكائن من قبل غير المهتم: 21 \u003d 1.

3. و 1 إلى 2 (تطير الطائرة واحدا تلو الآخر؛ يحمي الخصم اتجاهين ويترك ثالثا غير محمية). إن احتمال أن تنفصل طائرة واحدة على الأقل حتى الكائن مساويا لاحتمال أن يختار أحدهم اتجاه غير محمي: 12 \u003d 2/3.

4. و 2 في 2 (تطير الطائرة معا في اتجاه واحد؛ يحمي العدو اتجاه واحد مع اثنين من أدوات وواحد - واحد، وهذا هو، يحمي فعلا اتجاه واحد وأوراق واحدة غير محمية دون حماية اثنين). احتمال أن تنفجر طائرة واحدة على الأقل تصل إلى الكائن مساويا لاحتمال وجود زوج من الطائرات غير المحمية في الواقع: 22 \u003d 2/3.

5. و 1 إلى 3 (الطائرة تطير واحدا تلو الآخر؛ الخصم يحمي ثلاثة أسلحة اتجاه واحد فقط): 13 \u003d 1.

6. و 2 في 3 (تطير الطائرة معا؛ الخصم يحمي ثلاثة أسلحة اتجاه واحد فقط). من أجل دهش الكائن، يجب على الطائرات اختيار الاتجاه غير المحمي: 23 \u003d 2/3.

ألعاب مصفوفة:

من المصفوفة، من الواضح أن استراتيجية 3 غير مواتية غير مواتية مقارنة ب 2 (يمكن حل ذلك مقدما). التعبير عن الاستراتيجية في 3 لعبة يأتي إلى اللعبة 2 × 2:

يحتوي المصفوفة على نقطة السرج: السعر الأدنى من اللعبة 2/3 يتزامن مع القمة. في الوقت نفسه، نلاحظ أنه بالنسبة لنا (أ)، فإن الاستراتيجية A 1 غير مؤات من الواضح. الخلاصة: يجب أن تستخدم كلا الطرفين A و B دائما استراتيجياتها الخالصة 2 و B 2، I.E. يجب أن نرسل الطائرات إلى 2، واختيار اتجاه عشوائي يتم بها إرسال البخار؛ يجب أن يضع العدو البنادق مثل هذا: اثنان - في اتجاه واحد، واحد - من ناحية أخرى، وينبغي أيضا تنفيذ اختيار هذه المناطق عن طريق الصدفة (هنا، كما نرى، بالفعل "استراتيجيات نقية" تتضمن عنصر صدفة). تطبيق هذه الاستراتيجيات المثلى، سنتلقى دائما أربابا متوسطا دائما 2/3 (I.E. وسوف تتأثر كائن باحتمال 2/3). لاحظ أن الحل الموجود ليس هو الوحيد؛ بالإضافة إلى الحلول B. استراتيجيات نقية، هناك قطعة أرض كاملة من استراتيجيات اللاعب المختلط A، وهي الأمثل، من P 1 \u003d 0 إلى p 1 \u003d 1/3 (الشكل 4.11).

من السهل، على سبيل المثال، تأكد من أن متوسط \u200b\u200bالمكاسب المتوسطة 2/3 ستنجح، إذا طبقنا استراتيجياتنا الأولى والثلاثين في النسب 1/3 و 2/3.

مثال 5. نفس الشروط التي في المثال السابق، ولكن بالنسبة لنا هناك أربعة اتجاهات للتأثير، والعداء لديه أربعة أسلحة.

قرار.لا يزال لدينا استراتيجيات محتملة: 1 - إرسال طائرة واحدة تلو الأخرى، و 2 - إرسال طائرتين معا. لدى الخصم خمس استراتيجيات ممكنة: في 1 - ضع واحدة للأداة لكل اتجاه؛ في 2 - وضع سلاحين في اتجاهين مختلفين؛ في 3 - ضع مؤشرين على اتجاه واحد واحدا تلو الآخر - من قبل اثنين آخرين؛ في 4 وضع ثلاثة بنادق على اتجاه واحد وآخر - إلى آخر؛ في 5 - ضع جميع البنادق الأربعة على اتجاه واحد. الاستراتيجيات في 4، في 5 رمي مقدما بشكل واضح غير مواتية. يجادل بالمثل إلى المثال السابق، نبني مصفوفة للعبة:

سعر أقل من 1/2 لعبة، 3/4 العلوي. المصفوفة لا تملك نقطة السرج. يكمن القرار في مجال الاستراتيجيات المختلطة. باستخدام التفسير الهندسي (الشكل 4.12)، نسلط الضوء على استراتيجيات العدو "المفيدة": في 1 وفي 2.

الترددات P 1 و P 2 نحن نحدد من المعادلات: P 1 * 0 + (1 - p 1) * 1 \u003d ν و p 1 * 5/6 + (1 - p 1) * 1/2 \u003d ν؛ حيث p 1 \u003d 3/8؛ ص 2 \u003d 5/8؛ ν \u003d 5/8، أي استراتيجيتنا الأمثل هي وبعد استخدامه، ونحن نضمن نفسك متوسط \u200b\u200bالأرباح 5/8. معرفة سعر اللعبة ν \u003d 5/8، نجد التردد Q 1 و Q 2 "مفيدة" استراتيجيات العدو: Q 1 * 0 + (1 - Q 1) * 5/6 \u003d 5/8، Q 1 \u003d ¼، Q 2 \u003d ¾. ستكون استراتيجية العدو الأمثل: .

مثال 6. لدى الحزب استراتيجيتين 1 و 2، الجانب ب - أربعة ب 1، 2، في 3 وفي 4. مصفوفة اللعبة لديها النموذج:

العثور على حل للعبة.

قرار. انخفاض سعر اللعبة 3؛ أفضل 4. يظهر التفسير الهندسي (الشكل 4.13) أن استراتيجيات اللاعب المفيدة في 1 و 2 أو 2 وفي 4:

اللاعب A بلا حدود العديد من الاستراتيجيات المختلطة الأمثل: في الاستراتيجية المثلى P 1، قد تختلف من 1/5 إلى 4/5. سعر اللعبة ν \u003d 4. اللاعب في لديه استراتيجية مثالية نظيفة في 2.

§ 5. الأساليب العامة لحل الألعاب النهائية

لدينا حتى الآن فقط الألعاب الأولية من النوع 2xn، والتي يمكن حلها ببساطة تماما والسماح بالتفسير المريح والمرئي. في الحالة العامة، يمثل حل لعبة MXN مهمة صعبة إلى حد ما، مع تعقيد المشكلة ومقدار الحساب اللازم لحل الزيادات في الحساب مع زيادة M و N. ومع ذلك، فإن هذه الصعوبات لا تتحمل طبيعة أساسية وترتبط فقط بمقدار كبير جدا من المستوطنات، والتي قد تكون في بعض الحالات مستحيلة عمليا. لا يزال الجانب الرئيسي لقرار القرار مع أي م واحد ونفس الشيء.

نوضح هذا على مثال اللعبة 3XN. دعونا نقدم لها التفسير الهندسي - المكاني بالفعل. ثلاث استراتيجياتنا و 1، 2 و 3 ستكون ثلاث نقاط على الطائرة hou.؛ الأكاذيب الأولى في بداية الإحداثيات (الشكل 5.1)، والثاني والثالث - على المحاور أوه و واو على المسافات 1 من البداية.

من خلال النقاط A 1، و 2 و 3 يتم تنفيذ محور أنا.أنا., II.II. و ثالثاثالثاعمودي على الطائرة hou.وبعد على محور أنا.أنا. يتم تأجيل الأرباح عند الاستراتيجية A 1 على المحاور II.II. و ثالثاثالثا - أرباح مع الاستراتيجيات 2 و 3. تظهر كل استراتيجية عدوية B J طائرة تقطع على المحاور أنا.أنا., II.II. و ثالثاثالثا شرائح تساوي أرباح الاستراتيجيات المناسبة A 1 و 2 و 3 واستراتيجية في J. وبالتالي، بناء جميع استراتيجيات العدو، نحصل على عائلة من الطائرات فوق المثلث A 1 و 2 و 3 (الشكل 5.2). بالنسبة لهذه الأسرة، يمكنك أيضا إنشاء حد أقل من المكاسب، كما فعلنا في حالة 2xn وتجد النقطة ن في هذه الحدود مع أقصى ارتفاع فوق الطائرة hou.وبعد هذا الارتفاع هو ثمن اللعبة ν.

الترددات P 1، P 2، P 3 استراتيجيات A 1، A 2 و 3 في استراتيجية Optimal SA * سيتم تحديدها من خلال الإحداثيات (X، Y) من النقطة N، وهي: P 2 \u003d X، P 3 \u003d Y، ص 1 \u003d 1 - ص 2 - ص 3. ومع ذلك، فإن مثل هذا الإنشاء الهندسي حتى بالنسبة لحالة 3xN ليس من السهل تنفيذه ويتطلب الوقت العالي والجهود التي تبذلها الخيال. في الحالة العامة للعبة، يتم نقلها إلى مساحة M- الأبعاد وتفقد جميع الرؤية، على الرغم من أن استخدام المصطلحات الهندسية في بعض الحالات قد يكون مفيدا. عند حل ألعاب MXN في الممارسة العملية، يكون الأمر أكثر ملاءمة لاستخدامها وليس التظليلات الهندسية، ولكن عن طريق الأساليب التحليلية المحسوبة، خاصة منذ ذلك الحين، لحل المشكلة على أجهزة الحوسبة، هذه الأساليب مناسبة فقط.

يتم تقليل جميع هذه الطرق بشكل أساسي إلى حل المشكلة عن طريق العينات المتتالية، ولكن ترتيب تسلسل العينة يسمح لك ببناء خوارزمية تؤدي إلى حل الطريقة الأكثر اقتصادا. هنا سنركز لفترة وجيزة على نفس الطريقة المحسوبة لحل ألعاب MXN - على طريقة ما يسمى بطريقة "البرمجة الخطية". للقيام بذلك، سنقدم أولا الإعداد العام للمشكلة حول إيجاد قرار لعبة MXN. دع لعبة MXN مع استراتيجيات M 1، A 2، ...، ومشغل M لاعب A و N استراتيجيات B 1، B 2، ...، B N Player in و Set Matrix الدفع ‖a I J ‖. مطلوب لإيجاد قرار من اللعبة، أي استراتيجيات مختلطة مثبتة من اللاعبين A و

حيث p 1 + p 2 + ... + p m \u003d 1؛ Q 1 + Q 2 + ... + Q N \u003d 1 (يمكن أن يكون بعض الأرقام P I و Q J صفر).

يجب أن توفر لنا استراتيجيتنا الأمثل S A * أرباحا، وليس أقل ν، مع أي سلوك للعدو، وكسب مساويا ν، مع سلوكه الأمثل (استراتيجية S B *). وبالمثل، يجب أن توفر استراتيجية S B * خصما بفقدان، وليس أكبر من ν، مع أي من سلوكنا ومساوي مع سلوكنا الأمثل (استراتيجية S A *).

حجم سعر اللعبة ν في هذه الحالة غير معروف لنا؛ نحن نفترض أنه يساوي البعض رقم موجب، عدد إيجابيوبعد الاعتقاد بذلك، نحن لا ننتهك عمومية المنطق؛ من أجل أن تكون ν\u003e 0، من الواضح أن جميع عناصر المصفوفة ‖a i ‖ ‖ كانت غير سلبية. يمكن دائما تحقيق ذلك عن طريق إضافة إلى عناصر ‖a I J ‖ قيمة إيجابية إلى حد ما ل.؛ في الوقت نفسه سوف يزيد سعر اللعبة ل.والقرار لن يتغير.

دعنا نختار استراتيجيتنا الأمثل S A *. ثم سيكون متوسط \u200b\u200bأرباحنا مع الاستراتيجيات B J Enemy يساوي: j \u003d p 1 a 1j + p 2 a 2j + ... + p m mj. استراتيجيتنا الأمثل S A * لديها الخاصية التي مع أي سلوك العدو يضمن المكاسب التي لا تقل عن ν؛ وبالتالي، فإن أي من الأرقام A J لا يمكن أن تكون أقل ν. نحصل على عدد من الشروط:

نحن نقسم عدم المساواة (5.1) على القيمة الإيجابية ل ν وتشير

ثم الشروط (5.1) سيتم تسجيلها في النموذج

حيث ξ 1، ξ 2، ...، ξ م هي أرقام غير سلبية. منذ p 1 + p 2 + ... + p m \u003d 1، والقيم ξ 1، ξ 2، ...، ξ م إرضاء الحالة

(5.3) ξ 1 + ξ 2 + ... + ξ m \u003d 1 / ν.

نريد أن نجعل أرباحا مضمونة قدر الإمكان؛ من الواضح، في نفس الوقت الجزء الصحيح تساوي المساواة (5.3) الحد الأدنى للقيمة. وبالتالي، يتم تقليل مهمة العثور على حل اللعبة إلى المشكلة الرياضية التالية: لتحديد القيم غير السلبية من ξ 1، ξ 2، ξ M، ظروف مرضية (5.2)، بحيث مجموعها \u003d ξ 1 + ξ 2 + ... + ξ M كان الحد الأدنى.

عادة، عند حل المشكلات المرتبطة بإيجاد قيم متطرفة (Maxima و Minima)، يتم تمييز الوظيفة وتعادلها عن طريق مشتقات صفر. ولكن هذه التقنية لا طائل منه في هذه الحالة، لأن وظيفة، والتي يجب عكسها، خطية، ومشتقاتها في جميع الحجج تساوي واحدة، أي في أي مكان لا تتحول إلى الصفر. لذلك، يتم تحقيق أقصى وظيفة في مكان ما على حدود منطقة تغيير الحجج، والتي تحددها شرط عدم السلبية للحجج والظروف (5.2). قبول القيم الشديدة باستخدام التمايز غير مناسب وفي الحالات التي يكون فيها الحد الأقصى للحدود السفلي (أو على الأقل على الأقل) من المكاسب مصممة على حل اللعبة، كما تم تحديدنا، على سبيل المثال، عند حل الألعاب 2xn. في الواقع، يتكون الحد الأدنى من مجالات من خطوط مستقيمة، ولا يتحقق الحد الأقصى عند نقطة المشتق صفر (لا توجد هذه النقطة على الإطلاق)، وعلى الحدود الفاصلة أو عند نقطة تقاطع المستقيم المواقع.

لحل هذه المهام، غالبا ما تحدث في الممارسة العملية، تم تطوير جهاز برمجة خطي خاص في الرياضيات. تم تعيين مهمة البرمجة الخطية على النحو التالي. نظام دانا المعادلات الخطية:

مطلوب للعثور على القيم غير السلبية ل ξ 1، ξ 2، ξ، ξ م، ظروف مرضية (5.4) وفي الوقت نفسه تدفع الحد الأدنى من وظيفة خطية متجانسة معينة من القيم ξ 1، ξ 2، ξ، ξ m (نموذج خطي): \u003d c 1 ξ 1 + c 2 ξ 2 + ... + cm ξ m

من السهل التأكد من أن المهمة المذكورة أعلاه لنظرية اللعبة هي حالة خاصة لمشكلة البرمجة الخطية في C 1 \u003d C 2 \u003d ... \u003d CM \u003d 1. في لمحة، قد يبدو ذلك الشروط (5.2) لا تعادل الشروط (5.4)، حيث أن علامات المساواة بدلا من ذلك، فإنها تحتوي على علامات عدم المساواة. ومع ذلك، من علامات عدم المساواة، من السهل التخلص من، وإدخال المتغيرات غير السلبية الجديدة غير السلبية Z 1، z 2، ...، z n والتسجيل ظروف (5.2) في النموذج:

النموذج، الذي يجب عكسه في الحد الأدنى، هو \u003d ξ 1 + ξ 2 + ... + ξ m. يسمح جهاز البرمجة الخطي بعدد صغير نسبيا من العينات المتتالية لتحديد القيمة ξ 1، ξ 2، ...، ξ م مرضية المتطلبات. للحصول على وضوح أكبر، سنعرض هنا لتطبيق هذا الجهاز مباشرة على مواد حل الألعاب المحددة.

مثال 1. مطلوب للعثور على حل اللعبة 3 × 3 الواردة في المثال 2 § 1، مع مصفوفة:

للقيام بكل شيء و IJ غير سلبي، أضف إلى جميع عناصر Matrix L \u003d 5. نحصل على المصفوفة:

في الوقت نفسه، سيزيد سعر اللعبة بنسبة 5، ولم يتغير القرار.

نحن نحدد الإستراتيجية الأمثل S A *. الشروط (5.2) لها النموذج:

حيث ξ 1 \u003d p 1 / ν، ξ 2 \u003d p 2 / ν، ξ 3 \u003d p 3 / ν. للتخلص من علامات عدم المساواة، نقدم المتغيرات الوهمية Z 1، Z 2، Z 3؛ سيتم تسجيل الشروط (5.6) في النموذج:

النموذج الخطي هو: \u003d ξ 1 + ξ 2 + ξ 3 ويجب أن يتم بأقل قدر ممكن. إذا كانت جميع الاستراتيجيات الثلاثة "مفيدة"، فستنتقل جميع المتغيرات الوصية الثلاثة Z 1، Z 2، Z 3 إلى الصفر (أي المكبرات المساوية لسعر اللعبة ν سيتم تحقيقها مع كل استراتيجية B J). لكننا لم يكن لدينا سبب للتجول بأن جميع الاستراتيجيات الثلاث "مفيدة". لاختباره، وسوف نحاول التعبير عن الشكل من خلال المتغيرات الوهمية Z 1، z 2، z 3 ومعرفة ما إذا كنا، نعتقد لهم تساوي الصفر، والحد الأدنى من النموذج. للقيام بذلك، حل المعادلات (5.7) فيما يتعلق بالمتغيرات ξ 1، ξ 2، ξ 3 (I.E.، Express ξ 1، ξ 2، ξ 3 من خلال المتغيرات الوهمية Z 1، Z 2، Z 3):

للطي ξ 1، ξ 2، ξ 3، نحصل على: \u003d 1/5 + Z 1/20 + Z 2/10 + Z 3/2 20. هنا المعاملات في جميع Z إيجابية؛ هذا يعني أن أي زيادة في Z 1، Z 2، Z 3 أعلاه من الصفر يمكن أن تؤدي إلا إلى زيادة في النموذج، ونريد أن يكون الحد الأدنى. وبالتالي، فإن قيم z 1، z 2، z 3، النموذج في الحد الأدنى، هي Z 1 \u003d z 2 \u003d z 3 \u003d 0. لذلك، الحد الأدنى لقيمة النموذج φ: 1 / ν \u003d 1 / 5، من حيث سعر اللعبة ν \u003d 5. استبدال القيم الصفرية Z 1، Z 2، Z 3 في الصيغة (5.8)، نجد: ξ 1 \u003d 1/20، ξ 2 \u003d 1/10، ξ 3 \u003d 1/20، أو، مضاعفة لهم على ν، p 1 \u003d 1/4، p 2 \u003d 1/2، p 3 \u003d 1/4. وبالتالي، فإن الاستراتيجية المثلى وجدت: وبعد يجب أن نكتب في ربع جميع الحالات إلى الشكل 1، في نصف الحالات 2 وبقية أرباع الحالات 3.

معرفة سعر اللعبة ν \u003d 5، يمكنك بالفعل معرفة كيفية العثور على استراتيجية العدو الأمثل وبعد للقيام بذلك، نستخدم استراتيجياتنا "مفيدة" (على سبيل المثال، و 2 و 3) وكتابة المعادلات:

9Q 1 + 11 (1-Q 2 -Q 1) \u003d 5،

من حيث Q 1 \u003d Q3 \u003d 1/4؛ س 2 \u003d 1/2. ستكون استراتيجية العدو الأمثل هي نفسها وبعد الآن العودة إلى اللعبة الأولي (غير المحول). للقيام بذلك، من الضروري فقط من سعر اللعبة ν \u003d 5 لاتخاذ مقدار L \u003d 5، وأضاف إلى عناصر المصفوفة. نحصل على سعر اللعبة الأصلية الخامس 0 \u003d 0. وبالتالي، فإن الاستراتيجيات المثلى لكلا الطرفين توفر مكسب متوسط \u200b\u200bيساوي الصفر؛ اللعبة مفيدة بنفس القدر أو غير مربحة لكلا الجانبين.

مثال 2. يحتوي النادي الرياضي على ثلاثة متغيرات من تكوين الفريق 1 و 2 و 3. Club B هو أيضا ثلاثة نماذج ب 1 و 2 وفي 3. تطبيق طلب للمشاركة في المنافسة، أي من الأندية تعرف ما هي التكوين المنتخطي خصم. تم تعيين احتمالية الفوز بالنادي أ مع مختلف المتغيرات من تركيبات الفريق، المعروفة تقريبا من تجربة الاجتماعات السابقة، من قبل المصفوفة:

تجد، مع بعض نوادي التردد، ينبغي بذل كل اجتماع من الاجتماعات في الاجتماعات لتحقيق أكبر عدد من الانتصارات.

قرار. انخفاض سعر اللعبة 0.4؛ أعلى 0.6؛ الحل الذي نبحث عنه في مجال الاستراتيجيات المختلطة. من أجل عدم التعامل مع الكسور، اضرب كل عناصر المصفوفة بنسبة 10؛ في الوقت نفسه، سيزيد سعر اللعبة 10 مرات، ولن يتغير القرار. نحصل على مصفوفة:

الشروط (5.5) لها النموذج:

والحد الأدنى من الحالة \u003d ξ 1 + ξ 2 + ξ 3 \u003d دقيقة.

نتحقق مما إذا كانت جميع استراتيجيات العدو الثلاثة "مفيدة". كما فرضية، نفترض أولا أن المتغيرات الوهمية Z 1، Z 2، Z 3 هي صفر، واختبار المعادلة (5.10) بالنسبة إلى ξ 1، ξ 2، ξ 3:

(5.12) 136φ \u003d 30 + 13Z 1 + 18z 2 - 51z 3

تظهر الصيغة (5.12) أن الزيادة في المتغيرات z 1 و z 2 مقارنة بالقيمة المقدرة لها يمكن أن تزيد فقط، في حين أن الزيادة في Z 3 يمكن أن تقلل من. ومع ذلك، يجب أن تنفذ الزيادة في Z 3 بعناية أن القيم ξ 1، ξ 2، ξ 3 تعتمد على Z 3 لم تصبح سلبية. لذلك، نضع في الأجزاء الصحيحة من المساواة (5.11) قيم Z 1 و Z 2 تساوي الصفر، وسيزداد القيمة Z 3 إلى حدود مسموح بها (حتى الآن بعض القيم ξ 1، ξ 2، ξ 3 لن تتحول إلى صفر). من المساواة الثانية (5.11)، يمكن ملاحظة أن زيادة في Z 3 "بأمان" لقيمة ξ 2 - إنها تزداد منها فقط. بالنسبة للقيم ξ 1، و ξ 3، هنا تكون الزيادة في Z 3 ممكن فقط إلى حد معين. قيمة ξ 1 يناشد الصفر في z 3 \u003d 10/23؛ قيمة ξ 3 نداءات إلى الصفر في وقت سابق، بالفعل في Z 3 \u003d 1/4. لذلك، إعطاء Z 3 من أقصى قيمة مسموح بها Z 3 \u003d 1/4، بينما ننتقل إلى قيمة صفرية ξ 3.

للتحقق مما إذا كان النموذج يظهر بحد أدنى في z 1 \u003d 0، z 2 \u003d 0، ξ 3 \u003d 0، ونحن سوف نعبر عن المتغيرات المتبقية (غير المتساوية الصفر) من خلال zery zery zero z 1، z 2، ξ 3. حل المعادلات (5.10) فيما يتعلق ب ξ 1، ξ 2 و Z 3، نحصل على:

(5.13) 32φ \u003d 7 + ZZ 1 + 4Z 2 + ξ 3

من الصيغة (5.13)، يمكن ملاحظة أنه أي زيادة في z 1، z 2، ξ 3 على قيم الصفر المقصودة يمكن فقط زيادة النموذج. وبالتالي، تم العثور على قرار اللعبة؛ يتم تحديدها بواسطة القيم Z 1 \u003d z 2 \u003d ξ 3 \u003d 0، من حيث ξ 1 \u003d 1/32، ξ 2 \u003d 3/16، z 3 \u003d 1/4. استبدال في الصيغة (5.13)، نجد سعر اللعبة ν: 32φ \u003d 7 \u003d 32 / ν؛ ν \u003d 32/7. استراتيجيتنا الأمثل: وبعد يجب تطبيق استراتيجيات "مفيدة" (التركيبات A 1 و A 2) بالترددات 1/7 و 6/7؛ تكوين 3 - لا تنطبق أبدا.

للعثور على استراتيجية العدو المثلى، بشكل عام، يمكنك القيام بذلك: تغيير علامة الفوز في الاتجاه المعاكس، إضافة إلى عناصر القيمة الثابتة للمصفوفة ل L لجعلها غير سلبية، وحل المهمة للعدو تماما نحلها لأنفسهم. ومع ذلك، فإن حقيقة أن سعر اللعبة ν معروف بالفعل لنا بالفعل، يبسط إلى حد ما المهمة. بالإضافة إلى ذلك، هذا حالة ملموسة يتم تبسيط المهمة بشكل إضافي من حقيقة أن استراتيجيات العدو "المفيدة" فقط في 1 وفي 2 المشاركة في القرار، لأن قيمة Z 3 لا تساوي الصفر، وهذا يعني أن اللعبة لا تتحقق في 3. اختيار أي استراتيجية "مفيدة" لاعب A، على سبيل المثال، 1، يمكنك العثور على الترددات Q 1 و Q 2. للقيام بذلك، اكتب المعادلة 8Q 1 + 2 (1 - Q 1) \u003d 32/7، من حيث Q 1 \u003d 3/7، Q 2 \u003d 4/7؛ ستكون استراتيجية العدو الأمثل: وبعد يجب ألا يستخدم العدو تكوين 3، ويجب تطبيق تركيبات 1 وفي 2 مع الترددات 3/7 و 4/7.

العودة إلى المصفوفة الأولية، نحدد السعر الحقيقي للعبة ν 0 \u003d 32/7: 10 \u003d 0.457. هذا يعني ذاك رقم ضخم اجتماعات عدد انتصارات النادي أ سيكون 0.457 من جميع الاجتماعات.

§ 6. طرق تقريبية لحل الألعاب

في كثير من الأحيان في المهام العملية ليست هناك حاجة لإيجاد قرار دقيق للعبة؛ يكفي العثور على حل تقريبي، مما يعطي الفوز في المتوسط، بالقرب من سعر اللعبة. المعرفة المقدرة لسعر اللعبة ν يمكن أن تعطي بالفعل تحليلا بسيطا للمصفوفة وتعريف السعر السفلي (α) والسعر العلوي (β) للعبة. إذا كانت α و β قريبة، فلا حاجة عمليا للبحث عن حل دقيق، ولكن سيكون كافيا لاختيار استراتيجيات صافي minimax. في الحالات التي تكون فيها α و β غير قريبة، من الممكن الحصول على حل مقبول للممارسة بمساعدة الأساليب العددية لحل الألعاب، والتي نفقد طريقة التكرار لفترة وجيزة.

يتم تقليل فكرة طريقة التكرار إلى ما يلي. يتم تشغيل "التجربة الذهنية"، حيث تطبق المعارضون A و B استراتيجياتهم ضد بعضهم البعض. تتكون التجربة من سلسلة من الألعاب الابتدائية، كل منها لديه مصفوفة لعبة معينة. يبدأ بحقيقة أننا (لاعب أ) اختيار واحدة تعسفا من استراتيجياتها، على سبيل المثال وأنا. العدو مسؤولا عن ذلك مع استراتيجيتها B J، وهو أقل فائدة بالنسبة لنا، أي. يتحول الأرباح عند الاستراتيجيات والدنيا. في هذه الخطوة، نرد على نفس الاستراتيجية A K، التي تعطي الحد الأقصى لمتوسط \u200b\u200bالمكاسب عند تطبيق استراتيجية الخصم B J. التالي - مرة أخرى بدوره الخصم. يستجيب لبضعنا من تحركات I و K التي من استراتيجيتها B J، والتي تمنحنا أصغر أرباحا متوسطة مع هاتين الاستراتيجيتين (A I و K) وما إلى ذلك. في كل خطوة من خطوة عملية تكرارية، يستجيب كل لاعب لأي مسار لاعب آخر مع استراتيجيته، وهو الأمثل بشأن جميع خطواته السابقة، تعتبر إستراتيجية مختلطة يتم عرض استراتيجيات نقية في أبعاد مماثلة لتكرار طلبها وبعد

هذه الطريقة هي مثل نموذج من "التعلم" العملي الحقيقي للاعبين، عندما يختبر كل منهم وسيلة لسلوك الخصم ويحاول الاستجابة لها مواتية لنفسه. إذا استمرت مثل هذه المحاكاة لعملية التعلم في الاستمرار لفترة طويلة بما فيه الكفاية، فإن متوسط \u200b\u200bأرباحا لكل زوج من التحركات (اللعبة الابتدائية) سوف تسعى جاهدة لسعر اللعبة، والترددات P 1 ... P M؛ س 1 ... س ن، التي توجد فيها استراتيجيات اللاعبين الموجودة في هذا التعادل، ستتعامل مع الترددات التي تحدد الاستراتيجيات المثلى. تظهر الحسابات أن تقارب الطريقة بطيئة للغاية، ومع ذلك، بالنسبة لآلات العد عالية السرعة، فهذا ليس عقبة.

نوضح تطبيق الطريقة التكرارية على مثال اللعبة 3 × 3، حلها في المثال 2 من الفقرة السابقة. يتم تعيين اللعبة بواسطة مصفوفة:

يوضح الجدول 6.1 أول 18 خطوة للعملة التكرارية. يتم إعطاء العمود الأول عدد اللعبة الابتدائية (أزواج من التحركات) ن.؛ في الرقم الثاني أنا. استراتيجية لاعب مختارة A؛ في الثلاثة الثلاثة المقبلة - "المكاسب المتراكمة" لأول ن. ألعاب مع استراتيجيات العدو B 1، 2، في 3. يتم التأكيد على الحد الأدنى من هذه القيم. التالي يأتي الرقم ج. الإستراتيجية التي اختارها العدو، والفوز المتراكم على التوالي ن. يتم التأكيد على الألعاب قيد الاستراتيجيات 1 و 2 و 3 من هذه القيم من أعلى الحد الأقصى. تحدد القيم المسطرة اختيار استراتيجية الاستجابة لاعب آخر. تعطى الأعمدة التالية بالتتابع: الحد الأدنى متوسط \u200b\u200bالأرباح ν يساوي الحد الأدنى الفوز المتراكم مقسوما على عدد الألعاب ن.؛ الحد الأقصى لمتوسط \u200b\u200bمكاسب يساوي الحد الأقصى للفوز المتراكم المشترك ن.، ومتوسط \u200b\u200bالحساب الخاص بهم ν * \u003d (ν +) / 2. مع زيادة ن. جميع القيم الثلاث، وسوف تقترب من سعر اللعبة ν، ولكن قيمة ν * ستتعامل بشكل طبيعي منه بشكل أسرع نسبيا.

الجدول 6.1.

كما يتضح من المثال، فإن تقارب التكرار بطيئا للغاية، ولكن مع ذلك، حتى مثل هذا الحساب صغير يجعل من الممكن العثور على القيمة التقريبية لسعر اللعبة والكشف عن هيمنة الاستراتيجيات "المفيدة". عند استخدام الآلات القابلة للعد، تزيد قيمة الطريقة بشكل كبير. ميزة الطريقة التكرارية لحل اللعبة هي أن حجم وتعقيد العمليات الحسابية تزداد ضعيفة نسبيا مع زيادة عدد الاستراتيجيات م. و ن..

§ 7. طرق لحل بعض الألعاب التي لا نهاية لها

وتسمى لعبة لا نهاية لها لعبة واحدة من الأطراف على الأقل مجموعة من الاستراتيجيات. الطرق العامة لحل هذه الألعاب لا تزال مصممة قليلا. ومع ذلك، قد تكون بعض الحالات المعينة التي تسمح بحل بسيط نسبيا بمثابة مصلحة. النظر في لعبة اثنين من المعارضين A و B، كل منها لديه مجموعة من الاستراتيجيات اللانهائية (لا تحصى)؛ هذه الاستراتيجيات للاعب تتوافق مع القيم المختلفة تغيير باستمرار المعلمة حاء، وفي - المعلمة دوبعد في هذه الحالة، بدلا من المصفوفة ‖a IJ ‖ تحدد اللعبة بعض الوظائف من الحجج المتغيرة باستمرار a (x، y)التي سوف نسميها وظيفة المكاسب (نلاحظ أن الوظيفة نفسها a (x، y) لا ينبغي أن يكون مستمرا). وين وظيفة a (x، y) يمكن تقديمها مع بعض السطح هندسي a (x، y) فوق منطقة تغيير الحجج (س، ذ) (الشكل 7.1)

تحليل وظيفة المكاسب a (x، y) يتم تنفيذها مماثلة لتحليل مصفوفة الدفع. أولا، هناك سعر أقل للعبة α؛ لهذا هو تحديد الجميع حاء الدالة الدنيا a (x، y) في الكل د:، ثم يتم البحث عن الحد الأقصى لهذه القيم على الكل حاء (ماكسيمين):

يتم تعريف أفضل سعر اللعبة (minimax) بنفس الطريقة:

النظر في القضية عندما α \u003d β. نظرا لأن سعر اللعبة ν قد انتهى دائما بين α و β، فإن معناها هو ν. المساواة α \u003d β يعني السطح a (x، y) لديه نقطة السرج، أي مثل هذه النقطة مع الإحداثيات X 0، في 0، الذي a (x، y) في الوقت نفسه الحد الأدنى د والحد الأقصى من قبل حاء (الشكل 7.2).

قيمة a (x، y) في هذه المرحلة، هناك ثمن اللعبة ν: ν \u003d a (x 0، y 0). يعني وجود نقطة السرج أن هذه اللعبة التي لا نهاية لها لها حل في مجال الاستراتيجيات الخالصة؛ x 0، Y 0 هناك استراتيجيات نقية مثالية A و V. بشكل عام، عند α ≠ β، قد تحتوي اللعبة على حل فقط في مجال الاستراتيجيات المختلطة (ربما ليس الوحيد). استراتيجية مختلطة للألعاب التي لا نهاية لها هناك بعض توزيع الاحتمالات للاستراتيجيات حاء و دتعتبر متغيرات عشوائية. يمكن أن يكون هذا التوزيع مستمرا وتحديدا عن طريق الكثافة. f. 1 (س) و f. 2 (ذ)؛ قد تكون منفصلة، \u200b\u200bثم تتكون الاستراتيجيات المثلى من مجموعة من الاستراتيجيات الصافية المنفصلة المحددة مع بعض الاحتمالات غير الصفرية.

في الحالة عندما لا تملك لعبة لا نهاية لها نقطة سرج، يمكنك إعطاء تفسير مرئي هندسي للسعر السفلي والأعلى من اللعبة. النظر في لعبة لا نهاية لها مع وظيفة المكاسب. a (x، y)واستراتيجيات x، W.ملء شرائح باستمرار من المحاور (x 1، x 2) و (في 1، U 2)وبعد لتحديد سعر أقل من اللعبة α، تحتاج إلى "رؤية" على السطح a (x، y) من جانب المحور دوبعد تحويله إلى الطائرة حيرة (الشكل 7.3). نحصل على بعض الشكل، محدود من الجانبين مع مستقيم X \u003d X 1 و X \u003d X 2، ومن أعلى وتحت - المنحنيات إلى B وإلى N. السعر الأدنى من اللعبة α من الواضح أنه لا يوجد شيء سوى الحد الأقصى ترتيب المنحنى إلى N.

وبالمثل، للعثور على أعلى سعر اللعبة β، تحتاج إلى "رؤية" على السطح a (x، y) من جانب المحور حاء (تصميم السطح إلى الطائرة واو) وإيجاد الحد الأدنى من التنسيق من الحدود العليا إلى الإسقاط (الشكل، 7.4).

النظر في الأمثلة الأولية للألعاب التي لا نهاية لها.

مثال 1. اللاعبون A و B كلهم \u200b\u200bلا يحتملون على العديد من الاستراتيجيات الممكنة. حاءو دعلاوة على ذلك، 0 ≤ x 1؛ 0 ≤ y 1. يتم إعطاء وظيفة الفوز من قبل التعبير A (X و Y) - (X - Y) 2. العثور على حل للعبة.

الحل، السطح A (X، Y) هو اسطوانة مكافئ (الشكل 7.5) وليس لديها نقطة واضحة. نحدد انخفاض سعر اللعبة. من الواضح، للجميع حاء؛ وبالتالي \u003d 0. حدد السعر العلوي من اللعبة. للقيام بذلك، نجد مع ثابت د

في هذه الحالة، يتم تحقيق الحد الأقصى دائما على الحدود الفاصلة (في x \u003d 0 أو x \u003d 1)، I.E. إنه يساوي 2؛ (1 - ص) 2، وهو أكثر من ذلك. سأصور الرسوم البيانية لهذه الوظائف (الشكل 7.6)، أي إسقاط السطح a (x، y) على متن الطائرة واووبعد خط الدهون في الشكل. 7.6 ميزة تظهر. من الواضح أن القيمة الدنيا للحد الأدنى يتم تحقيقها في Y \u003d 1/2 وتساوي 1/4. وبالتالي، فإن أعلى سعر اللعبة β \u003d 1/4. في هذه الحالة، يتزامن السعر العلوي من اللعبة بسعر اللعبة ν. في الواقع، يمكن لاعب A تطبيق استراتيجية مختلطة S A \u003d في أي القيم المتطرفة x \u003d 0 و x \u003d 1 يتم تضمينها بنفس الترددات؛ بعد ذلك، مع أي استراتيجية، فإن اللاعب في اللاعب العادي الفوز سيكون مساويا: ½u 2 + (1 - Y) 2. من السهل التأكد من أن هذه القيمة لأي قيم د بين 0 و 1، لا يقل عن ¼: u 2 + ½ (1 - y) 2 ≥ ¼.

وبالتالي، فإن اللاعب واستخدام هذه الاستراتيجية المختلطة يمكن أن يضمن أرباحا مساوية للسعر الأعلى للعبة؛ نظرا لأن سعر اللعبة لا يمكن أن يكون أكبر من أعلى السعر، ثم هذه الاستراتيجية S مثلى: S A \u003d S A *.

يبقى إيجاد الاستراتيجية المثلى للمشغل الخامس. من الواضح، إذا كان سعر اللعبة ν يساوي السعر الأعلى للعبة β، فسيكون استراتيجية اللاعب المثلى دائما استراتيجية صافية Minimax التي تضمن له السعر العلوي من اللعبة. في هذه الحالة، مثل هذه الاستراتيجية هي 0 \u003d. في الواقع، مع هذه الاستراتيجية، مهما كان اللاعب A، فإن المكاسب لن تكون أكثر ¼. يتبع ذلك من عدم المساواة الواضحة (x - ½) 2 \u003d x (x -1) + ¼ ≤ ≤

مثال 2. الجانب A ("نحن") يقود الطائرة على الخصم. من أجل الكشف عن القصف، يمكن للعدو المناورة مع بعض الزائد دالذي هو في تقديره يمكن أن نعلق أهمية من د \u003d 0 (حركة مستقيمة) ل د = د الأعلى (تحلق حول محيط الحد الأقصى الانحناء). نحن نفترض د الأعلى وحدة القياس، أي وضع د الأعلى \u003d 1. في مكافحة العدو، يمكننا استخدام أجهزة الرؤية بناء على فرضية واحدة أو أخرى حول حركة الهدف أثناء رحلة الخدمة. الزائد حاء في هذه الحالة، يمكن للمناورة الافتراضية الاعتماد على مساويا لأي قيمة من 0 إلى 1. مهمتنا هي ضرب العدو؛ مهمة العدو هي أن تظل لا تتأثر. احتمال تلف البيانات حاء و د تقريبا أعربت عنها الصيغة: A (X، Y) \u003d , أين د - التحميل الزائد المطبق من قبل العدو؛ X - التحميل الزائد، أخذ في الاعتبار في الأفق. مطلوب تحديد الاستراتيجيات المثلى لكلا الطرفين.

قرار. من الواضح أن حل اللعبة لن يتغير إذا وضعنا P \u003d 1. وظيفة الفوز a (x، y) يصور السطح المعروض في الشكل. 7.7.

هذا هو سطح أسطواني تشكل بالتوازي مع Bisect ركن الإحداثيات hou.ومقاطع عرضية لطائرة عمودي على التشكيل، هناك منحنى من نوع منحنى التوزيع الطبيعي. باستخدام التفسير الهندسي المقترح للسعر السفلي والأعلى من اللعبة، نجد β \u003d 1 (الشكل 7.8) و (الشكل 7.9). اللعبة لا تحتوي على نقطة السرج؛ القرار الذي تحتاجه للبحث في مجال الاستراتيجيات المختلطة. المهمة هي إلى حد ما مماثلة مهمة المثال السابق. في الواقع في القيم الصغيرة ك. تعمل الوظيفة تقريبا كدالة - (س - ذ) 2، وسيعمل حل اللعبة إذا لحل المثال السابق، قم بتغيير أدوار اللاعبين A و B؛ أولئك. ستكون إستراتيجيتنا المثلى استراتيجية نقية X \u003d 1/2، والاستراتيجية المثلى للعدو SB \u003d ستكون لتطبيق الاستراتيجيات المتطرفة Y \u003d 0 و Y \u003d 1. وهذا يعني أنه يجب علينا استخدام البصر في جميع الحالات، حسب للتحميل الزائد x \u003d 1/2، وينبغي أن العدو لا يستخدم المناورة على الإطلاق في النصف من جميع الحالات، وفي النصف الحد الأقصى من المناورة ممكنة.

تين. 7.8 الشكل. 7.9.

من السهل إثبات أن هذا القرار سيكون عادلا للقيم K 2. في الواقع، متوسط \u200b\u200bالمكاسب مع استراتيجية العدو ب \u003d ومع استراتيجيتنا حاء يتم التعبير عنها من قبل الوظيفة , الذي بالنسبة للقيم K 2 لديه أقصى واحد في x \u003d 1/2، يساوي السعر الأدنى من اللعبة α. وبالتالي، فإن تطبيق استراتيجية S B يضمن عدو الخسارة، وليس أكثر من α، وهو واضح أن α هو سعر أقل من اللعبة - وهناك سعر اللعبة ν.

في K\u003e 2، تحتوي الوظيفة A (X) على اثنين من Maxima (الشكل 7.10)، الموجودة متناظرة بالنسبة إلى X \u003d 1/2 عند النقاط X 0 و X 0، وقيمة X 0 تعتمد على K.

من الواضح، ل ك. \u003d 2 × 0 \u003d 1 - × 0 \u003d؛ مع زيادة ك. يتم نقل نقاط × 0 و 1 - × 0، تقترب من أقرب إلى النقاط القصوى (0 و 1). وبالتالي، فإن حل اللعبة يعتمد على ك. حددنا القيمة المحددة ل K، على سبيل المثال K \u003d 3، وإيجاد حل للعبة؛ للقيام بذلك، نحدد ABSCISSA X 0 من الحد الأقصى للمنحنى A (X). معادلة وظيفة مشتق صفر A (X)، اكتب المعادلة لتحديد X 0:

تحتوي هذه المعادلة على ثلاث جذور: X \u003d 1/2 (حيث يتم تحقيقه على الأقل) و X 0، 1 - × 0، حيث يتم تحقيق Maxima. حل المعادلة عدديا، نجد حوالي × 0 ≈ 0.07؛ 1 - × 0 ≈ 0.93.

نثبت أن قرار اللعبة في هذه الحالة سيكون الزوج التالي من الاستراتيجيات:

مع استراتيجيتنا واستراتيجية العدو د الفوز المتوسط \u200b\u200bيساوي

العثور على الحد الأدنى 1 (Y) في 0< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

معتقدين Y \u003d 1/2، نحصل

وهو أكبر من 1 (0)؛ وبالتالي، فإن سعر اللعبة لا يقل عن 1 (0):

الآن دعونا نقول أن العدو ينطبق استراتيجية S B *، ونحن استراتيجية س. ثم الإرادة المتوسطة سوف

لكننا اخترنا X 0 بهذه الطريقة حتى تصل إلى x \u003d x 0 التعبير الأقصى (7.2)؛ بالتالي،

أولئك. قد لا يسمح الخصم بتطبيق استراتيجية S B * خسارة أكبر من 0.530؛ لذلك، ν \u003d 0.530 هو ثمن اللعبة، واستراتيجية S A * و S B * حل. هذا يعني أنه يجب علينا استخدام البصر مع X \u003d 0.07 و X \u003d 0.93 بنفس التردد، والخصم مع نفس التردد ليس مناورة ومناورة مع الحمل الزائد الأقصى.

لاحظ أن المكاسب ν \u003d 0،530 أكبر بشكل ملحوظ من السعر الأدنى للعبة التي يمكننا تأمين أنفسنا باستخدام أقصى استراتيجية لديك X 0 \u003d 1/2.

واحد من طرق عملية حل الألعاب التي لا نهاية لها هي تخفيض تقريبي في النهائي. في هذه الحالة، يتم دمج مجموعة كاملة من الاستراتيجيات الممكنة لكل لاعب تقليديا في استراتيجية واحدة. وبهذه الطريقة، بالطبع، من الممكن الحصول على قرار لعبة تقريبي فقط، ولكن في معظم الحالات حل دقيق غير مطلوب.

ومع ذلك، يجب أن يؤخذ في الاعتبار أنه عند استخدام هذا الاستقبال، قد تظهر الحلول في مجال الاستراتيجيات المختلطة، حتى في الحالات التي يكون فيها حل اللعبة اللانهائية الأولية ممكنة في استراتيجيات صافي، أي. عندما تكون لعبة لا نهاية لها نقطة السرج. إذا تم الحصول على معلومات اللعبة التي لا نهاية لها، من خلال حل مختلط، والذي يتضمن استراتيجية "مفيدة" مجاورة فقط، من المنطقي محاولة تطبيق الاستراتيجية الصافية الوسيطة للعبة التي لا نهاية لها بينهما.

في الختام، نلاحظ أن الألعاب التي لا نهاية لها على عكس قد لا يكون لها حلول. دعونا نعطي مثالا على لعبة لا حصر لها ليس لها حل. لاعبان يسمي كل أي عدد صحيح. اسم الشيئ أكثر يحصل من روبل آخر واحد. إذا اتصل كلاهما بنفس الرقم، تنتهي اللعبة بسحب. من الواضح أن اللعبة لا يمكن أن يكون لها حلول. ومع ذلك، هناك فئات من الألعاب التي لا نهاية لها من الواضح أن الحل من الواضح.

تسمى الإستراتيجية المختلطة لمشغل SA A باستخدام استراتيجيات نقية A1، A2، ...، AM مع الاحتمالات P1، P2، ...، PI، ...، PM، ومجموع الاحتمالات هو 1: مختلطة استراتيجيات اللاعبين يتم تسجيل A في شكل مصفوفة أو في شكل سلسلة SA \u003d (P1، P2، ...، PI، ...، PM)، استراتيجيات اللاعب المختلطة بالمثل في تعيين:، أو، SB \u003d (Q1، Q2، ...، QI، ...، QN)، حيث يوجد مجموع احتمالات ظهور الاستراتيجيات هو 1: يمكن اعتبار الاستراتيجيات الخالصة حالة خاصة من مختلطة وتعيين سلسلة تتوافق فيها لاستراتيجية نظيفة. بناء على مبدأ Minimax، يتم تحديد الحل الأمثل (أو القرار) من اللعبة: إنه زوج من الاستراتيجيات المثلى S * A، S * B في الحالة العامة المختلطة، والحيازة الخاصية التالية: إذا التمسك أحد اللاعبين باستراتيجيتها المثلى، فلن تتمكن الآخر من التراجع بشكل إيجابي من تلقاء نفسه. يسمى المكاسب المقابلة للحل الأمثل بسعر اللعبة الخامس سعر اللعبة يرضي عدم المساواة :؟ ؟ الخامس؟ ؟ (3.5) أين؟ و؟ - أقل أولا الأسعار العلوية ألعاب. عادلة نظرية نظرية اللعبة التالية هي نظرية نيومان. تحتوي كل لعبة أخيرة على حل مثالي على الأقل، ربما بين الاستراتيجيات المختلطة. دع S * A \u003d (P * 1، P * 2، ...، P * I، ...، P * M) و S * B \u003d (Q * 1، Q * 2، ...، Q * أنا، ...، Q * N) - زوج من الاستراتيجيات المثلى. إذا دخلت استراتيجية صافي الاستراتيجية المختلطة المثبتة باحتمال غير صفري، فإنه يسمى نشط. يتم عرض نظرية الاستراتيجية النشطة: إذا ارتفع أحد اللاعبين إلى استراتيجيتها المختلطة الأمثل، فإن المكاسب لا تتساوى وعلى تساوي سعر اللعبة الخامس، إذا كان اللاعب الثاني لا يتجاوز استراتيجياته النشطة. هذا نظرية له أهمية عملية كبيرة - إنه يعطي نماذج محددة لإيجاد الاستراتيجيات المثلى في غياب نقطة السرج. النظر في حجم اللعبة 2 × 2، وهو أبسط حالة اللعبة النهائية. إذا كانت هذه اللعبة لها نقطة سرج، فإن الحل الأمثل هو زوج من الاستراتيجيات الخالصة المقابلة لهذه النقطة. اللعبة التي لا توجد نقطة السرج، وفقا لنظرية نظرية اللعبة الرئيسية، والحل الأمثل موجود ويتم تحديده من قبل زوج من الاستراتيجيات المختلطة S * A \u003d (P * 1، P * 2) و S * ب \u003d (Q * 1، Q * 2). من أجل العثور عليها، نستخدم نظرية الاستراتيجية الفعلية. إذا كان اللاعب وهو يحمل إستراتيجيته الأمثل S "A، فسيكون متوسط \u200b\u200bأرباحه مساويا لسعر اللعبة الخامس، مهما كانت استراتيجية نشطة للاعب V. للعب 2 × 2 أي استراتيجية عدو نقية نشطة إذا لم يكن هناك نقطة السرج. فوز لاعب أ (خسارة لاعب) - قيمة عشوائية، التوقع الرياضي (متوسط \u200b\u200bقيمة) منها سعر اللعبة. لذلك، فإن متوسط \u200b\u200bاللاعب يفوز (استراتيجية مثالية) سيكون مساويا ضد V ولإستراتيجية العدو الثانية. السماح للعبة بمصفوفة الدفع من أرباح المشغل العادي A، إذا كانت تستخدم الاستراتيجية المختلطة المثالية، واللاعب في الإستراتيجية النقية B1 (هذا يتوافق مع العمود الأول من مصفوفة الدفع P)، هو ثمن لعبة V: A11 P * 1 + A21 P * 2 \u003d v. نفس متوسط \u200b\u200bالمكاسب يتلقى اللاعب أما إذا كان اللاعب الثاني ينطبق على استراتيجية B2، I.E. A12 P * 1 + A22 P * 2 \u003d V. بالنظر إلى أن P * 1 + P * 2 \u003d 1، نحصل على نظام من المعادلات لتحديد الاستراتيجية المثلى S "A وأسعار اللعبة الخامسة: (3.6) حل هذا النظام، نحصل على الاستراتيجية المثلى (3.7) و سعر اللعبة (3.8) تطبيق نظرية الاستراتيجيات النشطة عند العثور على SV * - استراتيجية اللاعب المثلى، نحصل على ذلك مع أي استراتيجية نظيفة للاعب A (A1 أو A2)، فإن فقدان اللاعب المتوسط \u200b\u200bيساوي السعر من اللعبة الخامس، أي (3.9) يتم تحديد الاستراتيجية المثلى حسب الصيغ: (3.10)

استراتيجيات "نظيفة"

نحن معتادون بالفعل على عضادات. ومع ذلك، ماذا سيحدث إذا قمت بإزالة المياه الضحلة من سلسلة من أي استراتيجية؟ سنحصل على "استراتيجية نقية". الاستراتيجيات الخالصة هي تلك الموجودة في سلسلة تصرفاتها، والتي تتراوح من الجذر نفسه والجزء الفعال، لا توجد أي تهديدات دون فعالية (المياه الضحلة)، وقد يشهد ذلك في كثير من الأحيان فقط وجود جميع الوحدات في الوعي.

بالطبع، من وجهة نظر جميع النتائج الممكنة لتطبيق الاستراتيجية، من الصعب علينا أن نتحدث عن الأكثر كفاءة، لأننا ببساطة لا يمكننا أن لا يكون لدينا تجارب معينة، وبالتالي فإن بعض الاستراتيجيات المتوسطة، ولكن من تجربة، يجب أن تكون الاستراتيجية فعالة قدر الإمكان.

مفهوم الاستراتيجيات الخالصة هو أيضا واحدة من المواد الرئيسية في هذه المواد، لذلك سأقدم مثالا:

اخر النهار. أنت عجل المنزل في منطقتك المنزلية. الحليب يركض بعيدا. الطيران عن طريق "النوع المشبوه من نوع" تسمع عنوانك "مهلا، أنت، [الرقابة المنحوتة]. أنت لا تذهب هنا، والثلوج ضرب! ".

ماذا ستفعل؟ خيارات يمكن أن تكون كثيرا. سيجد شخص ما العلاقة، شخص ما خائف وتسريع خطوة، شخص ما يحول شيئا استجابة. ومع ذلك، دعونا نفكر في هذه الحالة في هذه الحالة هي استراتيجية سلوك نقي؟

شخص غير مألوف لك، شيء يصرخ لك في الشارع. لديك عملنا الخاص، الذي تذهب إليه بالفعل. من غير المرجح أن يكون الحكم من النص، فوائد إيجابية بالنسبة لك من التواصل مع هذا الشخص. الاستنتاج المنطقي: يذهب بهدوء إلى أبعد من شؤونك. أرسم الانتباه إلى حقيقة أنه "هادئ"، دون ظل مشاعر سلبيةوبإبالغة صحية لما يحدث. كم من الناس سوف يأتي ذلك؟ أفترض أن الأقلية الساحقة. لماذا ا؟

لأن معظم الناس لديهم طبقة كاملة من الاستراتيجيات اللاوعوية المرتبطة في الطبقات السفلية للحفاظ على الذات، ولا سيما تلك التي قد تكون: "يجبر دائما عن وقاحة الوقاحة"، إذا قال شخص ما القضيب، ثم تحتاج إلى تشغيل "،" إذا شخص ما Grubit - تحتاج إلى ملء وجهه، "إذا كان شخص ما وقحا، فهذا يعني وجود خطر" وما شابه ذلك في اختلافات مختلفة. بالطبع، لن يستغرق الجميع بعض الإجراءات النشطة، ولكن العاطفيا سيحضر الجميع تقريبا. وهذا هو عضادة.

الاستراتيجيات النظيفة دائما محايدة عاطفية أو إيجابية، ويتم وضعها في عقلك، فلا يزال فقط لاستخدامه.

يمكنك قراءة القليل من الاستراتيجيات النظيفة في الملاحظات "لماذا تنظيف الاستراتيجيات بالضبط؟" و "المنزل، هوبكينز، وهلم جرا".

من كتاب استراتيجية جينيف. البرت اينشتاين من قبل المؤلف ديلتس روبرت.

استراتيجيات 1. تعريف مصطلح "الاستراتيجية": أ) يأتي من الكلمة اليونانية "الإستراتيجية"، المعنى: "الزعيم العسكري"، "العلم، فن الحرب"، "فن إدارة النضال العام والسياسي". ب. ) خطة مفصلة لتحقيق هدف أو مربحة

من كتاب استراتيجية Geniyev (أرسطو شيرلوك هولمز والت ديزني فولفغانغ أماديوس موزارت) من قبل المؤلف ديلتس روبرت.

من الكتاب الذي تعرفه كيف تتعلم جيدا؟! كتاب مفيد للطلاب المهملة المؤلف Karpov aleksey

ستستمر استراتيجيات دراستك في مستوى مختلف تماما من الجودة إذا كنت تعتقد واختيار استراتيجية للعمل. العزيمة هي الخطة العامة. هذا هو خط مشترك مع الظروف الحقيقيةوبعد هذه هي الأهداف والمواعيد النهائية وعدم القدرة على التنبؤ والمحاسبة المنوعية ... هذا هو الشعور بالنبض

من الكتاب، واستراتيجية السبب والنجاح مؤلف Antipov Anatoly

من كتاب الفكر العاطفي من قبل المؤلف جولمان دانيال

معامل في الرياضيات او درجة التطور العقلي والفكري و الفكر العاطفي: أنواع نظيفة من معامل التنمية العقلية والذكاء العاطفي ليست في المعارضة، ولكنها منفصلة إلى حد ما. نحن جميعا يجمعون المخابرات مع حدة الخبرات؛ الناس مع عالية

من كتاب 12 معتقدات مسيحية يمكن أن تكون مجنونة المؤلف Townsend جون

النوايا المناسبة أو الأفكار النقية هي النية الصحيحة هي قرار القيام به بشكل صحيح. نختار قانون جيد وجيد إلى الله، وعادة دون التفكير فيما إذا كنا نريد حقا أن نجعله. فقط تفعل ذلك - وهذا كل شيء. العديد من الخطباء الإنجيليين

من الكتاب عن طريق الدخول في الحياة: جمع مؤلف كاتب غير معروف

رودولف إيفانوفيتش هابيل: "تذكر، كما قالت Dzerzhinsky:" الأيدي النظيفة، رأس بارد وقلب ساخن ... "أكثر من ثلاثين عاما رودولف إيفانوفيتش إيفيل أعطى العمل في الاستخبارات السوفيتية. حصل على ترتيب لينين، أوامران من راية حمراء، وترتيب العمل

من كتاب هومو العاقل. 2.0 [رجل معقول 2.0 http://hs2.me] بواسطة sapiens homo.

إستراتيجية

من كتاب Homo Sapiens 2.0 المؤلف Sapiens 2.0 هومو

استراتيجيات "نظيفة" مألوفة بالفعل في عضادات. ومع ذلك، ماذا سيحدث إذا قمت بإزالة المياه الضحلة من سلسلة من أي استراتيجية؟ سنحصل على "استراتيجية نقية". استراتيجيات نقية هي تلك الموجودة في سلسلة تصرفاتها، والتي تتراوح من الجذر نفسه وإلى الجزء الفعال، غائبة

من كتاب البداية. قطع الخوف من الوجه، توقف عن كونه "طبيعي" ويفعل شيئا جديرا بالاهتمام المؤلف Einkoff John.

من كتاب رجل مثل حيوان مؤلف نيكونوف ألكسندر بتروفيتش

استراتيجيات المفهوم العام للاستراتيجيات من حيث المبدأ، كل شيء في درجة واحدة أو آخر يفهم ما هي الاستراتيجية. الحصول على نوع من مجموعة المعرفة التي اكتسبت نتيجة اكتساب وتجربة تجهيزها، ونحن نبني نماذج معينة من السلوك. المدعى عليه نموذج لتحقيق الهدف.

من الكتاب، قم بتشغيل ذاكرة عملك للسلطة الكاملة بواسطة تريسي ellowyay

لماذا استراتيجيات نقية؟ يشير حصة الأسد من مواد هذا المشروع باستمرار إلى لحظة أنه من الضروري استخدام استراتيجيات نظيفة للكتابة والتأكد من البحث عن عضادة عليها. هذه اللحظة ليست واضحة للوهلة الأولى و

من كتاب الانطوائي في عالم المنفتح مؤلف المنطقة الرومانية إليزابيث

من كتاب المؤلف

من كتاب المؤلف

تتطلب استراتيجيات استراتيجيات الكمبيوتر مشغل التركيز، والقدرة على التخطيط لأفعالها وحل مجموعة متنوعة من المهام. تشير الدراسات الحديثة إلى أن الاستراتيجيات تساعد في تحسين المهارات المعرفية للاعبين في أي عمر. بالنسبة الى

من كتاب المؤلف

أنواع نظيفة هناك مثل هذا المفهوم - "نظيفة النوع النفسي" في الواقع، هناك مفهوم وعناصر، وهذا هو، لا يوجد أي أشخاص غير مناسبين لهذا المفهوم بشكل مثالي. لا الانطوائيون الأصيلة والفتحات التي لا لبس فيها. علاوة على ذلك، اتفقنا

ويطلق اختيار لاعب هذا أو هذا الإجراء عن طريقوبعد يطلق النار على شخصي (يقبل اللاعب عمدا هذا أو هذا القرار) عشوائي (لا تعتمد نتائج اللعبة على إرادة اللاعب). تم استدعاء مجموعة من القواعد التي تحدد الدورة التدريبية التي يجب القيام بها إستراتيجيةوبعد الاستراتيجيات هناك ينظف (حلول اللاعب غير عشوائي) و مختلط (يمكن اعتبار الاستراتيجية مبلغا عشوائيا).

سيددو نقطة

في نظرية اللعبة شارع. ( عنصر السرج) - هذا هو أكبر عنصر في العمود ألعاب مصفوفةوهو في نفس الوقت أصغر عنصر في الخط المقابل (في لعبة شخصين مع مبلغ صفر). عند هذه النقطة، لذلك، ماكسيمين من لاعب واحد يساوي الحد الأدنى من الآخر؛ س. ر. لديك نقطة حالة توازن.

minixse نظرية

يتم استدعاء الاستراتيجية المقابلة للمتنزه استراتيجية minimax..

يطلق على المبدأ، الإملاء اللاعبين، واختيار استراتيجيات الحد الأقصى "الحذر" والحذر " مبدأ minimaxوبعد يتبع هذا المبدأ من افتراض معقول أن كل لاعب يسعى لتحقيق الهدف المعاكس لهدف العدو.

يختار اللاعب تصرفاته، على افتراض أن العدو سيصرف غير مواتية، أي سيحاول "الضرر".

فقدان وظيفة

فقدان وظيفة - وظيفة ذلك من الناحية النظرية الحلول الإحصائية إنه يميز الخسارة في صنع القرارات غير الصحيحة بناء على البيانات المرصودة. إذا تم حل مهمة تقدير معلمة الإشارة على خلفية التداخل، فإن وظيفة الخسارة هي مقياس للتناقضات بين المعنى الحقيقي المعلمة المقدرة وتقدير المعلمة

استراتيجية اللاعب المختلط الأمثل - هذه مجموعة كاملة من استراتيجياتها النظيفة في تكرار اللعبة في نفس الشروط مع الاحتمالات المحددة.

تعد الإستراتيجية المختلطة للاعب مجموعة كاملة من تطبيق استراتيجياتها الصافية في تكرار اللعبة في نفس الشروط مع الاحتمالات المحددة.

1. إذا لم تكن جميع عناصر السلسلة عناصر خطية أخرى، فيمكن حذف السلسلة المصدر من مصفوفة الدفع. على غرار الأعمدة.

2. سعر اللعبة هو الوحيد.

الرصيف: لنفترض أن هناك 1 ألعاب الأسعار الخامس. وهذا يتحقق على زوج، وبالتالي، إذن

3. إذا أضفت جميع عناصر مصفوفة الدفع نفس الرقم، فلن تتغير الاستراتيجيات المختلطة الأمثل، وسيزيد سعر اللعبة بهذا الرقم.

الرصيف:
أين

4. إذا كانت جميع عناصر مصفوفة الدفع مضاعفة بنفس الرقم لا يساوي الصفر، فإن سعر اللعبة يضاعف على هذا الرقم، والاستراتيجيات المثلى لن تتغير.

© 2021 Skudelnica.ru - الحب، الخيانة، علم النفس، الطلاق، المشاعر، المشاجرات