مفهوم نماذج اللعبة. مصفوفة الدفع

الصفحة الرئيسية / تخون زوجها

ضع في اعتبارك لعبة زوجية محدودة. دع اللاعب لكنلديها تيالاستراتيجيات الشخصية التي نشير إليها

دع اللاعب فيمتوفرة صالاستراتيجيات الشخصية ، دعنا نشير إليها. يقولون أن اللعبة لها بعد تي X ص.

نتيجة لاختيار اللاعبين لأي زوج من الإستراتيجيات ، يتم تحديد نتيجة اللعبة بشكل فريد ، أي يفوز لكن؛. لاعب لكن(إيجابي أو سلبي) وخاسر (-ay)لاعب في.لنفترض أن القيم لكن..معروف بأي زوج من الإستراتيجيات (أ: ، ب؛.). المصفوفة ف =(أ..)، أنا == 1, 2, ..., إم جي = 1, 2, ..., فعناصرها هي المكافآت المقابلة للاستراتيجيات لكن.و BJمسمى مصفوفة الدفعأو مصفوفة اللعبة. الشكل العاميتم عرض هذه المصفوفة في الجدول. 12.1. تتوافق صفوف هذا الجدول مع استراتيجيات اللاعب لكن،والأعمدة هي استراتيجيات اللاعب في.

الجدول 12.1

دعونا نجعل مصفوفة المكافآت للمباراة التالية.

12.1. لعبة البحث.

لاعب لكنيمكن أن تختبئ في أحد الملاجئ (الأول والثاني) ؛ لاعب فيتبحث عن لاعب لكن،وإذا وجد فيحصل على غرامة دن. الوحدات من لكن،خلاف ذلك يدفع للاعب لكنيوم 1 الوحدات من الضروري بناء مصفوفة المكافآت للعبة.

د ه س ه. لتجميع مصفوفة المكافآت ، من الضروري تحليل سلوك كل من اللاعبين. لاعب لكنيمكن أن تختبئ في المأوى الأول - نشير إلى هذه الاستراتيجية من خلال أ v أما في المأوى الثاني - الإستراتيجية لكن.ز لاعب فييمكن أن تبحث عن اللاعب الأول في الملجأ الأول - الإستراتيجية في(أو في المأوى II - إستراتيجية في.،.إذا كان اللاعب لكنهو في مخبأ واكتشفه اللاعب هناك في،أولئك. يتم تنفيذ استراتيجيتين ν في{), ثم اللاعب لكنيدفع غرامة ، أي لكنن = -1. وبالمثل نحصل عليه لكن.ن = -1 (لكن 2، في.،).من الواضح أن الاستراتيجيات (أ ، في.،)و (R2، / 1) أعط اللاعب لكنفوز 1 ، لذلك لكنص = أ. n = I. وهكذا ، بالنسبة إلى "بحث" اللعبة بحجم 2x2 ، نحصل على مصفوفة المكافآت:

تأمل اللعبة تي X صمع المصفوفة ف = أي) ، أنا = 1,2, ..., τη ؛ ي= 1 ، 2 ، ... ، وتحديد الأفضل بين الاستراتيجيات لكنفي أالخامس...، لكنم اختيار الاستراتيجية ألاعب جي لكنيجب أن يتوقع اللاعب فيستجيب عليه بإحدى الاستراتيجيات في.،التي مكافأة للاعب لكنالحد الأدنى (لاعب فييسعى إلى "إيذاء" اللاعب لكن).

تدل عليه أ ؛ أدنى مكافأة للاعب لكنعندما يختار الإستراتيجية L ؛ لجميع استراتيجيات اللاعب الممكنة في(أصغر رقم في أنا خطمصفوفة المكافآت) ، أي

من بين جميع الأرقام أ (ص = 1،2 ، ... ، تي)اختر الأكبر:. لنتصل وانخفاض سعر اللعبة ،أو الحد الأقصى للمكافأة (الحد الأقصى).هذه مكافأة مضمونة للاعب "أ" لأي إستراتيجية للاعب "ب".بالتالي،

(12.2)

يتم استدعاء الإستراتيجية المقابلة للمبدأ الأقصى استراتيجية maximin.لاعب فيمهتم بتقليل أرباح اللاعب لكن؛اختيار استراتيجية في.،يأخذ في الاعتبار أقصى قدر ممكن من المردود ل لكن.دل

من بين كل الأرقام β. اختر الأصغر

وندعو β أعلى سعر اللعبة، أو الحد الأدنى للمكافأة (الحد الأدنى).هذه خسارة مضمونة للاعب B.بالتالي،

(12.4)

تسمى استراتيجية minimax استراتيجية minimax.

يُطلق على المبدأ الذي يُملي على اللاعبين اختيار استراتيجيات minimax و maximin الأكثر "حذرًا" مبدأ مينيماكس.ينبع هذا المبدأ من الافتراض المعقول بأن كل لاعب يسعى إلى تحقيق الهدف المعاكس للخصم. دعونا نحدد الأسعار الدنيا والعليا للعبة والاستراتيجيات المقابلة لها في المشكلة 12.1. ضع في اعتبارك مصفوفة المكافآت

من المشكلة 12.1. عند اختيار الإستراتيجية A ، (الصف الأول من المصفوفة) ، فإن الحد الأدنى للمكافأة يساوي a ، = min (-l ؛ 1) = -1 ويتوافق مع الإستراتيجية β1 للاعب في.عند اختيار الإستراتيجية إل 2 (الصف الثاني من المصفوفة) الحد الأدنى للمكافأة هو لكن 2 = min (l؛ -1) = -1 ، يتم تحقيقها باستخدام الإستراتيجية في.،.

ضمان نفسك أقصى فوزلأية استراتيجية للاعب في، بمعنى آخر. السعر الأدنى للعبة a = max (a، a2) = max (-l؛ -1) = -1 ، لاعب لكنيمكنك اختيار أي استراتيجية: Aj أو لكن 2 ، أي أي من إستراتيجياته هي ماكسيمين.

اختيار الإستراتيجية ب (العمود 1) اللاعب فييفهم أن اللاعب لكنسوف تستجيب مع استراتيجية لكن 2 لتعظيم مكاسبك (خسارة في).لذلك ، فإن الخسارة القصوى للاعب فيعندما يختار الإستراتيجية B ، تساوي β ، = max (-1 ؛ 1) = 1.

وبالمثل ، فإن أقصى خسارة للاعب B (كسب لكن) عندما يختار الإستراتيجية B2 (العمود 2) تساوي β2 = max (l ؛ -1) = 1.

وهكذا ، لأية استراتيجية للاعب لكنالحد الأدنى المضمون للخسارة للاعب B يساوي β = πιίη (β1، β2) = min (l؛ 1) = 1- أعلى سعر للعبة.

أي استراتيجية للاعب B هي بحد أدنى. عن طريق إضافة الجدول. 12.1 سطر β ؛ والعمود أ ؛ نحصل على الجدول. 12.2. عند تقاطع صفوف وأعمدة إضافية ، سنقوم بتسجيل الأسعار العلوية والسفلية للألعاب.

الجدول 12.2

في المشكلة 12.1 أعلاه ، تختلف التكاليف العلوية والسفلية للعبة: أ و β.

إذا كان السعران العلوي والسفلي للعبة متماثلين ، إذن معنى عامأعلى و سعر منخفضاللعبة α = β = تسمى السعر الصافي للعبة ،أو سعر اللعبة.استراتيجيات minimax المقابلة لسعر اللعبة هي الاستراتيجيات المثلىوكاملها الحل الأمثلأو قرارألعاب. في هذه الحالة اللاعب لكنيتلقى الحد الأقصى المضمون (بغض النظر عن سلوك اللاعب) في)المردود υ ، واللاعب فييحقق الحد الأدنى المضمون (بغض النظر عن سلوك اللاعب L) الخسارة υ. يقال أن الحل لهذه اللعبة المزيد،أولئك. إذا التزم أحد اللاعبين بإستراتيجيته المثلى ، فلن يكون من المفيد للآخر أن ينحرف عن إستراتيجيته المثلى.

زوج استراتيجيات خالصة لكن.و B. يعطي الحل الأمثل للعبة إذا وفقط إذا كان العنصر المقابل r هو الأكبر في عمودها والأصغر في صفها. مثل هذا الموقف ، إذا كان موجودًا ، يسمى نقطة سرج(على غرار سطح السرج الذي ينحني لأعلى في اتجاه واحد ولأسفل في الاتجاه الآخر).

دل لكن*و في*هما زوجان من الاستراتيجيات الخالصة التي يتم من خلالها الوصول إلى حل اللعبة في مشكلة نقطة السرج. دعونا نقدم وظيفة المكافأة للاعب الأول في كل زوج من الاستراتيجيات: ص (أ:، في-) = وعلى. ثم شرط الأمثل عند نقطة السرج يلبي عدم المساواة المزدوجة: ف (أج ، ب *)<Р(А*, В*)<Р(А", В ), وهو ما ينطبق على الجميع أنا = 1, 2, ..., م ؛ ي = 1, 2, ..., ص.في الواقع ، اختيار الاستراتيجية لكن* اللاعب الأول في ظل الإستراتيجية المثلى في"اللاعب الثاني يزيد من الحد الأدنى الممكن للمكافأة: ص (أ*, ب")> ص (أجي في")،واختيار الاستراتيجية ب"اللاعب الثاني ، مع الإستراتيجية المثلى للاعب الأول ، يقلل من الحد الأقصى للخسارة: P (D ، في*)<Р(А", В).

12.2. حدد السعر الأدنى والأعلى للعبة الذي قدمته مصفوفة المكافآت

هل اللعبة لها نقطة سرج؟

الجدول 12 3

المحلول.يتم إجراء جميع الحسابات بشكل ملائم في جدول ، بالإضافة إلى المصفوفة R ،دخلت العمود أ ؛ وخط)

© 2022 skudelnica.ru - الحب والخيانة وعلم النفس والطلاق والمشاعر والمشاجرات