ശുദ്ധമായ തന്ത്ര ഗെയിമുകൾ. എലീന വെന്റ്സെൽ

വീട് / വഴക്കിടുന്നു

തിയറി ഗെയിം സ്ട്രാറ്റജി മിക്സഡ്

സമ്മിശ്ര തന്ത്രങ്ങൾ

ഒരു മാട്രിക്സ് ഗെയിമിന് ശുദ്ധമായ തന്ത്രങ്ങളിൽ സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഗെയിമിന്റെ ഉയർന്നതും താഴ്ന്നതുമായ വിലകൾ കണ്ടെത്തും. പ്ലെയർ 1 ന് ഗെയിമിന്റെ ഉയർന്ന വിലയേക്കാൾ വലിയ പ്രതിഫലം ലഭിക്കില്ലെന്നും, ഗെയിമിന്റെ ഏറ്റവും കുറഞ്ഞ വിലയേക്കാൾ കുറഞ്ഞ പ്രതിഫലം പ്ലെയർ 1ന് ഉറപ്പുനൽകുന്നുവെന്നും അവർ കാണിക്കുന്നു.

ഒരു കളിക്കാരന്റെ മിക്സഡ് സ്ട്രാറ്റജി എന്നത് അവന്റെ ശുദ്ധമായ തന്ത്രങ്ങളുടെ ഒരു സമ്പൂർണ്ണ സെറ്റാണ്, നൽകിയിരിക്കുന്ന സാധ്യതകളോടെ ഒരേ സാഹചര്യങ്ങളിൽ ഗെയിം പലതവണ ആവർത്തിക്കുമ്പോൾ. പറഞ്ഞ കാര്യങ്ങൾ സംഗ്രഹിച്ച് ഉപയോഗ വ്യവസ്ഥകൾ പട്ടികപ്പെടുത്താം സമ്മിശ്ര തന്ത്രങ്ങൾ:

  • * സാഡിൽ പോയിന്റില്ലാത്ത ഗെയിം;
  • * കളിക്കാർ നൽകിയിരിക്കുന്ന സാധ്യതകളുള്ള ശുദ്ധമായ തന്ത്രങ്ങളുടെ ക്രമരഹിതമായ മിശ്രിതം ഉപയോഗിക്കുന്നു;
  • * സമാനമായ സാഹചര്യങ്ങളിൽ ഗെയിം നിരവധി തവണ ആവർത്തിക്കുന്നു;
  • * ഓരോ നീക്കത്തിലും, മറ്റ് കളിക്കാരൻ തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിനെക്കുറിച്ച് ഒരു കളിക്കാരനെയും അറിയിക്കില്ല;
  • * ഗെയിം ഫലങ്ങളുടെ ശരാശരി അനുവദനീയമാണ്.

സമ്മിശ്ര തന്ത്രങ്ങൾക്കായി ഇനിപ്പറയുന്ന പദവികൾ ഉപയോഗിക്കുന്നു.

പ്ലെയർ 1-ന്, ഒരു സമ്മിശ്ര തന്ത്രം ശുദ്ധമായ തന്ത്രങ്ങൾ A 1, A 2, ..., A t എന്നിവയുമായി ബന്ധപ്പെട്ട പ്രോബബിലിറ്റികൾ ഉപയോഗിച്ച് p 1, p 2, ..., p t എന്നിവ ഉൾക്കൊള്ളുന്നു.

കളിക്കാരന് 2

q j എന്നത് ശുദ്ധമായ തന്ത്രം B j ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യതയാണ്.

p i = 1 ആണെങ്കിൽ, പ്ലെയർ 1-ന് നമുക്ക് ഒരു ശുദ്ധമായ തന്ത്രമുണ്ട്

കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രങ്ങൾ മാത്രമാണ് സാധ്യമായ പൊരുത്തപ്പെടാത്ത ഇവന്റുകൾ. ഒരു മാട്രിക്സ് ഗെയിമിൽ, മാട്രിക്സ് എ അറിയുന്നത് (ഇത് പ്ലെയർ 1 നും പ്ലെയർ 2 നും ബാധകമാണ്), എപ്പോൾ എന്ന് നമുക്ക് നിർണ്ണയിക്കാനാകും നൽകിയ വെക്റ്ററുകൾശരാശരി വിജയങ്ങളും ( പ്രതീക്ഷിച്ച മൂല്യംപ്രഭാവം) പ്ലെയർ 1:

വെക്‌ടറുകൾ എവിടെയാണ്,

p i, q i എന്നിവ വെക്റ്ററുകളുടെ ഘടകങ്ങളാണ്.

അവരുടെ സമ്മിശ്ര തന്ത്രങ്ങൾ പ്രയോഗിക്കുന്നതിലൂടെ, കളിക്കാരൻ 1 തന്റെ ശരാശരി പ്രതിഫലം പരമാവധിയാക്കാൻ ശ്രമിക്കുന്നു, കൂടാതെ പ്ലെയർ 2 ഈ പ്രഭാവം സാധ്യമായ ഏറ്റവും കുറഞ്ഞ മൂല്യത്തിലേക്ക് കുറയ്ക്കാൻ ശ്രമിക്കുന്നു. പ്ലെയർ 1 എത്താൻ ശ്രമിക്കുന്നു

പ്ലെയർ 2 വ്യവസ്ഥ പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുന്നു

1, 2 എന്നീ കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുമായി ബന്ധപ്പെട്ട വെക്റ്ററുകളും നമുക്ക് സൂചിപ്പിക്കാം, അതായത്. അത്തരം വെക്‌ടറുകൾ, അതിനായി തുല്യത തൃപ്തിപ്പെടുത്തും

രണ്ട് കളിക്കാരും സമ്മിശ്ര തന്ത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ പ്ലെയർ 1 ന്റെ ശരാശരി പ്രതിഫലമാണ് ഗെയിമിന്റെ വില. അതിനാൽ, മാട്രിക്സ് ഗെയിമിനുള്ള പരിഹാരം ഇതാണ്:

  • - പ്ലെയർ 1-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി;
  • - പ്ലെയർ 2-നുള്ള ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി;

ഗെയിം വില.

മിക്സഡ് സ്ട്രാറ്റജികൾ ഒപ്റ്റിമൽ ആയിരിക്കും (ഒപ്പം) അവ ഫംഗ്ഷനായി ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടാക്കുകയാണെങ്കിൽ, അതായത്.

ഗണിത ഗെയിമുകൾക്ക് ഒരു അടിസ്ഥാന സിദ്ധാന്തമുണ്ട്.

ഏതെങ്കിലും മാട്രിക്സ് A ഉള്ള മാട്രിക്സ് ഗെയിമിനായി

നിലനിൽക്കുന്നതും പരസ്പരം തുല്യവുമാണ്: = = .

ഒപ്റ്റിമൽ സ്ട്രാറ്റജികൾ തിരഞ്ഞെടുക്കുമ്പോൾ, പ്ലെയർ 2-ന്റെ ഏതൊരു നിശ്ചിത തന്ത്രത്തിനും (പിന്നിൽ, പ്ലെയർ 2-ന് വേണ്ടി, കളിയുടെ വിലയേക്കാൾ കുറയാത്ത, ശരാശരി പ്രതിഫലം പ്ലെയർ 1-ന് എല്ലായ്പ്പോഴും ഉറപ്പുനൽകും എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്. 1, 2 കളിക്കാരുടെ സജീവ തന്ത്രങ്ങൾ പൂജ്യം ഒഴികെയുള്ള സാധ്യതകളുള്ള അനുബന്ധ കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുടെ ഭാഗമായ തന്ത്രങ്ങളാണ്. ഇതിനർത്ഥം കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളിൽ അവരുടെ എല്ലാ മുൻഗണനാ തന്ത്രങ്ങളും ഉൾപ്പെട്ടേക്കില്ല എന്നാണ്.

ഒരു ഗെയിം പരിഹരിക്കുക എന്നതിനർത്ഥം ഗെയിമിന്റെ വിലയും ഒപ്റ്റിമൽ തന്ത്രങ്ങളും കണ്ടെത്തുക എന്നാണ്. മാട്രിക്സ് ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള രീതികളെക്കുറിച്ചുള്ള നമ്മുടെ പരിഗണന ആരംഭിക്കാം ഏറ്റവും ലളിതമായ ഗെയിം, മാട്രിക്സ് 22 വിവരിച്ചിരിക്കുന്നു. സാഡിൽ പോയിന്റുള്ള ഗെയിമുകൾ പ്രത്യേകമായി പരിഗണിക്കില്ല. ഒരു സാഡിൽ പോയിന്റ് ലഭിക്കുകയാണെങ്കിൽ, ഉപേക്ഷിക്കപ്പെടേണ്ട ലാഭകരമല്ലാത്ത തന്ത്രങ്ങൾ ഉണ്ടെന്നാണ് ഇതിനർത്ഥം. ഒരു സാഡിൽ പോയിന്റിന്റെ അഭാവത്തിൽ, രണ്ട് ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ ലഭിക്കും. ഇതിനകം സൂചിപ്പിച്ചതുപോലെ, ഈ സമ്മിശ്ര തന്ത്രങ്ങൾ ഇനിപ്പറയുന്ന രീതിയിൽ എഴുതിയിരിക്കുന്നു:

ഇതിനർത്ഥം ഒരു പേയ്മെന്റ് മാട്രിക്സ് ഉണ്ടെന്നാണ്

a 11 p 1 + a 21 p 2 = ; (1.16)

a 12 p 1 + a 22 p 2 = ; (1.17)

p 1 + p 2 = 1. (1.18)

a 11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

a 11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1 , (1.20)

ഇവിടെ നമുക്ക് ഒപ്റ്റിമൽ മൂല്യങ്ങൾ ലഭിക്കും:

അറിയുന്നതും, ഞങ്ങൾ കണ്ടെത്തുന്നതും:

കണക്കാക്കിയ ശേഷം, ഞങ്ങൾ കണ്ടെത്തുന്നു:

a 11 q 1 + a 12 q 2 = ; q 1 + q 2 = 1; (1.24)

a 11 q 1 + a 12 (1 - q 1) = . (1.25)

ഒരു 11 മുതൽ 12 വരെ. (1.26)

വെക്റ്ററുകളും ഗെയിമിന്റെ വിലയും കണ്ടെത്തിയതിനാൽ പ്രശ്നം പരിഹരിച്ചു. പേയ്‌മെന്റ് മാട്രിക്സ് A ഉള്ളതിനാൽ, നിങ്ങൾക്ക് ഗ്രാഫിക്കായി പ്രശ്നം പരിഹരിക്കാനാകും. ഈ രീതി ഉപയോഗിച്ച്, പരിഹാര അൽഗോരിതം വളരെ ലളിതമാണ് (ചിത്രം 2.1).

  • 1. യൂണിറ്റ് നീളത്തിന്റെ ഒരു ഭാഗം abscissa അക്ഷത്തിൽ പ്ലോട്ട് ചെയ്തിരിക്കുന്നു.
  • 2. സ്ട്രാറ്റജി A 1-ന്റെ വിജയങ്ങൾ y-ആക്സിസ് കാണിക്കുന്നു.
  • 3. ഓർഡിനേറ്റിന് സമാന്തരമായ ഒരു വരിയിൽ, പോയിന്റ് 1-ൽ, തന്ത്രം a 2-ന്റെ വിജയങ്ങൾ പ്ലോട്ട് ചെയ്യുന്നു.
  • 4. സെഗ്‌മെന്റുകളുടെ അറ്റങ്ങൾ a 11 -b 11, a 12 -b 21, a 22 -b 22, a 21 -b 12 എന്നിവയ്ക്കായി നിയുക്തമാക്കിയിരിക്കുന്നു കൂടാതെ രണ്ട് നേർരേഖകൾ b 11 b 12, b 21 b 22 എന്നിവ വരയ്ക്കുന്നു.
  • 5. വിഭജനത്തിന്റെ പോയിന്റിന്റെ ഓർഡിനേറ്റ് നിർണ്ണയിക്കപ്പെടുന്നു. അവൾ തുല്യമാണ്. പോയിന്റ് c യുടെ abscissa p 2 (p 1 = 1 - p 2) ന് തുല്യമാണ്.

അരി. 1.1

ഈ രീതിക്ക് വളരെ വിശാലമായ ആപ്ലിക്കേഷൻ ഏരിയയുണ്ട്. ഇത് അടിസ്ഥാനമാക്കിയുള്ളതാണ് പൊതു സ്വത്ത്ഗെയിമുകൾ TP, ഏത് ഗെയിമിലും TP ഓരോ കളിക്കാരനും ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി ഉണ്ട്, അതിൽ ശുദ്ധമായ തന്ത്രങ്ങളുടെ എണ്ണം min(m, n) നേക്കാൾ കൂടുതലല്ല. ഈ പ്രോപ്പർട്ടിയിൽ നിന്ന് നമുക്ക് അറിയപ്പെടുന്ന ഒരു പരിണതഫലം ലഭിക്കും: ഏത് ഗെയിമിലും 2n, m2, ഓരോ ഒപ്റ്റിമൽ സ്ട്രാറ്റജിയിലും പരമാവധി രണ്ട് സജീവ തന്ത്രങ്ങൾ അടങ്ങിയിരിക്കുന്നു. ഇതിനർത്ഥം ഏത് ഗെയിമും 2n, m2 എന്നിവ ഗെയിം 22 ആയി ചുരുക്കാം. തൽഫലമായി, 2n, m2 ഗെയിമുകൾ ഗ്രാഫിക്കായി പരിഹരിക്കാനാകും. പരിമിതമായ ഗെയിം മാട്രിക്‌സിന് mn ഡയമൻഷൻ ഉണ്ടെങ്കിൽ, ഇവിടെ m > 2, n > 2, ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ നിർണ്ണയിക്കാൻ ലീനിയർ പ്രോഗ്രാമിംഗ് ഉപയോഗിക്കുന്നു.

5. ഗെയിമുകളുടെയും സ്റ്റാറ്റിസ്റ്റിക്കൽ തീരുമാനങ്ങളുടെയും സിദ്ധാന്തം

5.1 സീറോ-സം മാട്രിക്സ് ഗെയിം

സാമ്പത്തികവും ഗണിതശാസ്ത്രപരവുമായ മോഡലിംഗ് ഇനിപ്പറയുന്ന വ്യവസ്ഥകളിൽ നടപ്പിലാക്കുന്നു:

ഉറപ്പ്;

അനിശ്ചിതത്വങ്ങൾ.

മോഡലിംഗ് ഉറപ്പുള്ള സാഹചര്യങ്ങളിൽ ഇതിന് ആവശ്യമായ എല്ലാ പ്രാരംഭ റെഗുലേറ്ററി ഡാറ്റയുടെയും ലഭ്യത അനുമാനിക്കുന്നു (മാട്രിക്സ് മോഡലിംഗ്, നെറ്റ്‌വർക്ക് പ്ലാനിംഗ്, മാനേജുമെന്റ്).

മോഡലിംഗ് അപകടത്തിലാണ് ചില പ്രാരംഭ ഡാറ്റയുടെ മൂല്യങ്ങൾ ക്രമരഹിതവും ഈ ക്രമരഹിതമായ വേരിയബിളുകളുടെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷന്റെ നിയമങ്ങൾ അറിയപ്പെടുമ്പോൾ (റിഗ്രഷൻ വിശകലനം, ക്യൂയിംഗ് സിദ്ധാന്തം) സ്ഥാപിതമായ അനിശ്ചിതത്വത്തിലാണ് നടത്തുന്നത്.

മോഡലിംഗ് അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ യോജിക്കുന്നു പൂർണ്ണമായ അഭാവംഇതിന് ആവശ്യമായ ചില ഡാറ്റ (ഗെയിം തിയറി).

ഒപ്റ്റിമൽ തീരുമാനങ്ങൾ എടുക്കുന്നതിനുള്ള ഗണിതശാസ്ത്ര മാതൃകകൾ സംഘർഷ സാഹചര്യങ്ങൾഅനിശ്ചിതത്വത്തിന്റെ സാഹചര്യത്തിലാണ് നിർമ്മിച്ചിരിക്കുന്നത്.

ഗെയിം സിദ്ധാന്തം ഇനിപ്പറയുന്ന അടിസ്ഥാന ആശയങ്ങളുമായി പ്രവർത്തിക്കുന്നു:

തന്ത്രം;

വിൻ ഫംഗ്‌ഷൻ.

യാത്രയിലാണ് ഗെയിമിന്റെ നിയമങ്ങൾക്കായി നൽകിയിരിക്കുന്ന ഒരു പ്രവർത്തനത്തിന്റെ കളിക്കാരന്റെ തിരഞ്ഞെടുപ്പും നടപ്പിലാക്കലും ഞങ്ങൾ വിളിക്കും.

തന്ത്രം - നിലവിലെ സാഹചര്യത്തെ ആശ്രയിച്ച് ഓരോ നീക്കത്തിലും ഒരു പ്രവർത്തന ഓപ്ഷൻ തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാങ്കേതികവിദ്യയാണിത്.

വിൻ ഫംഗ്‌ഷൻ തോൽക്കുന്ന കളിക്കാരനിൽ നിന്ന് വിജയിക്കുന്നയാൾക്കുള്ള പേയ്‌മെന്റ് തുക നിർണ്ണയിക്കാൻ സഹായിക്കുന്നു.

ഒരു മാട്രിക്സ് ഗെയിമിൽ, പേഓഫ് ഫംഗ്ഷൻ ഇതായി പ്രതിനിധീകരിക്കുന്നു പേയ്മെന്റ് മാട്രിക്സ് :

നീക്കം തിരഞ്ഞെടുത്ത പ്ലെയർ II-ൽ നിന്ന് നീക്കം തിരഞ്ഞെടുത്ത കളിക്കാരൻ I-ക്കുള്ള പേയ്‌മെന്റ് തുക എവിടെയാണ്.

അത്തരമൊരു ജോടിയാക്കിയ ഗെയിമിൽ, ഓരോ സാഹചര്യത്തിലും രണ്ട് കളിക്കാരുടെയും പേഓഫ് ഫംഗ്‌ഷനുകളുടെ മൂല്യങ്ങൾ വലുപ്പത്തിൽ തുല്യവും ചിഹ്നത്തിൽ വിപരീതവുമാണ്, അതായത്. ഈ ഗെയിമിനെ വിളിക്കുന്നു പൂജ്യം തുക .

"മാട്രിക്സ് ഗെയിം കളിക്കുന്ന" പ്രക്രിയ ഇനിപ്പറയുന്ന രീതിയിൽ പ്രതിനിധീകരിക്കുന്നു:

പേയ്മെന്റ് മാട്രിക്സ് സജ്ജീകരിച്ചിരിക്കുന്നു;

പ്ലെയർ I, പ്ലെയർ II പരിഗണിക്കാതെ, ഈ മാട്രിക്സിന്റെ വരികളിലൊന്ന് തിരഞ്ഞെടുക്കുന്നു, ഉദാഹരണത്തിന്, -th;

പ്ലെയർ I, പരിഗണിക്കാതെ തന്നെ പ്ലെയർ II, ഈ മാട്രിക്സിന്റെ നിരകളിൽ ഒന്ന് തിരഞ്ഞെടുക്കുന്നു, ഉദാഹരണത്തിന്, - th;

പ്ലെയർ II-ൽ നിന്ന് എനിക്ക് എത്ര പ്ലേയർ ലഭിക്കുമെന്ന് മാട്രിക്സ് ഘടകം നിർണ്ണയിക്കുന്നു. തീർച്ചയായും, എങ്കിൽ, പിന്നെ ഞങ്ങൾ സംസാരിക്കുന്നത്ഐ കളിക്കാരന്റെ യഥാർത്ഥ നഷ്ടത്തെക്കുറിച്ച്.

പേഓഫ് മാട്രിക്സുള്ള ഒരു വിരുദ്ധ ജോടിയാക്കിയ ഗെയിമിനെ ഞങ്ങൾ ഗെയിം എന്ന് വിളിക്കും.

ഉദാഹരണം

നമുക്ക് കളി പരിഗണിക്കാം.

പേയ്മെന്റ് മാട്രിക്സ് സജ്ജീകരിച്ചിരിക്കുന്നു:

.

പ്ലെയർ II-ൽ നിന്ന് സ്വതന്ത്രമായി, ഈ മാട്രിക്സിന്റെ 3-ാം വരി തിരഞ്ഞെടുക്കാൻ പ്ലെയർ I അനുവദിക്കുക, കൂടാതെ പ്ലെയർ I-ൽ നിന്ന് സ്വതന്ത്രമായി പ്ലെയർ II, ഈ മാട്രിക്സിന്റെ 2-ാം നിര തിരഞ്ഞെടുക്കട്ടെ:

അപ്പോൾ പ്ലെയർ I-ൽ നിന്ന് 9 യൂണിറ്റുകൾ പ്ലേയർ ഐക്ക് ലഭിക്കും.

5.2 ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒപ്റ്റിമൽ പ്യുവർ സ്ട്രാറ്റജി

ഒപ്റ്റിമൽ തന്ത്രം പ്ലെയർ I യുടെ ഒരു തന്ത്രം എന്ന് വിളിക്കുന്നു, അതിൽ പ്ലെയർ II ന്റെ ഏതെങ്കിലും തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിനുള്ള തന്റെ വിജയങ്ങൾ കുറയ്ക്കില്ല, കൂടാതെ കളിക്കാരൻ I യുടെ ഏതെങ്കിലും തന്ത്രത്തിന്റെ തിരഞ്ഞെടുപ്പിന് നഷ്ടം വർദ്ധിപ്പിക്കാത്ത പ്ലെയർ II ന്റെ അത്തരമൊരു തന്ത്രം.

ഒരു നീക്കമായി പേഓഫ് മാട്രിക്‌സിന്റെ വരി തിരഞ്ഞെടുക്കുന്നതിലൂടെ, പ്ലെയർ II ഈ മൂല്യം കുറയ്ക്കാൻ ശ്രമിക്കുമ്പോൾ, ഏറ്റവും മോശം സാഹചര്യത്തിൽ മൂല്യത്തിൽ കുറയാതെ വിജയിക്കുമെന്ന് പ്ലെയർ I ഉറപ്പാക്കുന്നു. അതിനാൽ, കളിക്കാരൻ അവന് നൽകുന്ന വരി ഞാൻ തിരഞ്ഞെടുക്കും പരമാവധി വിജയം:

.

പ്ലെയർ II സമാനമായി വാദിക്കുന്നു, തീർച്ചയായും കുറഞ്ഞ നഷ്ടം ഉറപ്പാക്കാൻ കഴിയും:

.

അസമത്വം എല്ലായ്പ്പോഴും ശരിയാണ്:

അളവ് വിളിക്കുന്നു കുറഞ്ഞ വിലഗെയിമുകൾ .

അളവ് വിളിക്കുന്നു ഗെയിമിന്റെ ഉയർന്ന വില .

ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ വിളിക്കുന്നു ശുദ്ധമായ , അവർക്ക് തുല്യത നിലനിൽക്കുകയാണെങ്കിൽ:

,

.

അളവ് വിളിക്കുന്നു കളിയുടെ ശുദ്ധമായ വിലയിൽ , എങ്കിൽ.

ഒപ്റ്റിമൽ ശുദ്ധമായ തന്ത്രങ്ങൾ രൂപം സാഡിൽ പോയിന്റ് പേയ്മെന്റ് മാട്രിക്സ്.

ഒരു സാഡിൽ പോയിന്റിനായി ഇനിപ്പറയുന്ന വ്യവസ്ഥകൾ പാലിക്കുന്നു:

അതായത്, മൂലകം വരിയിലെ ഏറ്റവും ചെറുതും നിരയിലെ ഏറ്റവും വലുതുമാണ്.

അങ്ങനെ, പേഓഫ് മാട്രിക്സ് ഉണ്ടെങ്കിൽ സാഡിൽ പോയിന്റ് , അപ്പോൾ നിങ്ങൾക്ക് കണ്ടെത്താം ഒപ്റ്റിമൽ ശുദ്ധമായ തന്ത്രങ്ങൾ കളിക്കാർ.

പ്ലെയർ I ന്റെ ശുദ്ധമായ തന്ത്രത്തെ ക്രമീകരിച്ച സംഖ്യകളുടെ (വെക്റ്റർ) ഒരു കൂട്ടം പ്രതിനിധീകരിക്കാം, അതിൽ --ാം സ്ഥാനത്തുള്ള സംഖ്യ ഒഴികെ എല്ലാ സംഖ്യകളും പൂജ്യത്തിന് തുല്യമാണ്, അത് ഒന്നിന് തുല്യമാണ്.

പ്ലെയർ II-ന്റെ ശുദ്ധമായ തന്ത്രത്തെ ക്രമീകരിച്ച സംഖ്യകളുടെ (ഒരു വെക്റ്റർ) പ്രതിനിധീകരിക്കാൻ കഴിയും, അതിൽ എല്ലാ സംഖ്യകളും പൂജ്യത്തിന് തുല്യമാണ്, --ാം സ്ഥാനത്തുള്ള സംഖ്യ ഒഴികെ, ഒന്നിന് തുല്യമാണ്.

ഉദാഹരണം

.

പേഓഫ് മാട്രിക്സിന്റെ ഏതെങ്കിലും വരി ഒരു നീക്കമായി തിരഞ്ഞെടുക്കുന്നതിലൂടെ, ഏറ്റവും മോശം സാഹചര്യത്തിൽ വിജയങ്ങൾ അടയാളപ്പെടുത്തിയിരിക്കുന്ന കോളത്തിലെ മൂല്യത്തേക്കാൾ കുറവല്ലെന്ന് പ്ലെയർ ഞാൻ ഉറപ്പാക്കുന്നു:

അതിനാൽ, പ്ലെയർ ഞാൻ പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ രണ്ടാം നിര തിരഞ്ഞെടുക്കും, ഇത് കളിക്കാരൻ II ന്റെ നീക്കം പരിഗണിക്കാതെ തന്നെ അദ്ദേഹത്തിന് പരമാവധി വിജയങ്ങൾ നൽകുന്നു, ഈ മൂല്യം കുറയ്ക്കാൻ ശ്രമിക്കുന്നു:

പ്ലെയർ II സമാനമായ കാരണങ്ങളാൽ തന്റെ നീക്കമായി ഒന്നാം നിര തിരഞ്ഞെടുക്കുന്നു:

അങ്ങനെ, പേയ്മെന്റ് മാട്രിക്സിന്റെ ഒരു സാഡിൽ പോയിന്റ് ഉണ്ട്:

പ്ലെയർ I, പ്ലെയർ II എന്നിവയ്‌ക്കായുള്ള ഒപ്റ്റിമൽ പ്യുവർ സ്ട്രാറ്റജിക്ക് അനുസൃതമായി, അതിൽ പ്ലെയർ II ന്റെ തന്ത്രത്തിലെ എന്തെങ്കിലും മാറ്റത്തിന് കളിക്കാരൻ അവന്റെ വിജയങ്ങൾ കുറയ്ക്കില്ല, കളിക്കാരൻ II തന്ത്രത്തിലെ ഏതെങ്കിലും മാറ്റത്തിന് അവന്റെ നഷ്ടം വർദ്ധിപ്പിക്കില്ല.

5.3 ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം

പേഓഫ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഏതൊരു കളിക്കാരനും ഒരു ശുദ്ധ തന്ത്രം ഉപയോഗിക്കുന്നത് യുക്തിരഹിതമാണ്. ഇത് ഉപയോഗിക്കുന്നത് കൂടുതൽ ലാഭകരമാണ് "സാധ്യത മിശ്രിതങ്ങൾ" ശുദ്ധമായ തന്ത്രങ്ങൾ. അപ്പോൾ സമ്മിശ്ര തന്ത്രങ്ങൾ ഒപ്റ്റിമൽ ആയി തിരിച്ചറിയപ്പെടുന്നു.

സമ്മിശ്ര തന്ത്രം ഈ കളിക്കാരന്റെ ഒരു നീക്കം തിരഞ്ഞെടുക്കുന്നതിൽ ഉൾപ്പെടുന്ന ഒരു റാൻഡം ഇവന്റിന്റെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷനാണ് ഒരു കളിക്കാരന്റെ സവിശേഷത.

പ്ലെയർ I-ന്റെ സമ്മിശ്ര തന്ത്രം അത്തരത്തിലുള്ള ഒരു ക്രമപ്പെടുത്തിയ സംഖ്യകളാണ് (വെക്റ്റർ) അത് രണ്ട് വ്യവസ്ഥകൾ പാലിക്കുന്നു:

1) എന്നതിന്, അതായത് പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ ഓരോ വരിയും തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത നെഗറ്റീവ് അല്ല;

2) , അതായത്, പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ ഓരോ വരികളുടെയും തിരഞ്ഞെടുപ്പ് മൊത്തത്തിൽ പ്രതിനിധീകരിക്കുന്നു മുഴുവൻ ഗ്രൂപ്പ്സംഭവങ്ങൾ.

പ്ലെയർ II-ന്റെ സമ്മിശ്ര തന്ത്രം ക്രമപ്പെടുത്തിയ സംഖ്യകളുടെ കൂട്ടമായിരിക്കും (വെക്റ്റർ) വ്യവസ്ഥകൾ തൃപ്തിപ്പെടുത്തുന്നു:

അടക്കേണ്ട തുക ഒരു സമ്മിശ്ര തന്ത്രം തിരഞ്ഞെടുത്ത I കളിക്കാരന്

ഒരു സമ്മിശ്ര തന്ത്രം തിരഞ്ഞെടുത്ത കളിക്കാരൻ II-ൽ നിന്ന്

,

ശരാശരി മൂല്യത്തെ പ്രതിനിധീകരിക്കുന്നു

.

ഒപ്റ്റിമൽ സമ്മിശ്ര തന്ത്രങ്ങൾ എന്ന് വിളിക്കുന്നു

ഒപ്പം ,

ഏതെങ്കിലും ഏകപക്ഷീയമായ സമ്മിശ്ര തന്ത്രങ്ങൾക്കായി ഇനിപ്പറയുന്ന വ്യവസ്ഥ തൃപ്തികരമാണെങ്കിൽ:

അതായത്, ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി ഉപയോഗിച്ച്, പ്ലെയർ I യുടെ നേട്ടമാണ് ഏറ്റവും വലുത്, കളിക്കാരൻ II ന്റെ നഷ്ടം ഏറ്റവും കുറവാണ്.

പേയ്മെന്റ് മാട്രിക്സിൽ സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, പിന്നെ

,

അതായത് ഒരു നല്ല വ്യത്യാസമുണ്ട് ( അനുവദിക്കാത്ത വ്യത്യാസം )

- ³ 0,

ഈ വ്യത്യാസത്തിന്റെ വലിയൊരു പങ്ക് ആത്മവിശ്വാസത്തോടെ അവർക്ക് അനുകൂലമായി ലഭിക്കുന്നതിന് കളിക്കാർ കൂടുതൽ അവസരങ്ങൾ തേടേണ്ടതുണ്ട്.

ഉദാഹരണം

പേഓഫ് മാട്രിക്സ് നിർവചിച്ച ഗെയിം പരിഗണിക്കുക:

.

ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടോ എന്ന് നമുക്ക് നിർണ്ണയിക്കാം:

, .

പേയ്‌മെന്റ് മാട്രിക്‌സിൽ സാഡിൽ പോയിന്റ് ഇല്ലെന്നും വിതരണം ചെയ്യാത്ത വ്യത്യാസം ഇതിന് തുല്യമാണെന്നും ഇത് മാറുന്നു:

.

5.4 ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്തുന്നു

2x2 ഗെയിമുകൾക്കായി

രണ്ട് വേരിയബിളുകളുടെ ഒരു ഫംഗ്‌ഷന്റെ ഒപ്റ്റിമൽ പോയിന്റുകൾ കണ്ടെത്തുന്നതിലൂടെയാണ് അളവുകളുടെ പേയ്‌മെന്റ് മാട്രിക്‌സിനായി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികൾ നിർണ്ണയിക്കുന്നത്.

പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ ആദ്യ വരി ഞാൻ തിരഞ്ഞെടുക്കുന്ന കളിക്കാരന്റെ സംഭാവ്യത അനുവദിക്കുക

തുല്യമാണ്. അപ്പോൾ രണ്ടാമത്തെ വരി തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത തുല്യമാണ്.

ആദ്യ കോളം തിരഞ്ഞെടുക്കുന്ന പ്ലെയർ II ന് തുല്യമായിരിക്കട്ടെ. അപ്പോൾ രണ്ടാമത്തെ നിര തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത തുല്യമാണ്.

പ്ലെയർ II-ന്റെ പ്ലെയർ I-ലേക്കുള്ള പേയ്‌മെന്റ് തുക ഇതിന് തുല്യമാണ്:

പ്ലെയർ I-ന്റെ നേട്ടത്തിന്റെയും കളിക്കാരൻ II-ന്റെ നഷ്ടത്തിന്റെയും അങ്ങേയറ്റത്തെ മൂല്യം ഇനിപ്പറയുന്ന വ്യവസ്ഥകളുമായി പൊരുത്തപ്പെടുന്നു:

;

.

അതിനാൽ, I, II കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ യഥാക്രമം തുല്യമാണ്:

5.5 ഗെയിമുകളുടെ ജ്യാമിതീയ പരിഹാരം 2×എൻ

പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ അളവ് വർധിക്കുന്നതിനാൽ, രണ്ട് വേരിയബിളുകളുടെ ഒരു ഫംഗ്‌ഷന്റെ ഒപ്റ്റിമൽ കണ്ടെത്തുന്നതിന് ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുടെ നിർണ്ണയം കുറയ്ക്കാൻ ഇനി സാധ്യമല്ല. എന്നിരുന്നാലും, കളിക്കാരിൽ ഒരാൾക്ക് രണ്ട് തന്ത്രങ്ങൾ മാത്രമേ ഉള്ളൂ എന്നതിനാൽ, ഒരു ജ്യാമിതീയ പരിഹാരം ഉപയോഗിക്കാം.

ഗെയിമിന് പരിഹാരം കണ്ടെത്തുന്നതിനുള്ള പ്രധാന ഘട്ടങ്ങൾ ഇനിപ്പറയുന്നവയാണ്.

നമുക്ക് വിമാനത്തിൽ ഒരു കോർഡിനേറ്റ് സിസ്റ്റം അവതരിപ്പിക്കാം. നമുക്ക് അച്ചുതണ്ടിൽ സെഗ്മെന്റ് പ്ലോട്ട് ചെയ്യാം. ഈ സെഗ്‌മെന്റിന്റെ ഇടത്, വലത് അറ്റങ്ങളിൽ നിന്ന് ഞങ്ങൾ ലംബമായി വരയ്ക്കുന്നു.


യൂണിറ്റ് സെഗ്‌മെന്റിന്റെ ഇടത്, വലത് അറ്റങ്ങൾ രണ്ട് സ്ട്രാറ്റജികളുമായി പൊരുത്തപ്പെടുന്നു, കൂടാതെ I-ന് ലഭ്യമാണ്. വരച്ച ലംബങ്ങളിൽ ഈ കളിക്കാരന്റെ വിജയങ്ങൾ ഞങ്ങൾ പ്ലോട്ട് ചെയ്യും. ഉദാഹരണത്തിന്, പേയ്മെന്റ് മാട്രിക്സിന്


ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ കളിക്കാരൻ I യുടെ അത്തരം പ്രതിഫലങ്ങൾ ആയിരിക്കും കൂടാതെ, ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ അവയും ആയിരിക്കും.

പ്ലെയർ II-ന്റെ തന്ത്രങ്ങൾക്ക് അനുസൃതമായി, പ്ലെയർ I-ന്റെ വിജയിക്കുന്ന പോയിന്റുകൾ നേർരേഖ സെഗ്മെന്റുകൾ വഴി നമുക്ക് ബന്ധിപ്പിക്കാം. രൂപപ്പെട്ട തകർന്ന ലൈൻ, താഴെ നിന്ന് ഗ്രാഫ് പരിമിതപ്പെടുത്തുന്നു, പ്ലെയർ I ന്റെ പ്രതിഫലത്തിന്റെ താഴ്ന്ന പരിധി നിർണ്ണയിക്കുന്നു.



പ്ലെയർ I യുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം കണ്ടെത്തുന്നു

,

ഇത് പരമാവധി ഓർഡിനേറ്റ് ഉപയോഗിച്ച് പ്ലെയർ ഐയുടെ പ്രതിഫലത്തിന്റെ താഴത്തെ പരിധിയിലുള്ള പോയിന്റുമായി യോജിക്കുന്നു.

പരിഗണനയിലിരിക്കുന്ന ഉദാഹരണത്തിൽ, രണ്ട് തന്ത്രങ്ങൾ മാത്രം ഉപയോഗിച്ച്, പ്ലെയർ I, പ്ലെയർ II ന്റെ പേഓഫിന്റെ താഴത്തെ അതിർത്തിയിൽ കണ്ടെത്തിയ പോയിന്റിൽ വിഭജിക്കുന്ന നേർരേഖകൾക്ക് അനുസൃതമായി, കളിക്കാരൻ I വലുതാകുന്നത് തടയാൻ കഴിയും എന്ന വസ്തുത നമുക്ക് ശ്രദ്ധിക്കാം. പേ ഓഫ്.

അങ്ങനെ, ഗെയിം ഒരു ഗെയിമായി ചുരുക്കി, പരിഗണനയിലുള്ള ഉദാഹരണത്തിൽ പ്ലെയർ II-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം ഇതായിരിക്കും

,

ഗെയിമിലേതിന് തുല്യമായ സംഭാവ്യത ഇവിടെ:

5.6 ഗെയിം സോൾവിംഗ്എം× എൻ

ഒരു മാട്രിക്സ് ഗെയിമിന് ശുദ്ധമായ തന്ത്രങ്ങളിൽ പരിഹാരമില്ലെങ്കിൽ (അതായത്, സാഡിൽ പോയിന്റ് ഇല്ല) കൂടാതെ, പേഓഫ് മാട്രിക്സിന്റെ വലിയ മാനം കാരണം, ഗ്രാഫിക്കായി പരിഹരിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, ഒരു പരിഹാരം നേടുന്നതിന്, ഉപയോഗിക്കുക ലീനിയർ പ്രോഗ്രാമിംഗ് രീതി .

അളവിന്റെ ഒരു പേയ്‌മെന്റ് മാട്രിക്സ് നൽകട്ടെ:

.

സാധ്യതകൾ കണ്ടെത്തേണ്ടതുണ്ട് , ഏത് കളിക്കാരനോടൊപ്പമാണ് ഞാൻ അവന്റെ നീക്കങ്ങൾ തിരഞ്ഞെടുക്കേണ്ടത്, അതുവഴി ഈ സമ്മിശ്ര തന്ത്രം പ്ലെയർ II ന്റെ നീക്കങ്ങൾ തിരഞ്ഞെടുക്കുന്നത് പരിഗണിക്കാതെ തന്നെ മൂല്യത്തിൽ കുറയാത്ത വിജയം ഉറപ്പ് നൽകുന്നു.

പ്ലെയർ II തിരഞ്ഞെടുത്ത ഓരോ നീക്കത്തിനും, കളിക്കാരൻ I-ന്റെ പ്രതിഫലം നിർണ്ണയിക്കുന്നത് ഡിപൻഡൻസികളാണ്:

അസമത്വങ്ങളുടെ ഇരുവശങ്ങളെയും നമുക്ക് വിഭജിച്ച് പുതിയ നൊട്ടേഷനുകൾ അവതരിപ്പിക്കാം:

സമത്വം

ഫോം എടുക്കും:

പ്ലെയർ I പേഓഫ് പരമാവധിയാക്കാൻ ശ്രമിക്കുന്നതിനാൽ, വിപരീതം ചെറുതാക്കണം. അപ്പോൾ കളിക്കാരനുള്ള ലീനിയർ പ്രോഗ്രാമിംഗ് പ്രശ്നം ഞാൻ ഫോം എടുക്കും:

നിയന്ത്രണങ്ങൾക്ക് കീഴിൽ

പ്ലെയർ II-നുള്ള പ്രശ്നം ഇരട്ട പോലെ തന്നെ നിർമ്മിച്ചിരിക്കുന്നു:

നിയന്ത്രണങ്ങൾക്ക് കീഴിൽ

സിംപ്ലക്സ് രീതി ഉപയോഗിച്ച് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നു, ഞങ്ങൾക്ക് ലഭിക്കുന്നു:

,

5.7 മാട്രിക്സ് ഗെയിമുകൾ പരിഹരിക്കുന്നതിന്റെ സവിശേഷതകൾ

ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിക്കുന്നതിന് മുമ്പ്, രണ്ട് വ്യവസ്ഥകൾ പരിശോധിക്കണം:

പേയ്മെന്റ് മാട്രിക്സ് ലളിതമാക്കാൻ കഴിയുമോ;

പേയ്‌മെന്റ് മാട്രിക്‌സിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടോ?

പേയ്മെന്റ് മാട്രിക്സ് ലളിതമാക്കുന്നതിനുള്ള സാധ്യത പരിഗണിക്കുക:

ഞാൻ നേടാൻ ശ്രമിക്കുന്ന കളിക്കാരൻ കാരണം ഏറ്റവും വലിയ വിജയം, തുടർന്ന് പേയ്‌മെന്റ് മാട്രിക്‌സിൽ നിന്ന് ആം വരി ഇല്ലാതാക്കാൻ കഴിയും, കാരണം ഇനിപ്പറയുന്ന ബന്ധം മറ്റേതെങ്കിലും വരിയിൽ തൃപ്തികരമാണെങ്കിൽ അവൻ ഒരിക്കലും ഈ നീക്കം ഉപയോഗിക്കില്ല:

അതുപോലെ, ഏറ്റവും ചെറിയ നഷ്ടത്തിനായി പരിശ്രമിക്കുമ്പോൾ, പ്ലെയർ II ഒരിക്കലും പേഓഫ് മാട്രിക്സിലെ -th കോളം ഒരു നീക്കമായി തിരഞ്ഞെടുക്കില്ല, കൂടാതെ ഇനിപ്പറയുന്ന ബന്ധം മറ്റേതെങ്കിലും -th കോളത്തിൽ തൃപ്തിപ്പെട്ടാൽ ഈ കോളം മറികടക്കാൻ കഴിയും:

മിക്കതും ലളിതമായ പരിഹാരംഗെയിം ഒരു സാഡിൽ പോയിന്റിന്റെ ലളിതമായ പേയ്‌മെന്റ് മാട്രിക്‌സിലെ സാന്നിധ്യമാണ്, അത് ഇനിപ്പറയുന്ന വ്യവസ്ഥകൾ പാലിക്കുന്നു (നിർവചനപ്രകാരം):

ഉദാഹരണം

പേയ്മെന്റ് മാട്രിക്സ് നൽകിയിരിക്കുന്നു:

.

പേയ്മെന്റ് മാട്രിക്സിന്റെ ലളിതവൽക്കരണം:

ഒരു സാഡിൽ പോയിന്റിന്റെ സാന്നിധ്യം:

5.8 പ്രകൃതിയുമായി കളിക്കുന്നു

ഗെയിം തിയറി പ്രശ്നങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി സിദ്ധാന്തത്തിന്റെ പ്രശ്നങ്ങൾ സ്ഥിതിവിവരക്കണക്ക് പരിഹാരങ്ങൾ ഒരു അനിശ്ചിത സാഹചര്യത്തിന് ഒരു വൈരുദ്ധ്യ വൈരുദ്ധ്യ അർത്ഥമില്ല, അത് വസ്തുനിഷ്ഠമായ യാഥാർത്ഥ്യത്തെ ആശ്രയിച്ചിരിക്കുന്നു, അതിനെ സാധാരണയായി വിളിക്കുന്നു "പ്രകൃതി" .

പ്രകൃതിയുമായുള്ള മാട്രിക്സ് ഗെയിമുകളിൽ, എടുക്കുന്ന തീരുമാനങ്ങളുടെ ഫലപ്രാപ്തിയെ സ്വാധീനിക്കുന്ന അനിശ്ചിതത്വ ഘടകങ്ങളുടെ ഒരു കൂട്ടമാണ് പ്ലെയർ II.

സ്വാഭാവിക മാട്രിക്സ് ഗെയിമുകൾ സാധാരണ മാട്രിക്സ് ഗെയിമുകളിൽ നിന്ന് വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, പ്ലെയർ I എന്നതിനായി ഒപ്റ്റിമൽ തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ, കളിക്കാരൻ II തന്റെ നഷ്ടം കുറയ്ക്കാൻ ശ്രമിക്കുമെന്ന വസ്തുതയെ ഇനി ആശ്രയിക്കാൻ കഴിയില്ല. അതിനാൽ, പേയ്മെന്റ് മാട്രിക്സിനൊപ്പം ഞങ്ങൾ അവതരിപ്പിക്കുന്നു റിസ്ക് മാട്രിക്സ് :

വ്യവസ്ഥകളിൽ ഒരു നീക്കം ഉപയോഗിക്കുമ്പോൾ പ്ലെയർ I ന്റെ അപകടസാധ്യതയുടെ അളവ് വ്യത്യാസത്തിന് തുല്യമാണ് ഈ അവസ്ഥ സ്ഥാപിക്കപ്പെടുമെന്ന് കളിക്കാരന് അറിയാമെങ്കിൽ എനിക്ക് ലഭിക്കുന്ന പ്രതിഫലത്തിന് ഇടയിൽ, അതായത്. , കൂടാതെ അവൻ സ്വീകരിക്കുന്ന വിജയങ്ങൾ, ഒരു നീക്കം തിരഞ്ഞെടുക്കുമ്പോൾ അറിയാതെ, വ്യവസ്ഥ സ്ഥാപിക്കപ്പെടും.

അങ്ങനെ, പേയ്‌മെന്റ് മാട്രിക്‌സ് അദ്വിതീയമായി ഒരു റിസ്ക് മെട്രിക്‌സായി രൂപാന്തരപ്പെടുന്നു, പക്ഷേ വിപരീത പരിവർത്തനം അവ്യക്തമാണ്.

ഉദാഹരണം

വിജയിക്കുന്ന മാട്രിക്സ്:

.

റിസ്ക് മാട്രിക്സ്:

സാധ്യമാണ് രണ്ട് പ്രശ്ന പ്രസ്താവനകൾ ഒരു പരിഹാരം തിരഞ്ഞെടുക്കുന്നതിനെക്കുറിച്ച് പ്രകൃതിയുമായുള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ :

പരമാവധി വിജയങ്ങൾ;

അപകടസാധ്യത കുറയ്ക്കുന്നു.

തീരുമാനമെടുക്കൽ പ്രശ്നം രണ്ട് വ്യവസ്ഥകളിൽ ഒന്നിന് വേണ്ടി ഉയർത്താം:

- അപകടത്തിലാണ് , പ്രകൃതിയുടെ തന്ത്രങ്ങളുടെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ ഫംഗ്‌ഷൻ അറിയുമ്പോൾ, ഉദാഹരണത്തിന്, പ്രതീക്ഷിക്കുന്ന ഓരോ നിർദ്ദിഷ്ട സാമ്പത്തിക സാഹചര്യങ്ങളുടെയും സംഭവത്തിന്റെ ക്രമരഹിതമായ വേരിയബിൾ;

- അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ , അത്തരമൊരു പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ ഫംഗ്‌ഷൻ അജ്ഞാതമാകുമ്പോൾ.

5.9 സ്റ്റാറ്റിസ്റ്റിക്കൽ തീരുമാന സിദ്ധാന്തത്തിലെ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നു

അപകടത്തിലാണ്

റിസ്ക് സാഹചര്യങ്ങളിൽ തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ, കളിക്കാരൻ എനിക്ക് സാധ്യതകൾ അറിയാം പ്രകൃതിയുടെ അവസ്ഥകളുടെ തുടക്കം.

അപ്പോൾ കളിക്കാരൻ I അതിനുള്ള തന്ത്രം തിരഞ്ഞെടുക്കുന്നതാണ് ഉചിതം ലൈൻ എടുത്ത ശരാശരി വിജയ മൂല്യം പരമാവധി ആണ് :

.

ഒരു റിസ്ക് മാട്രിക്സ് ഉപയോഗിച്ച് ഈ പ്രശ്നം പരിഹരിക്കുമ്പോൾ, സമാനമായ പരിഹാരം നമുക്ക് ലഭിക്കും കുറഞ്ഞ ശരാശരി അപകടസാധ്യത :

.

5.10 സ്റ്റാറ്റിസ്റ്റിക്കൽ തീരുമാന സിദ്ധാന്തത്തിലെ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നു

അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ

അനിശ്ചിതത്വത്തിൽ തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ, നിങ്ങൾക്ക് ഇനിപ്പറയുന്നവ ഉപയോഗിക്കാം മാനദണ്ഡം :

പരമാവധി വാൾഡ് മാനദണ്ഡം;

മാനദണ്ഡം കുറഞ്ഞ അപകടസാധ്യതക്രൂരൻ;

അശുഭാപ്തിവിശ്വാസത്തിന്റെ ഹർവിറ്റ്സിന്റെ മാനദണ്ഡം - ശുഭാപ്തിവിശ്വാസം;

അപര്യാപ്തമായ കാരണത്തിന്റെ ലാപ്ലേസിന്റെ തത്വം.

നമുക്ക് പരിഗണിക്കാം മാക്സിമിൻ വാൾഡ് ടെസ്റ്റ് .

പ്രകൃതിയുമായുള്ള ഗെയിം ന്യായമായ ആക്രമണാത്മക എതിരാളിയെ പോലെയാണ് കളിക്കുന്നത്, അതായത്, പേയ്‌മെന്റ് മാട്രിക്‌സിനായി അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസത്തിന്റെ സ്ഥാനത്ത് നിന്ന് ഒരു പുനർ ഇൻഷുറൻസ് സമീപനം സ്വീകരിക്കുന്നു:

.

നമുക്ക് പരിഗണിക്കാം സാവേജിന്റെ ഏറ്റവും കുറഞ്ഞ അപകടസാധ്യത മാനദണ്ഡം .

റിസ്ക് മാട്രിക്സിനായുള്ള അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസത്തിന്റെ സ്ഥാനത്ത് നിന്ന് മുമ്പത്തേതിന് സമാനമായ ഒരു സമീപനം:

.

നമുക്ക് പരിഗണിക്കാം അശുഭാപ്തിവിശ്വാസത്തിന്റെ ഹർവിറ്റ്സ് മാനദണ്ഡം - ശുഭാപ്തിവിശ്വാസം .

അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസം അല്ലെങ്കിൽ അങ്ങേയറ്റത്തെ ശുഭാപ്തിവിശ്വാസം എന്നിവയാൽ നയിക്കപ്പെടാതിരിക്കാനുള്ള അവസരം വാഗ്ദാനം ചെയ്യുന്നു:

അശുഭാപ്തിവിശ്വാസത്തിന്റെ അളവ് എവിടെയാണ്;

at - അങ്ങേയറ്റത്തെ ശുഭാപ്തിവിശ്വാസം,

at - അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസം.

നമുക്ക് പരിഗണിക്കാം അപര്യാപ്തമായ കാരണത്തിന്റെ ലാപ്ലേസിന്റെ തത്വം .

പ്രകൃതിയുടെ എല്ലാ അവസ്ഥകളും ഒരുപോലെ സാധ്യമാണെന്ന് അനുമാനിക്കപ്പെടുന്നു:

,

.

അഞ്ചാമത്തെ വിഭാഗത്തെക്കുറിച്ചുള്ള നിഗമനങ്ങൾ

ഒരു മാട്രിക്സ് ഗെയിമിൽ, രണ്ട് കളിക്കാർ പങ്കെടുക്കുന്നു, തോൽക്കുന്ന കളിക്കാരനിൽ നിന്ന് വിജയിക്കുന്ന കളിക്കാരനിലേക്കുള്ള പേയ്‌മെന്റ് തുക നിർണ്ണയിക്കാൻ സഹായിക്കുന്ന പേയ്‌മെന്റ് ഫംഗ്‌ഷൻ ഒരു പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ രൂപത്തിൽ പ്രതിനിധീകരിക്കുന്നു. പ്ലെയർ I പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ വരികളിലൊന്ന് ഒരു നീക്കമായി തിരഞ്ഞെടുക്കുന്നുവെന്നും പ്ലെയർ II അതിന്റെ നിരകളിലൊന്ന് തിരഞ്ഞെടുക്കുമെന്നും സമ്മതിച്ചു. ഈ മാട്രിക്സിന്റെ തിരഞ്ഞെടുത്ത വരികളുടെയും നിരകളുടെയും കവലയിൽ, പ്ലെയർ II-ൽ നിന്ന് പ്ലേയർ I-ലേക്കുള്ള പേയ്‌മെന്റിന്റെ ഒരു സംഖ്യാ മൂല്യമുണ്ട് (ഈ മൂല്യം പോസിറ്റീവ് ആണെങ്കിൽ, പ്ലേയർ ഞാൻ ശരിക്കും വിജയിച്ചു, അത് നെഗറ്റീവ് ആണെങ്കിൽ, പ്ലേയർ II പ്രധാനമായും ജയിച്ചു).

പേഓഫ് മാട്രിക്സിൽ ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടെങ്കിൽ, കളിക്കാർക്ക് ഒപ്റ്റിമൽ ശുദ്ധമായ തന്ത്രങ്ങളുണ്ട്, അതായത്, വിജയിക്കാൻ, ഓരോരുത്തരും അവന്റെ ഒപ്റ്റിമൽ നീക്കം ആവർത്തിക്കണം. സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, വിജയിക്കാൻ, ഓരോരുത്തരും ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം ഉപയോഗിക്കണം, അതായത്, ചലനങ്ങളുടെ ഒരു മിശ്രിതം ഉപയോഗിക്കുക, അവ ഓരോന്നും ഒപ്റ്റിമൽ പ്രോബബിലിറ്റി ഉപയോഗിച്ച് നിർമ്മിക്കണം.

അറിയപ്പെടുന്ന ഫോർമുലകൾ ഉപയോഗിച്ച് ഒപ്റ്റിമൽ പ്രോബബിലിറ്റികൾ കണക്കാക്കിയാണ് 2x2 ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികൾ കണ്ടെത്തുന്നത്. ഉപയോഗിച്ച് ജ്യാമിതീയ പരിഹാരം 2×n ഗെയിമുകൾ, അവയിലെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ നിർണ്ണയിക്കുന്നത് 2×2 ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിലേക്ക് വരുന്നു. m×n ഗെയിമുകൾ പരിഹരിക്കുന്നതിന്, അവയിൽ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്താൻ ലീനിയർ പ്രോഗ്രാമിംഗ് രീതി ഉപയോഗിക്കുന്നു.

ചില പേയ്‌മെന്റ് മെട്രിക്‌സുകൾ ലളിതമാക്കാൻ കഴിയും, അതിന്റെ ഫലമായി വിട്ടുവീഴ്‌ചയില്ലാത്ത നീക്കങ്ങളുമായി ബന്ധപ്പെട്ട വരികളും നിരകളും നീക്കം ചെയ്തുകൊണ്ട് അവയുടെ അളവ് കുറയുന്നു.

വസ്തുനിഷ്ഠമായ യാഥാർത്ഥ്യത്തെ ആശ്രയിക്കുന്ന അനിശ്ചിതത്വ ഘടകങ്ങളുടെ ഒരു കൂട്ടമാണ് പ്ലെയർ II എങ്കിൽ, അത്തരം ഗെയിമിനെ പ്രകൃതിയുമായുള്ള ഗെയിം എന്ന് വിളിക്കുന്നു, കൂടാതെ സ്ഥിതിവിവരക്കണക്ക് തീരുമാനങ്ങളുടെ സിദ്ധാന്തത്തിൽ നിന്നുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ഉപയോഗിക്കുന്നു. തുടർന്ന്, പേയ്‌മെന്റ് മാട്രിക്സിനൊപ്പം, ഒരു റിസ്ക് മാട്രിക്സ് അവതരിപ്പിക്കുകയും പ്രകൃതിയുമായി ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒരു പരിഹാരം തിരഞ്ഞെടുക്കുന്നതിനുള്ള പ്രശ്നത്തിന്റെ രണ്ട് ഫോർമുലേഷനുകൾ സാധ്യമാണ്: നേട്ടം വർദ്ധിപ്പിക്കുകയും അപകടസാധ്യത കുറയ്ക്കുകയും ചെയ്യുക.

റിസ്ക് സാഹചര്യങ്ങളിൽ സ്ഥിതിവിവരക്കണക്ക് തീരുമാനങ്ങളുടെ സിദ്ധാന്തത്തിന്റെ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നത്, പേയ്മെന്റ് മാട്രിക്സിന്റെ ഒരു നിരയിൽ നിന്ന് എടുത്ത വിജയങ്ങളുടെ ശരാശരി മൂല്യം (ഗണിതശാസ്ത്ര പ്രതീക്ഷ) പരമാവധി, അല്ലെങ്കിൽ (ഏത്) തന്ത്രം തിരഞ്ഞെടുക്കുന്നത് കളിക്കാരന് ഉചിതമാണെന്ന് കാണിക്കുന്നു. അതുതന്നെയാണ്) റിസ്ക് മാട്രിക്സിന്റെ നിരയിൽ എടുത്ത അപകടസാധ്യതയുടെ ശരാശരി മൂല്യം (ഗണിതശാസ്ത്രപരമായ പ്രതീക്ഷ) വളരെ കുറവാണ്. അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ അവർ ഉപയോഗിക്കുന്നു ഇനിപ്പറയുന്ന മാനദണ്ഡങ്ങൾ: വാൾഡിന്റെ മാക്സിമിൻ മാനദണ്ഡം, സാവേജിന്റെ ഏറ്റവും കുറഞ്ഞ അപകടസാധ്യത മാനദണ്ഡം, ഹർവിറ്റ്സിന്റെ അശുഭാപ്തിവിശ്വാസം-ശുഭാപ്തിവിശ്വാസം മാനദണ്ഡം, ലാപ്ലേസിന്റെ അപര്യാപ്തമായ കാരണ തത്വം.

സ്വയം പരിശോധനാ ചോദ്യങ്ങൾ

ഗെയിം തിയറിയുടെ അടിസ്ഥാന ആശയങ്ങൾ എങ്ങനെയാണ് നിർവചിക്കപ്പെട്ടിരിക്കുന്നത്: നീക്കം, തന്ത്രം, പേഓഫ് പ്രവർത്തനം?

ഒരു മാട്രിക്സ് ഗെയിമിൽ പ്രതിനിധീകരിക്കുന്ന പേഓഫ് ഫംഗ്ഷൻ എന്താണ്?

എന്തുകൊണ്ടാണ് ഒരു മാട്രിക്സ് ഗെയിമിനെ സീറോ-സം എന്ന് വിളിക്കുന്നത്?

ഒരു മാട്രിക്സ് ഗെയിം കളിക്കുന്ന പ്രക്രിയ എങ്ങനെയാണ്?

m×n ഗെയിം എന്ന് ഏത് ഗെയിമിനെ വിളിക്കുന്നു?

ഏത് മാട്രിക്സ് ഗെയിം തന്ത്രത്തെ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു?

പ്യുവർ എന്ന് വിളിക്കപ്പെടുന്ന ഒരു മാട്രിക്സ് ഗെയിമിനുള്ള ഒപ്റ്റിമൽ തന്ത്രം എന്താണ്?

പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ സാഡിൽ പോയിന്റ് എന്താണ് അർത്ഥമാക്കുന്നത്?

മിക്സഡ് എന്ന് വിളിക്കപ്പെടുന്ന ഒരു മാട്രിക്സ് ഗെയിമിനുള്ള ഒപ്റ്റിമൽ തന്ത്രം എന്താണ്?

ഒരു കളിക്കാരന്റെ സമ്മിശ്ര തന്ത്രം എങ്ങനെയിരിക്കും?

സമ്മിശ്ര തന്ത്രങ്ങൾ തിരഞ്ഞെടുത്ത പ്ലെയർ II-ൽ നിന്ന് പ്ലേയർ I-ക്കുള്ള പേയ്‌മെന്റ് തുക എത്രയാണ്?

ഏത് സമ്മിശ്ര തന്ത്രങ്ങളെ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു?

വിതരണമില്ലാത്ത വ്യത്യാസം എന്താണ് അർത്ഥമാക്കുന്നത്?

2x2 ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്താൻ ഏത് രീതിയാണ് ഉപയോഗിക്കുന്നത്?

2×n ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികൾ എങ്ങനെയാണ് കണ്ടെത്തുന്നത്?

m×n ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്താൻ ഏത് രീതിയാണ് ഉപയോഗിക്കുന്നത്?

മാട്രിക്സ് ഗെയിമുകൾ പരിഹരിക്കുന്നതിന്റെ സവിശേഷതകൾ എന്തൊക്കെയാണ്?

പേയ്‌മെന്റ് മാട്രിക്‌സിന്റെ ലളിതവൽക്കരണം എന്താണ് അർത്ഥമാക്കുന്നത്, ഏത് സാഹചര്യത്തിലാണ് ഇത് നടപ്പിലാക്കാൻ കഴിയുക?

പേഓഫ് മാട്രിക്‌സിന് ഒരു സാഡിൽ പോയിന്റ് ഉള്ളപ്പോൾ അല്ലെങ്കിൽ ഇല്ലെങ്കിൽ ഏത് മാട്രിക്‌സ് ഗെയിം പരിഹരിക്കാൻ എളുപ്പമാണ്?

സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡിസിഷൻ തിയറി പ്രശ്നങ്ങളുമായി എന്ത് ഗെയിം തിയറി പ്രശ്നങ്ങൾ ബന്ധപ്പെട്ടിരിക്കുന്നു?

പേയ്‌മെന്റ് മാട്രിക്‌സ് എങ്ങനെയാണ് റിസ്ക് മെട്രിക്‌സിലേക്ക് വിവർത്തനം ചെയ്യുന്നത്?

പ്രകൃതിയുമായുള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ പരിഹാരങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള പ്രശ്നത്തിന്റെ ഏത് രണ്ട് ഫോർമുലേഷനുകൾ സാധ്യമാണ്?

പ്രകൃതിയുമായുള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ എന്ത് രണ്ട് വ്യവസ്ഥകൾക്കായി തീരുമാനമെടുക്കൽ പ്രശ്നങ്ങൾ ഉയർത്താം?

റിസ്ക് സാഹചര്യങ്ങളിൽ ഒരു സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡിസിഷൻ തിയറി പ്രശ്നം പരിഹരിക്കുമ്പോൾ ഞാൻ തിരഞ്ഞെടുക്കുന്ന തന്ത്രം ഏത് കളിക്കാരന് അനുയോജ്യമാണ്?

അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ സ്ഥിതിവിവരക്കണക്ക് തീരുമാന സിദ്ധാന്തത്തിന്റെ പ്രശ്നങ്ങൾ പരിഹരിക്കുമ്പോൾ എന്ത് തീരുമാനമെടുക്കൽ മാനദണ്ഡങ്ങൾ ഉപയോഗിക്കാനാകും?

പ്രശ്നം പരിഹരിക്കുന്നതിനുള്ള ഉദാഹരണങ്ങൾ

1. എന്റർപ്രൈസ് വിൽക്കുമ്പോൾ അതിന്റെ ലാഭത്തിന്റെ അളവ് പേയ്മെന്റ് മാട്രിക്സ് സൂചിപ്പിക്കുന്നു വത്യസ്ത ഇനങ്ങൾസ്ഥാപിത ഡിമാൻഡ് (വരി) അനുസരിച്ച് ഉൽപ്പന്നങ്ങൾ (നിരകൾ). വിവിധ തരത്തിലുള്ള ഉൽപ്പന്നങ്ങളുടെ ഉൽപാദനത്തിനായി എന്റർപ്രൈസസിന്റെ ഒപ്റ്റിമൽ തന്ത്രവും അവയുടെ വിൽപ്പനയിൽ നിന്നുള്ള പരമാവധി (ശരാശരി) വരുമാനവും നിർണ്ണയിക്കേണ്ടത് ആവശ്യമാണ്.

നമുക്ക് തന്നിരിക്കുന്ന മാട്രിക്സിനെ സൂചിപ്പിക്കുകയും വേരിയബിളുകൾ അവതരിപ്പിക്കുകയും ചെയ്യാം. ഞങ്ങൾ മാട്രിക്സ് (വെക്റ്റർ) ഉപയോഗിക്കും. പിന്നെ ഒപ്പം, അതായത്.

വിപരീത മാട്രിക്സ് കണക്കാക്കുന്നു:

മൂല്യങ്ങൾ കണ്ടെത്തി:

.

സാധ്യതകൾ കണക്കാക്കുന്നു:

ശരാശരി വിൽപ്പന വരുമാനം നിർണ്ണയിക്കപ്പെടുന്നു:

.

2. ഫാർമസിസ്റ്റ് കമ്പനി ഈ മേഖലയിലെ മരുന്നുകളുടെയും ബയോമെഡിക്കൽ ഉൽപ്പന്നങ്ങളുടെയും നിർമ്മാതാവാണ്. ചില മരുന്നുകൾക്ക് ഏറ്റവും ഉയർന്ന ഡിമാൻഡ് സംഭവിക്കുന്നത് ഈ സമയത്താണ് എന്ന് അറിയാം വേനൽക്കാല കാലയളവ്(ഹൃദയ മരുന്നുകൾ, വേദനസംഹാരികൾ), മറ്റുള്ളവർക്ക് - ശരത്കാലത്തും വസന്തകാലത്തും (ആന്റി-ഇൻഫെക്ഷ്യസ്, ആന്റിട്യൂസിവ്).

1 സ്റ്റാൻഡേർഡ് യൂണിറ്റിന്റെ വില യൂണിറ്റുകൾ സെപ്റ്റംബർ-ഒക്ടോബർ മാസങ്ങളിലെ ഉൽപ്പന്നങ്ങൾ ഇവയായിരുന്നു: ആദ്യ ഗ്രൂപ്പിന് (ഹൃദയ സംബന്ധമായ മരുന്നുകളും വേദനസംഹാരികളും) - 20 റൂബിൾസ്; രണ്ടാമത്തെ ഗ്രൂപ്പിന് (ആന്റി-ഇൻഫെക്ഷ്യസ്, ആന്റിട്യൂസിവ് മരുന്നുകൾ) - 15 റൂബിൾസ്.

നിരവധി നിരീക്ഷണങ്ങൾ അനുസരിച്ച് കഴിഞ്ഞ വർഷങ്ങൾചൂടുള്ള കാലാവസ്ഥയിൽ പരിഗണനയിലുള്ള രണ്ട് മാസത്തിനുള്ളിൽ 3050 പരമ്പരാഗത യൂണിറ്റുകൾ വിൽക്കാൻ കഴിയുമെന്ന് കമ്പനിയുടെ മാർക്കറ്റിംഗ് സേവനം സ്ഥാപിച്ചു. യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിന്റെയും 1100 പരമ്പരാഗത യൂണിറ്റുകളുടെയും ഉൽപ്പന്നങ്ങൾ. യൂണിറ്റുകൾ രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ ഉൽപ്പന്നങ്ങൾ; തണുത്ത കാലാവസ്ഥയിൽ - 1525 arb. യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിന്റെയും 3690 പരമ്പരാഗത യൂണിറ്റുകളുടെയും ഉൽപ്പന്നങ്ങൾ. യൂണിറ്റുകൾ രണ്ടാമത്തെ ഗ്രൂപ്പ്.

കാലാവസ്ഥയിൽ സാധ്യമായ മാറ്റങ്ങളുമായി ബന്ധപ്പെട്ട്, 40 റൂബിളുകളുടെ വിൽപ്പന വിലയിൽ പരമാവധി വിൽപ്പന വരുമാനം ഉറപ്പാക്കുന്ന കമ്പനിയുടെ ഉൽപ്പന്ന ഉൽപ്പാദന തന്ത്രം നിർണ്ണയിക്കാൻ ചുമതല സജ്ജീകരിച്ചിരിക്കുന്നു. 1 സ്റ്റാൻഡേർഡ് യൂണിറ്റിന് യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിന്റെ ഉൽപ്പന്നങ്ങളും 30 റബ്ബും. - രണ്ടാമത്തെ ഗ്രൂപ്പ്.

പരിഹാരം. കമ്പനിക്ക് രണ്ട് തന്ത്രങ്ങളുണ്ട്:

ഈ വർഷം കാലാവസ്ഥ ചൂടായിരിക്കും;

കാലാവസ്ഥ തണുത്തതായിരിക്കും.

കമ്പനി തന്ത്രം സ്വീകരിക്കുകയും വാസ്തവത്തിൽ ഊഷ്മളമായ കാലാവസ്ഥ (പ്രകൃതി തന്ത്രം) ഉണ്ടാവുകയും ചെയ്താൽ, ഉൽപ്പാദിപ്പിക്കുന്ന ഉൽപ്പന്നങ്ങൾ (ആദ്യ ഗ്രൂപ്പിന്റെ 3050 സ്റ്റാൻഡേർഡ് യൂണിറ്റുകളും രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ 1100 സ്റ്റാൻഡേർഡ് യൂണിറ്റുകളും) പൂർണ്ണമായും വിറ്റഴിക്കപ്പെടുകയും വരുമാനം ലഭിക്കുകയും ചെയ്യും.

3050×(40-20)+1100×(30-15)=77500 റബ്.

തണുത്ത കാലാവസ്ഥയിൽ (പ്രകൃതിയുടെ തന്ത്രം), രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ മരുന്നുകൾ പൂർണ്ണമായും വിൽക്കപ്പെടും, ആദ്യ ഗ്രൂപ്പ് 1525 പരമ്പരാഗത യൂണിറ്റുകളുടെ അളവിൽ മാത്രം. യൂണിറ്റുകൾ കൂടാതെ ചില മരുന്നുകൾ വിൽക്കാതെ കിടക്കും. വരുമാനം ഉണ്ടാകും

1525×(40-20)+1100×(30-15)-20×()=16500 റബ്.

അതുപോലെ, രൂപം തന്ത്രം സ്വീകരിക്കുകയും കാലാവസ്ഥ യഥാർത്ഥത്തിൽ തണുത്തതാണെങ്കിൽ, വരുമാനം ആയിരിക്കും

1525×(40-20)+3690×(30-15)=85850 റബ്.

ചൂടുള്ള കാലാവസ്ഥയിൽ, വരുമാനം ഉണ്ടാകും

1525×(40-20)+1100×(30-15)-() ×15=8150 റബ്.

കമ്പനിയെയും കാലാവസ്ഥയെയും രണ്ട് കളിക്കാരായി കണക്കാക്കി, ഞങ്ങൾക്ക് പേയ്‌മെന്റ് മാട്രിക്സ് ലഭിക്കും

,

ഗെയിമിന്റെ വില പരിധിയിലാണ്

എല്ലാ സാഹചര്യങ്ങളിലും കമ്പനിയുടെ വരുമാനം 16,500 റുബിളിൽ കുറയില്ലെന്ന് പേയ്‌മെന്റ് മാട്രിക്സിൽ നിന്ന് വ്യക്തമാണ്, എന്നാൽ കാലാവസ്ഥാ സാഹചര്യങ്ങൾ തിരഞ്ഞെടുത്ത തന്ത്രവുമായി പൊരുത്തപ്പെടുന്നെങ്കിൽ, കമ്പനിയുടെ വരുമാനം 77,500 റുബിളായിരിക്കാം.

ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്താം.

ഒരു തന്ത്രം ഉപയോഗിച്ച് ഒരു സ്ഥാപനത്തിന്റെ സംഭാവ്യതയെ നമുക്ക് സൂചിപ്പിക്കാം, കൂടാതെ ഒരു തന്ത്രം ഉപയോഗിച്ച് . ഗെയിം ഗ്രാഫിക്കായി പരിഹരിക്കുന്നു, നമുക്ക് ലഭിക്കും , ഗെയിമിന്റെ വില പി.

മരുന്നുകളുടെ ഉത്പാദനത്തിനുള്ള ഒപ്റ്റിമൽ പ്ലാൻ ആയിരിക്കും

അതിനാൽ, സെപ്റ്റംബർ, ഒക്ടോബർ മാസങ്ങളിൽ 2379 പരമ്പരാഗത യൂണിറ്റുകൾ ഉൽപ്പാദിപ്പിക്കുന്നതാണ് കമ്പനിക്ക് ഉചിതം. യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിലെ മരുന്നുകളും 2239.6 പരമ്പരാഗത യൂണിറ്റുകളും. യൂണിറ്റുകൾ രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ മരുന്നുകൾ, പിന്നെ ഏത് കാലാവസ്ഥയിലും അവൾക്ക് കുറഞ്ഞത് 46,986 റുബിളെങ്കിലും വരുമാനം ലഭിക്കും.

അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ, ഒരു കമ്പനിക്ക് മിക്സഡ് സ്ട്രാറ്റജി (മറ്റ് ഓർഗനൈസേഷനുകളുമായുള്ള കരാറുകൾ) ഉപയോഗിക്കുന്നത് സാധ്യമല്ലെങ്കിൽ, കമ്പനിയുടെ ഒപ്റ്റിമൽ തന്ത്രം നിർണ്ണയിക്കാൻ ഞങ്ങൾ ഇനിപ്പറയുന്ന മാനദണ്ഡങ്ങൾ ഉപയോഗിക്കുന്നു:

വാൾഡ് മാനദണ്ഡം:

Hurwitz മാനദണ്ഡം: വ്യക്തതയ്ക്കായി ഞങ്ങൾ അംഗീകരിക്കുന്നു, തുടർന്ന് കമ്പനിയുടെ തന്ത്രത്തിനായി

തന്ത്രത്തിന്

ഒരു കമ്പനി ഒരു തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.

ക്രൂരമായ മാനദണ്ഡം. ആദ്യ നിരയിലെ പരമാവധി ഘടകം 77500 ആണ്, രണ്ടാമത്തെ നിരയിൽ - 85850.

റിസ്ക് മാട്രിക്സിന്റെ ഘടകങ്ങൾ എക്സ്പ്രഷനിൽ നിന്ന് കണ്ടെത്തി

,

എവിടെ,,,

റിസ്ക് മാട്രിക്സ് ഇതുപോലെ കാണപ്പെടുന്നു

,

അല്ലെങ്കിൽ തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.

അതിനാൽ, കമ്പനി അല്ലെങ്കിൽ തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.

പരിഗണിക്കുന്ന ഓരോ മാനദണ്ഡവും പൂർണ്ണമായും തൃപ്തികരമാണെന്ന് കണക്കാക്കാനാവില്ല അന്തിമ തിരഞ്ഞെടുപ്പ്തീരുമാനങ്ങൾ, എന്നാൽ അവരുടെ സംയുക്ത വിശകലനം ചില മാനേജ്മെന്റ് തീരുമാനങ്ങൾ എടുക്കുന്നതിന്റെ അനന്തരഫലങ്ങൾ കൂടുതൽ വ്യക്തമായി സങ്കൽപ്പിക്കാൻ ഞങ്ങളെ അനുവദിക്കുന്നു.

പ്രകൃതിയുടെ വിവിധ അവസ്ഥകളുടെ അറിയപ്പെടുന്ന പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ കണക്കിലെടുക്കുമ്പോൾ, വിജയിക്കുന്നതിനുള്ള പരമാവധി ഗണിതശാസ്ത്ര പ്രതീക്ഷയാണ് തീരുമാന മാനദണ്ഡം.

ഊഷ്മളവും തണുത്തതുമായ കാലാവസ്ഥയുടെ സാധ്യതകൾ തുല്യമാണെന്നും 0.5 ആണെന്നും പരിഗണിക്കപ്പെടുന്ന പ്രശ്നത്തെക്കുറിച്ച് അറിയിക്കട്ടെ, തുടർന്ന് കമ്പനിയുടെ ഒപ്റ്റിമൽ തന്ത്രം ഇനിപ്പറയുന്ന രീതിയിൽ നിർണ്ണയിക്കപ്പെടുന്നു:

കമ്പനി അല്ലെങ്കിൽ തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.

സ്വതന്ത്ര ജോലിക്കുള്ള ചുമതലകൾ

1. ഒരു എന്റർപ്രൈസസിന് മൂന്ന് തരം ഉൽപ്പന്നങ്ങൾ (എ, ബി, സി) ഉത്പാദിപ്പിക്കാൻ കഴിയും, അതേസമയം ഡിമാൻഡിന് അനുസരിച്ച് ലാഭം ലഭിക്കും. ആവശ്യത്തിന്, നാല് സംസ്ഥാനങ്ങളിൽ ഒന്ന് (I, II, III, IV) എടുക്കാം. ഇനിപ്പറയുന്ന മാട്രിക്സിൽ, ഘടകങ്ങൾ -th ഉൽപ്പന്നം റിലീസ് ചെയ്യുമ്പോൾ എന്റർപ്രൈസസിന് ലഭിക്കുന്ന ലാഭവും ഡിമാൻഡിന്റെ -th അവസ്ഥയും കാണിക്കുന്നു:

പൊതുവേ, V * ≠ V * - സാഡിൽ പോയിന്റ് ഇല്ല. ശുദ്ധമായ തന്ത്രങ്ങളിൽ ഒപ്റ്റിമൽ പരിഹാരവുമില്ല. എന്നിരുന്നാലും, മിക്സഡ് സ്ട്രാറ്റജി എന്ന ആശയം അവതരിപ്പിച്ചുകൊണ്ട് ഞങ്ങൾ പ്യുവർ സ്ട്രാറ്റജി എന്ന ആശയം വിപുലീകരിക്കുകയാണെങ്കിൽ, നന്നായി നിർവചിക്കപ്പെട്ടിട്ടില്ലാത്ത ഗെയിം പ്രശ്നത്തിന് ഒപ്റ്റിമൽ പരിഹാരം കണ്ടെത്തുന്നതിനുള്ള ഒരു അൽഗോരിതം നടപ്പിലാക്കാൻ സാധിക്കും. അത്തരമൊരു സാഹചര്യത്തിൽ, സീറോ-സം ഗെയിമിന് ഒപ്റ്റിമൽ പരിഹാരം കണ്ടെത്തുന്നതിന് സ്റ്റാറ്റിസ്റ്റിക്കൽ (പ്രോബബിലിസ്റ്റിക്) സമീപനം ഉപയോഗിക്കാൻ നിർദ്ദേശിക്കുന്നു. ഓരോ കളിക്കാരനും, അവനു സാധ്യമായ ഒരു നിശ്ചിത തന്ത്രങ്ങൾക്കൊപ്പം, ഒന്നോ അല്ലെങ്കിൽ മറ്റൊരു തന്ത്രം പ്രയോഗിക്കേണ്ട ഒരു അജ്ഞാത പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തികൾ) അവതരിപ്പിക്കുന്നു.

പ്ലെയർ എയുടെ തന്നിരിക്കുന്ന തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യതകളുടെ വെക്റ്റർ (ആപേക്ഷിക ആവൃത്തികൾ) നമുക്ക് ഇനിപ്പറയുന്ന രീതിയിൽ സൂചിപ്പിക്കാം:
P = (p 1, p 2,..., p m),
ഇവിടെ p i ≥ 0, p 1 + p 2 +…+ p m = 1. p i മൂല്യം A i തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തി) എന്ന് വിളിക്കുന്നു.

അതുപോലെ, B പ്ലെയറിനായി, സാധ്യതകളുടെ ഒരു അജ്ഞാത വെക്റ്റർ (ആപേക്ഷിക ആവൃത്തികൾ) അവതരിപ്പിക്കപ്പെടുന്നു, കൂടാതെ ഫോം ഉണ്ട്:
Q = (q 1, q 2,..., q n),
ഇവിടെ q j ≥ 0, q 1 + q 2 +…+ q n = 1. q j മൂല്യത്തെ B j സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിന്റെ പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തി) എന്ന് വിളിക്കുന്നു. A 1, A 2, …A m, B 1, B 2, …B n എന്നീ ശുദ്ധ തന്ത്രങ്ങളുടെ സെറ്റ് (കോമ്പിനേഷൻ) അവ ഓരോന്നും തിരഞ്ഞെടുക്കാനുള്ള സാധ്യതകളുടെ വെക്‌ടറുകളുമായി സംയോജിപ്പിച്ച് വിളിക്കുന്നു. സമ്മിശ്ര തന്ത്രങ്ങൾ.

ഫിനിറ്റ് സീറോ-സം ഗെയിമുകളുടെ സിദ്ധാന്തത്തിലെ പ്രധാന സിദ്ധാന്തം വോൺ ന്യൂമാന്റെ സിദ്ധാന്തം: ഓരോ ഫിനിറ്റ് മാട്രിക്സ് ഗെയിമിനും ഉണ്ട്, ഇത്രയെങ്കിലും, ഒരു സമുചിതമായ പരിഹാരം, ഒരുപക്ഷേ സമ്മിശ്ര തന്ത്രങ്ങൾക്കിടയിൽ.
ഈ സിദ്ധാന്തത്തിൽ നിന്ന്, നന്നായി നിർവചിക്കപ്പെട്ടിട്ടില്ലാത്ത ഗെയിമിന് സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഒരു സമുചിതമായ പരിഹാരമെങ്കിലും ഉണ്ടെന്ന് പിന്തുടരുന്നു. അത്തരം ഗെയിമുകളിൽ, ഒരു ജോടി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളായ പി *, ക്യു * എന്നിവയായിരിക്കും പരിഹാരം, അതായത് കളിക്കാരിൽ ഒരാൾ തന്റെ ഒപ്റ്റിമൽ തന്ത്രം പാലിക്കുകയാണെങ്കിൽ, മറ്റ് കളിക്കാരന് അവന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിൽ നിന്ന് വ്യതിചലിക്കുന്നത് ലാഭകരമല്ല.
A കളിക്കാരന്റെ ശരാശരി പ്രതിഫലം ഗണിതശാസ്ത്ര പ്രതീക്ഷയാൽ നിർണ്ണയിക്കപ്പെടുന്നു:

ഒരു തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തി) പൂജ്യത്തിൽ നിന്ന് വ്യത്യസ്തമാണെങ്കിൽ, അത്തരമൊരു തന്ത്രത്തെ വിളിക്കുന്നു സജീവമാണ്.

തന്ത്രങ്ങൾ പി*, ക്യു* എന്ന് വിളിക്കുന്നു ഒപ്റ്റിമൽ മിക്സഡ് M A (P, Q *) ≤ M A (P *, Q *) ≤ M A (P *, Q) (1) ആണെങ്കിൽ തന്ത്രങ്ങൾ
ഈ സാഹചര്യത്തിൽ M A (P * , Q *) എന്ന് വിളിക്കുന്നു ചെലവിൽഗെയിമുകളെ V (V * ≤ V ≤ V *) എന്ന് സൂചിപ്പിക്കുന്നു. അസമത്വങ്ങളിൽ ആദ്യത്തേത് (1) എന്നാണ് കളിക്കാരൻ എയുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ നിന്നുള്ള വ്യതിചലനംകളിക്കാരൻ ബി തന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ ഉറച്ചുനിൽക്കുകയാണെങ്കിൽ, ശരാശരി വിജയങ്ങളിൽ കുറവുണ്ടാക്കുന്നുകളിക്കാരൻ എ. അസമത്വങ്ങളിൽ രണ്ടാമത്തേത് അർത്ഥമാക്കുന്നത് കളിക്കാരൻ ബിയുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ നിന്നുള്ള വ്യതിയാനംകളിക്കാരൻ എ തന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ ഉറച്ചുനിൽക്കുകയാണെങ്കിൽ, കളിക്കാരൻ ബിയുടെ ശരാശരി നഷ്ടം വർദ്ധിക്കുന്നതിലേക്ക് നയിക്കുന്നു.

പൊതുവേ, അത്തരം പ്രശ്നങ്ങൾ ഈ കാൽക്കുലേറ്റർ ഉപയോഗിച്ച് വിജയകരമായി പരിഹരിക്കാൻ കഴിയും.

ഉദാഹരണം.

4 7 2
7 3 2
2 1 8

1. പേയ്‌മെന്റ് മാട്രിക്‌സിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടോ എന്ന് പരിശോധിക്കുക. അതെ എങ്കിൽ, ഗെയിമിനുള്ള പരിഹാരം ഞങ്ങൾ ശുദ്ധമായ തന്ത്രങ്ങളിൽ എഴുതുന്നു.

കളിക്കാരൻ I തന്റെ പ്രതിഫലം പരമാവധി വർദ്ധിപ്പിക്കുന്ന തരത്തിൽ അവന്റെ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു എന്ന് ഞങ്ങൾ അനുമാനിക്കുന്നു, കൂടാതെ I-ന്റെ പ്രതിഫലം കുറയ്ക്കുന്ന തരത്തിൽ കളിക്കാരൻ II അവന്റെ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു.

കളിക്കാർ ബി 1 ബി 2 ബി 3 a = മിനിറ്റ് (A i)
എ 1 4 7 2 2
എ 2 7 3 2 2
എ 3 2 1 8 1
b = പരമാവധി(B i) 7 7 8

ഗെയിമിന്റെ കുറഞ്ഞ വില a = max(a i) = 2 നിർണ്ണയിക്കുന്ന ഗ്യാരണ്ടീഡ് പേഓഫ് ഞങ്ങൾ കണ്ടെത്തുന്നു, ഇത് പരമാവധി ശുദ്ധമായ തന്ത്രം A 1 സൂചിപ്പിക്കുന്നു.
ഗെയിമിന്റെ ഉയർന്ന വില b = min(b j) = 7. ഇത് ഒരു സാഡിൽ പോയിന്റിന്റെ അഭാവത്തെ സൂചിപ്പിക്കുന്നു, a ≠ b ആയതിനാൽ, ഗെയിമിന്റെ വില 2 ≤ y ≤ 7 പരിധിക്കുള്ളിലാണ്. ഞങ്ങൾ ഒരു പരിഹാരം കണ്ടെത്തുന്നു സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഗെയിമിലേക്ക്. കളിക്കാർക്ക് അവരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ശത്രുവിനോട് പ്രഖ്യാപിക്കാൻ കഴിയില്ല എന്ന വസ്തുത ഇത് വിശദീകരിക്കുന്നു: അവർ അവരുടെ പ്രവർത്തനങ്ങൾ മറയ്ക്കണം. കളിക്കാർക്ക് അവരുടെ തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കാൻ അനുവദിച്ചുകൊണ്ട് ഗെയിം പരിഹരിക്കാനാകും ക്രമരഹിതമായി(ശുദ്ധമായ തന്ത്രങ്ങൾ മിക്സ് ചെയ്യുക).

2. പ്രബലമായ വരികൾക്കും പ്രബലമായ കോളങ്ങൾക്കും പേയ്‌മെന്റ് മാട്രിക്സ് പരിശോധിക്കുക.
പേയ്‌മെന്റ് മാട്രിക്‌സിൽ പ്രബലമായ വരികളോ ആധിപത്യ നിരകളോ ഇല്ല.

3. സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക.
സമവാക്യങ്ങളുടെ ഒരു സിസ്റ്റം എഴുതാം.
ഐ കളിക്കാരന്
4p 1 +7p 2 +2p 3 = y
7p 1 +3p 2 +p 3 = y
2p 1 +2p 2 +8p 3 = y
p 1 +p 2 +p 3 = 1

പ്ലെയർ II-ന്
4q 1 +7q 2 +2q 3 = y
7q 1 +3q 2 +2q 3 = y
2q 1 +q 2 +8q 3 = y
q 1 + q 2 + q 3 = 1

ഗാസ് രീതി ഉപയോഗിച്ച് ഈ സിസ്റ്റങ്ങൾ പരിഹരിക്കുന്നത്, ഞങ്ങൾ കണ്ടെത്തുന്നു:

y = 4 1 / 34
p 1 = 29 / 68 (ഒന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
p 2 = 4 / 17 (രണ്ടാം തന്ത്രം ഉപയോഗിക്കാനുള്ള സാധ്യത).
p 3 = 23 / 68 (മൂന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).

പ്ലെയർ I-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി: P = (29 / 68; 4 / 17; 23 / 68)
q 1 = 6 / 17 (ഒന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
q 2 = 9 / 34 (രണ്ടാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
q 3 = 13 / 34 (മൂന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).

പ്ലെയർ II-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി: Q = (6 / 17; 9 / 34; 13 / 34)
ഗെയിം വില: y = 4 1 / 34

ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഗെയിമിന്റെ വിലയും കളിക്കാരുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങളും നിർണ്ണയിക്കുന്നതിൽ ബുദ്ധിമുട്ടുകൾ ഉണ്ടാകുന്നു. ഉദാഹരണത്തിന്, ഗെയിം പരിഗണിക്കുക:

ഈ ഗെയിമിൽ ഒപ്പം. അതിനാൽ, ആദ്യ കളിക്കാരന് സ്വയം 4-ന് തുല്യമായ വിജയം ഉറപ്പ് നൽകാം, രണ്ടാമത്തേതിന് തന്റെ തോൽവി 5 ആയി പരിമിതപ്പെടുത്താം. തമ്മിലുള്ള വിസ്തീർണ്ണം, സമനില, ഓരോ കളിക്കാരനും അതിന്റെ ചെലവിൽ തന്റെ ഫലം മെച്ചപ്പെടുത്താൻ ശ്രമിക്കാം. പ്രദേശം. ഈ സാഹചര്യത്തിൽ കളിക്കാരുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ എന്തായിരിക്കണം?

ഓരോ കളിക്കാരനും നക്ഷത്രചിഹ്നം (ഒപ്പം) ഉപയോഗിച്ച് അടയാളപ്പെടുത്തിയ തന്ത്രം ഉപയോഗിക്കുകയാണെങ്കിൽ, ആദ്യ കളിക്കാരന്റെ വിജയവും രണ്ടാമന്റെ തോൽവിയും 5 ന് തുല്യമായിരിക്കും. രണ്ടാമത്തെ കളിക്കാരന് ഇത് ദോഷകരമാണ്, കാരണം ആദ്യത്തേത് ഉറപ്പ് നൽകുന്നതിനേക്കാൾ കൂടുതൽ വിജയിക്കുന്നു. തന്നെ. എന്നിരുന്നാലും, തന്ത്രം ഉപയോഗിക്കാനുള്ള ആദ്യ കളിക്കാരന്റെ ഉദ്ദേശ്യം രണ്ടാമത്തെ കളിക്കാരൻ എങ്ങനെയെങ്കിലും വെളിപ്പെടുത്തിയാൽ, അയാൾക്ക് തന്ത്രം പ്രയോഗിക്കുകയും ആദ്യ കളിക്കാരന്റെ പ്രതിഫലം 4 ആയി കുറയ്ക്കുകയും ചെയ്യാം. എന്നിരുന്നാലും, തന്ത്രം ഉപയോഗിക്കാനുള്ള രണ്ടാമത്തെ കളിക്കാരന്റെ ഉദ്ദേശ്യം ആദ്യ കളിക്കാരൻ വെളിപ്പെടുത്തിയാൽ, പിന്നെ, തന്ത്രം ഉപയോഗിച്ച്, അവൻ തന്റെ പ്രതിഫലം 6 ആയി വർദ്ധിപ്പിക്കും, അങ്ങനെ, ഓരോ കളിക്കാരനും താൻ ഉപയോഗിക്കാൻ പോകുന്ന തന്ത്രം രഹസ്യമായി സൂക്ഷിക്കേണ്ട ഒരു സാഹചര്യം ഉണ്ടാകുന്നു. എന്നിരുന്നാലും, ഇത് എങ്ങനെ ചെയ്യണം? എല്ലാത്തിനുമുപരി, ഗെയിം നിരവധി തവണ കളിക്കുകയും രണ്ടാമത്തെ കളിക്കാരൻ എല്ലായ്പ്പോഴും തന്ത്രം ഉപയോഗിക്കുകയും ചെയ്യുന്നുവെങ്കിൽ, ആദ്യ കളിക്കാരൻ ഉടൻ തന്നെ രണ്ടാമത്തെ കളിക്കാരന്റെ പദ്ധതി കണ്ടെത്തുകയും തന്ത്രം പ്രയോഗിച്ചാൽ ഒരു അധിക വിജയം നേടുകയും ചെയ്യും. വ്യക്തമായും, രണ്ടാമത്തെ കളിക്കാരൻ ഓരോ പുതിയ ഗെയിമിലും തന്ത്രം മാറ്റണം, എന്നാൽ ഓരോ സാഹചര്യത്തിലും താൻ ഏത് തന്ത്രമാണ് ഉപയോഗിക്കേണ്ടതെന്ന് ആദ്യ കളിക്കാരൻ ഊഹിക്കാത്ത വിധത്തിൽ ഇത് ചെയ്യണം.

ഒരു റാൻഡം സെലക്ഷൻ മെക്കാനിസത്തിന്, കളിക്കാരുടെ വിജയങ്ങളും നഷ്ടങ്ങളും ആയിരിക്കും ക്രമരഹിതമായ വേരിയബിളുകൾ. ഈ കേസിൽ കളിയുടെ ഫലം രണ്ടാമത്തെ കളിക്കാരന്റെ ശരാശരി നഷ്ടം കണക്കാക്കാം. നമുക്ക് ഉദാഹരണത്തിലേക്ക് മടങ്ങാം. അതിനാൽ, രണ്ടാമത്തെ കളിക്കാരൻ ഒരു തന്ത്രം ഉപയോഗിക്കുകയും ക്രമരഹിതമായി 0.5 പ്രോബബിലിറ്റികൾ ഉപയോഗിക്കുകയും ചെയ്യുന്നുവെങ്കിൽ; 0.5, അപ്പോൾ ആദ്യ കളിക്കാരന്റെ തന്ത്രം ഉപയോഗിച്ച് അവന്റെ നഷ്ടത്തിന്റെ ശരാശരി മൂല്യം ഇതായിരിക്കും:

ഒപ്പം ആദ്യ കളിക്കാരന്റെ തന്ത്രവും

അതിനാൽ, ആദ്യ കളിക്കാരൻ ഉപയോഗിക്കുന്ന തന്ത്രം പരിഗണിക്കാതെ തന്നെ രണ്ടാമത്തെ കളിക്കാരന് തന്റെ ശരാശരി നഷ്ടം 4.5 ആയി പരിമിതപ്പെടുത്താൻ കഴിയും.

അതിനാൽ, ചില സന്ദർഭങ്ങളിൽ, ഒരു തന്ത്രം മുൻ‌കൂട്ടി രൂപപ്പെടുത്തുകയല്ല, മറിച്ച് ഏതെങ്കിലും തരത്തിലുള്ള റാൻഡം സെലക്ഷൻ മെക്കാനിസം ഉപയോഗിച്ച് ക്രമരഹിതമായി ഒന്നോ അതിലധികമോ തിരഞ്ഞെടുക്കുന്നതാണ് ഉചിതം. ക്രമരഹിതമായ തിരഞ്ഞെടുപ്പിനെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു തന്ത്രത്തെ വിളിക്കുന്നു സമ്മിശ്ര തന്ത്രം, വിളിക്കപ്പെടുന്ന ഉദ്ദേശിച്ച തന്ത്രങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി ശുദ്ധമായ തന്ത്രങ്ങൾ.

ശുദ്ധവും സമ്മിശ്രവുമായ തന്ത്രങ്ങൾക്ക് കൂടുതൽ കർശനമായ നിർവചനം നൽകാം.



സാഡിൽ പോയിന്റില്ലാതെ ഒരു ഗെയിം നടക്കട്ടെ:

ആദ്യ കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ ആവൃത്തി , (i-th സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത) ഉപയോഗിച്ച് നമുക്ക് സൂചിപ്പിക്കാം. അതുപോലെ, രണ്ടാമത്തെ കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ ആവൃത്തി , (j-th സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത) ഉപയോഗിച്ച് നമുക്ക് സൂചിപ്പിക്കാം. ഒരു സാഡിൽ പോയിന്റുള്ള ഗെയിമിന്, ശുദ്ധമായ തന്ത്രങ്ങളിൽ ഒരു പരിഹാരമുണ്ട്. സാഡിൽ പോയിന്റ് ഇല്ലാത്ത ഒരു ഗെയിമിന്, സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഒരു പരിഹാരമുണ്ട്, അതായത്, തന്ത്രത്തിന്റെ തിരഞ്ഞെടുപ്പ് സാധ്യതകളെ അടിസ്ഥാനമാക്കിയുള്ളതായിരിക്കുമ്പോൾ. പിന്നെ

ശുദ്ധമായ 1st പ്ലെയർ തന്ത്രങ്ങൾ ധാരാളം;

ധാരാളം മിക്‌സഡ് 1st കളിക്കാരുടെ തന്ത്രങ്ങൾ;

ധാരാളം ശുദ്ധമായ രണ്ടാം കളിക്കാരന്റെ തന്ത്രങ്ങൾ;

നിരവധി സമ്മിശ്ര രണ്ടാം കളിക്കാരന്റെ തന്ത്രങ്ങൾ.

നമുക്ക് ഒരു ഉദാഹരണം നോക്കാം: ഒരു ഗെയിം ഉണ്ടാകട്ടെ

രണ്ടാമത്തെ കളിക്കാരൻ സാധ്യത തിരഞ്ഞെടുക്കുന്നു . യഥാക്രമം തന്ത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ രണ്ടാമത്തെ കളിക്കാരന്റെ ശരാശരി നഷ്ടം നമുക്ക് കണക്കാക്കാം.

ശുദ്ധവും സമ്മിശ്രവുമായ തന്ത്രങ്ങളുണ്ട്. ശുദ്ധമായ തന്ത്രം
ആദ്യ കളിക്കാരൻ (ശുദ്ധമായ തന്ത്രം
രണ്ടാമത്തെ കളിക്കാരൻ) ആദ്യ (രണ്ടാം) കളിക്കാരന്റെ സാധ്യമായ നീക്കമാണ്, അവൻ തിരഞ്ഞെടുത്തത് 1 ന് തുല്യമാണ്.

ആദ്യ കളിക്കാരന് m സ്ട്രാറ്റജികളും രണ്ടാമത്തെ കളിക്കാരന് n സ്ട്രാറ്റജികളും ഉണ്ടെങ്കിൽ, ആദ്യത്തെയും രണ്ടാമത്തെയും കളിക്കാരുടെ ഏത് ജോഡി തന്ത്രങ്ങൾക്കും, ശുദ്ധമായ തന്ത്രങ്ങളെ യൂണിറ്റ് വെക്റ്ററുകളായി പ്രതിനിധീകരിക്കാം. ഉദാഹരണത്തിന്, ഒരു ജോടി തന്ത്രങ്ങൾക്കായി
,
ഒന്നും രണ്ടും കളിക്കാരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ഇങ്ങനെ എഴുതപ്പെടും:
,
. ഒരു ജോടി തന്ത്രങ്ങൾക്കായി ,ശുദ്ധമായ തന്ത്രങ്ങൾ ഇങ്ങനെ എഴുതാം:

,

.

സിദ്ധാന്തം: ഒരു മാട്രിക്സ് ഗെയിമിൽ, ഗെയിമിന്റെ കുറഞ്ഞ അറ്റ ​​വില ഗെയിമിന്റെ ഉയർന്ന അറ്റ ​​വിലയേക്കാൾ കൂടുതലാകില്ല, അതായത്.
.

നിർവ്വചനം:ശുദ്ധമായ തന്ത്രങ്ങൾക്കാണെങ്കിൽ ,യഥാക്രമം എ, ബി കളിക്കാർ സമത്വമുണ്ട്
, പിന്നെ ഒരു ജോടി ശുദ്ധമായ തന്ത്രങ്ങൾ ( ,) മാട്രിക്സ് ഗെയിമിന്റെ സാഡിൽ പോയിന്റ്, മൂലകം എന്ന് വിളിക്കുന്നു മാട്രിക്സ്, i-th വരിയുടെയും j-th നിരയുടെയും കവലയിൽ നിൽക്കുന്നത് പേയ്മെന്റ് മാട്രിക്സിന്റെ സാഡിൽ ഘടകമാണ്, കൂടാതെ നമ്പർ
- കളിയുടെ ശുദ്ധമായ വില.

ഉദാഹരണം:താഴ്ന്നതും ഉയർന്നതുമായ നെറ്റ് വിലകൾ കണ്ടെത്തുക, മാട്രിക്സ് ഗെയിമിന്റെ സാഡിൽ പോയിന്റുകളുടെ സാന്നിധ്യം സ്ഥാപിക്കുക

.

ഗെയിമിന്റെ താഴ്ന്നതും ഉയർന്നതുമായ അറ്റ ​​വിലകൾ നമുക്ക് നിർണ്ണയിക്കാം: , ,
.

ഈ സാഹചര്യത്തിൽ, നമുക്ക് ഒരു സാഡിൽ പോയിന്റ് (A 1 ; B 2) ഉണ്ട്, സാഡിൽ ഘടകം 5 ആണ്. ഈ ഘടകം 1-ആം വരിയിലെ ഏറ്റവും ചെറുതും 2-ാം നിരയിലെ ഏറ്റവും വലുതുമാണ്. മാക്സിമിൻ തന്ത്രമായ A 1-ൽ നിന്ന് കളിക്കാരൻ A യുടെ വ്യതിചലനം അവന്റെ വിജയങ്ങളിൽ കുറവുണ്ടാക്കുന്നു, കൂടാതെ മിനിമാക്സ് തന്ത്രമായ B 2-ൽ നിന്ന് കളിക്കാരൻ B യുടെ വ്യതിചലനം നഷ്ടം വർദ്ധിക്കുന്നതിലേക്ക് നയിക്കുന്നു. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഒരു മാട്രിക്സ് ഗെയിമിന് ഒരു സാഡിൽ ഘടകം ഉണ്ടെങ്കിൽ, കളിക്കാർക്ക് ഏറ്റവും മികച്ച തന്ത്രങ്ങൾ അവരുടെ മിനിമാക്സ് തന്ത്രങ്ങളാണ്. ഈ ശുദ്ധമായ തന്ത്രങ്ങൾ, ഒരു സാഡിൽ പോയിന്റ് രൂപീകരിക്കുകയും ഗെയിം മാട്രിക്സിൽ 12 =5 എന്ന സാഡിൽ മൂലകത്തെ ഹൈലൈറ്റ് ചെയ്യുകയും ചെയ്യുന്നത് ഒപ്റ്റിമൽ പ്യുവർ സ്ട്രാറ്റജികളാണ്. ഒപ്പം യഥാക്രമം എ, ബി കളിക്കാർ.

ഒരു മാട്രിക്സ് ഗെയിമിന് സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഗെയിം പരിഹരിക്കുന്നത് ബുദ്ധിമുട്ടാണ്. ഈ ഗെയിമുകളിൽ
. അത്തരം ഗെയിമുകളിൽ മിനിമാക്സ് തന്ത്രങ്ങളുടെ ഉപയോഗം ഓരോ കളിക്കാരന്റെയും പ്രതിഫലം കവിയുന്നില്ല എന്ന വസ്തുതയിലേക്ക് നയിക്കുന്നു. , തോൽവിയും കുറവല്ല . ഓരോ കളിക്കാരനും, വിജയങ്ങൾ (നഷ്ടം കുറയ്ക്കൽ) വർദ്ധിപ്പിക്കുന്ന ചോദ്യം ഉയർന്നുവരുന്നു. സമ്മിശ്ര തന്ത്രങ്ങൾ ഉപയോഗിച്ചാണ് പരിഹാരം കണ്ടെത്തുന്നത്.

നിർവ്വചനം:ആദ്യ (രണ്ടാം) കളിക്കാരന്റെ മിക്സഡ് തന്ത്രം ഒരു വെക്റ്റർ ആണ്
, എവിടെ
ഒപ്പം
(
, എവിടെ
ഒപ്പം
).

വെക്റ്റർ p(q) എന്നാൽ ആദ്യ കളിക്കാരൻ i-th പ്യുവർ സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യതയാണ് (രണ്ടാമത്തെ കളിക്കാരന്റെ j-th പ്യുവർ സ്ട്രാറ്റജി).

കളിക്കാർ അവരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ക്രമരഹിതമായും പരസ്പരം സ്വതന്ത്രമായും തിരഞ്ഞെടുക്കുന്നതിനാൽ, ഗെയിം ക്രമരഹിതവും വിജയങ്ങളുടെ (നഷ്ടങ്ങൾ) ക്രമരഹിതവുമാണ്. ഈ സാഹചര്യത്തിൽ, ലാഭത്തിന്റെ (നഷ്ടം) ശരാശരി മൂല്യം - ഗണിതശാസ്ത്ര പ്രതീക്ഷ - സമ്മിശ്ര തന്ത്രങ്ങളുടെ പ്രവർത്തനമാണ് p, q:

.

നിർവ്വചനം: f(р, q) ഫംഗ്‌ഷനെ മാട്രിക്സ് ഗെയിമിന്റെ പേഓഫ് ഫംഗ്ഷൻ എന്ന് വിളിക്കുന്നു
.

നിർവ്വചനം:തന്ത്രങ്ങൾ
,
അനിയന്ത്രിതമായ തന്ത്രങ്ങളാണെങ്കിൽ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു
,
വ്യവസ്ഥ പാലിക്കപ്പെടുന്നു

ഗെയിമിലെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുടെ ഉപയോഗം ആദ്യ കളിക്കാരന് മറ്റേതെങ്കിലും തന്ത്രം ഉപയോഗിക്കുന്നതിനേക്കാൾ കുറഞ്ഞ പ്രതിഫലം നൽകുന്നു; രണ്ടാമത്തെ കളിക്കാരന് മറ്റേതെങ്കിലും തന്ത്രം ഉപയോഗിച്ചാൽ കൂടുതൽ നഷ്ടമാകില്ല q.

ഒപ്റ്റിമൽ തന്ത്രങ്ങളുടെയും ഗെയിമിന്റെ വിലയുടെയും സംയോജനമാണ് ഗെയിമിന്റെ പരിഹാരം.

© 2024 skudelnica.ru -- പ്രണയം, വിശ്വാസവഞ്ചന, മനഃശാസ്ത്രം, വിവാഹമോചനം, വികാരങ്ങൾ, വഴക്കുകൾ