ശുദ്ധമായ തന്ത്ര ഗെയിമുകൾ. എലീന വെന്റ്സെൽ
തിയറി ഗെയിം സ്ട്രാറ്റജി മിക്സഡ്
സമ്മിശ്ര തന്ത്രങ്ങൾ
ഒരു മാട്രിക്സ് ഗെയിമിന് ശുദ്ധമായ തന്ത്രങ്ങളിൽ സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഗെയിമിന്റെ ഉയർന്നതും താഴ്ന്നതുമായ വിലകൾ കണ്ടെത്തും. പ്ലെയർ 1 ന് ഗെയിമിന്റെ ഉയർന്ന വിലയേക്കാൾ വലിയ പ്രതിഫലം ലഭിക്കില്ലെന്നും, ഗെയിമിന്റെ ഏറ്റവും കുറഞ്ഞ വിലയേക്കാൾ കുറഞ്ഞ പ്രതിഫലം പ്ലെയർ 1ന് ഉറപ്പുനൽകുന്നുവെന്നും അവർ കാണിക്കുന്നു.
ഒരു കളിക്കാരന്റെ മിക്സഡ് സ്ട്രാറ്റജി എന്നത് അവന്റെ ശുദ്ധമായ തന്ത്രങ്ങളുടെ ഒരു സമ്പൂർണ്ണ സെറ്റാണ്, നൽകിയിരിക്കുന്ന സാധ്യതകളോടെ ഒരേ സാഹചര്യങ്ങളിൽ ഗെയിം പലതവണ ആവർത്തിക്കുമ്പോൾ. പറഞ്ഞ കാര്യങ്ങൾ സംഗ്രഹിച്ച് ഉപയോഗ വ്യവസ്ഥകൾ പട്ടികപ്പെടുത്താം സമ്മിശ്ര തന്ത്രങ്ങൾ:
- * സാഡിൽ പോയിന്റില്ലാത്ത ഗെയിം;
- * കളിക്കാർ നൽകിയിരിക്കുന്ന സാധ്യതകളുള്ള ശുദ്ധമായ തന്ത്രങ്ങളുടെ ക്രമരഹിതമായ മിശ്രിതം ഉപയോഗിക്കുന്നു;
- * സമാനമായ സാഹചര്യങ്ങളിൽ ഗെയിം നിരവധി തവണ ആവർത്തിക്കുന്നു;
- * ഓരോ നീക്കത്തിലും, മറ്റ് കളിക്കാരൻ തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിനെക്കുറിച്ച് ഒരു കളിക്കാരനെയും അറിയിക്കില്ല;
- * ഗെയിം ഫലങ്ങളുടെ ശരാശരി അനുവദനീയമാണ്.
സമ്മിശ്ര തന്ത്രങ്ങൾക്കായി ഇനിപ്പറയുന്ന പദവികൾ ഉപയോഗിക്കുന്നു.
പ്ലെയർ 1-ന്, ഒരു സമ്മിശ്ര തന്ത്രം ശുദ്ധമായ തന്ത്രങ്ങൾ A 1, A 2, ..., A t എന്നിവയുമായി ബന്ധപ്പെട്ട പ്രോബബിലിറ്റികൾ ഉപയോഗിച്ച് p 1, p 2, ..., p t എന്നിവ ഉൾക്കൊള്ളുന്നു.
കളിക്കാരന് 2
q j എന്നത് ശുദ്ധമായ തന്ത്രം B j ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യതയാണ്.
p i = 1 ആണെങ്കിൽ, പ്ലെയർ 1-ന് നമുക്ക് ഒരു ശുദ്ധമായ തന്ത്രമുണ്ട്
കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രങ്ങൾ മാത്രമാണ് സാധ്യമായ പൊരുത്തപ്പെടാത്ത ഇവന്റുകൾ. ഒരു മാട്രിക്സ് ഗെയിമിൽ, മാട്രിക്സ് എ അറിയുന്നത് (ഇത് പ്ലെയർ 1 നും പ്ലെയർ 2 നും ബാധകമാണ്), എപ്പോൾ എന്ന് നമുക്ക് നിർണ്ണയിക്കാനാകും നൽകിയ വെക്റ്ററുകൾശരാശരി വിജയങ്ങളും ( പ്രതീക്ഷിച്ച മൂല്യംപ്രഭാവം) പ്ലെയർ 1:
വെക്ടറുകൾ എവിടെയാണ്,
p i, q i എന്നിവ വെക്റ്ററുകളുടെ ഘടകങ്ങളാണ്.
അവരുടെ സമ്മിശ്ര തന്ത്രങ്ങൾ പ്രയോഗിക്കുന്നതിലൂടെ, കളിക്കാരൻ 1 തന്റെ ശരാശരി പ്രതിഫലം പരമാവധിയാക്കാൻ ശ്രമിക്കുന്നു, കൂടാതെ പ്ലെയർ 2 ഈ പ്രഭാവം സാധ്യമായ ഏറ്റവും കുറഞ്ഞ മൂല്യത്തിലേക്ക് കുറയ്ക്കാൻ ശ്രമിക്കുന്നു. പ്ലെയർ 1 എത്താൻ ശ്രമിക്കുന്നു
പ്ലെയർ 2 വ്യവസ്ഥ പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കുന്നു
1, 2 എന്നീ കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുമായി ബന്ധപ്പെട്ട വെക്റ്ററുകളും നമുക്ക് സൂചിപ്പിക്കാം, അതായത്. അത്തരം വെക്ടറുകൾ, അതിനായി തുല്യത തൃപ്തിപ്പെടുത്തും
രണ്ട് കളിക്കാരും സമ്മിശ്ര തന്ത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ പ്ലെയർ 1 ന്റെ ശരാശരി പ്രതിഫലമാണ് ഗെയിമിന്റെ വില. അതിനാൽ, മാട്രിക്സ് ഗെയിമിനുള്ള പരിഹാരം ഇതാണ്:
- - പ്ലെയർ 1-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി;
- - പ്ലെയർ 2-നുള്ള ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി;
ഗെയിം വില.
മിക്സഡ് സ്ട്രാറ്റജികൾ ഒപ്റ്റിമൽ ആയിരിക്കും (ഒപ്പം) അവ ഫംഗ്ഷനായി ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടാക്കുകയാണെങ്കിൽ, അതായത്.
ഗണിത ഗെയിമുകൾക്ക് ഒരു അടിസ്ഥാന സിദ്ധാന്തമുണ്ട്.
ഏതെങ്കിലും മാട്രിക്സ് A ഉള്ള മാട്രിക്സ് ഗെയിമിനായി
നിലനിൽക്കുന്നതും പരസ്പരം തുല്യവുമാണ്: = = .
ഒപ്റ്റിമൽ സ്ട്രാറ്റജികൾ തിരഞ്ഞെടുക്കുമ്പോൾ, പ്ലെയർ 2-ന്റെ ഏതൊരു നിശ്ചിത തന്ത്രത്തിനും (പിന്നിൽ, പ്ലെയർ 2-ന് വേണ്ടി, കളിയുടെ വിലയേക്കാൾ കുറയാത്ത, ശരാശരി പ്രതിഫലം പ്ലെയർ 1-ന് എല്ലായ്പ്പോഴും ഉറപ്പുനൽകും എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്. 1, 2 കളിക്കാരുടെ സജീവ തന്ത്രങ്ങൾ പൂജ്യം ഒഴികെയുള്ള സാധ്യതകളുള്ള അനുബന്ധ കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുടെ ഭാഗമായ തന്ത്രങ്ങളാണ്. ഇതിനർത്ഥം കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളിൽ അവരുടെ എല്ലാ മുൻഗണനാ തന്ത്രങ്ങളും ഉൾപ്പെട്ടേക്കില്ല എന്നാണ്.
ഒരു ഗെയിം പരിഹരിക്കുക എന്നതിനർത്ഥം ഗെയിമിന്റെ വിലയും ഒപ്റ്റിമൽ തന്ത്രങ്ങളും കണ്ടെത്തുക എന്നാണ്. മാട്രിക്സ് ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള രീതികളെക്കുറിച്ചുള്ള നമ്മുടെ പരിഗണന ആരംഭിക്കാം ഏറ്റവും ലളിതമായ ഗെയിം, മാട്രിക്സ് 22 വിവരിച്ചിരിക്കുന്നു. സാഡിൽ പോയിന്റുള്ള ഗെയിമുകൾ പ്രത്യേകമായി പരിഗണിക്കില്ല. ഒരു സാഡിൽ പോയിന്റ് ലഭിക്കുകയാണെങ്കിൽ, ഉപേക്ഷിക്കപ്പെടേണ്ട ലാഭകരമല്ലാത്ത തന്ത്രങ്ങൾ ഉണ്ടെന്നാണ് ഇതിനർത്ഥം. ഒരു സാഡിൽ പോയിന്റിന്റെ അഭാവത്തിൽ, രണ്ട് ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ ലഭിക്കും. ഇതിനകം സൂചിപ്പിച്ചതുപോലെ, ഈ സമ്മിശ്ര തന്ത്രങ്ങൾ ഇനിപ്പറയുന്ന രീതിയിൽ എഴുതിയിരിക്കുന്നു:
ഇതിനർത്ഥം ഒരു പേയ്മെന്റ് മാട്രിക്സ് ഉണ്ടെന്നാണ്
a 11 p 1 + a 21 p 2 = ; (1.16)
a 12 p 1 + a 22 p 2 = ; (1.17)
p 1 + p 2 = 1. (1.18)
a 11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)
a 11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1 , (1.20)
ഇവിടെ നമുക്ക് ഒപ്റ്റിമൽ മൂല്യങ്ങൾ ലഭിക്കും:
അറിയുന്നതും, ഞങ്ങൾ കണ്ടെത്തുന്നതും:
കണക്കാക്കിയ ശേഷം, ഞങ്ങൾ കണ്ടെത്തുന്നു:
a 11 q 1 + a 12 q 2 = ; q 1 + q 2 = 1; (1.24)
a 11 q 1 + a 12 (1 - q 1) = . (1.25)
ഒരു 11 മുതൽ 12 വരെ. (1.26)
വെക്റ്ററുകളും ഗെയിമിന്റെ വിലയും കണ്ടെത്തിയതിനാൽ പ്രശ്നം പരിഹരിച്ചു. പേയ്മെന്റ് മാട്രിക്സ് A ഉള്ളതിനാൽ, നിങ്ങൾക്ക് ഗ്രാഫിക്കായി പ്രശ്നം പരിഹരിക്കാനാകും. ഈ രീതി ഉപയോഗിച്ച്, പരിഹാര അൽഗോരിതം വളരെ ലളിതമാണ് (ചിത്രം 2.1).
- 1. യൂണിറ്റ് നീളത്തിന്റെ ഒരു ഭാഗം abscissa അക്ഷത്തിൽ പ്ലോട്ട് ചെയ്തിരിക്കുന്നു.
- 2. സ്ട്രാറ്റജി A 1-ന്റെ വിജയങ്ങൾ y-ആക്സിസ് കാണിക്കുന്നു.
- 3. ഓർഡിനേറ്റിന് സമാന്തരമായ ഒരു വരിയിൽ, പോയിന്റ് 1-ൽ, തന്ത്രം a 2-ന്റെ വിജയങ്ങൾ പ്ലോട്ട് ചെയ്യുന്നു.
- 4. സെഗ്മെന്റുകളുടെ അറ്റങ്ങൾ a 11 -b 11, a 12 -b 21, a 22 -b 22, a 21 -b 12 എന്നിവയ്ക്കായി നിയുക്തമാക്കിയിരിക്കുന്നു കൂടാതെ രണ്ട് നേർരേഖകൾ b 11 b 12, b 21 b 22 എന്നിവ വരയ്ക്കുന്നു.
- 5. വിഭജനത്തിന്റെ പോയിന്റിന്റെ ഓർഡിനേറ്റ് നിർണ്ണയിക്കപ്പെടുന്നു. അവൾ തുല്യമാണ്. പോയിന്റ് c യുടെ abscissa p 2 (p 1 = 1 - p 2) ന് തുല്യമാണ്.
അരി. 1.1
ഈ രീതിക്ക് വളരെ വിശാലമായ ആപ്ലിക്കേഷൻ ഏരിയയുണ്ട്. ഇത് അടിസ്ഥാനമാക്കിയുള്ളതാണ് പൊതു സ്വത്ത്ഗെയിമുകൾ TP, ഏത് ഗെയിമിലും TP ഓരോ കളിക്കാരനും ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി ഉണ്ട്, അതിൽ ശുദ്ധമായ തന്ത്രങ്ങളുടെ എണ്ണം min(m, n) നേക്കാൾ കൂടുതലല്ല. ഈ പ്രോപ്പർട്ടിയിൽ നിന്ന് നമുക്ക് അറിയപ്പെടുന്ന ഒരു പരിണതഫലം ലഭിക്കും: ഏത് ഗെയിമിലും 2n, m2, ഓരോ ഒപ്റ്റിമൽ സ്ട്രാറ്റജിയിലും പരമാവധി രണ്ട് സജീവ തന്ത്രങ്ങൾ അടങ്ങിയിരിക്കുന്നു. ഇതിനർത്ഥം ഏത് ഗെയിമും 2n, m2 എന്നിവ ഗെയിം 22 ആയി ചുരുക്കാം. തൽഫലമായി, 2n, m2 ഗെയിമുകൾ ഗ്രാഫിക്കായി പരിഹരിക്കാനാകും. പരിമിതമായ ഗെയിം മാട്രിക്സിന് mn ഡയമൻഷൻ ഉണ്ടെങ്കിൽ, ഇവിടെ m > 2, n > 2, ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ നിർണ്ണയിക്കാൻ ലീനിയർ പ്രോഗ്രാമിംഗ് ഉപയോഗിക്കുന്നു.
5. ഗെയിമുകളുടെയും സ്റ്റാറ്റിസ്റ്റിക്കൽ തീരുമാനങ്ങളുടെയും സിദ്ധാന്തം
5.1 സീറോ-സം മാട്രിക്സ് ഗെയിം
സാമ്പത്തികവും ഗണിതശാസ്ത്രപരവുമായ മോഡലിംഗ് ഇനിപ്പറയുന്ന വ്യവസ്ഥകളിൽ നടപ്പിലാക്കുന്നു:
ഉറപ്പ്;
അനിശ്ചിതത്വങ്ങൾ.
മോഡലിംഗ് ഉറപ്പുള്ള സാഹചര്യങ്ങളിൽ ഇതിന് ആവശ്യമായ എല്ലാ പ്രാരംഭ റെഗുലേറ്ററി ഡാറ്റയുടെയും ലഭ്യത അനുമാനിക്കുന്നു (മാട്രിക്സ് മോഡലിംഗ്, നെറ്റ്വർക്ക് പ്ലാനിംഗ്, മാനേജുമെന്റ്).
മോഡലിംഗ് അപകടത്തിലാണ് ചില പ്രാരംഭ ഡാറ്റയുടെ മൂല്യങ്ങൾ ക്രമരഹിതവും ഈ ക്രമരഹിതമായ വേരിയബിളുകളുടെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷന്റെ നിയമങ്ങൾ അറിയപ്പെടുമ്പോൾ (റിഗ്രഷൻ വിശകലനം, ക്യൂയിംഗ് സിദ്ധാന്തം) സ്ഥാപിതമായ അനിശ്ചിതത്വത്തിലാണ് നടത്തുന്നത്.
മോഡലിംഗ് അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ യോജിക്കുന്നു പൂർണ്ണമായ അഭാവംഇതിന് ആവശ്യമായ ചില ഡാറ്റ (ഗെയിം തിയറി).
ഒപ്റ്റിമൽ തീരുമാനങ്ങൾ എടുക്കുന്നതിനുള്ള ഗണിതശാസ്ത്ര മാതൃകകൾ സംഘർഷ സാഹചര്യങ്ങൾഅനിശ്ചിതത്വത്തിന്റെ സാഹചര്യത്തിലാണ് നിർമ്മിച്ചിരിക്കുന്നത്.
ഗെയിം സിദ്ധാന്തം ഇനിപ്പറയുന്ന അടിസ്ഥാന ആശയങ്ങളുമായി പ്രവർത്തിക്കുന്നു:
തന്ത്രം;
വിൻ ഫംഗ്ഷൻ.
യാത്രയിലാണ് ഗെയിമിന്റെ നിയമങ്ങൾക്കായി നൽകിയിരിക്കുന്ന ഒരു പ്രവർത്തനത്തിന്റെ കളിക്കാരന്റെ തിരഞ്ഞെടുപ്പും നടപ്പിലാക്കലും ഞങ്ങൾ വിളിക്കും.
തന്ത്രം - നിലവിലെ സാഹചര്യത്തെ ആശ്രയിച്ച് ഓരോ നീക്കത്തിലും ഒരു പ്രവർത്തന ഓപ്ഷൻ തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാങ്കേതികവിദ്യയാണിത്.
വിൻ ഫംഗ്ഷൻ തോൽക്കുന്ന കളിക്കാരനിൽ നിന്ന് വിജയിക്കുന്നയാൾക്കുള്ള പേയ്മെന്റ് തുക നിർണ്ണയിക്കാൻ സഹായിക്കുന്നു.
ഒരു മാട്രിക്സ് ഗെയിമിൽ, പേഓഫ് ഫംഗ്ഷൻ ഇതായി പ്രതിനിധീകരിക്കുന്നു പേയ്മെന്റ് മാട്രിക്സ് :
നീക്കം തിരഞ്ഞെടുത്ത പ്ലെയർ II-ൽ നിന്ന് നീക്കം തിരഞ്ഞെടുത്ത കളിക്കാരൻ I-ക്കുള്ള പേയ്മെന്റ് തുക എവിടെയാണ്.
അത്തരമൊരു ജോടിയാക്കിയ ഗെയിമിൽ, ഓരോ സാഹചര്യത്തിലും രണ്ട് കളിക്കാരുടെയും പേഓഫ് ഫംഗ്ഷനുകളുടെ മൂല്യങ്ങൾ വലുപ്പത്തിൽ തുല്യവും ചിഹ്നത്തിൽ വിപരീതവുമാണ്, അതായത്. ഈ ഗെയിമിനെ വിളിക്കുന്നു പൂജ്യം തുക .
"മാട്രിക്സ് ഗെയിം കളിക്കുന്ന" പ്രക്രിയ ഇനിപ്പറയുന്ന രീതിയിൽ പ്രതിനിധീകരിക്കുന്നു:
പേയ്മെന്റ് മാട്രിക്സ് സജ്ജീകരിച്ചിരിക്കുന്നു;
പ്ലെയർ I, പ്ലെയർ II പരിഗണിക്കാതെ, ഈ മാട്രിക്സിന്റെ വരികളിലൊന്ന് തിരഞ്ഞെടുക്കുന്നു, ഉദാഹരണത്തിന്, -th;
പ്ലെയർ I, പരിഗണിക്കാതെ തന്നെ പ്ലെയർ II, ഈ മാട്രിക്സിന്റെ നിരകളിൽ ഒന്ന് തിരഞ്ഞെടുക്കുന്നു, ഉദാഹരണത്തിന്, - th;
പ്ലെയർ II-ൽ നിന്ന് എനിക്ക് എത്ര പ്ലേയർ ലഭിക്കുമെന്ന് മാട്രിക്സ് ഘടകം നിർണ്ണയിക്കുന്നു. തീർച്ചയായും, എങ്കിൽ, പിന്നെ ഞങ്ങൾ സംസാരിക്കുന്നത്ഐ കളിക്കാരന്റെ യഥാർത്ഥ നഷ്ടത്തെക്കുറിച്ച്.
പേഓഫ് മാട്രിക്സുള്ള ഒരു വിരുദ്ധ ജോടിയാക്കിയ ഗെയിമിനെ ഞങ്ങൾ ഗെയിം എന്ന് വിളിക്കും.
ഉദാഹരണം
നമുക്ക് കളി പരിഗണിക്കാം.
പേയ്മെന്റ് മാട്രിക്സ് സജ്ജീകരിച്ചിരിക്കുന്നു:
.
പ്ലെയർ II-ൽ നിന്ന് സ്വതന്ത്രമായി, ഈ മാട്രിക്സിന്റെ 3-ാം വരി തിരഞ്ഞെടുക്കാൻ പ്ലെയർ I അനുവദിക്കുക, കൂടാതെ പ്ലെയർ I-ൽ നിന്ന് സ്വതന്ത്രമായി പ്ലെയർ II, ഈ മാട്രിക്സിന്റെ 2-ാം നിര തിരഞ്ഞെടുക്കട്ടെ:
അപ്പോൾ പ്ലെയർ I-ൽ നിന്ന് 9 യൂണിറ്റുകൾ പ്ലേയർ ഐക്ക് ലഭിക്കും.
5.2 ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒപ്റ്റിമൽ പ്യുവർ സ്ട്രാറ്റജി
ഒപ്റ്റിമൽ തന്ത്രം പ്ലെയർ I യുടെ ഒരു തന്ത്രം എന്ന് വിളിക്കുന്നു, അതിൽ പ്ലെയർ II ന്റെ ഏതെങ്കിലും തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിനുള്ള തന്റെ വിജയങ്ങൾ കുറയ്ക്കില്ല, കൂടാതെ കളിക്കാരൻ I യുടെ ഏതെങ്കിലും തന്ത്രത്തിന്റെ തിരഞ്ഞെടുപ്പിന് നഷ്ടം വർദ്ധിപ്പിക്കാത്ത പ്ലെയർ II ന്റെ അത്തരമൊരു തന്ത്രം.
ഒരു നീക്കമായി പേഓഫ് മാട്രിക്സിന്റെ വരി തിരഞ്ഞെടുക്കുന്നതിലൂടെ, പ്ലെയർ II ഈ മൂല്യം കുറയ്ക്കാൻ ശ്രമിക്കുമ്പോൾ, ഏറ്റവും മോശം സാഹചര്യത്തിൽ മൂല്യത്തിൽ കുറയാതെ വിജയിക്കുമെന്ന് പ്ലെയർ I ഉറപ്പാക്കുന്നു. അതിനാൽ, കളിക്കാരൻ അവന് നൽകുന്ന വരി ഞാൻ തിരഞ്ഞെടുക്കും പരമാവധി വിജയം:
.
പ്ലെയർ II സമാനമായി വാദിക്കുന്നു, തീർച്ചയായും കുറഞ്ഞ നഷ്ടം ഉറപ്പാക്കാൻ കഴിയും:
.
അസമത്വം എല്ലായ്പ്പോഴും ശരിയാണ്:
അളവ് വിളിക്കുന്നു കുറഞ്ഞ വിലഗെയിമുകൾ .
അളവ് വിളിക്കുന്നു ഗെയിമിന്റെ ഉയർന്ന വില .
ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ വിളിക്കുന്നു ശുദ്ധമായ , അവർക്ക് തുല്യത നിലനിൽക്കുകയാണെങ്കിൽ:
,
.
അളവ് വിളിക്കുന്നു കളിയുടെ ശുദ്ധമായ വിലയിൽ , എങ്കിൽ.
ഒപ്റ്റിമൽ ശുദ്ധമായ തന്ത്രങ്ങൾ രൂപം സാഡിൽ പോയിന്റ് പേയ്മെന്റ് മാട്രിക്സ്.
ഒരു സാഡിൽ പോയിന്റിനായി ഇനിപ്പറയുന്ന വ്യവസ്ഥകൾ പാലിക്കുന്നു:
അതായത്, മൂലകം വരിയിലെ ഏറ്റവും ചെറുതും നിരയിലെ ഏറ്റവും വലുതുമാണ്.
അങ്ങനെ, പേഓഫ് മാട്രിക്സ് ഉണ്ടെങ്കിൽ സാഡിൽ പോയിന്റ് , അപ്പോൾ നിങ്ങൾക്ക് കണ്ടെത്താം ഒപ്റ്റിമൽ ശുദ്ധമായ തന്ത്രങ്ങൾ കളിക്കാർ.
പ്ലെയർ I ന്റെ ശുദ്ധമായ തന്ത്രത്തെ ക്രമീകരിച്ച സംഖ്യകളുടെ (വെക്റ്റർ) ഒരു കൂട്ടം പ്രതിനിധീകരിക്കാം, അതിൽ --ാം സ്ഥാനത്തുള്ള സംഖ്യ ഒഴികെ എല്ലാ സംഖ്യകളും പൂജ്യത്തിന് തുല്യമാണ്, അത് ഒന്നിന് തുല്യമാണ്.
പ്ലെയർ II-ന്റെ ശുദ്ധമായ തന്ത്രത്തെ ക്രമീകരിച്ച സംഖ്യകളുടെ (ഒരു വെക്റ്റർ) പ്രതിനിധീകരിക്കാൻ കഴിയും, അതിൽ എല്ലാ സംഖ്യകളും പൂജ്യത്തിന് തുല്യമാണ്, --ാം സ്ഥാനത്തുള്ള സംഖ്യ ഒഴികെ, ഒന്നിന് തുല്യമാണ്.
ഉദാഹരണം
.
പേഓഫ് മാട്രിക്സിന്റെ ഏതെങ്കിലും വരി ഒരു നീക്കമായി തിരഞ്ഞെടുക്കുന്നതിലൂടെ, ഏറ്റവും മോശം സാഹചര്യത്തിൽ വിജയങ്ങൾ അടയാളപ്പെടുത്തിയിരിക്കുന്ന കോളത്തിലെ മൂല്യത്തേക്കാൾ കുറവല്ലെന്ന് പ്ലെയർ ഞാൻ ഉറപ്പാക്കുന്നു:
അതിനാൽ, പ്ലെയർ ഞാൻ പേയ്മെന്റ് മാട്രിക്സിന്റെ രണ്ടാം നിര തിരഞ്ഞെടുക്കും, ഇത് കളിക്കാരൻ II ന്റെ നീക്കം പരിഗണിക്കാതെ തന്നെ അദ്ദേഹത്തിന് പരമാവധി വിജയങ്ങൾ നൽകുന്നു, ഈ മൂല്യം കുറയ്ക്കാൻ ശ്രമിക്കുന്നു:
പ്ലെയർ II സമാനമായ കാരണങ്ങളാൽ തന്റെ നീക്കമായി ഒന്നാം നിര തിരഞ്ഞെടുക്കുന്നു:
അങ്ങനെ, പേയ്മെന്റ് മാട്രിക്സിന്റെ ഒരു സാഡിൽ പോയിന്റ് ഉണ്ട്:
പ്ലെയർ I, പ്ലെയർ II എന്നിവയ്ക്കായുള്ള ഒപ്റ്റിമൽ പ്യുവർ സ്ട്രാറ്റജിക്ക് അനുസൃതമായി, അതിൽ പ്ലെയർ II ന്റെ തന്ത്രത്തിലെ എന്തെങ്കിലും മാറ്റത്തിന് കളിക്കാരൻ അവന്റെ വിജയങ്ങൾ കുറയ്ക്കില്ല, കളിക്കാരൻ II തന്ത്രത്തിലെ ഏതെങ്കിലും മാറ്റത്തിന് അവന്റെ നഷ്ടം വർദ്ധിപ്പിക്കില്ല.
5.3 ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം
പേഓഫ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഏതൊരു കളിക്കാരനും ഒരു ശുദ്ധ തന്ത്രം ഉപയോഗിക്കുന്നത് യുക്തിരഹിതമാണ്. ഇത് ഉപയോഗിക്കുന്നത് കൂടുതൽ ലാഭകരമാണ് "സാധ്യത മിശ്രിതങ്ങൾ" ശുദ്ധമായ തന്ത്രങ്ങൾ. അപ്പോൾ സമ്മിശ്ര തന്ത്രങ്ങൾ ഒപ്റ്റിമൽ ആയി തിരിച്ചറിയപ്പെടുന്നു.
സമ്മിശ്ര തന്ത്രം ഈ കളിക്കാരന്റെ ഒരു നീക്കം തിരഞ്ഞെടുക്കുന്നതിൽ ഉൾപ്പെടുന്ന ഒരു റാൻഡം ഇവന്റിന്റെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷനാണ് ഒരു കളിക്കാരന്റെ സവിശേഷത.
പ്ലെയർ I-ന്റെ സമ്മിശ്ര തന്ത്രം അത്തരത്തിലുള്ള ഒരു ക്രമപ്പെടുത്തിയ സംഖ്യകളാണ് (വെക്റ്റർ) അത് രണ്ട് വ്യവസ്ഥകൾ പാലിക്കുന്നു:
1) എന്നതിന്, അതായത് പേയ്മെന്റ് മാട്രിക്സിന്റെ ഓരോ വരിയും തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത നെഗറ്റീവ് അല്ല;
2) , അതായത്, പേയ്മെന്റ് മാട്രിക്സിന്റെ ഓരോ വരികളുടെയും തിരഞ്ഞെടുപ്പ് മൊത്തത്തിൽ പ്രതിനിധീകരിക്കുന്നു മുഴുവൻ ഗ്രൂപ്പ്സംഭവങ്ങൾ.
പ്ലെയർ II-ന്റെ സമ്മിശ്ര തന്ത്രം ക്രമപ്പെടുത്തിയ സംഖ്യകളുടെ കൂട്ടമായിരിക്കും (വെക്റ്റർ) വ്യവസ്ഥകൾ തൃപ്തിപ്പെടുത്തുന്നു:
അടക്കേണ്ട തുക ഒരു സമ്മിശ്ര തന്ത്രം തിരഞ്ഞെടുത്ത I കളിക്കാരന്
ഒരു സമ്മിശ്ര തന്ത്രം തിരഞ്ഞെടുത്ത കളിക്കാരൻ II-ൽ നിന്ന്
,
ശരാശരി മൂല്യത്തെ പ്രതിനിധീകരിക്കുന്നു
.
ഒപ്റ്റിമൽ സമ്മിശ്ര തന്ത്രങ്ങൾ എന്ന് വിളിക്കുന്നു
ഒപ്പം ,
ഏതെങ്കിലും ഏകപക്ഷീയമായ സമ്മിശ്ര തന്ത്രങ്ങൾക്കായി ഇനിപ്പറയുന്ന വ്യവസ്ഥ തൃപ്തികരമാണെങ്കിൽ:
അതായത്, ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി ഉപയോഗിച്ച്, പ്ലെയർ I യുടെ നേട്ടമാണ് ഏറ്റവും വലുത്, കളിക്കാരൻ II ന്റെ നഷ്ടം ഏറ്റവും കുറവാണ്.
പേയ്മെന്റ് മാട്രിക്സിൽ സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, പിന്നെ
,
അതായത് ഒരു നല്ല വ്യത്യാസമുണ്ട് ( അനുവദിക്കാത്ത വ്യത്യാസം )
- ³ 0,
ഈ വ്യത്യാസത്തിന്റെ വലിയൊരു പങ്ക് ആത്മവിശ്വാസത്തോടെ അവർക്ക് അനുകൂലമായി ലഭിക്കുന്നതിന് കളിക്കാർ കൂടുതൽ അവസരങ്ങൾ തേടേണ്ടതുണ്ട്.
ഉദാഹരണം
പേഓഫ് മാട്രിക്സ് നിർവചിച്ച ഗെയിം പരിഗണിക്കുക:
.
ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടോ എന്ന് നമുക്ക് നിർണ്ണയിക്കാം:
, .
പേയ്മെന്റ് മാട്രിക്സിൽ സാഡിൽ പോയിന്റ് ഇല്ലെന്നും വിതരണം ചെയ്യാത്ത വ്യത്യാസം ഇതിന് തുല്യമാണെന്നും ഇത് മാറുന്നു:
.
5.4 ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്തുന്നു
2x2 ഗെയിമുകൾക്കായി
രണ്ട് വേരിയബിളുകളുടെ ഒരു ഫംഗ്ഷന്റെ ഒപ്റ്റിമൽ പോയിന്റുകൾ കണ്ടെത്തുന്നതിലൂടെയാണ് അളവുകളുടെ പേയ്മെന്റ് മാട്രിക്സിനായി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികൾ നിർണ്ണയിക്കുന്നത്.
പേയ്മെന്റ് മാട്രിക്സിന്റെ ആദ്യ വരി ഞാൻ തിരഞ്ഞെടുക്കുന്ന കളിക്കാരന്റെ സംഭാവ്യത അനുവദിക്കുക
തുല്യമാണ്. അപ്പോൾ രണ്ടാമത്തെ വരി തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത തുല്യമാണ്.
ആദ്യ കോളം തിരഞ്ഞെടുക്കുന്ന പ്ലെയർ II ന് തുല്യമായിരിക്കട്ടെ. അപ്പോൾ രണ്ടാമത്തെ നിര തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത തുല്യമാണ്.
പ്ലെയർ II-ന്റെ പ്ലെയർ I-ലേക്കുള്ള പേയ്മെന്റ് തുക ഇതിന് തുല്യമാണ്:
പ്ലെയർ I-ന്റെ നേട്ടത്തിന്റെയും കളിക്കാരൻ II-ന്റെ നഷ്ടത്തിന്റെയും അങ്ങേയറ്റത്തെ മൂല്യം ഇനിപ്പറയുന്ന വ്യവസ്ഥകളുമായി പൊരുത്തപ്പെടുന്നു:
;
.
അതിനാൽ, I, II കളിക്കാരുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ യഥാക്രമം തുല്യമാണ്:
5.5 ഗെയിമുകളുടെ ജ്യാമിതീയ പരിഹാരം 2×എൻ
പേയ്മെന്റ് മാട്രിക്സിന്റെ അളവ് വർധിക്കുന്നതിനാൽ, രണ്ട് വേരിയബിളുകളുടെ ഒരു ഫംഗ്ഷന്റെ ഒപ്റ്റിമൽ കണ്ടെത്തുന്നതിന് ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുടെ നിർണ്ണയം കുറയ്ക്കാൻ ഇനി സാധ്യമല്ല. എന്നിരുന്നാലും, കളിക്കാരിൽ ഒരാൾക്ക് രണ്ട് തന്ത്രങ്ങൾ മാത്രമേ ഉള്ളൂ എന്നതിനാൽ, ഒരു ജ്യാമിതീയ പരിഹാരം ഉപയോഗിക്കാം.
ഗെയിമിന് പരിഹാരം കണ്ടെത്തുന്നതിനുള്ള പ്രധാന ഘട്ടങ്ങൾ ഇനിപ്പറയുന്നവയാണ്.
നമുക്ക് വിമാനത്തിൽ ഒരു കോർഡിനേറ്റ് സിസ്റ്റം അവതരിപ്പിക്കാം. നമുക്ക് അച്ചുതണ്ടിൽ സെഗ്മെന്റ് പ്ലോട്ട് ചെയ്യാം. ഈ സെഗ്മെന്റിന്റെ ഇടത്, വലത് അറ്റങ്ങളിൽ നിന്ന് ഞങ്ങൾ ലംബമായി വരയ്ക്കുന്നു.
യൂണിറ്റ് സെഗ്മെന്റിന്റെ ഇടത്, വലത് അറ്റങ്ങൾ രണ്ട് സ്ട്രാറ്റജികളുമായി പൊരുത്തപ്പെടുന്നു, കൂടാതെ I-ന് ലഭ്യമാണ്. വരച്ച ലംബങ്ങളിൽ ഈ കളിക്കാരന്റെ വിജയങ്ങൾ ഞങ്ങൾ പ്ലോട്ട് ചെയ്യും. ഉദാഹരണത്തിന്, പേയ്മെന്റ് മാട്രിക്സിന്
ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ കളിക്കാരൻ I യുടെ അത്തരം പ്രതിഫലങ്ങൾ ആയിരിക്കും കൂടാതെ, ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ അവയും ആയിരിക്കും.
പ്ലെയർ II-ന്റെ തന്ത്രങ്ങൾക്ക് അനുസൃതമായി, പ്ലെയർ I-ന്റെ വിജയിക്കുന്ന പോയിന്റുകൾ നേർരേഖ സെഗ്മെന്റുകൾ വഴി നമുക്ക് ബന്ധിപ്പിക്കാം. രൂപപ്പെട്ട തകർന്ന ലൈൻ, താഴെ നിന്ന് ഗ്രാഫ് പരിമിതപ്പെടുത്തുന്നു, പ്ലെയർ I ന്റെ പ്രതിഫലത്തിന്റെ താഴ്ന്ന പരിധി നിർണ്ണയിക്കുന്നു.
പ്ലെയർ I യുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം കണ്ടെത്തുന്നു
,
ഇത് പരമാവധി ഓർഡിനേറ്റ് ഉപയോഗിച്ച് പ്ലെയർ ഐയുടെ പ്രതിഫലത്തിന്റെ താഴത്തെ പരിധിയിലുള്ള പോയിന്റുമായി യോജിക്കുന്നു.
പരിഗണനയിലിരിക്കുന്ന ഉദാഹരണത്തിൽ, രണ്ട് തന്ത്രങ്ങൾ മാത്രം ഉപയോഗിച്ച്, പ്ലെയർ I, പ്ലെയർ II ന്റെ പേഓഫിന്റെ താഴത്തെ അതിർത്തിയിൽ കണ്ടെത്തിയ പോയിന്റിൽ വിഭജിക്കുന്ന നേർരേഖകൾക്ക് അനുസൃതമായി, കളിക്കാരൻ I വലുതാകുന്നത് തടയാൻ കഴിയും എന്ന വസ്തുത നമുക്ക് ശ്രദ്ധിക്കാം. പേ ഓഫ്.
അങ്ങനെ, ഗെയിം ഒരു ഗെയിമായി ചുരുക്കി, പരിഗണനയിലുള്ള ഉദാഹരണത്തിൽ പ്ലെയർ II-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം ഇതായിരിക്കും
,
ഗെയിമിലേതിന് തുല്യമായ സംഭാവ്യത ഇവിടെ:
5.6 ഗെയിം സോൾവിംഗ്എം× എൻ
ഒരു മാട്രിക്സ് ഗെയിമിന് ശുദ്ധമായ തന്ത്രങ്ങളിൽ പരിഹാരമില്ലെങ്കിൽ (അതായത്, സാഡിൽ പോയിന്റ് ഇല്ല) കൂടാതെ, പേഓഫ് മാട്രിക്സിന്റെ വലിയ മാനം കാരണം, ഗ്രാഫിക്കായി പരിഹരിക്കാൻ കഴിയുന്നില്ലെങ്കിൽ, ഒരു പരിഹാരം നേടുന്നതിന്, ഉപയോഗിക്കുക ലീനിയർ പ്രോഗ്രാമിംഗ് രീതി .
അളവിന്റെ ഒരു പേയ്മെന്റ് മാട്രിക്സ് നൽകട്ടെ:
.
സാധ്യതകൾ കണ്ടെത്തേണ്ടതുണ്ട് , ഏത് കളിക്കാരനോടൊപ്പമാണ് ഞാൻ അവന്റെ നീക്കങ്ങൾ തിരഞ്ഞെടുക്കേണ്ടത്, അതുവഴി ഈ സമ്മിശ്ര തന്ത്രം പ്ലെയർ II ന്റെ നീക്കങ്ങൾ തിരഞ്ഞെടുക്കുന്നത് പരിഗണിക്കാതെ തന്നെ മൂല്യത്തിൽ കുറയാത്ത വിജയം ഉറപ്പ് നൽകുന്നു.
പ്ലെയർ II തിരഞ്ഞെടുത്ത ഓരോ നീക്കത്തിനും, കളിക്കാരൻ I-ന്റെ പ്രതിഫലം നിർണ്ണയിക്കുന്നത് ഡിപൻഡൻസികളാണ്:
അസമത്വങ്ങളുടെ ഇരുവശങ്ങളെയും നമുക്ക് വിഭജിച്ച് പുതിയ നൊട്ടേഷനുകൾ അവതരിപ്പിക്കാം:
സമത്വം
ഫോം എടുക്കും:
പ്ലെയർ I പേഓഫ് പരമാവധിയാക്കാൻ ശ്രമിക്കുന്നതിനാൽ, വിപരീതം ചെറുതാക്കണം. അപ്പോൾ കളിക്കാരനുള്ള ലീനിയർ പ്രോഗ്രാമിംഗ് പ്രശ്നം ഞാൻ ഫോം എടുക്കും:
നിയന്ത്രണങ്ങൾക്ക് കീഴിൽ
പ്ലെയർ II-നുള്ള പ്രശ്നം ഇരട്ട പോലെ തന്നെ നിർമ്മിച്ചിരിക്കുന്നു:
നിയന്ത്രണങ്ങൾക്ക് കീഴിൽ
സിംപ്ലക്സ് രീതി ഉപയോഗിച്ച് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നു, ഞങ്ങൾക്ക് ലഭിക്കുന്നു:
,
5.7 മാട്രിക്സ് ഗെയിമുകൾ പരിഹരിക്കുന്നതിന്റെ സവിശേഷതകൾ
ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിക്കുന്നതിന് മുമ്പ്, രണ്ട് വ്യവസ്ഥകൾ പരിശോധിക്കണം:
പേയ്മെന്റ് മാട്രിക്സ് ലളിതമാക്കാൻ കഴിയുമോ;
പേയ്മെന്റ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടോ?
പേയ്മെന്റ് മാട്രിക്സ് ലളിതമാക്കുന്നതിനുള്ള സാധ്യത പരിഗണിക്കുക:
ഞാൻ നേടാൻ ശ്രമിക്കുന്ന കളിക്കാരൻ കാരണം ഏറ്റവും വലിയ വിജയം, തുടർന്ന് പേയ്മെന്റ് മാട്രിക്സിൽ നിന്ന് ആം വരി ഇല്ലാതാക്കാൻ കഴിയും, കാരണം ഇനിപ്പറയുന്ന ബന്ധം മറ്റേതെങ്കിലും വരിയിൽ തൃപ്തികരമാണെങ്കിൽ അവൻ ഒരിക്കലും ഈ നീക്കം ഉപയോഗിക്കില്ല:
അതുപോലെ, ഏറ്റവും ചെറിയ നഷ്ടത്തിനായി പരിശ്രമിക്കുമ്പോൾ, പ്ലെയർ II ഒരിക്കലും പേഓഫ് മാട്രിക്സിലെ -th കോളം ഒരു നീക്കമായി തിരഞ്ഞെടുക്കില്ല, കൂടാതെ ഇനിപ്പറയുന്ന ബന്ധം മറ്റേതെങ്കിലും -th കോളത്തിൽ തൃപ്തിപ്പെട്ടാൽ ഈ കോളം മറികടക്കാൻ കഴിയും:
മിക്കതും ലളിതമായ പരിഹാരംഗെയിം ഒരു സാഡിൽ പോയിന്റിന്റെ ലളിതമായ പേയ്മെന്റ് മാട്രിക്സിലെ സാന്നിധ്യമാണ്, അത് ഇനിപ്പറയുന്ന വ്യവസ്ഥകൾ പാലിക്കുന്നു (നിർവചനപ്രകാരം):
ഉദാഹരണം
പേയ്മെന്റ് മാട്രിക്സ് നൽകിയിരിക്കുന്നു:
.
പേയ്മെന്റ് മാട്രിക്സിന്റെ ലളിതവൽക്കരണം:
ഒരു സാഡിൽ പോയിന്റിന്റെ സാന്നിധ്യം:
5.8 പ്രകൃതിയുമായി കളിക്കുന്നു
ഗെയിം തിയറി പ്രശ്നങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി സിദ്ധാന്തത്തിന്റെ പ്രശ്നങ്ങൾ സ്ഥിതിവിവരക്കണക്ക് പരിഹാരങ്ങൾ ഒരു അനിശ്ചിത സാഹചര്യത്തിന് ഒരു വൈരുദ്ധ്യ വൈരുദ്ധ്യ അർത്ഥമില്ല, അത് വസ്തുനിഷ്ഠമായ യാഥാർത്ഥ്യത്തെ ആശ്രയിച്ചിരിക്കുന്നു, അതിനെ സാധാരണയായി വിളിക്കുന്നു "പ്രകൃതി" .
പ്രകൃതിയുമായുള്ള മാട്രിക്സ് ഗെയിമുകളിൽ, എടുക്കുന്ന തീരുമാനങ്ങളുടെ ഫലപ്രാപ്തിയെ സ്വാധീനിക്കുന്ന അനിശ്ചിതത്വ ഘടകങ്ങളുടെ ഒരു കൂട്ടമാണ് പ്ലെയർ II.
സ്വാഭാവിക മാട്രിക്സ് ഗെയിമുകൾ സാധാരണ മാട്രിക്സ് ഗെയിമുകളിൽ നിന്ന് വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, പ്ലെയർ I എന്നതിനായി ഒപ്റ്റിമൽ തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ, കളിക്കാരൻ II തന്റെ നഷ്ടം കുറയ്ക്കാൻ ശ്രമിക്കുമെന്ന വസ്തുതയെ ഇനി ആശ്രയിക്കാൻ കഴിയില്ല. അതിനാൽ, പേയ്മെന്റ് മാട്രിക്സിനൊപ്പം ഞങ്ങൾ അവതരിപ്പിക്കുന്നു റിസ്ക് മാട്രിക്സ് :
വ്യവസ്ഥകളിൽ ഒരു നീക്കം ഉപയോഗിക്കുമ്പോൾ പ്ലെയർ I ന്റെ അപകടസാധ്യതയുടെ അളവ് വ്യത്യാസത്തിന് തുല്യമാണ് ഈ അവസ്ഥ സ്ഥാപിക്കപ്പെടുമെന്ന് കളിക്കാരന് അറിയാമെങ്കിൽ എനിക്ക് ലഭിക്കുന്ന പ്രതിഫലത്തിന് ഇടയിൽ, അതായത്. , കൂടാതെ അവൻ സ്വീകരിക്കുന്ന വിജയങ്ങൾ, ഒരു നീക്കം തിരഞ്ഞെടുക്കുമ്പോൾ അറിയാതെ, വ്യവസ്ഥ സ്ഥാപിക്കപ്പെടും.
അങ്ങനെ, പേയ്മെന്റ് മാട്രിക്സ് അദ്വിതീയമായി ഒരു റിസ്ക് മെട്രിക്സായി രൂപാന്തരപ്പെടുന്നു, പക്ഷേ വിപരീത പരിവർത്തനം അവ്യക്തമാണ്.
ഉദാഹരണം
വിജയിക്കുന്ന മാട്രിക്സ്:
.
റിസ്ക് മാട്രിക്സ്:
സാധ്യമാണ് രണ്ട് പ്രശ്ന പ്രസ്താവനകൾ ഒരു പരിഹാരം തിരഞ്ഞെടുക്കുന്നതിനെക്കുറിച്ച് പ്രകൃതിയുമായുള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ :
പരമാവധി വിജയങ്ങൾ;
അപകടസാധ്യത കുറയ്ക്കുന്നു.
തീരുമാനമെടുക്കൽ പ്രശ്നം രണ്ട് വ്യവസ്ഥകളിൽ ഒന്നിന് വേണ്ടി ഉയർത്താം:
- അപകടത്തിലാണ് , പ്രകൃതിയുടെ തന്ത്രങ്ങളുടെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ ഫംഗ്ഷൻ അറിയുമ്പോൾ, ഉദാഹരണത്തിന്, പ്രതീക്ഷിക്കുന്ന ഓരോ നിർദ്ദിഷ്ട സാമ്പത്തിക സാഹചര്യങ്ങളുടെയും സംഭവത്തിന്റെ ക്രമരഹിതമായ വേരിയബിൾ;
- അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ , അത്തരമൊരു പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ ഫംഗ്ഷൻ അജ്ഞാതമാകുമ്പോൾ.
5.9 സ്റ്റാറ്റിസ്റ്റിക്കൽ തീരുമാന സിദ്ധാന്തത്തിലെ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നു
അപകടത്തിലാണ്
റിസ്ക് സാഹചര്യങ്ങളിൽ തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ, കളിക്കാരൻ എനിക്ക് സാധ്യതകൾ അറിയാം പ്രകൃതിയുടെ അവസ്ഥകളുടെ തുടക്കം.
അപ്പോൾ കളിക്കാരൻ I അതിനുള്ള തന്ത്രം തിരഞ്ഞെടുക്കുന്നതാണ് ഉചിതം ലൈൻ എടുത്ത ശരാശരി വിജയ മൂല്യം പരമാവധി ആണ് :
.
ഒരു റിസ്ക് മാട്രിക്സ് ഉപയോഗിച്ച് ഈ പ്രശ്നം പരിഹരിക്കുമ്പോൾ, സമാനമായ പരിഹാരം നമുക്ക് ലഭിക്കും കുറഞ്ഞ ശരാശരി അപകടസാധ്യത :
.
5.10 സ്റ്റാറ്റിസ്റ്റിക്കൽ തീരുമാന സിദ്ധാന്തത്തിലെ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നു
അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ
അനിശ്ചിതത്വത്തിൽ തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ, നിങ്ങൾക്ക് ഇനിപ്പറയുന്നവ ഉപയോഗിക്കാം മാനദണ്ഡം :
പരമാവധി വാൾഡ് മാനദണ്ഡം;
മാനദണ്ഡം കുറഞ്ഞ അപകടസാധ്യതക്രൂരൻ;
അശുഭാപ്തിവിശ്വാസത്തിന്റെ ഹർവിറ്റ്സിന്റെ മാനദണ്ഡം - ശുഭാപ്തിവിശ്വാസം;
അപര്യാപ്തമായ കാരണത്തിന്റെ ലാപ്ലേസിന്റെ തത്വം.
നമുക്ക് പരിഗണിക്കാം മാക്സിമിൻ വാൾഡ് ടെസ്റ്റ് .
പ്രകൃതിയുമായുള്ള ഗെയിം ന്യായമായ ആക്രമണാത്മക എതിരാളിയെ പോലെയാണ് കളിക്കുന്നത്, അതായത്, പേയ്മെന്റ് മാട്രിക്സിനായി അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസത്തിന്റെ സ്ഥാനത്ത് നിന്ന് ഒരു പുനർ ഇൻഷുറൻസ് സമീപനം സ്വീകരിക്കുന്നു:
.
നമുക്ക് പരിഗണിക്കാം സാവേജിന്റെ ഏറ്റവും കുറഞ്ഞ അപകടസാധ്യത മാനദണ്ഡം .
റിസ്ക് മാട്രിക്സിനായുള്ള അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസത്തിന്റെ സ്ഥാനത്ത് നിന്ന് മുമ്പത്തേതിന് സമാനമായ ഒരു സമീപനം:
.
നമുക്ക് പരിഗണിക്കാം അശുഭാപ്തിവിശ്വാസത്തിന്റെ ഹർവിറ്റ്സ് മാനദണ്ഡം - ശുഭാപ്തിവിശ്വാസം .
അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസം അല്ലെങ്കിൽ അങ്ങേയറ്റത്തെ ശുഭാപ്തിവിശ്വാസം എന്നിവയാൽ നയിക്കപ്പെടാതിരിക്കാനുള്ള അവസരം വാഗ്ദാനം ചെയ്യുന്നു:
അശുഭാപ്തിവിശ്വാസത്തിന്റെ അളവ് എവിടെയാണ്;
at - അങ്ങേയറ്റത്തെ ശുഭാപ്തിവിശ്വാസം,
at - അങ്ങേയറ്റത്തെ അശുഭാപ്തിവിശ്വാസം.
നമുക്ക് പരിഗണിക്കാം അപര്യാപ്തമായ കാരണത്തിന്റെ ലാപ്ലേസിന്റെ തത്വം .
പ്രകൃതിയുടെ എല്ലാ അവസ്ഥകളും ഒരുപോലെ സാധ്യമാണെന്ന് അനുമാനിക്കപ്പെടുന്നു:
,
.
അഞ്ചാമത്തെ വിഭാഗത്തെക്കുറിച്ചുള്ള നിഗമനങ്ങൾ
ഒരു മാട്രിക്സ് ഗെയിമിൽ, രണ്ട് കളിക്കാർ പങ്കെടുക്കുന്നു, തോൽക്കുന്ന കളിക്കാരനിൽ നിന്ന് വിജയിക്കുന്ന കളിക്കാരനിലേക്കുള്ള പേയ്മെന്റ് തുക നിർണ്ണയിക്കാൻ സഹായിക്കുന്ന പേയ്മെന്റ് ഫംഗ്ഷൻ ഒരു പേയ്മെന്റ് മാട്രിക്സിന്റെ രൂപത്തിൽ പ്രതിനിധീകരിക്കുന്നു. പ്ലെയർ I പേയ്മെന്റ് മാട്രിക്സിന്റെ വരികളിലൊന്ന് ഒരു നീക്കമായി തിരഞ്ഞെടുക്കുന്നുവെന്നും പ്ലെയർ II അതിന്റെ നിരകളിലൊന്ന് തിരഞ്ഞെടുക്കുമെന്നും സമ്മതിച്ചു. ഈ മാട്രിക്സിന്റെ തിരഞ്ഞെടുത്ത വരികളുടെയും നിരകളുടെയും കവലയിൽ, പ്ലെയർ II-ൽ നിന്ന് പ്ലേയർ I-ലേക്കുള്ള പേയ്മെന്റിന്റെ ഒരു സംഖ്യാ മൂല്യമുണ്ട് (ഈ മൂല്യം പോസിറ്റീവ് ആണെങ്കിൽ, പ്ലേയർ ഞാൻ ശരിക്കും വിജയിച്ചു, അത് നെഗറ്റീവ് ആണെങ്കിൽ, പ്ലേയർ II പ്രധാനമായും ജയിച്ചു).
പേഓഫ് മാട്രിക്സിൽ ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടെങ്കിൽ, കളിക്കാർക്ക് ഒപ്റ്റിമൽ ശുദ്ധമായ തന്ത്രങ്ങളുണ്ട്, അതായത്, വിജയിക്കാൻ, ഓരോരുത്തരും അവന്റെ ഒപ്റ്റിമൽ നീക്കം ആവർത്തിക്കണം. സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, വിജയിക്കാൻ, ഓരോരുത്തരും ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം ഉപയോഗിക്കണം, അതായത്, ചലനങ്ങളുടെ ഒരു മിശ്രിതം ഉപയോഗിക്കുക, അവ ഓരോന്നും ഒപ്റ്റിമൽ പ്രോബബിലിറ്റി ഉപയോഗിച്ച് നിർമ്മിക്കണം.
അറിയപ്പെടുന്ന ഫോർമുലകൾ ഉപയോഗിച്ച് ഒപ്റ്റിമൽ പ്രോബബിലിറ്റികൾ കണക്കാക്കിയാണ് 2x2 ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികൾ കണ്ടെത്തുന്നത്. ഉപയോഗിച്ച് ജ്യാമിതീയ പരിഹാരം 2×n ഗെയിമുകൾ, അവയിലെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ നിർണ്ണയിക്കുന്നത് 2×2 ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിലേക്ക് വരുന്നു. m×n ഗെയിമുകൾ പരിഹരിക്കുന്നതിന്, അവയിൽ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്താൻ ലീനിയർ പ്രോഗ്രാമിംഗ് രീതി ഉപയോഗിക്കുന്നു.
ചില പേയ്മെന്റ് മെട്രിക്സുകൾ ലളിതമാക്കാൻ കഴിയും, അതിന്റെ ഫലമായി വിട്ടുവീഴ്ചയില്ലാത്ത നീക്കങ്ങളുമായി ബന്ധപ്പെട്ട വരികളും നിരകളും നീക്കം ചെയ്തുകൊണ്ട് അവയുടെ അളവ് കുറയുന്നു.
വസ്തുനിഷ്ഠമായ യാഥാർത്ഥ്യത്തെ ആശ്രയിക്കുന്ന അനിശ്ചിതത്വ ഘടകങ്ങളുടെ ഒരു കൂട്ടമാണ് പ്ലെയർ II എങ്കിൽ, അത്തരം ഗെയിമിനെ പ്രകൃതിയുമായുള്ള ഗെയിം എന്ന് വിളിക്കുന്നു, കൂടാതെ സ്ഥിതിവിവരക്കണക്ക് തീരുമാനങ്ങളുടെ സിദ്ധാന്തത്തിൽ നിന്നുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ഉപയോഗിക്കുന്നു. തുടർന്ന്, പേയ്മെന്റ് മാട്രിക്സിനൊപ്പം, ഒരു റിസ്ക് മാട്രിക്സ് അവതരിപ്പിക്കുകയും പ്രകൃതിയുമായി ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒരു പരിഹാരം തിരഞ്ഞെടുക്കുന്നതിനുള്ള പ്രശ്നത്തിന്റെ രണ്ട് ഫോർമുലേഷനുകൾ സാധ്യമാണ്: നേട്ടം വർദ്ധിപ്പിക്കുകയും അപകടസാധ്യത കുറയ്ക്കുകയും ചെയ്യുക.
റിസ്ക് സാഹചര്യങ്ങളിൽ സ്ഥിതിവിവരക്കണക്ക് തീരുമാനങ്ങളുടെ സിദ്ധാന്തത്തിന്റെ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നത്, പേയ്മെന്റ് മാട്രിക്സിന്റെ ഒരു നിരയിൽ നിന്ന് എടുത്ത വിജയങ്ങളുടെ ശരാശരി മൂല്യം (ഗണിതശാസ്ത്ര പ്രതീക്ഷ) പരമാവധി, അല്ലെങ്കിൽ (ഏത്) തന്ത്രം തിരഞ്ഞെടുക്കുന്നത് കളിക്കാരന് ഉചിതമാണെന്ന് കാണിക്കുന്നു. അതുതന്നെയാണ്) റിസ്ക് മാട്രിക്സിന്റെ നിരയിൽ എടുത്ത അപകടസാധ്യതയുടെ ശരാശരി മൂല്യം (ഗണിതശാസ്ത്രപരമായ പ്രതീക്ഷ) വളരെ കുറവാണ്. അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ തീരുമാനങ്ങൾ എടുക്കുമ്പോൾ അവർ ഉപയോഗിക്കുന്നു ഇനിപ്പറയുന്ന മാനദണ്ഡങ്ങൾ: വാൾഡിന്റെ മാക്സിമിൻ മാനദണ്ഡം, സാവേജിന്റെ ഏറ്റവും കുറഞ്ഞ അപകടസാധ്യത മാനദണ്ഡം, ഹർവിറ്റ്സിന്റെ അശുഭാപ്തിവിശ്വാസം-ശുഭാപ്തിവിശ്വാസം മാനദണ്ഡം, ലാപ്ലേസിന്റെ അപര്യാപ്തമായ കാരണ തത്വം.
സ്വയം പരിശോധനാ ചോദ്യങ്ങൾ
ഗെയിം തിയറിയുടെ അടിസ്ഥാന ആശയങ്ങൾ എങ്ങനെയാണ് നിർവചിക്കപ്പെട്ടിരിക്കുന്നത്: നീക്കം, തന്ത്രം, പേഓഫ് പ്രവർത്തനം?
ഒരു മാട്രിക്സ് ഗെയിമിൽ പ്രതിനിധീകരിക്കുന്ന പേഓഫ് ഫംഗ്ഷൻ എന്താണ്?
എന്തുകൊണ്ടാണ് ഒരു മാട്രിക്സ് ഗെയിമിനെ സീറോ-സം എന്ന് വിളിക്കുന്നത്?
ഒരു മാട്രിക്സ് ഗെയിം കളിക്കുന്ന പ്രക്രിയ എങ്ങനെയാണ്?
m×n ഗെയിം എന്ന് ഏത് ഗെയിമിനെ വിളിക്കുന്നു?
ഏത് മാട്രിക്സ് ഗെയിം തന്ത്രത്തെ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു?
പ്യുവർ എന്ന് വിളിക്കപ്പെടുന്ന ഒരു മാട്രിക്സ് ഗെയിമിനുള്ള ഒപ്റ്റിമൽ തന്ത്രം എന്താണ്?
പേയ്മെന്റ് മാട്രിക്സിന്റെ സാഡിൽ പോയിന്റ് എന്താണ് അർത്ഥമാക്കുന്നത്?
മിക്സഡ് എന്ന് വിളിക്കപ്പെടുന്ന ഒരു മാട്രിക്സ് ഗെയിമിനുള്ള ഒപ്റ്റിമൽ തന്ത്രം എന്താണ്?
ഒരു കളിക്കാരന്റെ സമ്മിശ്ര തന്ത്രം എങ്ങനെയിരിക്കും?
സമ്മിശ്ര തന്ത്രങ്ങൾ തിരഞ്ഞെടുത്ത പ്ലെയർ II-ൽ നിന്ന് പ്ലേയർ I-ക്കുള്ള പേയ്മെന്റ് തുക എത്രയാണ്?
ഏത് സമ്മിശ്ര തന്ത്രങ്ങളെ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു?
വിതരണമില്ലാത്ത വ്യത്യാസം എന്താണ് അർത്ഥമാക്കുന്നത്?
2x2 ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്താൻ ഏത് രീതിയാണ് ഉപയോഗിക്കുന്നത്?
2×n ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികൾ എങ്ങനെയാണ് കണ്ടെത്തുന്നത്?
m×n ഗെയിമുകൾക്കായി ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ കണ്ടെത്താൻ ഏത് രീതിയാണ് ഉപയോഗിക്കുന്നത്?
മാട്രിക്സ് ഗെയിമുകൾ പരിഹരിക്കുന്നതിന്റെ സവിശേഷതകൾ എന്തൊക്കെയാണ്?
പേയ്മെന്റ് മാട്രിക്സിന്റെ ലളിതവൽക്കരണം എന്താണ് അർത്ഥമാക്കുന്നത്, ഏത് സാഹചര്യത്തിലാണ് ഇത് നടപ്പിലാക്കാൻ കഴിയുക?
പേഓഫ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഉള്ളപ്പോൾ അല്ലെങ്കിൽ ഇല്ലെങ്കിൽ ഏത് മാട്രിക്സ് ഗെയിം പരിഹരിക്കാൻ എളുപ്പമാണ്?
സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡിസിഷൻ തിയറി പ്രശ്നങ്ങളുമായി എന്ത് ഗെയിം തിയറി പ്രശ്നങ്ങൾ ബന്ധപ്പെട്ടിരിക്കുന്നു?
പേയ്മെന്റ് മാട്രിക്സ് എങ്ങനെയാണ് റിസ്ക് മെട്രിക്സിലേക്ക് വിവർത്തനം ചെയ്യുന്നത്?
പ്രകൃതിയുമായുള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ പരിഹാരങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള പ്രശ്നത്തിന്റെ ഏത് രണ്ട് ഫോർമുലേഷനുകൾ സാധ്യമാണ്?
പ്രകൃതിയുമായുള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ എന്ത് രണ്ട് വ്യവസ്ഥകൾക്കായി തീരുമാനമെടുക്കൽ പ്രശ്നങ്ങൾ ഉയർത്താം?
റിസ്ക് സാഹചര്യങ്ങളിൽ ഒരു സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡിസിഷൻ തിയറി പ്രശ്നം പരിഹരിക്കുമ്പോൾ ഞാൻ തിരഞ്ഞെടുക്കുന്ന തന്ത്രം ഏത് കളിക്കാരന് അനുയോജ്യമാണ്?
അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ സ്ഥിതിവിവരക്കണക്ക് തീരുമാന സിദ്ധാന്തത്തിന്റെ പ്രശ്നങ്ങൾ പരിഹരിക്കുമ്പോൾ എന്ത് തീരുമാനമെടുക്കൽ മാനദണ്ഡങ്ങൾ ഉപയോഗിക്കാനാകും?
പ്രശ്നം പരിഹരിക്കുന്നതിനുള്ള ഉദാഹരണങ്ങൾ
1. എന്റർപ്രൈസ് വിൽക്കുമ്പോൾ അതിന്റെ ലാഭത്തിന്റെ അളവ് പേയ്മെന്റ് മാട്രിക്സ് സൂചിപ്പിക്കുന്നു വത്യസ്ത ഇനങ്ങൾസ്ഥാപിത ഡിമാൻഡ് (വരി) അനുസരിച്ച് ഉൽപ്പന്നങ്ങൾ (നിരകൾ). വിവിധ തരത്തിലുള്ള ഉൽപ്പന്നങ്ങളുടെ ഉൽപാദനത്തിനായി എന്റർപ്രൈസസിന്റെ ഒപ്റ്റിമൽ തന്ത്രവും അവയുടെ വിൽപ്പനയിൽ നിന്നുള്ള പരമാവധി (ശരാശരി) വരുമാനവും നിർണ്ണയിക്കേണ്ടത് ആവശ്യമാണ്.
നമുക്ക് തന്നിരിക്കുന്ന മാട്രിക്സിനെ സൂചിപ്പിക്കുകയും വേരിയബിളുകൾ അവതരിപ്പിക്കുകയും ചെയ്യാം. ഞങ്ങൾ മാട്രിക്സ് (വെക്റ്റർ) ഉപയോഗിക്കും. പിന്നെ ഒപ്പം, അതായത്.
വിപരീത മാട്രിക്സ് കണക്കാക്കുന്നു:
മൂല്യങ്ങൾ കണ്ടെത്തി:
.
സാധ്യതകൾ കണക്കാക്കുന്നു:
ശരാശരി വിൽപ്പന വരുമാനം നിർണ്ണയിക്കപ്പെടുന്നു:
.
2. ഫാർമസിസ്റ്റ് കമ്പനി ഈ മേഖലയിലെ മരുന്നുകളുടെയും ബയോമെഡിക്കൽ ഉൽപ്പന്നങ്ങളുടെയും നിർമ്മാതാവാണ്. ചില മരുന്നുകൾക്ക് ഏറ്റവും ഉയർന്ന ഡിമാൻഡ് സംഭവിക്കുന്നത് ഈ സമയത്താണ് എന്ന് അറിയാം വേനൽക്കാല കാലയളവ്(ഹൃദയ മരുന്നുകൾ, വേദനസംഹാരികൾ), മറ്റുള്ളവർക്ക് - ശരത്കാലത്തും വസന്തകാലത്തും (ആന്റി-ഇൻഫെക്ഷ്യസ്, ആന്റിട്യൂസിവ്).
1 സ്റ്റാൻഡേർഡ് യൂണിറ്റിന്റെ വില യൂണിറ്റുകൾ സെപ്റ്റംബർ-ഒക്ടോബർ മാസങ്ങളിലെ ഉൽപ്പന്നങ്ങൾ ഇവയായിരുന്നു: ആദ്യ ഗ്രൂപ്പിന് (ഹൃദയ സംബന്ധമായ മരുന്നുകളും വേദനസംഹാരികളും) - 20 റൂബിൾസ്; രണ്ടാമത്തെ ഗ്രൂപ്പിന് (ആന്റി-ഇൻഫെക്ഷ്യസ്, ആന്റിട്യൂസിവ് മരുന്നുകൾ) - 15 റൂബിൾസ്.
നിരവധി നിരീക്ഷണങ്ങൾ അനുസരിച്ച് കഴിഞ്ഞ വർഷങ്ങൾചൂടുള്ള കാലാവസ്ഥയിൽ പരിഗണനയിലുള്ള രണ്ട് മാസത്തിനുള്ളിൽ 3050 പരമ്പരാഗത യൂണിറ്റുകൾ വിൽക്കാൻ കഴിയുമെന്ന് കമ്പനിയുടെ മാർക്കറ്റിംഗ് സേവനം സ്ഥാപിച്ചു. യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിന്റെയും 1100 പരമ്പരാഗത യൂണിറ്റുകളുടെയും ഉൽപ്പന്നങ്ങൾ. യൂണിറ്റുകൾ രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ ഉൽപ്പന്നങ്ങൾ; തണുത്ത കാലാവസ്ഥയിൽ - 1525 arb. യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിന്റെയും 3690 പരമ്പരാഗത യൂണിറ്റുകളുടെയും ഉൽപ്പന്നങ്ങൾ. യൂണിറ്റുകൾ രണ്ടാമത്തെ ഗ്രൂപ്പ്.
കാലാവസ്ഥയിൽ സാധ്യമായ മാറ്റങ്ങളുമായി ബന്ധപ്പെട്ട്, 40 റൂബിളുകളുടെ വിൽപ്പന വിലയിൽ പരമാവധി വിൽപ്പന വരുമാനം ഉറപ്പാക്കുന്ന കമ്പനിയുടെ ഉൽപ്പന്ന ഉൽപ്പാദന തന്ത്രം നിർണ്ണയിക്കാൻ ചുമതല സജ്ജീകരിച്ചിരിക്കുന്നു. 1 സ്റ്റാൻഡേർഡ് യൂണിറ്റിന് യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിന്റെ ഉൽപ്പന്നങ്ങളും 30 റബ്ബും. - രണ്ടാമത്തെ ഗ്രൂപ്പ്.
പരിഹാരം. കമ്പനിക്ക് രണ്ട് തന്ത്രങ്ങളുണ്ട്:
ഈ വർഷം കാലാവസ്ഥ ചൂടായിരിക്കും;
കാലാവസ്ഥ തണുത്തതായിരിക്കും.
കമ്പനി തന്ത്രം സ്വീകരിക്കുകയും വാസ്തവത്തിൽ ഊഷ്മളമായ കാലാവസ്ഥ (പ്രകൃതി തന്ത്രം) ഉണ്ടാവുകയും ചെയ്താൽ, ഉൽപ്പാദിപ്പിക്കുന്ന ഉൽപ്പന്നങ്ങൾ (ആദ്യ ഗ്രൂപ്പിന്റെ 3050 സ്റ്റാൻഡേർഡ് യൂണിറ്റുകളും രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ 1100 സ്റ്റാൻഡേർഡ് യൂണിറ്റുകളും) പൂർണ്ണമായും വിറ്റഴിക്കപ്പെടുകയും വരുമാനം ലഭിക്കുകയും ചെയ്യും.
3050×(40-20)+1100×(30-15)=77500 റബ്.
തണുത്ത കാലാവസ്ഥയിൽ (പ്രകൃതിയുടെ തന്ത്രം), രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ മരുന്നുകൾ പൂർണ്ണമായും വിൽക്കപ്പെടും, ആദ്യ ഗ്രൂപ്പ് 1525 പരമ്പരാഗത യൂണിറ്റുകളുടെ അളവിൽ മാത്രം. യൂണിറ്റുകൾ കൂടാതെ ചില മരുന്നുകൾ വിൽക്കാതെ കിടക്കും. വരുമാനം ഉണ്ടാകും
1525×(40-20)+1100×(30-15)-20×()=16500 റബ്.
അതുപോലെ, രൂപം തന്ത്രം സ്വീകരിക്കുകയും കാലാവസ്ഥ യഥാർത്ഥത്തിൽ തണുത്തതാണെങ്കിൽ, വരുമാനം ആയിരിക്കും
1525×(40-20)+3690×(30-15)=85850 റബ്.
ചൂടുള്ള കാലാവസ്ഥയിൽ, വരുമാനം ഉണ്ടാകും
1525×(40-20)+1100×(30-15)-() ×15=8150 റബ്.
കമ്പനിയെയും കാലാവസ്ഥയെയും രണ്ട് കളിക്കാരായി കണക്കാക്കി, ഞങ്ങൾക്ക് പേയ്മെന്റ് മാട്രിക്സ് ലഭിക്കും
,
ഗെയിമിന്റെ വില പരിധിയിലാണ്
എല്ലാ സാഹചര്യങ്ങളിലും കമ്പനിയുടെ വരുമാനം 16,500 റുബിളിൽ കുറയില്ലെന്ന് പേയ്മെന്റ് മാട്രിക്സിൽ നിന്ന് വ്യക്തമാണ്, എന്നാൽ കാലാവസ്ഥാ സാഹചര്യങ്ങൾ തിരഞ്ഞെടുത്ത തന്ത്രവുമായി പൊരുത്തപ്പെടുന്നെങ്കിൽ, കമ്പനിയുടെ വരുമാനം 77,500 റുബിളായിരിക്കാം.
ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്താം.
ഒരു തന്ത്രം ഉപയോഗിച്ച് ഒരു സ്ഥാപനത്തിന്റെ സംഭാവ്യതയെ നമുക്ക് സൂചിപ്പിക്കാം, കൂടാതെ ഒരു തന്ത്രം ഉപയോഗിച്ച് . ഗെയിം ഗ്രാഫിക്കായി പരിഹരിക്കുന്നു, നമുക്ക് ലഭിക്കും , ഗെയിമിന്റെ വില പി.
മരുന്നുകളുടെ ഉത്പാദനത്തിനുള്ള ഒപ്റ്റിമൽ പ്ലാൻ ആയിരിക്കും
അതിനാൽ, സെപ്റ്റംബർ, ഒക്ടോബർ മാസങ്ങളിൽ 2379 പരമ്പരാഗത യൂണിറ്റുകൾ ഉൽപ്പാദിപ്പിക്കുന്നതാണ് കമ്പനിക്ക് ഉചിതം. യൂണിറ്റുകൾ ആദ്യ ഗ്രൂപ്പിലെ മരുന്നുകളും 2239.6 പരമ്പരാഗത യൂണിറ്റുകളും. യൂണിറ്റുകൾ രണ്ടാമത്തെ ഗ്രൂപ്പിന്റെ മരുന്നുകൾ, പിന്നെ ഏത് കാലാവസ്ഥയിലും അവൾക്ക് കുറഞ്ഞത് 46,986 റുബിളെങ്കിലും വരുമാനം ലഭിക്കും.
അനിശ്ചിതത്വത്തിന്റെ സാഹചര്യങ്ങളിൽ, ഒരു കമ്പനിക്ക് മിക്സഡ് സ്ട്രാറ്റജി (മറ്റ് ഓർഗനൈസേഷനുകളുമായുള്ള കരാറുകൾ) ഉപയോഗിക്കുന്നത് സാധ്യമല്ലെങ്കിൽ, കമ്പനിയുടെ ഒപ്റ്റിമൽ തന്ത്രം നിർണ്ണയിക്കാൻ ഞങ്ങൾ ഇനിപ്പറയുന്ന മാനദണ്ഡങ്ങൾ ഉപയോഗിക്കുന്നു:
വാൾഡ് മാനദണ്ഡം:
Hurwitz മാനദണ്ഡം: വ്യക്തതയ്ക്കായി ഞങ്ങൾ അംഗീകരിക്കുന്നു, തുടർന്ന് കമ്പനിയുടെ തന്ത്രത്തിനായി
തന്ത്രത്തിന്
ഒരു കമ്പനി ഒരു തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.
ക്രൂരമായ മാനദണ്ഡം. ആദ്യ നിരയിലെ പരമാവധി ഘടകം 77500 ആണ്, രണ്ടാമത്തെ നിരയിൽ - 85850.
റിസ്ക് മാട്രിക്സിന്റെ ഘടകങ്ങൾ എക്സ്പ്രഷനിൽ നിന്ന് കണ്ടെത്തി
,
എവിടെ,,,
റിസ്ക് മാട്രിക്സ് ഇതുപോലെ കാണപ്പെടുന്നു
,
അല്ലെങ്കിൽ തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.
അതിനാൽ, കമ്പനി അല്ലെങ്കിൽ തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.
പരിഗണിക്കുന്ന ഓരോ മാനദണ്ഡവും പൂർണ്ണമായും തൃപ്തികരമാണെന്ന് കണക്കാക്കാനാവില്ല അന്തിമ തിരഞ്ഞെടുപ്പ്തീരുമാനങ്ങൾ, എന്നാൽ അവരുടെ സംയുക്ത വിശകലനം ചില മാനേജ്മെന്റ് തീരുമാനങ്ങൾ എടുക്കുന്നതിന്റെ അനന്തരഫലങ്ങൾ കൂടുതൽ വ്യക്തമായി സങ്കൽപ്പിക്കാൻ ഞങ്ങളെ അനുവദിക്കുന്നു.
പ്രകൃതിയുടെ വിവിധ അവസ്ഥകളുടെ അറിയപ്പെടുന്ന പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ കണക്കിലെടുക്കുമ്പോൾ, വിജയിക്കുന്നതിനുള്ള പരമാവധി ഗണിതശാസ്ത്ര പ്രതീക്ഷയാണ് തീരുമാന മാനദണ്ഡം.
ഊഷ്മളവും തണുത്തതുമായ കാലാവസ്ഥയുടെ സാധ്യതകൾ തുല്യമാണെന്നും 0.5 ആണെന്നും പരിഗണിക്കപ്പെടുന്ന പ്രശ്നത്തെക്കുറിച്ച് അറിയിക്കട്ടെ, തുടർന്ന് കമ്പനിയുടെ ഒപ്റ്റിമൽ തന്ത്രം ഇനിപ്പറയുന്ന രീതിയിൽ നിർണ്ണയിക്കപ്പെടുന്നു:
കമ്പനി അല്ലെങ്കിൽ തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ഉചിതം.
സ്വതന്ത്ര ജോലിക്കുള്ള ചുമതലകൾ
1. ഒരു എന്റർപ്രൈസസിന് മൂന്ന് തരം ഉൽപ്പന്നങ്ങൾ (എ, ബി, സി) ഉത്പാദിപ്പിക്കാൻ കഴിയും, അതേസമയം ഡിമാൻഡിന് അനുസരിച്ച് ലാഭം ലഭിക്കും. ആവശ്യത്തിന്, നാല് സംസ്ഥാനങ്ങളിൽ ഒന്ന് (I, II, III, IV) എടുക്കാം. ഇനിപ്പറയുന്ന മാട്രിക്സിൽ, ഘടകങ്ങൾ -th ഉൽപ്പന്നം റിലീസ് ചെയ്യുമ്പോൾ എന്റർപ്രൈസസിന് ലഭിക്കുന്ന ലാഭവും ഡിമാൻഡിന്റെ -th അവസ്ഥയും കാണിക്കുന്നു:
പൊതുവേ, V * ≠ V * - സാഡിൽ പോയിന്റ് ഇല്ല. ശുദ്ധമായ തന്ത്രങ്ങളിൽ ഒപ്റ്റിമൽ പരിഹാരവുമില്ല. എന്നിരുന്നാലും, മിക്സഡ് സ്ട്രാറ്റജി എന്ന ആശയം അവതരിപ്പിച്ചുകൊണ്ട് ഞങ്ങൾ പ്യുവർ സ്ട്രാറ്റജി എന്ന ആശയം വിപുലീകരിക്കുകയാണെങ്കിൽ, നന്നായി നിർവചിക്കപ്പെട്ടിട്ടില്ലാത്ത ഗെയിം പ്രശ്നത്തിന് ഒപ്റ്റിമൽ പരിഹാരം കണ്ടെത്തുന്നതിനുള്ള ഒരു അൽഗോരിതം നടപ്പിലാക്കാൻ സാധിക്കും. അത്തരമൊരു സാഹചര്യത്തിൽ, സീറോ-സം ഗെയിമിന് ഒപ്റ്റിമൽ പരിഹാരം കണ്ടെത്തുന്നതിന് സ്റ്റാറ്റിസ്റ്റിക്കൽ (പ്രോബബിലിസ്റ്റിക്) സമീപനം ഉപയോഗിക്കാൻ നിർദ്ദേശിക്കുന്നു. ഓരോ കളിക്കാരനും, അവനു സാധ്യമായ ഒരു നിശ്ചിത തന്ത്രങ്ങൾക്കൊപ്പം, ഒന്നോ അല്ലെങ്കിൽ മറ്റൊരു തന്ത്രം പ്രയോഗിക്കേണ്ട ഒരു അജ്ഞാത പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തികൾ) അവതരിപ്പിക്കുന്നു.
പ്ലെയർ എയുടെ തന്നിരിക്കുന്ന തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യതകളുടെ വെക്റ്റർ (ആപേക്ഷിക ആവൃത്തികൾ) നമുക്ക് ഇനിപ്പറയുന്ന രീതിയിൽ സൂചിപ്പിക്കാം:
P = (p 1, p 2,..., p m),
ഇവിടെ p i ≥ 0, p 1 + p 2 +…+ p m = 1. p i മൂല്യം A i തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തി) എന്ന് വിളിക്കുന്നു.
അതുപോലെ, B പ്ലെയറിനായി, സാധ്യതകളുടെ ഒരു അജ്ഞാത വെക്റ്റർ (ആപേക്ഷിക ആവൃത്തികൾ) അവതരിപ്പിക്കപ്പെടുന്നു, കൂടാതെ ഫോം ഉണ്ട്:
Q = (q 1, q 2,..., q n),
ഇവിടെ q j ≥ 0, q 1 + q 2 +…+ q n = 1. q j മൂല്യത്തെ B j സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിന്റെ പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തി) എന്ന് വിളിക്കുന്നു. A 1, A 2, …A m, B 1, B 2, …B n എന്നീ ശുദ്ധ തന്ത്രങ്ങളുടെ സെറ്റ് (കോമ്പിനേഷൻ) അവ ഓരോന്നും തിരഞ്ഞെടുക്കാനുള്ള സാധ്യതകളുടെ വെക്ടറുകളുമായി സംയോജിപ്പിച്ച് വിളിക്കുന്നു. സമ്മിശ്ര തന്ത്രങ്ങൾ.
ഫിനിറ്റ് സീറോ-സം ഗെയിമുകളുടെ സിദ്ധാന്തത്തിലെ പ്രധാന സിദ്ധാന്തം വോൺ ന്യൂമാന്റെ സിദ്ധാന്തം: ഓരോ ഫിനിറ്റ് മാട്രിക്സ് ഗെയിമിനും ഉണ്ട്, ഇത്രയെങ്കിലും, ഒരു സമുചിതമായ പരിഹാരം, ഒരുപക്ഷേ സമ്മിശ്ര തന്ത്രങ്ങൾക്കിടയിൽ.
ഈ സിദ്ധാന്തത്തിൽ നിന്ന്, നന്നായി നിർവചിക്കപ്പെട്ടിട്ടില്ലാത്ത ഗെയിമിന് സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഒരു സമുചിതമായ പരിഹാരമെങ്കിലും ഉണ്ടെന്ന് പിന്തുടരുന്നു. അത്തരം ഗെയിമുകളിൽ, ഒരു ജോടി ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളായ പി *, ക്യു * എന്നിവയായിരിക്കും പരിഹാരം, അതായത് കളിക്കാരിൽ ഒരാൾ തന്റെ ഒപ്റ്റിമൽ തന്ത്രം പാലിക്കുകയാണെങ്കിൽ, മറ്റ് കളിക്കാരന് അവന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിൽ നിന്ന് വ്യതിചലിക്കുന്നത് ലാഭകരമല്ല.
A കളിക്കാരന്റെ ശരാശരി പ്രതിഫലം ഗണിതശാസ്ത്ര പ്രതീക്ഷയാൽ നിർണ്ണയിക്കപ്പെടുന്നു:
ഒരു തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ പ്രോബബിലിറ്റി (ആപേക്ഷിക ആവൃത്തി) പൂജ്യത്തിൽ നിന്ന് വ്യത്യസ്തമാണെങ്കിൽ, അത്തരമൊരു തന്ത്രത്തെ വിളിക്കുന്നു സജീവമാണ്.
തന്ത്രങ്ങൾ പി*, ക്യു* എന്ന് വിളിക്കുന്നു ഒപ്റ്റിമൽ മിക്സഡ് M A (P, Q *) ≤ M A (P *, Q *) ≤ M A (P *, Q) (1) ആണെങ്കിൽ തന്ത്രങ്ങൾ
ഈ സാഹചര്യത്തിൽ M A (P * , Q *) എന്ന് വിളിക്കുന്നു ചെലവിൽഗെയിമുകളെ V (V * ≤ V ≤ V *) എന്ന് സൂചിപ്പിക്കുന്നു. അസമത്വങ്ങളിൽ ആദ്യത്തേത് (1) എന്നാണ് കളിക്കാരൻ എയുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ നിന്നുള്ള വ്യതിചലനംകളിക്കാരൻ ബി തന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ ഉറച്ചുനിൽക്കുകയാണെങ്കിൽ, ശരാശരി വിജയങ്ങളിൽ കുറവുണ്ടാക്കുന്നുകളിക്കാരൻ എ. അസമത്വങ്ങളിൽ രണ്ടാമത്തേത് അർത്ഥമാക്കുന്നത് കളിക്കാരൻ ബിയുടെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ നിന്നുള്ള വ്യതിയാനംകളിക്കാരൻ എ തന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ ഉറച്ചുനിൽക്കുകയാണെങ്കിൽ, കളിക്കാരൻ ബിയുടെ ശരാശരി നഷ്ടം വർദ്ധിക്കുന്നതിലേക്ക് നയിക്കുന്നു.
പൊതുവേ, അത്തരം പ്രശ്നങ്ങൾ ഈ കാൽക്കുലേറ്റർ ഉപയോഗിച്ച് വിജയകരമായി പരിഹരിക്കാൻ കഴിയും.
ഉദാഹരണം.
4 | 7 | 2 |
7 | 3 | 2 |
2 | 1 | 8 |
1. പേയ്മെന്റ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടോ എന്ന് പരിശോധിക്കുക. അതെ എങ്കിൽ, ഗെയിമിനുള്ള പരിഹാരം ഞങ്ങൾ ശുദ്ധമായ തന്ത്രങ്ങളിൽ എഴുതുന്നു.
കളിക്കാരൻ I തന്റെ പ്രതിഫലം പരമാവധി വർദ്ധിപ്പിക്കുന്ന തരത്തിൽ അവന്റെ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു എന്ന് ഞങ്ങൾ അനുമാനിക്കുന്നു, കൂടാതെ I-ന്റെ പ്രതിഫലം കുറയ്ക്കുന്ന തരത്തിൽ കളിക്കാരൻ II അവന്റെ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു.
കളിക്കാർ | ബി 1 | ബി 2 | ബി 3 | a = മിനിറ്റ് (A i) |
എ 1 | 4 | 7 | 2 | 2 |
എ 2 | 7 | 3 | 2 | 2 |
എ 3 | 2 | 1 | 8 | 1 |
b = പരമാവധി(B i) | 7 | 7 | 8 |
ഗെയിമിന്റെ കുറഞ്ഞ വില a = max(a i) = 2 നിർണ്ണയിക്കുന്ന ഗ്യാരണ്ടീഡ് പേഓഫ് ഞങ്ങൾ കണ്ടെത്തുന്നു, ഇത് പരമാവധി ശുദ്ധമായ തന്ത്രം A 1 സൂചിപ്പിക്കുന്നു.
ഗെയിമിന്റെ ഉയർന്ന വില b = min(b j) = 7. ഇത് ഒരു സാഡിൽ പോയിന്റിന്റെ അഭാവത്തെ സൂചിപ്പിക്കുന്നു, a ≠ b ആയതിനാൽ, ഗെയിമിന്റെ വില 2 ≤ y ≤ 7 പരിധിക്കുള്ളിലാണ്. ഞങ്ങൾ ഒരു പരിഹാരം കണ്ടെത്തുന്നു സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഗെയിമിലേക്ക്. കളിക്കാർക്ക് അവരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ശത്രുവിനോട് പ്രഖ്യാപിക്കാൻ കഴിയില്ല എന്ന വസ്തുത ഇത് വിശദീകരിക്കുന്നു: അവർ അവരുടെ പ്രവർത്തനങ്ങൾ മറയ്ക്കണം. കളിക്കാർക്ക് അവരുടെ തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കാൻ അനുവദിച്ചുകൊണ്ട് ഗെയിം പരിഹരിക്കാനാകും ക്രമരഹിതമായി(ശുദ്ധമായ തന്ത്രങ്ങൾ മിക്സ് ചെയ്യുക).
2. പ്രബലമായ വരികൾക്കും പ്രബലമായ കോളങ്ങൾക്കും പേയ്മെന്റ് മാട്രിക്സ് പരിശോധിക്കുക.
പേയ്മെന്റ് മാട്രിക്സിൽ പ്രബലമായ വരികളോ ആധിപത്യ നിരകളോ ഇല്ല.
3. സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക.
സമവാക്യങ്ങളുടെ ഒരു സിസ്റ്റം എഴുതാം.
ഐ കളിക്കാരന്
4p 1 +7p 2 +2p 3 = y
7p 1 +3p 2 +p 3 = y
2p 1 +2p 2 +8p 3 = y
p 1 +p 2 +p 3 = 1
പ്ലെയർ II-ന്
4q 1 +7q 2 +2q 3 = y
7q 1 +3q 2 +2q 3 = y
2q 1 +q 2 +8q 3 = y
q 1 + q 2 + q 3 = 1
ഗാസ് രീതി ഉപയോഗിച്ച് ഈ സിസ്റ്റങ്ങൾ പരിഹരിക്കുന്നത്, ഞങ്ങൾ കണ്ടെത്തുന്നു:
y = 4 1 / 34
p 1 = 29 / 68 (ഒന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
p 2 = 4 / 17 (രണ്ടാം തന്ത്രം ഉപയോഗിക്കാനുള്ള സാധ്യത).
p 3 = 23 / 68 (മൂന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
പ്ലെയർ I-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി: P = (29 / 68; 4 / 17; 23 / 68)
q 1 = 6 / 17 (ഒന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
q 2 = 9 / 34 (രണ്ടാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
q 3 = 13 / 34 (മൂന്നാം തന്ത്രം ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത).
പ്ലെയർ II-ന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി: Q = (6 / 17; 9 / 34; 13 / 34)
ഗെയിം വില: y = 4 1 / 34
ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഗെയിമിന്റെ വിലയും കളിക്കാരുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങളും നിർണ്ണയിക്കുന്നതിൽ ബുദ്ധിമുട്ടുകൾ ഉണ്ടാകുന്നു. ഉദാഹരണത്തിന്, ഗെയിം പരിഗണിക്കുക:
ഈ ഗെയിമിൽ ഒപ്പം. അതിനാൽ, ആദ്യ കളിക്കാരന് സ്വയം 4-ന് തുല്യമായ വിജയം ഉറപ്പ് നൽകാം, രണ്ടാമത്തേതിന് തന്റെ തോൽവി 5 ആയി പരിമിതപ്പെടുത്താം. തമ്മിലുള്ള വിസ്തീർണ്ണം, സമനില, ഓരോ കളിക്കാരനും അതിന്റെ ചെലവിൽ തന്റെ ഫലം മെച്ചപ്പെടുത്താൻ ശ്രമിക്കാം. പ്രദേശം. ഈ സാഹചര്യത്തിൽ കളിക്കാരുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ എന്തായിരിക്കണം?
ഓരോ കളിക്കാരനും നക്ഷത്രചിഹ്നം (ഒപ്പം) ഉപയോഗിച്ച് അടയാളപ്പെടുത്തിയ തന്ത്രം ഉപയോഗിക്കുകയാണെങ്കിൽ, ആദ്യ കളിക്കാരന്റെ വിജയവും രണ്ടാമന്റെ തോൽവിയും 5 ന് തുല്യമായിരിക്കും. രണ്ടാമത്തെ കളിക്കാരന് ഇത് ദോഷകരമാണ്, കാരണം ആദ്യത്തേത് ഉറപ്പ് നൽകുന്നതിനേക്കാൾ കൂടുതൽ വിജയിക്കുന്നു. തന്നെ. എന്നിരുന്നാലും, തന്ത്രം ഉപയോഗിക്കാനുള്ള ആദ്യ കളിക്കാരന്റെ ഉദ്ദേശ്യം രണ്ടാമത്തെ കളിക്കാരൻ എങ്ങനെയെങ്കിലും വെളിപ്പെടുത്തിയാൽ, അയാൾക്ക് തന്ത്രം പ്രയോഗിക്കുകയും ആദ്യ കളിക്കാരന്റെ പ്രതിഫലം 4 ആയി കുറയ്ക്കുകയും ചെയ്യാം. എന്നിരുന്നാലും, തന്ത്രം ഉപയോഗിക്കാനുള്ള രണ്ടാമത്തെ കളിക്കാരന്റെ ഉദ്ദേശ്യം ആദ്യ കളിക്കാരൻ വെളിപ്പെടുത്തിയാൽ, പിന്നെ, തന്ത്രം ഉപയോഗിച്ച്, അവൻ തന്റെ പ്രതിഫലം 6 ആയി വർദ്ധിപ്പിക്കും, അങ്ങനെ, ഓരോ കളിക്കാരനും താൻ ഉപയോഗിക്കാൻ പോകുന്ന തന്ത്രം രഹസ്യമായി സൂക്ഷിക്കേണ്ട ഒരു സാഹചര്യം ഉണ്ടാകുന്നു. എന്നിരുന്നാലും, ഇത് എങ്ങനെ ചെയ്യണം? എല്ലാത്തിനുമുപരി, ഗെയിം നിരവധി തവണ കളിക്കുകയും രണ്ടാമത്തെ കളിക്കാരൻ എല്ലായ്പ്പോഴും തന്ത്രം ഉപയോഗിക്കുകയും ചെയ്യുന്നുവെങ്കിൽ, ആദ്യ കളിക്കാരൻ ഉടൻ തന്നെ രണ്ടാമത്തെ കളിക്കാരന്റെ പദ്ധതി കണ്ടെത്തുകയും തന്ത്രം പ്രയോഗിച്ചാൽ ഒരു അധിക വിജയം നേടുകയും ചെയ്യും. വ്യക്തമായും, രണ്ടാമത്തെ കളിക്കാരൻ ഓരോ പുതിയ ഗെയിമിലും തന്ത്രം മാറ്റണം, എന്നാൽ ഓരോ സാഹചര്യത്തിലും താൻ ഏത് തന്ത്രമാണ് ഉപയോഗിക്കേണ്ടതെന്ന് ആദ്യ കളിക്കാരൻ ഊഹിക്കാത്ത വിധത്തിൽ ഇത് ചെയ്യണം.
ഒരു റാൻഡം സെലക്ഷൻ മെക്കാനിസത്തിന്, കളിക്കാരുടെ വിജയങ്ങളും നഷ്ടങ്ങളും ആയിരിക്കും ക്രമരഹിതമായ വേരിയബിളുകൾ. ഈ കേസിൽ കളിയുടെ ഫലം രണ്ടാമത്തെ കളിക്കാരന്റെ ശരാശരി നഷ്ടം കണക്കാക്കാം. നമുക്ക് ഉദാഹരണത്തിലേക്ക് മടങ്ങാം. അതിനാൽ, രണ്ടാമത്തെ കളിക്കാരൻ ഒരു തന്ത്രം ഉപയോഗിക്കുകയും ക്രമരഹിതമായി 0.5 പ്രോബബിലിറ്റികൾ ഉപയോഗിക്കുകയും ചെയ്യുന്നുവെങ്കിൽ; 0.5, അപ്പോൾ ആദ്യ കളിക്കാരന്റെ തന്ത്രം ഉപയോഗിച്ച് അവന്റെ നഷ്ടത്തിന്റെ ശരാശരി മൂല്യം ഇതായിരിക്കും:
ഒപ്പം ആദ്യ കളിക്കാരന്റെ തന്ത്രവും
അതിനാൽ, ആദ്യ കളിക്കാരൻ ഉപയോഗിക്കുന്ന തന്ത്രം പരിഗണിക്കാതെ തന്നെ രണ്ടാമത്തെ കളിക്കാരന് തന്റെ ശരാശരി നഷ്ടം 4.5 ആയി പരിമിതപ്പെടുത്താൻ കഴിയും.
അതിനാൽ, ചില സന്ദർഭങ്ങളിൽ, ഒരു തന്ത്രം മുൻകൂട്ടി രൂപപ്പെടുത്തുകയല്ല, മറിച്ച് ഏതെങ്കിലും തരത്തിലുള്ള റാൻഡം സെലക്ഷൻ മെക്കാനിസം ഉപയോഗിച്ച് ക്രമരഹിതമായി ഒന്നോ അതിലധികമോ തിരഞ്ഞെടുക്കുന്നതാണ് ഉചിതം. ക്രമരഹിതമായ തിരഞ്ഞെടുപ്പിനെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു തന്ത്രത്തെ വിളിക്കുന്നു സമ്മിശ്ര തന്ത്രം, വിളിക്കപ്പെടുന്ന ഉദ്ദേശിച്ച തന്ത്രങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി ശുദ്ധമായ തന്ത്രങ്ങൾ.
ശുദ്ധവും സമ്മിശ്രവുമായ തന്ത്രങ്ങൾക്ക് കൂടുതൽ കർശനമായ നിർവചനം നൽകാം.
സാഡിൽ പോയിന്റില്ലാതെ ഒരു ഗെയിം നടക്കട്ടെ:
ആദ്യ കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ ആവൃത്തി , (i-th സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത) ഉപയോഗിച്ച് നമുക്ക് സൂചിപ്പിക്കാം. അതുപോലെ, രണ്ടാമത്തെ കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രം ഉപയോഗിക്കുന്നതിന്റെ ആവൃത്തി , (j-th സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യത) ഉപയോഗിച്ച് നമുക്ക് സൂചിപ്പിക്കാം. ഒരു സാഡിൽ പോയിന്റുള്ള ഗെയിമിന്, ശുദ്ധമായ തന്ത്രങ്ങളിൽ ഒരു പരിഹാരമുണ്ട്. സാഡിൽ പോയിന്റ് ഇല്ലാത്ത ഒരു ഗെയിമിന്, സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഒരു പരിഹാരമുണ്ട്, അതായത്, തന്ത്രത്തിന്റെ തിരഞ്ഞെടുപ്പ് സാധ്യതകളെ അടിസ്ഥാനമാക്കിയുള്ളതായിരിക്കുമ്പോൾ. പിന്നെ
ശുദ്ധമായ 1st പ്ലെയർ തന്ത്രങ്ങൾ ധാരാളം;
ധാരാളം മിക്സഡ് 1st കളിക്കാരുടെ തന്ത്രങ്ങൾ;
ധാരാളം ശുദ്ധമായ രണ്ടാം കളിക്കാരന്റെ തന്ത്രങ്ങൾ;
നിരവധി സമ്മിശ്ര രണ്ടാം കളിക്കാരന്റെ തന്ത്രങ്ങൾ.
നമുക്ക് ഒരു ഉദാഹരണം നോക്കാം: ഒരു ഗെയിം ഉണ്ടാകട്ടെ
രണ്ടാമത്തെ കളിക്കാരൻ സാധ്യത തിരഞ്ഞെടുക്കുന്നു . യഥാക്രമം തന്ത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ രണ്ടാമത്തെ കളിക്കാരന്റെ ശരാശരി നഷ്ടം നമുക്ക് കണക്കാക്കാം.
ശുദ്ധവും സമ്മിശ്രവുമായ തന്ത്രങ്ങളുണ്ട്. ശുദ്ധമായ തന്ത്രം
ആദ്യ കളിക്കാരൻ (ശുദ്ധമായ തന്ത്രം
രണ്ടാമത്തെ കളിക്കാരൻ) ആദ്യ (രണ്ടാം) കളിക്കാരന്റെ സാധ്യമായ നീക്കമാണ്, അവൻ തിരഞ്ഞെടുത്തത് 1 ന് തുല്യമാണ്.
ആദ്യ കളിക്കാരന് m സ്ട്രാറ്റജികളും രണ്ടാമത്തെ കളിക്കാരന് n സ്ട്രാറ്റജികളും ഉണ്ടെങ്കിൽ, ആദ്യത്തെയും രണ്ടാമത്തെയും കളിക്കാരുടെ ഏത് ജോഡി തന്ത്രങ്ങൾക്കും, ശുദ്ധമായ തന്ത്രങ്ങളെ യൂണിറ്റ് വെക്റ്ററുകളായി പ്രതിനിധീകരിക്കാം. ഉദാഹരണത്തിന്, ഒരു ജോടി തന്ത്രങ്ങൾക്കായി
,
ഒന്നും രണ്ടും കളിക്കാരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ഇങ്ങനെ എഴുതപ്പെടും:
,
. ഒരു ജോടി തന്ത്രങ്ങൾക്കായി ,ശുദ്ധമായ തന്ത്രങ്ങൾ ഇങ്ങനെ എഴുതാം:
,
.
സിദ്ധാന്തം: ഒരു മാട്രിക്സ് ഗെയിമിൽ, ഗെയിമിന്റെ കുറഞ്ഞ അറ്റ വില ഗെയിമിന്റെ ഉയർന്ന അറ്റ വിലയേക്കാൾ കൂടുതലാകില്ല, അതായത്.
.
നിർവ്വചനം:ശുദ്ധമായ തന്ത്രങ്ങൾക്കാണെങ്കിൽ ,യഥാക്രമം എ, ബി കളിക്കാർ സമത്വമുണ്ട്
, പിന്നെ ഒരു ജോടി ശുദ്ധമായ തന്ത്രങ്ങൾ ( ,) മാട്രിക്സ് ഗെയിമിന്റെ സാഡിൽ പോയിന്റ്, മൂലകം എന്ന് വിളിക്കുന്നു മാട്രിക്സ്, i-th വരിയുടെയും j-th നിരയുടെയും കവലയിൽ നിൽക്കുന്നത് പേയ്മെന്റ് മാട്രിക്സിന്റെ സാഡിൽ ഘടകമാണ്, കൂടാതെ നമ്പർ
- കളിയുടെ ശുദ്ധമായ വില.
ഉദാഹരണം:താഴ്ന്നതും ഉയർന്നതുമായ നെറ്റ് വിലകൾ കണ്ടെത്തുക, മാട്രിക്സ് ഗെയിമിന്റെ സാഡിൽ പോയിന്റുകളുടെ സാന്നിധ്യം സ്ഥാപിക്കുക
.
ഗെയിമിന്റെ താഴ്ന്നതും ഉയർന്നതുമായ അറ്റ വിലകൾ നമുക്ക് നിർണ്ണയിക്കാം: , ,
.
ഈ സാഹചര്യത്തിൽ, നമുക്ക് ഒരു സാഡിൽ പോയിന്റ് (A 1 ; B 2) ഉണ്ട്, സാഡിൽ ഘടകം 5 ആണ്. ഈ ഘടകം 1-ആം വരിയിലെ ഏറ്റവും ചെറുതും 2-ാം നിരയിലെ ഏറ്റവും വലുതുമാണ്. മാക്സിമിൻ തന്ത്രമായ A 1-ൽ നിന്ന് കളിക്കാരൻ A യുടെ വ്യതിചലനം അവന്റെ വിജയങ്ങളിൽ കുറവുണ്ടാക്കുന്നു, കൂടാതെ മിനിമാക്സ് തന്ത്രമായ B 2-ൽ നിന്ന് കളിക്കാരൻ B യുടെ വ്യതിചലനം നഷ്ടം വർദ്ധിക്കുന്നതിലേക്ക് നയിക്കുന്നു. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഒരു മാട്രിക്സ് ഗെയിമിന് ഒരു സാഡിൽ ഘടകം ഉണ്ടെങ്കിൽ, കളിക്കാർക്ക് ഏറ്റവും മികച്ച തന്ത്രങ്ങൾ അവരുടെ മിനിമാക്സ് തന്ത്രങ്ങളാണ്. ഈ ശുദ്ധമായ തന്ത്രങ്ങൾ, ഒരു സാഡിൽ പോയിന്റ് രൂപീകരിക്കുകയും ഗെയിം മാട്രിക്സിൽ 12 =5 എന്ന സാഡിൽ മൂലകത്തെ ഹൈലൈറ്റ് ചെയ്യുകയും ചെയ്യുന്നത് ഒപ്റ്റിമൽ പ്യുവർ സ്ട്രാറ്റജികളാണ്. ഒപ്പം യഥാക്രമം എ, ബി കളിക്കാർ.
ഒരു മാട്രിക്സ് ഗെയിമിന് സാഡിൽ പോയിന്റ് ഇല്ലെങ്കിൽ, ഗെയിം പരിഹരിക്കുന്നത് ബുദ്ധിമുട്ടാണ്. ഈ ഗെയിമുകളിൽ
. അത്തരം ഗെയിമുകളിൽ മിനിമാക്സ് തന്ത്രങ്ങളുടെ ഉപയോഗം ഓരോ കളിക്കാരന്റെയും പ്രതിഫലം കവിയുന്നില്ല എന്ന വസ്തുതയിലേക്ക് നയിക്കുന്നു. , തോൽവിയും കുറവല്ല . ഓരോ കളിക്കാരനും, വിജയങ്ങൾ (നഷ്ടം കുറയ്ക്കൽ) വർദ്ധിപ്പിക്കുന്ന ചോദ്യം ഉയർന്നുവരുന്നു. സമ്മിശ്ര തന്ത്രങ്ങൾ ഉപയോഗിച്ചാണ് പരിഹാരം കണ്ടെത്തുന്നത്.
നിർവ്വചനം:ആദ്യ (രണ്ടാം) കളിക്കാരന്റെ മിക്സഡ് തന്ത്രം ഒരു വെക്റ്റർ ആണ്
, എവിടെ
ഒപ്പം
(
, എവിടെ
ഒപ്പം
).
വെക്റ്റർ p(q) എന്നാൽ ആദ്യ കളിക്കാരൻ i-th പ്യുവർ സ്ട്രാറ്റജി ഉപയോഗിക്കുന്നതിനുള്ള സാധ്യതയാണ് (രണ്ടാമത്തെ കളിക്കാരന്റെ j-th പ്യുവർ സ്ട്രാറ്റജി).
കളിക്കാർ അവരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ക്രമരഹിതമായും പരസ്പരം സ്വതന്ത്രമായും തിരഞ്ഞെടുക്കുന്നതിനാൽ, ഗെയിം ക്രമരഹിതവും വിജയങ്ങളുടെ (നഷ്ടങ്ങൾ) ക്രമരഹിതവുമാണ്. ഈ സാഹചര്യത്തിൽ, ലാഭത്തിന്റെ (നഷ്ടം) ശരാശരി മൂല്യം - ഗണിതശാസ്ത്ര പ്രതീക്ഷ - സമ്മിശ്ര തന്ത്രങ്ങളുടെ പ്രവർത്തനമാണ് p, q:
.
നിർവ്വചനം: f(р, q) ഫംഗ്ഷനെ മാട്രിക്സ് ഗെയിമിന്റെ പേഓഫ് ഫംഗ്ഷൻ എന്ന് വിളിക്കുന്നു
.
നിർവ്വചനം:തന്ത്രങ്ങൾ
,
അനിയന്ത്രിതമായ തന്ത്രങ്ങളാണെങ്കിൽ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു
,
വ്യവസ്ഥ പാലിക്കപ്പെടുന്നു
ഗെയിമിലെ ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജികളുടെ ഉപയോഗം ആദ്യ കളിക്കാരന് മറ്റേതെങ്കിലും തന്ത്രം ഉപയോഗിക്കുന്നതിനേക്കാൾ കുറഞ്ഞ പ്രതിഫലം നൽകുന്നു; രണ്ടാമത്തെ കളിക്കാരന് മറ്റേതെങ്കിലും തന്ത്രം ഉപയോഗിച്ചാൽ കൂടുതൽ നഷ്ടമാകില്ല q.
ഒപ്റ്റിമൽ തന്ത്രങ്ങളുടെയും ഗെയിമിന്റെ വിലയുടെയും സംയോജനമാണ് ഗെയിമിന്റെ പരിഹാരം.