ഗെയിമുകളുടെയും സ്റ്റാറ്റിസ്റ്റിക്കൽ പരിഹാരങ്ങളുടെയും സിദ്ധാന്തം.

പ്രധാനപ്പെട്ട / ഭർത്താവിന്റെ രാജ്യദ്രോഹം

ഇതിന്റെ കളിക്കാരന്റെ തിരഞ്ഞെടുപ്പ് അല്ലെങ്കിൽ ആ പ്രവർത്തനത്തെ വിളിക്കുന്നു വഴിയിൽ. ചിനപ്പുപൊട്ടൽ വക്തിപരമായ (കളിക്കാരൻ മന ib പൂർവ്വം അല്ലെങ്കിൽ ആ തീരുമാനം സ്വീകരിക്കുന്നു) കൂടാതെ വികലമായ (കളിയുടെ ഫലം കളിക്കാരന്റെ ഇച്ഛാശക്തിയെ ആശ്രയിക്കുന്നില്ല). ഏത് കോഴ്സിന് ഈ കോഴ്സിന് ചെയ്യേണ്ട ഒരു കൂട്ടം നിയമങ്ങൾ വിളിക്കുന്നു കൗശലം. തന്ത്രങ്ങൾ ഉണ്ട് ശുചിയാക്കുക (റാൻഡം ഇതര പ്ലെയർ സൊല്യൂഷനുകൾ) കൂടാതെ മിശ്രിത (തന്ത്രം ക്രമരഹിതമായ തുകയായി കണക്കാക്കാം).

മധ്യസ്ഥത

... ഇല് ഗെയിം സിദ്ധാന്തം S. ടി. സാഡിൽ ഘടകം) - ഇത് നിരയുടെ ഏറ്റവും വലിയ ഘടകമാണ് മാട്രിക്സ് ഗെയിമുകൾഅവ ഒരേ സമയം അനുബന്ധ വരിയുടെ ഏറ്റവും ചെറിയ ഘടകം (ഇൻ പൂജ്യം തുക ഉപയോഗിച്ച് രണ്ട് വ്യക്തികളുടെ ഗെയിം). അതിനാൽ, ഈ സമയത്ത്, ഒരു കളിക്കാരന്റെ മാക്സിമൈൻ മറ്റൊന്നിന്റെ ചുരുങ്ങിയത് തുല്യമാണ്; S. ടി. ഒരു പോയിന്റ് ഉണ്ട് സന്തുലിതാവസ്ഥ.

മിനിക്സെ സിദ്ധാന്തം

മിൻസിസിനോട് യോജിക്കുന്ന തന്ത്രം എന്ന് വിളിക്കുന്നു മിനിമാക്സ് തന്ത്രം.

ഏറ്റവും ജാഗ്രത "മാക്സിമൈൻ, മിനിമാക്സ് തന്ത്രങ്ങൾ എന്നിവയുടെ തിരഞ്ഞെടുപ്പ് കളിക്കാരെ നിർദ്ദേശിക്കുന്നു മിനിമാക്സിന്റെ തത്വം. ഓരോ കളിക്കാരനും ശത്രുവിന്റെ ലക്ഷ്യത്തിന് എതിർവശത്ത് ലക്ഷ്യം നേടാൻ ശ്രമിക്കുന്ന ന്യായമായ അനുമാനത്തിൽ നിന്ന് ഈ തത്ത്വം പിന്തുടരുന്നു.

കളിക്കാരൻ തന്റെ പ്രവർത്തനങ്ങൾ തിരഞ്ഞെടുക്കുന്നു, ശത്രു പ്രതികൂലമായി പ്രവർത്തിക്കുമെന്ന് കരുതി, ഞാൻ.ഇ. "ദോഷം" ചെയ്യാൻ ശ്രമിക്കും.

നഷ്ടം

നഷ്ടം - സ്റ്റാറ്റിസ്റ്റിക്കൽ പരിഹാരങ്ങൾ സിദ്ധാന്തത്തിലെ ഒരു പ്രവർത്തനം നിരീക്ഷിച്ച ഡാറ്റയെ അടിസ്ഥാനമാക്കി തെറ്റായ തീരുമാനമെടുക്കലിന്റെ നഷ്ടത്തെ സ്വഭാവ സവിശേഷതകളാണ്. ഇടപെടലിന്റെ പശ്ചാത്തലത്തിലുള്ള സിഗ്നൽ പാരാമീറ്റർ കണക്കാക്കുകയാണെങ്കിൽ, നഷ്ടം പ്രവർത്തനം പൊരുത്തക്കേടുകളുടെ അളവുകോലാണ് യഥാർത്ഥ അർത്ഥം കണക്കാക്കിയ പാരാമീറ്റർ, പാരാമീറ്റർ എസ്റ്റിമേറ്റ്

ഒപ്റ്റിമൽ മിക്സഡ് പ്ലെയർ തന്ത്രം - നിർദ്ദിഷ്ട സാധ്യതകളോടെ അതേ സാഹചര്യങ്ങളിൽ ഗെയിം ആവർത്തിക്കുന്നതിലെ അതിന്റെ ശുദ്ധമായ തന്ത്രങ്ങളുടെ ഒരു നിശ്ചിത കൂട്ടമാണിത്.

നിർദ്ദിഷ്ട പ്രോബബിലിറ്റികളോടെ അതേ സാഹചര്യങ്ങളിൽ ഗെയിം ആവർത്തിക്കുന്നതിലെ അറ്റ \u200b\u200bതന്ത്രങ്ങളുടെ ഒരു നിശ്ചിത പ്രയോഗമാണ് കളിക്കാരന്റെ സമ്മിശ്ര തന്ത്രം.

1. സ്ട്രിംഗിന്റെ എല്ലാ ഘടകങ്ങളും മറ്റൊരു വരിയുടെതവണ ഇനങ്ങൾ ഇല്ലെങ്കിൽ, പേയ്മെന്റ് മാട്രിക്സിൽ നിന്ന് ഉറവിട സ്ട്രിംഗ് ഇല്ലാതാക്കാൻ കഴിയും. നിരകൾക്ക് സമാനമാണ്.

2. കളിയുടെ വില മാത്രമാണ്.

മുറിവാല്: 2 വിലകൾ ഗെയിമുകൾ ഉണ്ടെന്ന് കരുതുക v. ഒരു ജോഡിയിൽ നേടിയെടുക്കുന്നതും അതനുസരിച്ച്, പിന്നെ

3. പേയ്മെന്റ് മാട്രിക്സിന്റെ എല്ലാ ഘടകങ്ങളും ഒരേ നമ്പർ ചേർക്കുകയാണെങ്കിൽ, ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ മാറില്ല, ഒപ്പം ഗെയിമിന്റെ വില ഈ നമ്പർ വർദ്ധിപ്പിക്കും.

മുറിവാല്:
എവിടെ

4. പേയ്മെന്റിന്റെ എല്ലാ ഘടകങ്ങളും ഒരേ നമ്പർ ഗുണിതമായിരിക്കില്ലെങ്കിൽ, ഗെയിമിന്റെ വില ഈ നമ്പറിൽ പെരുകുന്നു, ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ മാറില്ല.

എസ്എയുടെ സമ്മിശ്ര തന്ത്രം എ 1, എ 2, ..., പി 2, ..., പിഐ, ..., സാധ്യതകളുടെ ആകെത്തുക എന്നിവയാണ് സാമ്മിക തന്ത്രം എന്ന് വിളിക്കുന്നത്. പി.എം. പ്ലെയർ തന്ത്രങ്ങൾ ഒരു മാട്രിക്സിന്റെയോ അല്ലെങ്കിൽ സ്ട്രിംഗിന്റെയോ രൂപത്തിൽ രേഖപ്പെടുത്തിയിട്ടുണ്ട് അല്ലെങ്കിൽ ഒരു സ്ട്രിംഗ് സെ \u003d (പി 1, പി 2, രൂപത്തിൽ, അതുപോലെ തന്നെ മിക്സഡ് പ്ലേയർ തന്ത്രങ്ങൾ നിയുക്തമാക്കിയിരിക്കുന്നു :, അല്ലെങ്കിൽ, SB \u003d (ക്യു 1, ക്യു 2, ..., ക്വി, ..., ക്യുഎൻ), അവിടെ തന്ത്രങ്ങൾ പ്രത്യക്ഷപ്പെടുന്നതിന്റെ സാധ്യത 1: ശുദ്ധമായ തന്ത്രങ്ങൾ മിശ്രിതമാവുകയും ഒരു സ്ട്രിംഗ് സജ്ജമാക്കുകയും ചെയ്യാം, അതിൽ 1 ശുദ്ധമായ ഒരു തന്ത്രവുമായി യോജിക്കുന്നു. ഏറ്റവും കുറഞ്ഞ തത്വത്തെ അടിസ്ഥാനമാക്കി, ഗെയിമിന്റെ ഒപ്റ്റിമൽ പരിഹാരം (അല്ലെങ്കിൽ തീരുമാനം) നിർണ്ണയിക്കപ്പെടുന്നു: ഇത് ഒരു ജോഡി ഒപ്റ്റിമൽ സ്ട്രാറ്ററുകളാണ്, ഇതിൽ ഒരാളാണെങ്കിൽ കളിക്കാർക്ക് അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രം സൂക്ഷിക്കുന്നു, തുടർന്ന് മറ്റൊരാളിൽ നിന്ന് മറ്റൊന്നിൽ നിന്ന് പിന്മാറാൻ കഴിയില്ല. ഒപ്റ്റിമൽ പരിഹാരത്തിന് അനുസരിച്ച് വിജയങ്ങളെ ഗെയിം വി. കളിയുടെ വില അസമത്വം തൃപ്തിപ്പെടുത്തുന്നു:? ? വി? ? (3.5) എവിടെ? ഒപ്പം? - താഴ്ന്നതും ഉയർന്നതുമായ ഗെയിം വിലകൾ. ഗെയിം സിദ്ധാന്തത്തിന്റെ ഇനിപ്പറയുന്ന അടിസ്ഥാന സൈദ്ധാന്തികമാണ് നല്ലത്, ദി ഗെയിം സിദ്ധാന്തമാണ് ന്യൂമാൻ സിദ്ധാന്തം. ഓരോ അവസാന ഗെയിമിനും ഉണ്ട് ഇത്രയെങ്കിലും ഒപ്റ്റിമൽ പരിഹാരംണ്ടായിരിക്കാം സമ്മിശ്ര തന്ത്രങ്ങൾ. S * a \u003d (p * 1, p * 2, ..., p * i, p * 2, p * m), s * b \u003d (q * 1, q * 2, ..., q * ഞാൻ, ..., q * n) - ഒരു ജോഡി ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ. മൊത്തം തന്ത്രം പൂജ്യമല്ലാത്ത പ്രോബബിലിറ്റി ഉള്ള ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിലേക്ക് പ്രവേശിച്ചാൽ അത് സജീവമായി വിളിക്കുന്നു. സജീവ സ്ട്രാറ്റജി സിദ്ധാന്തം സാധുവാണ്: കളിക്കാരിലൊരാൾ അതിന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തെ സൂചിപ്പിക്കുന്നുവെങ്കിൽ, രണ്ടാമത്തെ കളിക്കാരൻ അതിന്റെ സജീവ തന്ത്രങ്ങൾക്ക് അതീതമായി പോയില്ലെങ്കിൽ വിജയികൾ v വിലയ്ക്ക് തുല്യമാണ്. ഈ സിദ്ധാന്തത്തിന് മികച്ച പ്രായോഗിക പ്രാധാന്യമുണ്ട് - ഒരു സാഡിൽ പോയിന്റിന്റെ അഭാവത്തിൽ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള പ്രത്യേക മോഡലുകൾ നൽകുന്നു. ഗെയിം വലുപ്പം 2 × 2 ന്റെ വലുപ്പം പരിഗണിക്കുക, അതായത് അവസാന ഗെയിമിന്റെ ലളിതമായ കേസ്. അത്തരമൊരു ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടെങ്കിൽ, ഒപ്റ്റിമൽ പരിഹാരം ഈ ഘട്ടത്തിന് അനുയോജ്യമായ ഒരു ജോഡി ശുദ്ധമായ തന്ത്രങ്ങളാണ്. ഗെയിം സിദ്ധാന്തത്തിന്റെ പ്രധാന സിദ്ധാന്തത്തിന് അനുസൃതമായി, ഒപ്റ്റിമൽ പരിഹാരം നിലവിലുണ്ട്, ഒരു ജോഡി മിക്സഡ് തന്ത്രങ്ങൾ നിർണ്ണയിക്കുന്നത് s * a \u003d (p * 1, p * 2), s * B \u003d (q * 1, q * 2). അവ കണ്ടെത്തുന്നതിന്, ഞങ്ങൾ യഥാർത്ഥ സ്ട്രാറ്റഗോ സിദ്ധാന്തം ഉപയോഗിക്കുന്നു. കളിക്കാരൻ അയാളുടെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് "എ ആണെങ്കിൽ, തുടർന്ന് തന്റെ ശരാശരി വിഷം ഗെയിം വി, v വരെ, v കൾ v to to to to to to to × 2 കളിച്ചതിന് v. സാഡിൽ പോയിന്റ്. വിൻ പ്ലെയർ എ (പ്ലേയർ നഷ്ടം) - ക്രമരഹിതമായ മൂല്യം, പ്രതീക്ഷിച്ച മൂല്യം (ശരാശരി മൂല്യം) അത് ഗെയിമിന്റെ വിലയാണ്. അതിനാൽ, ശരാശരി കളിക്കാരൻ ഒരു (ഒപ്റ്റിമൽ തന്ത്രം) നേടുന്നത് v, 1 ന് തുല്യമായിരിക്കും, രണ്ടാം ശത്രു തന്ത്രത്തിന്. അത് ഒരു സമ്മിശ്ര ബദലിയെയും ശുദ്ധമായ തന്ത്രപരമായ ബി 1 ലെ പ്ലെയറിനെയും ഉപയോഗിക്കുന്ന ഗെയിമിനെ അനുവദിക്കുക (ഇത് പേയ്മെന്റ് മാട്രിക്സ് പിയുടെ ആദ്യ നിരയുമായി പൊരുത്തപ്പെടുന്നു), ഇത് വിലയാണ് ഗെയിം v: A11 p * 1 + A21 p * 2 \u003d v. രണ്ടാമത്തെ കളിക്കാരൻ ഒരു ബി 2 തന്ത്രം പ്രയോഗിച്ചാൽ അതേ ശരാശരി നേട്ടത്തിന് ഒരു കളിക്കാരൻ ലഭിക്കുന്നു, അതായത്. A12 p * 1 + A22 p * 2 \u003d v. പി * 1 + p * 2 \u003d 1 എന്ന് കണക്കിലെടുക്കുമ്പോൾ, ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് "എയും ഗെയിമിന്റെ വിലയും V: (3.6), ഞങ്ങൾ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ (3.7) ഗെയിമിന്റെ വില (3.8) സജീവ തന്ത്രങ്ങളെക്കുറിച്ച് പ്രയോഗിക്കുന്നു - സ്വെറ്റ് കളിക്കാരന്റെ തന്ത്രം, പ്ലെയർ എ 1 അല്ലെങ്കിൽ എ 2), ശരാശരി പ്ലെയർ നഷ്ടം വിലയ്ക്ക് തുല്യമാണ് ഗെയിം v, അതായത് (3.9) ഒപ്റ്റിമൽ തന്ത്രം നിർണ്ണയിക്കുന്നത് സൂത്രവാക്യങ്ങൾ നിർണ്ണയിക്കുന്നു: (3.10)

സമ്പദ്വ്യവസ്ഥയിലെ ഗണിത രീതികളും മോഡലുകളും

മാട്രിക്സ് ഗെയിമുകൾ

പരിചയപ്പെടുത്തല്

സാമ്പത്തിക പരിശീലനത്തിൽ, വിവിധ ലക്ഷ്യങ്ങൾ വിവിധ ലക്ഷ്യങ്ങൾ പാലിക്കുന്നു. ഉദാഹരണത്തിന്, വിൽപ്പനക്കാരനും വാങ്ങുന്നവനും വിതരണക്കാരനും ഉപഭോക്താവും ബാങ്കും സംഭാവകരും മുതലായവയും തമ്മിലുള്ള ബന്ധം. ഇത്തരം സംഘട്ടനങ്ങൾ സമ്പദ്വ്യവസ്ഥയിൽ മാത്രമല്ല, മറ്റ് പ്രവർത്തനങ്ങളിൽ ഉണ്ടാകുന്നു. ഉദാഹരണത്തിന്, ചെസ്സ്, ചെക്കേഴ്സ്, ഡൊമിനോ, ലോട്ടോ മുതലായവ കളിക്കുമ്പോൾ.

കളി- ഇതാണ് മാത്തമാറ്റിക്കൽ മോഡൽ നിരവധി പേർ ഉപയോഗിക്കുന്ന രണ്ട് വ്യക്തികളെങ്കിലും പങ്കാളിത്തവുമായി പൊരുത്തക്കേട് വ്യത്യസ്ത വഴികൾ നിങ്ങളുടെ ലക്ഷ്യങ്ങൾ നേടാൻ. ഗെയിമിനെ വിളിക്കുന്നു ഇണ രണ്ട് കളിക്കാർ അതിൽ പങ്കെടുക്കുകയാണെങ്കിൽ. ഗെയിമിനെ വിളിക്കുന്നു വിരുദ്ധ ഒരു കളിക്കാരന്റെ വിജയം മറ്റൊന്നിന്റെ നഷ്ടത്തിന് തുല്യമാണെങ്കിൽ. അതിനാൽ, ഗെയിം ചുമതലപ്പെടുത്തുന്നതിന്, വിവിധ സാഹചര്യങ്ങളിൽ ഒരു കളിക്കാരന്റെ വിജയത്തിന്റെ മൂല്യങ്ങൾ വ്യക്തമാക്കാൻ ഇത് മതിയാകും.

നിലവിലെ സാഹചര്യത്തെ ആശ്രയിച്ച് കളിക്കാരന്റെ ഏത് രീതിയും വിളിക്കുന്നു തന്ത്രം. ഓരോ കളിക്കാരനും ഒരു നിശ്ചിത തന്ത്രങ്ങൾ ഉണ്ട്. കോഴ്സിന്റെ തന്ത്രങ്ങളുടെ എണ്ണം ആണെങ്കിൽ, ഗെയിമിനെ വിളിക്കുന്നു ആത്യന്തികമായി അല്ലെങ്കിൽ - അനന്തമായ . തന്ത്രങ്ങൾ വിളിക്കുന്നു ശുചിയാക്കുക ഓരോ കളിക്കാരും നിർവചിക്കപ്പെട്ട ഒരു തന്ത്രം മാത്രം തിരഞ്ഞെടുക്കുന്നുവെങ്കിൽ, ക്രമരഹിതമായി അല്ല.

ഗെയിം പരിഹരിക്കുന്നുഅത്തരമൊരു തന്ത്രം തൃപ്തിപ്പെടുത്തുന്ന ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിലാണ് ഒപ്റ്റിമലിറ്റിയുടെ അവസ്ഥ. ഈ അവസ്ഥ ഒരു കളിക്കാരൻ ലഭിക്കുന്നു എന്നതാണ് പരമാവധി വിജയം, രണ്ടാമത്തെ അകത്തെ അതിന്റെ തന്ത്രത്തിന്റേതാണെങ്കിൽ. തിരിച്ചും രണ്ടാമത്തെ കളിക്കാരൻ ലഭിക്കുന്നു കുറഞ്ഞ നഷ്ടം, കളിക്കാരിൽ ആദ്യത്തേത് അതിന്റെ തന്ത്രം പിടിക്കുന്നുവെങ്കിൽ. അത്തരം തന്ത്രങ്ങൾ വിളിക്കുന്നു ഒപ്റ്റിമൽ . ഈ വഴിയിൽ, ഓരോ കളിക്കാരനുമുള്ള ഒപ്റ്റിമൽ തന്ത്രത്തിന്റെ നിർവചനമാണ് ഗെയിമിന്റെ ലക്ഷ്യം.

വൃത്തിയുള്ള സ്ട്രാറ്റജി ഗെയിം

രണ്ട് കളിക്കാരുമായി ഗെയിം പരിഗണിക്കുക പക്ഷേ ഒപ്പം ൽ.ഒരു കളിക്കാരനെ കരുതുക പക്ഷേഅതിന് ഉണ്ട് എം.തന്ത്രങ്ങൾ 1, 2, ... എം, ഒരു കളിക്കാരൻ ... ഇല്അതിന് ഉണ്ട് n.തന്ത്രങ്ങൾ B 1, B 2, ..., B n.ഒരു കളിക്കാരന്റെ തിരഞ്ഞെടുപ്പ് ഞങ്ങൾ അനുമാനിക്കുന്നു പക്ഷേകൗശലം A i,ഒരു കളിക്കാരൻ ... ഇല്കൗശലം B J.തീർച്ചയായും ഗെയിമിന്റെ ഫലം നിർണ്ണയിക്കുന്നു, അതായത്. വിജയിക്കുക ഒരു ij.കളിക്കാരി പക്ഷേവിജയിക്കുക B ij.കളിക്കാരി ൽ.ഇവിടെ i \u003d 1,2, ..., എം, ജെ \u003d 1,2, ..., N.

രണ്ട് കളിക്കാരുമായുള്ള ഏറ്റവും ലളിതമായ ഗെയിം ഒരു വിരുദ്ധ ഗെയിമാണ് , ആ. കളിക്കാരുടെ താൽപ്പര്യങ്ങൾ നേരിട്ട് എതിർവശത്തുള്ള ഗെയിം. ഈ സാഹചര്യത്തിൽ, കളിക്കാരുടെ നേട്ടം സമത്വവുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു.

b ij \u003d -a ij

ഈ സമത്വം അർത്ഥമാക്കുന്നത് കളിക്കാരിൽ ഒരാളുടെ വിജയിക്കുന്നത് മറ്റൊന്നിന്റെ നഷ്ടത്തിന് തുല്യമാണ്. ഈ സാഹചര്യത്തിൽ, കളിക്കാളിലൊരാളുടെ വിജയികളെ മാത്രം പരിഗണിക്കാൻ പര്യാപ്തമാണ്, ഉദാഹരണത്തിന്, ഒരു കളിക്കാരൻ പക്ഷേ.

ഓരോ ജോഡി തന്ത്രങ്ങളും A i.ഒപ്പം B J.വിജയിക്കുന്നതിനോട് യോജിക്കുന്നു ഒരു ij.കളിക്കാരി പക്ഷേ.ഈ വിജയങ്ങളെല്ലാം തന്നെ വിളിക്കപ്പെടുന്ന രൂപത്തിൽ അവതരിപ്പിക്കുന്നു പേയ്മെന്റ് മാട്രിക്സ്

ഈ മാട്രിക്സിന്റെ വരികൾ പ്ലെയർ തന്ത്രങ്ങൾ സന്ദർശിക്കുന്നു പക്ഷേ,നിരകൾ - പ്ലേയർ തന്ത്രങ്ങൾ ൽ.പൊതുവേ, ഈ ഗെയിമിനെ വിളിക്കുന്നു (M × n) -game.


ഉദാഹരണം 1.രണ്ട് കളിക്കാർ പക്ഷേ ഒപ്പം ... ഇല്ഒരു നാണയം എറിയുക. നാണയത്തിന്റെ വശം യോജിക്കുന്നുവെങ്കിൽ, വിജയിക്കും പക്ഷേ. കളിക്കാരി ... ഇല്പെയർ ചെയ്യുന്നു. പക്ഷേ1 ന് തുല്യമായ കുറച്ച് തുക, അവർ പൊരുത്തപ്പെടുന്നില്ലെങ്കിൽ, കളിക്കാരൻ വിജയിക്കുന്നു, അതായത് നേരെമറിച്ച്, കളിക്കാരൻ പക്ഷേപെയർ ചെയ്യുന്നു. ... ഇല്അതേ തുക , തുലമായ 1. ഒരു പേയ്മെന്റ് മാട്രിക്സ് രൂപീകരിക്കുന്നതിന്.

തീരുമാനം.ചുമതലയുടെ അവസ്ഥയിൽ

വൃത്തിയുള്ള തന്ത്രം കളിക്കാരൻ ഞാൻ വിജയിച്ച മാന്നിക്സിന്റെ മാട്രിക്സിന്റെ ഒരു വരികളിലൊന്നാണ്, കൂടാതെ ശുദ്ധമായ കളിക്കാരൻ II തന്ത്രം ഒരേ മാട്രിക്സിന്റെ നിരകളിലൊന്നാണ്.

പ്ലേയറുകളുടെ ഒപ്റ്റിമൽ നെറ്റ് തന്ത്രങ്ങൾ നിർബന്ധിത യൂണിറ്റ് പി I \u003d 1, q i \u003d 1 ന്റെ സമ്മിശ്ര സാന്നിധ്യത്തിൽ നിന്ന് വ്യത്യാസപ്പെട്ടിരിക്കുന്നു: p (1.0), q (1.0). ഇവിടെ p 1 \u003d 1, Q 1 \u003d 1.

ടാസ്ക് 1.
പേയ്മെന്റ് മാട്രിക്സ് പ്രകാരം, കർശനമായ ആധിപത്യത്തിന്റെ തത്വം ഉപയോഗിച്ച് ഒപ്റ്റിമൽ ക്ലീൻ തന്ത്രങ്ങൾ കണ്ടെത്തുക. ബേൺ വെക്റ്ററുകളുടെ പ്രതികരണമായി p *, q *.



R1

R2.

R3

R4.

എസ് 1.

3

1

2

5

എസ് 2.

2

0

0

3

എസ് 3.

-3

-5

-5

-2

എസ് 4.

0

-2

-2

1

തീരുമാനം:

ഒരു കാൽക്കുലേറ്റർ മാട്രിക്സ് ഗെയിം ഉപയോഗിച്ച് എല്ലാ ജോലികളും പരിഹരിക്കുന്നു.

കളിക്കാരൻ അതിന്റെ പരമാവധി വിജയിക്കാൻ നിങ്ങൾ തിരഞ്ഞെടുക്കുന്നുവെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു, പ്ലെയർ II കളിക്കാരന്റെ നേട്ടങ്ങൾ കുറയ്ക്കുന്നതിനുള്ള തന്ത്രം തിരഞ്ഞെടുക്കുന്നു.

കളിക്കാർB 1.B 2.B 3.B 4.a \u003d മിനിറ്റ് (ഒരു i)
ഒരു 1.3 1 2 5 1
ഒരു 2.2 0 0 3 0
ഒരു 3.-3 -5 -5 -2 -5
ഒരു 4.0 -2 -2 1 -2
b \u003d max (b i)3 1 2 5
ഗെയിമിന്റെ ചുവടെയുള്ള ഒരു ഗ്യാരണ്ടീഡ് ഒരു ഗ്യാരണ്ടീഡ് നേട്ടം എ \u003d മാക്സ് (എ ഐ) \u003d 1 ഉപയോഗിച്ച് നിർവചിച്ചിരിക്കുന്നു, ഇത് പരമാവധി ശുദ്ധമായ തന്ത്രത്തെ സൂചിപ്പിക്കുന്നു.
മികച്ച വില ഗെയിം b \u003d മിനിറ്റ് (B j J) \u003d 1.
രണ്ട് ഇതരമാർഗങ്ങൾക്കുള്ള ഒരു പരിഹാരത്തെ സൂചിപ്പിക്കുന്നു (എ 1, ബി 2) ഒരു പരിഹാരത്തെ സൂചിപ്പിക്കുന്നു. കളിയുടെ വില 1 ന് തുല്യമാണ്.
2. പ്രബലമായ വരികളിലും പ്രബലമായ നിരകളിലും ഞങ്ങൾ പേയ്മെന്റ് മാട്രിക്സ് പരിശോധിക്കുന്നു.
ചില സമയങ്ങളിൽ കളിയുടെ മാട്രിക്സ് ലളിതമായ പരിഗണനയുടെ അടിസ്ഥാനത്തിൽ, ചില നെറ്റ് തന്ത്രങ്ങൾക്ക് ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിന് സീറോ പ്രോബബിലിറ്റിയിൽ മാത്രം നൽകാൻ കഴിയും.
അവർ അത് പറയുന്നു i-ya ഒന്നാം കളിക്കാരൻ തന്ത്രം അദ്ദേഹത്തിന് ആധിപത്യം പുലർത്തുന്നു k-y. എല്ലാവർക്കുമായി ഒരു kj ആണെങ്കിൽ തന്ത്രം j e n. കുറഞ്ഞത് ഒന്നിന് ജെ. ഒരു IJ\u003e ഒരു കെജെ. ഈ സാഹചര്യത്തിൽ, അവർ അത് പറയുന്നു i-ya തന്ത്രം (അല്ലെങ്കിൽ സ്ട്രിംഗ്) - ആധിപത്യം, കെ-യാ - ആധിപത്യം.
അവർ അത് പറയുന്നു ജെ-ജെ. രണ്ടാമത്തെ കളിക്കാരന്റെ തന്ത്രം അദ്ദേഹത്തിന് ആധിപത്യം പുലർത്തുന്നു എൽ-യു എല്ലാവർക്കുമായി തന്ത്രം ജെ ഇ എം. ഒരു ij al al al al at i a ij< a il . В этом случае ജെ-യു തന്ത്രം (നിര) ആധിപത്യം എന്ന് വിളിക്കുന്നു, എൽ-യു - ആധിപത്യം.
ഒരു തന്ത്രം ഒരു 2 (സ്ട്രിംഗ് 1 ന്റെ എല്ലാ ഘടകങ്ങളും രണ്ടാം വരിയുടെ മൂല്യങ്ങളേക്കാൾ വലുതോ തുല്യമോ ആയ തന്ത്രമാണ് (അതിനാൽ ഞങ്ങൾ മാട്രിക്സിന്റെ രണ്ടാം സ്ട്രിംഗ് ഒഴിവാക്കുന്നു. PE 2 \u003d 0.
തന്ത്രം ഒരു 1 തന്ത്രത്തിന് ആധിപത്യം പുലർത്തുന്നു (സ്ട്രിംഗ് 1 ന്റെ എല്ലാ ഘടകങ്ങളും മൂന്നാം സ്ട്രിംഗിന്റെ മൂല്യത്തേക്കാൾ വലുതോ തുല്യമോ ആണ്), അതിനാൽ ഞങ്ങൾ മാട്രിക്സിന്റെ മൂന്നാം സ്ട്രിംഗ് ഒഴിവാക്കുന്നു. P 3 \u003d 0.
3 1 2 5
0 -2 -2 1

സ്ട്രാറ്റജി ബി 1 ലെ കളിക്കാരന്റെ നഷ്ടത്തിന്റെ സ്ഥാനത്ത് നിന്ന് സ്ട്രാറ്റജി ബി 2 (നിര 1 ന്റെ എല്ലാ ഘടകങ്ങളും കൂടുതൽ ഘടകങ്ങൾ നിര 2) അതിനാൽ, മാട്രിക്സിന്റെ ആദ്യ നിര ഞങ്ങൾ ഒഴിവാക്കുന്നു. Q 1 \u003d 0 എന്ന പ്രോബബിലിറ്റി.
അതിനാൽ, കളിക്കാരന്റെ നഷ്ടത്തിന്റെ സ്ഥാനത്ത് നിന്ന്, സ്ട്രാറ്റജി ബി 4 (നിര 4 ഘടകങ്ങളുടെ 4 മേലറുകളുടെ എല്ലാ ഘടകങ്ങളും ആധിപത്യം പുലർത്തുന്നു), അതിനാൽ, നിരയുടെ നാലാമത്തെ ഘടകങ്ങൾ. Q 4 \u003d 0 എന്ന പ്രോബബിലിറ്റി.
1 2
-2 -2

ഞാൻ ഗെയിം 4 x 4 ഗെയിം 2 x 2 ലേക്ക് മൂടി.



ഗെയിമിന്റെ പരിഹാരം ( 2 x n.


p 1 \u003d 1
p 2 \u003d 0
വില ഗെയിം, y \u003d 1
ഇപ്പോൾ നിങ്ങൾക്ക് ഒരു കളിക്കാരന്റെ മിനിമാക്സ് തന്ത്രം കണ്ടെത്താൻ കഴിയും, അനുബന്ധ സംവിധാനം എഴുതുന്നു
q 1 \u003d 1
q 1 + Q 2 \u003d 1
ഈ സിസ്റ്റം പരിഹരിക്കുന്ന ഞങ്ങൾ കണ്ടെത്തുന്നു:
q 1 \u003d 1.
ഉത്തരം:
ഗെയിം വില: Y \u003d 1, പ്ലെയർ സ്ട്രാറ്റജി വെക്ടറുകൾ:
ചോദ്യം (1, 0), പി (1, 0)

Σa ij q j ≤ v
Σa Ij p i ≥ v
M (p 1; q) \u003d (1 1) + (2 0) \u003d 1 \u003d v
M (p 2; q) \u003d (-2 1) + (-2 0) \u003d -2 ≤ v
M (p; q 1) \u003d (1 1) + (-2 0) \u003d 1 \u003d v
M (p; q 2) \u003d (2 1) + (-2 0) \u003d 2 ≥ v

വരികളും നിരകളും യഥാർത്ഥ മാട്രിക്സിൽ നിന്ന് നീക്കംചെയ്തതിനാൽ, കണ്ടെത്തിയ പ്രോബബിലിറ്റി വെക്റ്ററുകൾ ഇതായി എഴുതാം:
പി (1,0,0,0)
Q (0,1,0,0)

ടാസ്ക് 2.
ഗെയിമിന്റെ ചുവടെയും മുകളിലെ വിലയും കണ്ടെത്താൻ പേയ്മെന്റ് മാട്രിക്സിനെക്കുറിച്ച്. ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടെങ്കിൽ, ഒപ്റ്റിമൽ ക്ലീൻ തന്ത്രങ്ങളുടെ വെക്റ്ററുകൾ p *, q * എന്ന് എഴുതുക.



R1

R2.

R3

എസ് 1.

-6

-5

0

എസ് 2.

-8

-3

-2

എസ് 3.

-3

-2

3

തീരുമാനം:
1. പേയ്മെന്റ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റുണ്ടോ എന്ന് ഞങ്ങൾ പരിശോധിക്കുന്നു. അങ്ങനെയാണെങ്കിൽ, ഞങ്ങൾ കളിയുടെ പരിഹാരം ശുദ്ധമായ തന്ത്രങ്ങളിൽ എഴുതുന്നു.
കളിക്കാർB 1.B 2.B 3.a \u003d മിനിറ്റ് (ഒരു i)
ഒരു 1.-6 -5 0 -6
ഒരു 2.-8 -3 -2 -8
ഒരു 3.-3 -2 3 -3
b \u003d max (b i)-3 -2 3

ഒരു ഗ്യാരണ്ടീഡ് നേട്ടം ഞങ്ങൾ കണ്ടെത്തുന്നു, ഗെയിമിന്റെ ചുവടെയുള്ള വില നിർവചിച്ചിരിക്കുന്നു a \u003d പരമാവധി (എ ഐ) \u003d -3, ഇത് പരമാവധി ശുദ്ധമായ തന്ത്രം സൂചിപ്പിക്കുന്നു.
മികച്ച വില ഗെയിം b \u003d മിനിറ്റ് (B J) \u003d -3.
രണ്ട് ബദലുകൾ (എ 3, ബി 1) സാഡിൽ പോയിന്റ് (3, 1) ഒരു പരിഹാരം സൂചിപ്പിക്കുന്നു. ഗെയിമിന്റെ വില -3 ആണ്.
ഉത്തരം: പി (0,0,1), q (1,0,0)

ടാസ്ക് 3.
പേയ്മെന്റ് മാട്രിക്സിൽ, ഒപ്റ്റിമൽ തന്ത്രങ്ങളുടെ വെക്ടർമാരുടെ വെക്ടറുകൾ നിങ്ങൾ കണ്ടെത്തുന്നു P *, Q *, ഗെയിമിന്റെ വില എന്നിവ നിങ്ങൾ കണ്ടെത്തുന്നു. ഏത് കളിക്കാർ വിജയിക്കുന്നു?



R1

R2.

R3

R4.

എസ് 1.

-6

-6

2

4

എസ് 2.

2

-2

7

-1

തീരുമാനം:
1. പേയ്മെന്റ് മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റുണ്ടോ എന്ന് ഞങ്ങൾ പരിശോധിക്കുന്നു. അങ്ങനെയാണെങ്കിൽ, ഞങ്ങൾ കളിയുടെ പരിഹാരം ശുദ്ധമായ തന്ത്രങ്ങളിൽ എഴുതുന്നു.
കളിക്കാരൻ അതിന്റെ പരമാവധി വിജയിക്കാൻ നിങ്ങൾ തിരഞ്ഞെടുക്കുന്നുവെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു, പ്ലെയർ II കളിക്കാരന്റെ നേട്ടങ്ങൾ കുറയ്ക്കുന്നതിനുള്ള തന്ത്രം തിരഞ്ഞെടുക്കുന്നു.
കളിക്കാർB 1.B 2.B 3.B 4.a \u003d മിനിറ്റ് (ഒരു i)
ഒരു 1.-6 -6 2 4 -6
ഒരു 2.2 -2 7 -1 -2
b \u003d max (b i)2 -2 7 4

ഗെയിമിന്റെ ചുവടെയുള്ള (എ ഐ) \u003d -2 എന്ന ഗെയിമിന്റെ ചുവടെയുള്ള ഒരു വിജയകരമായ വിജയങ്ങൾ ഞങ്ങൾ കണ്ടെത്തുന്നു. ഒരു 2 പരമാവധി സ്ട്രാറ്റജിയെ സൂചിപ്പിക്കുന്നു.
ഗെയിം ബി \u003d മിനിറ്റ് (ബി J) \u003d -2 ന്റെ മുൻനിര വില.
രണ്ട് ബദലുകൾ (a2, b2) സാഡിൽ പോയിന്റ് (2, 2) ഒരു പരിഹാരത്തെ സൂചിപ്പിക്കുന്നു. ഗെയിമിന്റെ വില -2 ആണ്.
3. സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക.
ഇനിപ്പറയുന്ന ഘട്ടങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു ജ്യാമിതീയ രീതിയുടെ ചുമതല ഞങ്ങൾ പരിഹരിക്കും:
1. അബ്സിസ്സ അച്ചുതണ്ടിനൊപ്പം കാർട്ടീഷ്യൻ കോർഡിനേറ്റ് സിസ്റ്റത്തിൽ, ഒരു സെഗ്മെന്റ് മാറ്റിവച്ചു, അതിന്റെ നീളം 1. സെഗ്മെന്റിന്റെ ഇടത് അറ്റത്ത് (പോയിന്റ് x \u003d 0) (പോയിന്റ് x \u003d 0), വലത് - തന്ത്രം a 2 (x \u003d 1). ഇന്റർമീഡിയറ്റ് പോയിൻറ് എക്സ് 1 \u003d (പേജ് 1, പി 2) എന്ന ചില സമ്മിശ്ര തന്ത്രങ്ങളുടെ സാധ്യതകളുമായി യോജിക്കുന്നു.
2. നിഡിറ്ററിന്റെ ഇടതുവശത്ത്, തന്ത്രത്തിന്റെ വിജയങ്ങൾ മാറ്റിവച്ചു. നിശ്ചയദാർത്തിയുടെ അക്ഷത്തിന് സമാന്തരമായി, തന്ത്രത്തിന്റെ വിജയങ്ങൾ പോയിന്റ് 1 ൽ നിന്ന് മാറ്റിവയ്ക്കുന്നു.
ഗെയിമിന്റെ പരിഹാരം ( 2 x n.) പരമാവധി തന്ത്രം ഉള്ള കളിക്കാരന്റെ സ്ഥാനത്ത് നിന്ന് നടത്തുക. ഏതെങ്കിലും കളിക്കാർക്ക് മേലങ്കി, തനിപ്പകർപ്പ് തന്ത്രങ്ങളൊന്നുമില്ല.

മാക്സിമൈൻ ഒപ്റ്റിമൽ കളിക്കാരന്റെ തന്ത്രം ഒരു തരം സമവാക്യങ്ങളുടെ സിസ്റ്റം എഴുതാൻ കഴിയുന്ന പോയിന്റുമായി യോജിക്കുന്നു:
പി 1 \u003d 0
p 2 \u003d 1
ഗെയിം വില, y \u003d -2
ആർക്കാർ ബി 1, ബി 3, ബി 4 എന്നിവരെ ഒഴിവാക്കിക്കൊണ്ട് പ്രസക്തമായ സമവാക്യങ്ങൾ എഴുതി, അത് ആർക്കാണ് കൂടുതൽ വലിയ നഷ്ടം നൽകുന്ന സ്ട്രാറ്റജി ബി 3, ബി 4, q, അതിനാൽ, q 1 \u003d 0, q 3 \u003d 0, Q 4 \u003d 0.
-2Q 2 \u003d -2
q 2 \u003d 1
ഈ സിസ്റ്റം പരിഹരിക്കുന്ന ഞങ്ങൾ കണ്ടെത്തുന്നു:
q 2 \u003d 1.
ഉത്തരം:
ഗെയിം വില: y \u003d -2, പ്ലെയർ സ്ട്രാറ്റജി വെക്ടറുകൾ:
Q (0, 1, 0, 0), p (0, 1)
4. സ്ട്രാറ്റജി ഒപ്റ്റിമലിറ്റി മാനദണ്ഡത്തിന്റെ സഹായത്തോടെ ഗെയിമിന്റെ കൃത്യത പരിശോധിക്കുക.
Σa ij q j ≤ v
Σa Ij p i ≥ v
എം (പി 1; q) \u003d (-6 0) + (-6 1) + (2 0) + (4 0) \u003d -6 ≤ v
M (p 2; q) \u003d (2 0) + (-2 1) + (7 0) + (-1 0) \u003d -2 \u003d v
M (p; q 1) \u003d (-6 0) + (2 1) \u003d 2 ≥ v
M (p; q 2) \u003d (-6 0) + (-2 1) \u003d -2 \u003d v
എം (പി; Q 3) \u003d (2 0) + (7 1) \u003d 7 ≥ v
എം (പി; Q 4) \u003d (4 0) + (-1 1) \u003d -1 ≥ v
അതിനാൽ എല്ലാ അസമത്വങ്ങളും സമത്വം അല്ലെങ്കിൽ കർശനമായ അസമത്വങ്ങളായി നടത്തുന്നു, അതിനാൽ, ഗെയിമിന്റെ പരിഹാരം ശരിയാണ്.

ടാസ്ക് 4.
ചോദ്യത്തിന് വിശദമായ ഉത്തരം നൽകുക

ഞാൻ ഫിസിക്കോ-സാങ്കേതിക ഫാക്കൽറ്റി പൂർത്തിയാക്കിയെങ്കിലും, സർവകലാശാലയിലെ ഗെയിമുകൾ ഞാൻ വായിച്ചിട്ടില്ല. ഞാൻ ഉള്ളതിനാൽ വിദ്യാർത്ഥികൾ ഞാൻ ആദ്യം ഒരുപാട് മുൻഗണനയിൽ കളിച്ചു, തുടർന്ന് പാലത്തിൽ, ഗെയിമുകൾ സിദ്ധാന്തത്തിൽ എനിക്ക് താൽപ്പര്യമുണ്ടായിരുന്നു, ഞാൻ ഒരു ചെറിയ ട്യൂട്ടോറിയൽ മാസ്റ്റേഴ്സ് ചെയ്തു. ഗെയിമുകൾ സിദ്ധാന്തത്തിന്റെ ചുമതല പരിഹരിക്കാൻ അടുത്തിടെ സൈറ്റ് മിഖായേറ്റ്. എനിക്ക് ആവശ്യമില്ലെന്ന് എനിക്ക് മനസ്സിലായി, ഗെയിമുകളുടെ സിദ്ധാന്തത്തെക്കുറിച്ച് എന്റെ അറിവ് പുതുക്കാൻ ഞാൻ തീരുമാനിച്ചു. ഞാൻ നിങ്ങൾക്ക് ഒരു ചെറിയ പുസ്തകം വാഗ്ദാനം ചെയ്യുന്നു - ഗെയിം സിദ്ധാന്തത്തിന്റെ ഘടകങ്ങളുടെ പ്രസ്താവനയും മാട്രിക്സ് ഗെയിമുകളുടെ ചില വഴികളും. ഇതിന് മിക്കവാറും തെളിവുകൾ അടങ്ങിയിട്ടില്ല, ഉദാഹരണങ്ങളുടെ സിദ്ധാന്തത്തിന്റെ പ്രധാന വ്യവസ്ഥകൾ വ്യക്തമാക്കുന്നു. പുസ്തകം ഒരു ഗണിതശാസ്ത്രജ്ഞനും പ്രചാരകനായ എലീന സെർജെവ്ന വെന്റിസലും എഴുതി. സോവിയറ്റ് എഞ്ചിനീയർമാരുടെ എണ്ണം അതിന്റെ പാഠപുസ്തകത്തിൽ "പ്രോബബിലിറ്റി സിദ്ധാന്തത്തിൽ" പഠിച്ചു. ഐ. ഗ്രെക്കോവ് എന്ന പെൻസെറിന് കീഴിൽ നിരവധി സാഹിത്യകൃതികൾ എലീന സെർഗെവ്ന എഴുതി.

എലീന വെൻസെൽ. ഗെയിം സിദ്ധാന്തത്തിന്റെ ഘടകങ്ങൾ. - m.: ഫിസ്മാറ്റ്ഗിസ്, 1961. - 68 പേ.

ഡൗൺലോഡ് ഹ്രസ്വ അമൂർത്തത ഫോർമാറ്റിൽ അല്ലെങ്കിൽ

§ 1. ഗെയിം സിദ്ധാന്തത്തിന്റെ വിഷയം. അടിസ്ഥാനസങ്കല്പം

നിരവധി പ്രായോഗിക ജോലികൾ പരിഹരിക്കുമ്പോൾ (സാമ്പത്തിക ശാസ്ത്രത്തിൽ, സൈനിക കേസ് മുതലായവ), എതിർവശത്ത് രണ്ട് (അല്ലെങ്കിൽ കൂടുതൽ വാറവൽ പാർട്ടികൾ) ഉള്ള സാഹചര്യം വിശകലനം ചെയ്യേണ്ടത് ആവശ്യമാണ്, കൂടാതെ എതിർ ലക്ഷ്യങ്ങൾക്കും ഒരു കക്ഷികളിലൊരാൾ പ്രവർത്തനത്തിന്റെ ചിത്രം ഒരു എതിരാളിയെ തിരഞ്ഞെടുക്കുന്നതിനെ ആശ്രയിച്ചിരിക്കുന്നു. "സംഘർഷ സാഹചര്യങ്ങൾ" എന്നതിലേക്ക് അത്തരം സാഹചര്യങ്ങളെ ഞങ്ങൾ വിളിക്കും.

സംഘട്ടന സാഹചര്യങ്ങളുടെ നിരവധി ഉദാഹരണങ്ങൾ വിവിധ പരിശീലകരിൽ നിന്ന് കൊണ്ടുവരാൻ കഴിയും. ശത്രുതയിൽ ഉണ്ടാകുന്ന ഏതെങ്കിലും സാഹചര്യം സംഘർഷ സാഹചര്യങ്ങളിൽ പെടുന്നു: ഓരോ പോരാട്ട കക്ഷികളും ശത്രു വിജയം നേടുന്നത് തടയാൻ ഓരോ പോരാട്ട കക്ഷികളും എല്ലാ നടപടികളും എടുക്കുന്നു. വൈരുദ്ധ്യം ലഭിക്കുന്നത് ആയുധ സമ്പ്രദായം തിരഞ്ഞെടുക്കുന്നതിൽ നിന്ന് ഉണ്ടാകാത്ത സാഹചര്യങ്ങളും പൊതുവെയുള്ള സൈനിക പ്രവർത്തനങ്ങൾ ആസൂത്രണം ചെയ്യുമ്പോൾ, ഈ പ്രദേശത്തെ ഓരോ പരിഹാരങ്ങളും ശത്രുവിന്റെ ഏറ്റവും ഗുണം ചെയ്യുന്ന പ്രവർത്തനങ്ങളെ കണക്കാക്കണം. സാമ്പത്തിക ശാസ്ത്ര മേഖലയിലെ നിരവധി സാഹചര്യങ്ങൾ (പ്രത്യേകിച്ച് സൗത്ത് മത്സരത്തിന്റെ സാന്നിധ്യത്തിൽ) സംഘടിത സാഹചര്യങ്ങളിൽ ഉൾപ്പെടുന്നു; ട്രേഡിംഗ് സ്ഥാപനങ്ങൾ, വ്യാവസായിക സംരംഭങ്ങൾ മുതലായവരാണ് കഷ്ട സംഘത്തിന്റെ വേഷത്തിൽ.

അത്തരം സാഹചര്യങ്ങൾ വിശകലനം ചെയ്യേണ്ടതിന്റെ ആവശ്യകത ജീവിതത്തിന് ഒരു പ്രത്യേക ഗണിത ഉപകരണത്തിന് കാരണമായി. ഗെയിമുകളുടെ സിദ്ധാന്തം അടിസ്ഥാനപരമായി ഒരു മാന്യമായ സാഹചര്യങ്ങളെ ഗണിതശാസ്ത്ര സിദ്ധാന്തമല്ലാതെ മറ്റൊന്നുമല്ല. സംഘട്ടന സാഹചര്യത്തിൽ ഓരോ എതിരാളികളുടെയും യുക്തിസഹമായ പ്രവർത്തനത്തെക്കുറിച്ചുള്ള ശുപാർശകളുടെ വികാസമാണ് സിദ്ധാന്തത്തിന്റെ ലക്ഷ്യം. സംഘട്ടന സാഹചര്യത്തിന്റെ പരിശീലനത്തിൽ നിന്ന് നേരിട്ട് എടുത്ത ഓരോന്നും വളരെ സങ്കീർണ്ണമാണ്, അതിന്റെ വിശകലനം നിരവധി മനോഭാവങ്ങളുടെ സാന്നിധ്യത്താൽ തടസ്സപ്പെടുത്തുന്നു. സാഹചര്യത്തെക്കുറിച്ച് സാധ്യമായ ഗണിത വിശകലനം നടത്താൻ, ദ്വിതീയ, ഘടകങ്ങൾ കൊണ്ടുവരിക, ലളിതമായ, formal പചാരിക, formal പചാരിക, formal പചാരിക, ഒരു സാഹചര്യം മോഡൽ നിർമ്മിക്കേണ്ടത് ആവശ്യമാണ്. അത്തരമൊരു മോഡൽ "ഗെയിം" എന്ന് വിളിക്കും.

യഥാർത്ഥ സംഘട്ടന സാഹചര്യത്തിൽ നിന്ന്, അത് വളരെ കൃത്യമായ നിയമങ്ങൾക്കനുസൃതമായി നടത്തിയതാണ് ഗെയിം സവിശേഷത. വാക്കിന്റെ അക്ഷരാർത്ഥത്തിൽ ഗെയിമുകൾ ഉള്ള അത്തരം formal പചാരിക സംഘടനങ്ങൾ മനുഷ്യരാശി വളരെക്കാലമായി ഉപയോഗിക്കുന്നു. ഉദാഹരണങ്ങൾക്ക് ചെസ്സ്, ചെക്കേഴ്സ്, കാർഡ് ഗെയിമുകൾ മുതലായവ നൽകാൻ കഴിയും. ഈ ഗെയിമുകളെല്ലാം ഒരു പ്രത്യേക കളിക്കാരന്റെ അറിയപ്പെടുന്ന നിയമങ്ങൾക്കും അവസാനിക്കുന്ന "വിജയത്തിനും അനുസരിച്ച് ഒഴുകുന്ന മത്സരത്തിന്റെ സ്വഭാവമാണ്.

അത്തരം formal ദ്യോഗികമായി നിയന്ത്രിത, കൃത്രിമമായി സംഘടിത ഗെയിമുകൾ ഏറ്റവും കൂടുതൽ അനുയോജ്യമായ മെറ്റീരിയൽ ഗെയിം സിദ്ധാന്തത്തിന്റെ അടിസ്ഥാന ആശയങ്ങൾ വ്യക്തമാക്കാനും മാസ്റ്റുമാനും. ടെർമിനോളജി, അത്തരം ഗെയിമുകൾ പ്രയോഗത്തിൽ നിന്ന് ബാധകമാണ്, മറ്റ് സംഘട്ടന സാഹചര്യങ്ങൾ വിശകലനം ചെയ്യുമ്പോൾ, അവയിൽ ഉൾപ്പെട്ട കക്ഷികൾ സോളിതർ "എന്ന് വിളിക്കുന്നു, മറിച്ച്" വിജയിച്ച "ഇത്" വിജയിക്കുന്നു "എന്നതാണ്.

ഗെയിം രണ്ടോ അതിലധികമോ എതിരാളികളെ അഭിമുഖീകരിച്ചേക്കാം; ആദ്യ കേസിൽ, ഗെയിമിനെ "ജോഡി", "ഒന്നിലധികം" എന്ന് വിളിക്കുന്നു. ഒന്നിലധികം ഗെയിം പങ്കാളികൾ കോഴ്സിൽ സഖ്യങ്ങൾ സൃഷ്ടിച്ചേക്കാം - ശാശ്വതമോ താൽക്കാലികമോ. രണ്ട് സ്ഥിരമായ സഖ്യങ്ങളുണ്ടെങ്കിൽ, ഒന്നിലധികം ഗെയിം ജോഡിയിലേക്ക് ആകർഷിക്കുന്നു. ജോടിയാക്കിയ ഗെയിമുകളാണ് ഏറ്റവും പ്രായോഗികമായ പ്രാധാന്യം; അത്തരം ഗെയിമുകൾ മാത്രം പരിഗണിക്കുന്നതിനായി ഇവിടെ ഞങ്ങൾ സ്വയം പരിമിതപ്പെടുത്തും.

ചില അടിസ്ഥാന ആശയങ്ങളുടെ വാക്കിലുള്ള ഗെയിമുകളുടെ പ്രാഥമിക സിദ്ധാന്തത്തിന്റെ അവതരണം നമുക്ക് ആരംഭിക്കാം. ജോടിയാക്കിയ ഗെയിമിലെ രണ്ട് കളിക്കാർ a, b എതിർ താൽപ്പര്യങ്ങളുള്ള ബി എന്നിവ ഉൾപ്പെടുന്നു. "ഗെയിമിന് കീഴിൽ" പാർട്ടികളുടെ നിരവധി പ്രവർത്തനങ്ങൾ ഉൾക്കൊള്ളുന്ന ഇവന്റ് ഞങ്ങൾ മനസ്സിലാക്കും, ഗെയിം ഗണിതശാസ്ത്ര വിശകലനത്തിന് വിധേയമാകുന്നതിന്, ഗെയിമിന്റെ നിയമങ്ങൾ കൃത്യമായി രൂപീകരിക്കേണ്ടതാണ്. രണ്ട് പാർട്ടികളുടെയും "ഗെയിമിന്റെ നിയമങ്ങൾക്ക് കീഴിലുള്ള ഒരു വ്യവസ്ഥകളുടെ ഒരു വ്യവസ്ഥയാണ്, മറ്റൊരാളുടെ പെരുമാറ്റത്തിന്റെ ഓരോ വശത്തെയും കുറിച്ചുള്ള വിവരങ്ങളുടെ ഒരു സംവിധാനമുണ്ട്," നീക്കങ്ങൾ "ഇതരമാർഗ്ഗം" (വ്യക്തിഗത തീരുമാനങ്ങൾ) ഗെയിം പ്രക്രിയയിൽ), അതുപോലെ തന്നെ, ഇത് അതിന്റെ ഫലമോ ഫലമോ ഇതിലേക്ക് ഒരു കൂട്ടം നീക്കങ്ങൾ. ഈ ഫലം (വിജയമോ നഷ്ടമോ) എല്ലായ്പ്പോഴും ഒരു ക്വാണ്ടിറ്റേറ്റീവ് എക്സ്പ്രഷൻ ഇല്ല, പക്ഷേ സാധാരണയായി നിങ്ങൾക്ക് കുറച്ച് അളവെടുക്കൽ സ്കെയിൽ സജ്ജമാക്കുക, അത് പ്രകടിപ്പിക്കുക, അത് പ്രകടിപ്പിക്കുക ഒരു നിശ്ചിത സംഖ്യ. ഉദാഹരണത്തിന്, ഒരു ചെസ്സ് ഗെയിമിൽ വിജയിക്കുന്നത് +1, നഷ്ടം -1, ഡ്രോ 0 എന്നിവയ്ക്ക് കാരണമാകും.

ഒരു കളിക്കാരൻ ഒരു കളിക്കാരൻ വിജയിച്ചാൽ ഗെയിമിനെ ഗെയിം എന്ന് വിളിക്കുന്നു, മറ്റൊന്ന് നഷ്ടപ്പെടുന്നത്, അതായത്. ഇരുവശത്തും വിജയികളുടെ ആകെത്തുക പൂജ്യമാണ്. പൂജ്യ തുകയിൽ, കളിക്കാരുടെ താൽപ്പര്യങ്ങൾ നേരിട്ട് എതിർവശത്താണ്. അത്തരം ഗെയിമുകൾ മാത്രമേ ഇവിടെ പരിഗണിക്കുകയുള്ളൂ.

കളിയിൽ ഒരു പൂജ്യമായ ആകെത്തുകയുള്ള ഒരു കളിക്കാരുടെ ആകെത്തുകയുള്ളതിനാൽ മറ്റൊന്നിന് തുല്യമാണ് വിപരീത പരിചിത, വ്യക്തമായും, അത്തരമൊരു ഗെയിം വിശകലനം ചെയ്യുമ്പോൾ, കളിക്കാരിലൊരാൾ നേടിയത് നിങ്ങൾക്ക് പരിഗണിക്കാം. ഉദാഹരണത്തിന്, അത് എ. ഉദാഹരണത്തിന്, എ. ഭാവിയിൽ, ഞങ്ങൾ വശത്തിന്റെ സ for കര്യത്തിനുവേണ്ടിയാണ്, ഞങ്ങൾ പരമ്പരാഗതവും "ഞങ്ങൾ", എതിരാളിയിലെ "ഞങ്ങൾ" വിളിക്കും.

അതേസമയം, എപ്പോഴും ഒരു ("ഞങ്ങൾ") എല്ലായ്പ്പോഴും "വിജയിക്കുക" എന്ന നിലയിലും ("എതിരാളി") "നഷ്ടപ്പെടുന്നു" എന്ന് വിളിക്കും. ഈ formal പചാരിക അവസ്ഥ, ആദ്യത്തെ കളിക്കാരന്റെ യഥാർത്ഥ ഒരു നേട്ടവും അർത്ഥമാക്കുന്നില്ല; വിൻ ചിഹ്നം വിപരീതമായി മാറ്റിയാൽ വിപരീതമായി മാറ്റിസ്ഥാപിക്കുന്നത് കാണാൻ എളുപ്പമാണ്.

ഗെയിമിന്റെ വികസനം തുടർച്ചയായ നിരവധി ഘട്ടങ്ങൾ ഉൾക്കൊള്ളുന്ന അല്ലെങ്കിൽ "നീക്കങ്ങൾ" ഉൾക്കൊള്ളുന്നു. ഗെയിമുകൾ സിദ്ധാന്തത്തിലെ നീക്കം എന്ന് വിളിക്കുന്നു ഓപ്ഷനുകളുടെ നിയമങ്ങൾ നൽകുന്ന ഒരു ഓപ്ഷനെ തിരഞ്ഞെടുക്കുന്നു. നീക്കങ്ങൾ വ്യക്തിപരവും ക്രമരഹിതവുമായി തിരിച്ചിരിക്കുന്നു. ഒരു വ്യക്തിഗത നീക്കം ബോധപൂർവമായ ചോയ്സ് എന്ന് വിളിക്കുന്നു ഈ സാഹചര്യത്തിൽ സാധ്യമായ ഒരു നീക്കങ്ങളിലൊന്നിലൊന്ന് ഇത് നടപ്പിലാക്കുന്നു. ഒരു വ്യക്തിഗത നീക്കത്തിന്റെ ഉദാഹരണം - ഒരു ചെസ്സ് ഗെയിമിലെ ഏതെങ്കിലും നീക്കങ്ങൾ. മറ്റൊരു നീക്കം നടത്തുന്നത് ബോർഡിലെ കണക്കുകളുടെ ഈ സ്ഥലത്ത് സാധ്യമായ ഓപ്ഷനുകളിൽ ഒരാളെക്കുറിച്ച് ഒരു ബോധപൂർവകമായ ഒരു തിരഞ്ഞെടുപ്പാണ്. ഓരോ വ്യക്തിഗത പുരോഗതിക്കും സാധ്യമായ ഓപ്ഷനുകൾ ഗെയിമിന്റെ നിയമങ്ങളാൽ നിയന്ത്രിക്കുകയും രണ്ട് പാർട്ടികളുടെയും മുമ്പത്തെ നീക്കങ്ങളുടെ മുഴുവൻ മൊത്തത്തെയും ആശ്രയിക്കുകയും ചെയ്യുന്നു.

ക്രമരഹിതമായ പുരോഗതിക്ക് നിരവധി അവസരങ്ങളിൽ നിന്ന് തിരഞ്ഞെടുക്കപ്പെടുന്നു, പക്ഷേ ഒരു കളിക്കാരന്റെ തീരുമാനത്തിനല്ല, ഏതെങ്കിലും റാൻഡം തിരഞ്ഞെടുക്കൽ സംവിധാനത്തിലൂടെ (നാണയങ്ങൾ എറിയുക, അസ്ഥികൾ, തസ്റ്റോവ്ക, മാപ്സ് ഡെലിവറി മുതലായവ). ഉദാഹരണത്തിന്, മുൻഗണനയിലെ കളിക്കാരിൽ ഒരാളുള്ള ആദ്യ കാർഡിന് 32 തുല്യ ഓപ്ഷൻസ് ഓപ്ഷനുകൾ ഉണ്ട്. ഗെയിമിന് ഗണിതശാസ്ത്രപരമായി നിർവചിക്കപ്പെടുന്നതിന്, ഗെയിമിന്റെ നിയമങ്ങൾ ഓരോ ആക്സിഡന്റൽ സ്ട്രോക്കിനും സാധ്യമായ ഫലങ്ങളുടെ വിതരണത്തെ സൂചിപ്പിക്കണം.

ചില ഗെയിമുകൾക്ക് റാൻഡം നീക്കങ്ങൾ (ചെരിപ്പ് എന്ന് വിളിക്കപ്പെടുന്നവ) അല്ലെങ്കിൽ വ്യക്തിപരമായ നീക്കങ്ങളിൽ നിന്ന് മാത്രം (ചെസ്സ്, ചെക്കറുകൾ) മാത്രം അടങ്ങിയിരിക്കാം. ഏറ്റവും അധികമായ ചീട്ടുകളി ഗെയിമുകളുടേതാണ് മിക്സഡ് തരം. ക്രമരഹിതവും വ്യക്തിഗത നീക്കങ്ങളും അടങ്ങിയിരിക്കുന്നു.

ഗെയിമുകൾ (വ്യക്തിഗത, ക്രമരഹിതം) മാത്രമല്ല, സ്വഭാവവും മറ്റൊന്നിന്റെ പ്രവർത്തനങ്ങളും സംബന്ധിച്ച വിവരങ്ങളുടെ അളവും മാത്രമല്ല തരം തിരിച്ചിരിക്കുന്നു. പ്രത്യേക ക്ലാസ് ഗെയിമുകൾ "ഗെയിമുകൾ" എന്ന് വിളിക്കപ്പെടുന്നു വിവരങ്ങൾ പൂർണ്ണമായി" പൂർണ്ണ വിവരങ്ങളുള്ള ഗെയിമിനെ ഓരോ വ്യക്തിക്കും വ്യക്തിപരവും ക്രമരഹിതവുമായ എല്ലാ നീക്കങ്ങളുടെയും ഫലങ്ങൾ അറിയാം. പൂർണ്ണ വിവര ഗെയിമുകളുടെ ഉദാഹരണങ്ങൾ ചെസ്സ്, ചെക്കറുകൾ, ഒപ്പം പ്രശസ്ത ഗെയിം "ക്രോസ്, നോളിക്കി" എന്നിവ നൽകാൻ കഴിയും.

പ്രായോഗിക പ്രാധാന്യമുള്ള മിക്ക ഗെയിമുകളും പൂർണ്ണ വിവരങ്ങളുള്ള ഗെയിമുകളിൽ ഉൾപ്പെടുന്നില്ല, കാരണം ശത്രുവിന്റെ പ്രവർത്തനങ്ങളെക്കുറിച്ചുള്ള അജ്ഞാതം സാധാരണയായി സംഘർഷ സാഹചര്യങ്ങളുടെ ഗണ്യമായ ഘടകമാണ്.

ഗെയിം സിദ്ധാന്തത്തിന്റെ അടിസ്ഥാന ആശയങ്ങൾ "തന്ത്രം" എന്ന ആശയമാണ്. കളിയുടെ പ്രക്രിയയെ ആശ്രയിച്ച് ഈ കളിക്കാരന്റെ ഓരോ വ്യക്തിഗത പുരോഗതിയും നിർണ്ണയിക്കുന്ന ഒരു കൂട്ടം നിയമങ്ങൾ കളിക്കാരനെ വിളിക്കുന്നു. സാധാരണയായി, നിലവിലെ നിർദ്ദിഷ്ട സാഹചര്യത്തെ ആശ്രയിച്ച് ഓരോ വ്യക്തിഗത പുരോഗതിക്കും കളിക്കാരൻ കളിക്കാരൻ എടുക്കുന്നു. എന്നിരുന്നാലും, സൈദ്ധാന്തികമായി മാറുന്നില്ല, ഈ തീരുമാനങ്ങളെല്ലാം കളിക്കാരൻ മുൻകൂട്ടി അംഗീകരിക്കുന്നുവെന്ന് ഞങ്ങൾ കരുതുന്നുവെങ്കിൽ. ഇതിനായി കളിക്കാരൻ കളിയുടെ ഗതിയിൽ സാധ്യമായ എല്ലാ സാഹചര്യങ്ങളുടെയും പട്ടിക തയ്യാറാക്കേണ്ടതുണ്ട്. തത്ത്വത്തിൽ (പ്രായോഗികമായി ഇല്ലെങ്കിൽ) ഏത് ഗെയിമിനും ഇത് സാധ്യമാണ്. അത്തരമൊരു പരിഹാര സംവിധാനം സ്വീകരിച്ചാൽ, കളിക്കാരൻ ഒരു നിർദ്ദിഷ്ട തന്ത്രം തിരഞ്ഞെടുത്തു എന്നാണ് ഇതിനർത്ഥം.

തന്ത്രം തിരഞ്ഞെടുത്ത കളിക്കാരൻ ഇപ്പോൾ വ്യക്തിപരമായി ഗെയിമിൽ പങ്കെടുത്തില്ല, പക്ഷേ അദ്ദേഹത്തിന്റെ പങ്കാളിത്തം മാറ്റിസ്ഥാപിക്കുക എന്ന നിയമങ്ങളുടെ പട്ടികയിലേക്ക് മാറ്റിസ്ഥാപിക്കുക. ഒരു നിർദ്ദിഷ്ട പ്രോഗ്രാമിന്റെ രൂപത്തിൽ ഒരു മെഷീൻ മെഷീനും തന്ത്രം ചോദിച്ചേക്കാം. അതാണ് നിലവിൽ ഇഎംഎം ചെസിൽ കളിച്ചത്. "തന്ത്രം" എന്ന ആശയം അർത്ഥമാക്കുന്നു, വ്യക്തിഗത നീക്കങ്ങളുടെ ഗെയിമിൽ ഉണ്ടായിരിക്കേണ്ടത് ആവശ്യമാണ്; ഒരു ക്രമരഹിതമായ നീക്കങ്ങൾ അടങ്ങിയ ഗെയിമുകളിൽ, തന്ത്രങ്ങളൊന്നുമില്ല.

സാധ്യമായ തന്ത്രങ്ങളുടെ എണ്ണത്തെ ആശ്രയിച്ച്, ഗെയിം "ഫൈനലിലേക്ക്", "അനന്തമായി" എന്നിങ്ങനെ തിരിച്ചിരിക്കുന്നു. ആത്യന്തിക എന്ന് വിളിക്കുന്നു, അവ ഓരോ കളിക്കാരനും പരിമിതമായ എണ്ണം തന്ത്രങ്ങൾ മാത്രമേയുള്ളൂ. കളിക്കാരന്റെ ആത്യന്തിക ഗെയിം എം. തന്ത്രങ്ങളും ഒരു കളിക്കാരനും - n. MXN ഗെയിം എന്ന തന്ത്രങ്ങൾ.

എ, ബി ("ഞങ്ങൾ", "എതിരാളി") എന്നീ രണ്ട് കളിക്കാരുടെ mxn ഗെയിം പരിഗണിക്കുക. ", 2, എം, എം എന്നിവ ശത്രു തന്ത്രത്തിൽ", 2, എം എന്നിവ ഞങ്ങൾ സൂചിപ്പിക്കും b 1, 2, ... ഓരോ വശവും ഒരു നിർദ്ദിഷ്ട തന്ത്രം തിരഞ്ഞെടുത്തു; ഞങ്ങളെ സംബന്ധിച്ചിടത്തോളം ഇത് ഒരു ഞാനും ശത്രുവിന്റെയും ആയിരിക്കും. ഗെയിമിന് വ്യക്തിപരമായ നീക്കങ്ങളിൽ മാത്രം മാത്രം അടങ്ങിയിട്ടുണ്ടെങ്കിൽ, തന്ത്രങ്ങളുടെ തിരഞ്ഞെടുപ്പ് a i, b j എന്നത് ഗെയിമിന്റെ ഫലം അദ്വിതീയമായി നിർണ്ണയിക്കുന്നു - ഞങ്ങളുടെ വിജയം. അവനെയും ഇജെയെയും സൂചിപ്പിക്കുക. ഗെയിമിൽ, വ്യക്തിഗത, ക്രമരഹിതമായ നീക്കങ്ങൾ കൂടാതെ, വിജയിക്കുന്ന ജോഡി തന്ത്രങ്ങൾ a i, b j എന്നിവയെല്ലാം ക്രമരഹിതമായ മൂല്യമാണ്, എല്ലാ ക്രമരഹിതമായ നീക്കങ്ങളുടെയും ഫലങ്ങളെ ആശ്രയിച്ച് ക്രമരഹിതമായ മൂല്യമാണ്. ഈ സാഹചര്യത്തിൽ, പ്രതീക്ഷിച്ച വിജയങ്ങളുടെ സ്വാഭാവിക കണക്ക് അതിന്റെ ശരാശരി മൂല്യമാണ് (ഗണിതശാസ്ത്രപരമായ പ്രതീക്ഷ). വിജയിച്ചതിന്റെ അതേ ചിഹ്നം ഞങ്ങൾ സ്വയം സൂചിപ്പിക്കും (ക്രമരഹിതമായ നീക്കങ്ങളില്ലാതെ) അതിന്റെ ശരാശരി മൂല്യവും (ക്രമരഹിതമായ നീക്കങ്ങളുള്ള ഗെയിമിൽ) ഞങ്ങൾ സൂചിപ്പിക്കും.

ഓരോ ജോഡി തന്ത്രങ്ങളും ഉപയോഗിച്ച് വിജയിക്കുന്ന (അല്ലെങ്കിൽ ശരാശരി വിജയം) ന്റെ ഐജെയുടെ മൂല്യങ്ങൾ ഞങ്ങളെ അറിയിക്കുക. മൂല്യങ്ങൾ ഒരു ചതുരാകൃതിയിലുള്ള പട്ടിക (മാട്രിക്സ്) ആയി എഴുതാം, അതിന്റെ സ്ട്രിംഗുകൾ ഞങ്ങളുടെ തന്ത്രങ്ങൾ (എ ഐ), നിരകൾ - ശത്രു തന്ത്രങ്ങൾ (ബി ജെ) എന്നിവയുമായി യോജിക്കുന്നു. അത്തരമൊരു പട്ടികയെ ഒരു പേയ്മെന്റ് മാട്രിക്സ് അല്ലെങ്കിൽ ഒരു ഗെയിം മാട്രിക്സ് എന്ന് വിളിക്കുന്നു. MXN ഗെയിം മാട്രിക്സ് ചിത്രം അവതരിപ്പിക്കുന്നു. ഒന്ന്.

അത്തിപ്പഴം. 1. മെട്രിക് MXN.

ചുരുക്കത്തിൽ ഞങ്ങൾ ഗെയിമിന്റെ മാട്രിക്സിനെ സൂചിപ്പിക്കും ‖ ij ‖. ഗെയിമുകളുടെ നിരവധി പ്രാഥമിക ഉദാഹരണങ്ങൾ പരിഗണിക്കുക.

ഉദാഹരണം 1. പരസ്പരം നോക്കാതെ രണ്ട് കളിക്കാർ, അകത്ത്, ചിഹ്നം അല്ലെങ്കിൽ വിശാലമായ, അവരുടെ വിവേചനാധികാരത്തിൽ മേശപ്പുറത്ത് വയ്ക്കുക. കളിക്കാർ ഒരേ വശങ്ങളെ തിരഞ്ഞെടുത്തു (രണ്ട് ആയുധങ്ങളിലും തിരക്കിലും), പിന്നെ കളിക്കാരൻ രണ്ട് നാണുകളും എടുക്കുന്നു; അല്ലാത്തപക്ഷം, ഗെയിം വിശകലനം ചെയ്യുന്നതിനും ഇത് ഒരു മാട്രിക്സിനെ ആക്കുന്നതിനും അവരുടെ കളിക്കാരൻ എടുക്കുന്നു. തീരുമാനം. ഗെയിമിൽ രണ്ട് നീക്കങ്ങളിൽ മാത്രമേയുള്ളൂ: ഞങ്ങളുടെ നീക്കവും ശത്രുവിന്റെ നീക്കം വ്യക്തിഗതവും. ഗെയിം പൂർണ്ണ വിവരങ്ങളുള്ള ഗെയിമുകളിൽ ഉൾപ്പെടുന്നില്ല, കാരണം കോഴ്സിന് തന്റെ കളിക്കാരന് എന്താണ് ചെയ്തതെന്ന് അറിയില്ല. ഓരോ കളിക്കാർക്കും ഒരു വ്യക്തിഗത നീക്കം മാത്രമുള്ളതിനാൽ, കളിക്കാരന്റെ തന്ത്രം ഒരേ സമയം ഒരു തിരഞ്ഞെടുപ്പാണ്.

ഞങ്ങൾക്ക് രണ്ട് തന്ത്രങ്ങളുണ്ട്: 1 - ഒരു തീരുമാനം തിരഞ്ഞെടുക്കുന്നതിന് 2 - ഒരു തീരുമാനം തിരഞ്ഞെടുക്കുക; എതിരാളിക്ക് ഒരേ രണ്ട് തന്ത്രങ്ങളും ഉണ്ട്: 1 ൽ - കോട്ട് ആയുധങ്ങളും 2 - തിരക്കുകളും. അതിനാൽ, ഈ ഗെയിം 2 × 2 ഗെയിമാണ്. +1 നായി വിജയിക്കുന്ന നാണയങ്ങൾ ഞങ്ങൾ പരിഗണിക്കും. മാട്രിക്സ് ഗെയിമുകൾ:

ഈ കളിയുടെ ഉദാഹരണത്തിൽ, അത് പ്രാഥമികമല്ലാത്തതുപോലെ, ഗെയിമുകൾ സിദ്ധാന്തത്തിന്റെ ചില അവശ്യ ആശയങ്ങൾ നിങ്ങൾക്ക് മനസിലാക്കാൻ കഴിയും. ഈ ഗെയിം ഒരു തവണ മാത്രമേ നടപ്പിലാക്കിയതെന്ന് കരുതുക. അപ്പോൾ, വ്യക്തമായും, കളിക്കാരുടെ "തന്ത്രങ്ങൾ" എന്നതിനെക്കുറിച്ച് സംസാരിക്കുന്നത് അർത്ഥശൂന്യമാണ്, മറ്റുള്ളവരെക്കാൾ ന്യായമായത്. ഒരേ അടിത്തറയുള്ള കളിക്കാർക്കും ഒരു പരിഹാരം എടുക്കും. എന്നിരുന്നാലും, ഗെയിമിനെ ആവർത്തിക്കുമ്പോൾ, സ്ഥാനം മാറ്റങ്ങൾ.

തീർച്ചയായും, ഞങ്ങൾ (പ്ലെയർ എ) ഒരുതരം തന്ത്രം തിരഞ്ഞെടുത്തുവെന്ന് ഞങ്ങൾ അനുമാനിക്കുന്നു (നമുക്ക് പറയാം, 1) അതിൽ പാലിക്കുക. പിന്നെ, ആദ്യ കുറച്ച് നീക്കങ്ങളുടെ ഫലങ്ങൾ അനുസരിച്ച്, ഞങ്ങളുടെ തന്ത്രത്തെക്കുറിച്ച് എതിരാളി ess ഹിക്കുക, ഞങ്ങൾക്ക് ഏറ്റവും അനുകൂലമായി പ്രതികരിക്കും, ഞാൻ ഞങ്ങൾക്ക് വേണ്ടി അനുകൂലമായി പ്രതികരിക്കും, അതായത് ഒരു പിടി തിരഞ്ഞെടുക്കുക. ചില ഒരു തന്ത്രം എല്ലായ്പ്പോഴും പ്രയോഗിക്കാൻ ഞങ്ങൾ വ്യക്തമായി ലാഭകരമല്ല; നഷ്ടം സംഭവിക്കാതിരിക്കാൻ, ചിലപ്പോൾ നാം ആയുധങ്ങൾ തിരഞ്ഞെടുക്കണം, ചിലപ്പോൾ - ഒരു കൈവശം. എന്നിരുന്നാലും, നാം ചില പ്രത്യേക ക്രമത്തിൽ ചായുകയും ചില പ്രത്യേക ക്രമത്തിൽ ചാറുകയും ചെയ്താൽ (ഉദാഹരണത്തിന്, ഇത്) ശത്രുവിന് ഇത് ess ഹിക്കുകയും ഞങ്ങൾക്ക് ഏറ്റവും മോശമായ ഈ തന്ത്രത്തോട് പ്രതികരിക്കാനും കഴിയും. നമ്മുടെ തന്ത്രം ശത്രുവിന് ഉറപ്പുനൽകില്ലെന്ന് ഉറപ്പുനൽകുന്ന ഒരു സുരക്ഷിത മാർഗം, ഞങ്ങൾ സ്വയം അറിയാതെ ഓരോ സമയത്തും ഒരു ഉദ്ദേശ്യ സംഘടന ഉണ്ടാകും (ഇത് ഉറപ്പാക്കാം, ഉദാഹരണത്തിന്, ഒരു നാണയം എറിയുന്നത്). അതിനാൽ,, അവബോധജന്യമായ യുക്തിയിലൂടെ, ഗെയിം സിദ്ധാന്തത്തിലെ ഒരാളെ "സമ്മിശ്ര തന്ത്രം" എന്ന ആശയത്തിലേക്ക് സമീപിക്കുന്നു, അതായത്. "ശുദ്ധമായ" തന്ത്രങ്ങൾ - ഈ സാഹചര്യത്തിൽ, 1, ഒരു 2 - ഒരു 2 ആവൃത്തികളുമായി ഒന്നിടവിട്ട് ഇതര ഇടപെടൽ. ഈ ഉദാഹരണത്തിൽ, 1, ഒരു 2 എന്നിവ ഒരേ ആവൃത്തിയിൽ മാറി മാറ്റാലെ ആയിരിക്കണമെന്ന് ഈ ഉദാഹരണത്തിൽ സമമിതി പരിഗണനകൾ വ്യക്തമാണ്; കൂടുതൽ സങ്കീർണ്ണമായ ഗെയിമുകളിൽ, തീരുമാനം നിസ്സാരമായിരിക്കാം.

ഉദാഹരണം 2. പരസ്പരം സ്വതന്ത്രമായി കളിക്കുന്ന കളിക്കാർ പരസ്പരം സ്വതന്ത്രമായി പ്രവർത്തിക്കുന്നു: 1, 2 അല്ലെങ്കിൽ 3. രേഖാമൂലമുള്ള സംഖ്യകളുടെ ആകെത്തുകയാണെങ്കിൽ, ഈ തുക റുബിളിൽ പണമടയ്ക്കുന്നു; അത് വിചിത്രമാണെങ്കിൽ, നേരെമറിച്ച്, ഈ തുക നൽകുന്നു. ഇത് ഗെയിം വിശകലനം ചെയ്ത് ഒരു മാട്രിക്സ് ആക്കുന്നതിന് ആവശ്യമാണ്.

തീരുമാനം. ഗെയിമിൽ രണ്ട് നീക്കങ്ങൾ അടങ്ങിയിരിക്കുന്നു; രണ്ടും വ്യക്തിപരമാണ്. ഞങ്ങൾ (എ) മൂന്ന് തന്ത്രങ്ങൾ: ഒരു 1 - എഴുതുക 1; 2 - എഴുതുക 2; 3 - എഴുതുക 3. എതിരാളി (ബി) ഒരേ മൂന്ന് തന്ത്രങ്ങളാണ്. ഗെയിം 3 × 3 ഗെയിമാണ്:

വ്യക്തമായും, മുമ്പത്തെ കാര്യത്തിലെന്നപോലെ, ഞങ്ങൾക്ക് തിരഞ്ഞെടുത്ത എതിരാളിയുടെ ശത്രു നമുക്ക് ഏറ്റവും മോശമായതിന് ഉത്തരം നൽകാൻ കഴിയും. ഉദാഹരണത്തിന്, ഞങ്ങൾ തിരഞ്ഞെടുക്കുകയാണെങ്കിൽ, ഒരു തന്ത്രം ഒരു തന്ത്രം, ശത്രു എപ്പോഴും 2-ലെ ഒരു തന്ത്രത്തോട് പ്രതികരിക്കും; ഒരു തന്ത്രത്തിൽ 2 - 3 ലെ തന്ത്രമാണ്; 2 ലെ 3 തന്ത്രപരമായ തന്ത്രത്തിൽ; അതിനാൽ, ഒരു പ്രത്യേക തന്ത്രത്തിന്റെ ഏതെങ്കിലും തിരഞ്ഞെടുപ്പ് അനിവാര്യമായും നമ്മെ നഷ്ടപ്പെടുത്തും (എന്നിരുന്നാലും, ഒരു എതിരാളിയും ഒരേ പ്ലോട്ടിൽ സ്ഥിതിചെയ്യുന്നുവെന്ന് മറക്കുക). ഈ ഗെയിം പരിഹരിക്കുന്നു (i.e. സജ്ജമാക്കുക ഏറ്റവും ഉയർന്ന തന്ത്രങ്ങൾ രണ്ട് കളിക്കാരും) § 5 ൽ നൽകും.

ഉദാഹരണം 3.ഞങ്ങളുടെ പക്കൽ മൂന്ന് തരത്തിലുള്ള ആയുധങ്ങളുണ്ട്: ഒരു 1, ഒരു 2, ഒരു 3; എതിരാളിക്ക് മൂന്ന് തരം വിമാനങ്ങളുണ്ട്: ബി 1, 2, 3 ൽ. വിമാനം അടിക്കുക എന്നതാണ് ഞങ്ങളുടെ ചുമതല; അത് ബാധിക്കാത്തവയെ നിലനിർത്തുക എന്നതാണ് എതിരാളിയുടെ ചുമതല. 3.9, 0.4, 0.2 എന്നീ ക്ബബിലിറ്റികൾ 3 ൽ ആയുധധാരികളെ 1, വിമാനങ്ങൾ എ 1, വിമാനങ്ങൾ എ 1, ബി 2 എന്നിവ ബാധിക്കുന്നു; 2-ലെ സേവനത്തിൽ - പ്രോബബിലിറ്റികൾ 0.3, 0.6, 0.8; ആയുധത്തിലും 3 - പ്രോബബിലിറ്റികളോടെ 0.5, 0.7, 0.2. ഗെയിമുകളുടെ സിദ്ധാന്തത്തിന്റെ അടിസ്ഥാനത്തിൽ സാഹചര്യം രൂപപ്പെടുത്തേണ്ടതുണ്ട്.

തീരുമാനം. രണ്ട് വ്യക്തിഗത നീക്കങ്ങളും ഒരു ക്രമരത്തിലുമുള്ള 3 × 3 ഗെയിമായി സാഹചര്യം കണക്കാക്കാം. ആയുധ തരത്തിന്റെ തിരഞ്ഞെടുപ്പാണ് ഞങ്ങളുടെ വ്യക്തിഗത നീക്കം; എതിരാളിയുടെ വ്യക്തിഗത നീക്കം - യുദ്ധത്തിൽ പങ്കെടുക്കാൻ വിമാനത്തിന്റെ തിരഞ്ഞെടുപ്പ്. ക്രമരഹിതമായ നീക്കം - ആയുധങ്ങളുടെ ഉപയോഗം; ഈ നീക്കം വിമാനത്തിന്റെ തോൽവി അല്ലെങ്കിൽ വിയോജിപ്പ് അവസാനിപ്പിക്കാം. വിമാനം ആശ്ചര്യമാണെങ്കിൽ ഞങ്ങളുടെ ജയം ഒന്നിന് തുല്യമാണ്, അല്ലെങ്കിൽ പൂജ്യത്തിന് തുല്യമാണ്. ഞങ്ങളുടെ തന്ത്രങ്ങൾ മൂന്ന് ആയുധങ്ങളാണ്; വിമാനത്തിനുള്ള മൂന്ന് ഓപ്ഷനുകളാണ് ശത്രു തന്ത്രങ്ങൾ. ഓരോ നിർദ്ദിഷ്ട ജോഡി തന്ത്രങ്ങൾക്കായുള്ള വിജയത്തിന്റെ ശരാശരി മൂല്യം ഈ ആയുധവുമായി ഈ വിമാനത്തിന് കേടുപാടുകൾ സംഭവിക്കാമെന്നില്ല. മാട്രിക്സ് ഗെയിമുകൾ:

ഗെയിമുകൾ സിദ്ധാന്തത്തിന്റെ ഉദ്ദേശ്യം ശുപാർശകൾ വികസിപ്പിക്കുക എന്നതാണ് ന്യായമായ പെരുമാറ്റം കളിക്കാർ B. സംഘട്ടന സാഹചര്യങ്ങൾ. ഓരോരുത്തരുടെയും "ഒപ്റ്റിമൽ തന്ത്രത്തിന്റെ" നിർവചനം. ഗെയിംസ് സിദ്ധാന്തത്തിലെ ഒപ്റ്റിമൽ പ്ലെയർ തന്ത്രത്തെ അത്തരമൊരു തന്ത്രം എന്ന് വിളിക്കുന്നു, ഗെയിമിന്റെ ആവർത്തനവുമായി, ഈ കളിക്കാരനെ സാധ്യമായ ശരാശരി വിജയത്തിലേക്ക് (അല്ലെങ്കിൽ സാധ്യമായ ശരാശരി നഷ്ടം) നൽകുന്നു. ഈ തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ, ശത്രു നമ്മളെപ്പോലെ ന്യായമായയാളാണ് എന്ന ധാരണയാണ് യുക്തിയുടെ അടിസ്ഥാനം. അവരുടെ ലക്ഷ്യം നേടുന്നതിൽ നിന്ന് നമ്മെ തടയുന്നതിനായി എല്ലാം ചെയ്യുന്നു.

ഗെയിമുകൾ സിദ്ധാന്തത്തിൽ, ഈ തത്ത്വങ്ങളെ അടിസ്ഥാനമാക്കി എല്ലാ ശുപാർശകളും സൃഷ്ടിക്കപ്പെടുന്നു; അതിനാൽ, ഇത് റിസ്ക് ഘടകങ്ങളായി എടുക്കുന്നില്ല, അവ അനിവാര്യമായും ഓരോ യഥാർത്ഥ തന്ത്രത്തിലും ഓരോ കളിക്കാരുടെയും തെറ്റായ പ്രവർത്തനങ്ങളും പിശകുകളും ഉണ്ട്. സങ്കീർണ്ണമായ ഒരു പ്രതിഭാസത്തിന്റെ ഏതെങ്കിലും ഗണിത മാതൃക പോലെ ഗെയിമുകളുടെ സിദ്ധാന്തം അതിന്റെ പരിമിതികളുണ്ട്. അവയിൽ ഏറ്റവും പ്രധാനം വിജയങ്ങൾ കൃത്രിമമായി ഒന്നായി കുറയ്ക്കുന്നു എന്നതാണ് ഒറ്റ സംഖ്യ. ഏറ്റവും പ്രായോഗിക സംഘട്ടന സാഹചര്യങ്ങളിൽ, ന്യായമായ ഒരു തന്ത്രം വികസിപ്പിക്കുമ്പോൾ, ഒന്നല്ല കണക്കിലെടുക്കേണ്ടത് അത്യാവശ്യമാണ്, പക്ഷേ ഇവന്റിന്റെ വിജയത്തിനുള്ള മാനദണ്ഡങ്ങൾ - സംഖ്യകൾ. ഒരു തന്ത്രം ഒരു മാനദണ്ഡം മറ്റുള്ളവരിൽ ഒപ്റ്റിമൽ ആയിരിക്കണമെന്നില്ല. എന്നിരുന്നാലും, ഈ നിയന്ത്രണങ്ങളെക്കുറിച്ച് ബോധമുള്ള, അതിനാൽ, ഗെയിം രീതികൾ സ്വീകരിച്ച അന്ധമായ ശുപാർശകൾ പാലിക്കാതെ, അവശേഷിക്കുന്നതിനുള്ള ഗെയിം സിദ്ധാന്തത്തിന്റെ ഗണിത ഉപകരണം, തുടർന്ന്, ഏത് സാഹചര്യത്തിലും, " സ്വീകാര്യമായ "തന്ത്രം.

§ 2. താഴ്ന്നതും മികച്ചതുമായ വില ഗെയിം. "മിനിമാക്സിന്റെ" തത്വം

ചിത്രത്തിലെന്നപോലെ മാട്രിക്സ് ഉപയോഗിച്ച് Mxn ഗെയിം പരിഗണിക്കുക. 1. ഞങ്ങളുടെ തന്ത്രത്തിന്റെ എന്റെ എണ്ണം ഞങ്ങൾ സൂചിപ്പിക്കും; J എന്നത് ശത്രു തന്ത്ര സംഖ്യയാണ്. ഞങ്ങൾ ഒരു ടാസ്ക് ചെയ്യും: നിങ്ങളുടെ ഒപ്റ്റിമൽ തന്ത്രം നിർണ്ണയിക്കാൻ. 1 മുതൽ ആരംഭിച്ച് ഞങ്ങളുടെ ഓരോ തന്ത്രങ്ങളും ഞങ്ങൾ സ്ഥിരമായി വിശകലനം ചെയ്യുന്നു.

ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിലൂടെ, j ലെ തന്ത്രങ്ങളെ ശത്രു അതിനോട് പ്രതികരിക്കേണ്ടതിന്റെ കാര്യത്തിൽ നാം എല്ലായ്പ്പോഴും ആശ്രയിക്കണം, അതിനായി ഞങ്ങളുടെ വിജയവും ij ഉം കുറവാണ്. വിൻനിംഗുകളുടെ ഈ മൂല്യം ഞങ്ങൾ നിർവചിക്കുന്നു, അതായത്. കുറഞ്ഞത് അക്കങ്ങളുടെയും ij- ൽ i.വരി. I: i: i: i:

ഇവിടെ ചെറിയ ചിഹ്നം (കുറഞ്ഞത് j on j j) എന്നത് ഈ പാരാമീറ്ററിന്റെ ഏറ്റവും കുറഞ്ഞ മൂല്യങ്ങളാൽ സൂചിപ്പിച്ചിരിക്കുന്നു. I. ഞാൻ; ഞാൻ; ഒരു അധിക നിരയുടെ രൂപത്തിൽ വലതുവശത്തുള്ള മാട്രിക്സിന് അടുത്തായി:

ഏതെങ്കിലും തന്ത്രം തിരഞ്ഞെടുക്കുന്നതിലൂടെ, ശത്രുവിന്റെ ന്യായമായ പ്രവർത്തനങ്ങളുടെ ഫലമായി ഞങ്ങൾ പ്രതീക്ഷിക്കേണ്ടതായി നാം പ്രതീക്ഷിക്കണം, ഞാൻ i α എന്നതിനേക്കാൾ കൂടുതൽ വിജയിക്കില്ല. സ്വാഭാവികമായും, ഏറ്റവും ന്യായമായ ശത്രുവിനെ (I.e. ഏതെങ്കിലും അപകടസാധ്യത ഒഴിവാക്കുക) പ്രവർത്തിക്കുന്നത് (ഞാൻ എന്തെങ്കിലും അപകടസാധ്യത ഒഴിവാക്കുന്നു), ഞാൻ പരമാവധി ആ തന്ത്രത്തിൽ വസിക്കണം. ഈ പരമാവധി മൂല്യം സൂചിപ്പിക്കുക:

അല്ലെങ്കിൽ, ഫോർമുല (2.1) കണക്കിലെടുക്കുന്നു,

യുടെ മൂല്യം ഗെയിമിന്റെ ചുവടെയുള്ള വില എന്ന് വിളിക്കുന്നു, അല്ലാത്തപക്ഷം - പരമാവധി വിജയികൾ അല്ലെങ്കിൽ മാക്സിമ. മാട്രിക്സിന്റെ ഒരു പ്രത്യേക വരിയിലെ നമ്പർ α; ഈ വരിയുമായി യോജിക്കുന്ന പ്ലെയർ സ്ട്രാറ്റജി എ, പരമാവധി ഒരു തന്ത്രം എന്ന് വിളിക്കുന്നു. വ്യക്തമായും, പിന്നെ, ഏതെങ്കിലും ശത്രുവിന്റെ പെരുമാറ്റത്തോടുകൂടിയ, ഏത് ശത്രു പെരുമാറ്റവും അനുസരിച്ച്, വിജയികൾ ഉറപ്പുനൽകുന്നു, ഏത് സാഹചര്യത്തിലും, കുറഞ്ഞതല്ല α. അതിനാൽ, യുടെ മൂല്യം അതിനെ "ഗെയിമിന്റെ വില" എന്ന് വിളിക്കുന്നു. ഇത് നമുക്ക് സ്വയം നൽകാനും ഏറ്റവും ശ്രദ്ധാപൂർവ്വം ("റിൻസൈനൽ") തന്ത്രം പാലിക്കാനും ഉറപ്പുനൽകുന്ന ഏറ്റവും കുറഞ്ഞത് ഇതാണ്.

ശത്രു വിക്കായി സമാനമായ ന്യായവാദം നടത്താം, കാരണം ശത്രുവിന് ഞങ്ങളുടെ വിജയങ്ങൾ കുറഞ്ഞത് പണമടയ്ക്കാൻ താൽപ്പര്യമുണ്ട്, ഓരോ തന്ത്രങ്ങളും അനുസരിച്ച് അദ്ദേഹം കണക്കിലെടുക്കണം പരമാവധി വിജയം ഈ തന്ത്രം ഉപയോഗിച്ച്. അതിനാൽ, മാട്രിക്സിന്റെ അടിയിൽ, ഓരോ നിരയ്ക്കും പരമാവധി മൂല്യങ്ങൾ ഞങ്ങൾ പിന്തിരിപ്പിക്കുന്നു:

j ന്റെ ഏറ്റവും കുറഞ്ഞത് കണ്ടെത്തുക:

Β ന്റെ മൂല്യം ഗെയിമിന്റെ ഉയർന്ന വില, അല്ലാത്തപക്ഷം എന്ന് വിളിക്കുന്നു. ശത്രുവിന്റെ അനുബന്ധ മിനിമേറ്റ് തന്ത്രത്തെ അതിന്റെ "മിനിമാക്സ് തന്ത്രം" എന്ന് വിളിക്കുന്നു. ഏറ്റവും ശ്രദ്ധാപൂർവ്വം മിനിമാക്സ് തന്ത്രത്തിലേക്ക് ചേർന്ന്, ശത്രു സ്വയം ഉറപ്പുനൽകുന്നു: ഞങ്ങൾ അദ്ദേഹത്തിനെതിരെ എടുത്തതെല്ലാം βക്കാൾ വലുതല്ലാത്ത തുക നഷ്ടപ്പെടും. ജാഗ്രത പാലിക്കാനുള്ള തത്വം, കളിക്കാരെ (പരമാവധി, മിനിമാക്സ്), ഗെയിംസ്, അതിന്റെ ആപ്ലിക്കേഷനുകൾ എന്നിവയുടെ സിദ്ധാന്തത്തെ തിരഞ്ഞെടുക്കാറുണ്ട്, പലപ്പോഴും "മിനിമാക്സ് തത്ത്വം" എന്നാണ് വിളിക്കുന്നത്. കളിക്കാരുടെ ഏറ്റവും ശ്രദ്ധാപൂർവ്വം, മിനിമാക്സ് തന്ത്രങ്ങൾ ചിലപ്പോൾ സൂചിപ്പിക്കുന്നു പൊതുവായ പദം "മിനിമാക്സ് തന്ത്രങ്ങൾ".

ഉദാഹരണങ്ങളായി, ഗെയിമുകൾക്കുള്ള ഗെയിമുകളുടെ താഴത്തെ ഉയർന്ന വിലയും ഉദാഹരണങ്ങൾക്ക് മിനിമാക്സ് തന്ത്രങ്ങളും ഞങ്ങൾ നിർവചിക്കുന്നു 1, 2, 3 § 1.

ഉദാഹരണം 1.ഉദാഹരണത്തിൽ 1 § 1 1 ഡാന ഗെയിം അടുത്ത മാട്രിക്സ്:

I, β യുടെ മൂല്യങ്ങൾ യഥാക്രമം സ്ഥിരവും തുല്യവുമായതിനാൽ, -1, +1 എന്നിവയും - 1, +1 എന്നിവയും -1, +1 എന്നിവയും -1, മുൻനിര വില -1, +1: α \u003d -1, β \u003d + എന്നിവയ്ക്ക് തുല്യമാണ് 1. ഏതൊരു പ്ലെയർ തന്ത്രവും അതിന്റെ മാക്സിമിൻ ആണ്, ഏതെങ്കിലും കളിക്കാരന്റെ തന്ത്രം അതിന്റെ മിനിമാക്സ് തന്ത്രമാണ്. ട്രിവിലിയന്റെ പിൻവലിക്കൽ: അതിന്റെ ഏതെങ്കിലും തന്ത്രങ്ങളിൽ ഏതെങ്കിലും ഒരു തന്ത്രങ്ങൾക്കും ഒരു കളിക്കാരനും ചേർന്നുനിൽക്കുക, അത് 1 ൽ കൂടുതൽ നഷ്ടപ്പെടില്ലെന്ന് ഉറപ്പ് നൽകും; ആർക്കാണ് താരങ്ങൾക്ക് ഉറപ്പ് നൽകുന്നത്.

ഉദാഹരണം 2. ഉദാഹരണത്തിൽ 2 § 1 മാട്രിക്സ് ഉപയോഗിച്ച് ഡാന ഗെയിം:

ഗെയിമിന്റെ കുറഞ്ഞ വില α \u003d -3; മികച്ച വില ഗെയിം β \u003d 4. ഞങ്ങളുടെ മാക്സിമൈൻ തന്ത്രം 1; വ്യവസ്ഥാപിതമായി പ്രയോഗിക്കുന്നത്, കുറഞ്ഞത് -3 -3 ൽ വിജയിക്കരുതെന്ന് നമുക്ക് ഉറച്ചുനിൽക്കാം (3 ൽ കൂടുതൽ നഷ്ടപ്പെടരുത്). 1, 2-നുള്ളിൽ ശത്രുവിന്റെ മിനിമാക്സ് തന്ത്രം; അവ വ്യവസ്ഥാപിതമായി പ്രയോഗിക്കുന്നത്, ഒരു സാഹചര്യത്തിലും, നിങ്ങളുടെ മാക്സിമൈൻ തന്ത്രത്തിൽ നിന്ന് പിന്മാറുകയാണെങ്കിൽ (ഉദാഹരണത്തിന്, ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുക എന്നതിന്) ഉറപ്പുനൽകാൻ കഴിയും 3 വരെയുള്ള തന്ത്രം, 4 -5 -5 വരെ കുറയ്ക്കുക; ഒരുപോലെ, അതിന്റെ മിനിമാക്സ് തന്ത്രത്തിൽ നിന്നുള്ള ശത്രുവിന്റെ അടിച്ചമർത്തലിന് നഷ്ടം 6 ആയി വർദ്ധിപ്പിക്കും.

ഉദാഹരണം 3.ഉദാഹരണത്തിൽ 3 § 1 ഒരു മാട്രിക്സ് ഉള്ള ഡാന ഗെയിം:

ഗെയിമിന്റെ കുറഞ്ഞ വില α \u003d 0.3; മികച്ച മൂല്യ ഗെയിമുകൾ β \u003d 0.7. ഞങ്ങളുടെ ഏറ്റവും ശ്രദ്ധാപൂർവ്വം (പരമാവധി) തന്ത്രം ഒരു 2; ആയുധം എ 2 ഉപയോഗിച്ച്, എല്ലാ കേസുകളിലും 0.3 ൽ കുറയാത്ത വിമാനത്തെ ശരാശരി ബാധിക്കുമെന്ന് ഞങ്ങൾ ഉറപ്പ് നൽകുന്നു. ശത്രുവിന്റെ ഏറ്റവും ജാഗ്രത (മിനിമേക്സ്) തന്ത്രം 2; ഈ വിമാനം പ്രയോഗിക്കുമ്പോൾ, 0.7 ൽ കൂടുതൽ എല്ലാ കേസുകളും ബാധിക്കില്ലെന്ന് ശത്രുവിന് ഇത് ബാധിക്കുമെന്ന് ഉറപ്പാക്കാം.

അവസാന ഉദാഹരണത്തിൽ, ഒരെണ്ണം പ്രകടമാക്കുന്നത് സൗകര്യപ്രദമാണ് പ്രധാനപ്പെട്ട സ്വത്ത് മിനിമാക്സ് തന്ത്രങ്ങൾ അവരുടെ അസ്ഥിരതയാണ്. ഞങ്ങളുടെ ജാഗ്രത (പരമാവധി) തന്ത്രം ഒരു 2 പ്രയോഗിക്കാൻ ഞങ്ങൾ അനുവദിക്കുന്നു, കൂടാതെ ശത്രു അതിന്റെ ഏറ്റവും ജാഗ്രത (മിനിമേക്സ്) തന്ത്രമാണ്. രണ്ട് ശത്രുക്കളും ഈ തന്ത്രങ്ങൾ പാലിക്കുന്നിടത്തോളം കാലം ശരാശരി വിജയം 0.6; ഇത് ദൈർഘ്യമേറിയതാണ്, പക്ഷേ കുറവാണ് മികച്ച വില ഗെയിമുകൾ. ഒരു തന്ത്രം ഞങ്ങൾ പ്രയോഗിക്കുന്നുവെന്ന് ശത്രു അറിയപ്പെട്ടിരുന്നിട്ടുണ്ടെന്ന് ഇപ്പോൾ നമുക്ക് പറയാം; 1 ലെ തന്ത്രത്തോട് അദ്ദേഹം ഉടൻ പ്രതികരിക്കുകയും 0.3 ന് വിജയം നൽകുകയും ചെയ്യും. ടേണിൽ, സ്ട്രാറ്റജി ബി 1 ന് ഞങ്ങൾക്ക് ഒരു നല്ല ഉത്തരം ഉണ്ട്: തന്ത്രം a 1, ഞങ്ങൾക്ക് ഒരു വിജയം 0.9, തുടങ്ങിയവ നൽകുന്നു.

അങ്ങനെ, രണ്ട് കളിക്കാരും അവരുടെ മിനിമാക്സ് തന്ത്രങ്ങൾ ആസ്വദിക്കുന്ന സ്ഥാനം അസ്ഥിരമാണ്, മാത്രമല്ല എതിരാളിയുടെ എതിരാളിയുടെ തന്ത്രത്തെക്കുറിച്ചുള്ള വിവരങ്ങൾ ലംഘിക്കാനും കഴിയും. എന്നിരുന്നാലും, മിനിമാക്സ് തന്ത്രങ്ങൾ സുസ്ഥിരമാണെന്ന് ചില ഗെയിമുകൾ ഉണ്ട്. താഴത്തെ വില മുകളിലേക്ക് തുല്യമായ ഗെയിമുകളാണ് ഇവ. Α \u003d. ഗെയിമിന്റെ കുറഞ്ഞ വില മുകളിലേക്ക് തുല്യമാണെങ്കിൽ, അവയുടെ പൊതു മൂല്യം ഗെയിമിന്റെ അറ്റ \u200b\u200bവില (ചിലപ്പോൾ കളിയുടെ വില) എന്ന് വിളിക്കുന്നു (ചിലപ്പോൾ ഇത്) കത്ത് ഉപയോഗിച്ച് ഞങ്ങൾ അത് സൂചിപ്പിക്കും.

ഒരു ഉദാഹരണം പരിഗണിക്കുക. ഗെയിം 4 × 4 മാട്രിക്സ് സജ്ജമാക്കാൻ അനുവദിക്കുക:

ഗെയിമിന്റെ കുറഞ്ഞ വില കണ്ടെത്തുക: α \u003d 0.6. ഗെയിമിന്റെ മികച്ച വില കണ്ടെത്തുക: β \u003d 0.6. അതിനാൽ, ഗെയിമിന് α \u003d β \u003d ν \u003d 0.6 ന് തുല്യമായ ശുദ്ധമായ വിലയുണ്ട്. പേയ്മെന്റ് മാട്രിക്സിൽ ഹൈലൈറ്റ് ചെയ്തിട്ടുള്ള ഘടകം 0.6, ഒരേസമയം അതിന്റെ വരിയിൽ ചുരുങ്ങിയതും അതിന്റെ നിരയിലെ പരമാവധിയുമാണ്. ജ്യാമിതിയിൽ, സമാന സ്വത്തുക്കളുമായി ഉപരിതലത്തിലെ പോയിന്റ് (ഒൻകോംനേറ്റ്, പരമാവധി മറ്റൊന്ന്, മറ്റൊന്ന്) ഒരു സാഡിൽ പോയിന്റ് എന്ന് വിളിക്കുന്നു, സമാനതകളാൽ, ഈ പദം ഗെയിമുകൾ സിദ്ധാന്തത്തിൽ പ്രയോഗിക്കുന്നു. ഈ പ്രോപ്പർട്ടി ഉള്ള ഒരു മാട്രിക്സിന്റെ ഒരു ഘടകം മാട്രിക്സിന്റെ ഒരു സാഡിൽ പോയിന്റ് എന്ന് വിളിക്കുന്നു, ഇത് ഒരു സാഡിൽ പോയിന്റുണ്ടെന്ന് അവർ പറയുന്ന ഗെയിമിനെക്കുറിച്ചാണ്.

സാഡിൽ പോയിന്റ് ഒരു ജോടി മിനിമാക്സ് തന്ത്രങ്ങളുമായി യോജിക്കുന്നു (ഈ ഉദാഹരണത്തിലും 3, 2 എന്നിവ). ഈ തന്ത്രങ്ങളെ ഒപ്റ്റിമൽ എന്ന് വിളിക്കുന്നു, അവരുടെ മൊത്തത്തിലുള്ള ഗെയിം പരിഹരിക്കേണ്ടതാണ്. കളിയുടെ തീരുമാനത്തിന് ഇനിപ്പറയുന്നവയുണ്ട് അത്ഭുതകരമായ സ്വത്ത്. കളിക്കാരിലൊരാൾ (ഉദാഹരണത്തിന്, എ) അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിന് അനുസൃതമായി, മറ്റൊരു കളിക്കാരൻ (സി) അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിൽ നിന്ന് വ്യതിചലിക്കാൻ ഒരു തരത്തിലും വ്യതിചലിക്കും, തുടർന്ന് വ്യതിചലനം നടത്തി, അത് ഒരിക്കലും പ്രയോജനകകില്ല, ആർക്കാണ് കളിക്കാരന്റെ നിരസിക്കാൻ കഴിയുന്നത് നേടുന്നത് മാറ്റമില്ലാതെ വിജയിച്ചു, ഏറ്റവും മോശം അവസ്ഥയിൽ - അത് വർദ്ധിപ്പിക്കുക. നേരെമറിച്ച്, അവന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിലാണെങ്കിൽ, അതിന്റേതിൽ നിന്ന് വ്യതിചലിക്കുന്നുവെങ്കിൽ, ഇത് a ന് ഗുണം ചെയ്യാൻ കഴിയില്ല.

സാഡിൽ പോയിന്റുമായി പരിഗണനയിലുള്ള ഗെയിമിന്റെ ഉദാഹരണം പരിശോധിക്കുന്നത് ഈ പ്രസ്താവന എളുപ്പമാണ്. ഒരു സാഡിൽ പോയിന്റുള്ള ഒരു ഗെയിമിന്റെ കാര്യത്തിൽ, മിനിമാക്സ് തന്ത്രങ്ങൾക്ക് പ്രത്യേക "സ്ഥിരത" ഉണ്ട്: ഒരു വശം മിനിമാക്സ് തന്ത്രത്തിലേക്ക് ചേർക്കുന്നുവെങ്കിൽ, മറ്റൊന്ന് മറ്റൊന്നിലേക്ക് മാത്രമേ വ്യതിചലിക്കാൻ കഴിയൂ. ഈ സാഹചര്യത്തിൽ ശത്രു തന്റെ ഒപ്റ്റിമൽ തന്ത്രം തിരഞ്ഞെടുക്കാൻ ശത്രുവിന്റെ സ്വന്തം പെരുമാറ്റത്തെ മാറ്റാൻ കഴിയില്ലെന്ന് ശ്രദ്ധിക്കുക: സ്വന്തം താൽപ്പര്യങ്ങൾക്കെതിരെ പ്രവർത്തിക്കാൻ അദ്ദേഹം ആഗ്രഹിക്കുന്നില്ലെങ്കിൽ, അവൻ അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രം പാലിക്കണം. ഒരു സാഡിൽ പോയിന്റുമായി ഗെയിമിലെ ജോഡി ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ, "സന്തുലിതാവസ്ഥയുടെ സ്ഥാനം" പോലെയാണ്: ഒപ്റ്റിമൽ തന്ത്രത്തിൽ നിന്നുള്ള എന്തെങ്കിലും വ്യതിയാനം അതിന്റെ യഥാർത്ഥ സ്ഥാനത്തേക്ക് മടങ്ങാൻ നിർബന്ധിക്കുന്ന ഒരു വ്യതിചലനത്തെ നയിക്കുന്നു .

അതിനാൽ, ഒരു സാഡിൽ പോയിന്റുമൊത്തുള്ള ഓരോ ഗെയിമിനും രണ്ട് പാർട്ടികളുടെയും രണ്ട് കക്ഷികളുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങളെ നിർവചിക്കുന്ന ഒരു പരിഹാരം ഉണ്ട്, അത് ഇനിപ്പറയുന്ന പ്രോപ്പർട്ടികളുടെ സവിശേഷതയാണ്.

1) ഇരുവശത്തും അവരുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ പാലിക്കുന്നുണ്ടെങ്കിൽ, ശരാശരി വിജയം ഗെയിമിന്റെ അറ്റ \u200b\u200bവിലയ്ക്ക് തുല്യമാണ് ν, അത് അതിന്റെ താഴത്തെയും ഉയർന്ന വിലയുമാണ്.

2) ഒരു കക്ഷികളിലൊരാൾ അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രം ഉണ്ടെങ്കിൽ, മറ്റൊന്ന് അതിന്റേതായ വ്യതിചലിക്കുന്നുവെങ്കിൽ, വ്യതിചലിക്കുന്ന വർഷത്തിന് മാത്രമേ നഷ്ടം ലഭിക്കൂ, ഒരു സാഹചര്യത്തിലും അതിന്റെ നേട്ടം വർദ്ധിപ്പിക്കാൻ കഴിയില്ല.

ഒരു സാഡിൽ പോയിന്റ് ഉള്ള ഗെയിമുകളുടെ ക്ലാസ് സൈദ്ധാന്തികവും പ്രായോഗിക വീക്ഷണകോണിൽ നിന്നും മികച്ച താൽപ്പര്യമാണ്. ഗെയിമുകളുടെ സിദ്ധാന്തത്തിൽ, പൂർണ്ണ ഇമെയിലുകളുള്ള ഓരോ ഗെയിമിനും ഒരു സാഡിൽ പോയിന്റും ഉണ്ടെന്ന് തെളിയിക്കപ്പെട്ടിട്ടുണ്ട്, അതിനാൽ, അത്തരം ഓരോ ഗെയിമിനും ഒരു പരിഹാരമുണ്ട്, അത്തരം ഓരോ ഗെയിമിന് പരിഹാരമുണ്ട്, അത്തരം ഓരോ ഗെയിമിന്, I.E. മറുവശത്തെ ഒരു ജോടി ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ ഉണ്ട്, ഇത് ഗെയിമിന് തുല്യമായ ശരാശരി നേട്ടം നൽകുന്നു. പൂർണ്ണ വിവരങ്ങളുള്ള ഗെയിമിന് വ്യക്തിപരമായ നീക്കങ്ങളിൽ മാത്രം അടങ്ങിയിട്ടുണ്ടെങ്കിൽ, അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിന്റെ ഓരോ വശവും പ്രയോഗിക്കുമ്പോൾ, അത് എല്ലായ്പ്പോഴും ഒരു ഫലമായി ബന്ധപ്പെടാൻ, അതായത്, വിജയത്തിന്റെ കൃത്യമായി, ഗെയിമിന്റെ വില എന്നിവയുമായി ബന്ധപ്പെടണം.

പൂർണ്ണ വിവരങ്ങളുള്ള ഗെയിമിന്റെ ഉദാഹരണമായി പ്രശസ്ത ഗെയിം നാണയങ്ങൾ സ്ഥാപിച്ച് വട്ട മേശ. രണ്ട് കളിക്കാർ ഒരേ നാണയങ്ങൾ റ round ണ്ട് ടേബിളിൽ ഇടുന്നു, ഓരോ തവണയും നാണയത്തിന്റെ കേന്ദ്രത്തിന്റെ അനിയന്ത്രിതമായ സ്ഥാനം തിരഞ്ഞെടുക്കുന്നു; നാണയങ്ങളുടെ പരസ്പര ആവരണം അനുവദനീയമല്ല. അവസാന നാണയം ഇടുന്ന കളിക്കാരിലൊരാൾ വിജയിക്കുന്നു (മറ്റുള്ളവർക്ക് സ്ഥലങ്ങൾ ഇല്ലാത്തപ്പോൾ). ഈ ഗെയിമിന്റെ ഫലം എല്ലായ്പ്പോഴും മുൻകൂട്ടി നിശ്ചയിച്ചിട്ടുണ്ടെന്നും, നാണയം ആദ്യം ഉൾപ്പെടുത്തിയിരിക്കുന്ന കളിക്കാരിൽ നിന്ന് ഇതിന്റെ വിശ്വസനീയമായ ഒരു നേട്ടം നൽകുന്ന തീർത്തും നിശ്ചയദാർമയുണ്ട്. അതായത്, അവൻ ആദ്യം നാണയം മേശയുടെ മധ്യഭാഗത്തേക്ക് വയ്ക്കണം, തുടർന്ന് ഒരു സമമിതി നീക്കവുമായി പ്രതികരിക്കാൻ ശത്രുവിന്റെ ഓരോ നീക്കത്തിലും. അതേസമയം, ഗെയിമിന്റെ മുൻകൂട്ടി നിശ്ചയിക്കാതെ രണ്ടാമത്തെ കളിക്കാരന് എന്തെങ്കിലും പെരുമാറാൻ കഴിയും. അതിനാൽ, ഒപ്റ്റിമൽ തന്ത്രം അറിയാത്ത കളിക്കാർക്ക് മാത്രമാണ് ഈ ഗെയിം അർത്ഥമാക്കുന്നത്. മുഴുവൻ വിവരങ്ങളുള്ള ചെസ്, മറ്റ് ഗെയിമുകൾ എന്നിവയ്ക്ക് സമാനമാണ് സ്ഥിതി; അത്തരം ഏതൊരു ഗെയിമിനും ഒരു സാഡിൽ പോയിന്റും കളിക്കാരെ അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രവും സൂചിപ്പിക്കുന്ന ഒരു പരിഹാരമുണ്ട്; ചെസ്സ് ഗെയിം തീരുമാനിച്ചിട്ടില്ല, കാരണം ചെസ്സിൽ സാധ്യമായ നീക്കങ്ങളുടെ കോമ്പിനേഷനുകളുടെ എണ്ണം വളരെ വലുതായതിനാൽ നിങ്ങൾക്ക് ഒരു പേയ്മെന്റ് മാട്രിക്സ് നിർമ്മിക്കാനും അതിൽ ഒരു സാഡിൽ പോയിന്റ് കണ്ടെത്താനും കഴിയും.

§ 3. വൃത്തിയുള്ളതും സമ്മിശ്രവുമായ തന്ത്രങ്ങൾ. സമ്മിശ്ര തന്ത്രങ്ങളിൽ കളിയുടെ പരിഹാരം

പ്രായോഗിക പ്രാധാന്യമുള്ള അവസാന ഗെയിമുകളിൽ, ഒരു സാഡിൽ പോയിന്റുമായി താരതമ്യേന അപൂർവ ഗെയിമുകൾ ഉണ്ട്; ഗെയിമിന്റെ അടിയും മുൻനിരയും വില വ്യത്യസ്തമാകുമ്പോൾ കൂടുതൽ സാധാരണമാണ്. അത്തരം ഗെയിമുകളുടെ മാട്രിക്സ് വിശകലനം ചെയ്താൽ ഓരോ കളിക്കാരനും ഒരൊറ്റ തന്ത്രത്തിന്റെ തിരഞ്ഞെടുപ്പ് നൽകിയിട്ടുണ്ടെങ്കിൽ, ഓരോ കളിക്കാരനിലും മിനാക്കുകളുടെ തത്വത്താൽ ഈ തിരഞ്ഞെടുപ്പ് നിർണ്ണയിക്കണം. മാക്സിമൈൻ തന്ത്രത്തെ ചേർന്നുനിൽക്കുക, ശത്രുവിന്റെ ഏതെങ്കിലും പെരുമാറ്റത്തിൽ വിജയികൾ ഗെയിം α ന്റെ കുറഞ്ഞ വിലയ്ക്ക് തുല്യമായി ഉറപ്പ് നൽകുക. ഒരു സ്വാഭാവിക ചോദ്യമുണ്ട്: നിങ്ങൾ ഒരു "വൃത്തിയുള്ള" തന്ത്രം പ്രയോഗിക്കുകയാണെങ്കിൽ, ക്രമരഹിതമായി നിരവധി തന്ത്രങ്ങൾ ഇതര പ്രയോഗിക്കുകയാണെങ്കിൽ, ശരാശരി വിജയികൾ സ്വയം ഉറപ്പ് നൽകുന്നത് അസാധ്യമാണോ? ഗെയിമുകളുടെ സിദ്ധാന്തത്തിൽ ഒരു നിശ്ചിത ആവൃത്തി അനുപാതത്തിൽ ഒരു നിശ്ചിത തന്ത്രങ്ങൾ പ്രയോഗിക്കുന്ന ഇത്തരം സംയോജിത തന്ത്രങ്ങൾ സമ്മിശ്ര തന്ത്രങ്ങൾ എന്ന് വിളിക്കുന്നു.

വ്യക്തമായും, ഓരോ നെറ്റ് തന്ത്രവും മിശ്രിതമായുള്ള ഒരു പ്രത്യേക അവസരമാണ്, അതിൽ ഒരാൾ ഒഴികെയുള്ള എല്ലാ തന്ത്രങ്ങളും പൂജ്യം ആവൃത്തികളോടെ ഉപയോഗിക്കുന്നു, ഇത് ശരിയാക്കുന്നു, നിങ്ങൾ സമ്മിശ്ര തന്ത്രങ്ങളും ഓരോ അവസാന ഗെയിം തീരുമാനത്തിനും ലഭിക്കും, I.E. രണ്ട് കളിക്കാരുമായും പ്രയോഗിക്കുമ്പോൾ, വിജയികൾ ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമാകും, കൂടാതെ, ഒപ്റ്റിമൽ തന്ത്രത്തിൽ നിന്ന് ഏതെങ്കിലും ഏകപക്ഷീയമായ വ്യതിയാനം നൽകും, വിനിംഗ് മാത്രം മാറ്റാൻ കഴിയും വ്യതിചലിക്കുന്നതിനായി പരിഹാരമില്ലാത്ത ഭാഗം.

ഗെയിമുകൾ സിദ്ധാന്തത്തിന്റെ അടിസ്ഥാന സിദ്ധാന്തം എന്ന് വിളിക്കപ്പെടുന്ന ഉള്ളടക്കമാണ് അംഗീകാരം. സിദ്ധാന്തത്തിന്റെ പ്രശസ്തനായ തെളിവുകൾ താരതമ്യേന സങ്കീർണ്ണമാണെന്ന് ഈ സിദ്ധാന്തം ആദ്യമായി തെളിയിക്കപ്പെട്ടു. അതിനാൽ, ഞങ്ങൾ അതിന്റെ വാക്ക് മാത്രമേ നൽകുന്നത്.

ഓരോ അന്തിമ ഗെയിമിനും കുറഞ്ഞത് ഒരു പരിഹാരമെങ്കിലും ഉണ്ട് (ഒരുപക്ഷേ മിശ്രിത തന്ത്രങ്ങളുടെ വയൽ മേഖലയിൽ).

പരിഹാരത്തിന്റെ ഫലമായി ലഭിച്ച വിജയികൾ ഗെയിമിന്റെ വില എന്ന് വിളിക്കുന്നു. പ്രധാന സിദ്ധാന്തത്തിൽ നിന്ന് ഓരോ അന്തിമ ഗെയിമിനും ഒരു വിലയുണ്ടെന്ന് പിന്തുടരുന്നു. വ്യക്തമായും, ഗെയിമിന്റെ വില the ഗെയിമിന്റെ കുറഞ്ഞ വിലയ്ക്കും ഗെയിമിന്റെ ഉയർന്ന വിലയ്ക്കും ഇടയിൽ സ്ഥിതിചെയ്യുന്നു β:

(3.1) α ≤ ν ≤

തീർച്ചയായും, α, നിങ്ങളുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ മാത്രം പ്രയോഗിക്കുന്ന പരമാവധി ഗ്യാരണ്ടീഡ് നേട്ടമാണ്. സമ്മിശ്ര തന്ത്രങ്ങൾ ഒരു സ്വകാര്യ കേസായി ഉൾപ്പെടുത്തുകയും എല്ലാം ശുദ്ധീകരിക്കുകയും ചെയ്യുന്നതിനാൽ, ശുദ്ധിയുള്ളതല്ലാതെ, ശുദ്ധിയുള്ളവയല്ലാതെ, അവയുടെ കഴിവുകൾ വർദ്ധിപ്പിക്കാൻ അനുവദിക്കുന്നു, ഞങ്ങൾ അവരുടെ കഴിവുകൾ വഷളാക്കുന്നില്ല; തൽഫലമായി, ν ≥ α. അതുപോലെ, ശത്രുവിന്റെ സാധ്യതകൾ കണക്കിലെടുക്കുമ്പോൾ, അസമത്വം തെളിവായിരിക്കണം (3.1) എന്നതിൽ നിന്ന് ഞങ്ങൾ കാണിക്കും.

മിക്സഡ് തന്ത്രങ്ങൾക്ക് ഞങ്ങൾ ഒരു പ്രത്യേക പദവി അവതരിപ്പിക്കുന്നു. ഉദാഹരണത്തിന്, നമ്മുടെ സമ്മിശ്ര തന്ത്രം ഒരു 1, ഒരു 2, 3, 3 എന്നിവ ഉപയോഗിച്ച് ഫ്രീക്വൻസികൾ പ്രയോഗിക്കുന്നതിൽ ഉൾപ്പെടുന്നുവെങ്കിൽ പി 1, പി 2, പി 3 എന്നിവ ഉപയോഗിച്ച് p 1 + p 2, p 3 \u003d p 3 \u003d 1, ഞങ്ങൾ ഈ തന്ത്രം സൂചിപ്പിക്കും

അതുപോലെ, സമ്മിശ്ര ശത്രു തന്ത്രം സൂചിപ്പിക്കും:

എവിടെ 1, Q 2, Q 3 - 2-ൽ ഫ്രംഭങ്ങൾ 3, 2 ൽ ഫ്രംഭകങ്ങൾ മിശ്രിതമാണ്; Q 1 + Q 2 + Q Q 3 \u003d 1.

ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രങ്ങൾ ഉൾക്കൊള്ളുന്ന ഗെയിമിന് ഞങ്ങൾ ഒരു പരിഹാരം കണ്ടെത്തി. പൊതുവേ, ഈ കളിക്കാരന് ലഭ്യമായ എല്ലാ ശുദ്ധമായ തന്ത്രങ്ങളും അതിന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രത്തിൽ ഉൾപ്പെടുത്തിയിട്ടില്ല, ചിലത് മാത്രം. ഒപ്റ്റിമൽ മിക്സഡ് കളിക്കാരന്റെ തന്ത്രത്തിൽ ഞങ്ങൾ ഇതിനെ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. കളിയുടെ തീരുമാനത്തിന് മറ്റൊരു അത്ഭുതകരമായ സ്വത്തമുണ്ടെന്ന് ഇത് മാറുന്നു: കളിക്കാരിലൊരാൾ അതിന്റെ ഒപ്റ്റിമൽ മിക്സഡ് സാ / തന്ത്രം (എസ്ബി *) ഉണ്ടെങ്കിൽ, വിജയിച്ചതും ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യവും മറ്റ് കളിക്കാരൻ, അത് അതിന്റെ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾക്കപ്പുറത്തേക്ക് പോകുന്നു. ഉദാഹരണത്തിന്, അവൻ ശുദ്ധമായ രൂപത്തിൽ അതിന്റെ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ ഉപയോഗിക്കാനും അവയെ ഏതെങ്കിലും അനുപാതത്തിൽ ഉൾപ്പെടുത്താനും കഴിയും.

§ 4. ഗെയിമുകൾ പരിഹരിക്കുന്ന പ്രാഥമിക രീതികൾ. ഗെയിമുകൾ 2.x.2 ഉം 2 ഉം.x.n.

MXN ഗെയിമിൽ ഒരു സാഡിൽ ഇല്ലെങ്കിൽ, ഒരു പരിഹാരം കണ്ടെത്തുന്നത് പൊതുവെ ബുദ്ധിമുട്ടുള്ള കാര്യമാണ്, പ്രത്യേകിച്ച് വലിയ എം, എൻ. ചില സമയങ്ങളിൽ ഈ ടാസ്ക് ലളിതമാക്കാൻ സാധ്യമാണ്, ചില അനാവശ്യമായ ചില തന്ത്രങ്ങളുടെ എണ്ണം നിങ്ങൾ ആദ്യം കുറയ്ക്കുകയാണെങ്കിൽ. അനാവശ്യ തന്ത്രങ്ങൾ ഒരു) തനിപ്പകർപ്പാണ്, ബി) വ്യക്തമായും ലാഭകരമല്ല. ഉദാഹരണത്തിന്, മാട്രിക്സിനൊപ്പം ഗെയിം പരിഗണിക്കുക:

ഒരു തന്ത്രം ഒരു തന്ത്രം ആവർത്തിക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നത് എളുപ്പമാണ്, അതിനാൽ ഈ രണ്ട് തന്ത്രങ്ങളും ഇല്ലാതാക്കാൻ കഴിയും. കൂടാതെ, വരികളെ 1, ഒരു 2 എന്നിവയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, സ്ട്രിംഗിന്റെ ഓരോ ഘടകവും സ്ട്രിംഗിന്റെ അനുബന്ധ ഘടകത്തിന്റെ അനുബന്ധ ഘടകീകരണത്തിന്റെ 2 (അല്ലെങ്കിൽ തുല്യമാണ്) എന്ന് ഞങ്ങൾ കാണുന്നു. വ്യക്തമായും, ഞങ്ങൾ ഒരിക്കലും A2 തന്ത്രം ഉപയോഗിക്കരുത്, അത് വ്യക്തമായും ദോഷകരമാണ്. 3, ഒരു 2 എന്നിവ വരയ്ക്കുന്നു, മാട്രിക്സ് കൂടുതൽ അടുക്കുക ലളിതം. അടുത്തതായി, ശത്രുക്കൾക്കായി, അറിഞ്ഞുകൊണ്ട് ലാഭകരമല്ലാത്ത തന്ത്രം ഞങ്ങൾ ശ്രദ്ധിക്കുന്നു; അത് വരച്ച്, മാട്രിക്സ് അന്തിമരൂപത്തിലേക്ക് കൊണ്ടുവരിക:

അതിനാൽ, തനിപ്പകർപ്പ് കടന്ന് 4 × 4 ഗെയിം, അറിഞ്ഞുകൊണ്ട് ലാഭകരമല്ലാത്ത തന്ത്രങ്ങൾ 2 × 3 വരെ ചുരുക്കിയിരിക്കുന്നു.

തനിപ്പകർപ്പ് അമിതമായി തനിപ്പകർപ്പ്, അറിഞ്ഞുകൊണ്ട് പ്രതികൂല തന്ത്രങ്ങൾ എന്നിവയ്ക്കുള്ള നടപടിക്രമം എല്ലായ്പ്പോഴും ഗെയിം തീരുമാനത്തിന് മുമ്പായിരിക്കണം. പ്രാഥമിക വഴികൾ പരിഹരിക്കാൻ കഴിയുന്ന ഏറ്റവും ലളിതമായ കേസുകൾ 2 × 2, 2 എക്സ്എൻ ഗെയിമുകളാണ്.

ഗെയിം 2 × 2 ഒരു മാട്രിക്സ് ഉപയോഗിച്ച് പരിഗണിക്കുക:

രണ്ട് കേസുകളിൽ ഇവിടെ കണ്ടുമുട്ടാം: 1) ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ട്; 2) ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ല. ആദ്യ സന്ദർഭത്തിൽ, പരിഹാരം വ്യക്തമാണ്: ഇത് സാഡിൽ പോയിന്റിൽ വിഭജിക്കുന്ന ഒരു ജോഡി തന്ത്രങ്ങളാണ്. കുറിപ്പ് വഴിയിൽ, ഗെയിമിൽ 2 × 2, ഒരു സാഡിഡിന്റെ സാന്നിധ്യം എല്ലായ്പ്പോഴും പ്രാഥമിക വിശകലനത്തിൽ ഇല്ലാതാക്കേണ്ടതിന്റെ നിലനിൽപ്പിന് തുല്യമാണ്.

അതിനാൽ, ഗെയിമിന്റെ താഴത്തെ വില മുകളിലല്ല: α β ന് തുല്യമല്ല. ഒപ്റ്റിമൽ മിക്സഡ് കളിക്കാരന്റെ തന്ത്രം കണ്ടെത്തേണ്ടതുണ്ട് a:

വസ്തുവിന്റെ സവിശേഷതയാണ്, ശത്രുവിന്റെ പ്രവൃത്തികൾ എന്തായിരിക്കും (ഇത് ഉപയോഗപ്രദമായ "തന്ത്രങ്ങൾക്കപ്പുറത്തേക്ക് പോകില്ലെങ്കിൽ, വിജയിച്ച ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമായിരിക്കും. ഗെയിമിൽ 2 × 2, രണ്ട് ശത്രു തന്ത്രങ്ങളും "ഉപയോഗപ്രദമാണ്", - അല്ലാത്തപക്ഷം ഈ ഗെയിമിന് ശുദ്ധമായ തന്ത്രങ്ങളുടെ (സാഡിൽ പോയിന്റ്) ഫീൽഡിൽ ഒരു പരിഹാരം ലഭിക്കും. ഇതിനർത്ഥം നമ്മുടെ ഒപ്റ്റിമൽ തന്ത്രത്തിന് അനുസൃതമായി (4.1), ശത്രുവിന് അതിന്റെ ശരാശരി വിജയം മാറ്റാതെ 2, രണ്ടിൽ ഏതെങ്കിലും ശുദ്ധമായ തന്ത്രങ്ങൾ ഉപയോഗിക്കാം. ഇവിടെ നിന്ന് ഞങ്ങൾക്ക് രണ്ട് സമവാക്യങ്ങൾ ഉണ്ട്:

അതിൽ, p 1 + p 2 \u003d 1 എന്ന് കണക്കിലെടുക്കുമ്പോൾ നമുക്ക് ലഭിക്കും:

ഗെയിമിന്റെ വില ν, പി 1, പി 2 ന്റെ ഏതെങ്കിലും സമവാക്യങ്ങളിലേക്ക് p 1 ന്റെ മൂല്യങ്ങൾ പകരമായി കാണപ്പെടുന്നു (4.2).

ഗെയിം അറിയപ്പെടുന്നുവെങ്കിൽ, അത് ഒപ്റ്റിമൽ ശത്രു തന്ത്രം നിർണ്ണയിക്കാൻ

ഉദാഹരണത്തിന് മതിയായ സമവാക്യം ഉണ്ട്:

എവിടെ നിന്ന്, Q 1 + Q 2 \u003d 1 പരിഗണിക്കുക, ഞങ്ങൾക്ക്:

ഉദാഹരണം 1. ഗെയിമിന്റെ പരിഹാരം 2 × 2, ഉദാഹരണം 1 § 1, മാട്രിക്സ് ഉപയോഗിച്ച് ഞങ്ങൾ കാണുന്നു:

ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ല (α \u003d -1; β \u003d +1), അതിനാൽ, പരിഹാരം സമ്മിശ്ര തന്ത്രങ്ങളുടെ വയലിൽ കിടക്കണം:

പി 1, പി 2, Q 1, q 2 എന്നിവ കണ്ടെത്തേണ്ടത് ആവശ്യമാണ്. പി 1 നായി ഞങ്ങൾക്ക് ഒരു സമവാക്യം ഉണ്ട്

1 * P 1 + (-1) (1 - P 1) \u003d (-1) p 1 + 1 (1 - P 1)

എവിടെ നിന്ന് p 1 \u003d 1/2, p 2 \u003d 1/2.

അതുപോലെ, ഞങ്ങൾ കണ്ടെത്തുന്നു: Q 1 \u003d 1/2, Q 2 \u003d 1/2, ν \u003d 0.

തൽഫലമായി, ഓരോ കളിക്കാരുടെയും ഒപ്റ്റിമൽ തന്ത്രം ക്രമരഹിതമായി അതിന്റെ നെറ്റ് തന്ത്രങ്ങൾ ഒന്നിടവിട്ട്, പലപ്പോഴും ഓരോരുത്തർക്കും ഒരേ അവയിൽ ഓരോന്നും ഉപയോഗിക്കുന്നു; ഈ സാഹചര്യത്തിൽ, ശരാശരി വിജയങ്ങൾ പൂജ്യമായിരിക്കും.

തത്ഫലമായുണ്ടാകുന്ന output ട്ട്പുട്ട് മുൻകൂട്ടി വ്യക്തമായിരുന്നു. ഇനിപ്പറയുന്ന ഉദാഹരണത്തിൽ, ഞങ്ങൾ കൂടുതൽ നോക്കാം സങ്കീർണ്ണമായ ഗെയിം, അതിന്റെ പരിഹാരം അത്ര വ്യക്തമല്ല. "വഞ്ചന" അല്ലെങ്കിൽ "തെറ്റിദ്ധരിപ്പിക്കുന്ന" ഗെയിമുകൾ എന്നറിയപ്പെടുന്ന ഗെയിമുകളുടെ ഒരു പ്രാഥമിക സാമ്പിളാണ് ഒരു ഉദാഹരണം. പ്രായോഗികമായി, സംഘർഷ സാഹചര്യങ്ങൾ പലപ്പോഴും ബാധകമാണ് വ്യത്യസ്ത രീതികൾ ഒരു ശത്രുവിന്റെ ആമുഖം തെറ്റിദ്ധരിപ്പിക്കുന്നു (തെറ്റായ ആവശ്യങ്ങൾ, തെറ്റായ ആവശ്യങ്ങൾ മുതലായവ). ഒരു ഉദാഹരണം, ലാളിത്യം, വളരെ പ്രബോധനപരമായി.

ഉദാഹരണം 2. ഗെയിം അടുത്തതായി ഉൾക്കൊള്ളുന്നു. രണ്ട് കാർഡുകൾ ഉണ്ട്: ace, രണ്ടുതവണ. പ്ലെയർ, ക്രമരഹിതമായി അവയിലൊന്ന് പുറത്തെടുക്കുന്നു; അവൻ എന്ത് മാപ്പ് പുറത്തെടുത്ത മാപ്പ് കാണുന്നില്ല. ഞാൻ ഏസ് പുറത്തെടുത്തപ്പോൾ, "എനിക്ക് ഐസ് ഉണ്ട്," എതിരാളി 1 റൂബിൾ ആവശ്യമാണ്. ഞാൻ ഒരു ഇരട്ടകൾ പുറത്തെടുക്കുകയാണെങ്കിൽ, "എനിക്ക് ഐസ്" എന്നും അല്ലെങ്കിൽ ശത്രുക്കളിൽ നിന്ന് "എന്നും അല്ലെങ്കിൽ 2) അവന് രണ്ടുതവണ ഉണ്ടെന്ന് സമ്മതിക്കുകയും ശത്രു 1 റൂബിൾ നൽകുകയും ചെയ്യുക.

ശത്രു, സ്വമേധയാ 1 റൂബിൾ അടച്ചാൽ മാത്രമേ അത് എടുക്കൂ. അവന് 1 റൂബിൾ വേണമെങ്കിൽ, കളിക്കാരൻ വിശ്വസിക്കാൻ അവന് 1-ൽ ആകാം, പക്ഷേ അവന് ഒരു ട s ണ്ട് ചെയ്യാനും ആവശ്യമായി ആവശ്യപ്പെടാനും എ ആവശ്യങ്ങൾ ആവശ്യപ്പെടാനും അവന് ഒരു റൂബിൾ അല്ലെങ്കിൽ 2). തൽഫലമായി നിങ്ങൾ ശരിക്കും 2 റുബിളുകൾ നൽകണമെന്ന് ചെക്കുകൾ മാറുമെങ്കിൽ ശരിയാണ്. അദ്ദേഹം വഞ്ചിക്കുകയും അയാൾക്ക് രണ്ടുതവണ, ഒരു കളിക്കാരൻ ഉണ്ട്, കൂടാതെ കളിക്കാരൻ 2 റൂബിളിൽ പണം നൽകുന്നു. ഗെയിം വിശകലനം ചെയ്ത് ഓരോ കളിക്കാരുടെയും ഒപ്റ്റിമൽ തന്ത്രം കണ്ടെത്തേണ്ടതുണ്ട്.

തീരുമാനം. ഗെയിമിന് താരതമ്യേന സങ്കീർണ്ണ ഘടനയുണ്ട്; ഇതിൽ ഒരു നിർബന്ധിത ക്രമരഹിതമായ നീക്കം അടങ്ങിയിരിക്കുന്നു - ഒരു കളിക്കാരനും രണ്ട് കാർഡുകളിലും ഒന്ന് തിരഞ്ഞെടുക്കുന്നു - രണ്ട് വ്യക്തിഗത നീക്കങ്ങളും, എന്നിരുന്നാലും, ഇത് നടപ്പിലാക്കേണ്ടതില്ല. തീർച്ചയായും, ഞാൻ ഏസ് പുറത്തെടുക്കുകയാണെങ്കിൽ, അവൻ വ്യക്തിപരമായോവെടുക്കുന്നില്ല: അദ്ദേഹത്തിന് ഒരു സാധ്യത മാത്രമേ നൽകിയിട്ടുള്ളൂ - 1 റൂബിൾ ആവശ്യപ്പെടാൻ. ഈ സാഹചര്യത്തിൽ, വിശ്വസിക്കാനോ വിശ്വസിക്കാനോ ഒരു വ്യക്തിഗത നീക്കം (അതായത് 1 റൂബിൾ അടയ്ക്കരുതു) - ആദ്യ റാൻഡം നീക്കത്തിന്റെ ഫലമായി, അയാൾക്ക് രണ്ടുതവണ ലഭിച്ചിട്ടുണ്ടെങ്കിൽ, അദ്ദേഹത്തിന് ഒരു വ്യക്തിഗത നീക്കത്തിലൂടെ നൽകിയിട്ടുണ്ട്: 1 റൂബിൾ നൽകാനും ശത്രുവിനെ വഞ്ചിക്കാനും 1 റൂബിൾ ആവശ്യപ്പെടാനും ശ്രമിക്കുക (ചുരുക്കത്തിൽ: "വഞ്ചിക്കരുത്" അല്ലെങ്കിൽ "വഞ്ചിക്കരുത്"). ആദ്യത്തേത് തിരഞ്ഞെടുക്കുന്നു, അപ്പോൾ അത് 1 റൂബിൾ എടുക്കാൻ മാത്രമാണ്. ഞാൻ രണ്ടാമത്തേത് തിരഞ്ഞെടുത്തുവെങ്കിൽ, പ്ലെയർ ഒരു വ്യക്തിഗത നീക്കത്തിലൂടെ നൽകിയിട്ടുണ്ട്: വിശ്വസിക്കാൻ അല്ലെങ്കിൽ ഒരു (അതായത്, 1 റൂബിൾ അടയ്ക്കാനോ സ്ഥിരീകരിക്കാനോ ഉള്ളത്.

വ്യക്തിഗത നീക്കം നൽകുമ്പോൾ പ്ലെയർ നൽകുമ്പോൾ എങ്ങനെ നൽകാമെന്ന് സൂചിപ്പിക്കുന്ന നിയമങ്ങൾ ഓരോ കളിക്കാരുടെയും തന്ത്രങ്ങളാണ്. വ്യക്തമായും, രണ്ട് തന്ത്രങ്ങൾ മാത്രം: 1 - വഞ്ചന, 2 - വഞ്ചിക്കരുത്. B - യിലും രണ്ട് തന്ത്രങ്ങളും: ബി 1 - 2-ൽ വിശ്വസിക്കാൻ - വിശ്വസിക്കരുത്. ഒരു ഗെയിം മാട്രിക്സ് നിർമ്മിക്കുക. ഇതിനായി, തന്ത്രങ്ങളുടെ ഓരോ സംയോജനത്തിലും ഞങ്ങൾ ശരാശരി വിജയികൾ കണക്കാക്കുന്നു.

1. 1-ൽ 1 (വിശ്വാസികളായി). എനിക്ക് എസെഡ് ലഭിക്കുകയാണെങ്കിൽ (ഇതിന്റെ സാധ്യത) ഒരു വ്യക്തിഗത നീക്കം നൽകിയില്ല; അതിന് ഒരു റൂബിൾ ആവശ്യമാണ്. കിണറുടെയും റൂബിലും (ഇതിന്റെ സാധ്യത) ഇതും), അവൻ തന്റെ തന്ത്രം അനുസരിച്ച് വഞ്ചിക്കുകയാണ്, അത് അവനിൽ വിശ്വസിക്കുകയും ചെയ്യുന്നു. അത് അവനിൽ വിശ്വസിക്കുകയും ചെയ്യുന്നു. വിജയങ്ങളും 1. 1 നും തുല്യമാണ്: ഒരു 11 \u003d ½ * 1 ½ * 1 \u003d 1.

2. 2-ൽ 1 (വഞ്ചിക്കുന്നവർ). എനിക്ക് ഐസ് ലഭിക്കുകയാണെങ്കിൽ, അവന് വ്യക്തിപരമായോവമില്ല; ഇതിന് 1 റൂബിൾ ആവശ്യമാണ്; അതിന്റെ തന്ത്രത്തിന് അനുസൃതമായി, അത് വിശ്വസിക്കുന്നില്ല, പരിശോധനയുടെ ഫലമായി 2 റുബിളുകൾ (വിജയികൾ a +2). എനിക്ക് രണ്ടെണ്ണം കിട്ടിയാൽ, എന്റെ തന്ത്രമനുസരിച്ച് 1 റൂബിൾ ആവശ്യമാണ്; അകത്ത്, അത് വിശ്വസിക്കുന്നില്ല; തൽഫലമായി, ഇത് 2 റുബിളുകൾ (വിജയികൾക്ക് തുല്യമായത്) നൽകുന്നു. ശരാശരി വിജയം: ഒരു 12 \u003d ½ * (+ 2) + ½ * (- 2) \u003d 0.

3. 1 ൽ ഒരു 2 (വഞ്ചിക്കപ്പെടരുത്). ഞാൻ ഏസ് പുറത്തെടുത്താൽ, അതിന് 1 റൂബിൾ ആവശ്യമാണ്; അതിന്റെ തന്ത്രം അനുസരിച്ച്, പണമടയ്ക്കുന്നു; എ വിജയിക്കുന്നത് +1 ആണ്. ഞാൻ രണ്ടുതവണ പുറത്തെടുത്തെങ്കിൽ, അവൻ തന്റെ തന്ത്രം അനുസരിച്ച് റൂബിൾ നൽകുന്നു; അത് അംഗീകരിക്കാൻ മാത്രമാണ് (വിജയിക്കും) തുല്യമാണ്. ശരാശരി വിജയികൾ ഇവയാണ്: a 21 \u003d ½ * (+ 1) + ½ * (- 1) \u003d 0.

4. 2-ൽ 2 (വഞ്ചിക്കപ്പെടുന്നില്ല, b വിശ്വസിക്കുന്നില്ല). ഞാൻ ഏസ് പുറത്തെടുത്താൽ, അതിന് 1 റൂബിൾ ആവശ്യമാണ്; ചെക്കുകളിൽ, പരിശോധിക്കുന്നതിന്റെ ഫലമായി, 2 റൂബിൾസ് പണമടയ്ക്കുന്നു (വിജയം +2 ആണ്). ഞാൻ രണ്ടുതവണ പുറത്തെടുക്കുകയാണെങ്കിൽ, അത് 1 റൂബിൾ നൽകുന്നു; ഇത് അംഗീകരിക്കാൻ മാത്രമാണ് (വിജയം 1). ശരാശരി ജയം തുല്യമാണ്: ഒരു 22 \u003d ½ * (+ 2) + ½ * (- 1) \u003d.

ഗെയിം മാട്രിക്സ് നിർമ്മിക്കുക:

മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ല. ഗെയിമിന്റെ കുറഞ്ഞ വില α \u003d 0, ഗെയിമിന്റെ മുൻനിര വില β \u003d. സമ്മിശ്ര തന്ത്രങ്ങളുടെ രംഗത്ത് ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക. ഫോർമുല ഉപയോഗിച്ച് (4.3), ഞങ്ങൾക്ക് ലഭിക്കും:

ആ. കളിക്കാരിലെ ഒരു മൂന്നിലൊന്ന് പേരിൽ അതിന്റെ ആദ്യ തന്ത്രവും മൂന്നിൽ രണ്ട് ഭാഗവും ഉപയോഗിക്കുന്നു - മൂന്നിൽ രണ്ട് ഭാഗങ്ങൾ - രണ്ടാമത്തേത് (വഞ്ചിക്കപ്പെടില്ല). അതേസമയം, ഇത് ഗെയിമിന്റെ വില ശരാശരി വിജയിക്കും.

Ν \u003d 1/3 ന്റെ മൂല്യം സൂചിപ്പിക്കുന്നത്, ബി. അതിന്റേറ്റീവ് തന്ത്രം ഉപയോഗിച്ച് ലാഭകരവും ലാഭകരമല്ലാത്തതും പ്രയോജനകരമാണെന്ന് സൂചിപ്പിക്കുന്നു, ഇത് എല്ലായ്പ്പോഴും ഒരു പോസിറ്റീവ് മീഡിയം നേട്ടം നൽകാൻ കഴിയും. ഞാൻ എന്റെ ഏറ്റവും ശ്രദ്ധാപൂർവ്വം (പരമാവധി) തന്ത്രം ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിൽ (ഈ സാഹചര്യത്തിൽ, 1 ഉം ഒരു 2യും മാക്സിമൽ ആണ്, ഇതിന് പൂജ്യത്തിന് തുല്യമായ ശരാശരി നേട്ടമുണ്ടാകും. അങ്ങനെ, ഒരു സമ്മിശ്ര തന്ത്രത്തിന്റെ ഉപയോഗം നൽകുകയും ബി യുടെ നേട്ടം തിരിച്ചറിയാനുള്ള കഴിവ്, അത് ഗെയിമിന്റെ ഡാറ്റാ നിയമങ്ങൾക്കിടയിൽ സംഭവിക്കുന്നു.

ഒപ്റ്റിമൽ സ്ട്രാറ്റജി വി. ഞങ്ങൾ: Q 1 * 1 + q 2 * 0 \u003d 1/3, q 1 \u003d 1 \u003d 3 \u003d 2/3. മുതല്

ടെ. കളിക്കാരൻ എല്ലാ കേസുകളിലും മൂന്നിലൊന്ന് വിശ്വസിക്കുകയും പരിശോധിക്കാതിരിക്കുകയും മൂന്നിൽ രണ്ട് കേസുകളിലും നൽകുകയും വേണം. ഓരോ ഗെയിമിനും ശരാശരി 1/3 നഷ്ടപ്പെടും. തന്റെ മിനിമാക്സ് ശുദ്ധമായ തന്ത്രം 2 ആയി ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിൽ (വിശ്വസിക്കാനല്ല), ശരാശരി 1/2 ലെ ഓരോ ഗെയിമിലും അദ്ദേഹം നഷ്ടപ്പെടും.

ഗെയിമിന്റെ പരിഹാരം 2 × 2 ലളിതമായ ജ്യാമിതീയ വ്യാഖ്യാനം നൽകാം. ഒരു മാട്രിക്സ് ഉപയോഗിച്ച് 2 × 2 ഉണ്ടാകട്ടെ

അബ്സിസ്സ അക്ഷം വിഭാഗം 1 എടുക്കുക (ചിത്രം 4.1). വിഭാഗത്തിന്റെ ഇടത് അറ്റത്ത് (അബ്സിസ്സ എക്സ് \u003d 0 ഉള്ള പോയിന്റ് ഒരു 1 ചിത്രം ചിത്രീകരിക്കും; സൈറ്റിന്റെ വലത് അവസാനം (x \u003d 1) ഒരു തന്ത്രമാണ്. ഒന്നിൽ നിന്ന് 1, 2 രണ്ട് ലംബമായി ഒക്സിസ്സ അച്ചുതണ്ടിന് ലംബമായി മുറിക്കുക: ആക്സിസ് I.-I. ആക്സിസ് II-II.. അക്ഷത്തിൽ I.-I. ഒരു തന്ത്രം ഒരു 1 ആയിരിക്കുമ്പോൾ ഞങ്ങൾ വിജയികൾ മാറ്റിവയ്ക്കും; അക്ഷത്തിൽ II-II. - സ്ട്രാറ്റജിയോ ഉള്ള വഴികൾ a 2. ശത്രു തന്ത്രം പരിഗണിക്കുക b 1; ഇത് അക്ഷങ്ങളിൽ രണ്ട് പോയിന്റുകൾ നൽകുന്നു I.-I. ഒപ്പം II-II. യഥാക്രമം, യഥാക്രമം 11, 21, 21 എന്നിവ. ഈ പോയിന്റുകളിലൂടെ ഞങ്ങൾ നേരിട്ട് നേരിട്ട് ബി 1 ബി 1 ചെലവഴിക്കും. വ്യക്തമായും, ഞങ്ങൾ, ശത്രു തന്ത്രമായ ബി 1 ഉപയോഗിച്ച്, ഞങ്ങൾ ഒരു മിശ്രിത തന്ത്രം പ്രയോഗിക്കും

തുടർന്ന് ഞങ്ങളുടെ ശരാശരി വിജയികൾ ഈ സാഹചര്യത്തിൽ തുല്യമാണ്, ഒരു ബി 1 ലെ ഒരു വരിയിൽ ഒരു പോയിന്റ് എം. ഈ പോയിന്റിലെ അബ്സിസ്സ പി 2 ന് തുല്യമാണ്. 1 ൽ 1 ൽ 1 ൽ നേരിട്ട്, 1 ൽ തന്ത്രമുള്ള തന്ത്രമുള്ള തന്ത്രം ചിത്രീകരിക്കുന്നതിന് "1 തന്ത്രം" എന്ന് വിളിക്കാൻ സമർപ്പിക്കും.

വ്യക്തമായും, 2 ലെ ഒരു തന്ത്രം അതേ രീതിയിൽ നിർമ്മിക്കാൻ കഴിയും (ചിത്രം 4.2).

ഞങ്ങൾക്ക് ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് എ *, ഐ.ഇ. ഇത് ചെയ്യുന്നതിന്, 1, 2-ൽ 1, i.e.e.ഇയിലെ തന്ത്രപ്രധാനമുള്ള വിജയത്തിന്റെ താഴത്തെ അതിർത്തി ഞങ്ങൾ നിർമ്മിക്കുന്നു. തകർന്ന b 1 എൻബി 2 ചിത്രം. 4.2 കൊഴുപ്പ് രേഖ. ഈ താഴ്ന്ന പരിധി മിനിമം കളിക്കാരൻ ഏതെങ്കിലും സമ്മിശ്ര തന്ത്രങ്ങളുമായി വിജയിക്കും; പോയിന്റ് എൻ, അതിൽ ഈ മിനിമം വിജയികൾ പരമാവധി എത്തുന്നു, ഇത് ഗെയിമിന്റെ പരിഹാരവും വിലയും നിർണ്ണയിക്കുന്നു. നോട്ടിന്റെ നിർദേശം ഗെയിമിന്റെ വിലയാണ് ν, അതിന്റെ അബ്സിസ്സയ്ക്ക് തുല്യമാണ് എന്ന് ഉറപ്പാക്കുന്നത് എളുപ്പമാണ് - ഒപ്റ്റിമൽ മിക്സഡ് സ്ട്രാറ്റജി എസ് എ *

ഞങ്ങളുടെ കാര്യത്തിൽ, ഗെയിമിന്റെ പരിഹാരം നിർണ്ണയിച്ചത് തന്ത്രങ്ങളുടെ കവലയാണ്. എന്നിരുന്നാലും, അത് എല്ലായ്പ്പോഴും അങ്ങനെയായിരിക്കില്ല; ചിത്രം. തന്ത്രങ്ങളുടെ കവലയുടെ സാന്നിധ്യം ഉണ്ടായിരുന്നിട്ടും, പരിഹാരം രണ്ട് കളിക്കാർക്കും (2, 2), ഗെയിമിന്റെ വില എന്നിവയ്ക്ക് 4.3 കേസ് കാണിക്കുന്നു. ഈ സാഹചര്യത്തിൽ, മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റും ഉണ്ട്, ഒരു തന്ത്രം ഒരു തന്ത്രം വ്യക്തമായും ലാഭകരമല്ല, കാരണം ശുദ്ധമായ ശത്രു തന്ത്രത്തോടെ, ഇത് 2 നേക്കാൾ ചെറിയ നേട്ടവും നൽകുന്നു.

കേസിൽ ഒരു പ്രതികൂലമായ ഒരു തന്ത്രം ഒരു എതിരാളിയുണ്ടെങ്കിൽ, ജ്യാമിതീയ വ്യാഖ്യാനം ചിത്രം അവതരിപ്പിച്ച രൂപം ഉണ്ട്. 4.4.

ഈ സാഹചര്യത്തിൽ, വിജയത്തിന്റെ താഴത്തെ അതിർത്തി 1-ലെ തന്ത്രവുമായി പൊരുത്തപ്പെടുന്നു, 2 ലെ തന്ത്രം ശത്രുവിന് ദോഷകരമാണ്.

ജ്യാമിതീയ വ്യാഖ്യാനം കളിയുടെ അടിയും മികച്ച വിലയും സങ്കൽപ്പിക്കാൻ സഹായിക്കുന്നു (ചിത്രം 4.5).

ഉദാഹരണമായി, ഉദാഹരണങ്ങളിൽ ചർച്ച ചെയ്ത 2 × 2 കളികളുടെ ജ്യാമിതീയ വ്യാഖ്യാനങ്ങൾ ഞങ്ങൾ നിർമ്മിക്കും (ചിത്രം 4.6, 4.7).

ഏതെങ്കിലും 2 × 2 ഗെയിം പ്രാഥമിക സാങ്കേതിക വിദ്യകൾ ഉപയോഗിച്ച് പരിഹരിക്കാൻ കഴിയുമെന്ന് ഞങ്ങൾ ഉറപ്പാക്കി. ഏതെങ്കിലും 2 എക്സ്എൻ ഗെയിം പൂർണ്ണമായും പരിഹരിക്കാൻ കഴിയും. ഞങ്ങൾക്ക് രണ്ട് തന്ത്രങ്ങൾ മാത്രമേയുള്ളൂ, എതിരാളിക്ക് അനിയന്ത്രിതമായ ഒരു സംഖ്യയുണ്ട്.

ഞങ്ങൾക്ക് രണ്ട് തന്ത്രങ്ങൾ നൽകാം: ഒരു 1, ഒരു 2, എതിരാളി - എൻ തന്ത്രങ്ങൾ: 1, 2-ൽ ... മാട്രിക്സ് ‖A ij a സജ്ജമാക്കി; അതിൽ രണ്ട് വരികളും എൻ നിരകളും അടങ്ങിയിരിക്കുന്നു. രണ്ട് തന്ത്രങ്ങളുടെ കാര്യത്തിന് സമാനമായതിനാൽ, ഞങ്ങൾ ഒരു ജ്യാമിതീയ വ്യാഖ്യാനം നൽകും; N ശത്രു തന്ത്രങ്ങൾ N നേരിട്ട് കാണിക്കുന്നു (ചിത്രം 4.8). വിൻനിംഗുകളുടെ കുറഞ്ഞ പരിധി ഞങ്ങൾ നിർമ്മിക്കുന്നു (തകർന്ന ബി 1 എംഎൻബി 2), പരമാവധി റെസിഡൻസി ഉപയോഗിച്ച് ഞങ്ങൾ പോയിന്റ് എൻ കണ്ടെത്തുന്നു. ഈ പോയിന്റ് ഗെയിമിന്റെ ഒരു ഗെയിം നൽകുന്നു (തന്ത്രം ) ഓർഡിനേറ്റ് പോയിന്റ് എൻ ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമാണ് ν, അബ്സിസ്സയുടെ തന്ത്രത്തിന്റെ p 2 ന്റെ ആവൃത്തിയ്ക്ക് തുല്യമാണ്.

ഈ സാഹചര്യത്തിൽ, രണ്ട് "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങളുടെ മിശ്രിതം ഉപയോഗിച്ച്, 2-ൽ 4-ൽ നോമ്പുകാലങ്ങളിൽ ഒപ്റ്റിമൽ ശത്രു തന്ത്രം ലഭിക്കും Sa *. എന്നിരുന്നാലും, അത് അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രം പാലിക്കുമെന്നെങ്കിൽ, എന്നിരുന്നാലും, അതിൻറെ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ എത്രയാണെങ്കിലും, അത് b 1 അല്ലെങ്കിൽ 3 എന്ന സ്ട്രാറ്ററുകളിലേക്ക് പോയാൽ അത് മാറും. സിദ്ധാന്ത്രി സിദ്ധാന്തത്തിൽ, ഏതെങ്കിലും ആത്യന്തിക MXN ഗെയിമിൽ മറുവശത്തെ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങളുടെ എണ്ണം രണ്ട് അക്കങ്ങളെയും എൻയുടേതിനേക്കാൾ ചെറുതായിരിക്കില്ലെന്ന് തെളിഞ്ഞു. പ്രത്യേകിച്ചും, 2 എക്സ്എം ഗെയിമിന് എല്ലായ്പ്പോഴും ഒരു പരിഹാരം ഉണ്ട്, അതിൽ 2xm ഗെയിമിന് എല്ലായ്പ്പോഴും ഒരു പരിഹാരം ഉണ്ട്, അതിൽ മറുവശത്ത് നിന്ന് രണ്ടിൽ കൂടുതൽ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങളൊന്നുമില്ല.

ജിയോമെട്രിക് വ്യാഖ്യാനം ഉപയോഗിച്ച്, ഏതെങ്കിലും 2 എക്സ്എം ഗെയിം പരിഹരിക്കാൻ നിങ്ങൾക്ക് ഒരു എളുപ്പ മാർഗം നൽകാൻ കഴിയും. നേരിട്ട് ഡ്രോയിംഗുകൾക്കനുസരിച്ച് ശത്രു ബി യുടെ ഒരു ജോഡി ശത്രു ബി യും യും എന്ന ഒരു ജോഡി കണ്ടെത്തുന്നു, k ൽ, പോയിന്റ് n (പോയിന്റ് n രണ്ട് തന്ത്രങ്ങൾ കടക്കുന്നുവെങ്കിൽ, അവയിൽ രണ്ടെണ്ണം എടുക്കുകയും ചെയ്യുക). ഒരു കളിക്കാരനും അതിന്റെ ഒപ്റ്റിമൽ തന്ത്രമുണ്ടെങ്കിൽ, വിജയിക്കുന്നത് ഏത് അനുപാതം "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾക്ക് ബാധകമാണെന്ന് ഞങ്ങൾ ആശ്രയിക്കുന്നില്ലെന്ന് നമുക്കറിയാം.

ഈ സമവാക്യങ്ങളും അവസ്ഥകളും p 2 \u003d 1 - പി 1, ഞങ്ങൾ p1, p2, ഗെയിമിന്റെ വില എന്നിവ കാണുന്നു. കളിയുടെ വില അറിയുന്നത്, നിങ്ങൾക്ക് ഉടനടി ഒപ്റ്റിമൽ തന്ത്രം നിർണ്ണയിക്കാൻ കഴിയും ഇത് ചെയ്യുന്നതിന്, പരിഹരിക്കപ്പെട്ടിരിക്കുന്നത്, ഉദാഹരണത്തിന്, സമവാക്യം: QJ + qk \u003d 1. ഞങ്ങൾക്ക് എം തന്ത്രങ്ങൾ ഉള്ളപ്പോൾ ശത്രുവിന് രണ്ടുതവണ മാത്രമാണ് , ചുമതല പൂർണ്ണമായും സമാനമായ രീതിയിൽ പരിഹരിക്കപ്പെടുന്നു .; വിപരീതമായി മാറ്റുന്നതിലൂടെ നിങ്ങൾക്ക് എതിർവശത്ത് മാറ്റുന്നതിലൂടെ, നിങ്ങൾക്ക് കളിക്കാരനെയും "നേടുന്നതിൽ" നിന്നും "നഷ്ടപ്പെടാൻ" മാറ്റാം. നിങ്ങൾക്ക് ഗെയിം പരിഹരിക്കാൻ കഴിയും, ജ്ഞാനം അടയാളം മാറ്റാതെ; അപ്പോൾ ചുമതല ബിക്കുമായി നേരിട്ട് പരിഹരിക്കുന്നു, പക്ഷേ താഴത്തെവയല്ല, മറിച്ച് വിജയികളുടെ ഉയർന്ന പരിധി (ചിത്രം 4.9). അതിർത്തിയിൽ കുറഞ്ഞ നിർണ്ണയിക്കുന്നതിനൊപ്പം ഒരു പോയിന്റ് എൻ തിരയുകയാണ്, അത് ഗെയിമിന്റെ വിലയാണ് ν.

പ്രായോഗിക ഗെയിമുകളുടെ ലളിതമായ മാതൃകകളുള്ള 2 × 2, 2 എക്സ്എം ഗെയിമുകളുടെ നിരവധി ഉദാഹരണങ്ങൾ പരിഗണിക്കുക.

ഉദാഹരണം 3.പാർട്ടി രണ്ടു ബോംബറിലേക്ക് ശത്രുവിനെ അയയ്ക്കുന്നു I. ഒപ്പം Ii.; I. മുന്നിൽ പറക്കുന്നു Ii. - പുറകിലുള്ള. ഒരു ബോംബറുകളിലൊന്ന് - ഇത് മുൻകൂട്ടി അറിയില്ല - ഒരു ബോംബ് ഉണ്ടായിരിക്കണം, മറ്റൊന്ന് അനുഗൃത്തൽ പ്രവർത്തനം നടത്തുന്നു. എതിരാളിയുടെ പ്രദേശത്ത്, വി. ബോംബാക്രമണങ്ങളാൽ ബോംബർ ആക്രമിക്കുന്നത് വ്യത്യസ്ത വേഗതയുള്ള ഗുണങ്ങളുമായി ആയുധധാരികളാണ്. പോരാളിയെ പിൻ ബോംബറിനെ ആക്രമിച്ചാൽ Ii., ഈ ബോംബാർഡറുടെ മാത്രം തീ അതിൽ മുന്നിലാണ്; മുൻ ബോംബറിനെ അദ്ദേഹം ആക്രമിച്ചാൽ, രണ്ട് ബോംബറുകളുടെയും തോക്കുകൾ അതിൽ നയിക്കുന്നു. ആദ്യ കേസിൽ പോരാളി നിഖേദ് 0.3 ആണ്, രണ്ടാം 0.7.

പോരാളിയെ പ്രതിരോധാത്മക വരിയിലൂടെ വെടിവച്ചില്ലെങ്കിൽ, 0.6 എന്ന ലക്ഷ്യം ഉപയോഗിച്ച് അദ്ദേഹം അവർക്ക് തിരഞ്ഞെടുത്ത ലക്ഷ്യം അവരെ അടിക്കുന്നു. ഗോളിലേക്ക് ഒരു ബോംബ് എത്തിക്കാൻ ബോംബറിന്റെ ചുമതല; ഇത് തടയുക എന്നതാണ് പോരാളിയുടെ ചുമതല, I.e. കാരിയർ ബോംബർ ലോഡുചെയ്യുക. പാർട്ടികളുടെ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കേണ്ടതുണ്ട്:

a) പാർട്ടി എ: ഒരു വാഹനം ഉണ്ടാക്കാനുള്ള ബോംബർ എന്താണ്?

b) പാർട്ടി Q: ഏത് ബോംബറിനെ ആക്രമിക്കുന്നു?

തീരുമാനം. 2 × 2 കളിക്കുന്നതിൽ ഞങ്ങൾക്ക് ലളിതമായ ഒരു കേസ് ഉണ്ട്; അന്വേഷിക്കുന്ന സാധ്യത ഡിസ്പോസിബിൾ കാരിയർ. ഞങ്ങളുടെ തന്ത്രങ്ങൾ: 1 - കാരിയർ - ബോംബർ I.; ഒപ്പം 2 - കാരിയർ - ബോംബർ Ii.. എൻട്രറ്ററി സ്ട്രാറ്റജി: 1 ൽ - ബോംബറിനെ ആക്രമിക്കുന്നു I.; 2-സ്ട്രെയിറ്റ് ബോംബറിൽ Ii.. നമുക്ക് ഗെയിമിന്റെ മാട്രിക്സ് ഉണ്ടാക്കാം, I.E. തന്ത്രങ്ങളുടെ ഓരോ കോമ്പിനേഷനുമായുള്ള ശരാശരി നേട്ടം ഞങ്ങൾ കണ്ടെത്തുന്നു.

1. 1 ൽ 1 (കാരിയർ I.ആക്രമിക്കുന്നു I.). ബോംബറുകൾ ഒരു പോരാളിയെ ശേഖരിക്കുകയാണോ അതോ ഡിസ്ചാർജ് ചെയ്യരുത്, പക്ഷേ അത് തന്റെ ലക്ഷ്യത്തിൽ തട്ടുകയില്ലെങ്കിൽ കാരിയർ ആശ്ചര്യപ്പെടില്ല: ഒരു 11 \u003d 0.7 + 0.3 * 0.4 \u003d 0.82.

2. 1 ൽ 2 (കാരിയർ Ii.ആക്രമിക്കുന്നു I.). ഒരു 21 \u003d 1

3. 2 ൽ 1 (കാരിയർ I.ആക്രമിക്കുന്നു Ii.). ഒരു 12 \u003d 1

4. 2 ൽ 2 (കാരിയർ Ii.ആക്രമിക്കുന്നു Ii.). 22 \u003d 0.3 + 0.7 * 0.4 \u003d 0.58

ഗെയിമിന്റെ മാട്രിക്സിന് ഫോം ഉണ്ട്:

ഗെയിമിന്റെ കുറഞ്ഞ വില 0.82; മികച്ച വില 1. മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ല; സമ്മിശ്ര തന്ത്രങ്ങളുടെ വയലിൽ ഞങ്ങൾ തിരയുന്ന പരിഹാരം. നമുക്ക് ഉണ്ട്:

p 1 * 0.82 + P 2 * 1 \u003d

പേജ് 1 * 1 + p 2 * 0,58 \u003d

p 1 \u003d 0.7; പി 2 \u003d 0.3

നമ്മുടെ ഒപ്റ്റിമൽ തന്ത്രം I.e. ഒരു കാരിയർ എന്ന നിലയിൽ നിങ്ങൾ കൂടുതൽ തിരഞ്ഞെടുക്കേണ്ടതുണ്ട് I.... ക്കാളും Ii.. കളിയുടെ വില ν \u003d 0.874 ന് തുല്യമാണ്. അറിയുന്നത്, ഞങ്ങൾ Q 1, Q 2 എന്നിവ നിർണ്ണയിക്കുന്നു - ഒന്നിൽ 1, 2-ൽ തന്ത്രങ്ങളുടെ ആവൃത്തി ഒപ്റ്റിമൽ ശത്രു തന്ത്രത്തിന്റെ b *. ഞങ്ങൾക്ക് ഉണ്ട്: Q 1 * 0.82 + Q 2 * 1 \u003d 0.874, q 2 \u003d 1 - ക്യു 1, Q 1 \u003d 0.7; Q 2 \u003d 0.3, I.E., ഒപ്റ്റിമൽ ശത്രു തന്ത്രം .

ഉദാഹരണം 4.പാർട്ടി ഒബ്ജക്റ്റിനെ ആക്രമിക്കുന്നു, പാർട്ടി അദ്ദേഹത്തെ പ്രതിരോധിക്കുന്നു. ഒരു - രണ്ട് വിമാനത്തിൽ നിന്ന്; ബി - മൂന്ന് സെനിത്ത് തോക്കുകൾ. ഓരോ വിമാനവും ശക്തമായ സ്നേഹനിർഭരമായ ഒരു കാരിയറാണ്; ഒബ്ജക്റ്റ് ആശ്ചര്യപ്പെടുന്നതിന്, കുറഞ്ഞത് ഒരു വിമാനത്തിൽ തകർക്കാൻ പര്യാപ്തമാണ്. വിമാനത്തിൽ സമീപിക്കാൻ വിമാനങ്ങളിൽ ഏതെങ്കിലും മൂന്ന് ദിശകൾ തിരഞ്ഞെടുക്കാനും കഴിയും: I., Ii., III (ചിത്രം 4.10). ശത്രുവിഭാഗത്തിന് (സൈഡ് സി) അതിന്റെ തോക്കുകളെ ഏതെങ്കിലും ദിശയിലേക്ക് ഉൾക്കൊള്ളാൻ കഴിയും; ഈ സാഹചര്യത്തിൽ, ഓരോ ഉപകരണവും ഈ പ്രദേശവുമായി ബന്ധപ്പെട്ട സ്ഥലത്തിന്റെ വിസ്തീർണ്ണം മാത്രമേ എടുക്കൂ, കൂടാതെ അയൽ ദിശകൾ ഷൂട്ട് ചെയ്യുന്നില്ല. ഓരോ ആയുധത്തിനും ഒരു വിമാനം മാത്രമേ വെടിവയ്ക്കാൻ കഴിയൂ; പുറത്തായ വിമാനത്തിൽ ഒരു പ്രോബബിലിറ്റി ഉപയോഗിച്ച് ആശ്ചര്യപ്പെടുന്നു. പാർട്ടി എവിടെ സ്ഥാപിച്ചിരുന്നത് നിങ്ങൾക്കറിയില്ല; പാർട്ടികൾ എവിടെ നിന്ന് വരുന്നുവെന്ന് പാർട്ടിക്ക് അറിയില്ല. A ന്റെ ഭാഗത്തിന്റെ ചുമതല ഒബ്ജക്റ്റിൽ അടിക്കുക എന്നതാണ്; കക്ഷികളുടെ ലക്ഷ്യം - അതിന്റെ തോൽവി തടയാൻ. ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക.

തീരുമാനം. ഗെയിം 2 × 3 ഗെയിമാണ്. ഒബ്ജക്റ്റ് കേടുപാടുകൾ വരുന്നതാണ് വിജയി. ഞങ്ങളുടെ സാധ്യമായ ഞങ്ങളുടെ തന്ത്രങ്ങൾ: ഒരു 1 - ഒരു വിമാനം രണ്ട് വ്യത്യസ്ത ദിശകളിലേക്ക് അയയ്ക്കുക. ഒരു 2 - രണ്ട് വിമാനങ്ങളും ഒരു ദിശയിലേക്ക് അയയ്ക്കുക. എൻട്രറ്ററി തന്ത്രം: 1 ൽ - ഓരോ ദിശയിലേക്കും ഒരു ഉപകരണത്തിലേക്ക് ഒന്ന് ഇടുക; 2-ൽ - രണ്ട് തോക്കുകൾ ഒരു ദിശയിലും മറ്റൊന്ന് വരെയും ഇടുക; 3 ൽ - മൂന്ന് തോക്കുകളും ഒരു ദിശയിലേക്ക് ഇടുക. ഗെയിമിന്റെ മാട്രിക്സ് ഉണ്ടാക്കുക.

1. 1 ൽ 1 (വിമാന ഈച്ച വ്യത്യസ്ത മേഖലകൾ; തോക്കുകൾ ക്രമീകരിച്ചിരിക്കുന്നു). വ്യക്തമായും, വിമാനത്തിന് വിമാനങ്ങളൊന്നും വേർപെടുത്തുകയില്ല: ഒരു 11 \u003d 0.

2. 1 ൽ ഒരു 2 (ഒറ്റ ദിശയിൽ ഒരുമിച്ച് പറക്കുക; തോക്കുകൾ ഓരോന്നായി സ്ഥാപിച്ചിരിക്കുന്നു). വ്യക്തമായും, അതേ സമയം ഒരു വിമാനം താൽപ്പര്യമില്ലാത്തവർ ഒബ്ജക്റ്റിലേക്ക് കടക്കും: 21 \u003d 1.

3. 1 മുതൽ 2 വരെ (എയർപോർട്ടിന് ഓരോന്നായി പറക്കുക; എതിരാളി രണ്ട് ദിശകളും സുരക്ഷിതമല്ലാത്ത മൂന്നാമത് പുറത്തെടുക്കുകയും ചെയ്യുന്നു). ഒബ്ജക്റ്റിലേക്ക് ഒരു വിമാനങ്ങളെങ്കിലും ഒബ്ജക്റ്റുചെയ്യാൻ തുല്യമാണെന്ന് സാധ്യത അവയിലൊന്ന് സുരക്ഷിതമല്ലാത്ത ഒരു ദിശ തിരഞ്ഞെടുക്കും: 12 \u003d 2/3.

4. 2-ൽ 2 (ഒറ്റ ദിശയിലേക്കും ഒരു ദിശയെ രണ്ട് ഉപകരണങ്ങളും ഒരെണ്ണം ഉപയോഗിച്ച് ഒരു ദിശയെ സംരക്ഷിക്കുന്നു, അതായത് സുരക്ഷിതമല്ലാത്ത രണ്ടെണ്ണം സംരക്ഷിക്കുകയും ഇലകൾ മാറ്റുകയും ചെയ്യുന്നു). ഒബ്ജക്റ്റിലേക്ക് ഒരു വിമാനമെങ്കിലും ഒബ്ജക്റ്റിലേക്ക് വേർപെടുത്തുന്ന സാധ്യത ഒരു ജോഡി വിമാനത്തിന്റെ സാധ്യതയ്ക്ക് തുല്യമാണ്: ഒരു 22 \u003d 2/3.

5. 1 മുതൽ 3 വരെ (എയർപോർട്ട് ഓരോന്നായി പറക്കുക; എതിരാളി മൂന്ന് ആയുധങ്ങൾ ഒരു ദിശയെ മാത്രം സംരക്ഷിക്കുന്നു): ഒരു 13 \u003d 1.

6. 36-ൽ 3 (എയർപോർട്ടിൻ ഒരുമിച്ച് പറക്കുക; എതിരാളി മൂന്ന് ആയുധങ്ങൾ ഒരു ദിശയെ മാത്രം സംരക്ഷിക്കുന്നു). ഒബ്ജക്റ്റ് ആശ്ചര്യപ്പെടുന്നതിന്, വിമാനം സുരക്ഷിതമല്ലാത്ത ഒരു ദിശ തിരഞ്ഞെടുക്കണം: എ 23 \u003d 2/3.

മാട്രിക്സ് ഗെയിമുകൾ:

മാട്രിക്സിൽ നിന്ന് 3 ന്റെ തന്ത്രം ബി 2 നെ അപേക്ഷിച്ച് പ്രതികൂലമാണെന്ന് വ്യക്തമാണ് (ഇത് മുൻകൂട്ടി പരിഹരിക്കാൻ കഴിയുമായിരുന്നു). 3 ഗെയിമിൽ തന്ത്രം പ്രകടിപ്പിക്കുന്നത് ഗെയിമിലേക്ക് 2 × 2 വരെ വരുന്നു:

മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഉണ്ട്: ഗെയിമിന്റെ കുറഞ്ഞ വില 2/3 മുകളിലുമായി പൊരുത്തപ്പെടുന്നു. അതേസമയം, നമുക്കുവേണ്ടി (എ), ഒരു തന്ത്രം വ്യക്തമായും ദോഷകരമാണെന്ന് ഞങ്ങൾ ശ്രദ്ധിക്കുന്നു. ഉപസംഹാരം: ഇരു പാർട്ടികളും എല്ലായ്പ്പോഴും അവരുടെ ശുദ്ധമായ തന്ത്രങ്ങൾ ഒരു 2, ബി 2, i.e. നീരാവി അയച്ച ഒരു ക്രമരഹിതമായ ദിശ തിരഞ്ഞെടുക്കുന്ന ഒരു ക്രമരഹിതമായ ദിശ തിരഞ്ഞെടുക്കുന്ന ഞങ്ങൾ വിമാനം അയയ്ക്കണം; ശത്രുക്കൾ ഇതുപോലുള്ള തോക്കുകൾ ഇടും: രണ്ടെണ്ണം - ഒരു ദിശയിൽ, മറ്റൊന്ന്, മറ്റൊന്ന്, ഈ പ്രദേശങ്ങൾ, ഇതിനകം "ശുദ്ധമായ തന്ത്രങ്ങൾ" എന്നിവയുടെ തിരഞ്ഞെടുക്കപ്പെടും അവസരം). ഈ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ പ്രയോഗിക്കുമ്പോൾ, ഞങ്ങൾക്ക് എല്ലായ്പ്പോഴും ഒരു സ്ഥിരമായ ശരാശരി വിജയികൾ ലഭിക്കും 2/3 (i.e. ഒരു ഒബ്ജക്റ്റിനെ 2/3 ന്റെ സാധ്യതയെ ബാധിക്കും). കണ്ടെത്തിയ പരിഹാരം മാത്രം മാത്രമല്ല; ശുദ്ധമായ തന്ത്രങ്ങളിൽ പരിഹരിക്കുന്നതിന് പുറമേ, പ്യൂപ്ലെയർ, പി 1 \u003d 1/3 മുതൽ പി 1/3 വരെ (ചിത്രം 4.11) മുതൽ അത് ഒരു കളിക്കാരന്റെ സമ്മിശ്ര തന്ത്രങ്ങൾ ഉണ്ട് (ചിത്രം 4.11).

എളുപ്പത്തിൽ, അതേ ശരാശരി വിജയികൾ വിജയിക്കുമെന്ന് ഉറപ്പാക്കുക, 1/3, 2/3 അനുപാതത്തിൽ ഞങ്ങളുടെ 1, 2 തന്ത്രങ്ങൾ പ്രയോഗിക്കുകയാണെങ്കിൽ.

ഉദാഹരണം 5. മുമ്പത്തെ ഉദാഹരണത്തിലെ അതേ വ്യവസ്ഥകൾ, എന്നാൽ നമുക്ക് നാലു സ്വാധീനം ചെലുത്തുന്നു, ശത്രുവിന് നാല് തോക്കുകളുണ്ട്.

തീരുമാനം.ഞങ്ങൾക്ക് ഇപ്പോഴും സാധ്യമായ രണ്ട് തന്ത്രങ്ങളുണ്ട്: ഒരു 1 - വിമാനം ഒന്ന്, 2 - രണ്ട് വിമാനം ഒരുമിച്ച് അയയ്ക്കുക. എതിരാളിക്ക് സാധ്യമായ അഞ്ച് തന്ത്രങ്ങളുണ്ട്: 1 ൽ - ഓരോ ദിശയിലേക്കും ഒരെണ്ണം ഉപകരണത്തിലേക്ക് ഇടുക; 2-ൽ - രണ്ട് തോക്കുകൾ രണ്ട് വ്യത്യസ്ത ദിശകളിലേക്ക് ഇടുക; 3-ൽ - രണ്ട് തോക്കുകൾ ഒരു ദിശയിലേക്കും ഓരോന്നായി ഒന്ന് വരെ ഇടുക; 4 ൽ മൂന്ന് തോക്കുകൾ ഒരു ദിശയിലും ഒന്നായിയിലേക്കും ഇടുക; 5-ൽ - നാല് തോക്കുകളും ഒരു ദിശയിലേക്ക് ഇടുക. 4 ലെ തന്ത്രങ്ങൾ, 5 ൽ 5 പേർ മുൻകൂട്ടി പ്രതികൂലമായി പ്രതികൂലമായി എറിയുന്നു. മുമ്പത്തെ ഉദാഹരണത്തിന് സമാനമായി വാദിക്കുന്ന ഞങ്ങൾ ഗെയിമിന്റെ മാട്രിക്സ് നിർമ്മിക്കുന്നു:

1/2 ഗെയിമിന്റെ കുറഞ്ഞ വില, അപ്പർ 3/4. മാട്രിക്സിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ല; മിശ്രിത തന്ത്രങ്ങളുടെ വസഭാഗത്താണ് തീരുമാനം. ജ്യാമിതീയ വ്യാഖ്യാനം (ചിത്രം 4.12), ഞങ്ങൾ "ഉപയോഗപ്രദ" ശത്രു തന്ത്രങ്ങൾ ഉയർത്തിക്കാട്ടുന്നു: 1, 2-ൽ.

ആവൃത്തികൾ പി 1, പി 2 ഞങ്ങൾ സമവാക്യങ്ങൾ ഒഴിവാക്കുന്നു: പി 1 * 0 + (1 - പി 1) * 1 \u003d ν, പി 1 * 5 + (1 - പി 1) * 1/2 \u003d ν; അവിടെ p 1 \u003d 3/8; p 2 \u003d 5/8; ν \u003d 5/8, I.E. ഞങ്ങളുടെ ഒപ്റ്റിമൽ തന്ത്രം . ഇത് ഉപയോഗിക്കുന്നു, ശരാശരി വിജയികൾ ഞങ്ങൾ സ്വയം ഉറപ്പ് നൽകുന്നു 5/8. ഗെയിമിന്റെ വില അറിയുന്നത് Q 1, q 2 എന്നിവ ഞങ്ങൾ കണ്ടെത്തുന്നു ക്യു 1, q 2 "ഉപയോഗപ്രദമായ" ശത്രു തന്ത്രങ്ങൾ ഞങ്ങൾ കാണുന്നു: Q 1 * 0 + (1 - Q 1) * 5/6 \u003d 5/8, Q 1 \u003d 1 \u003d Q, Q 2 \u003d. ഒപ്റ്റിമൽ ശത്രു തന്ത്രം ആയിരിക്കും: .

ഉദാഹരണം 6. പാർട്ടി എ 2, ഒരു 2, സൈഡ് ബി - നാല് ബി 1, 2, 3 എന്നിവയിൽ 3, 4 ൽ. ഗെയിമിന്റെ മാട്രിക്സിന് ഫോം ഉണ്ട്:

ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക.

തീരുമാനം. ഗെയിമിന്റെ കുറഞ്ഞ വില; മികച്ച 4. ജ്യാമിതീയ വ്യാഖ്യാനം (ചിത്രം 4.13) ആർക്കാണ് കളിക്കാരന്റെ ഉപയോഗപ്രദമായ തന്ത്രങ്ങൾ 1, 2 അല്ലെങ്കിൽ 2, 4 ൽ:

പ്ലെയർ എമിംഗിന് അനന്തമായ പല സമ്മിശ്ര തന്ത്രങ്ങളും ഉണ്ട്: ഒപ്റ്റിമൽ സ്ട്രാറ്റജി പി 1 ൽ, ഇത് 1/5 മുതൽ 4/5 വരെ വ്യത്യാസപ്പെടാം. ഗെയിമിന്റെ വില ν \u003d 4. പ്ലെയറിന് 2-ൽ ക്ലീൻ ഒപ്റ്റിമൽ തന്ത്രമുണ്ട്.

§ അഞ്ച്. പൊതു രീതികൾ അവസാന ഗെയിമുകളുടെ തീരുമാനങ്ങൾ

ഞങ്ങൾക്ക് ഇതുവരെ ഏറ്റവും പ്രാഥമിക ഗെയിമുകൾ മാത്രമേയുള്ളൂ, അത് വളരെ പരിഹരിക്കാനും സൗകര്യപ്രദവും വിഷ്വൽ ജ്യാമിതീയ വ്യാഖ്യാനവും അനുവദിക്കാനും കഴിയും. എംഎക്സ്എൻ ഗെയിം പരിഹാരം ഒരു വിഷയത്തിന്റെ സങ്കീർണ്ണതയെ പ്രതിനിധീകരിക്കുന്നു, മാത്രമല്ല എം, എൻ എന്നിവ ഉപയോഗിച്ച് കണക്കുകൂട്ടൽ വർദ്ധിപ്പിക്കുന്നതിന് ആവശ്യമായ കണക്കുകൂട്ടൽ അളവും. എന്നിരുന്നാലും, ഈ ബുദ്ധിമുട്ടുകൾ അടിസ്ഥാനപരമായ സ്വഭാവം വഹിക്കുന്നില്ല, വളരെ വലിയ അളവിലുള്ള സെറ്റിൽമെന്റുകളിൽ മാത്രം ബന്ധപ്പെട്ടിരിക്കുന്നു, ചില സാഹചര്യങ്ങളിൽ പ്രായോഗികമായി അസാധ്യമാണ്. തീരുമാനത്തിന്റെ തീരുമാനത്തിന്റെ പ്രധാന വശം ഏതെങ്കിലും m എന്നതുമായി തുടരുന്നു.

ഗെയിമിന്റെ ഉദാഹരണത്തിന് ഞങ്ങൾ ഇത് വിശദീകരിക്കുന്നു. നമുക്ക് അവളുടെ ജ്യാമിതീയ വ്യാഖ്യാനം നൽകാം - ഇതിനകം സ്പേഷ്യൽ. ഞങ്ങളുടെ മൂന്ന് തന്ത്രങ്ങളും 1, ഒരു 2, 3 എന്നിവ വിമാനത്തിൽ മൂന്ന് പോയിന്റുകളായിരിക്കും കുടിക്കൂ; കോർഡിനേറ്റുകളുടെ തുടക്കത്തിൽ ആദ്യ നുണകൾ (ചിത്രം 5.1), രണ്ടാമത്തെയും മൂന്നാമത്തെയും - അക്ഷങ്ങളിൽ ഒപ്പം ഓ, ou ആരംഭത്തിൽ നിന്ന് 1 അകലെ.

പോയിന്റുകളിലൂടെ 1, 2, 3, 3 എന്നിവ ആക്സിസിനെ വഹിക്കുന്നു I.I., Ii.Ii. ഒപ്പം IIIIIIവിമാനത്തിന് ലംബമായി കുടിക്കൂ. അക്ഷത്തിൽ I.I. വിന്നിരണങ്ങൾ അക്ഷങ്ങളിൽ ഒരു 1 തന്ത്രം ചെയ്യുമ്പോൾ മാറ്റിവയ്ക്കുന്നു Ii.Ii. ഒപ്പം IIIIII - ഒരു 2, 3 എന്നിവയുള്ള തന്ത്രങ്ങളുള്ള വിജയങ്ങൾ. ഓരോ ശത്രു തന്ത്രവും b j അക്ഷങ്ങളിൽ മുറിക്കുന്ന ഒരു വിമാനം കാണിക്കുന്നു I.I., Ii.Ii. ഒപ്പം IIIIII 1, ഒരു 2, 3, 3, തന്ത്രം എന്നിവയുള്ള നേട്ടങ്ങൾ നേടിയ സെഗ്മെന്റുകൾ. അങ്ങനെ, എല്ലാ ശത്രു തന്ത്രങ്ങളും പണിയുകയും ത്രികോണത്തെക്കുറിച്ചുള്ള ഒരു കുടുംബത്തെ ഞങ്ങൾ നേടുന്നത് ഒരു 1, ഒരു 2, 3 (ചിത്രം 5.2). ഈ കുടുംബത്തിന്, വിജയികളുടെ അതിർത്തി പണിയാനും നിങ്ങൾക്ക് 2xn കേസ് കേസിൽ ഈ അതിർത്തിയിൽ Net കണ്ടെത്താനും കഴിയും. പരമാവധി ഉയരം വിമാനത്തിന് മുകളിൽ കുടിക്കൂ. ഈ ഉയരം ഗെയിമിന്റെ വിലയാണ് ν.

ആവൃത്തികൾ പി 1, പി 2, p 3 തന്ത്രങ്ങൾ ഒപ്റ്റിമൽ സാ * തന്ത്രത്തിൽ 1, ഒരു 2, 3 എന്നിവയുടെ കോർഡിനേറ്റുകൾ (x, y) നിർണ്ണയിക്കും: പേജ് 2 \u003d x, പേജ് 3 \u003d y, p 1 \u003d 1 - p 2 - p 3. എന്നിരുന്നാലും, 3xn കേസിന് പോലും അത്തരമൊരു ജ്യാമിതീയ നിർമ്മാണം നടപ്പിലാക്കാൻ എളുപ്പമല്ല, ഒപ്പം ഭാവനയുടെ ഉയർന്ന സമയവും പരിശ്രമങ്ങളും ആവശ്യമാണ്. ഗെയിമിന്റെ പൊതുവായ കാര്യത്തിൽ, ഇത് എം-ഡൈമൻഷണൽ സ്ഥലത്തേക്ക് മാറ്റുന്നു, മാത്രമല്ല എല്ലാ ദൃശ്യപരതയും നഷ്ടപ്പെടുകയും ചെയ്യുന്നു, എന്നിരുന്നാലും ചില സാഹചര്യങ്ങളിൽ ജ്യാമിക് ടെർമിനോളജിയുടെ ഉപയോഗം ഉപയോഗപ്രദമാകും. പ്രായോഗികമായി Mxn ഗെയിമുകൾ പരിഹരിക്കുമ്പോൾ ഇത് ജിയോമെട്രിക് അനലോജികൾ മാത്രമല്ല, കണക്കാക്കുന്നത്, പ്രത്യേകിച്ചും, കണക്കിലുള്ള മെഷീനുകളിൽ പ്രശ്നം പരിഹരിക്കാൻ, ഈ രീതികൾ അനുയോജ്യമായ രീതിയിൽ അനുയോജ്യമാണ്.

ഈ രീതികളെല്ലാം കൃത്യമായ സാമ്പിളുകളാൽ പരിഹരിക്കുന്നതിനായി കുറയുന്നു, എന്നാൽ ഏറ്റവും സാമ്പത്തിക രീതി പരിഹരിക്കാൻ നയിക്കുന്ന ഒരു അൽഗോരിതം നിർമ്മിക്കാൻ സാമ്പിൾ ക്വാളിതം നിർമ്മിക്കാൻ നിങ്ങളെ അനുവദിക്കുന്നു. "ലീനിയർ പ്രോഗ്രാമിംഗ്" രീതിയായി MXN ഗെയിമുകൾ പരിഹരിക്കുന്നതിനുള്ള അതേ കണക്കാക്കിയ രീതിയിലാണ് ഞങ്ങൾ ഇവിടെ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. ഇത് ചെയ്യുന്നതിന്, mxn ഗെയിമിന്റെ തീരുമാനം കണ്ടെത്തുന്നതിനെക്കുറിച്ച് ഞങ്ങൾ ആദ്യം പ്രശ്നത്തിന്റെ മൊത്തത്തിലുള്ള ക്രമീകരണം നൽകും. എം എക്സ് എൻ ഗെയിം ഒരു 1, ഒരു 2, എം പ്ലെയർ എ, എൻ സ്ട്രാറ്റപ്പുകൾ b platass b 1, b, ... പ്ലെയർ ഇൻ ചെയ്ത് പേയ്മെന്റ് മാട്രിക്സ് കൾ ‖. ഗെയിമിന്റെ തീരുമാനം കണ്ടെത്തേണ്ടതുണ്ട്, അതായത്. കളിക്കാരുടെ ഒപ്റ്റിമൽ സമ്മിശ്ര തന്ത്രങ്ങൾ a

ഇവിടെ p 1 + p 2 + ... + p m \u003d 1; Q 1 + Q 2 + ... + Q N \u003d 1 (p i, q j എന്നിവ പൂജ്യമാകും).

നമ്മുടെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് എ * ഞങ്ങൾക്ക് ഒരു വിജയങ്ങൾ ഉപയോഗിച്ച് ഒരു വിജയങ്ങൾ നൽകണം, മാത്രമല്ല, ശത്രുവിന്റെ ഏതെങ്കിലും പെരുമാറ്റത്തോടും കൂടി നൽകണം, അതിന്റെ ഒപ്റ്റിമൽ പെരുമാറ്റത്തോടെ (സ്ട്രാറ്റജി എസ് ബി *). അതുപോലെ, സ്ട്രാറ്റജി എസ് ബി * ഒരു നഷ്ടം ഉപയോഗിച്ച് ഒരു എതിരാളിക്ക് ഒരു എതിരാളിക്ക് നൽകണം, ഞങ്ങളുടെ ഏതെങ്കിലും പെരുമാറ്റത്തിൽ കൂടുതലല്ല, ഞങ്ങളുടെ ഒപ്റ്റിമൽ പെരുമാറ്റത്തിന് തുല്യമാണ് (സ്ട്രാറ്റജി എസ് എ *).

ഗെയിമിന്റെ വിലയുടെ വ്യാപ്തി ഞങ്ങൾക്ക് അജ്ഞാതമാണ്; അത് ചിലർക്ക് തുല്യമാണെന്ന് ഞങ്ങൾ അനുമാനിക്കുന്നു പോസിറ്റീവ് നമ്പർ. വിശ്വസിക്കുന്നു അതിനാൽ, ഞങ്ങൾ യുക്തിസഹമായി ലംഘിക്കുന്നില്ല; Ν\u003e\u003e ആയിരിക്കാൻ, മാട്രിക്സിന്റെ എല്ലാ ഘടകങ്ങളും നെഗറ്റീവ് അല്ലാത്തതാണെന്ന് വ്യക്തമാണ്. You i J of ന്റെ ഘടകങ്ങളിലേക്ക് ചേർത്ത് ഇത് എല്ലായ്പ്പോഴും നേടാൻ കഴിയും L.; അതേസമയം ഗെയിമിന്റെ വില വർദ്ധിക്കും L.തീരുമാനം മാറില്ല.

ഞങ്ങളുടെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് എ * തിരഞ്ഞെടുക്കാം. തന്ത്രങ്ങളോടുള്ള ഞങ്ങളുടെ ശരാശരി വിജയികൾ b j + p 1 a 1J + P 2 a 2J + P ഒരു MJ. നമ്മുടെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് എ * * ശത്രുവിന്റെ ഏതെങ്കിലും പെരുമാറ്റമുള്ള സ്വത്ത് ഉണ്ട്, വിജയികൾ വിജയിക്കാത്തതിനേക്കാൾ കുറവല്ല, തൽഫലമായി, ഒരു J കുറയ്ക്കാൻ കഴിയില്ല ν. ഞങ്ങൾക്ക് നിരവധി വ്യവസ്ഥകൾ ലഭിക്കുന്നു:

ഞങ്ങൾ അസമത്വം (5.1) പോസിറ്റീവ് മൂല്യത്തിൽ വിഭജിച്ച് സൂചിപ്പിക്കുക

അപ്പോൾ അവസ്ഥകൾ (5.1) രൂപത്തിൽ രേഖപ്പെടുത്തും

എവിടെ, ξ 2, ξ 2, ξ m നെഗറ്റീവ് ഇതര സംഖ്യകളാണ്. പി 1 + പി 2 + ... + പി m \u003d 1, മൂല്യങ്ങൾ ξ 1, ξ 2, ..., അവസ്ഥ തൃപ്തിപ്പെടുത്തുക

(5.3) ξ 1 + 2 + ... + ξ m \u003d 1 /.

അവരുടെ ഉറപ്പുനൽകുന്ന വിജയങ്ങൾ കഴിയുന്നത്ര മാറ്റാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു; വ്യക്തമായും, ഒരേ സമയം വലത് ഭാഗം സമത്വം (5.3) ഏറ്റവും കുറഞ്ഞ മൂല്യം എടുക്കുന്നു. അതിനാൽ, കളിയുടെ ഒരു പരിഹാരം കണ്ടെത്തുന്നതിന്റെ ചുമതല ഇനിപ്പറയുന്ന ഗണിതശാസ്ത്ര പ്രശ്നത്തിലേക്ക് ചുരുക്കുന്നു: ξ 1, ξ 2, ξ m, തൃപ്തികരമായ അവസ്ഥകൾ (5.2), അതിനാൽ അവരുടെ തുക φ \u003d 1 + ξ 2 + ... + me meass വളരെ കുറവായിരുന്നു.

സാധാരണയായി, അങ്ങേയറ്റത്തെ മൂല്യങ്ങളുമായി (മാക്സിമ, മിനിമ) എന്നതുമായി ബന്ധപ്പെട്ട പ്രശ്നങ്ങൾ പരിഹരിക്കുമ്പോൾ, പ്രവർത്തനം വേർതിരിച്ച് സീറോ ഡെറിവേറ്റീവുകൾക്ക് തുല്യമാണ്. എന്നാൽ ഈ കൽച്ച് ഈ കേസിൽ, φ, അത് വിപരീതമായി, രേഖീയമാവുക, എല്ലാ വാദങ്ങളിലെയും വ്യുൽപ്പന്നം ഒരെണ്ണത്തിന് തുല്യമാണ്, അതായത്. ഒരിടത്തും പൂജ്യത്തിലേക്ക് തിരിവില്ല. അതിനാൽ, വാദങ്ങളുടെ മാറ്റത്തിന്റെ ഭാഗത്തിന്റെ അതിർത്തിയിൽ എവിടെയോ പരമാവധി ഫംഗ്ഷൻ നേടുന്നു, ഇത് നിർണ്ണയിക്കപ്പെടുന്നു, അത് വാദങ്ങളുടെയും വ്യവസ്ഥകളുടെയും (5.2) നിർണ്ണയിക്കപ്പെടുന്നത് നിർണ്ണയിക്കപ്പെടുന്നു. വ്യത്യാസങ്ങൾ ഉപയോഗിച്ച് അങ്ങേയറ്റത്തെ മൂല്യങ്ങളുടെ സ്വീകാര്യത അനുയോജ്യമല്ല, വിജയികളായ പരമാവധി (അല്ലെങ്കിൽ കുറഞ്ഞത്) അതിർത്തികൾ ഗെയിം പരിഹരിക്കാൻ നിർണ്ണയിക്കപ്പെടുന്നു, കാരണം ഞങ്ങൾ, 2xn ഗെയിമുകൾ പരിഹരിക്കുമ്പോൾ നിർണ്ണയിക്കപ്പെട്ടു. ഉദാഹരണത്തിന്, ഞങ്ങൾ നിർണ്ണയിച്ചു. വാസ്തവത്തിൽ, താഴ്ന്ന പരിധി നേർരേഖകളിലൂടെയാണ് നിർമ്മിച്ചിരിക്കുന്നത്, ഡെറിവേറ്റീവ് പൂജ്യമായ ഒരു ഘട്ടത്തിൽ നേടാനാകില്ല (എല്ലാ കാര്യങ്ങളിലും അത്തരം പോയിന്റുകളൊന്നുമില്ല), ഇടവേള അതിർത്തിയിൽ അല്ലെങ്കിൽ തിടുനതിലുള്ള പാതയിലോ സൈറ്റുകൾ.

അത്തരം ജോലികൾ പരിഹരിക്കാൻ, പലപ്പോഴും പ്രായോഗികമായി സംഭവിക്കുന്ന ഒരു പ്രത്യേക രേഖീയ പ്രോഗ്രാമിംഗ് ഉപകരണം, ഗണിതശാസ്ത്രത്തിൽ ഒരു പ്രത്യേക രേഖീയ പ്രോഗ്രാമിംഗ് ഉപകരണം വികസിപ്പിച്ചെടുത്തു. ലീനിയർ പ്രോഗ്രാമിംഗിന്റെ ചുമതല ഇനിപ്പറയുന്ന രീതിയിൽ സജ്ജമാക്കി. ലീനിയർ സമവാക്യങ്ങളുടെ ഡാന സിസ്റ്റം:

Ξ 1, ξ 2, ξ, ξ 2, ξ, ξ 2, ξ, (5.4) എന്നിവയുടെ നെഗറ്റീവ് മൂല്യങ്ങൾ കണ്ടെത്തേണ്ടതുണ്ട് (5.4), അതേ സമയം ഒരു നിശ്ചിത ഏകതാപരമായ ലീനിയർ ഫംഗ്ഷൻ മൂല്യങ്ങൾ ξ 1, 2, ξ, ξ m (ലീനിയർ ഫോം): φ \u003d c 1 + c 2 ξ 2 + ... + സെ.മീ.

ഗെയിം സിദ്ധാന്തത്തിന്റെ മുകളിലുള്ള ജോലി ഒരു രേഖീയ പ്രോഗ്രാമിംഗ് പ്രശ്നത്തിന്റെ ഒരു പ്രത്യേക കേസാണെന്ന് ഉറപ്പാക്കുന്നത് എളുപ്പമാണ്, ഒരു നോട്ടത്തിൽ, ഇത് ആ അവസ്ഥകൾ (5.2) തോന്നാം വ്യവസ്ഥകൾക്ക് തുല്യമല്ല (5.4), പകരം സമത്വ ചിഹ്നങ്ങൾ അടങ്ങിയിരിക്കുന്നതിനാൽ അസമത്വ ചിഹ്നങ്ങൾ അടങ്ങിയിരിക്കുന്നു. എന്നിരുന്നാലും, അസമത്വ അടയാളങ്ങളിൽ നിന്ന് മുക്തി നേടുന്നത് എളുപ്പമാണ്, പുതിയ സാങ്കൽപ്പിക ഇതര വേരിയബിളുകൾ ഇസഡ് 1, ഇസഡ് 2, ഇസഡ് എൻ, റെക്കോർഡിംഗ് അവസ്ഥകൾ (5.2)

ഫോം φ, അത് കുറഞ്ഞത് പഴയപടിയാക്കണം, φ \u003d + 1 + 2 + ... + m. മൂല്യം തിരഞ്ഞെടുക്കുന്നതിന് തുടർച്ചയായ ചെറിയ സാമ്പിളുകളുടെ താരതമ്യേന ചെറിയ എണ്ണം രേഖപ്പെടുത്തുന്ന ഉപകരണം അനുവദിക്കുന്നു ξ 1, ξ 2, ice ആവശ്യകതകൾ തൃപ്തിപ്പെടുത്തുന്നു. കൂടുതൽ വ്യക്തതയ്ക്കായി, നിർദ്ദിഷ്ട ഗെയിമുകൾ പരിഹരിക്കുന്ന മെറ്റീരിയലിൽ ഈ ഉപകരണം നേരിട്ട് പ്രയോഗിക്കാൻ ഞങ്ങൾ ഇവിടെ കാണിക്കും.

ഉദാഹരണം 1. ഗെയിമിന്റെ പരിഹാരം 3 × 3 നൽകിയിരിക്കുന്നത് ഉദാഹരണം 2 × 3 നൽകി, ഒരു മാട്രിക്സ് ഉപയോഗിച്ച്:

എല്ലാം ചെയ്യാനും ij നെഗറ്റീവ് ചെയ്യാനും, മാട്രിക്സ് എൽ \u003d 5 ന്റെ എല്ലാ ഘടകങ്ങൾക്കും ചേർക്കുക, ഞങ്ങൾ മാട്രിക്സ് നേടുന്നു:

അതേസമയം, കളിയുടെ വില 5 വർദ്ധിപ്പിക്കും, തീരുമാനം മാറില്ല.

ഒപ്റ്റിമൽ സ്ട്രാറ്റജി എസ് എ * ഞങ്ങൾ നിർവചിക്കുന്നു. വ്യവസ്ഥകൾ (5.2) ഫോം ഉണ്ട്:

ഇവിടെ ξ 1 \u003d p 1 / ν, ξ 2 \u003d p 2 / ν, ξ 3 \u003d p 3 / ν. അസമത്വ ചിഹ്നങ്ങൾ ഒഴിവാക്കാൻ, Z 1, z 2, z 3; വ്യവസ്ഥകൾ (5.6) ഫോമിൽ രേഖപ്പെടുത്തും:

ലീനിയർ ഫോം φ ഇവയാണ്: φ \u003d + 1 + ξ 2 + 3 3, കഴിയുന്നത്ര അല്പം ഉണ്ടാക്കണം. മൂന്ന് തന്ത്രങ്ങളും "ഉപയോഗപ്രദമാണ്" എന്നത് "ഉപയോഗപ്രദമായ വേരിയബിളുകൾ ഇസഡ് 1, ഇസഡ് 2, ഇസഡ് 3 എന്നിവ പൂജ്യമായി മാറും (അതായത്, ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമായ വിജയങ്ങൾ the ഓരോ ബി J തന്ത്രത്തിലും വിജയിക്കും). എന്നാൽ മൂന്ന് തന്ത്രങ്ങളും "ഉപയോഗപ്രദമാണെന്ന്" വാദിക്കാൻ ഞങ്ങൾ ഇതുവരെ ഒരു കാരണവുമില്ല. ഇത് പരീക്ഷിക്കാൻ, ആകാരം പ്രകടിപ്പിക്കാൻ ഞങ്ങൾ ശ്രമിക്കും z 1, ഇസഡ് 2, z 3 വഴി ഞങ്ങൾ ശ്രമിക്കും, ഞങ്ങൾ അവരെ പൂജ്യത്തിന് തുല്യമാണെന്ന് നോക്കുക, കുറഞ്ഞത് ഫോം. ഇത് ചെയ്യുന്നതിന്, സമവാക്യങ്ങൾ (5.7) പരിഹരിക്കുക (5.7) പരിഹരിക്കുക ξ 1, ξ 2, ξ 3 (i.e., എക്സ്പ്രസ്)

മടക്കുക ξ 1, ξ 2, ξ 3, ഞങ്ങൾ നേടുന്നു: φ \u003d 1/5 + z 1/20 + z 2/10 + Z 3/2 20. ഇവിടെ എല്ലാ ഇസുകളിലെയും ഗുണകങ്ങൾ പോസിറ്റീവ് ആണ്; ഇസഡ് 1, ഇസഡ് 2, z 3 എന്നിവയുടെ ഏതെങ്കിലും വർദ്ധനവ് ഫോമിലെ വർദ്ധനവിന് മാത്രമേ കഴിയൂ എന്നാണ് ഇതിനർത്ഥം, അത് ചുരുങ്ങിയതായിരിക്കും. തൽഫലമായി, ഇസഡ് 1, ഇസഡ് 2, ഇസഡ് 3, ഫോം φ, z 1 \u003d z 2 \u003d z 3 \u003d z 3 \u003d 0. അതിനാൽ, ഫോമിന്റെ ഏറ്റവും കുറഞ്ഞ മൂല്യം φ: 1 / ν \u003d 1 / 5, ഗെയിമിന്റെ വില മുതൽ ν \u003d. 5, z 2, z 3 എന്നിവ സൂത്രവാക്ലത്തിൽ (5.8) സബ്. (5.8), ξ 2 \u003d 1/10, ξ 3 \u003d 1/20, അല്ലെങ്കിൽ, p 1 \u003d 1/4, p 2 \u003d 1/2, p 3 \u003d 1/4. അങ്ങനെ, ഒപ്റ്റിമൽ തന്ത്രം, കണ്ടെത്തി: . എല്ലാ കേസുകളിലും നാലിലൊന്ന് കേസുകളിലും, പകുതി കേസുകളിലും, ബാക്കി ഭാഗങ്ങൾ 3 കേസുകളുടെ ബാക്കി ഭാഗങ്ങൾ ഞങ്ങൾ എഴുതണം.

ഗെയിമിന്റെ വില അറിയുന്നത് ν \u003d 5, നിങ്ങൾക്ക് ഇതിനകം കഴിയും അറിയപ്പെടുന്ന രീതികൾ ഒപ്റ്റിമൽ ശത്രു തന്ത്രം കണ്ടെത്തുക . ഇത് ചെയ്യുന്നതിന്, ഞങ്ങൾ ഞങ്ങളുടെ ഏതെങ്കിലും രണ്ട് "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ ഉപയോഗിക്കുന്നു (ഉദാഹരണത്തിന്, 2, 3, 3, 3) സമവാക്യങ്ങൾ എഴുതുക:

9Q 1 + 11 (1-Q 2 -Q 1) \u003d 5,

1 \u003d Q3 \u003d 1/4 എവിടെ നിന്ന്; Q 2 \u003d 1/2. ഒപ്റ്റിമൽ ശത്രു തന്ത്രം നമ്മുടേതിന് സമാനമായിരിക്കും: . ഇപ്പോൾ പ്രാരംഭ (രൂപാന്തരപ്പെടുത്തിയിട്ടില്ല) ഗെയിമിലേക്ക് മടങ്ങുക. ഇത് ചെയ്യുന്നതിന്, ഇത് ഗെയിമിന്റെ വിലയിൽ നിന്ന് മാത്രം ആവശ്യമാണ് ν \u003d 5 എന്നത് L \u003d 5 എടുക്കാൻ മാട്രിക്സിന്റെ ഘടകങ്ങളിൽ ചേർത്തു. യഥാർത്ഥ ഗെയിമിന്റെ വില ഞങ്ങൾ നേടുന്നു. തൽഫലമായി, രണ്ട് പാർട്ടികളുടെയും ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ പൂജ്യത്തിന് തുല്യമായ ശരാശരി നേട്ടം നൽകുന്നു; ഗെയിം ഇരുവശത്തും ഒരുപോലെ പ്രയോജനകരമോ ലാഭകരമല്ലോ.

ഉദാഹരണം 2. സ്പോർട്സ് ക്ലബ് എ 1, 2, 3, 3, 3 എന്നിവയുടെ ഘടനയുടെ മൂന്ന് വകഭേദങ്ങളുണ്ട്. ക്ലബ് ബി 1, 2, 3 എന്നിവയിൽ മൂന്ന് എംബോസിമെന്റുകളും ആണ്. മത്സരത്തിൽ പങ്കാളിത്തത്തിനായി ഒരു അപേക്ഷ പ്രയോഗിക്കുന്നു, ഒരു എതിരാളിയെ എന്ത് രചനയെ തിരഞ്ഞെടുക്കും എന്ന് ക്ലബ്ബിൽ ആർക്കും അറിയില്ല. വിജയിച്ച ക്ലബ്ബിന്റെ സാധ്യത a വ്യത്യസ്ത ഓപ്ഷനുകൾ മുൻ മീറ്റിംഗുകളുടെ അനുഭവത്തിൽ നിന്ന് ഏകദേശം അറിയപ്പെടുന്ന ടീമുകളുടെ ഘടന മാട്രിക്സ് സജ്ജമാക്കിയിരിക്കുന്നു:

ചില ഫ്രീക്വൻസി ക്ലബ്ബുകൾ ഉപയോഗിച്ച്, മീറ്റിംഗുകളിലെ ഓരോ മീറ്റിംഗുകളും ഏറ്റവും കൂടുതൽ വിജയങ്ങൾ നേടാൻ സഹായിക്കണം.

തീരുമാനം. ഗെയിമിന്റെ കുറഞ്ഞ വില 0.4; മികച്ച 0.6; സമ്മിശ്ര തന്ത്രങ്ങളുടെ വയലിൽ ഞങ്ങൾ തിരയുന്ന പരിഹാരം. ഭിന്നസംഖ്യകൾ കൈകാര്യം ചെയ്യരുതെന്നായി, മാട്രിക്സിന്റെ എല്ലാ ഘടകങ്ങളും 10 കൊണ്ട് ഗുണിക്കുക; അതേസമയം, ഗെയിമിന്റെ വില 10 തവണ വർദ്ധിക്കും, തീരുമാനം മാറില്ല. ഞങ്ങൾക്ക് ഒരു മാട്രിക്സ് ലഭിക്കുന്നു:

വ്യവസ്ഥകൾ (5.5) ഫോം ഉണ്ട്:

മിനിമം കണ്ടീഷൻ φ \u003d ξ 1 + ξ 2 ξ 3 \u003d മിനിറ്റ്.

മൂന്ന് ശത്രു തന്ത്രങ്ങളും "ഉപയോഗപ്രദമാണോ" എന്ന് ഞങ്ങൾ പരിശോധിക്കുന്നു. സിക്റ്റിയസ് എന്ന നിലയിൽ, സാങ്കൽപ്പിക വേരിയബിളുകൾ ഇസഡ് 1, ഇസഡ് 2, ഇസഡ് 3 പൂജ്യമാണെന്നും (5.10) ആപേക്ഷികത പരിശോധിക്കുന്നതിനും (5.10) ξ 3, ξ 3 എന്നിവ പരീക്ഷിക്കുന്നതിനും (5.10)

(5.12) 136φ \u003d 30 + 13z 1 + 18z 2 - 51Z 3

തീവ്രവാദ പൂജ്യവുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ വേരിയബിളുകൾ z 1, z 2 എന്നീ വർധനയുണ്ടാകുമെന്ന് ഫോർമുല (5.12) വർദ്ധിപ്പിക്കാൻ കഴിയും, അതേസമയം z 3 ൽ വർദ്ധനവ് കുറയ്ക്കും. എന്നിരുന്നാലും, Z 3 ലെ വർദ്ധനവ് ശ്രദ്ധാപൂർവ്വം നടത്തണം, മൂല്യങ്ങൾ ξ 1, ξ 2, ξ 3 z 3, ξ 3 എന്നിവയെ ആശ്രയിച്ചിരിക്കേണ്ടത് നെഗറ്റീവ് ആയിരുന്നില്ല. അതിനാൽ, ഞങ്ങൾ തുല്യതകളുടെ വലത് ഭാഗങ്ങൾ (5.11) z 1, ഇസെഡ് 2 എന്നിവ പൂജ്യത്തിന് തുല്യമായ മൂല്യങ്ങൾ, z 3 എന്ന മൂല്യങ്ങൾ അനുവദനീയമായ പരിധികളിലേക്ക് വർദ്ധിപ്പിക്കും (1, ξ, 2, ξ 3 3 പൂജ്യമായി മാറുകയില്ല). രണ്ടാമത്തെ സമത്വത്തിൽ നിന്ന് (5.11) z 2 ന്റെ മൂല്യത്തിനായി z 3 "സുരക്ഷിതമായി" വർദ്ധിച്ചതായി ഇത് കാണാം. അതിൽ നിന്ന് മാത്രമേ അതിൽ നിന്ന് വർദ്ധിക്കൂ. മൂല്യങ്ങളെ സംബന്ധിച്ചിടത്തോളം ξ 1, ξ 3, ഇവിടെ ഒരു നിശ്ചിത പരിധിക്ക് മാത്രമേ സാധ്യമാകൂ. Z 3 \u003d 10/23 ൽ ξ 1 ന്റെ മൂല്യം പൂജ്യമായിരിക്കണം; നേരത്തെ സീറോയിലേക്ക് ξ 3 അപ്പീലുകളുടെ മൂല്യം, ഇതിനകം z 3 \u003d 1/4 ൽ. അതിനാൽ, ഇസഡ് 3 ന് അനുവദനീയമായ പരമാവധി മൂല്യമുള്ള z 3 \u003d 1/4 നൽകുമ്പോൾ, ഞങ്ങൾ പൂജ്യം മൂല്യത്തിലേക്ക് തിരിയുന്നു.

ഫോം z കുറഞ്ഞത് ദൃശ്യമാകുമോ എന്ന് പരിശോധിക്കുന്നതിന് z 1 \u003d 0, z 3 \u003d 0, ξ 3 \u003d 0, Z 1, z 1, Z 2, ξ 3 എന്നിവയിലൂടെ ഞങ്ങൾ പ്രകടിപ്പിക്കും. Ξ 1, ξ 2, Z 3, Z 3 എന്നിവയുമായി ബന്ധപ്പെട്ട് സമവാക്യങ്ങൾ (5.10) പരിഹരിക്കുന്നു:

(5.13) 32φ \u003d 7 + 1 + 4z 2 + 3 ξ 3

ഫോർമുലയിൽ നിന്ന് (5.13) മുതൽ ഇസഡ് 1, ഇസഡ് 2, z, ξ 3, ξ 3, അവരുടെ ഉദ്ദേശിച്ച പൂജ്യം മൂല്യങ്ങളിൽ നിന്ന് φ 3, φ വരെ വർദ്ധിപ്പിക്കാൻ കഴിയും. തൽഫലമായി, കളിയുടെ തീരുമാനം കണ്ടെത്തി; Z 1 \u003d z 2 \u003d ξ 3 \u003d ξ 3 \u003d 0, Z 3 \u003d 3/16, Z 3 \u003d 1/4 എന്നീ മൂല്യങ്ങൾ എന്നിവയാണ് ഇത് നിർണ്ണയിക്കുന്നത്. ഫോർമുലയിൽ പകരമായി (5.13), ഗെയിമിന്റെ വില ഞങ്ങൾ കണ്ടെത്തുന്നു ν: 32φ \u003d 7 \u003d 32 / ν; ν \u003d 32/7. ഞങ്ങളുടെ ഒപ്റ്റിമൽ തന്ത്രം: . "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ (1, ഒരു 2, 2) ഘടകങ്ങൾ 1/7, 6/7 എന്നിവ ഉപയോഗിച്ച് പ്രയോഗിക്കണം; ഘടന ഒരു 3 - ഒരിക്കലും ബാധകമല്ല.

ഒപ്റ്റിമൽ ശത്രു തന്ത്രം കണ്ടെത്താൻ, പൊതുവേ, നിങ്ങൾക്ക് ഇത് ചെയ്യാൻ കഴിയും: വിപരീതമായി വിജയിക്കുന്നതിന്റെ അടയാളം മാറ്റുക, അവയുടെ മാട്രിക്സ് നിരന്തരമായ മൂല്യത്തിലേക്ക്, അവയെ നെഗറ്റീവ് ആകാതിരിക്കാൻ, ശത്രുവിനായി ചുമതല പരിഹരിക്കുക ഞങ്ങൾ അത് സ്വയം പരിഹരിച്ചു. എന്നിരുന്നാലും, ഗെയിമിന്റെ വില ഇതിനകം തന്നെ ഞങ്ങൾക്ക് അറിയാമെന്ന വസ്തുത, കുറച്ച് ടാസ്പിലിഫിക്കേഷൻസ് ചെയ്യുന്നു. കൂടാതെ, ഈ പ്രത്യേക കേസിൽ, 1, 2-ൽ രണ്ട് "ഉപയോഗപ്രദമായ" ശത്രു തന്ത്രങ്ങൾ മാത്രമാണ് തീരുമാനം ലളിതമാക്കുന്നത്, Z 3 ന്റെ മൂല്യം പൂജ്യമല്ലെന്നും അതിനർത്ഥം ഗെയിം വില നേടിയിട്ടില്ല. ഏതെങ്കിലും "ഉപയോഗപ്രദമായ" കളിക്കാരന്റെ തന്ത്രം എ, ഉദാഹരണത്തിന്, ഒരു 1, Q 1, q 2 എന്നിവ കണ്ടെത്താൻ കഴിയും. ഇത് ചെയ്യുന്നതിന്, Q 1 \u003d 3/7, Q 2 \u003d 4/7 എന്നതിൽ നിന്ന് സമവാക്യം 8Q 1 + 2 (1 - + 2 (1 - Q 1) \u003d 32/7 എഴുതുക; ഒപ്റ്റിമൽ ശത്രു തന്ത്രം ആയിരിക്കും: . ശത്രു 3 ന്റെ ഘടന ഉപയോഗിക്കരുത്, 1 ന്റെ രചനകൾ ആവൃത്തികളോടെ 3/7, 4/7 എന്നിവ ഉപയോഗിച്ച് പ്രയോഗിക്കണം.

പ്രാരംഭ മാട്രിക്സിലേക്ക് മടങ്ങുമ്പോൾ, ഗെയിമിന്റെ യഥാർത്ഥ വില ഞങ്ങൾ നിർവചിക്കുന്നു ν 0 \u003d 32/7: 10 \u003d 0.457. എന്ന് വച്ചാൽ അത് വലിയ സംഖ്യ മീറ്റിംഗുകൾ എല്ലാ മീറ്റിംഗുകളിലും 0.457 ആയിരിക്കും ക്ലബ്ബിന്റെ വിജയങ്ങളുടെ എണ്ണം.

§ 6. ഗെയിമുകൾ പരിഹരിക്കുന്ന ഏകദേശ രീതികൾ

മിക്കപ്പോഴും പ്രായോഗിക ജോലികളിൽ കളിയുടെ കൃത്യമായ തീരുമാനം കണ്ടെത്തേണ്ടതില്ല; ഒരു ഏകദേശ പരിഹാരം കണ്ടെത്തുന്നത് മതി, ശരാശരി വിജയം നൽകുക, ഗെയിമിന്റെ വിലയ്ക്ക് സമീപം. ഗെയിമിന്റെ വിലയെക്കുറിച്ചുള്ള കണക്കാക്കിയ അറിവ് ν ഇതിനകം തന്നെ മാട്രിക്സിന്റെ ലളിതമായ വിശകലനം, താഴത്തെ (α) നിർവചനം, ഗെയിമിന്റെ വില എന്നിവയും. Α ഉം y ഉണ്ടെങ്കിൽ, കൃത്യമായ പരിഹാരത്തിനായി പ്രായോഗികമായി തിരയേണ്ട ആവശ്യമില്ല, പക്ഷേ നെറ്റ് മിനിമാക്സ് തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കാൻ ഇത് മതിയാകും. Α, α, thems ഗെയിമുകൾ പരിഹരിക്കുന്നതിനുള്ള സംഖ്യാ രീതികളുടെ സഹായത്തോടെ പരിശീലിക്കാൻ സ്വീകാര്യമായ പരിഹാരം നേടാൻ കഴിയും, അതിൽ ഞങ്ങൾ ആവർത്തന രീതി കുറയ്ക്കാൻ കഴിയും.

ആവർത്തന രീതിയുടെ ആശയം ഇനിപ്പറയുന്നവയിലേക്ക് ചുരുക്കിയിരിക്കുന്നു. "മാനസിക പരീക്ഷണം" കളിക്കുന്നത്, അതിൽ എതിരാളികൾ എ, ബി അവരുടെ തന്ത്രങ്ങൾ പരസ്പരം പ്രയോഗിക്കുന്നു. പരീക്ഷണാത്മക ഗെയിമുകളുടെ ഒരു ശ്രേണിയാണ് പരീക്ഷണം. ഓരോന്നും നൽകിയ ഗെയിമിന്റെ മാട്രിക്സ് ഉണ്ട്. ഞങ്ങൾ (പ്ലെയർ എ) (പ്ലെയർ എ) ഏകപക്ഷീയമായി അതിന്റെ തന്ത്രങ്ങളിൽ ഒന്നെങ്കിലും ഉദാഹരണത്തിന്, ഞാൻ എന്നിവ തിരഞ്ഞെടുക്കുന്നതിലൂടെ ഇത് ആരംഭിക്കുന്നു. ഈ സ്ട്രാറ്റജി ബി ജെ ഉപയോഗിച്ച് ശത്രു ഉത്തരവാദികളാണ്, അത് ഞങ്ങൾക്ക് ഏറ്റവും പ്രയോജനകരമാണ്, അതായത്. തന്ത്രങ്ങൾ, ഞാൻ മിനിമം വരെ വിജയിക്കുന്നു. ഈ നീക്കത്തിൽ, ഇതേ തന്ത്രത്തിൽ ഞങ്ങൾ പ്രതികരിക്കുന്നു, ഇത് എതിരാളിയുടെ തന്ത്രം പ്രയോഗിക്കുമ്പോൾ പരമാവധി ശരാശരി നേട്ടത്തിന് നൽകുന്നു. അടുത്തത് - വീണ്ടും എതിരാളിയുടെ തിരിവ്. ഈ രണ്ട് തന്ത്രങ്ങളും (എ ഞാനും യും) ഉപയോഗിച്ച് ഏറ്റവും ചെറിയ വിജയികളായ ഒരു ഞാനും ഒരു കെയും ഒരു ഞാനും ഒരു യും നീക്കങ്ങളോട് അദ്ദേഹം പ്രതികരിക്കുന്നു. ആവർത്തന പ്രക്രിയയുടെ ഓരോ ഘട്ടത്തിലും, ഓരോ കളിക്കാരനും അതിന്റെ എല്ലാ നീക്കങ്ങളെയും കുറിച്ചുള്ള മറ്റൊരു കളിക്കാരന്റെ ഏതെങ്കിലും കോഴ്സിനോട് പ്രതികരിക്കുന്നു, അത് അവരുടെ ആവൃത്തിയുടെ ആവൃത്തിയിൽ അനുപാതത്തിൽ അവതരിപ്പിച്ചിരിക്കുന്ന സമ്മിശ്ര തന്ത്രങ്ങളായി കണക്കാക്കപ്പെടുന്നു .

ഈ രീതി കളിക്കാരുടെ യഥാർത്ഥ പ്രായോഗിക "പഠനത്തിന്റെ ഒരു മാതൃക പോലെയാണ്, ഓരോരുത്തരും ഓരോരുത്തർക്കും എതിരാളിയുടെ പെരുമാറ്റത്തിന് വിധേയരാകുകയും സ്വയം അനുകൂലമായി പ്രതികരിക്കാൻ ശ്രമിക്കുകയും ചെയ്യുമ്പോൾ. പഠന പ്രക്രിയയുടെ അത്തരമൊരു സിമുലേഷൻ സമയം തുടരുന്നത് തുടരുകയാണെങ്കിൽ, ഒരു ജോഡി നീക്കങ്ങൾ (പ്രാഥമിക ഗെയിം) ഗെയിം വിലയ്ക്കും ആവൃത്തി പി 1 ... പി 1 ... പി 1 ... പി 1 ... പി 1 ... പി 1 ... പി 1 ... Q 1 ... Q N, ഈ നറുക്കെടുപ്പിൽ കളിക്കാരുടെ തന്ത്രങ്ങൾ കാണുന്നത്, ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ നിർണ്ണയിക്കുന്ന ആവൃത്തികളെ സമീപിക്കും. രീതിയുടെ ഒത്തുചേരൽ വളരെ മന്ദഗതിയിലാണെന്ന് കണക്കുകൂട്ടലുകൾ കാണിക്കുന്നു, എന്നിരുന്നാലും, അതിവേഗ വോയ്സ് മെഷീനുകൾക്ക്, ഇത് ഒരു തടസ്സമല്ല.

ഗെയിമിന്റെ ഉദാഹരണത്തിന് 3 × 3, മുമ്പത്തെ ഖണ്ഡികയുടെ 2-ൽ പരിഹരിച്ച ആവർത്തന രീതിയുടെ ആപ്ലിക്കേഷൻ ഞങ്ങൾ വ്യക്തമാക്കുന്നു. ഗെയിം ഒരു മാട്രിക്സ് സജ്ജമാക്കിയിരിക്കുന്നു:

ആവർത്തന പ്രക്രിയയുടെ ആദ്യ 18 ഘട്ടങ്ങൾ പട്ടിക 6.1 കാണിക്കുന്നു. ആദ്യ നിരയ്ക്ക് പ്രാഥമിക ഗെയിമിന്റെ എണ്ണം (ജോഡി നീക്കങ്ങൾ) നൽകിയിരിക്കുന്നു n.; രണ്ടാമത്തേതിൽ - നമ്പറിൽ I. തിരഞ്ഞെടുത്ത പ്ലെയർ സ്ട്രാറ്റജി a; അടുത്ത മൂന്നിൽ - ആദ്യത്തേതിന് "ശേഖരിച്ച നേട്ടം" n. 3, 3, 3 ൽ ശത്രു തന്ത്രങ്ങളുള്ള ഗെയിമുകൾ. ഈ മൂല്യങ്ങളുടെ ഏറ്റവും കുറഞ്ഞത് ized ന്നിപ്പറയുന്നു. അടുത്തത് നമ്പർ വരുന്നു ജെ. ശത്രുവിനെ തിരഞ്ഞെടുക്കുന്ന തന്ത്രം, യഥാക്രമം അടിഞ്ഞുകകം n. തന്ത്രങ്ങൾക്ക് കീഴിലുള്ള ഗെയിമുകൾ ഒരു 1, 2, ഈ മൂല്യങ്ങളിൽ 3, ഈ മൂല്യങ്ങളിൽ നിന്ന് പരമാവധി ize ന്നിപ്പറയുന്നു. അടിവരയിട്ട മൂല്യങ്ങൾ മറ്റൊരു കളിക്കാരന്റെ പ്രതികരണ തന്ത്രത്തിന്റെ തിരഞ്ഞെടുപ്പ് നിർണ്ണയിക്കുന്നു. ഇനിപ്പറയുന്ന നിരകൾ തുടർച്ചയായി നൽകിയിരിക്കുന്നു: ഗെയിമുകളുടെ എണ്ണം അനുസരിച്ച് വിഭജിച്ചിരിക്കുന്ന ഏറ്റവും കുറഞ്ഞ വിജയത്തിന് തുല്യമായ ശരാശരി വിജയികൾ n.; പങ്കിട്ട പരമാവധി വിജയത്തിന് തുല്യമായ പരമാവധി ശരാശരി നേട്ടം n., അവരുടെ അരിത്മെറ്റിക് ശരാശരി ν * \u003d \u003d (ν +) / 2. വർദ്ധിച്ചു കൂടുന്നു n. മൂന്ന് മൂല്യങ്ങളും ν, ν * ഗെയിമിന്റെ വിലയെ സമീപിക്കും ν * ന്റെ മൂല്യം സ്വാഭാവികമായും അതിനെ താരതമ്യേന വേഗത്തിൽ സമീപിക്കും.

പട്ടിക 6.1.

ഉദാഹരണത്തിൽ നിന്ന് കാണാൻ കഴിയുന്നതുപോലെ, ആവർത്തനങ്ങളുടെ ഒത്തുചേരൽ വളരെ മന്ദഗതിയിലാണ്, എന്നിരുന്നാലും, അത്തരമൊരു ചെറിയ കണക്കുകൂട്ടൽ പോലും ഗെയിം വിലയുടെ ഏകദേശ മൂല്യം കണ്ടെത്താനും "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ വെളിപ്പെടുത്തുന്നത്. കണക്കാക്കാവുന്ന മെഷീനുകൾ ഉപയോഗിക്കുമ്പോൾ, രീതിയുടെ മൂല്യം ഗണ്യമായി വർദ്ധിക്കുന്നു. തന്ത്രങ്ങളുടെ എണ്ണം കൂടുന്നതിനനുസരിച്ച് കണക്കുകൂട്ടലുകളുടെ എണ്ണം കുറച്ചുകൂടി വർദ്ധിച്ചുകൊണ്ടിരിക്കുക എന്നതാണ് ഗെയിം പരിഹരിക്കാനുള്ള ആസക്തി രീതിയുടെ ഗുണം എം. ഒപ്പം n..

§ 7. അനന്തമായ ചില ഗെയിമുകൾ പരിഹരിക്കുന്നതിനുള്ള രീതികൾ

അനന്തമായ ഗെയിമിനെ ഒരു ഗെയിം എന്ന് വിളിക്കുന്നു, അതിൽ ഒരു പാർട്ടികളിലൊന്ന് അനന്തമായ തന്ത്രങ്ങളും ഉണ്ട്. അത്തരം ഗെയിമുകൾ പരിഹരിക്കുന്നതിനുള്ള പൊതുവായ രീതികൾ ഇപ്പോഴും ഒരു ചെറിയ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. എന്നിരുന്നാലും, താരതമ്യേന ലളിതമായ പരിഹാരം അനുവദിക്കുന്ന ചില പ്രത്യേക കേസുകൾ പ്രായോഗികമായി പ്രായോഗികമായിരിക്കും. രണ്ട് എതിരാളികളുടെ ഗെയിം എ, ബി എന്നിവ പരിഗണിക്കുക, അവ ഓരോന്നും ഓരോന്നിനും അനന്തമായ (കണക്കാക്കാനാവാത്ത) തന്ത്രങ്ങൾ ഉണ്ട്; കളിക്കാരന് അനുയോജ്യമായ ഈ തന്ത്രങ്ങൾ വിവിധ മൂല്യങ്ങൾ തുടർച്ചയായി മാറ്റുന്ന പാരാമീറ്റർ എച്ച്., ഇൻ - പാരാമീറ്ററിൽ ഡബ്ല്യു.. ഈ സാഹചര്യത്തിൽ, മാട്രിക്സിന് പകരം ‖a Ij ‖ എന്നതിനുപകരം ഗെയിം തുടർച്ചയായി മാറ്റുന്ന രണ്ട് വാദങ്ങളുടെ ചില പ്രവർത്തനം നിർണ്ണയിക്കുന്നു a (x, y)അത് വിജയികളുടെ പ്രവർത്തനത്തെ ഞങ്ങൾ വിളിക്കും (ഫംഗ്ഷൻ തന്നെ ഞങ്ങൾ ശ്രദ്ധിക്കുന്നു a (x, y) അത് തുടർച്ചയായിരിക്കരുത്). വിൻ ഫംഗ്ഷൻ a (x, y) ചില ഉപരിതലത്തിൽ ജ്യാമിതീയമായി അവതരിപ്പിക്കാൻ കഴിയും a (x, y) വാദങ്ങളുടെ മാറ്റത്തിന്റെ വിസ്തീർണ്ണത്തിന് മുകളിൽ (x, y) (ചിത്രം 7.1)

വിന്നിംഗ്സ് പ്രവർത്തനത്തിന്റെ വിശകലനം A (x, y) പേയ്മെന്റ് മാട്രിക്സിന്റെ വിശകലനത്തിന് സമാനമാണ് ഇത് നടപ്പിലാക്കുന്നത്. ആദ്യം ഗെയിം α ന്റെ കുറഞ്ഞ വിലയുണ്ട്; ഇതിനായി എല്ലാവർക്കും നിർണ്ണയിക്കപ്പെടുന്നു എച്ച്. ഏറ്റവും കുറഞ്ഞ പ്രവർത്തനം a (x, y) എല്ലാവരിലും ഡബ്ല്യു.:, എന്നിട്ട് ഇത് എല്ലായിടത്തും പരമാവധി മൂല്യങ്ങൾക്കായി തിരഞ്ഞു എച്ച്. (മാക്സിമം):

ഗെയിമിന്റെ മികച്ച വില (മിനിമാക്സ്) ഒരേ രീതിയിൽ നിർവചിച്ചിരിക്കുന്നു:

Α \u003d β എപ്പോൾ പരിഗണിക്കുക. ഗെയിമിന്റെ വില എല്ലായ്പ്പോഴും α, β എന്നിങ്ങനെ അവസാനിച്ചതിനാൽ, അവയുടെ അർത്ഥം is. സമത്വം α \u003d β എന്നാൽ ഉപരിതലം a (x, y) ഒരു സാഡിൽ പോയിന്റ് ഉണ്ട്, അത്തരമൊരു പോയിന്റ് x 0, 0 ൽ, അതിൽ a (x, y) ഒരേ സമയം മിനിമൽ ഡബ്ല്യു. ഒപ്പം പരമാവധി എച്ച്. (ചിത്രം 7.2).

വിലമതിക്കുക a (x, y) ഈ സമയത്ത്, ഗെയിമിന്റെ വിലയുണ്ട് ν:. a (x 0, y 0). ഒരു സാഡിൽ പോയിന്റിന്റെ സാന്നിധ്യം എന്നാൽ ഈ അനന്തമായ ഗെയിമിന് ശുദ്ധമായ തന്ത്രങ്ങളുടെ വയലിൽ ഒരു പരിഹാരമുണ്ട്; x 0, y 0 ഒരു, വി. പൊതുവേ, α α, ഗെയിമിൽ സമ്മിശ്ര തന്ത്രങ്ങളുടെ വയലിൽ മാത്രം ഒരു പരിഹാരം ഉണ്ടാകുമോ (ഒരുപക്ഷേ മാത്രമല്ല). അനന്തമായ ഗെയിമിനായുള്ള സമ്മിശ്ര തന്ത്രം തന്ത്രങ്ങൾക്ക് ചില സാധ്യതകയറ്റം ഉണ്ട് എച്ച്. ഒപ്പം ഡബ്ല്യു.ക്രമരഹിതമായ വേരിയബിളുകളായി കണക്കാക്കുന്നു. ഈ വിതരണം തുടർച്ചയും സാന്ദ്രത നിർണ്ണയിക്കാനാകും. എഫ്. 1 (x) ഒപ്പം എഫ്. 2 (Y); ഇത് വ്യതിരിക്തമായിരിക്കാം, തുടർന്ന് പൂജ്യമല്ലാത്ത ചില അന്വേഷണങ്ങൾ ഉപയോഗിച്ച് തിരഞ്ഞെടുത്ത ഒരു കൂട്ടം പ്രത്യേക നെറ്റ് തന്ത്രങ്ങൾ അടങ്ങിയിരിക്കുന്നു.

ഒരു അനന്തമായ ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ലാത്തപ്പോൾ, ഗെയിമിന്റെ താഴത്തെ, മുൻനിര വിലയുടെ ഒരു വിഷ്വൽ ജ്യാമിതീയ വ്യാഖ്യാനം നിങ്ങൾക്ക് നൽകാൻ കഴിയും. വിജയകരമായ പ്രവർത്തനം ഉപയോഗിച്ച് അനന്തമായ ഗെയിം പരിഗണിക്കുക. a (x, y)ഒപ്പം തന്ത്രങ്ങളും എക്സ്, ഡബ്ല്യു.കോട്ടിന്റെ തുടർച്ചയായ ഭാഗങ്ങൾ പൂരിപ്പിക്കുക (x 1, x 2) ഒപ്പം (1, U 2 ൽ). ഗെയിമിന്റെ കുറഞ്ഞ വില നിർണ്ണയിക്കാൻ, നിങ്ങൾ ഉപരിതലത്തിൽ "കാണാം" a (x, y) അക്ഷത്തിന്റെ വശത്ത് നിന്ന് ഡബ്ല്യു.. അത് വിമാനത്തിലേക്ക് പരിവർത്തനം ചെയ്യുക ഹോ (ചിത്രം 7.3). ഞങ്ങൾ ചില ആകൃതികൾ നേടുന്നു, സ്ട്രെയിറ്റ് എക്സ് \u003d എക്സ് 1, എക്സ് \u003d എക്സ് 2, ഒപ്പം താഴെയുള്ള, ബി, എൻ. ഗെയിമിന്റെ കുറഞ്ഞ വില, എൻറെ വക്രത്തിന്റെ ക്രമം എൻ.

അതുപോലെ, ഗെയിമിന്റെ മികച്ച വില കണ്ടെത്താൻ β, നിങ്ങൾ ഉപരിതലത്തിൽ "കാണുക" ആവശ്യമാണ് a (x, y) അക്ഷത്തിന്റെ വശത്ത് നിന്ന് എച്ച്. (വിമാനത്തിലേക്ക് ഉപരിതലം രൂപകൽപ്പന ചെയ്യുക വോ) മുകളിലെ അതിർത്തിയുടെ ഏറ്റവും കുറഞ്ഞ നിർദേശം പൂജത്തിന് (ചിത്രം, 7.4) കണ്ടെത്തുക.

അനന്തമായ ഗെയിമുകളുടെ രണ്ട് പ്രാഥമിക ഉദാഹരണങ്ങൾ പരിഗണിക്കുക.

ഉദാഹരണം 1. കളിക്കാർക്ക് a, b ന് കണക്കാക്കാനാവാത്ത എല്ലാ തന്ത്രങ്ങളും ഉണ്ട്. എച്ച്.ഒപ്പം ഡബ്ല്യു., മാത്രമല്ല, 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. ഒരു (x, y) - (x - Y) 2 എന്ന പദപ്രയോഗം നൽകിയിരിക്കുന്ന ഫംഗ്ഷൻ നൽകുന്നത്. ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക.

പരിഹാരം, ഉപരിതലം a (x, y) ഒരു പാരബോളിക് സിലിണ്ടറാണ് (അത്തി. 7.5), സാഡ്ഡിലെ പോയിന്റ് ഇല്ല. കളിയുടെ കുറഞ്ഞ വില ഞങ്ങൾ നിർവചിക്കുന്നു; വ്യക്തമായും, എല്ലാവർക്കും എച്ച്.; അതിനാൽ \u003d 0. ഗെയിമിന്റെ ഉയർന്ന വില നിർണ്ണയിക്കുക. ഇത് ചെയ്യുന്നതിന്, ഞങ്ങൾ ഒരു നിശ്ചിത കണ്ടെത്തുന്നു ഡബ്ല്യു.

ഈ സാഹചര്യത്തിൽ, ഇടവേള അതിർത്തിയിൽ പരമാവധി നേടാനാണ് പരമാവധി നേടിയത് (x \u003d 0 അല്ലെങ്കിൽ x \u003d 1), i.e. ഇത് 2 ന് തുല്യമാണ്; (1 - Y) 2, അത് കൂടുതൽ. ഈ ഫംഗ്ഷനുകളുടെ ഗ്രാഫുകൾ ഞാൻ ചിത്രീകരിക്കും (ചിത്രം 7.6), i.e. ഉപരിതലത്തിന്റെ പ്രൊജക്ഷൻ a (x, y) വിമാനത്തിൽ വോ. FIG- ലെ ഫാറ്റ് ലൈൻ. 7.6 സവിശേഷത കാണിച്ചിരിക്കുന്നു. വ്യക്തമായും, അതിന്റെ ഏറ്റവും കുറഞ്ഞ മൂല്യം y \u003d 1/2 ൽ നേടാനും 1/4 ന് തുല്യമാണ്. തൽഫലമായി, ഗെയിമിന്റെ മികച്ച വില β \u003d 1/4. ഈ സാഹചര്യത്തിൽ, കളിയുടെ മുൻനിര വില ഗെയിമിന്റെ വിലയുമായി പൊരുത്തപ്പെടുന്നു. വാസ്തവത്തിൽ, കളിക്കാരന് ഒരു മിശ്രിത സ്ട്രാറ്റജി എസ് എ \u003d അങ്ങേയറ്റത്തെ മൂല്യങ്ങൾ x \u003d 0, X \u003d 1 എന്നിവ ഒരേ ആവൃത്തികളുമായി ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. അപ്പോൾ, ഏതെങ്കിലും തന്ത്രത്തോടെ, ശരാശരി കളിക്കാരന്റെ കളിക്കാരൻ എ വിജയിക്കും: ½u 2 + ½ (1 - Y) 2. ഏത് മൂല്യങ്ങൾക്കും ഈ മൂല്യം ഉറപ്പാക്കുന്നത് എളുപ്പമാണ് ഡബ്ല്യു. 0 നും 1 നും ഇടയിൽ, ഇത് ¼: ½u 2 + ½ (1 - Y) 2 ൽ കുറവല്ല.

അതിനാൽ, ഈ കളിക്കാരനും ഈ സമ്മിശ്ര തന്ത്രത്തിന്റെ ഉപയോഗത്തിനും ഗെയിമിന്റെ മുൻനിര വിലയ്ക്ക് തുല്യമായ ഒരു വിജയങ്ങൾ ഉറപ്പ് നൽകും; കളിയുടെ വില ഉയർന്ന വിലയേക്കാൾ വലുതായിരിക്കാൻ കഴിയില്ല ഈ തന്ത്രം ഒരു ഒപ്റ്റിമൽ: എസ് എ \u003d എസ് എ *.

കളിക്കാരന്റെ വില ഗെയിമിന്റെ മികച്ച വിലയ്ക്ക് തുല്യമാണെങ്കിൽ, കളിക്കാരന്റെ വില β ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമാണെന്ന് പ്ലെയർ വി. വ്യക്തമായ തന്ത്രം എല്ലായ്പ്പോഴും അസ്തമിക്കുന്ന ഒരു നെറ്റ് മിനിമേക്സ് തന്ത്രമാണ് കളിയുടെ. ഈ സാഹചര്യത്തിൽ, അത്തരമൊരു തന്ത്രം 0 \u003d. ഈ തന്ത്രം ഉപയോഗിച്ച്, കളിക്കാരൻ എങ്കിലും വിജയികൾ കൂടുതൽ വലുതായിരിക്കില്ല. ഇത് വ്യക്തമായ അസമത്വത്തിൽ നിന്ന് (X - ½) 2 \u003d x (x -1) + ¼ ≤

ഉദാഹരണം 2. ഒരു ("ഞങ്ങൾ") എതിരാളിയിലെ വിമാനം നയിക്കുന്നു. ഷെല്ലിംഗിൽ നിന്ന് വേട്ടയാടുന്നതിന്, ശത്രുവിന് ചില ഓവർലോഡ് ഉപയോഗിച്ച് കൈകാര്യം ചെയ്യാൻ കഴിയും ഡബ്ല്യു.അവന്റെ വിവേചനാധികാരത്തിൽ നിന്ന് അവന് പ്രാധാന്യം നൽകാൻ കഴിയും ഡബ്ല്യു. \u003d 0 (നേരായ ചലനം) ഡബ്ല്യു. = ഡബ്ല്യു. പരമാവധി (പരമാവധി വക്രതയുടെ ചുറ്റളവിൽ പറക്കുന്നു). ഞങ്ങൾ കരുതുന്നു ഡബ്ല്യു. പരമാവധി അളവിലുള്ള അളവ്, I.E. ഇടുക ഡബ്ല്യു. പരമാവധി \u003d 1. ശത്രുവിനെതിരായ പോരാട്ടത്തിൽ, സേവന വിമാനത്തിൽ ഗോൾ പ്രസ്ഥാനത്തെക്കുറിച്ച് ഒന്നോ മറ്റൊരു പരികല്പനയോ അടിസ്ഥാനമാക്കി ഞങ്ങൾക്ക് കാഴ്ചകൾ ഉപയോഗിക്കാൻ കഴിയും. അമിതഭാരം കയറ്റുക എച്ച്. ഈ സാഹചര്യത്തിൽ, സാങ്കൽപ്പിക കുസൃതിയിൽ 0 മുതൽ 1 വരെ ഒരു മൂല്യത്തിന് തുല്യമാണ്. ഞങ്ങളുടെ ചുമതല ശത്രുവിനെ അടിക്കുക എന്നതാണ്; ബാധിക്കപ്പെടാത്തവരാകാതിരിക്കുക എന്നതാണ് ശത്രുവിന്റെ ചുമതല. ഡാറ്റയ്ക്കുള്ള നാശനഷ്ടമുണ്ടാകാനുള്ള സാധ്യത എച്ച്. ഒപ്പം ഡബ്ല്യു. ഏകദേശം സൂത്രവാക്യത്തിൽ ഏകദേശം പ്രകടിപ്പിക്കുന്നു: a (x, y) \u003d , എവിടെ ഡബ്ല്യു. - ശത്രുവിന്റെ ഓവർലോഡ്; X - ഓവർലോഡ്, കാഴ്ചയിൽ കണക്കിലെടുത്ത്. രണ്ട് പാർട്ടികളുടെയും ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ നിർണ്ണയിക്കേണ്ടതുണ്ട്.

തീരുമാനം. വ്യക്തമായും, ഞങ്ങൾ p \u003d 1. വിൻ ഫംഗ്ഷൻ ഇടുകയാണെങ്കിൽ ഗെയിം പരിഹാരം മാറില്ല a (x, y) ചിത്രം കാണിച്ചിരിക്കുന്ന ഉപരിതലത്തിൽ ചിത്രീകരിച്ചിരിക്കുന്നു. 7.7.

കോർഡിനേറ്റ് കോർണർ കാസ്റ്ററിന് സമാന്തരമായ ഒരു സിലിണ്ടർ ഉപരിതല രൂപീകരണമാണിത് കുടിക്കൂരൂപീകരിക്കുന്നതിന് ലംബമായി ഒരു വിമാനത്തിന്റെ ഒരു ക്രോസ്-സെക്ഷൻ, സാധാരണ വിതരണ കർവ് തരത്തിലുള്ള ഒരു വക്രം ഉണ്ട്. ഗെയിമിന്റെ താഴത്തെ, മുൻനിര വിലയുടെ നിർദ്ദിഷ്ട ജ്യാമിചിക വ്യാഖ്യാനം ഉപയോഗിച്ച്, ഞങ്ങൾ (ചിത്രം 7.8) കണ്ടെത്തുന്നു (ചിത്രം 7.8), (ചിത്രം 7.9). ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റ് ഇല്ല; മിശ്രിത തന്ത്രങ്ങളുടെ വയൽ ഭാഗത്ത് നിങ്ങൾ തിരയേണ്ട തീരുമാനം. മുമ്പത്തെ ഉദാഹരണത്തിന്റെ ചുമതലയ്ക്ക് സമാനമായ ഒരു പരിധിവരെ ടാസ്ക് ആണ്. തീർച്ചയായും ചെറിയ മൂല്യങ്ങളിൽ കെ. പ്രവർത്തനം ഏകദേശം ഒരു ഫംഗ്ഷനായി പെരുമാറുന്നു - (x - Y) 2, മുമ്പത്തെ ഉദാഹരണം പരിഹരിക്കുന്നതിനിടയിൽ ഗെയിം പരിഹാരം പ്രവർത്തിക്കും, കളിക്കാരുടെ വേഷങ്ങൾ മാറ്റുക a, b എന്നിവ മാറ്റുക; ആ. നമ്മുടെ ഒപ്റ്റിമൽ തന്ത്രം ശുദ്ധമായ ഒരു തന്ത്രം x \u003d 1/2 ആയിരിക്കും, ശത്രു എസ്ബിയുടെ ഒപ്റ്റിമൽ തന്ത്രം y \u003d 0, y \u003d 1 എന്നിവ പ്രയോഗിക്കുക എന്നാണ് ഇതിനർത്ഥം, കണക്കാക്കി, കണക്കാക്കി ഓവർലോഡിനായി x \u003d 1/2, ശത്രു എല്ലാ കേസുകളിലും പകുതിയോളം കുതന്ത്രം ഉപയോഗിക്കരുത്, സാധ്യമായ പരമാവധി കുസൃതി.

അത്തിപ്പഴം. 7.8 ചിത്രം. 7.9.

ഈ തീരുമാനം മൂല്യങ്ങൾക്കുള്ള ന്യായമായതായി തെളിയിക്കുന്നത് k ± 2. ശത്രു തന്ത്രമുള്ള എസ് ബി ഉള്ള ശരാശരി വിജയികളും ഞങ്ങളുടെ തന്ത്രവും എച്ച്. ഇത് പ്രവർത്തനത്തിലൂടെ പ്രകടിപ്പിക്കുന്നു , k ≤ 2 ന് k ≤ 2 ന് ഒരു പരമാവധി ഒരു പരമാവധി ഒരു പരമാവധി ഉണ്ട്, ഗെയിം α ന്റെ കുറഞ്ഞ വിലയ്ക്ക് തുല്യമാണ്. തൽഫലമായി, പരാജയപ്പെട്ട ശത്രുവിന്റെ പ്രയോഗം α യിൽ കൂടുതൽ അല്ല, ഇത് കളിയുടെ കുറഞ്ഞ വിലയാണ് - ഗെയിമിന്റെ വിലയുണ്ട് ν.

K\u003e 2 ന് x \u003d 1/2 പോയിന്റുകളിൽ x 0, 1 - x 0 എന്നിവയുമായി സമഗ്രമായ ആപേക്ഷികവുമുള്ള ഫംഗ്ഷന് (ചിത്രം 7.10) ഉണ്ട്, x 0 ന്റെ മൂല്യം കെ.

വ്യക്തമായും, കാരണം കെ. \u003d 2 x 0 \u003d 1 - x 0 \u003d ½; വർദ്ധിച്ചു കൂടുന്നു കെ. പോയിന്റുകൾ x 0, 1 - x 0 എന്നിവ നീക്കി, അങ്ങേയറ്റത്തെ പോയിന്റുകളുമായി അടുക്കുന്നു (0, 1). തൽഫലമായി, ഗെയിമിന്റെ പരിഹാരം കെയെ ആശ്രയിച്ചിരിക്കും. K ന്റെ നിർദ്ദിഷ്ട മൂല്യം ഞങ്ങൾ സജ്ജമാക്കി, ഉദാഹരണത്തിന് k \u003d 3, ഗെയിമിന് ഒരു പരിഹാരം കണ്ടെത്തുക; ഇത് ചെയ്യുന്നതിന്, പരമാവധി കർവ് എ (x) ന്റെ അബ്സസ്സി 0 ൽ ഞങ്ങൾ നിർവചിക്കുന്നു. സീറോ ഡെറിവേറ്റീവ് ഫംഗ്ഷനുമായി തുല്യമായ ഒരു (x), x 0 നിർണ്ണയിക്കാൻ സമവാക്യം എഴുതുക:

ഈ സമവാക്യത്തിന് മൂന്ന് വേരുകളുണ്ട്: x \u003d 1/2 (അത് നേടിയെടുക്കുന്നയിടത്ത്), x 0, 1 - x 0, x 0, 1 - x 0 എന്നിവയും. സമവാക്യം സംരംക പരിഹരിക്കുന്നതിന്, ഞങ്ങൾ ഏകദേശം x 0 ± 0.07 കണ്ടെത്തുന്നു; 1 - x 0 ± 0.93.

ഈ കേസിൽ കളിയുടെ തീരുമാനം അടുത്ത ജോഡി തന്ത്രങ്ങളായിരിക്കുമെന്ന് ഞങ്ങൾ തെളിയിക്കുന്നു:

ഞങ്ങളുടെ തന്ത്രവും ശത്രു തന്ത്രവും ഡബ്ല്യു. ശരാശരി വിജയം തുല്യമാണ്

0 ന് കുറഞ്ഞത് 1 (y) കണ്ടെത്തുക< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

Y \u003d 1/2, ഞങ്ങൾക്ക് ലഭിക്കുന്നു

അത് 1 (0) നേക്കാൾ വലുതാണ്; തൽഫലമായി, ഗെയിമിന്റെ വില 1 (0) ൽ കുറവല്ല:

ഇപ്പോൾ ശത്രു ഒരു തന്ത്രം പ്രയോഗിക്കുന്നുവെന്ന് പറയാം, ഞങ്ങൾ ഒരു തന്ത്രമാണ് x. അപ്പോൾ ശരാശരി വിജയം ചെയ്യും

എന്നാൽ ഞങ്ങൾ x 0 തിരഞ്ഞെടുത്തു, അതിനാൽ x \u003d x 0 പരമാവധി പദവിയിലെത്തി (7.2); അതിനാൽ

ആ. സ്ട്രാറ്റജി എസ് ബി * പ്രയോഗിച്ച എതിരാളി 0.530 ൽ കൂടുതൽ നഷ്ടം അനുവദിക്കരുത്; അതിനാൽ, ν \u003d 0.530 ഗെയിമിന്റെ വിലയാണ്, സ്ട്രാറ്റജി എസ് എ *, എസ് ബി * ഒരു പരിഹാരം നൽകുന്നു. ഇതിനർത്ഥം നമ്മൾ x \u003d 0.07, x \u003d 0.93 എന്നിവയുമായി ഒരേ ആവൃത്തിയുമായി ഉപയോഗിക്കണം, അതേ ആവൃത്തിയിലുള്ള എതിരാളി പരമാവധി ഓവർലോഡിനൊപ്പം കൈകാര്യം ചെയ്യുകയും കുസൃതിയും അല്ല.

വിജയികൾ ν \u003d 0,530 കളിയുടെ കുറഞ്ഞ വിലയേക്കാൾ വലുതാണ് നിങ്ങളുടെ പരമാവധി സ്ട്രാറ്റജി എക്സ് 0 \u003d 1/2 ഉപയോഗിച്ച് നമുക്ക് സ്വയം സുരക്ഷിതരാകാം.

അതിലൊന്ന് പ്രായോഗിക മാർഗങ്ങൾ അനന്തമായ ഗെയിമുകൾ പരിഹരിക്കുന്നത് അവരുടെ ഏകദേശ കുറവാണ് ഫൈനലിന്. ഈ സാഹചര്യത്തിൽ, ഓരോ കളിക്കാരന്റെയും സാധ്യമായ തന്ത്രങ്ങൾ പരമ്പരാഗതമായി ഒരു തന്ത്രത്തിലേക്ക് സംയോജിപ്പിച്ചിരിക്കുന്നു. ഈ രീതിയിൽ, തീർച്ചയായും, ഏകദേശ ഗെയിം തീരുമാനം മാത്രം നേടാൻ കഴിയും, പക്ഷേ മിക്ക കേസുകളിലും കൃത്യമായ പരിഹാരം ആവശ്യമില്ല.

എന്നിരുന്നാലും, ഈ സ്വീകരണം ഉപയോഗിക്കുമ്പോൾ, സമ്മിശ്ര തന്ത്രങ്ങളുടെ ഫീൽഡിൽ പരിഹാരങ്ങൾ പ്രത്യക്ഷപ്പെടാം, കൂടാതെ പ്രാരംഭ അനന്ത ഗെയിമിന്റെ പരിഹാരം നെറ്റ് തന്ത്രങ്ങളിൽ സാധ്യമാകുന്നിടത്തുവീണു, അതായത്. അനന്തമായ ഗെയിമിന് ഒരു സാഡിൽ പോയിന്റുണ്ടെങ്കിൽ. അനന്തമായ ഗെയിമിന്റെ വിവരസമയത്ത്, ഒരു മിശ്രിത പരിഹാരം ലഭിച്ചു, അതിൽ രണ്ട് അയൽവാസിയായ "ഉപയോഗപ്രദമായ" തന്ത്രങ്ങൾ മാത്രം ഉൾപ്പെട്ടിട്ടുണ്ടെങ്കിൽ, അവയ്ക്കിടയിലുള്ള യഥാർത്ഥ അനന്തകാലത്തെ ഇന്റർമീഡിയറ്റ് അറ്റ \u200b\u200bതന്ത്രം പ്രയോഗിക്കാൻ ശ്രമിക്കുന്നു.

ഉപസംഹാരമായി, അന്തിമത്തിന് വിരുദ്ധമായി അനന്തമായ ഗെയിമുകൾ പരിഹാരങ്ങളില്ലായില്ലായിരിക്കാം. പരിഹാരമില്ലാത്ത അനന്തമായ ഗെയിമിന്റെ ഒരു ഉദാഹരണം നമുക്ക് നൽകാം. രണ്ട് കളിക്കാർ എല്ലാ സംഖ്യകളെയും വിളിക്കുന്നു. പേരിലായി കൂടുതൽ മറ്റൊരു റൂബിളിൽ നിന്ന് ലഭിക്കുന്നു. രണ്ടും ഒരേ നമ്പർ വിളിച്ചിട്ടുണ്ടെങ്കിൽ, ഗെയിം ഒരു സമനിലയോടെ അവസാനിക്കുന്നു. ഗെയിം വ്യക്തമായും പരിഹാരങ്ങൾ ഉണ്ടാകില്ല. എന്നിരുന്നാലും, പരിഹാരം വ്യക്തമായി നിലനിൽക്കുന്ന അനന്തമായ ഗെയിമുകളുടെ ക്ലാസുകൾ ഉണ്ട്.

© 2021 skudelnica.ru - സ്നേഹം, രാജ്യദ്രോഹം, മന psych ശാസ്ത്രം, വിവാഹമോചനം, വികാരങ്ങൾ, വഴക്കുകൾ