ක්රීඩා ආකෘති සංකල්පය. ගෙවීම් අනුකෘතිය

නිවස / වංචා කරන සැමියා

යුගල කළ පරිමිත ක්‍රීඩාවක් සලකා බලන්න. ක්රීඩකයාට ඉඩ දෙන්න ඒත්ඇත ටීඅපි සඳහන් කරන පුද්ගලික උපාය මාර්ග

ක්රීඩකයාට ඉඩ දෙන්න තුලපවතින පීපුද්ගලික උපාය මාර්ග, අපි ඒවා දක්වමු. ඔවුන් පවසන්නේ ක්‍රීඩාවට මානයක් ඇති බවයි ටී x පී.

උපාය මාර්ග ඕනෑම යුගලයක ක්රීඩකයන් විසින් තෝරා ගැනීමේ ප්රතිඵලයක් ලෙස, ක්රීඩාවේ ප්රතිඵලය අද්විතීය ලෙස තීරණය කරනු ලැබේ, i.e. දිනනවා ඒත්;. ක්රීඩකයා ඒත්(ධනාත්මක හෝ ඍණාත්මක) සහ අහිමි වීම (-ay)ක්රීඩකයා තුල.අපි හිතමු වටිනාකම් කියලා ඒත්..ඕනෑම උපායමාර්ග යුගලයක් සඳහා ප්රසිද්ධය (ඒ:, බී;.). අනුකෘතිය පී =(ඒ..), i == 1, 2, ..., mj = 1, 2, ..., පී,එහි මූලද්‍රව්‍ය වන්නේ උපාය මාර්ගවලට අනුරූප වන ගෙවීම් ය ඒත්.හා bj,කියලා ගෙවීම් අනුකෘතිය,හෝ ක්රීඩා අනුකෘතිය. සාමාන්ය ආකෘතියඑවැනි අනුකෘතියක් වගුවේ දක්වා ඇත. 12.1 මෙම වගුවේ පේළි ක්රීඩකයාගේ උපාය මාර්ග වලට අනුරූප වේ ඒත්,සහ තීරු යනු ක්‍රීඩකයාගේ උපාය මාර්ග වේ තුල.

වගුව 12.1

ඊලග ගේම් එකට payoff matrix එකක් හදමු.

12.1 සෙවුම් ක්‍රීඩාව.

ක්රීඩකයා ඒත්නවාතැන් දෙකෙන් එකක (I සහ II) සැඟවිය හැක; ක්රීඩකයා තුලක්රීඩකයෙක් සොයමින් ඒත්,ඔහු සොයා ගන්නේ නම්, ඔහුට ගුහා 1 ක දඩයක් ලැබේ. ඒකක සිට ඒත්,එසේ නොමැති නම් ක්රීඩකයාට ගෙවයි ඒත්දින 1 යි ඒකක ක්රීඩාවේ ගෙවීමේ අනුකෘතිය ගොඩනැගීම අවශ්ය වේ.

D e s h e n i එස්. ගෙවීම් අනුකෘතිය සම්පාදනය කිරීම සඳහා, එක් එක් ක්රීඩකයාගේ හැසිරීම විශ්ලේෂණය කිරීම අවශ්ය වේ. ක්රීඩකයා ඒත්නවාතැන් I හි සැඟවිය හැක - අපි මෙම උපාය මාර්ගයෙන් දක්වන්නෙමු v නවාතැන් II තුළ - උපාය ඒත්. g ක්රීඩකයා තුලනවාතැන් I - උපාය මාර්ගයේ පළමු ක්‍රීඩකයා සෙවිය හැක තුල(හෝ නවාතැන් II තුළ - උපාය මාර්ගය තුල.,.ක්රීඩකයා නම් ඒත් I සැඟවී සිටින අතර ක්‍රීඩකයා විසින් එහි සොයාගනු ලැබේ තුල,එම. උපාය මාර්ග කිහිපයක් ක්රියාත්මක වෙමින් පවතී ν තුල{), පසුව ක්රීඩකයා ඒත්දඩයක් ගෙවයි, i.e. ඒත් n = -1. ඒ හා සමානව, අපට ලැබේ ඒත්. n = -1 (ඒත් 2, තුල.,).පැහැදිලිවම, උපාය මාර්ග (A, තුල.,)සහ (R2, /1,) ක්‍රීඩකයාට දෙන්න ඒත් 1 දිනන්න, ඉතින් ඒත්පී = a. n = I. මේ අනුව, 2x2 ප්‍රමාණයේ "සෙවුම්" ක්‍රීඩාව සඳහා, අපට ගෙවීම් අනුකෘතිය ලැබේ:

ක්රීඩාව සලකා බලන්න ටී x පී matrix සමඟ P = a j) , i = 1,2, ..., τη; j= 1, 2, ..., සහ උපාය මාර්ග අතරින් හොඳම දේ තීරණය කරන්න ඒත්හිදී v..., ඒත් m. උපාය මාර්ගයක් තෝරා ගැනීම j player ඒත්ක්රීඩකයා බලාපොරොත්තු විය යුතුය තුලඑක් උපාය මාර්ගයකින් එයට පිළිතුරු දෙනු ඇත තුල.,ඒ සඳහා ක්රීඩකයා සඳහා ගෙවීම ඒත්අවම (ක්රීඩකයා තුලක්‍රීඩකයාට "හානියක්" කිරීමට උත්සාහ කරයි ඒත්).

a මගින් දක්වන්න; ක්රීඩකයාගේ අඩුම ගෙවීම ඒත්ඔහු උපාය මාර්ගය තෝරා ගන්නා විට L; හැකි සියලුම ක්‍රීඩක උපාය මාර්ග සඳහා තුල(කුඩාම සංඛ්යාව i-th line payoff matrix), i.e.

සියලුම සංඛ්‍යා අතර a (r = 1,2,..., ටී)විශාලතම තෝරන්න: . අපි කතා කරමු සහ ක්රීඩාවේ අඩු මිල,හෝ උපරිම ගෙවීම (maximin).මේ B ක්‍රීඩකයාගේ ඕනෑම උපාය මාර්ගයක් සඳහා A ක්‍රීඩකයාගේ ගෙවීම සහතික කෙරේ.ප්රතිඵලයක් වශයෙන්,

(12.2)

maximin වලට අනුරූප වන උපාය මාර්ගය ලෙස හැඳින්වේ උපරිම උපාය.ක්රීඩකයා තුලක්‍රීඩකයාගේ ගෙවීම අඩු කිරීමට උනන්දු වෙයි ඒත්;උපාය මාර්ගයක් තෝරා ගැනීම තුල.,සඳහා හැකි උපරිම ගෙවීම සැලකිල්ලට ගනී ඒත්.දක්වන්න

සියලුම අංක අතර β. කුඩාම තෝරන්න

සහ β අමතන්න ඉහළම ක්රීඩා මිල, හෝ minimax ගෙවීම (minimax).මේ B ක්‍රීඩකයාගේ අහිමි වීම සහතිකයි.ප්රතිඵලයක් වශයෙන්,

(12.4)

minimax උපාය මාර්ගය ලෙස හැඳින්වේ minimax උපාය මාර්ගය.

ක්‍රීඩකයින්ට වඩාත්ම "ප්‍රවේශම් සහගත" minimax සහ maximin උපාය මාර්ග තෝරා ගැනීමට නියම කරන මූලධර්මය මූලධර්මය ලෙස හැඳින්වේ. minimax.මෙම මූලධර්මය අනුගමනය කරන්නේ එක් එක් ක්‍රීඩකයා ප්‍රතිවාදියාගේ ප්‍රතිවිරුද්ධ ඉලක්කය සපුරා ගැනීමට උත්සාහ කරන සාධාරණ උපකල්පනයෙනි. ගැටලුව 12.1 හි ක්‍රීඩාවේ පහළ සහ ඉහළ මිල ගණන් සහ ඊට අනුරූප උපාය මාර්ග තීරණය කරමු. ගෙවීම් අනුකෘතිය සලකා බලන්න

ගැටලුව 12.1 සිට. උපාය මාර්ගය තෝරා ගැනීමේදී, (න්‍යාසයේ පළමු පේළිය), අවම ගෙවීම a, =min(-l; 1) = -1 ට සමාන වන අතර ක්‍රීඩකයාගේ උපාය β1 ට අනුරූප වේ. තුල.උපාය මාර්ගයක් තෝරාගැනීමේදී එල් 2 (න්‍යාසයේ දෙවන පේළිය) අවම ගෙවීම වේ ඒත් 2 = min(l; -1) = -1, එය උපාය මාර්ගයෙන් සාක්ෂාත් කරගනු ලැබේ තුල.,.

ඔබටම සහතික වීම උපරිම ජයග්රහණයක්රීඩකයාගේ ඕනෑම උපාය මාර්ගයක් සඳහා තුල, i.e. ක්‍රීඩාවේ අඩු මිල a = max(a, a2) = max(-l; -1) = -1, player ඒත්ඕනෑම උපාය මාර්ගයක් තෝරා ගත හැකිය: Aj හෝ ඒත් 2, i.e. ඔහුගේ ඕනෑම උපාය මාර්ගයක් උපරිම වේ.

B, (තීරුව 1), ක්‍රීඩකයා තෝරා ගැනීම තුලක්රීඩකයා බව තේරුම් ගනී ඒත්උපාය මාර්ගයකින් ප්‍රතිචාර දක්වනු ඇත ඒත් 2 ඔබේ ලාභය උපරිම කිරීමට (අලාභය තුල).එබැවින්, ක්රීඩකයාගේ උපරිම පාඩුව තුලඔහු B උපායමාර්ගය තෝරා ගන්නා විට, β, = max(-1; 1) = 1 ට සමාන වේ.

ඒ හා සමානව, B ක්‍රීඩකයාගේ උපරිම අලාභය (ලාභ ඒත්) ඔහු උපාය මාර්ග තෝරා ගන්නා විට B2 (තීරුව 2) β2 = max(l; -1) = 1 ට සමාන වේ.

මේ අනුව, ක්රීඩකයාගේ ඕනෑම උපාය මාර්ගයක් සඳහා ඒත් B ක්‍රීඩකයාගේ සහතික කළ අවම පාඩුව β = πιίη(β1, β2) = min(l; 1) = 1- ක්‍රීඩාවේ ඉහළම මිලට සමාන වේ.

B ක්‍රීඩකයාගේ ඕනෑම උපාය මාර්ගයක් minimax වේ. වගුව එකතු කිරීමෙන්. 12.1 පේළිය β; සහ තීරුව a;, අපි මේසය ලබා ගනිමු. 12.2 අතිරේක පේළි සහ තීරු මංසන්ධියේදී, අපි ක්රීඩා වල ඉහළ සහ පහළ මිල සටහන් කරමු.

වගුව 12.2

ඉහත ගැටලුව 12.1 හි, ක්‍රීඩාවේ ඉහළ සහ පහළ පිරිවැය වෙනස් වේ: a f β.

ක්රීඩාවේ ඉහළ සහ පහළ මිල සමාන නම්, එසේ නම් සාමාන්ය අර්ථයඉහළ සහ අඩු මිලක්රීඩාව α = β = υ ලෙස හැඳින්වේ ක්රීඩාවේ ශුද්ධ මිල,හෝ ක්රීඩාවේ මිල.ක්‍රීඩාවේ මිලට අනුරූප වන minimax උපාය මාර්ග වේ ප්රශස්ත උපාය මාර්ගසහ ඔවුන්ගේ සම්පූර්ණත්වය ප්රශස්ත විසඳුමහෝ තීරණයක්රීඩා. මෙම නඩුවේ ක්රීඩකයා ඒත්උපරිම සහතිකය ලබා ගනී (ක්‍රීඩකයාගේ හැසිරීමෙන් ස්වාධීන) තුල)ගෙවීම υ, සහ ක්‍රීඩකයා තුලඅවම සහතික (L ක්‍රීඩකයාගේ හැසිරීම කුමක් වුවත්) පාඩුව υ ලබා ගනී. ක්‍රීඩාවට විසඳුම ඇති බව කියනු ලැබේ ස්ථාවරත්වය,එම. එක් ක්‍රීඩකයෙක් ඔහුගේ ප්‍රශස්ත උපාය මාර්ගයට ඇලී සිටින්නේ නම්, අනෙකාට ඔහුගේ ප්‍රශස්ත උපාය මාර්ගයෙන් බැහැර වීම වාසිදායක විය නොහැක.

යුගල පිරිසිදු උපාය මාර්ග ඒත්.සහ B. ක්‍රීඩාවට ප්‍රශස්ත විසඳුමක් ලබා දෙන්නේ අනුරූප මූලද්‍රව්‍යය r එහි තීරුවේ විශාලතම සහ එහි පේළියේ කුඩාම යන දෙකම නම් සහ පමණි. එවැනි තත්වයක් පවතී නම්, එය හැඳින්වේ සෑදල ලක්ෂය(එක් දිශාවකට ඉහළට සහ අනෙක් පැත්තෙන් පහළට වක්‍රවන සෑදලයක මතුපිටට සමාන වේ).

දක්වන්න ඒත්*හා තුල*සෑදල ලක්ෂ්‍යයක් සමඟ ගැටලුවේ ක්‍රීඩාවේ විසඳුම සාක්ෂාත් කර ගන්නා පිරිසිදු උපාය මාර්ග යුගලයකි. අපි එක් එක් උපාය මාර්ග යුගලයේ පළමු ක්‍රීඩකයාගේ ගෙවීම් කාර්යය හඳුන්වා දෙමු: පී(ඒ:, තුල-) = සහ දී. එවිට සෑදල ස්ථානයේ ඇති ප්‍රශස්ත තත්ත්වය ද්විත්ව අසමානතාවය තෘප්තිමත් කරයි: P(Aj, B*)<Р(А*, В*)<Р(А", В ), සෑම කෙනෙකුටම සත්ය වන i = 1, 2, ..., m;j = 1, 2, ..., පී.ඇත්ත වශයෙන්ම, උපාය මාර්ගය තෝරා ගැනීම ඒත්* ප්‍රශස්ත උපාය මාර්ගය යටතේ පළමු ක්‍රීඩකයා තුල"දෙවන ක්‍රීඩකයා හැකි අවම ගෙවීම් උපරිම කරයි: පී(ඒ*, බී")> පී(ඒජී තුල"),සහ උපාය මාර්ගය තෝරා ගැනීම බී"දෙවන ක්‍රීඩකයා, පළමු එකෙහි ප්‍රශස්ත උපාය මාර්ගයෙන්, උපරිම අලාභය අවම කරයි: P(D , තුල*)<Р(А", В).

12.2 payoff matrix මගින් ලබා දෙන ක්‍රීඩාවේ අඩු සහ ඉහළ මිල තීරණය කරන්න

ක්‍රීඩාවට සෑදල ලක්ෂයක් තිබේද?

වගුව 12 3

විසඳුමක්.සියලුම ගණනය කිරීම් න්‍යාසයට අමතරව වගුවක පහසුවෙන් සිදු කෙරේ ආර්,ඇතුල් කළ තීරුව a; සහ රේඛාව)

© 2022 skudelnica.ru -- ආදරය, පාවාදීම, මනෝවිද්‍යාව, දික්කසාදය, හැඟීම්, ආරවුල්