Wazo la mifano ya mchezo. Matrix ya Malipo

nyumbani / Saikolojia

KAZI YA VITENDO No. 3

Mifano ya nadharia ya mchezo

Kuelewa mifano ya mchezo

Nadharia ya mchezo inahusika katika ukuzaji wa aina anuwai za mapendekezo ya kufanya maamuzi katika hali hali ya migogoro... Kuunda hali za migogoro kihisabati, zinaweza kuwakilishwa kama mchezo wa wachezaji wawili, watatu au zaidi, ambao kila mmoja hufuata lengo la kuongeza faida yake kwa gharama ya mchezaji mwingine. Mfano wa hisabati wa hali ya migogoro inaitwa mchezo wahusika katika mzozo - wachezaji, na matokeo ya mzozo ni ushindi... Kwa kila mchezo uliorasimishwa, tunatanguliza kanuni, i.e. mfumo wa masharti ambayo huamua:

1. chaguzi kwa vitendo vya wachezaji;

2. kiasi cha habari kila mchezaji anayo kuhusu tabia ya washirika;

3. faida ambayo kila seti ya vitendo inaongoza.

Kama sheria, ushindi unaweza kubainishwa kwa kiasi (kwa mfano, hasara - 0, kushinda - 1, sare - ½). Mchezo unaitwa chumba cha mvuke ikiwa wachezaji wawili wanashiriki ndani yake, na nyingi ikiwa idadi ya wachezaji ni zaidi ya wawili. Mchezo unaitwa mchezo wa sifuri-jumla ikiwa faida ya mmoja wa wachezaji ni sawa na hasara ya mwingine. Uchaguzi na utekelezaji wa moja ya vitendo vinavyotolewa na sheria huitwa hoja mchezaji. Hatua zinaweza kuwa za kibinafsi au za nasibu. Hoja ya kibinafsi- chaguo la kufahamu na mchezaji wa moja ya vitendo vinavyowezekana (hoja katika mchezo wa chess), mwendo wa nasibu- hatua iliyochaguliwa kwa nasibu (kuchagua kadi kutoka kwa staha iliyochanganyikiwa).

Mkakati wa mchezaji inaitwa seti ya sheria zinazoamua uchaguzi wa hatua yake kwa kila hoja ya kibinafsi, kulingana na hali ya sasa. Mchezo unaitwa mwisho ikiwa mchezaji ana idadi komo ya mikakati, na isiyo na mwisho- vinginevyo.

Ili kutatua mchezo, au kupata suluhisho la mchezo, mtu anapaswa kuchagua mkakati kwa kila mchezaji ambao unakidhi hali bora, i.e. mmoja wa wachezaji lazima apokee ushindi wa juu wakati mwingine anashikilia mkakati wake. Wakati huo huo, mchezaji wa pili lazima awe na hasara ndogo ikiwa wa kwanza atashikamana na mkakati wake. Mikakati kama hiyo inaitwa bora. Kusudi nadharia ya mchezo ni kuamua mkakati mwafaka kwa kila mchezaji... Wakati wa kuchagua mkakati bora, ni kawaida kudhani kuwa wachezaji wote wawili wanatenda ipasavyo kutoka kwa mtazamo wa masilahi yao.

Matrix ya malipo. Bei za chini na za juu za mchezo

Fikiria mchezo wa mwisho wa jozi. Acha mchezaji A ina m mikakati ya kibinafsi, ambayo tutaiweka A 1, A 2, ..., A m. Acha mchezaji B kuna n mikakati binafsi, tuwachague B 1, B 2, ..., B n. Wanasema kwamba mchezo una mwelekeo m n... Kama matokeo ya chaguo la wachezaji wa jozi yoyote ya mikakati A i na B j matokeo ya mchezo ni ya kipekee kuamua, i.e. faida ij mchezaji A(chanya au hasi) na hasara (- ij) mchezaji V... Matrix Р = (ij), vipengele ambavyo ni malipo yanayolingana na mikakati A i na B j inaitwa matrix ya malipo au matrix ya mchezo.

B j A i B 1 B 2 B n
A 1 ya 11 ya 12 ya 1n
A 2 ya 21 ya 22 ya 2n
A m m1 m 2 mn

Mfano - mchezo "Tafuta"

Mchezaji A inaweza kujificha kwenye kuba 1 - tutateua mkakati huu kama A 1 au katika kuba 2 - mkakati A 2... Mchezaji V inaweza kutafuta mchezaji wa kwanza katika kuba 1 - mkakati KATIKA 1, au katika vault 2 - mkakati KATIKA 2... Ikiwa mchezaji A iko kwenye kuba 1 na inagunduliwa hapo na mchezaji V, i.e. mikakati kadhaa inafanywa (A 1, B 1), kisha mchezaji A hulipa faini, i.e. ya 11= -1. Vile vile, tunapata ya 22= -1. Ni wazi, mikakati (A 1, B 2) na (A 2, B 1) mpe mchezaji A malipo ni 1, kwa hivyo ya 12=ya 21= 1. Kwa hivyo, tunapata matrix ya malipo

Fikiria mchezo m n na matrix Р = (ij) na kuamua bora kati ya mikakati ya mchezaji A... Kuchagua mkakati A i, mchezaji A lazima kuhesabu kuwa mchezaji V itajibu kwa moja ya mikakati Katika j ambayo faida kwa mchezaji A ndogo (mchezaji V inatafuta "kumdhuru" mchezaji A).

Wacha tuonyeshe kwa a i malipo madogo zaidi ya mchezaji A wakati wa kuchagua mkakati A i kwa mikakati yote inayowezekana ya wachezaji V(idadi ndogo zaidi katika i-th safu ya matrix ya malipo), i.e. ...

Kati ya nambari zote a i chagua kubwa zaidi:. Hebu piga simu a bei ya chini ya mchezo , au ushindi wa juu (maximin ) hiyo malipo ya uhakika ya mchezaji A kwa mkakati wowote wa mchezaji B... Kwa hivyo, .

Mkakati unaolingana na maximin unaitwa kuongeza mkakati... Mchezaji V nia ya kupunguza ushindi wa mchezaji A; kuchagua mkakati B j, inazingatia kiwango cha juu cha faida kinachowezekana kwa A. Denote.

Kati ya nambari zote, tunachagua ndogo na kupiga simu b bei ya juu ya mchezo , au ushindi mdogo (kiwango cha chini ) hiyo hasara ya uhakika ya mchezaji B kwa mkakati wowote wa mchezaji A... Kwa hivyo, .

Mkakati unaolingana na minimax unaitwa mkakati wa minimax... Kanuni inayoelekeza kwa wachezaji chaguo la mikakati ya uangalifu zaidi ya minimax na maximin inaitwa kanuni ya kiwango cha chini.

Michezo ya takwimu

Katika kazi nyingi zinazosababisha kucheza, kutokuwa na uhakika kunasababishwa na ukosefu wa habari kuhusu hali ambayo hatua inafanywa. Masharti haya hayategemei vitendo vya ufahamu vya mchezaji mwingine, lakini kwa ukweli wa lengo, ambayo kwa kawaida huitwa "asili." Michezo kama hiyo inaitwa michezo ya asili (michezo ya takwimu).

Kazi

Baada ya miaka kadhaa ya uendeshaji, vifaa vya viwanda vinageuka kuwa katika mojawapo ya majimbo yafuatayo: B 1 - vifaa vinaweza kutumika mwaka ujao baada ya matengenezo ya kuzuia; В 2 - kwa uendeshaji usio na shida wa vifaa, sehemu zake za kibinafsi na makusanyiko zinapaswa kubadilishwa katika siku zijazo; B 3 - vifaa vinahitaji matengenezo makubwa au uingizwaji.

Kulingana na hali ya sasa B 1, B 2, B 3, usimamizi wa biashara unaweza kufanya maamuzi yafuatayo: A 1 - kutengeneza vifaa na wataalamu wa kiwanda, ambayo inahitaji gharama zinazolingana 1 = 6, 2 = 10. , na 3 = vitengo 15 vya fedha; Na 2 - piga timu maalum ya repairmen, gharama katika kesi hii itakuwa b 1 = 15, b 2 = 9, b 3 = 18 vitengo vya fedha; Na 3 - kuchukua nafasi ya vifaa na mpya, kuuza vifaa vya zamani kwa thamani yake ya mabaki. Gharama ya jumla ya matokeo ya shughuli hii itakuwa sawa, kwa mtiririko huo, na 1 = 13, na 2 = 24, na 3 = 12 vitengo vya fedha.

Zoezi

1. Baada ya kutoa hali iliyoelezewa mpango wa mchezo, tambua washiriki wake, onyesha mikakati safi ya wahusika.

2. Fanya matrix ya malipo, ukielezea maana ya vipengele vya ij ya tumbo (kwa nini ni hasi?).

3. Ili kujua ni uamuzi gani juu ya uendeshaji wa vifaa katika mwaka ujao inashauriwa kupendekeza kwa usimamizi wa biashara ili kupunguza hasara chini ya mawazo yafuatayo: a) uzoefu uliopatikana katika biashara katika uendeshaji wa vifaa sawa unaonyesha. kwamba uwezekano wa majimbo yaliyoonyeshwa ya vifaa ni, kwa mtiririko huo, q 1 = 0.15; q 2 = 0.55; q 3 = 0.3 (tumia kigezo cha Bayes); b) uzoefu unaonyesha kwamba hali zote tatu zinazowezekana za kifaa zinawezekana kwa usawa (tumia kigezo cha Laplace); c) hakuna kitu cha uhakika kinachoweza kusema juu ya uwezekano wa vifaa (tumia vigezo vya Wald, Savage, Hurwitz). Thamani ya parameter g = 0.8 katika kigezo cha Hurwitz imetolewa.

Suluhisho

1) Hali iliyoelezwa ni mchezo wa takwimu.

Mtaalamu wa takwimu ni usimamizi wa biashara, ambayo inaweza kufanya moja ya maamuzi yafuatayo: kutengeneza vifaa peke yake (mkakati A1), piga simu watengenezaji (mkakati A2); badilisha vifaa na mpya (mkakati A 3).

Upande wa pili wa kucheza - asili, tutazingatia seti ya mambo yanayoathiri hali ya vifaa: vifaa vinaweza kutumika baada ya ukarabati wa kuzuia (hali B 1); ni muhimu kuchukua nafasi ya makusanyiko ya mtu binafsi na sehemu za vifaa (hali B 2): inahitajika ukarabati au uingizwaji wa vifaa (jimbo B 3).

2) Wacha tuunda matrix ya malipo ya mchezo:

Sehemu ya matrix ya malipo a ij inaonyesha gharama za usimamizi wa biashara ikiwa, kwa mkakati uliochaguliwa A i, vifaa vinageuka kuwa katika hali B j. Vipengele vya matrix ya malipo ni hasi, kwani kwa mkakati wowote uliochaguliwa, usimamizi wa biashara utalazimika kubeba gharama.

a) uzoefu uliopatikana katika biashara kwa kufanya kazi sawa na vifaa unaonyesha kuwa uwezekano wa majimbo ya vifaa ni sawa na q 1 = 0.15; q 2 = 0.55; q 3 = 0.3.

Tunawakilisha matrix ya malipo katika fomu:

Takwimu za mkakati, A i Nchi za asili B j
B 1 B 2 B 3
A 1 -6 -10 -15 -10,9
A 2 -15 -9 -18 -12,6
A 3 -13 -24 -12 -18,75
q j 0,15 0,55 0,3

wapi, (i = 1,3)

Kwa mujibu wa kigezo cha Bayes, mkakati bora ni mkakati safi А i, ambayo huongeza malipo ya wastani ya mwanatakwimu, i.e. zinazotolewa = max.

Mkakati mwafaka wa Bayesian ni mkakati A 1.

b) uzoefu unaopatikana unaonyesha kwamba majimbo yote matatu yanayowezekana ya vifaa yanawezekana kwa usawa, i.e. = 1/3.

Ushindi wa wastani ni sawa:

1/3 * (- 6-10-15) = -31/3 "-10.33;

1/3*(-15-9-18) = -42/3 = -14;

1/3 * (- 13-24-12) = -49/3 "-16.33.

Mkakati bora wa Laplace ni mkakati A 1.

c) hakuna kitu cha uhakika kinachoweza kusema juu ya uwezekano wa vifaa.

Kwa mujibu wa kigezo cha Wald, mkakati bora unachukuliwa kuwa mkakati safi ambao unahakikisha malipo ya juu katika hali mbaya zaidi, i.e.

.

= max (-15, -18, -24) = -15.

Kwa hivyo, mkakati bora ni А 1.

Wacha tujenge matrix ya hatari, wapi.

Mkakati wa mchezaji ni mpango kulingana na ambayo hufanya uchaguzi katika hali yoyote inayowezekana na habari yoyote ya kweli. Kwa kawaida, mchezaji hufanya maamuzi wakati wa mchezo. Walakini, kwa nadharia, inaweza kuzingatiwa kuwa maamuzi haya yote yalifanywa na mchezaji mapema. Kisha jumla ya maamuzi haya ni mkakati wake. Kulingana na idadi ya mikakati inayowezekana, michezo imegawanywa kuwa isiyo na kikomo na isiyo na kikomo. Kazi ya nadharia ya mchezo ni kukuza mapendekezo kwa wachezaji, ambayo ni, kuamua mkakati bora kwao. Mbinu mojawapo ni mkakati ambao, kwa marudio mengi ya mchezo, humpa mchezaji fulani upeo wa wastani wa malipo unaowezekana.

Aina rahisi zaidi ya mchezo wa kimkakati ni mchezo wa wachezaji wawili wenye sifuri (jumla ya ushindi wa wahusika ni sawa na sifuri). Mchezo una hatua mbili: mchezaji A huchagua mojawapo ya mbinu anazoweza kutumia Ai (i = 1, 2, m), na mchezaji B anachagua mkakati Bj (j = 1, 2,., N), na kila chaguo hufanywa na ujinga kamili uchaguzi wa mchezaji mwingine.

Lengo la mchezaji A ni kuongeza chaguo za kukokotoa φ (Ai, Bj), kwa upande wake, lengo la mchezaji B ni kupunguza utendaji sawa. Kila mmoja wa wachezaji anaweza kuchagua moja ya vigezo ambavyo thamani ya chaguo la kukokotoa inategemea. Ikiwa mchezaji A atachagua baadhi ya mikakati Ai, basi hii yenyewe haiwezi kuathiri thamani ya chaguo la kukokotoa φ (Ai, Bj).

Ushawishi wa Ai juu ya thamani ya thamani φ (Ai, Bj) hauna uhakika; uhakika unafanyika tu baada ya uchaguzi, kwa kuzingatia kanuni ya kupunguza φ (Ai, Bj), na mchezaji mwingine wa variable Bj. Katika kesi hii, Bj imedhamiriwa na mchezaji mwingine. Acha φ (Ai, Bj) = aij. Wacha tutengeneze matrix A:

Safu za matrix zinalingana na mikakati Ai, safuwima zinalingana na mikakati Bj. Matrix A inaitwa malipo au matrix ya mchezo. Kipengele cha aij cha matrix ni malipo ya mchezaji A ikiwa alichagua mkakati wa Ai na mchezaji B alichagua mkakati Bj.

Acha mchezaji A achague mkakati fulani Ai; basi katika hali mbaya zaidi (mfano ikiwa chaguo litakuwa inayojulikana kwa mchezaji C) atapata malipo sawa na min aij. Kwa kutarajia uwezekano kama huo, mchezaji A lazima achague mkakati kama huo ili kuongeza malipo yake ya chini:

a = max min aij

Thamani a - malipo ya uhakika ya mchezaji A - inaitwa bei ya chini ya mchezo. Mkakati wa Аi0, ambao unahakikisha kupata a, unaitwa maximin.

Mchezaji B, akichagua mkakati, hutoka kwa kanuni ifuatayo: wakati wa kuchagua mkakati fulani Bj, upotezaji wake hautazidi kiwango cha juu cha maadili ya vitu vya safu ya j-th ya matrix, i.e. chini ya au sawa na max aij

Kuzingatia kuweka max aij kwa maana tofauti j, mchezaji B kawaida huchagua thamani kama hiyo ya j ambapo upotezaji wake wa juu zaidi β hupunguzwa:

β = min miax aij

Thamani β inaitwa bei ya juu ya mchezo, na mkakati Bj0 unaolingana na malipo β unaitwa minimax.

Faida halisi ya mchezaji A kwa vitendo vinavyokubalika vya washirika imepunguzwa na bei za chini na za juu za mchezo. Ikiwa maneno haya ni sawa, i.e.

Nadharia ya mchezo ni taaluma ya hisabati, somo ambalo ni mbinu za kufanya maamuzi katika hali za migogoro.

Hali hiyo inaitwa mzozo ikiwa masilahi ya watu kadhaa (kawaida wawili), wanaofuata malengo tofauti, yanagongana ndani yake. Kila upande unaweza kufanya shughuli kadhaa ili kufikia malengo yake, mafanikio ya upande mmoja yanamaanisha kushindwa kwa upande mwingine.

Katika uchumi, hali ya migogoro ni ya kawaida sana (uhusiano kati ya muuzaji na walaji, mnunuzi na muuzaji, benki na mteja). Hali za migogoro hutokea katika maeneo mengine mengi pia.

Hali ya migogoro inazalishwa na tofauti katika maslahi ya washirika na hamu ya kila mmoja wao kufanya maamuzi bora ambayo yanafikia malengo yaliyowekwa kwa kiwango kikubwa. Katika kesi hiyo, kila mtu anapaswa kuhesabu sio tu kwa malengo yao wenyewe, bali pia kwa malengo ya mpenzi, na kuzingatia maamuzi ambayo haijulikani mapema ambayo washirika watafanya.

Kawaida, hali za migogoro ni ngumu kuchanganua moja kwa moja kwa sababu ya sababu nyingi za upili zinazoingia. Ili kufanya uwezekano wa uchambuzi wa hisabati wa hali ya migogoro, ni lazima iwe rahisi, kwa kuzingatia mambo makuu tu. Mfano uliorahisishwa wa hali ya migogoro unaitwa mchezo wahusika katika mzozo - wachezaji, na matokeo ya mzozo ni ushindi. Kwa kawaida, faida (au hasara) inaweza kuhesabiwa; kwa mfano, unaweza kukadiria hasara kama sifuri, faida kama moja, na sare kama 1/2.

Mchezo ni mkusanyiko kanuni kuelezea tabia za wachezaji. Kila mfano wa kucheza mchezo kwa njia fulani kutoka mwanzo hadi mwisho ni chama cha mchezo. Uchaguzi na utekelezaji wa moja ya vitendo vinavyotolewa na sheria huitwa hoja mchezaji. Hatua zinaweza kuwa za kibinafsi au za nasibu. Hoja ya kibinafsi ni chaguo la ufahamu na mchezaji wa mojawapo ya vitendo vinavyowezekana (kwa mfano, hoja katika mchezo wa chess). Hoja bila mpangilio- hii pia ni chaguo la mojawapo ya chaguo nyingi, lakini hapa chaguo halichaguliwa na mchezaji, lakini kwa utaratibu fulani wa uteuzi wa random (kutupa sarafu, kuchagua kadi kutoka kwenye staha iliyopigwa).

Mkakati mchezaji ni seti ya sheria zinazoamua uchaguzi wa vitendo vyake kwa kila hoja ya kibinafsi, kulingana na hali ya sasa.



Ikiwa mchezo una hatua za kibinafsi pekee, basi matokeo ya mchezo hubainishwa ikiwa kila mmoja wa wachezaji amechagua mkakati wake. Hata hivyo, ikiwa kuna miondoko ya nasibu kwenye mchezo, basi mchezo utakuwa wa uwezekano na chaguo la mikakati ya wachezaji bado haitaamua matokeo ya mchezo.

Kwa kuamua mchezo, au kutafuta suluhu la mchezo, mtu anapaswa kuchagua mkakati kwa kila mchezaji unaokidhi hali hiyo ukamilifu, hizo. mmoja wa wachezaji lazima apokee ushindi wa juu, wakati mwingine anashikilia mkakati wake. Wakati huo huo, mchezaji wa pili lazima awe na hasara ndogo ikiwa wa kwanza atashikamana na mkakati wake. Mikakati kama hiyo inaitwa bora. Mikakati bora lazima ikidhi hali ya utulivu, i.e. haipaswi kuwa na faida kwa mchezaji yeyote kuacha mkakati wao katika mchezo huu.

Lengo la nadharia ya mchezo ni kubainisha mkakati mwafaka kwa kila mchezaji.

Fikiria mchezo wa mwisho wa jozi. Acha mchezaji A ina m mikakati ya kibinafsi, ambayo tutaiweka A 1 , A 2 , ..., A m ... Acha mchezaji V kuna n mikakati binafsi, tuwachague B 1 , B 2 , ..., B m ... Wanasema kwamba mchezo una mwelekeo m × n ... Kama matokeo ya chaguo la wachezaji wa jozi yoyote ya mikakati



A i na B j (i = 1, 2, ..., m; j = 1, 2, ..., n)

matokeo ya mchezo ni ya kipekee kuamua, i.e. faida ij mchezaji A (chanya au hasi) na hasara ( -a ij ) mchezaji V ... Tuseme maadili OU inayojulikana kwa jozi yoyote ya mikakati (A mimi, B j ) Matrix , vipengele ambavyo ni malipo yanayolingana na mikakati A i na B j inaitwa matrix ya malipo au matrix ya mchezo. Fomu ya jumla matrix kama hiyo imewasilishwa katika Jedwali 3.1.

Jedwali 3.1

Safu za jedwali hili zinalingana na mikakati ya mchezaji A , na safu wima ni za mikakati ya mchezaji V ... Hebu tuunde matrix ya malipo ya mchezo unaofuata.

Fikiria mchezo m × n na matrix P = (a ij), i = 1, 2, ..., m; j = 1, 2, ..., n na kuamua bora kati ya mikakati A 1 , A 2 , ..., A m ... Kuchagua mkakati A i mchezaji A lazima kuhesabu kuwa mchezaji V itajibu kwa moja ya mikakati B j ambayo faida kwa mchezaji A ndogo (mchezaji V inatafuta "kumdhuru" mchezaji A ) Wacha tuonyeshe kwa α i , malipo madogo zaidi ya mchezaji A wakati wa kuchagua mkakati A i kwa mikakati yote inayowezekana ya wachezaji V (idadi ndogo zaidi katika i-th safu ya matrix ya malipo), i.e.

Mkakati unaolingana na maximin unaitwa kuongeza mkakati... Mchezaji V nia ya kupunguza ushindi wa mchezaji A ; kuchagua mkakati B j , inachukua katika akaunti ya upeo wa faida iwezekanavyo kwa A ... Tunaashiria

Mkakati unaolingana na kiwango cha chini unaitwa mkakati wa kiwango cha chini. Kanuni inayoelekeza kwa wachezaji chaguo la mikakati ya "makini" zaidi na ya juu inaitwa kanuni ya kiwango cha chini... Kanuni hii inafuatia kutokana na dhana nzuri kwamba kila mchezaji anatafuta kufikia lengo kinyume na lile la adui. Wacha tuamue bei ya chini na ya juu ya mchezo na mikakati inayolingana katika shida.

Ikiwa bei ya juu na ya chini ya mchezo ni sawa, basi jumla ya thamani juu na bei ya chini michezo α = β = v kuitwa bei safi ya mchezo , au kwa gharama ya mchezo ... Mikakati ya kiwango cha chini zaidi inayolingana na bei ya mchezo ni mikakati bora, na jumla yao ni suluhisho mojawapo , au uamuzi wa mchezo... Katika kesi hii, mchezaji A hupata dhamana ya juu (huru ya tabia ya mchezaji V ) kushinda v na mchezaji V inafikia kiwango cha chini cha uhakika (bila kujali tabia ya mchezaji A ) kupoteza v ... Inasemekana kuwa suluhu ya mchezo ina uendelevu , i.e. ikiwa mmoja wa wachezaji atafuata mkakati wake bora, basi haiwezi kuwa na faida kwa mwingine kupotoka kutoka kwa mkakati wake bora.

Oa mikakati safi A i na B j inatoa suluhisho bora kwa mchezo ikiwa na tu ikiwa kipengele kinacholingana ij , ndio kubwa zaidi katika safu yake na ndogo zaidi katika safu yake. Hali kama hiyo, ikiwa iko, inaitwa sehemu ya tandiko (sawa na uso wa tandiko ambao hujipinda kuelekea upande mmoja na chini kwa upande mwingine).

Dhana za msingi za mfano wa usimamizi wa hesabu.

Katika biashara na utengenezaji, ni mazoea ya kawaida kudumisha hesabu inayofaa ya rasilimali au vipengee ili kuhakikisha uendelevu. mchakato wa uzalishaji... Kijadi, hisa hutazamwa kama gharama isiyoepukika wakati kiwango cha chini sana husababisha kukatizwa kwa gharama kubwa ya uzalishaji, na juu sana kwa mtaji "kufa ganzi". Changamoto ya usimamizi wa hesabu ni kuamua kiwango cha hesabu kinachosawazisha kesi mbili zilizotajwa.

Hebu fikiria sifa kuu za mifano ya usimamizi wa hesabu.

Mahitaji... Mahitaji ya bidhaa iliyohifadhiwa yanaweza kuwa ya kuamua(katika kesi rahisi, mara kwa mara kwa wakati) au nasibu. Nasibu ya mahitaji inaelezewa ama kwa wakati nasibu wa mahitaji, au kwa kiasi nasibu cha mahitaji katika nyakati za kubainisha au nasibu.

Ujazaji wa ghala. Ujazaji wa ghala unaweza kufanywa mara kwa mara kwa vipindi fulani, au kama hifadhi zinapungua, i.e. kuzipunguza kwa kiwango fulani.

Kiasi cha agizo. Kwa kujazwa tena mara kwa mara na kupungua kwa hisa kwa bahati mbaya, kiasi cha agizo kinaweza kutegemea hali ambayo inazingatiwa wakati wa kuweka agizo. Agizo kawaida huwasilishwa kwa kiasi sawa wakati hisa inafikia kiwango fulani - kinachojulikana pointi za utaratibu.

Muda wa kujifungua. Katika mifano bora ya usimamizi wa hesabu, inadhaniwa kuwa ujazo ulioagizwa hutolewa kwenye duka mara moja. Miundo mingine inazingatia kucheleweshwa kwa utoaji kwa muda maalum au wa nasibu.

Gharama ya utoaji. Kama sheria, inachukuliwa kuwa gharama ya kila uwasilishaji inajumuisha vifaa viwili - gharama za wakati mmoja ambazo hazitegemei kiasi cha kundi lililoamriwa, na gharama ambazo hutegemea (mara nyingi kwa mstari) kwa saizi ya kundi.

Gharama za kuhifadhi. Katika mifano mingi ya usimamizi wa hesabu, kiasi cha ghala kinachukuliwa kuwa kikomo bila ukomo, na kiasi cha hesabu iliyohifadhiwa hutumika kama thamani ya kudhibiti. Katika kesi hii, inaaminika kuwa uhifadhi wa kila kitengo cha hisa kwa kitengo cha wakati hutozwa ada fulani.

Adhabu ya upungufu. Ghala lolote linaundwa ili kuzuia uhaba ya aina fulani bidhaa katika mfumo wa huduma. Ukosefu wa hisa kwa wakati unaofaa husababisha hasara zinazohusiana na kupungua kwa vifaa, ukiukwaji wa uzalishaji, nk. Hasara hizi zinaitwa adhabu ya upungufu.

Nomenclature ya hisa. Katika hali rahisi, inachukuliwa kuwa hisa ya aina moja ya bidhaa au bidhaa ya homogeneous huhifadhiwa kwenye ghala. Katika zaidi kesi ngumu inazingatiwa hisa mbalimbali.

Muundo wa mfumo wa ghala. Zaidi kikamilifu mifano ya hisabati slaidi moja. Hata hivyo, katika mazoezi, pia kuna miundo ngumu zaidi: mifumo ya hierarchical ya watumwa na vipindi tofauti vya kujaza na wakati wa utoaji wa maagizo, pamoja na uwezekano wa kubadilishana hisa kati ya maghala ya ngazi sawa ya uongozi, nk.

Kigezo cha ufanisi wa mkakati wa usimamizi wa hesabu uliopitishwa ni kazi ya gharama (gharama), inayowakilisha gharama ya jumla ya kusambaza bidhaa iliyohifadhiwa, uhifadhi wake na gharama ya adhabu.

Usimamizi wa hesabu unajumuisha kutafuta mkakati kama huo wa kujaza tena na matumizi na hesabu, ambayo kazi ya gharama inachukua dhamana ya chini.

Acha kazi, na ueleze mtawalia:

Ujazaji wa hisa,

Matumizi ya hesabu,

Mahitaji ya bidhaa iliyohifadhiwa

kwa muda.

Katika mifano ya usimamizi wa hesabu, derivatives ya wakati wa kazi hizi kawaida hutumiwa, inayoitwa, kwa mtiririko huo,

Mchezo unaitwa mchezo wa sifuri-jumla, au upinzani ikiwa faida ya mmoja wa wachezaji ni sawa na hasara ya mwingine, i.e. kwa kazi kamili ya mchezo, inatosha kuonyesha thamani ya mmoja wao. Ikiwa tunaashiria a- ushindi wa mmoja wa wachezaji, b- malipo ya mwingine, basi kwa mchezo wa sifuri-jumla b = - a, kwa hiyo inatosha kuzingatia, kwa mfano, a.

Uchaguzi na utekelezaji wa moja ya vitendo vinavyotolewa na sheria huitwa hoja mchezaji. Hatua zinaweza kuwa za kibinafsi au za nasibu.

Hoja ya kibinafsi ni chaguo la ufahamu na mchezaji wa mojawapo ya vitendo vinavyowezekana (kwa mfano, hoja katika mchezo wa chess).

Hoja bila mpangilio ni kitendo kilichochaguliwa kwa nasibu (kwa mfano, kuchagua kadi kutoka kwa staha iliyochanganyikiwa). Katika kazi yangu, nitazingatia tu hatua za kibinafsi za wachezaji.

Mkakati mchezaji ni seti ya sheria zinazoamua uchaguzi wa hatua yake kwa kila hatua ya kibinafsi, kulingana na hali ya sasa. Kawaida, wakati wa mchezo, kwa kila hoja ya kibinafsi, mchezaji hufanya uchaguzi kulingana na hali maalum. Hata hivyo, kwa kanuni, inawezekana kwamba maamuzi yote yanafanywa na mchezaji mapema (kwa kukabiliana na hali yoyote inayotokea). Hii inamaanisha kuwa mchezaji amechagua mkakati fulani, ambao unaweza kuwekwa katika mfumo wa orodha ya sheria au programu. (Hivi ndivyo unavyoweza kucheza mchezo na kompyuta). Mchezo unaitwa mwisho ikiwa kila mchezaji ana idadi maalum ya mikakati, na isiyo na mwisho- vinginevyo.

Ili kutatua mchezo, au kupata suluhu la mchezo, ni muhimu kwa kila mchezaji kuchagua mkakati unaokidhi masharti. ukamilifu, i.e. mmoja wa wachezaji lazima apokee ushindi wa juu wakati mwingine anashikilia mkakati wake. Wakati huo huo, mchezaji wa pili lazima awe na hasara ndogo ikiwa wa kwanza atashikamana na mkakati wake. Vile mkakati zinaitwa mojawapo... Mikakati mwafaka inapaswa pia kutosheleza hali ya utulivu, i.e. haipaswi kuwa na faida kwa mchezaji yeyote kuacha mkakati wao katika mchezo huu.

Madhumuni ya Nadharia ya Mchezo: uamuzi wa mkakati bora kwa kila mchezaji. Wakati wa kuchagua mkakati bora, ni kawaida kudhani kuwa wachezaji wote wawili wanatenda ipasavyo kutoka kwa mtazamo wa masilahi yao.

Michezo pinzani ambayo kila mchezaji ana mikakati mahususi huitwa michezo ya matrix... Jina hili linaelezewa na uwezekano ufuatao wa kuelezea michezo ya aina hii. Tunachora jedwali la mstatili ambalo safu mlalo zinalingana na mikakati ya mchezaji wa kwanza, safu wima zinalingana na mikakati ya wa pili, na seli za jedwali kwenye makutano ya safu na safu zinalingana na hali ya mchezo. . Ikiwa tutaweka katika kila seli malipo ya mchezaji wa kwanza katika hali inayolingana, basi tunapata maelezo ya mchezo kwa namna ya matrix fulani. Matrix hii inaitwa matrix ya mchezo au matrix ya malipo.

Mchezo mmoja na wa mwisho wa uhasama unaweza kuelezewa na matrices tofauti, tofauti kutoka kwa kila mmoja tu kwa mpangilio wa safu na safu.

Fikiria mchezo m x n na matrix Р = (ij), i = 1,2, ..., m;j = 1,2, ..., n na kuamua bora kati ya mikakati A 1, A 2, ..., A m... Kuchagua mkakati A i mchezaji A lazima kuhesabu kuwa mchezaji V itajibu kwa moja ya mikakati B j ambayo faida kwa mchezaji A ndogo (mchezaji V inatafuta "kumdhuru" mchezaji A) Wacha tuonyeshe kwa a i, malipo madogo zaidi ya mchezaji A wakati wa kuchagua mkakati A i kwa mikakati yote inayowezekana ya wachezaji V(idadi ndogo zaidi katika i-th kulipa safu ya tumbo), i.e.

a i = ij , j = 1, ..., n.

Kati ya nambari zote a i (i = 1,2, ..., m ) chagua kubwa zaidi. Hebu piga simu a bei ya chini ya mchezo au malipo ya juu zaidi (maximin). Huu ni ushindi wa uhakika kwa mchezaji. A kwa mkakati wa mchezaji yeyote V... Kwa hivyo, i = 1, ..., m; j = 1, ..., n

Mkakati unaolingana na maximin unaitwa mkakati wa juu... Mchezaji V nia ya kupunguza ushindi wa mchezaji A; kuchagua mkakati B j, inachukua katika akaunti ya upeo wa faida iwezekanavyo kwa A.

Hebu tuashiria: β i = ij , i = 1, ..., m

Kati ya nambari zote B j chagua ndogo zaidi na upige simu β bei ya juu ya mchezo au ushindi wa kiwango cha chini (minimax). Hii ni hasara ya uhakika kwa mchezaji V.

Kwa hivyo, i = 1, ..., m; j = 1, ..., n.

Mkakati unaolingana na minimax unaitwa mkakati wa minimax.

Kanuni inayoelekeza kwa wachezaji chaguo la mikakati ya "makini" zaidi na ya juu inaitwa kanuni ya kiwango cha chini. Kanuni hii inafuatia kutokana na dhana nzuri kwamba kila mchezaji anatafuta kufikia lengo kinyume na lile la adui.

Hotuba ya 9. Wazo la mifano ya mchezo. Matrix ya malipo.

§ VIPENGELE 6 VYA NADHARIA YA MCHEZO

6.1 Wazo la mifano ya mchezo.

Mfano wa hisabati wa hali ya migogoro inaitwa mchezo , pande za migogoro - wachezaji, na matokeo ya mzozo ni ushindi .

Kwa kila mchezo uliorasimishwa, tunatanguliza kanuni , hizo. mfumo wa masharti ambayo huamua: 1) chaguzi kwa vitendo vya wachezaji; 2) kiasi cha habari kila mchezaji anayo kuhusu tabia ya washirika; 3) faida ambayo kila seti ya vitendo inaongoza. Kwa kawaida, faida (au hasara) inaweza kuhesabiwa; kwa mfano, unaweza kukadiria hasara kama sifuri, faida kama moja, na sare kama 1/2. Tathmini ya kiasi cha matokeo ya mchezo inaitwa malipo .

Mchezo unaitwa chumba cha mvuke , ikiwa wachezaji wawili wanashiriki ndani yake, na nyingi , ikiwa idadi ya wachezaji ni zaidi ya wawili. Tutazingatia michezo ya jozi pekee. Wanahusisha wachezaji wawili A na V, ambao maslahi yao ni kinyume, na kwa mchezo tunamaanisha mfululizo wa vitendo kutoka upande A na V.

Mchezo unaitwa mchezo wa sifuri, au upinzani anga , ikiwa faida ya mmoja wa wachezaji ni sawa na hasara ya mwingine, i.e. jumla ya ushindi wa pande zote mbili ni sawa na sifuri. Kwa kazi kamili ya mchezo, inatosha kuonyesha thamani ya mmoja wao . Ikiwa tunaashiria a- ushindi wa mmoja wa wachezaji, b malipo ya mwingine, basi kwa mchezo wa sifuri-jumla b =a, kwa hiyo inatosha kuzingatia, kwa mfano a.

Uchaguzi na utekelezaji wa moja ya vitendo vinavyotolewa na sheria huitwa hoja mchezaji. Hatua zinaweza kuwa binafsi na nasibu . Hoja ya kibinafsi ni chaguo la ufahamu na mchezaji wa mojawapo ya vitendo vinavyowezekana (kwa mfano, hoja katika mchezo wa chess). Seti ya chaguzi zinazowezekana kwa kila hoja ya kibinafsi inadhibitiwa na sheria za mchezo na inategemea seti nzima ya hatua za awali kwa pande zote mbili.

Hoja bila mpangilio ni hatua iliyochaguliwa kwa nasibu (kwa mfano, kuchagua kadi kutoka kwa staha iliyochanganyikiwa). Ili mchezo ufafanuliwe kihisabati, sheria za mchezo lazima zionyeshe kwa kila hatua ya nasibu usambazaji wa uwezekano matokeo iwezekanavyo.

Baadhi ya michezo inaweza tu kujumuisha miondoko ya nasibu (kinachojulikana kama kamari) au miondoko ya kibinafsi pekee (chess, checkers). Mengi ya michezo ya kadi ni michezo mchanganyiko, yaani, ina miondoko ya nasibu na ya kibinafsi. Katika siku zijazo, tutazingatia tu hatua za kibinafsi za wachezaji.

Michezo huainishwa si tu kwa asili ya mienendo yao (ya kibinafsi, bila mpangilio), lakini pia kwa asili na kiasi cha taarifa zinazopatikana kwa kila mchezaji kuhusu matendo ya mwingine. Darasa maalum la michezo linaundwa na ile inayoitwa "michezo na habari kamili». Mchezo wenye taarifa kamili unaitwa mchezo ambapo kila mchezaji katika kila hatua ya kibinafsi anajua matokeo ya hatua zote za awali, za kibinafsi na za nasibu. Mifano ya michezo yenye taarifa kamili ni chess, cheki, na mchezo maarufu"Noughts na misalaba". Michezo mingi yenye umuhimu wa kiutendaji si ya darasa la michezo yenye taarifa kamili, kwani kutokuwa na uhakika kuhusu matendo ya adui kwa kawaida ni kipengele muhimu cha hali za migogoro.

Moja ya dhana ya msingi ya nadharia ya mchezo ni dhana mkakati .

Mkakati mchezaji ni seti ya sheria zinazoamua uchaguzi wa hatua yake kwa kila hatua ya kibinafsi, kulingana na hali ya sasa. Kawaida, wakati wa mchezo, kwa kila hoja ya kibinafsi, mchezaji hufanya uchaguzi kulingana na hali maalum. Hata hivyo, kwa kanuni, inawezekana kwamba maamuzi yote yanafanywa na mchezaji mapema (kwa kukabiliana na hali yoyote inayotokea). Hii inamaanisha kuwa mchezaji amechagua mkakati fulani, ambao unaweza kuwekwa katika mfumo wa orodha ya sheria au programu. (Hivi ndivyo unavyoweza kucheza mchezo na kompyuta). Mchezo unaitwa mwisho , ikiwa kila mchezaji ana idadi maalum ya mikakati, na isiyo na mwisho .– vinginevyo.

Kwa kuamua mchezo , au kupata suluhisho la mchezo , mtu anapaswa kuchagua mkakati kwa kila mchezaji unaokidhi hali ukamilifu , hizo. mmoja wa wachezaji lazima apokee ushindi wa juu, wakati mchezaji wa pili anafuata mkakati wake, Wakati huo huo, mchezaji wa pili lazima awe na hasara ndogo , ikiwa wa kwanza atashikamana na mkakati wake. Mikakati kama hiyo inaitwa mojawapo . Mikakati bora lazima pia ikidhi hali hiyo uendelevu , hizo. haipaswi kuwa na faida kwa mchezaji yeyote kuacha mkakati wao katika mchezo huu.

Ikiwa mchezo unarudiwa mara nyingi, basi wachezaji wanaweza kutokuwa na hamu ya kushinda na kupoteza katika kila mchezo fulani, afaida ya wastani (hasara) katika vyama vyote.

Lengo la nadharia ya mchezo ni kubainisha mkakati mwafaka kwa kila mchezaji.

6.2. Matrix ya malipo. Bei za chini na za juu za mchezo

Mchezo wa mwisho ambao mchezaji A Ina T mikakati, na mchezaji B - uk mikakati inaitwa mchezo.

Fikiria mchezo
wachezaji wawili A na V("Sisi" na "adui").

Acha mchezaji A ina T mikakati ya kibinafsi, ambayo tutaiweka
... Acha mchezaji V kuna n mikakati binafsi, tuwachague
.

Acha kila upande uchague mkakati maalum; kwetu itakuwa , kwa adui ... Kama matokeo ya chaguo la wachezaji wa jozi yoyote ya mikakati na (
) matokeo ya mchezo yamedhamiriwa kipekee, i.e. faida mchezaji A(chanya au hasi) na kupoteza
mchezaji V.

Tuseme maadili wanajulikana kwa mikakati yoyote ( ,). Matrix
,
, vipengele vyake ni ushindi unaoendana na mikakati na , kuitwa matrix ya malipo au matrix ya mchezo. Safu mlalo za matrix hii zinalingana na mikakati ya mchezaji A, na safu ni za mikakati ya mchezaji B... Mikakati hii inaitwa mikakati safi.

Mchezo Matrix
inaonekana kama:

Fikiria mchezo
na matrix

na kuamua bora kati ya mikakati
. Kuchagua mkakati , mchezaji A lazima kuhesabu kuwa mchezaji V itajibu kwa moja ya mikakati , ambayo faida kwa mchezaji A ndogo (mchezaji V inatafuta "kumdhuru" mchezaji A).

Wacha tuonyeshe kwa malipo madogo zaidi ya mchezaji A wakati wa kuchagua mkakati kwa mikakati yote inayowezekana ya wachezaji V(idadi ndogo zaidi katika i-th safu ya matrix ya malipo), i.e.

(1)

Kati ya nambari zote (
) chagua kubwa zaidi:
.

Hebu piga simu
bei ya chini ya Ngra, au ushindi wa juu (maxmin). Huu ni ushindi uliohakikishwa kwa mchezaji A kwa mkakati wowote wa mchezaji B. Kwa hivyo,

. (2)

Mkakati unaolingana na maximin unaitwa kuongeza mkakati . Mchezaji V nia ya kupunguza ushindi wa mchezaji A, kuchagua mkakati , anazingatia faida kubwa iwezekanavyo katika kesi hii kwa A. Tunaashiria

. (3)

Kati ya nambari zote chagua ndogo zaidi

na piga simu bei ya juu ya mchezo au ushindi mdogo (kiwango cha chini). Ego amehakikishiwa kupoteza mchezaji B . Kwa hiyo,

. (4)

Mkakati unaolingana na minimax unaitwa mkakati wa minimax.

Kanuni inayoelekeza kwa wachezaji chaguo la mikakati ya "makini" zaidi na ya juu inaitwa kanuni ya kiwango cha chini . Kanuni hii inafuatia kutokana na dhana nzuri kwamba kila mchezaji anatafuta kufikia lengo kinyume na lile la adui.

Nadharia.Bei ya chini ya mchezo haizidi bei ya juu ya mchezo kila wakati
.

Ikiwa bei ya juu na ya chini ya mchezo ni sawa, basi jumla ya bei ya juu na ya chini ya mchezo.
kuitwa bei safi ya mchezo, au kwa gharama ya mchezo. Mikakati ya kiwango cha chini zaidi inayolingana na bei ya mchezo ni mikakati bora , na jumla yao - suluhisho mojawapo au kwa uamuzi wa mchezo. Katika kesi hii, mchezaji A hupata dhamana ya juu (huru ya tabia ya mchezaji V) faida v na mchezaji V inafikia kiwango cha chini cha uhakika (bila kujali tabia ya mchezaji A) kupoteza v... Inasemekana kuwa suluhu ya mchezo ina uendelevu , hizo. ikiwa mmoja wa wachezaji atafuata mkakati wake bora, basi haiwezi kuwa na faida kwa mwingine kupotoka kutoka kwa mkakati wake bora.

Ikiwa mmoja wa wachezaji (kwa mfano A) hushikamana na mkakati wake bora na mchezaji mwingine (V) itapotoka kutoka kwa mkakati wake bora kwa njia yoyote, basi haiwezi kamwe kuwa na faida kwa mchezaji anayefanya kupotoka; kupotoka kwa mchezaji kama huyo V inaweza kuacha ushindi bila kubadilika. na katika hali mbaya zaidi, ongeza.

Kinyume chake, ikiwa V inazingatia mkakati wake bora, na A inapotoka yenyewe, basi hakuna kesi inaweza kuwa na manufaa kwa A.

Mikakati michache safi na inatoa suluhisho bora kwa mchezo ikiwa na tu ikiwa kipengele kinacholingana ndio kubwa zaidi katika safu yake na ndogo zaidi katika safu yake. Hali kama hiyo, ikiwa iko, inaitwa sehemu ya tandiko. Katika jiometri, hatua kwenye uso ambayo ina mali ya kiwango cha chini cha wakati mmoja pamoja na kuratibu moja na kiwango cha juu kando ya nyingine inaitwa. tandiko uhakika, kwa mlinganisho neno hili linatumika katika nadharia ya mchezo.

Mchezo ambao
,
kuitwa mchezo wa hatua ya tandiko. Kipengele kumiliki mali hii, sehemu ya tandiko la tumbo.

Kwa hivyo, kwa kila mchezo ulio na sehemu ya tandiko, kuna suluhisho ambalo linafafanua jozi ya mikakati bora kwa pande zote mbili, ambayo ina mali zifuatazo.

1) Ikiwa pande zote mbili zitafuata mikakati yao bora, basi wastani wa malipo ni sawa na bei halisi ya mchezo. v, ambayo ni wakati huo huo bei yake ya chini na ya juu.

2) Ikiwa moja ya vyama inazingatia mkakati wake bora, na nyingine inapotoka kutoka kwake, basi upande wa kupotoka unaweza tu kupoteza kutoka kwa hili na hakuna kesi inaweza kuongeza faida yake.

Darasa la michezo iliyo na sehemu ya tandiko ni ya kupendeza sana kutoka kwa mtazamo wa kinadharia na wa vitendo.

Katika nadharia ya mchezo, inathibitishwa kuwa, haswa, kila mchezo ulio na habari kamili una mahali pa kuweka, na, kwa hivyo, kila mchezo kama huo una suluhisho, ambayo ni, kuna jozi ya mikakati bora ya pande zote mbili zinazotoa malipo ya wastani. sawa na bei ya mchezo. Iwapo mchezo ulio na taarifa kamili una hatua za kibinafsi pekee, basi kila upande unapotumia mkakati wake mwafaka, lazima umalizike kwa matokeo dhahiri kabisa, yaani, ushindi ambao ni sawa kabisa na bei ya mchezo.

© 2021 skudelnica.ru - Upendo, usaliti, saikolojia, talaka, hisia, ugomvi