เกมกลยุทธ์ที่บริสุทธิ์ กลยุทธ์ผสม
ทฤษฎีเกมกลยุทธ์ผสม
กลยุทธ์ผสม
หากในเกมเมทริกซ์ไม่มีจุดอานในกลยุทธ์ที่บริสุทธิ์ จะพบราคาบนและล่างของเกม พวกเขาแสดงให้เห็นว่าผู้เล่น 1 จะไม่ได้รับชัยชนะที่เกินราคาเกมบน และผู้เล่นที่ 1 รับประกันการชนะที่ไม่ต่ำกว่าราคาเกมที่ต่ำกว่า
กลยุทธ์แบบผสมของผู้เล่นคือชุดกลยุทธ์ที่สมบูรณ์ของเขาโดยมีการทำซ้ำหลาย ๆ เกมภายใต้เงื่อนไขเดียวกันกับความน่าจะเป็นที่กำหนด มาสรุปสิ่งที่กล่าวและระบุเงื่อนไขสำหรับการใช้กลยุทธ์แบบผสมกัน:
- * เล่นโดยไม่มีจุดอาน
- * ผู้เล่นใช้กลยุทธ์ผสมแบบสุ่มโดยมีความน่าจะเป็นที่กำหนด
- * เกมซ้ำหลายครั้งในเงื่อนไขที่คล้ายคลึงกัน
- * ในแต่ละการเคลื่อนไหวจะไม่มีใครแจ้งเกี่ยวกับการเลือกกลยุทธ์โดยผู้เล่นอื่น
- * อนุญาตให้ใช้ค่าเฉลี่ยของผลลัพธ์ของเกม
ใช้สัญกรณ์ต่อไปนี้สำหรับกลยุทธ์แบบผสม
สำหรับผู้เล่น 1 กลยุทธ์แบบผสมประกอบด้วยการใช้กลยุทธ์บริสุทธิ์ A 1, A 2, ..., A m ที่มีความน่าจะเป็นที่สอดคล้องกัน p 1, p 2, ..., p m
สำหรับผู้เล่น2
q j คือความน่าจะเป็นของการใช้กลยุทธ์บริสุทธิ์ B j
ในกรณีที่ р i = 1 สำหรับผู้เล่น 1 เรามีกลยุทธ์ที่บริสุทธิ์
กลยุทธ์ที่บริสุทธิ์ของผู้เล่นคือกลยุทธ์เดียวที่เป็นไปได้ เหตุการณ์ไม่สอดคล้องกัน... ในเกมเมทริกซ์ การรู้เมทริกซ์ A (ใช้กับทั้งผู้เล่น 1 และผู้เล่น 2) สามารถกำหนดได้ ให้เวกเตอร์และผลตอบแทนเฉลี่ย ( มูลค่าที่คาดหวังผล) ของผู้เล่น 1:
ที่ไหนและเป็นเวกเตอร์
pi และ q i เป็นองค์ประกอบของเวกเตอร์
ด้วยการใช้กลยุทธ์แบบผสม ผู้เล่น 1 พยายามที่จะเพิ่มผลตอบแทนโดยเฉลี่ยสูงสุด และผู้เล่นที่ 2 - เพื่อให้เอฟเฟกต์นี้มีค่าต่ำสุดที่เป็นไปได้ ผู้เล่น 1 พยายามที่จะบรรลุ
ผู้เล่น 2 ทำให้แน่ใจว่าตรงตามเงื่อนไข condition
ให้เราระบุเวกเตอร์ที่สอดคล้องกับกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 1 และ 2 นั่นคือ เวกเตอร์ดังกล่าวและซึ่งความเท่าเทียมกัน
ราคาของเกมคือผลตอบแทนเฉลี่ยของผู้เล่น 1 เมื่อผู้เล่นทั้งสองใช้กลยุทธ์แบบผสม ดังนั้น วิธีแก้ปัญหาของเกมเมทริกซ์คือ:
- - กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 1;
- - กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 2;
ราคาเกม.
กลยุทธ์ผสมจะเหมาะสมที่สุด (และ) หากสร้างจุดอานสำหรับฟังก์ชันเช่น
มีทฤษฎีบทพื้นฐานสำหรับเกมคณิตศาสตร์
สำหรับเกมเมทริกซ์ที่มีเมทริกซ์ A ใดๆ ปริมาณ
มีอยู่และเท่าเทียมกัน: = =.
ควรสังเกตว่าเมื่อเลือกกลยุทธ์ที่เหมาะสม ผู้เล่นที่ 1 จะรับประกันผลตอบแทนเฉลี่ยเสมอ ไม่น้อยกว่าราคาเกม สำหรับกลยุทธ์คงที่ของผู้เล่น 2 (และในทางกลับกัน สำหรับผู้เล่น 2) กลยุทธ์เชิงรุกของผู้เล่น 1 และ 2 เป็นกลยุทธ์ที่รวมอยู่ในกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นที่เกี่ยวข้องซึ่งมีความน่าจะเป็นที่ไม่ใช่ศูนย์ ซึ่งหมายความว่าองค์ประกอบของกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นอาจไม่รวมกลยุทธ์เฉพาะที่กำหนดไว้ล่วงหน้าทั้งหมด
การแก้ปัญหาเกมหมายถึงการหาราคาของเกมและกลยุทธ์ที่เหมาะสมที่สุด เราจะเริ่มพิจารณาวิธีการในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ด้วยเกมที่ง่ายที่สุดที่อธิบายโดย matrix 22 เกมจุดอานจะไม่ได้รับการพิจารณาเป็นพิเศษ หากได้จุดอานแล้ว แสดงว่ามีกลยุทธ์ที่ไม่เป็นประโยชน์ที่ควรละทิ้ง ในกรณีที่ไม่มีจุดอาน สามารถรับสองกลยุทธ์แบบผสมที่เหมาะสมที่สุดได้ ตามที่ระบุไว้ กลยุทธ์แบบผสมเหล่านี้เขียนดังนี้:
ซึ่งหมายความว่ามีเมทริกซ์การชำระเงิน
11 p 1 + 21 p 2 =; (1.16)
a 12 p 1 + 22 p 2 =; (1.17)
p 1 + p 2 = 1 (1.18)
11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)
11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1, (1.20)
ดังนั้นเราจึงได้รับค่าที่เหมาะสมที่สุดและ:
เมื่อรู้และเราพบว่า:
เมื่อคำนวณแล้วเราพบและ:
11 q 1 + 12 q 2 =; q 1 + q 2 = 1; (1.24)
11 q 1 + a 12 (1 - q 1) = (1.25)
สำหรับ 11 ถึง 12 (1.26)
ปัญหาได้รับการแก้ไขเนื่องจากพบเวกเตอร์และราคาของเกม การมีเมทริกซ์การชำระเงิน A ทำให้สามารถแก้ปัญหาแบบกราฟิกได้ ด้วยวิธีนี้ อัลกอริธึมการแก้ปัญหานั้นง่ายมาก (รูปที่ 2.1)
- 1. ส่วนของความยาวหน่วยถูกพล็อตตามแกน abscissa
- 2. ดุลยพินิจคือเงินรางวัลสำหรับกลยุทธ์ A 1
- 3. บนเส้นขนานกับแกนพิกัด ที่จุดที่ 1 เงินรางวัลจะถูกฝากด้วยกลยุทธ์ a 2
- 4. ส่วนปลายของเซ็กเมนต์ถูกกำหนดสำหรับ 11 -b 11, 12 -b 21, a 22 -b 22, 21 -b 12 และเส้นตรงสองเส้น b 11 b 12 และ b 21 b 22
- 5. กำหนดพิกัดของจุดตัดด้วย มันเท่ากัน abscissa ของจุด c เท่ากับ p 2 (p 1 = 1 - p 2)
รูปที่. 1.1.
วิธีนี้มีพื้นที่ใช้งานค่อนข้างกว้าง นี้จะขึ้นอยู่กับ ทรัพย์สินส่วนกลางเกม mn ซึ่งประกอบด้วยข้อเท็จจริงที่ว่าในเกม mn ผู้เล่นแต่ละคนมีกลยุทธ์แบบผสมที่เหมาะสมที่สุด ซึ่งจำนวนกลยุทธ์ที่แท้จริงจะอยู่ที่ต่ำสุด (m, n) จากคุณสมบัตินี้ คุณจะได้รับผลลัพธ์ที่เป็นที่รู้จัก: ในเกม 2n และ m2 ใดๆ กลยุทธ์ที่เหมาะสมที่สุดแต่ละกลยุทธ์จะมีกลยุทธ์ที่ใช้งานได้ไม่เกินสองกลยุทธ์ ดังนั้นเกม 2n และ m2 ใด ๆ ก็สามารถลดลงเป็นเกม 22 ดังนั้นเกม 2n และ m2 สามารถแก้ไขได้แบบกราฟิก หากเมทริกซ์ของเกมที่มีขอบเขตจำกัดมีมิติ mn โดยที่ m> 2 และ n> 2 จะใช้โปรแกรมเชิงเส้นเพื่อกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุด
กลยุทธ์ที่บริสุทธิ์ผู้เล่น I กำลังเลือกหนึ่งใน n แถวของเมทริกซ์ผลตอบแทน A และกลยุทธ์ที่บริสุทธิ์ของผู้เล่น II คือการเลือกหนึ่งในคอลัมน์ของเมทริกซ์เดียวกันเหมาะสมที่สุด กลยุทธ์ที่สะอาดผู้เล่นแตกต่างจากผู้เล่นแบบผสมโดยมีหน่วยบังคับ p i = 1, q i = 1 ตัวอย่างเช่น: P (1,0), Q (1,0) ที่นี่ p 1 = 1, q 1 = 1
ปัญหา 1
ใช้เมทริกซ์การชำระเงิน ค้นหากลยุทธ์ที่สะอาดเหมาะสมที่สุดโดยใช้หลักการครอบงำที่เข้มงวด ให้เขียนเวกเตอร์ P *, Q * เป็นคำตอบ
R1 | R2 | R3 | R4 |
|
S1 | 3 | 1 | 2 | 5 |
S2 | 2 | 0 | 0 | 3 |
S3 | -3 | -5 | -5 | -2 |
S4 | 0 | -2 | -2 | 1 |
การตัดสินใจ:
เราแก้ปัญหาทั้งหมดโดยใช้เครื่องคำนวณ Matrix Game
เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาเพื่อให้ได้ผลตอบแทนสูงสุด และผู้เล่น II เลือกกลยุทธ์ของเขาเพื่อลดผลตอบแทนของผู้เล่น I
ผู้เล่น | บี 1 | B2 | บี 3 | B4 | a = นาที (A ผม) |
A 1 | 3 | 1 | 2 | 5 | 1 |
A 2 | 2 | 0 | 0 | 3 | 0 |
A 3 | -3 | -5 | -5 | -2 | -5 |
A 4 | 0 | -2 | -2 | 1 | -2 |
b = สูงสุด (Bi) | 3 | 1 | 2 | 5 |
ราคาสูงสุดของเกมคือ b = นาที (b j) = 1
จุดอาน (1, 2) ระบุวิธีแก้ปัญหาสำหรับทางเลือกอื่น (A1, B2) ราคาเกมคือ 1
2. ตรวจสอบเมทริกซ์การจ่ายเงินสำหรับแถวที่โดดเด่นและคอลัมน์ที่โดดเด่น
บางครั้ง จากการพิจารณาอย่างง่ายของเมทริกซ์ของเกม เราสามารถพูดได้ว่ากลยุทธ์ที่บริสุทธิ์บางอย่างสามารถป้อนกลยุทธ์แบบผสมที่เหมาะสมที่สุดได้ก็ต่อเมื่อมีโอกาสเป็นศูนย์
พวกเขาบอกว่า ฉัน-thกลยุทธ์ของผู้เล่นคนแรกครอบงำเขา k-thกลยุทธ์ถ้า ij ≥ kj ทั้งหมด เจ อี นู๋และอย่างน้อยหนึ่ง เจ ij> kj. ในกรณีนี้ยังกล่าวอีกว่า ฉัน-thกลยุทธ์ (หรือเส้น) - เด่น k-th- ครอบงำ
พวกเขาบอกว่า j-thกลยุทธ์ของผู้เล่นคนที่ 2 ครอบงำเขา ล-thกลยุทธ์ถ้าเพื่อทั้งหมด เจ อี เอ็ม a ij ≤ a il และอย่างน้อยหนึ่ง i a ij< a il . В этом случае j-thกลยุทธ์ (คอลัมน์) เรียกว่าเด่น ล-th- ครอบงำ
กลยุทธ์ A 1 ครอบงำกลยุทธ์ A 2 (องค์ประกอบทั้งหมดของแถว 1 มากกว่าหรือเท่ากับค่าของแถวที่ 2) ดังนั้นเราจึงไม่รวมแถวที่ 2 ของเมทริกซ์ ความน่าจะเป็น p 2 = 0
กลยุทธ์ A 1 ครอบงำกลยุทธ์ A 3 (องค์ประกอบทั้งหมดของแถว 1 มากกว่าหรือเท่ากับค่าของแถวที่ 3) ดังนั้นเราจึงไม่รวมแถวที่ 3 ของเมทริกซ์ ความน่าจะเป็น p 3 = 0
3 | 1 | 2 | 5 |
0 | -2 | -2 | 1 |
จากตำแหน่งของผู้เล่น B ที่สูญเสีย กลยุทธ์ B 1 ครอบงำกลยุทธ์ B 2 (องค์ประกอบทั้งหมดของคอลัมน์ 1 รายการเพิ่มเติมคอลัมน์ 2) ดังนั้นเราจึงไม่รวมคอลัมน์ที่ 1 ของเมทริกซ์ ความน่าจะเป็น q 1 = 0
จากตำแหน่งการสูญเสียของผู้เล่น B กลยุทธ์ B 4 ครอบงำกลยุทธ์ B 1 (องค์ประกอบทั้งหมดของคอลัมน์ 4 มากกว่าองค์ประกอบของคอลัมน์ 1) ดังนั้นเราจึงไม่รวมคอลัมน์ที่ 4 ของเมทริกซ์ ความน่าจะเป็น q 4 = 0
1 | 2 |
-2 | -2 |
เราได้ลดเกม 4 x 4 เป็นเกม 2 x 2
โซลูชันเกม ( 2 x น
หน้า 1 = 1
หน้า 2 = 0
ราคาเกม y = 1
ตอนนี้เราสามารถหากลยุทธ์ minimax ของผู้เล่น B ได้โดยการเขียนระบบสมการที่เกี่ยวข้อง
q 1 = 1
q 1 + q 2 = 1
การแก้ปัญหาระบบนี้ เราพบว่า:
q 1 = 1
ตอบ:
ราคาเกม: y = 1 เวกเตอร์กลยุทธ์ของผู้เล่น:
ถาม (1, 0), P (1, 0)
∑a ij q j ≤ v
∑a ij p ฉัน ≥ v
M (P 1; Q) = (1 1) + (2 0) = 1 = v
M (P 2; Q) = (-2 1) + (-2 0) = -2 ≤ v
M (P; Q 1) = (1 1) + (-2 0) = 1 = v
M (P; Q 2) = (2 1) + (-2 0) = 2 ≥ v
เนื่องจากแถวและคอลัมน์ถูกลบออกจากเมทริกซ์ดั้งเดิม เวกเตอร์ความน่าจะเป็นที่พบสามารถเขียนได้ดังนี้:
ป (1,0,0,0)
คิว (0,1,0,0)
งาน2
ค้นหาราคาที่ต่ำกว่าและด้านบนของเกมโดยใช้เมทริกซ์การชำระเงิน ในที่ที่มีจุดอาน ให้เขียนเวกเตอร์ของกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด P *, Q *
R1 | R2 | R3 |
|
S1 | -6 | -5 | 0 |
S2 | -8 | -3 | -2 |
S3 | -3 | -2 | 3 |
การตัดสินใจ:
1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่ ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ
ผู้เล่น | บี 1 | B2 | บี 3 | a = นาที (A ผม) |
A 1 | -6 | -5 | 0 | -6 |
A 2 | -8 | -3 | -2 | -8 |
A 3 | -3 | -2 | 3 | -3 |
b = สูงสุด (Bi) | -3 | -2 | 3 |
เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = สูงสุด (a i) = -3 ซึ่งบ่งบอกถึงกลยุทธ์บริสุทธิ์สูงสุด A 3
ราคาสูงสุดของเกมคือ b = นาที (b j) = -3
จุดอาน (3, 1) ระบุวิธีแก้ปัญหาสำหรับทางเลือกอื่น (A3, B1) ราคาของเกมคือ -3
คำตอบ: P (0,0,1), Q (1,0,0)
ปัญหา3
ค้นหาเวกเตอร์ของกลยุทธ์ที่เหมาะสมที่สุด P *, Q * และราคาเกมโดยใช้เมทริกซ์การชำระเงิน ผู้เล่นคนไหนเป็นผู้ชนะ?
R1 | R2 | R3 | R4 |
|
S1 | -6 | -6 | 2 | 4 |
S2 | 2 | -2 | 7 | -1 |
การตัดสินใจ:
1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่ ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ
เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาเพื่อให้ได้ผลตอบแทนสูงสุด และผู้เล่น II เลือกกลยุทธ์ของเขาเพื่อลดผลตอบแทนของผู้เล่น I
ผู้เล่น | บี 1 | B2 | บี 3 | B4 | a = นาที (A ผม) |
A 1 | -6 | -6 | 2 | 4 | -6 |
A 2 | 2 | -2 | 7 | -1 | -2 |
b = สูงสุด (Bi) | 2 | -2 | 7 | 4 |
เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = max (a i) = -2 ซึ่งบ่งชี้ถึงกลยุทธ์สูงสุด A 2
ราคาสูงสุดของเกมคือ b = นาที (b j) = -2
จุดอาน (2, 2) ระบุวิธีแก้ปัญหาสำหรับทางเลือกอื่น (A2, B2) ราคาของเกมคือ -2
3. ค้นหาวิธีแก้ปัญหาในเกมด้วยกลยุทธ์แบบผสม
มาแก้ปัญหาด้วยวิธีเรขาคณิต ซึ่งมีขั้นตอนดังต่อไปนี้
1. ในระบบพิกัดคาร์ทีเซียน เซ็กเมนต์จะถูกพล็อตตามแกน abscissa ซึ่งมีความยาวเท่ากับ 1 ปลายด้านซ้ายของเซ็กเมนต์ (จุด x = 0) สอดคล้องกับกลยุทธ์ A 1 อันที่ถูกต้อง - กับกลยุทธ์ A 2 (x = 1) จุดกลาง x สอดคล้องกับความน่าจะเป็นของกลยุทธ์แบบผสม S 1 = (p 1, p 2)
2. ชัยชนะของกลยุทธ์ A 1 ถูกพล็อตบนแกนพิกัดด้านซ้าย บนเส้นที่ขนานกับแกนพิกัด จากจุดที่ 1 การชนะของกลยุทธ์ A 2 จะถูกวางแผน
โซลูชันเกม ( 2 x น) ดำเนินการจากตำแหน่งของผู้เล่น A โดยยึดตามกลยุทธ์สูงสุด ไม่มีผู้เล่นคนใดมีกลยุทธ์ที่โดดเด่นและซ้ำซาก
กลยุทธ์สูงสุดของผู้เล่น A สอดคล้องกับจุด N ซึ่งสามารถเขียนระบบสมการต่อไปนี้ได้:
หน้า 1 = 0
หน้า 2 = 1
ราคาเกม y = -2
ตอนนี้เราสามารถหากลยุทธ์ขั้นต่ำสุดของผู้เล่น B ได้โดยการเขียนระบบสมการที่เกี่ยวข้อง ยกเว้นกลยุทธ์ B 1, B 3, B 4 ซึ่งทำให้ผู้เล่น B สูญเสียมากกว่าอย่างเห็นได้ชัด ดังนั้น q 1 = 0 q 3 = 0, q 4 = 0 ...
-2q 2 = -2
q 2 = 1
การแก้ปัญหาระบบนี้ เราพบว่า:
q 2 = 1
ตอบ:
ราคาเกม: y = -2, เวกเตอร์กลยุทธ์ของผู้เล่น:
คิว (0, 1, 0, 0), พี (0, 1)
4. ตรวจสอบความถูกต้องของโซลูชันเกมโดยใช้เกณฑ์ความเหมาะสมของกลยุทธ์
∑a ij q j ≤ v
∑a ij p ฉัน ≥ v
M (P 1; Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M (P 2; Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M (P; Q 1) = (-6 0) + (2 1) = 2 ≥ v
M (P; Q 2) = (-6 0) + (-2 1) = -2 = v
M (P; Q 3) = (2 0) + (7 1) = 7 ≥ v
M (P; Q 4) = (4 0) + (-1 1) = -1 ≥ v
ความไม่เท่าเทียมกันทั้งหมดเป็นที่พึงพอใจในฐานะความเท่าเทียมกันหรือความไม่เท่าเทียมกันที่เข้มงวด ดังนั้นจึงพบวิธีแก้ปัญหาของเกมอย่างถูกต้อง
ปัญหา 4
ให้คำตอบโดยละเอียดสำหรับคำถาม
5. ทฤษฎีเกมและวิธีแก้ปัญหาทางสถิติ
5.1. เกมเมทริกซ์ผลรวมศูนย์
การสร้างแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ดำเนินการในเงื่อนไขต่อไปนี้:
ความแน่นอน;
ความไม่แน่นอน
การสร้างแบบจำลอง ในสภาวะความแน่นอน ถือว่ามีข้อมูลเชิงบรรทัดฐานเริ่มต้นที่จำเป็นทั้งหมด (การสร้างแบบจำลองเมทริกซ์ การวางแผนเครือข่ายและการจัดการ)
การสร้างแบบจำลอง มีความเสี่ยง ดำเนินการด้วยความไม่แน่นอนแบบสุ่มเมื่อค่าของข้อมูลเริ่มต้นบางส่วนเป็นแบบสุ่มและรู้กฎการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเหล่านี้ (การวิเคราะห์การถดถอย
การสร้างแบบจำลอง ท่ามกลางความไม่แน่นอน สอดคล้องกับ ขาดอย่างสมบูรณ์ completeข้อมูลบางส่วนที่จำเป็นสำหรับสิ่งนี้ (ทฤษฎีเกม)
แบบจำลองทางคณิตศาสตร์สำหรับการตัดสินใจที่เหมาะสมในสถานการณ์ความขัดแย้งนั้นสร้างขึ้นภายใต้เงื่อนไขที่ไม่แน่นอน
ในทฤษฎีเกม ใช้แนวคิดพื้นฐานต่อไปนี้:
กลยุทธ์;
ฟังก์ชั่นที่ชนะ
โดยหลักสูตร เราจะเรียกตัวเลือกและการดำเนินการโดยผู้เล่นจากการกระทำอย่างใดอย่างหนึ่งที่กำหนดโดยกฎของเกม
กลยุทธ์ เป็นเทคโนโลยีในการเลือกแนวทางปฏิบัติในแต่ละการเคลื่อนไหวขึ้นอยู่กับสถานการณ์ปัจจุบัน
ฟังก์ชั่นที่ชนะ ทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ
ในเกมเมทริกซ์ ฟังก์ชันการจ่ายเงินจะแสดงเป็น เมทริกซ์การชำระเงิน :
จำนวนเงินที่จ่ายให้กับผู้เล่น I ที่เลือกการย้ายจากผู้เล่น II ที่เลือกการย้ายคือที่ไหน
ในเกมคู่นี้ ค่าของฟังก์ชันการจ่ายเงินของผู้เล่นทั้งสองในแต่ละสถานการณ์จะมีขนาดเท่ากันและตรงข้ามกันในเครื่องหมายนั่นคือ และเกมนี้มีชื่อว่า ผลรวมศูนย์ .
กระบวนการของ "การเล่นเกมเมทริกซ์" มีดังต่อไปนี้:
มีการตั้งค่าเมทริกซ์การชำระเงิน
ผู้เล่น I โดยไม่ขึ้นกับผู้เล่น II เลือกหนึ่งในแถวของเมทริกซ์นี้ ตัวอย่างเช่น th;
ผู้เล่น II ไม่ว่าผู้เล่น I จะเลือกคอลัมน์ใดคอลัมน์หนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น - th;
องค์ประกอบของเมทริกซ์กำหนดจำนวนผู้เล่นที่ฉันจะได้รับจากผู้เล่น II แน่นอน ถ้าอย่างนั้น มันมาเกี่ยวกับการสูญเสียที่แท้จริงของผู้เล่น I.
เกมจับคู่ที่เป็นปฏิปักษ์กับเมทริกซ์ผลตอบแทนจะเรียกว่าเกม
ตัวอย่าง
พิจารณาเกม
กำหนดเมทริกซ์การชำระเงิน:
.
ให้ผู้เล่น I เป็นอิสระจากผู้เล่น II เลือกแถวที่สามของเมทริกซ์นี้ และผู้เล่น II โดยไม่ขึ้นกับผู้เล่น I เลือกคอลัมน์ที่สองของเมทริกซ์นี้:
จากนั้นผู้เล่น I จะได้รับ 9 หน่วยจากผู้เล่น II
5.2. กลยุทธ์ที่สะอาดที่สุดในเกมเมทริกซ์
กลยุทธ์ที่เหมาะสมที่สุด เป็นกลยุทธ์ของผู้เล่น I โดยที่เขาไม่ลดผลตอบแทนสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น II และกลยุทธ์ของผู้เล่น II ที่เขาไม่เพิ่มการสูญเสียสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น I
การเลือกแถวที่ th ของเมทริกซ์ผลตอบแทนเป็นการเคลื่อนไหว ผู้เล่น I รับรองว่าตัวเองจะได้รับผลตอบแทนอย่างน้อยตามมูลค่าในกรณีที่เลวร้ายที่สุด เมื่อผู้เล่น II พยายามลดค่านี้ให้เหลือน้อยที่สุด ดังนั้นผู้เล่นที่ฉันเลือกเช่นนั้น - แถวที่จะให้เขา ชนะสูงสุด:
.
ผู้เล่น II คิดในลักษณะเดียวกันและสามารถป้องกันการสูญเสียน้อยที่สุดได้อย่างแน่นอน:
.
ความไม่เท่าเทียมกันเป็นจริงเสมอ:
ปริมาณเรียกว่า ราคาต่ำสุดของเกม .
ปริมาณเรียกว่า ราคาสูงสุดของเกม .
กลยุทธ์ที่เหมาะสมเรียกว่า ทำความสะอาด หากความเท่าเทียมกันถือไว้สำหรับพวกเขา:
,
.
ปริมาณเรียกว่า ราคาที่แท้จริงของเกม , ถ้า ก.
กลยุทธ์และรูปแบบบริสุทธิ์ที่เหมาะสมที่สุด จุดอาน เมทริกซ์การชำระเงิน
สำหรับจุดอานจะเป็นไปตามเงื่อนไขต่อไปนี้:
นั่นคือองค์ประกอบจะเล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์
ดังนั้น หากเมทริกซ์ผลตอบแทนมี จุดอาน แล้วคุณจะพบ กลยุทธ์การทำความสะอาดที่เหมาะสมที่สุด ผู้เล่น
กลยุทธ์ที่บริสุทธิ์ของผู้เล่น I สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในหลักที่ th ซึ่งเท่ากับหนึ่ง
กลยุทธ์ที่บริสุทธิ์ของผู้เล่น II สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในหลักที่ th ซึ่งเท่ากับหนึ่ง
ตัวอย่าง
.
โดยการเลือกเป็นการย้ายแถวใดๆ ของเมทริกซ์ผลตอบแทน ผู้เล่นฉันมั่นใจว่าตัวเองจะได้รับผลตอบแทนในกรณีที่เลวร้ายที่สุดอย่างน้อยมูลค่าในคอลัมน์ที่ระบุโดย:
ดังนั้น ผู้เล่นฉันจะเลือกแถวที่ 2 ของเมทริกซ์การจ่ายเงิน ซึ่งให้ผลตอบแทนสูงสุดแก่เขาโดยไม่คำนึงถึงการเคลื่อนไหวของผู้เล่น II ซึ่งจะพยายามลดค่านี้ให้น้อยที่สุด:
ผู้เล่น II คิดเช่นเดียวกันและเลือกคอลัมน์ที่ 1 เป็นการเคลื่อนไหว:
ดังนั้นจึงมีจุดอานของเมทริกซ์การชำระเงิน:
สอดคล้องกับกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น I และสำหรับผู้เล่น II ซึ่งผู้เล่นที่ฉันไม่ได้ลดกำไรของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น II และผู้เล่น II จะไม่เพิ่มการสูญเสียของเขาสำหรับการเปลี่ยนแปลงในกลยุทธ์โดยผู้เล่น I
5.3. กลยุทธ์ผสมที่เหมาะสมที่สุดในเกมเมทริกซ์
หากเมทริกซ์ผลตอบแทนไม่มีจุดอาน ก็ไม่มีเหตุผลสำหรับผู้เล่นที่จะใช้กลยุทธ์เดียว มันทำกำไรได้มากกว่าที่จะใช้ "สารผสมความน่าจะเป็น" กลยุทธ์ที่บริสุทธิ์ จากนั้น กลยุทธ์แบบผสมแล้วจะถูกกำหนดเป็นกลยุทธ์ที่เหมาะสมที่สุด
กลยุทธ์ผสม ผู้เล่นมีลักษณะเฉพาะโดยการแจกแจงความน่าจะเป็นของเหตุการณ์สุ่มที่ประกอบด้วยตัวเลือกการย้ายของผู้เล่น
กลยุทธ์ผสมของผู้เล่น I เป็นชุดตัวเลขที่เรียงลำดับ ordered (เวกเตอร์) ที่ตรงตามเงื่อนไขสองประการ:
1) สำหรับนั่นคือความน่าจะเป็นของการเลือกแต่ละแถวของเมทริกซ์การชำระเงินนั้นไม่เป็นค่าลบ
2) นั่นคือ ตัวเลือกของแต่ละแถวของเมทริกซ์การชำระเงินในผลรวมหมายถึง เต็มกลุ่มเหตุการณ์
กลยุทธ์ผสมของผู้เล่น II คือชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) เป็นไปตามเงื่อนไข:
จำนวนเงินที่ชำระ ให้กับผู้เล่น I ที่ได้เลือกกลยุทธ์แบบผสม
จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสม
,
หมายถึงค่าเฉลี่ย
.
เหมาะสมที่สุด เรียกว่ากลยุทธ์ผสม
และ ,
ถ้าสำหรับกลยุทธ์ผสมตามอำเภอใจใด ๆ และเป็นไปตามเงื่อนไข:
นั่นคือ ภายใต้กลยุทธ์แบบผสมที่เหมาะสมที่สุด ผลตอบแทนของผู้เล่น I จะมากที่สุด และการสูญเสียผู้เล่น II จะน้อยที่สุด
หากไม่มีจุดอานในเมทริกซ์ผลตอบแทน แล้ว
,
กล่าวคือ มีความแตกต่างในเชิงบวก ( ส่วนต่างที่ไม่ได้จัดสรร )
- ³ 0,
และผู้เล่นจำเป็นต้องมองหาโอกาสเพิ่มเติมเพื่อรับส่วนแบ่งที่มากขึ้นของความแตกต่างนี้อย่างมั่นใจ
ตัวอย่าง
พิจารณาเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน:
.
ตรวจสอบว่ามีจุดอานหรือไม่:
, .
ปรากฎว่าไม่มีจุดอานในเมทริกซ์ผลตอบแทนและผลต่างที่ไม่ได้ปันส่วนจะเท่ากับ:
.
5.4. ค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุด
สำหรับเกม 2 × 2
การกำหนดกลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับเมทริกซ์ผลตอบแทนของมิตินั้นดำเนินการโดยวิธีการหาจุดที่เหมาะสมที่สุดของฟังก์ชันของตัวแปรสองตัว
ให้ความน่าจะเป็นของผู้เล่นที่ฉันเลือกแถวแรกของเมทริกซ์การชำระเงิน
มีค่าเท่ากัน แล้วความน่าจะเป็นที่จะเลือกแถวที่สองคือ
ให้ความน่าจะเป็นของผู้เล่น II เลือกคอลัมน์แรกเท่ากับ ความน่าจะเป็นที่จะเลือกคอลัมน์ที่สองคือ
จำนวนเงินที่จ่ายให้กับผู้เล่น I โดยผู้เล่น II เท่ากับ:
มูลค่าสูงสุดของการเพิ่มของผู้เล่น I และการสูญเสียผู้เล่น II สอดคล้องกับเงื่อนไข:
;
.
ดังนั้น กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I และ II เท่ากับ:
5.5. วิธีแก้ปัญหาทางเรขาคณิตของเกม 2 ×น
ด้วยการเพิ่มมิติของเมทริกซ์ผลตอบแทนจาก เป็น ถึง เป็นไปไม่ได้อีกต่อไปที่จะลดการกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดเพื่อค้นหาฟังก์ชันที่เหมาะสมที่สุดของสองตัวแปร อย่างไรก็ตาม เนื่องจากผู้เล่นคนใดคนหนึ่งมีเพียงสองกลยุทธ์ จึงสามารถใช้โซลูชันทางเรขาคณิตได้
ขั้นตอนหลักในการหาวิธีแก้ปัญหาของเกมมีดังนี้
ให้เราแนะนำระบบพิกัดบนเครื่องบิน วาดส่วนบนแกน วาดเส้นตั้งฉากจากปลายด้านซ้ายและขวาของส่วนนี้
ด้านซ้ายและขวาของส่วนหน่วยจะสอดคล้องกับสองกลยุทธ์และสำหรับผู้เล่น I ในการจับฉลาก เราจะเลื่อนการชนะของผู้เล่นรายนี้ออกไป ตัวอย่างเช่น สำหรับเมทริกซ์การชำระเงิน
ผลตอบแทนดังกล่าวของผู้เล่น I เมื่อเลือกกลยุทธ์จะเป็น และ และเมื่อเลือกกลยุทธ์จะเป็น และ
ให้เราเชื่อมต่อโดยการแบ่งส่วนเส้นตรงจุดจ่ายของผู้เล่น I ที่สอดคล้องกับกลยุทธ์ของผู้เล่น II จากนั้นเส้นแบ่งที่เกิดขึ้นซึ่งล้อมรอบกราฟจากด้านล่างจะกำหนดขอบเขตล่างของผลตอบแทนของผู้เล่น I
ค้นหากลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I
,
ซึ่งสอดคล้องกับจุดบนขอบเขตล่างของการจ่ายเงินของผู้เล่น I ด้วยพิกัดสูงสุด
โปรดทราบว่าในตัวอย่างที่กำลังพิจารณา ใช้เพียงสองกลยุทธ์และสอดคล้องกับเส้นตรงที่ตัดกันที่จุดที่พบบนขอบล่างของผลตอบแทนของผู้เล่น I ผู้เล่น II สามารถป้องกันไม่ให้ผู้เล่น I ได้รับผลตอบแทนที่มากขึ้น
ดังนั้นเกมจะลดลงเป็นเกมและกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II ในตัวอย่างที่พิจารณาจะเป็น
,
โดยที่ความน่าจะเป็นเท่ากับในเกม:
5.6. โซลูชันเกมม× น
หากเกมเมทริกซ์ไม่มีวิธีแก้ปัญหาในกลยุทธ์ที่บริสุทธิ์ (เช่น ไม่มีจุดอาน) และเนื่องจากเมทริกซ์ผลตอบแทนมีขนาดใหญ่จึงไม่สามารถแก้ไขได้แบบกราฟิก เพื่อให้ได้วิธีแก้ปัญหา ให้ใช้ วิธีการโปรแกรมเชิงเส้น .
ให้เมทริกซ์ผลตอบแทนของมิติได้รับ:
.
ต้องหาความน่าจะเป็น โดยผู้เล่นคนใดที่ฉันต้องเลือกการเคลื่อนไหวของเขาเพื่อให้กลยุทธ์แบบผสมนี้รับประกันว่าเขาจะได้รับผลตอบแทนอย่างน้อยที่สุดโดยไม่คำนึงถึงทางเลือกของการเคลื่อนไหวโดยผู้เล่น II
สำหรับแต่ละการย้ายที่เลือกโดยผู้เล่น II ผลตอบแทนของผู้เล่น I ถูกกำหนดโดยการอ้างอิง:
เราหารอสมการทั้งสองข้างด้วยและแนะนำสัญลักษณ์ใหม่:
ความเท่าเทียมกัน
จะใช้แบบฟอร์ม:
เนื่องจากผู้เล่นที่ฉันพยายามที่จะเพิ่มผลตอบแทนสูงสุด การแลกเปลี่ยนซึ่งกันและกันจะต้องถูกย่อให้เล็กสุด จากนั้นปัญหาการเขียนโปรแกรมเชิงเส้นสำหรับผู้เล่นที่ฉันใช้แบบฟอร์ม:
มีข้อจำกัด
ในทำนองเดียวกัน ปัญหาสำหรับผู้เล่น II ถูกสร้างขึ้นเป็นคู่:
มีข้อจำกัด
การแก้ปัญหาโดยใช้วิธีซิมเพล็กซ์ เราได้รับ:
,
5.7. คุณสมบัติของการแก้เกมเมทริกซ์
ก่อนแก้ปัญหาการหากลยุทธ์ที่เหมาะสม ควรตรวจสอบสองเงื่อนไข:
เป็นไปได้ไหมที่จะทำให้เมทริกซ์การชำระเงินง่ายขึ้น
เมทริกซ์การชำระเงินมีจุดอานหรือไม่
พิจารณาความเป็นไปได้ของการลดความซับซ้อนของเมทริกซ์การชำระเงิน:
เนื่องจากผู้เล่นที่ฉันพยายามที่จะได้รับ ชัยชนะที่ยิ่งใหญ่ที่สุดจากนั้นคุณสามารถขีดฆ่าบรรทัดที่ออกจากเมทริกซ์การชำระเงินได้ เนื่องจากเขาจะไม่ใช้การย้ายนี้หากความสัมพันธ์ต่อไปนี้เป็นจริงกับแถวอื่น:
ในทำนองเดียวกัน การดิ้นรนเพื่อการสูญเสียที่น้อยที่สุด ผู้เล่น II จะไม่เลือกคอลัมน์ ith ในเมทริกซ์การจ่ายเงินเป็นการเคลื่อนไหว และคอลัมน์นี้สามารถขีดฆ่าได้หากความสัมพันธ์ต่อไปนี้มีกับคอลัมน์ ith อื่น:
ส่วนใหญ่ วิธีแก้ปัญหาง่ายๆของเกมคือการมีอยู่ในเมทริกซ์การชำระเงินแบบง่ายของจุดอานที่ตรงตามเงื่อนไขต่อไปนี้ (ตามคำจำกัดความ):
ตัวอย่าง
มีเมทริกซ์การชำระเงิน:
.
การลดความซับซ้อนของเมทริกซ์การชำระเงิน:
จุดอาน:
5.8. เล่นกับธรรมชาติ
ตรงกันข้ามกับปัญหาของทฤษฎีเกมใน ปัญหาทางทฤษฎี การตัดสินใจทางสถิติ สถานการณ์ที่ไม่แน่นอนไม่มีความขัดแย้งที่เป็นปฏิปักษ์และขึ้นอยู่กับความเป็นจริงตามวัตถุประสงค์ซึ่งมักจะเรียกว่า "ธรรมชาติ" .
ในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ ผู้เล่น II จะเล่นโดยปัจจัยที่ไม่แน่นอนซึ่งส่งผลต่อประสิทธิภาพของการตัดสินใจ
เกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติแตกต่างจากเกมเมทริกซ์ทั่วไปตรงที่ เมื่อเลือกกลยุทธ์ที่เหมาะสมที่สุดโดยผู้เล่น I จะไม่สามารถถูกชี้นำโดยผู้เล่น II จะพยายามลดการสูญเสียของเขาให้เหลือน้อยที่สุด ดังนั้น พร้อมกับเมทริกซ์การชำระเงิน เราขอแนะนำ เมทริกซ์ความเสี่ยง :
ค่าความเสี่ยงของผู้เล่น I อยู่ที่ไหนเมื่อใช้การเคลื่อนไหวภายใต้เงื่อนไขเท่ากับส่วนต่าง ระหว่างผลตอบแทนที่ผู้เล่นจะได้รับ ถ้าเขารู้ว่าเงื่อนไขจะถูกสร้างขึ้น กล่าวคือ และเงินรางวัลที่เขาจะได้รับโดยไม่รู้ว่าเมื่อเลือกย้ายแล้วจะมีการกำหนดเงื่อนไข
ดังนั้นเมทริกซ์ผลตอบแทนจึงถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไม่น่าสงสัย และการแปลงย้อนกลับมีความคลุมเครือ
ตัวอย่าง
เมทริกซ์ผลตอบแทน:
.
เมทริกซ์ความเสี่ยง:
เป็นไปได้ สองประโยคปัญหา เกี่ยวกับการเลือกวิธีแก้ปัญหา ในเกมเมทริกซ์กับธรรมชาติ :
เพิ่มเงินรางวัลของคุณให้สูงสุด
ลดความเสี่ยง
ปัญหาการตัดสินใจสามารถเกิดขึ้นได้จากสองเงื่อนไข:
- มีความเสี่ยง เมื่อทราบฟังก์ชันการกระจายความน่าจะเป็นของกลยุทธ์ของธรรมชาติ ตัวอย่างเช่น ค่าสุ่มของการเกิดขึ้นของแต่ละสถานการณ์ทางเศรษฐกิจที่สมมติขึ้น
- ท่ามกลางความไม่แน่นอน เมื่อไม่ทราบฟังก์ชันการกระจายความน่าจะเป็นดังกล่าว
5.9. การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติ
มีความเสี่ยง
เมื่อทำการตัดสินใจภายใต้สภาวะเสี่ยง ผู้เล่นทราบความน่าจะเป็น การเริ่มต้นของสถานะของธรรมชาติ
จากนั้นจึงเป็นการสมควรที่ผู้เล่น I จะเลือกกลยุทธ์ที่ มูลค่าเฉลี่ยของเงินรางวัลที่ได้รับต่อบรรทัดสูงสุด :
.
เมื่อแก้ปัญหานี้ด้วยเมทริกซ์ความเสี่ยง เราจะได้โซลูชันเดียวกันกับ ความเสี่ยงเฉลี่ยขั้นต่ำ :
.
5.10. การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติ
ท่ามกลางความไม่แน่นอน
ในการตัดสินใจภายใต้สภาวะที่ไม่แน่นอน คุณสามารถใช้สิ่งต่อไปนี้ได้ เกณฑ์ :
เกณฑ์ Maximin ของ Wald;
เกณฑ์ ความเสี่ยงน้อยที่สุดเซวิจา;
เกณฑ์สำหรับการมองโลกในแง่ร้ายคือการมองโลกในแง่ดีของ Hurwitz;
หลักการของ Laplace ไม่เพียงพอ
พิจารณา การทดสอบแม็กซิมินของ Wald .
เกมที่มีธรรมชาติเล่นเหมือนกับฝ่ายตรงข้ามที่ก้าวร้าวพอสมควรนั่นคือวิธีการประกันภัยต่อจะดำเนินการจากตำแหน่งที่มองโลกในแง่ร้ายอย่างรุนแรงสำหรับเมทริกซ์การชำระเงิน:
.
พิจารณา เกณฑ์ความเสี่ยงขั้นต่ำของอำมหิต .
แนวทางที่คล้ายกับวิธีก่อนหน้าจากตำแหน่งของการมองโลกในแง่ร้ายที่รุนแรงสำหรับเมทริกซ์ความเสี่ยง:
.
พิจารณา เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของHurwitz .
มีการเสนอโอกาสที่จะไม่ถูกชี้นำโดยการมองโลกในแง่ร้ายสุดโต่งหรือการมองโลกในแง่ดีสุดขั้ว:
ระดับของการมองโลกในแง่ร้ายอยู่ที่ไหน
ใน - การมองโลกในแง่ดีสุดขีด
ใน - มองโลกในแง่ร้ายสุดขีด
พิจารณา หลักการของลาปลาซเรื่องพื้นฐานไม่เพียงพอ .
เป็นที่เชื่อกันว่าสภาวะธรรมชาติทั้งหมดมีความเป็นไปได้เท่าเทียมกัน:
,
.
บทสรุปในส่วนที่ห้า
ผู้เล่นสองคนมีส่วนร่วมในเกมเมทริกซ์ และฟังก์ชันการจ่ายเงิน ซึ่งทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ จะแสดงในรูปแบบของเมทริกซ์การจ่ายเงิน เราตกลงกันว่าผู้เล่นที่ฉันเลือกแถวหนึ่งของเมทริกซ์ผลตอบแทนเป็นการย้าย และผู้เล่น II เลือกคอลัมน์ใดคอลัมน์หนึ่ง จากนั้น ที่จุดตัดของแถวและคอลัมน์ที่เลือกของเมทริกซ์นี้ มีค่าตัวเลขของการชำระเงินให้กับผู้เล่น I จากผู้เล่น II (หากค่านี้เป็นค่าบวก แสดงว่าผู้เล่นที่ฉันชนะจริงๆ และหากเป็นค่าลบ แสดงว่าผู้เล่น II ชนะ)
หากมีจุดอานในเมทริกซ์ผลตอบแทน ผู้เล่นมีกลยุทธ์ที่ดีที่สุด นั่นคือ เพื่อที่จะชนะ แต่ละคนจะต้องทำซ้ำการเคลื่อนไหวที่เหมาะสมที่สุดของเขาในครั้งเดียว หากไม่มีจุดอาน เพื่อที่จะชนะ แต่ละคนต้องใช้กลยุทธ์ผสมที่เหมาะสม นั่นคือ ใช้ท่าผสม ซึ่งแต่ละท่าจะต้องดำเนินการด้วยความน่าจะเป็นที่เหมาะสมที่สุด
การค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2 ดำเนินการโดยการคำนวณความน่าจะเป็นที่เหมาะสมที่สุดโดยใช้สูตรที่ทราบ ผ่าน โซลูชันทางเรขาคณิตสำหรับเกม 2 × n เกม คำจำกัดความของกลยุทธ์แบบผสมที่เหมาะสมที่สุดในเกมจะลดลงเป็นการค้นหากลยุทธ์แบบผสมที่เหมาะสมสำหรับเกม 2 × 2 ในการแก้เกม m × n จะใช้วิธีการโปรแกรมเชิงเส้นเพื่อค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด
เมทริกซ์การชำระเงินบางตัวช่วยให้เข้าใจง่าย ซึ่งเป็นผลมาจากการที่มิติข้อมูลลดลงโดยการลบแถวและคอลัมน์ที่สอดคล้องกับการเคลื่อนไหวที่ไม่คาดฝัน
หากผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งขึ้นอยู่กับความเป็นจริงของวัตถุและไม่มีสีแห่งความขัดแย้งที่เป็นปรปักษ์กัน เกมดังกล่าวจะเรียกว่าเกมที่มีธรรมชาติ และปัญหาของทฤษฎีการตัดสินใจทางสถิติจะถูกนำมาใช้ในการแก้ปัญหา จากนั้นพร้อมกับเมทริกซ์การจ่ายค่าตอบแทนแนะนำเมทริกซ์ความเสี่ยงและสองงบของปัญหาในการเลือกวิธีแก้ปัญหาในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ: เพิ่มผลตอบแทนสูงสุดและลดความเสี่ยง
การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขความเสี่ยงแสดงให้เห็นว่า ขอแนะนำให้ผู้เล่น I เลือกกลยุทธ์ที่ค่าเฉลี่ย (การคาดหมายทางคณิตศาสตร์) ของผลตอบแทนที่ได้รับเหนือแถวของเมทริกซ์ผลตอบแทนสูงสุด หรือ (ซึ่งเท่ากัน) ค่าเฉลี่ย (การคาดหมายทางคณิตศาสตร์) ของความเสี่ยงที่ได้รับจากแถวของเมทริกซ์ความเสี่ยงนั้นน้อยที่สุด ในการตัดสินใจภายใต้สภาวะที่ไม่แน่นอน ให้ใช้ หลักเกณฑ์ดังต่อไปนี้: เกณฑ์สูงสุดของ Wald, เกณฑ์ความเสี่ยงขั้นต่ำของ Sevidge, เกณฑ์การมองโลกในแง่ร้ายและการมองโลกในแง่ดีของ Hurwitz, หลักการ Laplace เกี่ยวกับพื้นฐานไม่เพียงพอ
คำถามทดสอบตัวเอง
แนวคิดพื้นฐานของทฤษฎีเกมกำหนดไว้อย่างไร: การเคลื่อนไหว กลยุทธ์ และฟังก์ชันผลตอบแทน
ฟังก์ชันการจ่ายเงินแสดงในเกมเมทริกซ์อย่างไร
ทำไมเกมเมทริกซ์ถึงเรียกว่าผลรวมศูนย์?
กระบวนการเล่นเกมเมทริกซ์เป็นอย่างไร?
เกมอะไรที่เรียกว่าเกม m × n?
กลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์คืออะไร?
อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่า pure?
จุดอานของเมทริกซ์ผลตอบแทนหมายความว่าอย่างไร
อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่ามิกซ์?
กลยุทธ์ผสมของผู้เล่นปรากฏอย่างไร?
จำนวนเงินที่จ่ายให้กับผู้เล่น I จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสมคืออะไร?
กลยุทธ์แบบผสมใดที่เรียกว่าเหมาะสมที่สุด
ความแตกต่างที่ไม่ได้จัดสรรหมายความว่าอย่างไร
วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2
กลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับเกม 2 × n เกมพบได้อย่างไร?
วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม m × n
อะไรคือคุณสมบัติของการแก้เกมเมทริกซ์?
การลดความซับซ้อนของเมทริกซ์การชำระเงินหมายถึงอะไรและสามารถทำได้ภายใต้เงื่อนไขใด
เกมเมทริกซ์ใดแก้ง่ายกว่าเมื่อเมทริกซ์ผลตอบแทนมีหรือไม่มีจุดอาน
ปัญหาใดในทฤษฎีเกมที่เกี่ยวข้องกับปัญหาในทฤษฎีการตัดสินใจทางสถิติ
เมทริกซ์การชำระเงินถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไร
สองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาที่เป็นไปได้ในเกมเมทริกซ์ที่มีธรรมชาติคืออะไร?
สำหรับสองเงื่อนไขใดที่สามารถกำหนดปัญหาในการตัดสินใจในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ?
กลยุทธ์ใดที่เหมาะสมสำหรับผู้เล่น I ที่จะเลือกเมื่อแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้สภาวะเสี่ยง?
เกณฑ์การตัดสินใจใดที่สามารถใช้ในการแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขของความไม่แน่นอน
ตัวอย่างการแก้ปัญหา
1. เมทริกซ์การชำระเงินแสดงจำนวนกำไรขององค์กรเมื่อขายได้ ประเภทต่างๆผลิตภัณฑ์ (คอลัมน์) ขึ้นอยู่กับความต้องการคงที่ (แถว) จำเป็นต้องกำหนดกลยุทธ์ที่เหมาะสมที่สุดขององค์กรสำหรับการผลิตผลิตภัณฑ์ประเภทต่างๆ และรายได้สูงสุด (โดยเฉลี่ย) ที่สอดคล้องกันจากการขาย
ลองแสดงเมทริกซ์ที่กำหนดโดยและแนะนำตัวแปร เราจะใช้เมทริกซ์ (เวกเตอร์) ด้วย จากนั้นและนั่นคือ
คำนวณเมทริกซ์ผกผัน:
พบค่า:
.
คำนวณความน่าจะเป็น:
รายได้เฉลี่ยจากการขายถูกกำหนด:
.
2. บริษัท "เภสัช" เป็นผู้ผลิตยาและผลิตภัณฑ์ชีวการแพทย์ในภูมิภาค เป็นที่ทราบกันดีว่าความต้องการยาบางชนิดมีความต้องการสูงสุด ช่วงฤดูร้อน(ยาของกลุ่มหัวใจและหลอดเลือด, ยาแก้ปวด) สำหรับคนอื่น ๆ - สำหรับช่วงฤดูใบไม้ร่วงและฤดูใบไม้ผลิ (ป้องกันการติดเชื้อ, ฤทธิ์ต้านฤทธิ์)
ค่าใช้จ่ายสำหรับ 1 Conv. หน่วย ผลิตภัณฑ์สำหรับเดือนกันยายนถึงตุลาคมคือ: สำหรับกลุ่มแรก (ยารักษาโรคหัวใจและหลอดเลือดและยาแก้ปวด) - 20 รูเบิล; ในกลุ่มที่สอง (ยาต้านการติดเชื้อ, ยาแก้ไอ) - 15 รูเบิล
ตามข้อสังเกตสำหรับหลาย ๆ ปีที่ผ่านมาบริการการตลาดของบริษัทได้กำหนดขึ้นว่าสามารถรับรู้ได้ในช่วงสองเดือนภายใต้การพิจารณาในสภาพอากาศที่อบอุ่น 3050 Conv. หน่วย สินค้ากลุ่มแรกและ 1100 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มที่สอง ในสภาพอากาศหนาวเย็น - 1525 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 3690 Conv. หน่วย กลุ่มที่สอง
ในการเชื่อมต่อกับการเปลี่ยนแปลงของสภาพอากาศที่เป็นไปได้งานถูกกำหนด - เพื่อกำหนดกลยุทธ์ของ บริษัท ในการผลิตผลิตภัณฑ์ที่ให้รายได้สูงสุดจากการขายในราคาขาย 40 รูเบิล สำหรับ 1 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 30 รูเบิล - กลุ่มที่สอง
การตัดสินใจ บริษัท มีสองกลยุทธ์:
ปีนี้อากาศจะอบอุ่น
อากาศจะเย็น
หาก บริษัท ใช้กลยุทธ์และในความเป็นจริงจะมีอากาศอบอุ่น (กลยุทธ์ของธรรมชาติ) ผลิตภัณฑ์ที่ผลิต (3050 หน่วยทั่วไปของยากลุ่มแรกและ 1100 หน่วยทั่วไปของกลุ่มที่สอง) จะถูกขายอย่างเต็มที่และรายได้จะ เป็น
3050 × (40-20) + 1100 × (30-15) = 77500 หน้า
ในอากาศเย็น (กลยุทธ์ธรรมชาติ) ยากลุ่มที่ 2 จะขายเต็มจำนวน และกลุ่มแรกเพียงจำนวน 1,525 Conv. หน่วย และยาบางชนิดก็ยังไม่เกิดขึ้นจริง รายได้จะ
1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 หน้า
ในทำนองเดียวกัน หากรูปแบบใช้กลยุทธ์และอากาศหนาวจริง รายได้ก็จะเป็น
1525 × (40-20) + 3690 × (30-15) = 85850 หน้า
อากาศร้อนมีรายได้
1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 หน้า
เมื่อพิจารณาถึงบริษัทและสภาพอากาศในฐานะผู้เล่นสองคน เราจะได้เมทริกซ์การชำระเงิน
,
ราคาของเกมอยู่ในช่วง
จะเห็นได้จากเมทริกซ์การชำระเงินที่ภายใต้เงื่อนไขทั้งหมด รายได้ของบริษัทจะอยู่ที่ 16,500 รูเบิลเป็นอย่างน้อย แต่ถ้าสภาพอากาศตรงกับกลยุทธ์ที่เลือก รายได้ของบริษัทจะอยู่ที่ 77,500 รูเบิล
มาหาวิธีแก้ปัญหาของเกมกันเถอะ
ให้เราแสดงถึงความน่าจะเป็นของการนำกลยุทธ์ของบริษัทไปใช้ กลยุทธ์ผ่าน และ แก้เกมแบบกราฟิกด้วยวิธีการเราได้รับ ในขณะที่ราคาของเกมเป็น p.
แผนการผลิตยาที่เหมาะสมจะเป็น
ดังนั้นจึงแนะนำให้บริษัทผลิตในช่วงเดือนกันยายนและตุลาคม 2379 conv. หน่วย ยากลุ่มแรกและ 2239.6 Conv. หน่วย ยาเสพติดของกลุ่มที่สองจากนั้นในทุกสภาพอากาศเธอจะได้รับรายได้อย่างน้อย 46986 รูเบิล
ในสภาวะที่ไม่แน่นอน หากบริษัทไม่สามารถใช้กลยุทธ์แบบผสม (สัญญากับองค์กรอื่น) เพื่อกำหนดกลยุทธ์ที่เหมาะสมที่สุดของบริษัท เราใช้เกณฑ์ต่อไปนี้:
เกณฑ์ Walde:
เกณฑ์ของ Hurwitz: เพื่อความแน่นอนเราจะยอมรับแล้วสำหรับกลยุทธ์ของ บริษัท
สำหรับกลยุทธ์
ขอแนะนำให้บริษัทใช้กลยุทธ์
เกณฑ์ความป่าเถื่อน องค์ประกอบสูงสุดในคอลัมน์แรกคือ 77500 ในคอลัมน์ที่สองคือ 85850
องค์ประกอบของเมทริกซ์ความเสี่ยงพบได้จากนิพจน์
,
ที่ไหน,,
เมทริกซ์ความเสี่ยงมีรูปแบบ
,
ขอแนะนำให้ใช้กลยุทธ์หรือ
ดังนั้นจึงแนะนำให้บริษัทนำกลยุทธ์ไปใช้หรือ
โปรดทราบว่าเกณฑ์การพิจารณาแต่ละข้อไม่สามารถถือว่าน่าพอใจอย่างสมบูรณ์สำหรับ ทางเลือกสุดท้ายอย่างไรก็ตาม การตัดสินใจ การวิเคราะห์ร่วมกันทำให้คุณสามารถแสดงถึงผลที่ตามมาของการตัดสินใจด้านการจัดการบางอย่างได้ชัดเจนยิ่งขึ้น
ด้วยการกระจายความน่าจะเป็นของสภาวะธรรมชาติต่างๆ ที่ทราบ เกณฑ์สำหรับการตัดสินใจคือความคาดหวังทางคณิตศาสตร์สูงสุดของการชนะ
ให้ทราบปัญหาที่พิจารณาว่าความน่าจะเป็นของสภาพอากาศที่อบอุ่นและเย็นมีค่าเท่ากับ 0.5 แล้วจึงกำหนดกลยุทธ์ที่เหมาะสมของบริษัทดังนี้
ขอแนะนำให้บริษัทใช้กลยุทธ์หรือ
งานที่มอบหมายให้ศึกษาด้วยตนเอง
1. องค์กรสามารถผลิตสินค้าได้ 3 ประเภท (A, B และ C) โดยได้รับผลกำไรตามความต้องการ ในทางกลับกัน อุปสงค์สามารถรับหนึ่งในสี่สถานะ (I, II, III และ IV) ในเมทริกซ์ต่อไปนี้ องค์ประกอบจะแสดงลักษณะกำไรที่องค์กรจะได้รับเมื่อผลิตผลิตภัณฑ์ที่ - และ - สถานะของอุปสงค์:
หากในเกมฝ่ายตรงข้ามแต่ละรายใช้เพียงหนึ่งกลยุทธ์เดียวกันในกรณีนี้พวกเขาบอกว่ามันกำลังเกิดขึ้นเกี่ยวกับตัวเกมเอง ในกลยุทธ์ที่บริสุทธิ์ และใช้งานโดยผู้เล่น แต่และเครื่องเล่น ในสองกลยุทธ์ที่เรียกว่า กลยุทธ์ที่บริสุทธิ์ .
คำจำกัดความ ในเกมที่เป็นปฏิปักษ์ กลยุทธ์คู่หนึ่ง ( แต่ ผม , ใน j) เรียกว่าดุลยภาพหรือเสถียรหากผู้เล่นคนใดคนหนึ่งไม่ได้รับประโยชน์จากกลยุทธ์ของตน
มันสมเหตุสมผลแล้วที่จะใช้กลยุทธ์บริสุทธิ์เมื่อผู้เล่น แต่และ ในมีข้อมูลเกี่ยวกับการกระทำของกันและกันและผลลัพธ์ที่ได้ หากเราคิดว่าอย่างน้อยฝ่ายใดฝ่ายหนึ่งไม่รู้เกี่ยวกับพฤติกรรมของฝ่ายตรงข้าม แนวคิดเรื่องความสมดุลก็ถูกละเมิด และเกมจะเล่นอย่างสุ่มเสี่ยง
พิจารณาเกมเมทริกซ์ G(3x4)
ในตัวอย่างนี้ ราคาที่ต่ำกว่าของเกมจะเท่ากับราคาบน: == 9 เช่น เกมนี้มีจุดอาน
ปรากฎว่าในกรณีนี้กลยุทธ์สูงสุด max แต่ 2 และ ใน 2 จะ ที่ยั่งยืน เกี่ยวกับข้อมูลเกี่ยวกับพฤติกรรมของศัตรู
แน่นอนให้ผู้เล่น แต่รู้ว่าศัตรูกำลังใช้กลยุทธ์ ใน 2. แต่ในกรณีนี้ผู้เล่น แต่จะยึดมั่นในยุทธศาสตร์ต่อไป แต่ 2 เพราะการเบี่ยงเบนใด ๆ จากกลยุทธ์ แต่ 2 จะลดเฉพาะเงินรางวัลเท่านั้น เช่นเดียวกัน ข้อมูลที่ผู้เล่นได้รับ ใน,จะไม่บังคับเขาให้เบี่ยงเบนไปจากกลอุบายของเขา ใน 2 .
สองสามกลยุทธ์ แต่ 2 และ ใน 2 มีคุณสมบัติของความมั่นคง และผลตอบแทน (ในตัวอย่างที่พิจารณา เท่ากับ 9) ที่ทำได้ด้วยกลยุทธ์คู่นี้ กลายเป็นจุดอานของเมทริกซ์ผลตอบแทน
สัญญาณของความมั่นคง (สมดุล) ของคู่กลยุทธ์คือความเท่าเทียมกันของด้านล่างและ ราคาสูงสุดเกม.
กลยุทธ์ แต่ ผมและ ใน เจ(ในตัวอย่างที่พิจารณา แต่ 2 , ใน 2) ที่ซึ่งความเท่าเทียมกันของราคาที่ต่ำกว่าและด้านบนของเกมเป็นที่พอใจ เรียกว่ากลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด และการรวมกันของสิ่งเหล่านี้เรียกว่าวิธีแก้ปัญหาของเกม ในกรณีนี้ ตัวเกมเองได้รับการกล่าวขานว่าต้องแก้ด้วยกลยุทธ์ล้วนๆ
มูลค่าเรียกว่าต้นทุนของเกม
ถ้า 0 เกมจะเป็นประโยชน์สำหรับผู้เล่น A ถ้า 0 - สำหรับผู้เล่น B; สำหรับ = 0 เกมนั้นยุติธรรมเช่น เป็นประโยชน์อย่างเท่าเทียมกันสำหรับผู้เข้าร่วมทั้งสอง
อย่างไรก็ตาม การปรากฏตัวของจุดอานในเกมอยู่ไกลจากกฎ ค่อนข้างเป็นข้อยกเว้น เกมเมทริกซ์ส่วนใหญ่ไม่มีจุดอาน ดังนั้นจึงไม่มีกลยุทธ์ที่ดีที่สุด อย่างไรก็ตาม มีเกมประเภทหนึ่งที่มีจุดอานเสมอ ดังนั้นจึงแก้ไขได้ด้วยกลยุทธ์ล้วนๆ นี่คือเกมที่มี ข้อมูลครบถ้วน.
ทฤษฎีบท 2 แต่ละเกมที่มีข้อมูลครบถ้วนจะมีจุดอาน ดังนั้นจึงแก้ไขได้ด้วยกลยุทธ์ล้วนๆ เช่น มีคู่ของกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดที่ให้ผลตอบแทนที่มั่นคงเท่ากับ
หากเกมดังกล่าวประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น เมื่อผู้เล่นแต่ละคนใช้กลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด เกมดังกล่าวจะต้องจบลงด้วยการชนะที่เท่ากับราคาของเกม ตัวอย่างเช่น เกมหมากรุก เป็นเกมที่มีข้อมูลครบถ้วน มักจะจบลงด้วยการชนะสีขาว หรือเสมอด้วยการชนะสีดำ หรือเสมอด้วยการเสมอ (อะไรกันแน่ - เรายังไม่ทราบตั้งแต่ตัวเลข ของกลยุทธ์ที่เป็นไปได้ในเกมหมากรุกนั้นใหญ่มาก)
หากเมทริกซ์ของเกมมีจุดอาน ก็จะพบวิธีแก้ปัญหาทันทีตามหลักการแม็กซิมิน
คำถามเกิดขึ้น: จะหาวิธีแก้ไขเกมที่เมทริกซ์ผลตอบแทนไม่มีจุดอานได้อย่างไร? การใช้หลักการสูงสุดโดยผู้เล่นแต่ละคนทำให้ผู้เล่น A ได้กำไรและขาดทุนอย่างน้อยที่สุดสำหรับผู้เล่น พิจารณาว่าเป็นเรื่องปกติสำหรับผู้เล่น A ต้องการเพิ่มเงินรางวัลของเขา และสำหรับผู้เล่น B จะลดความสูญเสียของเขา การค้นหาวิธีแก้ปัญหาดังกล่าวนำไปสู่ความจำเป็นในการใช้กลยุทธ์แบบผสม: เพื่อสลับกลยุทธ์บริสุทธิ์ด้วยความถี่บางส่วน
คำจำกัดความ ตัวแปรสุ่มที่มีค่าเป็นกลยุทธ์ที่บริสุทธิ์ของผู้เล่นเรียกว่าของเขา กลยุทธ์ผสม .
ดังนั้น งานของกลยุทธ์แบบผสมของผู้เล่นประกอบด้วยการบ่งชี้ความน่าจะเป็นที่เลือกใช้กลยุทธ์ที่แท้จริงของเขา
เราจะแสดงถึงกลยุทธ์ที่หลากหลายของผู้เล่น แต่และ ในตามลำดับ
S A = || p 1, p 2, ..., p m ||,
SB = || q 1, q 2, ..., q n ||,
โดยที่ p i คือความน่าจะเป็นของผู้เล่นที่ใช้ แต่สะอาดจากกลยุทธ์ แต่ผม; ; q j คือความน่าจะเป็นของผู้เล่น B โดยใช้กลยุทธ์บริสุทธิ์ B j; ...
ในกรณีพิเศษ เมื่อความน่าจะเป็นทั้งหมด ยกเว้นหนึ่ง เท่ากับศูนย์ และอันนี้เท่ากับหนึ่ง กลยุทธ์แบบผสมจะกลายเป็นแบบบริสุทธิ์
มีการใช้กลยุทธ์แบบผสม เช่น วิธีนี้: เกมซ้ำหลายครั้ง แต่ในแต่ละเกม ผู้เล่นใช้กลยุทธ์ที่แตกต่างกันโดยสิ้นเชิง โดยมีความถี่สัมพัทธ์ของแอปพลิเคชันเท่ากับ พี ผม และ q เจ .
กลยุทธ์แบบผสมในทฤษฎีเกมเป็นแบบอย่างของกลยุทธ์ที่ลื่นไหลและยืดหยุ่น ซึ่งผู้เล่นไม่รู้ว่ากลยุทธ์ใดที่คู่ต่อสู้จะเลือกในเกมที่กำหนด
ถ้าผู้เล่น แต่ใช้กลยุทธ์แบบผสม SA = || p 1, p 2, ..., p m || และผู้เล่น ในกลยุทธ์ผสม SB = || q 1, q 2, ..., q n || จากนั้นผลตอบแทนเฉลี่ย (ความคาดหวังทางคณิตศาสตร์) ของผู้เล่น แต่ถูกกำหนดโดยอัตราส่วน
แน่นอนการสูญเสียผู้เล่นที่คาดหวัง ในมีค่าเท่ากัน
ดังนั้น หากเกมเมทริกซ์ไม่มีจุดอาน ผู้เล่นควรใช้กลยุทธ์ผสมที่เหมาะสมที่สุดที่จะให้ผลตอบแทนสูงสุด
คำถามเกิดขึ้นตามธรรมชาติ: สิ่งที่ควรพิจารณาเมื่อเลือกกลยุทธ์แบบผสม? ปรากฎว่าหลักการแม็กซิมินยังคงความหมายในกรณีนี้ไว้เช่นกัน นอกจากนี้ จำเป็นเพื่อทำความเข้าใจการแก้ปัญหาของเกม ให้เล่นทฤษฎีบทพื้นฐานของเกม
วิธีการและแบบจำลองทางคณิตศาสตร์ทางเศรษฐศาสตร์
เกมเมทริกซ์
บทนำ
ในทางปฏิบัติทางเศรษฐกิจ สถานการณ์มักเกิดขึ้นโดยที่ฝ่ายต่าง ๆ ต่างมีเป้าหมายที่แตกต่างกัน ตัวอย่างเช่น ความสัมพันธ์ระหว่างผู้ขายและผู้ซื้อ ซัพพลายเออร์และผู้บริโภค ธนาคารและผู้ฝากเงิน เป็นต้น สถานการณ์ความขัดแย้งดังกล่าวไม่ได้เกิดขึ้นเฉพาะในด้านเศรษฐกิจเท่านั้น แต่ยังเกิดขึ้นในกิจกรรมอื่นๆ ด้วย ตัวอย่างเช่น เมื่อเล่นหมากรุก หมากฮอส โดมิโน โลโต้ ฯลฯ
เกม- นี่คือ แบบจำลองทางคณิตศาสตร์ สถานการณ์ความขัดแย้งเกี่ยวข้องกับบุคคลอย่างน้อยสองคนโดยใช้หลาย วิธีทางที่แตกต่างเพื่อให้บรรลุเป้าหมายของคุณ เกมนี้มีชื่อว่า ห้องอบไอน้ำ, ถ้าผู้เล่นสองคนมีส่วนร่วม เกมนี้มีชื่อว่า เป็นปฏิปักษ์, ถ้ากำไรของผู้เล่นคนหนึ่งเท่ากับการสูญเสียของอีกคนหนึ่ง ดังนั้นเพื่อกำหนดเกมก็เพียงพอที่จะตั้งค่าผลตอบแทนของผู้เล่นคนหนึ่งในสถานการณ์ที่แตกต่างกัน
วิธีการใด ๆ ของการกระทำของผู้เล่นขึ้นอยู่กับสถานการณ์ปัจจุบันเรียกว่า กลยุทธ์. ผู้เล่นแต่ละคนมีชุดกลยุทธ์เฉพาะ หากจำนวนกลยุทธ์มีจำกัด เกมจะเรียกว่า สุดยอด, มิฉะนั้น - ไม่มีที่สิ้นสุด . กลยุทธ์ที่เรียกว่า สะอาด ถ้าผู้เล่นแต่ละคนเลือกเพียงหนึ่งกลยุทธ์ในวิธีที่แน่นอนและไม่ใช่แบบสุ่ม
โซลูชันเกมคือการเลือกกลยุทธที่โดนใจ สภาวะที่เหมาะสมที่สุด เงื่อนไขนี้คือผู้เล่นคนหนึ่งได้รับ ชนะสูงสุด, ถ้าคนที่สองปฏิบัติตามกลยุทธ์ของเขา ในทางกลับกัน ผู้เล่นคนที่สองจะได้รับ ขาดทุนน้อยที่สุด, ถ้าผู้เล่นคนแรกยึดติดกับกลยุทธ์ของเขา กลยุทธ์ดังกล่าวเรียกว่า เหมาะสมที่สุด . ทางนี้, เป้าหมายของเกมคือการกำหนดกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่นแต่ละคน
เกมกลยุทธ์ล้วนๆ
พิจารณาเกมที่มีผู้เล่นสองคน แต่และ ใน.สมมติว่าผู้เล่น แต่มันมี มกลยุทธ์ А 1, А 2, ..., А mและเครื่องเล่น ในมันมี นกลยุทธ์ บี 1 บี 2 ... บี น.เราจะถือว่าทางเลือกของผู้เล่น แต่กลยุทธ์ ฉันและเครื่องเล่น ในกลยุทธ์ บี เจกำหนดผลลัพธ์ของเกมโดยเฉพาะเช่น กำไร อิจผู้เล่น แต่และชนะ บีอิจผู้เล่น ใน.ที่นี่ ผม = 1,2, ..., ม., เจ = 1,2, ..., น.
เกมที่ง่ายที่สุดมีผู้เล่นสองคนเป็นเกมที่เป็นปฏิปักษ์ , เหล่านั้น เกมที่ผลประโยชน์ของผู้เล่นอยู่ตรงข้ามกัน ในกรณีนี้ ค่าตอบแทนของผู้เล่นสัมพันธ์กันด้วยความเท่าเทียมกัน
b ij = -a ij
ความเท่าเทียมกันนี้หมายความว่าการได้รับของผู้เล่นคนใดคนหนึ่งเท่ากับการสูญเสียของอีกคนหนึ่ง ในกรณีนี้ก็เพียงพอที่จะพิจารณาเฉพาะผลตอบแทนของผู้เล่นคนหนึ่งเช่นผู้เล่น แต่.
กลยุทธ์แต่ละคู่ ฉันและ บี เจตรงกับชัยชนะ อิจผู้เล่น แต่.สะดวกในการเขียนเงินรางวัลทั้งหมดเหล่านี้ในรูปแบบของสิ่งที่เรียกว่า เมทริกซ์การชำระเงิน
แถวของเมทริกซ์นี้สอดคล้องกับกลยุทธ์ของผู้เล่น แต่,และคอลัมน์สำหรับกลยุทธ์ของผู้เล่น ใน.โดยทั่วไปแล้วเกมดังกล่าวจะเรียกว่า (m × n) -เกม.
ตัวอย่างที่ 1ผู้เล่นสองคน แต่และ ในโยนเหรียญ ถ้าด้านของเหรียญตรงกันก็ชนะ แต่กล่าวคือ ผู้เล่น ในจ่ายผู้เล่น แต่ผลรวมเท่ากับ 1 และหากไม่ตรงกัน ผู้เล่น B จะชนะ นั่นคือ ในทางตรงกันข้ามผู้เล่น แต่จ่ายผู้เล่น ในเท่ากัน , เท่ากัน 1. สร้างเมทริกซ์การชำระเงิน
การตัดสินใจตามสภาพของปัญหา