เกมกลยุทธ์ที่บริสุทธิ์ กลยุทธ์ผสม

หลัก / อดีต

ทฤษฎีเกมกลยุทธ์ผสม

กลยุทธ์ผสม

หากในเกมเมทริกซ์ไม่มีจุดอานในกลยุทธ์ที่บริสุทธิ์ จะพบราคาบนและล่างของเกม พวกเขาแสดงให้เห็นว่าผู้เล่น 1 จะไม่ได้รับชัยชนะที่เกินราคาเกมบน และผู้เล่นที่ 1 รับประกันการชนะที่ไม่ต่ำกว่าราคาเกมที่ต่ำกว่า

กลยุทธ์แบบผสมของผู้เล่นคือชุดกลยุทธ์ที่สมบูรณ์ของเขาโดยมีการทำซ้ำหลาย ๆ เกมภายใต้เงื่อนไขเดียวกันกับความน่าจะเป็นที่กำหนด มาสรุปสิ่งที่กล่าวและระบุเงื่อนไขสำหรับการใช้กลยุทธ์แบบผสมกัน:

  • * เล่นโดยไม่มีจุดอาน
  • * ผู้เล่นใช้กลยุทธ์ผสมแบบสุ่มโดยมีความน่าจะเป็นที่กำหนด
  • * เกมซ้ำหลายครั้งในเงื่อนไขที่คล้ายคลึงกัน
  • * ในแต่ละการเคลื่อนไหวจะไม่มีใครแจ้งเกี่ยวกับการเลือกกลยุทธ์โดยผู้เล่นอื่น
  • * อนุญาตให้ใช้ค่าเฉลี่ยของผลลัพธ์ของเกม

ใช้สัญกรณ์ต่อไปนี้สำหรับกลยุทธ์แบบผสม

สำหรับผู้เล่น 1 กลยุทธ์แบบผสมประกอบด้วยการใช้กลยุทธ์บริสุทธิ์ A 1, A 2, ..., A m ที่มีความน่าจะเป็นที่สอดคล้องกัน p 1, p 2, ..., p m

สำหรับผู้เล่น2

q j คือความน่าจะเป็นของการใช้กลยุทธ์บริสุทธิ์ B j

ในกรณีที่ р i = 1 สำหรับผู้เล่น 1 เรามีกลยุทธ์ที่บริสุทธิ์

กลยุทธ์ที่บริสุทธิ์ของผู้เล่นคือกลยุทธ์เดียวที่เป็นไปได้ เหตุการณ์ไม่สอดคล้องกัน... ในเกมเมทริกซ์ การรู้เมทริกซ์ A (ใช้กับทั้งผู้เล่น 1 และผู้เล่น 2) สามารถกำหนดได้ ให้เวกเตอร์และผลตอบแทนเฉลี่ย ( มูลค่าที่คาดหวังผล) ของผู้เล่น 1:

ที่ไหนและเป็นเวกเตอร์

pi และ q i เป็นองค์ประกอบของเวกเตอร์

ด้วยการใช้กลยุทธ์แบบผสม ผู้เล่น 1 พยายามที่จะเพิ่มผลตอบแทนโดยเฉลี่ยสูงสุด และผู้เล่นที่ 2 - เพื่อให้เอฟเฟกต์นี้มีค่าต่ำสุดที่เป็นไปได้ ผู้เล่น 1 พยายามที่จะบรรลุ

ผู้เล่น 2 ทำให้แน่ใจว่าตรงตามเงื่อนไข condition

ให้เราระบุเวกเตอร์ที่สอดคล้องกับกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 1 และ 2 นั่นคือ เวกเตอร์ดังกล่าวและซึ่งความเท่าเทียมกัน

ราคาของเกมคือผลตอบแทนเฉลี่ยของผู้เล่น 1 เมื่อผู้เล่นทั้งสองใช้กลยุทธ์แบบผสม ดังนั้น วิธีแก้ปัญหาของเกมเมทริกซ์คือ:

  • - กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 1;
  • - กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 2;

ราคาเกม.

กลยุทธ์ผสมจะเหมาะสมที่สุด (และ) หากสร้างจุดอานสำหรับฟังก์ชันเช่น

มีทฤษฎีบทพื้นฐานสำหรับเกมคณิตศาสตร์

สำหรับเกมเมทริกซ์ที่มีเมทริกซ์ A ใดๆ ปริมาณ

มีอยู่และเท่าเทียมกัน: = =.

ควรสังเกตว่าเมื่อเลือกกลยุทธ์ที่เหมาะสม ผู้เล่นที่ 1 จะรับประกันผลตอบแทนเฉลี่ยเสมอ ไม่น้อยกว่าราคาเกม สำหรับกลยุทธ์คงที่ของผู้เล่น 2 (และในทางกลับกัน สำหรับผู้เล่น 2) กลยุทธ์เชิงรุกของผู้เล่น 1 และ 2 เป็นกลยุทธ์ที่รวมอยู่ในกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นที่เกี่ยวข้องซึ่งมีความน่าจะเป็นที่ไม่ใช่ศูนย์ ซึ่งหมายความว่าองค์ประกอบของกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นอาจไม่รวมกลยุทธ์เฉพาะที่กำหนดไว้ล่วงหน้าทั้งหมด

การแก้ปัญหาเกมหมายถึงการหาราคาของเกมและกลยุทธ์ที่เหมาะสมที่สุด เราจะเริ่มพิจารณาวิธีการในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ด้วยเกมที่ง่ายที่สุดที่อธิบายโดย matrix 22 เกมจุดอานจะไม่ได้รับการพิจารณาเป็นพิเศษ หากได้จุดอานแล้ว แสดงว่ามีกลยุทธ์ที่ไม่เป็นประโยชน์ที่ควรละทิ้ง ในกรณีที่ไม่มีจุดอาน สามารถรับสองกลยุทธ์แบบผสมที่เหมาะสมที่สุดได้ ตามที่ระบุไว้ กลยุทธ์แบบผสมเหล่านี้เขียนดังนี้:

ซึ่งหมายความว่ามีเมทริกซ์การชำระเงิน

11 p 1 + 21 p 2 =; (1.16)

a 12 p 1 + 22 p 2 =; (1.17)

p 1 + p 2 = 1 (1.18)

11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1, (1.20)

ดังนั้นเราจึงได้รับค่าที่เหมาะสมที่สุดและ:

เมื่อรู้และเราพบว่า:

เมื่อคำนวณแล้วเราพบและ:

11 q 1 + 12 q 2 =; q 1 + q 2 = 1; (1.24)

11 q 1 + a 12 (1 - q 1) = (1.25)

สำหรับ 11 ถึง 12 (1.26)

ปัญหาได้รับการแก้ไขเนื่องจากพบเวกเตอร์และราคาของเกม การมีเมทริกซ์การชำระเงิน A ทำให้สามารถแก้ปัญหาแบบกราฟิกได้ ด้วยวิธีนี้ อัลกอริธึมการแก้ปัญหานั้นง่ายมาก (รูปที่ 2.1)

  • 1. ส่วนของความยาวหน่วยถูกพล็อตตามแกน abscissa
  • 2. ดุลยพินิจคือเงินรางวัลสำหรับกลยุทธ์ A 1
  • 3. บนเส้นขนานกับแกนพิกัด ที่จุดที่ 1 เงินรางวัลจะถูกฝากด้วยกลยุทธ์ a 2
  • 4. ส่วนปลายของเซ็กเมนต์ถูกกำหนดสำหรับ 11 -b 11, 12 -b 21, a 22 -b 22, 21 -b 12 และเส้นตรงสองเส้น b 11 b 12 และ b 21 b 22
  • 5. กำหนดพิกัดของจุดตัดด้วย มันเท่ากัน abscissa ของจุด c เท่ากับ p 2 (p 1 = 1 - p 2)

รูปที่. 1.1.

วิธีนี้มีพื้นที่ใช้งานค่อนข้างกว้าง นี้จะขึ้นอยู่กับ ทรัพย์สินส่วนกลางเกม mn ซึ่งประกอบด้วยข้อเท็จจริงที่ว่าในเกม mn ผู้เล่นแต่ละคนมีกลยุทธ์แบบผสมที่เหมาะสมที่สุด ซึ่งจำนวนกลยุทธ์ที่แท้จริงจะอยู่ที่ต่ำสุด (m, n) จากคุณสมบัตินี้ คุณจะได้รับผลลัพธ์ที่เป็นที่รู้จัก: ในเกม 2n และ m2 ใดๆ กลยุทธ์ที่เหมาะสมที่สุดแต่ละกลยุทธ์จะมีกลยุทธ์ที่ใช้งานได้ไม่เกินสองกลยุทธ์ ดังนั้นเกม 2n และ m2 ใด ๆ ก็สามารถลดลงเป็นเกม 22 ดังนั้นเกม 2n และ m2 สามารถแก้ไขได้แบบกราฟิก หากเมทริกซ์ของเกมที่มีขอบเขตจำกัดมีมิติ mn โดยที่ m> 2 และ n> 2 จะใช้โปรแกรมเชิงเส้นเพื่อกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุด

กลยุทธ์ที่บริสุทธิ์ผู้เล่น I กำลังเลือกหนึ่งใน n แถวของเมทริกซ์ผลตอบแทน A และกลยุทธ์ที่บริสุทธิ์ของผู้เล่น II คือการเลือกหนึ่งในคอลัมน์ของเมทริกซ์เดียวกัน

เหมาะสมที่สุด กลยุทธ์ที่สะอาดผู้เล่นแตกต่างจากผู้เล่นแบบผสมโดยมีหน่วยบังคับ p i = 1, q i = 1 ตัวอย่างเช่น: P (1,0), Q (1,0) ที่นี่ p 1 = 1, q 1 = 1

ปัญหา 1
ใช้เมทริกซ์การชำระเงิน ค้นหากลยุทธ์ที่สะอาดเหมาะสมที่สุดโดยใช้หลักการครอบงำที่เข้มงวด ให้เขียนเวกเตอร์ P *, Q * เป็นคำตอบ



R1

R2

R3

R4

S1

3

1

2

5

S2

2

0

0

3

S3

-3

-5

-5

-2

S4

0

-2

-2

1

การตัดสินใจ:

เราแก้ปัญหาทั้งหมดโดยใช้เครื่องคำนวณ Matrix Game

เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาเพื่อให้ได้ผลตอบแทนสูงสุด และผู้เล่น II เลือกกลยุทธ์ของเขาเพื่อลดผลตอบแทนของผู้เล่น I

ผู้เล่นบี 1B2บี 3B4a = นาที (A ผม)
A 13 1 2 5 1
A 22 0 0 3 0
A 3-3 -5 -5 -2 -5
A 40 -2 -2 1 -2
b = สูงสุด (Bi)3 1 2 5
เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = สูงสุด (a i) = 1 ซึ่งบ่งบอกถึงกลยุทธ์บริสุทธิ์สูงสุด A 1
ราคาสูงสุดของเกมคือ b = นาที (b j) = 1
จุดอาน (1, 2) ระบุวิธีแก้ปัญหาสำหรับทางเลือกอื่น (A1, B2) ราคาเกมคือ 1
2. ตรวจสอบเมทริกซ์การจ่ายเงินสำหรับแถวที่โดดเด่นและคอลัมน์ที่โดดเด่น
บางครั้ง จากการพิจารณาอย่างง่ายของเมทริกซ์ของเกม เราสามารถพูดได้ว่ากลยุทธ์ที่บริสุทธิ์บางอย่างสามารถป้อนกลยุทธ์แบบผสมที่เหมาะสมที่สุดได้ก็ต่อเมื่อมีโอกาสเป็นศูนย์
พวกเขาบอกว่า ฉัน-thกลยุทธ์ของผู้เล่นคนแรกครอบงำเขา k-thกลยุทธ์ถ้า ij ≥ kj ทั้งหมด เจ อี นู๋และอย่างน้อยหนึ่ง เจ ij> kj. ในกรณีนี้ยังกล่าวอีกว่า ฉัน-thกลยุทธ์ (หรือเส้น) - เด่น k-th- ครอบงำ
พวกเขาบอกว่า j-thกลยุทธ์ของผู้เล่นคนที่ 2 ครอบงำเขา ล-thกลยุทธ์ถ้าเพื่อทั้งหมด เจ อี เอ็ม a ij ≤ a il และอย่างน้อยหนึ่ง i a ij< a il . В этом случае j-thกลยุทธ์ (คอลัมน์) เรียกว่าเด่น ล-th- ครอบงำ
กลยุทธ์ A 1 ครอบงำกลยุทธ์ A 2 (องค์ประกอบทั้งหมดของแถว 1 มากกว่าหรือเท่ากับค่าของแถวที่ 2) ดังนั้นเราจึงไม่รวมแถวที่ 2 ของเมทริกซ์ ความน่าจะเป็น p 2 = 0
กลยุทธ์ A 1 ครอบงำกลยุทธ์ A 3 (องค์ประกอบทั้งหมดของแถว 1 มากกว่าหรือเท่ากับค่าของแถวที่ 3) ดังนั้นเราจึงไม่รวมแถวที่ 3 ของเมทริกซ์ ความน่าจะเป็น p 3 = 0
3 1 2 5
0 -2 -2 1

จากตำแหน่งของผู้เล่น B ที่สูญเสีย กลยุทธ์ B 1 ครอบงำกลยุทธ์ B 2 (องค์ประกอบทั้งหมดของคอลัมน์ 1 รายการเพิ่มเติมคอลัมน์ 2) ดังนั้นเราจึงไม่รวมคอลัมน์ที่ 1 ของเมทริกซ์ ความน่าจะเป็น q 1 = 0
จากตำแหน่งการสูญเสียของผู้เล่น B กลยุทธ์ B 4 ครอบงำกลยุทธ์ B 1 (องค์ประกอบทั้งหมดของคอลัมน์ 4 มากกว่าองค์ประกอบของคอลัมน์ 1) ดังนั้นเราจึงไม่รวมคอลัมน์ที่ 4 ของเมทริกซ์ ความน่าจะเป็น q 4 = 0
1 2
-2 -2

เราได้ลดเกม 4 x 4 เป็นเกม 2 x 2



โซลูชันเกม ( 2 x น


หน้า 1 = 1
หน้า 2 = 0
ราคาเกม y = 1
ตอนนี้เราสามารถหากลยุทธ์ minimax ของผู้เล่น B ได้โดยการเขียนระบบสมการที่เกี่ยวข้อง
q 1 = 1
q 1 + q 2 = 1
การแก้ปัญหาระบบนี้ เราพบว่า:
q 1 = 1
ตอบ:
ราคาเกม: y = 1 เวกเตอร์กลยุทธ์ของผู้เล่น:
ถาม (1, 0), P (1, 0)

∑a ij q j ≤ v
∑a ij p ฉัน ≥ v
M (P 1; Q) = (1 1) + (2 0) = 1 = v
M (P 2; Q) = (-2 1) + (-2 0) = -2 ≤ v
M (P; Q 1) = (1 1) + (-2 0) = 1 = v
M (P; Q 2) = (2 1) + (-2 0) = 2 ≥ v

เนื่องจากแถวและคอลัมน์ถูกลบออกจากเมทริกซ์ดั้งเดิม เวกเตอร์ความน่าจะเป็นที่พบสามารถเขียนได้ดังนี้:
ป (1,0,0,0)
คิว (0,1,0,0)

งาน2
ค้นหาราคาที่ต่ำกว่าและด้านบนของเกมโดยใช้เมทริกซ์การชำระเงิน ในที่ที่มีจุดอาน ให้เขียนเวกเตอร์ของกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด P *, Q *



R1

R2

R3

S1

-6

-5

0

S2

-8

-3

-2

S3

-3

-2

3

การตัดสินใจ:
1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่ ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ
ผู้เล่นบี 1B2บี 3a = นาที (A ผม)
A 1-6 -5 0 -6
A 2-8 -3 -2 -8
A 3-3 -2 3 -3
b = สูงสุด (Bi)-3 -2 3

เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = สูงสุด (a i) = -3 ซึ่งบ่งบอกถึงกลยุทธ์บริสุทธิ์สูงสุด A 3
ราคาสูงสุดของเกมคือ b = นาที (b j) = -3
จุดอาน (3, 1) ระบุวิธีแก้ปัญหาสำหรับทางเลือกอื่น (A3, B1) ราคาของเกมคือ -3
คำตอบ: P (0,0,1), Q (1,0,0)

ปัญหา3
ค้นหาเวกเตอร์ของกลยุทธ์ที่เหมาะสมที่สุด P *, Q * และราคาเกมโดยใช้เมทริกซ์การชำระเงิน ผู้เล่นคนไหนเป็นผู้ชนะ?



R1

R2

R3

R4

S1

-6

-6

2

4

S2

2

-2

7

-1

การตัดสินใจ:
1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่ ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ
เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาเพื่อให้ได้ผลตอบแทนสูงสุด และผู้เล่น II เลือกกลยุทธ์ของเขาเพื่อลดผลตอบแทนของผู้เล่น I
ผู้เล่นบี 1B2บี 3B4a = นาที (A ผม)
A 1-6 -6 2 4 -6
A 22 -2 7 -1 -2
b = สูงสุด (Bi)2 -2 7 4

เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = max (a i) = -2 ซึ่งบ่งชี้ถึงกลยุทธ์สูงสุด A 2
ราคาสูงสุดของเกมคือ b = นาที (b j) = -2
จุดอาน (2, 2) ระบุวิธีแก้ปัญหาสำหรับทางเลือกอื่น (A2, B2) ราคาของเกมคือ -2
3. ค้นหาวิธีแก้ปัญหาในเกมด้วยกลยุทธ์แบบผสม
มาแก้ปัญหาด้วยวิธีเรขาคณิต ซึ่งมีขั้นตอนดังต่อไปนี้
1. ในระบบพิกัดคาร์ทีเซียน เซ็กเมนต์จะถูกพล็อตตามแกน abscissa ซึ่งมีความยาวเท่ากับ 1 ปลายด้านซ้ายของเซ็กเมนต์ (จุด x = 0) สอดคล้องกับกลยุทธ์ A 1 อันที่ถูกต้อง - กับกลยุทธ์ A 2 (x = 1) จุดกลาง x สอดคล้องกับความน่าจะเป็นของกลยุทธ์แบบผสม S 1 = (p 1, p 2)
2. ชัยชนะของกลยุทธ์ A 1 ถูกพล็อตบนแกนพิกัดด้านซ้าย บนเส้นที่ขนานกับแกนพิกัด จากจุดที่ 1 การชนะของกลยุทธ์ A 2 จะถูกวางแผน
โซลูชันเกม ( 2 x น) ดำเนินการจากตำแหน่งของผู้เล่น A โดยยึดตามกลยุทธ์สูงสุด ไม่มีผู้เล่นคนใดมีกลยุทธ์ที่โดดเด่นและซ้ำซาก

กลยุทธ์สูงสุดของผู้เล่น A สอดคล้องกับจุด N ซึ่งสามารถเขียนระบบสมการต่อไปนี้ได้:
หน้า 1 = 0
หน้า 2 = 1
ราคาเกม y = -2
ตอนนี้เราสามารถหากลยุทธ์ขั้นต่ำสุดของผู้เล่น B ได้โดยการเขียนระบบสมการที่เกี่ยวข้อง ยกเว้นกลยุทธ์ B 1, B 3, B 4 ซึ่งทำให้ผู้เล่น B สูญเสียมากกว่าอย่างเห็นได้ชัด ดังนั้น q 1 = 0 q 3 = 0, q 4 = 0 ...
-2q 2 = -2
q 2 = 1
การแก้ปัญหาระบบนี้ เราพบว่า:
q 2 = 1
ตอบ:
ราคาเกม: y = -2, เวกเตอร์กลยุทธ์ของผู้เล่น:
คิว (0, 1, 0, 0), พี (0, 1)
4. ตรวจสอบความถูกต้องของโซลูชันเกมโดยใช้เกณฑ์ความเหมาะสมของกลยุทธ์
∑a ij q j ≤ v
∑a ij p ฉัน ≥ v
M (P 1; Q) = (-6 0) + (-6 1) + (2 0) + (4 0) = -6 ≤ v
M (P 2; Q) = (2 0) + (-2 1) + (7 0) + (-1 0) = -2 = v
M (P; Q 1) = (-6 0) + (2 1) = 2 ≥ v
M (P; Q 2) = (-6 0) + (-2 1) = -2 = v
M (P; Q 3) = (2 0) + (7 1) = 7 ≥ v
M (P; Q 4) = (4 0) + (-1 1) = -1 ≥ v
ความไม่เท่าเทียมกันทั้งหมดเป็นที่พึงพอใจในฐานะความเท่าเทียมกันหรือความไม่เท่าเทียมกันที่เข้มงวด ดังนั้นจึงพบวิธีแก้ปัญหาของเกมอย่างถูกต้อง

ปัญหา 4
ให้คำตอบโดยละเอียดสำหรับคำถาม

5. ทฤษฎีเกมและวิธีแก้ปัญหาทางสถิติ

5.1. เกมเมทริกซ์ผลรวมศูนย์

การสร้างแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ดำเนินการในเงื่อนไขต่อไปนี้:

ความแน่นอน;

ความไม่แน่นอน

การสร้างแบบจำลอง ในสภาวะความแน่นอน ถือว่ามีข้อมูลเชิงบรรทัดฐานเริ่มต้นที่จำเป็นทั้งหมด (การสร้างแบบจำลองเมทริกซ์ การวางแผนเครือข่ายและการจัดการ)

การสร้างแบบจำลอง มีความเสี่ยง ดำเนินการด้วยความไม่แน่นอนแบบสุ่มเมื่อค่าของข้อมูลเริ่มต้นบางส่วนเป็นแบบสุ่มและรู้กฎการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเหล่านี้ (การวิเคราะห์การถดถอย

การสร้างแบบจำลอง ท่ามกลางความไม่แน่นอน สอดคล้องกับ ขาดอย่างสมบูรณ์ completeข้อมูลบางส่วนที่จำเป็นสำหรับสิ่งนี้ (ทฤษฎีเกม)

แบบจำลองทางคณิตศาสตร์สำหรับการตัดสินใจที่เหมาะสมในสถานการณ์ความขัดแย้งนั้นสร้างขึ้นภายใต้เงื่อนไขที่ไม่แน่นอน

ในทฤษฎีเกม ใช้แนวคิดพื้นฐานต่อไปนี้:

กลยุทธ์;

ฟังก์ชั่นที่ชนะ

โดยหลักสูตร เราจะเรียกตัวเลือกและการดำเนินการโดยผู้เล่นจากการกระทำอย่างใดอย่างหนึ่งที่กำหนดโดยกฎของเกม

กลยุทธ์ เป็นเทคโนโลยีในการเลือกแนวทางปฏิบัติในแต่ละการเคลื่อนไหวขึ้นอยู่กับสถานการณ์ปัจจุบัน

ฟังก์ชั่นที่ชนะ ทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ

ในเกมเมทริกซ์ ฟังก์ชันการจ่ายเงินจะแสดงเป็น เมทริกซ์การชำระเงิน :

จำนวนเงินที่จ่ายให้กับผู้เล่น I ที่เลือกการย้ายจากผู้เล่น II ที่เลือกการย้ายคือที่ไหน

ในเกมคู่นี้ ค่าของฟังก์ชันการจ่ายเงินของผู้เล่นทั้งสองในแต่ละสถานการณ์จะมีขนาดเท่ากันและตรงข้ามกันในเครื่องหมายนั่นคือ และเกมนี้มีชื่อว่า ผลรวมศูนย์ .

กระบวนการของ "การเล่นเกมเมทริกซ์" มีดังต่อไปนี้:

มีการตั้งค่าเมทริกซ์การชำระเงิน

ผู้เล่น I โดยไม่ขึ้นกับผู้เล่น II เลือกหนึ่งในแถวของเมทริกซ์นี้ ตัวอย่างเช่น th;

ผู้เล่น II ไม่ว่าผู้เล่น I จะเลือกคอลัมน์ใดคอลัมน์หนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น - th;

องค์ประกอบของเมทริกซ์กำหนดจำนวนผู้เล่นที่ฉันจะได้รับจากผู้เล่น II แน่นอน ถ้าอย่างนั้น มันมาเกี่ยวกับการสูญเสียที่แท้จริงของผู้เล่น I.

เกมจับคู่ที่เป็นปฏิปักษ์กับเมทริกซ์ผลตอบแทนจะเรียกว่าเกม

ตัวอย่าง

พิจารณาเกม

กำหนดเมทริกซ์การชำระเงิน:

.

ให้ผู้เล่น I เป็นอิสระจากผู้เล่น II เลือกแถวที่สามของเมทริกซ์นี้ และผู้เล่น II โดยไม่ขึ้นกับผู้เล่น I เลือกคอลัมน์ที่สองของเมทริกซ์นี้:

จากนั้นผู้เล่น I จะได้รับ 9 หน่วยจากผู้เล่น II

5.2. กลยุทธ์ที่สะอาดที่สุดในเกมเมทริกซ์

กลยุทธ์ที่เหมาะสมที่สุด เป็นกลยุทธ์ของผู้เล่น I โดยที่เขาไม่ลดผลตอบแทนสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น II และกลยุทธ์ของผู้เล่น II ที่เขาไม่เพิ่มการสูญเสียสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น I

การเลือกแถวที่ th ของเมทริกซ์ผลตอบแทนเป็นการเคลื่อนไหว ผู้เล่น I รับรองว่าตัวเองจะได้รับผลตอบแทนอย่างน้อยตามมูลค่าในกรณีที่เลวร้ายที่สุด เมื่อผู้เล่น II พยายามลดค่านี้ให้เหลือน้อยที่สุด ดังนั้นผู้เล่นที่ฉันเลือกเช่นนั้น - แถวที่จะให้เขา ชนะสูงสุด:

.

ผู้เล่น II คิดในลักษณะเดียวกันและสามารถป้องกันการสูญเสียน้อยที่สุดได้อย่างแน่นอน:

.

ความไม่เท่าเทียมกันเป็นจริงเสมอ:

ปริมาณเรียกว่า ราคาต่ำสุดของเกม .

ปริมาณเรียกว่า ราคาสูงสุดของเกม .

กลยุทธ์ที่เหมาะสมเรียกว่า ทำความสะอาด หากความเท่าเทียมกันถือไว้สำหรับพวกเขา:

,

.

ปริมาณเรียกว่า ราคาที่แท้จริงของเกม , ถ้า ก.

กลยุทธ์และรูปแบบบริสุทธิ์ที่เหมาะสมที่สุด จุดอาน เมทริกซ์การชำระเงิน

สำหรับจุดอานจะเป็นไปตามเงื่อนไขต่อไปนี้:

นั่นคือองค์ประกอบจะเล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์

ดังนั้น หากเมทริกซ์ผลตอบแทนมี จุดอาน แล้วคุณจะพบ กลยุทธ์การทำความสะอาดที่เหมาะสมที่สุด ผู้เล่น

กลยุทธ์ที่บริสุทธิ์ของผู้เล่น I สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในหลักที่ th ซึ่งเท่ากับหนึ่ง

กลยุทธ์ที่บริสุทธิ์ของผู้เล่น II สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในหลักที่ th ซึ่งเท่ากับหนึ่ง

ตัวอย่าง

.

โดยการเลือกเป็นการย้ายแถวใดๆ ของเมทริกซ์ผลตอบแทน ผู้เล่นฉันมั่นใจว่าตัวเองจะได้รับผลตอบแทนในกรณีที่เลวร้ายที่สุดอย่างน้อยมูลค่าในคอลัมน์ที่ระบุโดย:

ดังนั้น ผู้เล่นฉันจะเลือกแถวที่ 2 ของเมทริกซ์การจ่ายเงิน ซึ่งให้ผลตอบแทนสูงสุดแก่เขาโดยไม่คำนึงถึงการเคลื่อนไหวของผู้เล่น II ซึ่งจะพยายามลดค่านี้ให้น้อยที่สุด:

ผู้เล่น II คิดเช่นเดียวกันและเลือกคอลัมน์ที่ 1 เป็นการเคลื่อนไหว:

ดังนั้นจึงมีจุดอานของเมทริกซ์การชำระเงิน:

สอดคล้องกับกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น I และสำหรับผู้เล่น II ซึ่งผู้เล่นที่ฉันไม่ได้ลดกำไรของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น II และผู้เล่น II จะไม่เพิ่มการสูญเสียของเขาสำหรับการเปลี่ยนแปลงในกลยุทธ์โดยผู้เล่น I

5.3. กลยุทธ์ผสมที่เหมาะสมที่สุดในเกมเมทริกซ์

หากเมทริกซ์ผลตอบแทนไม่มีจุดอาน ก็ไม่มีเหตุผลสำหรับผู้เล่นที่จะใช้กลยุทธ์เดียว มันทำกำไรได้มากกว่าที่จะใช้ "สารผสมความน่าจะเป็น" กลยุทธ์ที่บริสุทธิ์ จากนั้น กลยุทธ์แบบผสมแล้วจะถูกกำหนดเป็นกลยุทธ์ที่เหมาะสมที่สุด

กลยุทธ์ผสม ผู้เล่นมีลักษณะเฉพาะโดยการแจกแจงความน่าจะเป็นของเหตุการณ์สุ่มที่ประกอบด้วยตัวเลือกการย้ายของผู้เล่น

กลยุทธ์ผสมของผู้เล่น I เป็นชุดตัวเลขที่เรียงลำดับ ordered (เวกเตอร์) ที่ตรงตามเงื่อนไขสองประการ:

1) สำหรับนั่นคือความน่าจะเป็นของการเลือกแต่ละแถวของเมทริกซ์การชำระเงินนั้นไม่เป็นค่าลบ

2) นั่นคือ ตัวเลือกของแต่ละแถวของเมทริกซ์การชำระเงินในผลรวมหมายถึง เต็มกลุ่มเหตุการณ์

กลยุทธ์ผสมของผู้เล่น II คือชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) เป็นไปตามเงื่อนไข:

จำนวนเงินที่ชำระ ให้กับผู้เล่น I ที่ได้เลือกกลยุทธ์แบบผสม

จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสม

,

หมายถึงค่าเฉลี่ย

.

เหมาะสมที่สุด เรียกว่ากลยุทธ์ผสม

และ ,

ถ้าสำหรับกลยุทธ์ผสมตามอำเภอใจใด ๆ และเป็นไปตามเงื่อนไข:

นั่นคือ ภายใต้กลยุทธ์แบบผสมที่เหมาะสมที่สุด ผลตอบแทนของผู้เล่น I จะมากที่สุด และการสูญเสียผู้เล่น II จะน้อยที่สุด

หากไม่มีจุดอานในเมทริกซ์ผลตอบแทน แล้ว

,

กล่าวคือ มีความแตกต่างในเชิงบวก ( ส่วนต่างที่ไม่ได้จัดสรร )

- ³ 0,

และผู้เล่นจำเป็นต้องมองหาโอกาสเพิ่มเติมเพื่อรับส่วนแบ่งที่มากขึ้นของความแตกต่างนี้อย่างมั่นใจ

ตัวอย่าง

พิจารณาเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน:

.

ตรวจสอบว่ามีจุดอานหรือไม่:

, .

ปรากฎว่าไม่มีจุดอานในเมทริกซ์ผลตอบแทนและผลต่างที่ไม่ได้ปันส่วนจะเท่ากับ:

.

5.4. ค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุด

สำหรับเกม 2 × 2

การกำหนดกลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับเมทริกซ์ผลตอบแทนของมิตินั้นดำเนินการโดยวิธีการหาจุดที่เหมาะสมที่สุดของฟังก์ชันของตัวแปรสองตัว

ให้ความน่าจะเป็นของผู้เล่นที่ฉันเลือกแถวแรกของเมทริกซ์การชำระเงิน

มีค่าเท่ากัน แล้วความน่าจะเป็นที่จะเลือกแถวที่สองคือ

ให้ความน่าจะเป็นของผู้เล่น II เลือกคอลัมน์แรกเท่ากับ ความน่าจะเป็นที่จะเลือกคอลัมน์ที่สองคือ

จำนวนเงินที่จ่ายให้กับผู้เล่น I โดยผู้เล่น II เท่ากับ:

มูลค่าสูงสุดของการเพิ่มของผู้เล่น I และการสูญเสียผู้เล่น II สอดคล้องกับเงื่อนไข:

;

.

ดังนั้น กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I และ II เท่ากับ:

5.5. วิธีแก้ปัญหาทางเรขาคณิตของเกม 2 ×

ด้วยการเพิ่มมิติของเมทริกซ์ผลตอบแทนจาก เป็น ถึง เป็นไปไม่ได้อีกต่อไปที่จะลดการกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดเพื่อค้นหาฟังก์ชันที่เหมาะสมที่สุดของสองตัวแปร อย่างไรก็ตาม เนื่องจากผู้เล่นคนใดคนหนึ่งมีเพียงสองกลยุทธ์ จึงสามารถใช้โซลูชันทางเรขาคณิตได้

ขั้นตอนหลักในการหาวิธีแก้ปัญหาของเกมมีดังนี้

ให้เราแนะนำระบบพิกัดบนเครื่องบิน วาดส่วนบนแกน วาดเส้นตั้งฉากจากปลายด้านซ้ายและขวาของส่วนนี้


ด้านซ้ายและขวาของส่วนหน่วยจะสอดคล้องกับสองกลยุทธ์และสำหรับผู้เล่น I ในการจับฉลาก เราจะเลื่อนการชนะของผู้เล่นรายนี้ออกไป ตัวอย่างเช่น สำหรับเมทริกซ์การชำระเงิน


ผลตอบแทนดังกล่าวของผู้เล่น I เมื่อเลือกกลยุทธ์จะเป็น และ และเมื่อเลือกกลยุทธ์จะเป็น และ

ให้เราเชื่อมต่อโดยการแบ่งส่วนเส้นตรงจุดจ่ายของผู้เล่น I ที่สอดคล้องกับกลยุทธ์ของผู้เล่น II จากนั้นเส้นแบ่งที่เกิดขึ้นซึ่งล้อมรอบกราฟจากด้านล่างจะกำหนดขอบเขตล่างของผลตอบแทนของผู้เล่น I



ค้นหากลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I

,

ซึ่งสอดคล้องกับจุดบนขอบเขตล่างของการจ่ายเงินของผู้เล่น I ด้วยพิกัดสูงสุด

โปรดทราบว่าในตัวอย่างที่กำลังพิจารณา ใช้เพียงสองกลยุทธ์และสอดคล้องกับเส้นตรงที่ตัดกันที่จุดที่พบบนขอบล่างของผลตอบแทนของผู้เล่น I ผู้เล่น II สามารถป้องกันไม่ให้ผู้เล่น I ได้รับผลตอบแทนที่มากขึ้น

ดังนั้นเกมจะลดลงเป็นเกมและกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II ในตัวอย่างที่พิจารณาจะเป็น

,

โดยที่ความน่าจะเป็นเท่ากับในเกม:

5.6. โซลูชันเกม×

หากเกมเมทริกซ์ไม่มีวิธีแก้ปัญหาในกลยุทธ์ที่บริสุทธิ์ (เช่น ไม่มีจุดอาน) และเนื่องจากเมทริกซ์ผลตอบแทนมีขนาดใหญ่จึงไม่สามารถแก้ไขได้แบบกราฟิก เพื่อให้ได้วิธีแก้ปัญหา ให้ใช้ วิธีการโปรแกรมเชิงเส้น .

ให้เมทริกซ์ผลตอบแทนของมิติได้รับ:

.

ต้องหาความน่าจะเป็น โดยผู้เล่นคนใดที่ฉันต้องเลือกการเคลื่อนไหวของเขาเพื่อให้กลยุทธ์แบบผสมนี้รับประกันว่าเขาจะได้รับผลตอบแทนอย่างน้อยที่สุดโดยไม่คำนึงถึงทางเลือกของการเคลื่อนไหวโดยผู้เล่น II

สำหรับแต่ละการย้ายที่เลือกโดยผู้เล่น II ผลตอบแทนของผู้เล่น I ถูกกำหนดโดยการอ้างอิง:

เราหารอสมการทั้งสองข้างด้วยและแนะนำสัญลักษณ์ใหม่:

ความเท่าเทียมกัน

จะใช้แบบฟอร์ม:

เนื่องจากผู้เล่นที่ฉันพยายามที่จะเพิ่มผลตอบแทนสูงสุด การแลกเปลี่ยนซึ่งกันและกันจะต้องถูกย่อให้เล็กสุด จากนั้นปัญหาการเขียนโปรแกรมเชิงเส้นสำหรับผู้เล่นที่ฉันใช้แบบฟอร์ม:

มีข้อจำกัด

ในทำนองเดียวกัน ปัญหาสำหรับผู้เล่น II ถูกสร้างขึ้นเป็นคู่:

มีข้อจำกัด

การแก้ปัญหาโดยใช้วิธีซิมเพล็กซ์ เราได้รับ:

,

5.7. คุณสมบัติของการแก้เกมเมทริกซ์

ก่อนแก้ปัญหาการหากลยุทธ์ที่เหมาะสม ควรตรวจสอบสองเงื่อนไข:

เป็นไปได้ไหมที่จะทำให้เมทริกซ์การชำระเงินง่ายขึ้น

เมทริกซ์การชำระเงินมีจุดอานหรือไม่

พิจารณาความเป็นไปได้ของการลดความซับซ้อนของเมทริกซ์การชำระเงิน:

เนื่องจากผู้เล่นที่ฉันพยายามที่จะได้รับ ชัยชนะที่ยิ่งใหญ่ที่สุดจากนั้นคุณสามารถขีดฆ่าบรรทัดที่ออกจากเมทริกซ์การชำระเงินได้ เนื่องจากเขาจะไม่ใช้การย้ายนี้หากความสัมพันธ์ต่อไปนี้เป็นจริงกับแถวอื่น:

ในทำนองเดียวกัน การดิ้นรนเพื่อการสูญเสียที่น้อยที่สุด ผู้เล่น II จะไม่เลือกคอลัมน์ ith ในเมทริกซ์การจ่ายเงินเป็นการเคลื่อนไหว และคอลัมน์นี้สามารถขีดฆ่าได้หากความสัมพันธ์ต่อไปนี้มีกับคอลัมน์ ith อื่น:

ส่วนใหญ่ วิธีแก้ปัญหาง่ายๆของเกมคือการมีอยู่ในเมทริกซ์การชำระเงินแบบง่ายของจุดอานที่ตรงตามเงื่อนไขต่อไปนี้ (ตามคำจำกัดความ):

ตัวอย่าง

มีเมทริกซ์การชำระเงิน:

.

การลดความซับซ้อนของเมทริกซ์การชำระเงิน:

จุดอาน:

5.8. เล่นกับธรรมชาติ

ตรงกันข้ามกับปัญหาของทฤษฎีเกมใน ปัญหาทางทฤษฎี การตัดสินใจทางสถิติ สถานการณ์ที่ไม่แน่นอนไม่มีความขัดแย้งที่เป็นปฏิปักษ์และขึ้นอยู่กับความเป็นจริงตามวัตถุประสงค์ซึ่งมักจะเรียกว่า "ธรรมชาติ" .

ในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ ผู้เล่น II จะเล่นโดยปัจจัยที่ไม่แน่นอนซึ่งส่งผลต่อประสิทธิภาพของการตัดสินใจ

เกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติแตกต่างจากเกมเมทริกซ์ทั่วไปตรงที่ เมื่อเลือกกลยุทธ์ที่เหมาะสมที่สุดโดยผู้เล่น I จะไม่สามารถถูกชี้นำโดยผู้เล่น II จะพยายามลดการสูญเสียของเขาให้เหลือน้อยที่สุด ดังนั้น พร้อมกับเมทริกซ์การชำระเงิน เราขอแนะนำ เมทริกซ์ความเสี่ยง :

ค่าความเสี่ยงของผู้เล่น I อยู่ที่ไหนเมื่อใช้การเคลื่อนไหวภายใต้เงื่อนไขเท่ากับส่วนต่าง ระหว่างผลตอบแทนที่ผู้เล่นจะได้รับ ถ้าเขารู้ว่าเงื่อนไขจะถูกสร้างขึ้น กล่าวคือ และเงินรางวัลที่เขาจะได้รับโดยไม่รู้ว่าเมื่อเลือกย้ายแล้วจะมีการกำหนดเงื่อนไข

ดังนั้นเมทริกซ์ผลตอบแทนจึงถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไม่น่าสงสัย และการแปลงย้อนกลับมีความคลุมเครือ

ตัวอย่าง

เมทริกซ์ผลตอบแทน:

.

เมทริกซ์ความเสี่ยง:

เป็นไปได้ สองประโยคปัญหา เกี่ยวกับการเลือกวิธีแก้ปัญหา ในเกมเมทริกซ์กับธรรมชาติ :

เพิ่มเงินรางวัลของคุณให้สูงสุด

ลดความเสี่ยง

ปัญหาการตัดสินใจสามารถเกิดขึ้นได้จากสองเงื่อนไข:

- มีความเสี่ยง เมื่อทราบฟังก์ชันการกระจายความน่าจะเป็นของกลยุทธ์ของธรรมชาติ ตัวอย่างเช่น ค่าสุ่มของการเกิดขึ้นของแต่ละสถานการณ์ทางเศรษฐกิจที่สมมติขึ้น

- ท่ามกลางความไม่แน่นอน เมื่อไม่ทราบฟังก์ชันการกระจายความน่าจะเป็นดังกล่าว

5.9. การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติ

มีความเสี่ยง

เมื่อทำการตัดสินใจภายใต้สภาวะเสี่ยง ผู้เล่นทราบความน่าจะเป็น การเริ่มต้นของสถานะของธรรมชาติ

จากนั้นจึงเป็นการสมควรที่ผู้เล่น I จะเลือกกลยุทธ์ที่ มูลค่าเฉลี่ยของเงินรางวัลที่ได้รับต่อบรรทัดสูงสุด :

.

เมื่อแก้ปัญหานี้ด้วยเมทริกซ์ความเสี่ยง เราจะได้โซลูชันเดียวกันกับ ความเสี่ยงเฉลี่ยขั้นต่ำ :

.

5.10. การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติ

ท่ามกลางความไม่แน่นอน

ในการตัดสินใจภายใต้สภาวะที่ไม่แน่นอน คุณสามารถใช้สิ่งต่อไปนี้ได้ เกณฑ์ :

เกณฑ์ Maximin ของ Wald;

เกณฑ์ ความเสี่ยงน้อยที่สุดเซวิจา;

เกณฑ์สำหรับการมองโลกในแง่ร้ายคือการมองโลกในแง่ดีของ Hurwitz;

หลักการของ Laplace ไม่เพียงพอ

พิจารณา การทดสอบแม็กซิมินของ Wald .

เกมที่มีธรรมชาติเล่นเหมือนกับฝ่ายตรงข้ามที่ก้าวร้าวพอสมควรนั่นคือวิธีการประกันภัยต่อจะดำเนินการจากตำแหน่งที่มองโลกในแง่ร้ายอย่างรุนแรงสำหรับเมทริกซ์การชำระเงิน:

.

พิจารณา เกณฑ์ความเสี่ยงขั้นต่ำของอำมหิต .

แนวทางที่คล้ายกับวิธีก่อนหน้าจากตำแหน่งของการมองโลกในแง่ร้ายที่รุนแรงสำหรับเมทริกซ์ความเสี่ยง:

.

พิจารณา เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของHurwitz .

มีการเสนอโอกาสที่จะไม่ถูกชี้นำโดยการมองโลกในแง่ร้ายสุดโต่งหรือการมองโลกในแง่ดีสุดขั้ว:

ระดับของการมองโลกในแง่ร้ายอยู่ที่ไหน

ใน - การมองโลกในแง่ดีสุดขีด

ใน - มองโลกในแง่ร้ายสุดขีด

พิจารณา หลักการของลาปลาซเรื่องพื้นฐานไม่เพียงพอ .

เป็นที่เชื่อกันว่าสภาวะธรรมชาติทั้งหมดมีความเป็นไปได้เท่าเทียมกัน:

,

.

บทสรุปในส่วนที่ห้า

ผู้เล่นสองคนมีส่วนร่วมในเกมเมทริกซ์ และฟังก์ชันการจ่ายเงิน ซึ่งทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ จะแสดงในรูปแบบของเมทริกซ์การจ่ายเงิน เราตกลงกันว่าผู้เล่นที่ฉันเลือกแถวหนึ่งของเมทริกซ์ผลตอบแทนเป็นการย้าย และผู้เล่น II เลือกคอลัมน์ใดคอลัมน์หนึ่ง จากนั้น ที่จุดตัดของแถวและคอลัมน์ที่เลือกของเมทริกซ์นี้ มีค่าตัวเลขของการชำระเงินให้กับผู้เล่น I จากผู้เล่น II (หากค่านี้เป็นค่าบวก แสดงว่าผู้เล่นที่ฉันชนะจริงๆ และหากเป็นค่าลบ แสดงว่าผู้เล่น II ชนะ)

หากมีจุดอานในเมทริกซ์ผลตอบแทน ผู้เล่นมีกลยุทธ์ที่ดีที่สุด นั่นคือ เพื่อที่จะชนะ แต่ละคนจะต้องทำซ้ำการเคลื่อนไหวที่เหมาะสมที่สุดของเขาในครั้งเดียว หากไม่มีจุดอาน เพื่อที่จะชนะ แต่ละคนต้องใช้กลยุทธ์ผสมที่เหมาะสม นั่นคือ ใช้ท่าผสม ซึ่งแต่ละท่าจะต้องดำเนินการด้วยความน่าจะเป็นที่เหมาะสมที่สุด

การค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2 ดำเนินการโดยการคำนวณความน่าจะเป็นที่เหมาะสมที่สุดโดยใช้สูตรที่ทราบ ผ่าน โซลูชันทางเรขาคณิตสำหรับเกม 2 × n เกม คำจำกัดความของกลยุทธ์แบบผสมที่เหมาะสมที่สุดในเกมจะลดลงเป็นการค้นหากลยุทธ์แบบผสมที่เหมาะสมสำหรับเกม 2 × 2 ในการแก้เกม m × n จะใช้วิธีการโปรแกรมเชิงเส้นเพื่อค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด

เมทริกซ์การชำระเงินบางตัวช่วยให้เข้าใจง่าย ซึ่งเป็นผลมาจากการที่มิติข้อมูลลดลงโดยการลบแถวและคอลัมน์ที่สอดคล้องกับการเคลื่อนไหวที่ไม่คาดฝัน

หากผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งขึ้นอยู่กับความเป็นจริงของวัตถุและไม่มีสีแห่งความขัดแย้งที่เป็นปรปักษ์กัน เกมดังกล่าวจะเรียกว่าเกมที่มีธรรมชาติ และปัญหาของทฤษฎีการตัดสินใจทางสถิติจะถูกนำมาใช้ในการแก้ปัญหา จากนั้นพร้อมกับเมทริกซ์การจ่ายค่าตอบแทนแนะนำเมทริกซ์ความเสี่ยงและสองงบของปัญหาในการเลือกวิธีแก้ปัญหาในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ: เพิ่มผลตอบแทนสูงสุดและลดความเสี่ยง

การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขความเสี่ยงแสดงให้เห็นว่า ขอแนะนำให้ผู้เล่น I เลือกกลยุทธ์ที่ค่าเฉลี่ย (การคาดหมายทางคณิตศาสตร์) ของผลตอบแทนที่ได้รับเหนือแถวของเมทริกซ์ผลตอบแทนสูงสุด หรือ (ซึ่งเท่ากัน) ค่าเฉลี่ย (การคาดหมายทางคณิตศาสตร์) ของความเสี่ยงที่ได้รับจากแถวของเมทริกซ์ความเสี่ยงนั้นน้อยที่สุด ในการตัดสินใจภายใต้สภาวะที่ไม่แน่นอน ให้ใช้ หลักเกณฑ์ดังต่อไปนี้: เกณฑ์สูงสุดของ Wald, เกณฑ์ความเสี่ยงขั้นต่ำของ Sevidge, เกณฑ์การมองโลกในแง่ร้ายและการมองโลกในแง่ดีของ Hurwitz, หลักการ Laplace เกี่ยวกับพื้นฐานไม่เพียงพอ

คำถามทดสอบตัวเอง

แนวคิดพื้นฐานของทฤษฎีเกมกำหนดไว้อย่างไร: การเคลื่อนไหว กลยุทธ์ และฟังก์ชันผลตอบแทน

ฟังก์ชันการจ่ายเงินแสดงในเกมเมทริกซ์อย่างไร

ทำไมเกมเมทริกซ์ถึงเรียกว่าผลรวมศูนย์?

กระบวนการเล่นเกมเมทริกซ์เป็นอย่างไร?

เกมอะไรที่เรียกว่าเกม m × n?

กลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์คืออะไร?

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่า pure?

จุดอานของเมทริกซ์ผลตอบแทนหมายความว่าอย่างไร

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่ามิกซ์?

กลยุทธ์ผสมของผู้เล่นปรากฏอย่างไร?

จำนวนเงินที่จ่ายให้กับผู้เล่น I จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสมคืออะไร?

กลยุทธ์แบบผสมใดที่เรียกว่าเหมาะสมที่สุด

ความแตกต่างที่ไม่ได้จัดสรรหมายความว่าอย่างไร

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2

กลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับเกม 2 × n เกมพบได้อย่างไร?

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม m × n

อะไรคือคุณสมบัติของการแก้เกมเมทริกซ์?

การลดความซับซ้อนของเมทริกซ์การชำระเงินหมายถึงอะไรและสามารถทำได้ภายใต้เงื่อนไขใด

เกมเมทริกซ์ใดแก้ง่ายกว่าเมื่อเมทริกซ์ผลตอบแทนมีหรือไม่มีจุดอาน

ปัญหาใดในทฤษฎีเกมที่เกี่ยวข้องกับปัญหาในทฤษฎีการตัดสินใจทางสถิติ

เมทริกซ์การชำระเงินถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไร

สองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาที่เป็นไปได้ในเกมเมทริกซ์ที่มีธรรมชาติคืออะไร?

สำหรับสองเงื่อนไขใดที่สามารถกำหนดปัญหาในการตัดสินใจในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ?

กลยุทธ์ใดที่เหมาะสมสำหรับผู้เล่น I ที่จะเลือกเมื่อแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้สภาวะเสี่ยง?

เกณฑ์การตัดสินใจใดที่สามารถใช้ในการแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขของความไม่แน่นอน

ตัวอย่างการแก้ปัญหา

1. เมทริกซ์การชำระเงินแสดงจำนวนกำไรขององค์กรเมื่อขายได้ ประเภทต่างๆผลิตภัณฑ์ (คอลัมน์) ขึ้นอยู่กับความต้องการคงที่ (แถว) จำเป็นต้องกำหนดกลยุทธ์ที่เหมาะสมที่สุดขององค์กรสำหรับการผลิตผลิตภัณฑ์ประเภทต่างๆ และรายได้สูงสุด (โดยเฉลี่ย) ที่สอดคล้องกันจากการขาย

ลองแสดงเมทริกซ์ที่กำหนดโดยและแนะนำตัวแปร เราจะใช้เมทริกซ์ (เวกเตอร์) ด้วย จากนั้นและนั่นคือ

คำนวณเมทริกซ์ผกผัน:

พบค่า:

.

คำนวณความน่าจะเป็น:

รายได้เฉลี่ยจากการขายถูกกำหนด:

.

2. บริษัท "เภสัช" เป็นผู้ผลิตยาและผลิตภัณฑ์ชีวการแพทย์ในภูมิภาค เป็นที่ทราบกันดีว่าความต้องการยาบางชนิดมีความต้องการสูงสุด ช่วงฤดูร้อน(ยาของกลุ่มหัวใจและหลอดเลือด, ยาแก้ปวด) สำหรับคนอื่น ๆ - สำหรับช่วงฤดูใบไม้ร่วงและฤดูใบไม้ผลิ (ป้องกันการติดเชื้อ, ฤทธิ์ต้านฤทธิ์)

ค่าใช้จ่ายสำหรับ 1 Conv. หน่วย ผลิตภัณฑ์สำหรับเดือนกันยายนถึงตุลาคมคือ: สำหรับกลุ่มแรก (ยารักษาโรคหัวใจและหลอดเลือดและยาแก้ปวด) - 20 รูเบิล; ในกลุ่มที่สอง (ยาต้านการติดเชื้อ, ยาแก้ไอ) - 15 รูเบิล

ตามข้อสังเกตสำหรับหลาย ๆ ปีที่ผ่านมาบริการการตลาดของบริษัทได้กำหนดขึ้นว่าสามารถรับรู้ได้ในช่วงสองเดือนภายใต้การพิจารณาในสภาพอากาศที่อบอุ่น 3050 Conv. หน่วย สินค้ากลุ่มแรกและ 1100 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มที่สอง ในสภาพอากาศหนาวเย็น - 1525 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 3690 Conv. หน่วย กลุ่มที่สอง

ในการเชื่อมต่อกับการเปลี่ยนแปลงของสภาพอากาศที่เป็นไปได้งานถูกกำหนด - เพื่อกำหนดกลยุทธ์ของ บริษัท ในการผลิตผลิตภัณฑ์ที่ให้รายได้สูงสุดจากการขายในราคาขาย 40 รูเบิล สำหรับ 1 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 30 รูเบิล - กลุ่มที่สอง

การตัดสินใจ บริษัท มีสองกลยุทธ์:

ปีนี้อากาศจะอบอุ่น

อากาศจะเย็น

หาก บริษัท ใช้กลยุทธ์และในความเป็นจริงจะมีอากาศอบอุ่น (กลยุทธ์ของธรรมชาติ) ผลิตภัณฑ์ที่ผลิต (3050 หน่วยทั่วไปของยากลุ่มแรกและ 1100 หน่วยทั่วไปของกลุ่มที่สอง) จะถูกขายอย่างเต็มที่และรายได้จะ เป็น

3050 × (40-20) + 1100 × (30-15) = 77500 หน้า

ในอากาศเย็น (กลยุทธ์ธรรมชาติ) ยากลุ่มที่ 2 จะขายเต็มจำนวน และกลุ่มแรกเพียงจำนวน 1,525 Conv. หน่วย และยาบางชนิดก็ยังไม่เกิดขึ้นจริง รายได้จะ

1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 หน้า

ในทำนองเดียวกัน หากรูปแบบใช้กลยุทธ์และอากาศหนาวจริง รายได้ก็จะเป็น

1525 × (40-20) + 3690 × (30-15) = 85850 หน้า

อากาศร้อนมีรายได้

1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 หน้า

เมื่อพิจารณาถึงบริษัทและสภาพอากาศในฐานะผู้เล่นสองคน เราจะได้เมทริกซ์การชำระเงิน

,

ราคาของเกมอยู่ในช่วง

จะเห็นได้จากเมทริกซ์การชำระเงินที่ภายใต้เงื่อนไขทั้งหมด รายได้ของบริษัทจะอยู่ที่ 16,500 รูเบิลเป็นอย่างน้อย แต่ถ้าสภาพอากาศตรงกับกลยุทธ์ที่เลือก รายได้ของบริษัทจะอยู่ที่ 77,500 รูเบิล

มาหาวิธีแก้ปัญหาของเกมกันเถอะ

ให้เราแสดงถึงความน่าจะเป็นของการนำกลยุทธ์ของบริษัทไปใช้ กลยุทธ์ผ่าน และ แก้เกมแบบกราฟิกด้วยวิธีการเราได้รับ ในขณะที่ราคาของเกมเป็น p.

แผนการผลิตยาที่เหมาะสมจะเป็น

ดังนั้นจึงแนะนำให้บริษัทผลิตในช่วงเดือนกันยายนและตุลาคม 2379 conv. หน่วย ยากลุ่มแรกและ 2239.6 Conv. หน่วย ยาเสพติดของกลุ่มที่สองจากนั้นในทุกสภาพอากาศเธอจะได้รับรายได้อย่างน้อย 46986 รูเบิล

ในสภาวะที่ไม่แน่นอน หากบริษัทไม่สามารถใช้กลยุทธ์แบบผสม (สัญญากับองค์กรอื่น) เพื่อกำหนดกลยุทธ์ที่เหมาะสมที่สุดของบริษัท เราใช้เกณฑ์ต่อไปนี้:

เกณฑ์ Walde:

เกณฑ์ของ Hurwitz: เพื่อความแน่นอนเราจะยอมรับแล้วสำหรับกลยุทธ์ของ บริษัท

สำหรับกลยุทธ์

ขอแนะนำให้บริษัทใช้กลยุทธ์

เกณฑ์ความป่าเถื่อน องค์ประกอบสูงสุดในคอลัมน์แรกคือ 77500 ในคอลัมน์ที่สองคือ 85850

องค์ประกอบของเมทริกซ์ความเสี่ยงพบได้จากนิพจน์

,

ที่ไหน,,

เมทริกซ์ความเสี่ยงมีรูปแบบ

,

ขอแนะนำให้ใช้กลยุทธ์หรือ

ดังนั้นจึงแนะนำให้บริษัทนำกลยุทธ์ไปใช้หรือ

โปรดทราบว่าเกณฑ์การพิจารณาแต่ละข้อไม่สามารถถือว่าน่าพอใจอย่างสมบูรณ์สำหรับ ทางเลือกสุดท้ายอย่างไรก็ตาม การตัดสินใจ การวิเคราะห์ร่วมกันทำให้คุณสามารถแสดงถึงผลที่ตามมาของการตัดสินใจด้านการจัดการบางอย่างได้ชัดเจนยิ่งขึ้น

ด้วยการกระจายความน่าจะเป็นของสภาวะธรรมชาติต่างๆ ที่ทราบ เกณฑ์สำหรับการตัดสินใจคือความคาดหวังทางคณิตศาสตร์สูงสุดของการชนะ

ให้ทราบปัญหาที่พิจารณาว่าความน่าจะเป็นของสภาพอากาศที่อบอุ่นและเย็นมีค่าเท่ากับ 0.5 แล้วจึงกำหนดกลยุทธ์ที่เหมาะสมของบริษัทดังนี้

ขอแนะนำให้บริษัทใช้กลยุทธ์หรือ

งานที่มอบหมายให้ศึกษาด้วยตนเอง

1. องค์กรสามารถผลิตสินค้าได้ 3 ประเภท (A, B และ C) โดยได้รับผลกำไรตามความต้องการ ในทางกลับกัน อุปสงค์สามารถรับหนึ่งในสี่สถานะ (I, II, III และ IV) ในเมทริกซ์ต่อไปนี้ องค์ประกอบจะแสดงลักษณะกำไรที่องค์กรจะได้รับเมื่อผลิตผลิตภัณฑ์ที่ - และ - สถานะของอุปสงค์:

หากในเกมฝ่ายตรงข้ามแต่ละรายใช้เพียงหนึ่งกลยุทธ์เดียวกันในกรณีนี้พวกเขาบอกว่ามันกำลังเกิดขึ้นเกี่ยวกับตัวเกมเอง ในกลยุทธ์ที่บริสุทธิ์ และใช้งานโดยผู้เล่น แต่และเครื่องเล่น ในสองกลยุทธ์ที่เรียกว่า กลยุทธ์ที่บริสุทธิ์ .

คำจำกัดความ ในเกมที่เป็นปฏิปักษ์ กลยุทธ์คู่หนึ่ง ( แต่ ผม , ใน j) เรียกว่าดุลยภาพหรือเสถียรหากผู้เล่นคนใดคนหนึ่งไม่ได้รับประโยชน์จากกลยุทธ์ของตน

มันสมเหตุสมผลแล้วที่จะใช้กลยุทธ์บริสุทธิ์เมื่อผู้เล่น แต่และ ในมีข้อมูลเกี่ยวกับการกระทำของกันและกันและผลลัพธ์ที่ได้ หากเราคิดว่าอย่างน้อยฝ่ายใดฝ่ายหนึ่งไม่รู้เกี่ยวกับพฤติกรรมของฝ่ายตรงข้าม แนวคิดเรื่องความสมดุลก็ถูกละเมิด และเกมจะเล่นอย่างสุ่มเสี่ยง

พิจารณาเกมเมทริกซ์ G(3x4)

ในตัวอย่างนี้ ราคาที่ต่ำกว่าของเกมจะเท่ากับราคาบน: == 9 เช่น เกมนี้มีจุดอาน

ปรากฎว่าในกรณีนี้กลยุทธ์สูงสุด max แต่ 2 และ ใน 2 จะ ที่ยั่งยืน เกี่ยวกับข้อมูลเกี่ยวกับพฤติกรรมของศัตรู

แน่นอนให้ผู้เล่น แต่รู้ว่าศัตรูกำลังใช้กลยุทธ์ ใน 2. แต่ในกรณีนี้ผู้เล่น แต่จะยึดมั่นในยุทธศาสตร์ต่อไป แต่ 2 เพราะการเบี่ยงเบนใด ๆ จากกลยุทธ์ แต่ 2 จะลดเฉพาะเงินรางวัลเท่านั้น เช่นเดียวกัน ข้อมูลที่ผู้เล่นได้รับ ใน,จะไม่บังคับเขาให้เบี่ยงเบนไปจากกลอุบายของเขา ใน 2 .

สองสามกลยุทธ์ แต่ 2 และ ใน 2 มีคุณสมบัติของความมั่นคง และผลตอบแทน (ในตัวอย่างที่พิจารณา เท่ากับ 9) ที่ทำได้ด้วยกลยุทธ์คู่นี้ กลายเป็นจุดอานของเมทริกซ์ผลตอบแทน

สัญญาณของความมั่นคง (สมดุล) ของคู่กลยุทธ์คือความเท่าเทียมกันของด้านล่างและ ราคาสูงสุดเกม.

กลยุทธ์ แต่ ผมและ ใน เจ(ในตัวอย่างที่พิจารณา แต่ 2 , ใน 2) ที่ซึ่งความเท่าเทียมกันของราคาที่ต่ำกว่าและด้านบนของเกมเป็นที่พอใจ เรียกว่ากลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด และการรวมกันของสิ่งเหล่านี้เรียกว่าวิธีแก้ปัญหาของเกม ในกรณีนี้ ตัวเกมเองได้รับการกล่าวขานว่าต้องแก้ด้วยกลยุทธ์ล้วนๆ

มูลค่าเรียกว่าต้นทุนของเกม

ถ้า 0 เกมจะเป็นประโยชน์สำหรับผู้เล่น A ถ้า 0 - สำหรับผู้เล่น B; สำหรับ = 0 เกมนั้นยุติธรรมเช่น เป็นประโยชน์อย่างเท่าเทียมกันสำหรับผู้เข้าร่วมทั้งสอง

อย่างไรก็ตาม การปรากฏตัวของจุดอานในเกมอยู่ไกลจากกฎ ค่อนข้างเป็นข้อยกเว้น เกมเมทริกซ์ส่วนใหญ่ไม่มีจุดอาน ดังนั้นจึงไม่มีกลยุทธ์ที่ดีที่สุด อย่างไรก็ตาม มีเกมประเภทหนึ่งที่มีจุดอานเสมอ ดังนั้นจึงแก้ไขได้ด้วยกลยุทธ์ล้วนๆ นี่คือเกมที่มี ข้อมูลครบถ้วน.

ทฤษฎีบท 2 แต่ละเกมที่มีข้อมูลครบถ้วนจะมีจุดอาน ดังนั้นจึงแก้ไขได้ด้วยกลยุทธ์ล้วนๆ เช่น มีคู่ของกลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุดที่ให้ผลตอบแทนที่มั่นคงเท่ากับ

หากเกมดังกล่าวประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น เมื่อผู้เล่นแต่ละคนใช้กลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด เกมดังกล่าวจะต้องจบลงด้วยการชนะที่เท่ากับราคาของเกม ตัวอย่างเช่น เกมหมากรุก เป็นเกมที่มีข้อมูลครบถ้วน มักจะจบลงด้วยการชนะสีขาว หรือเสมอด้วยการชนะสีดำ หรือเสมอด้วยการเสมอ (อะไรกันแน่ - เรายังไม่ทราบตั้งแต่ตัวเลข ของกลยุทธ์ที่เป็นไปได้ในเกมหมากรุกนั้นใหญ่มาก)

หากเมทริกซ์ของเกมมีจุดอาน ก็จะพบวิธีแก้ปัญหาทันทีตามหลักการแม็กซิมิน

คำถามเกิดขึ้น: จะหาวิธีแก้ไขเกมที่เมทริกซ์ผลตอบแทนไม่มีจุดอานได้อย่างไร? การใช้หลักการสูงสุดโดยผู้เล่นแต่ละคนทำให้ผู้เล่น A ได้กำไรและขาดทุนอย่างน้อยที่สุดสำหรับผู้เล่น พิจารณาว่าเป็นเรื่องปกติสำหรับผู้เล่น A ต้องการเพิ่มเงินรางวัลของเขา และสำหรับผู้เล่น B จะลดความสูญเสียของเขา การค้นหาวิธีแก้ปัญหาดังกล่าวนำไปสู่ความจำเป็นในการใช้กลยุทธ์แบบผสม: เพื่อสลับกลยุทธ์บริสุทธิ์ด้วยความถี่บางส่วน

คำจำกัดความ ตัวแปรสุ่มที่มีค่าเป็นกลยุทธ์ที่บริสุทธิ์ของผู้เล่นเรียกว่าของเขา กลยุทธ์ผสม .

ดังนั้น งานของกลยุทธ์แบบผสมของผู้เล่นประกอบด้วยการบ่งชี้ความน่าจะเป็นที่เลือกใช้กลยุทธ์ที่แท้จริงของเขา

เราจะแสดงถึงกลยุทธ์ที่หลากหลายของผู้เล่น แต่และ ในตามลำดับ

S A = || p 1, p 2, ..., p m ||,

SB = || q 1, q 2, ..., q n ||,

โดยที่ p i คือความน่าจะเป็นของผู้เล่นที่ใช้ แต่สะอาดจากกลยุทธ์ แต่ผม; ; q j คือความน่าจะเป็นของผู้เล่น B โดยใช้กลยุทธ์บริสุทธิ์ B j; ...

ในกรณีพิเศษ เมื่อความน่าจะเป็นทั้งหมด ยกเว้นหนึ่ง เท่ากับศูนย์ และอันนี้เท่ากับหนึ่ง กลยุทธ์แบบผสมจะกลายเป็นแบบบริสุทธิ์

มีการใช้กลยุทธ์แบบผสม เช่น วิธีนี้: เกมซ้ำหลายครั้ง แต่ในแต่ละเกม ผู้เล่นใช้กลยุทธ์ที่แตกต่างกันโดยสิ้นเชิง โดยมีความถี่สัมพัทธ์ของแอปพลิเคชันเท่ากับ พี ผม และ q เจ .

กลยุทธ์แบบผสมในทฤษฎีเกมเป็นแบบอย่างของกลยุทธ์ที่ลื่นไหลและยืดหยุ่น ซึ่งผู้เล่นไม่รู้ว่ากลยุทธ์ใดที่คู่ต่อสู้จะเลือกในเกมที่กำหนด

ถ้าผู้เล่น แต่ใช้กลยุทธ์แบบผสม SA = || p 1, p 2, ..., p m || และผู้เล่น ในกลยุทธ์ผสม SB = || q 1, q 2, ..., q n || จากนั้นผลตอบแทนเฉลี่ย (ความคาดหวังทางคณิตศาสตร์) ของผู้เล่น แต่ถูกกำหนดโดยอัตราส่วน

แน่นอนการสูญเสียผู้เล่นที่คาดหวัง ในมีค่าเท่ากัน

ดังนั้น หากเกมเมทริกซ์ไม่มีจุดอาน ผู้เล่นควรใช้กลยุทธ์ผสมที่เหมาะสมที่สุดที่จะให้ผลตอบแทนสูงสุด

คำถามเกิดขึ้นตามธรรมชาติ: สิ่งที่ควรพิจารณาเมื่อเลือกกลยุทธ์แบบผสม? ปรากฎว่าหลักการแม็กซิมินยังคงความหมายในกรณีนี้ไว้เช่นกัน นอกจากนี้ จำเป็นเพื่อทำความเข้าใจการแก้ปัญหาของเกม ให้เล่นทฤษฎีบทพื้นฐานของเกม

วิธีการและแบบจำลองทางคณิตศาสตร์ทางเศรษฐศาสตร์

เกมเมทริกซ์

บทนำ

ในทางปฏิบัติทางเศรษฐกิจ สถานการณ์มักเกิดขึ้นโดยที่ฝ่ายต่าง ๆ ต่างมีเป้าหมายที่แตกต่างกัน ตัวอย่างเช่น ความสัมพันธ์ระหว่างผู้ขายและผู้ซื้อ ซัพพลายเออร์และผู้บริโภค ธนาคารและผู้ฝากเงิน เป็นต้น สถานการณ์ความขัดแย้งดังกล่าวไม่ได้เกิดขึ้นเฉพาะในด้านเศรษฐกิจเท่านั้น แต่ยังเกิดขึ้นในกิจกรรมอื่นๆ ด้วย ตัวอย่างเช่น เมื่อเล่นหมากรุก หมากฮอส โดมิโน โลโต้ ฯลฯ

เกม- นี่คือ แบบจำลองทางคณิตศาสตร์ สถานการณ์ความขัดแย้งเกี่ยวข้องกับบุคคลอย่างน้อยสองคนโดยใช้หลาย วิธีทางที่แตกต่างเพื่อให้บรรลุเป้าหมายของคุณ เกมนี้มีชื่อว่า ห้องอบไอน้ำ, ถ้าผู้เล่นสองคนมีส่วนร่วม เกมนี้มีชื่อว่า เป็นปฏิปักษ์, ถ้ากำไรของผู้เล่นคนหนึ่งเท่ากับการสูญเสียของอีกคนหนึ่ง ดังนั้นเพื่อกำหนดเกมก็เพียงพอที่จะตั้งค่าผลตอบแทนของผู้เล่นคนหนึ่งในสถานการณ์ที่แตกต่างกัน

วิธีการใด ๆ ของการกระทำของผู้เล่นขึ้นอยู่กับสถานการณ์ปัจจุบันเรียกว่า กลยุทธ์. ผู้เล่นแต่ละคนมีชุดกลยุทธ์เฉพาะ หากจำนวนกลยุทธ์มีจำกัด เกมจะเรียกว่า สุดยอด, มิฉะนั้น - ไม่มีที่สิ้นสุด . กลยุทธ์ที่เรียกว่า สะอาด ถ้าผู้เล่นแต่ละคนเลือกเพียงหนึ่งกลยุทธ์ในวิธีที่แน่นอนและไม่ใช่แบบสุ่ม

โซลูชันเกมคือการเลือกกลยุทธที่โดนใจ สภาวะที่เหมาะสมที่สุด เงื่อนไขนี้คือผู้เล่นคนหนึ่งได้รับ ชนะสูงสุด, ถ้าคนที่สองปฏิบัติตามกลยุทธ์ของเขา ในทางกลับกัน ผู้เล่นคนที่สองจะได้รับ ขาดทุนน้อยที่สุด, ถ้าผู้เล่นคนแรกยึดติดกับกลยุทธ์ของเขา กลยุทธ์ดังกล่าวเรียกว่า เหมาะสมที่สุด . ทางนี้, เป้าหมายของเกมคือการกำหนดกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่นแต่ละคน

เกมกลยุทธ์ล้วนๆ

พิจารณาเกมที่มีผู้เล่นสองคน แต่และ ใน.สมมติว่าผู้เล่น แต่มันมี กลยุทธ์ А 1, А 2, ..., А mและเครื่องเล่น ในมันมี กลยุทธ์ บี 1 บี 2 ... บี น.เราจะถือว่าทางเลือกของผู้เล่น แต่กลยุทธ์ ฉันและเครื่องเล่น ในกลยุทธ์ บี เจกำหนดผลลัพธ์ของเกมโดยเฉพาะเช่น กำไร อิจผู้เล่น แต่และชนะ บีอิจผู้เล่น ใน.ที่นี่ ผม = 1,2, ..., ม., เจ = 1,2, ..., น.

เกมที่ง่ายที่สุดมีผู้เล่นสองคนเป็นเกมที่เป็นปฏิปักษ์ , เหล่านั้น เกมที่ผลประโยชน์ของผู้เล่นอยู่ตรงข้ามกัน ในกรณีนี้ ค่าตอบแทนของผู้เล่นสัมพันธ์กันด้วยความเท่าเทียมกัน

b ij = -a ij

ความเท่าเทียมกันนี้หมายความว่าการได้รับของผู้เล่นคนใดคนหนึ่งเท่ากับการสูญเสียของอีกคนหนึ่ง ในกรณีนี้ก็เพียงพอที่จะพิจารณาเฉพาะผลตอบแทนของผู้เล่นคนหนึ่งเช่นผู้เล่น แต่.

กลยุทธ์แต่ละคู่ ฉันและ บี เจตรงกับชัยชนะ อิจผู้เล่น แต่.สะดวกในการเขียนเงินรางวัลทั้งหมดเหล่านี้ในรูปแบบของสิ่งที่เรียกว่า เมทริกซ์การชำระเงิน

แถวของเมทริกซ์นี้สอดคล้องกับกลยุทธ์ของผู้เล่น แต่,และคอลัมน์สำหรับกลยุทธ์ของผู้เล่น ใน.โดยทั่วไปแล้วเกมดังกล่าวจะเรียกว่า (m × n) -เกม.


ตัวอย่างที่ 1ผู้เล่นสองคน แต่และ ในโยนเหรียญ ถ้าด้านของเหรียญตรงกันก็ชนะ แต่กล่าวคือ ผู้เล่น ในจ่ายผู้เล่น แต่ผลรวมเท่ากับ 1 และหากไม่ตรงกัน ผู้เล่น B จะชนะ นั่นคือ ในทางตรงกันข้ามผู้เล่น แต่จ่ายผู้เล่น ในเท่ากัน , เท่ากัน 1. สร้างเมทริกซ์การชำระเงิน

การตัดสินใจตามสภาพของปัญหา

© 2021 skudelnica.ru - ความรัก, การทรยศ, จิตวิทยา, การหย่าร้าง, ความรู้สึก, การทะเลาะวิวาท