เกมกลยุทธ์ที่บริสุทธิ์ เอเลน่า เวนท์เซล

บ้าน / ทะเลาะกัน

ทฤษฎีเกมกลยุทธ์ผสม

กลยุทธ์ผสม

หากในเกมเมทริกซ์ไม่มีจุดอานในกลยุทธ์ที่บริสุทธิ์ จะพบราคาบนและล่างของเกม พวกเขาแสดงให้เห็นว่าผู้เล่น 1 จะไม่ได้รับชัยชนะที่เกินราคาเกมบน และผู้เล่นที่ 1 รับประกันการชนะที่ไม่ต่ำกว่าราคาเกมที่ต่ำกว่า

กลยุทธ์แบบผสมของผู้เล่นคือชุดกลยุทธ์ที่สมบูรณ์ของเขา โดยมีการทำซ้ำหลาย ๆ เกมภายใต้เงื่อนไขเดียวกันกับความน่าจะเป็นที่กำหนด มาสรุปสิ่งที่กล่าวและระบุเงื่อนไขการใช้งาน กลยุทธ์ผสม:

  • * เล่นโดยไม่มีจุดอาน
  • * ผู้เล่นใช้กลยุทธ์ผสมแบบสุ่มโดยมีความน่าจะเป็นที่กำหนด
  • * เกมซ้ำหลายครั้งในเงื่อนไขที่คล้ายคลึงกัน
  • * ในแต่ละการเคลื่อนไหวจะไม่มีใครแจ้งเกี่ยวกับการเลือกกลยุทธ์โดยผู้เล่นอื่น
  • * อนุญาตให้ใช้ค่าเฉลี่ยของผลลัพธ์ของเกม

ใช้สัญกรณ์ต่อไปนี้สำหรับกลยุทธ์แบบผสม

สำหรับผู้เล่น 1 กลยุทธ์แบบผสมประกอบด้วยการใช้กลยุทธ์บริสุทธิ์ A 1, A 2, ..., A m ที่มีความน่าจะเป็นที่สอดคล้องกัน p 1, p 2, ..., p m

สำหรับผู้เล่น2

q j คือความน่าจะเป็นของการใช้กลยุทธ์บริสุทธิ์ B j

ในกรณีที่ р i = 1 สำหรับผู้เล่น 1 เรามีกลยุทธ์ที่บริสุทธิ์

กลยุทธ์ที่บริสุทธิ์ของผู้เล่นเป็นเพียงเหตุการณ์ที่ไม่สอดคล้องกันเท่านั้น ในเกมเมทริกซ์ การรู้เมทริกซ์ A (ใช้กับทั้งผู้เล่น 1 และผู้เล่น 2) สามารถกำหนดได้ ให้เวกเตอร์และผลตอบแทนเฉลี่ย ( มูลค่าที่คาดหวังผล) ของผู้เล่น 1:

ที่ไหนและเป็นเวกเตอร์

pi และ q i เป็นองค์ประกอบของเวกเตอร์

ด้วยการใช้กลยุทธ์แบบผสม ผู้เล่น 1 พยายามที่จะเพิ่มผลตอบแทนโดยเฉลี่ยสูงสุด และผู้เล่นที่ 2 - เพื่อให้เอฟเฟกต์นี้มีค่าต่ำสุดที่เป็นไปได้ ผู้เล่น 1 พยายามที่จะบรรลุ

ผู้เล่น 2 ทำให้แน่ใจว่าตรงตามเงื่อนไข

ให้เราระบุเวกเตอร์ที่สอดคล้องกับกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 1 และ 2 นั่นคือ เวกเตอร์ดังกล่าวและความเท่าเทียมกัน

ราคาของเกมคือผลตอบแทนเฉลี่ยของผู้เล่น 1 เมื่อผู้เล่นทั้งสองใช้กลยุทธ์แบบผสม ดังนั้น วิธีแก้ปัญหาของเกมเมทริกซ์คือ:

  • - กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 1;
  • - กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น 2;

ราคาเกม.

กลยุทธ์แบบผสมจะเหมาะสมที่สุด (และ) หากพวกเขาสร้างจุดอานสำหรับฟังก์ชันเช่น

มีทฤษฎีบทพื้นฐานสำหรับเกมคณิตศาสตร์

สำหรับเกมเมทริกซ์ที่มีเมทริกซ์ A ใดๆ ปริมาณ

มีอยู่และเท่าเทียมกัน: = =.

ควรสังเกตว่าเมื่อเลือกกลยุทธ์ที่เหมาะสม ผู้เล่นที่ 1 จะรับประกันผลตอบแทนเฉลี่ยเสมอ ไม่น้อยกว่าราคาเกม สำหรับกลยุทธ์คงที่ของผู้เล่น 2 (และในทางกลับกัน สำหรับผู้เล่น 2) กลยุทธ์เชิงรุกของผู้เล่น 1 และ 2 เป็นกลยุทธ์ที่เป็นส่วนหนึ่งของกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นที่เกี่ยวข้องซึ่งมีความน่าจะเป็นไม่เป็นศูนย์ ซึ่งหมายความว่าองค์ประกอบของกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นอาจไม่รวมกลยุทธ์เฉพาะที่กำหนดไว้ล่วงหน้าทั้งหมด

การแก้ปัญหาเกมหมายถึงการหาราคาของเกมและกลยุทธ์ที่เหมาะสมที่สุด เราเริ่มพิจารณาวิธีการเพื่อค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ด้วย เกมที่ง่ายที่สุดอธิบายโดยเมทริกซ์ 22 เกมจุดอานจะไม่ได้รับการพิจารณาเป็นพิเศษ หากได้จุดอานแล้ว แสดงว่ามีกลยุทธ์ที่ไม่เป็นประโยชน์ที่ควรละทิ้ง ในกรณีที่ไม่มีจุดอาน สามารถรับสองกลยุทธ์แบบผสมที่เหมาะสมที่สุดได้ ตามที่ระบุไว้ กลยุทธ์แบบผสมเหล่านี้เขียนดังนี้:

จึงมีเมทริกซ์การชำระเงิน

11 p 1 + 21 p 2 =; (1.16)

a 12 p 1 + a 22 p 2 =; (1.17)

p 1 + p 2 = 1 (1.18)

11 p 1 + a 21 (1 - p 1) = a 12 p 1 + a 22 (1 - p 1); (1.19)

11 p 1 + a 21 - a 21 p 1 = a 12 p 1 + a 22 - a 22 p 1, (1.20)

ดังนั้นเราจึงได้รับค่าที่เหมาะสมและ:

เมื่อรู้และเราพบว่า:

เมื่อคำนวณแล้วเราพบและ:

11 q 1 + 12 q 2 =; q 1 + q 2 = 1; (1.24)

11 q 1 + a 12 (1 - q 1) = (1.25)

สำหรับ 11 ถึง 12 (1.26)

ปัญหาได้รับการแก้ไขแล้วเนื่องจากพบเวกเตอร์และราคาของเกมแล้ว การมีเมทริกซ์การชำระเงิน A ทำให้สามารถแก้ปัญหาแบบกราฟิกได้ ด้วยวิธีนี้ อัลกอริธึมการแก้ปัญหานั้นง่ายมาก (รูปที่ 2.1)

  • 1. ส่วนของความยาวหน่วยถูกพล็อตตามแกน abscissa
  • 2 ดุลยพินิจคือเงินรางวัลสำหรับกลยุทธ์ A 1
  • 3. บนเส้นขนานกับแกนพิกัด ที่จุดที่ 1 เงินรางวัลจะถูกฝากด้วยกลยุทธ์ a 2
  • 4. ส่วนปลายของเซ็กเมนต์ถูกกำหนดสำหรับ 11 -b 11, 12 -b 21, a 22 -b 22, 21 -b 12 และเส้นตรงสองเส้น b 11 b 12 และ b 21 b 22
  • 5. กำหนดพิกัดของจุดตัดด้วย มันเท่ากัน abscissa ของจุด c เท่ากับ p 2 (p 1 = 1 - p 2)

ข้าว. 1.1.

วิธีนี้มีพื้นที่ใช้งานค่อนข้างกว้าง นี้จะขึ้นอยู่กับ ทรัพย์สินส่วนกลางเกม mn ซึ่งประกอบด้วยข้อเท็จจริงที่ว่าในเกม mn ผู้เล่นแต่ละคนมีกลยุทธ์แบบผสมที่เหมาะสมที่สุด ซึ่งจำนวนกลยุทธ์ที่แท้จริงจะอยู่ที่ต่ำสุด (m, n) จากคุณสมบัตินี้ คุณจะได้รับผลลัพธ์ที่เป็นที่รู้จัก: ในเกม 2n และ m2 ใดๆ กลยุทธ์ที่เหมาะสมที่สุดแต่ละกลยุทธ์จะมีกลยุทธ์ที่ทำงานอยู่ไม่เกินสองกลยุทธ์ ดังนั้นเกม 2n และ m2 ใด ๆ ก็สามารถลดลงเป็นเกมที่ 22 ดังนั้นเกม 2n และ m2 สามารถแก้ไขได้แบบกราฟิก หากเมทริกซ์ของเกมที่มีขอบเขตจำกัดมีมิติ mn โดยที่ m> 2 และ n> 2 จะใช้โปรแกรมเชิงเส้นเพื่อกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุด

5. ทฤษฎีเกมและวิธีแก้ปัญหาทางสถิติ

5.1. เกมเมทริกซ์ผลรวมศูนย์

การสร้างแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ดำเนินการในเงื่อนไขต่อไปนี้:

ความแน่นอน;

ความไม่แน่นอน

การสร้างแบบจำลอง ในเรื่องความแน่นอน ถือว่ามีข้อมูลเชิงบรรทัดฐานเริ่มต้นที่จำเป็นทั้งหมด (การสร้างแบบจำลองเมทริกซ์ การวางแผนเครือข่ายและการจัดการ)

การสร้างแบบจำลอง มีความเสี่ยง ดำเนินการด้วยความไม่แน่นอนแบบสุ่มเมื่อค่าของข้อมูลเริ่มต้นบางส่วนเป็นแบบสุ่มและรู้กฎการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเหล่านี้ (การวิเคราะห์การถดถอย ทฤษฎีการจัดคิว)

การสร้างแบบจำลอง ท่ามกลางความไม่แน่นอน สอดคล้องกับ ขาดอย่างสมบูรณ์ข้อมูลที่จำเป็นสำหรับสิ่งนี้ (ทฤษฎีเกม)

ตัวแบบทางคณิตศาสตร์เพื่อการตัดสินใจที่เหมาะสมที่สุดใน สถานการณ์ความขัดแย้งถูกสร้างในสภาวะที่ไม่แน่นอน

ในทฤษฎีเกม ใช้แนวคิดพื้นฐานต่อไปนี้:

กลยุทธ์;

ฟังก์ชั่นที่ชนะ

โดยหลักสูตร เราจะเรียกตัวเลือกและการดำเนินการโดยผู้เล่นในการดำเนินการอย่างใดอย่างหนึ่งที่กำหนดโดยกฎของเกม

กลยุทธ์ เป็นเทคโนโลยีในการเลือกแนวทางปฏิบัติในแต่ละการเคลื่อนไหวขึ้นอยู่กับสถานการณ์ปัจจุบัน

ฟังก์ชันวิน ทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ

ในเกมเมทริกซ์ ฟังก์ชันการจ่ายเงินจะแสดงเป็น เมทริกซ์การชำระเงิน :

จำนวนเงินที่จ่ายให้กับผู้เล่น I ที่เลือกการย้ายจากผู้เล่น II ที่เลือกการย้ายคือที่ไหน

ในเกมคู่นี้ ค่าของฟังก์ชันการจ่ายเงินของผู้เล่นทั้งสองในแต่ละสถานการณ์จะมีขนาดเท่ากันและตรงข้ามกันในเครื่องหมายเช่น และเกมนี้มีชื่อว่า ผลรวมศูนย์ .

กระบวนการของ "การเล่นเกมเมทริกซ์" มีดังต่อไปนี้:

มีการตั้งค่าเมทริกซ์การชำระเงิน

ผู้เล่น I โดยไม่ขึ้นกับผู้เล่น II จะเลือกแถวใดแถวหนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น th;

ผู้เล่น II ไม่ว่าผู้เล่น I จะเลือกคอลัมน์ใดคอลัมน์หนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น - th;

องค์ประกอบของเมทริกซ์กำหนดจำนวนผู้เล่นที่ฉันจะได้รับจากผู้เล่น II แน่นอน ถ้าอย่างนั้น มันมาเกี่ยวกับการสูญเสียที่แท้จริงของผู้เล่น I.

เกมจับคู่ที่เป็นปฏิปักษ์กับเมทริกซ์ผลตอบแทนจะเรียกว่าเกม

ตัวอย่าง

พิจารณาเกม

มีการตั้งค่าเมทริกซ์การชำระเงิน:

.

ให้ผู้เล่น I โดยไม่ขึ้นกับผู้เล่น II เลือกแถวที่ 3 ของเมทริกซ์นี้ และผู้เล่น II โดยไม่ขึ้นกับผู้เล่น I เลือกคอลัมน์ที่ 2 ของเมทริกซ์นี้:

จากนั้นผู้เล่น I จะได้รับ 9 หน่วยจากผู้เล่น II

5.2. กลยุทธ์ที่สะอาดที่สุดในเกมเมทริกซ์

กลยุทธ์ที่เหมาะสมที่สุด เป็นกลยุทธ์ของผู้เล่น I โดยที่เขาไม่ได้ลดกำไรของเขาสำหรับการเลือกกลยุทธ์ใดๆ โดยผู้เล่น II และกลยุทธ์ของผู้เล่น II ที่เขาไม่เพิ่มการสูญเสียของเขาสำหรับการเลือกกลยุทธ์ใดๆ ของผู้เล่น I

การเลือกแถวที่ th ของเมทริกซ์ผลตอบแทนเป็นการเคลื่อนไหว ผู้เล่น I มั่นใจว่าตัวเองจะได้รับผลตอบแทนอย่างน้อยตามมูลค่าในกรณีที่เลวร้ายที่สุด เมื่อผู้เล่น II พยายามลดค่านี้ให้เหลือน้อยที่สุด ดังนั้นผู้เล่นฉันจะเลือกแถวดังกล่าวที่จะให้เขา ชนะสูงสุด:

.

ผู้เล่น II โต้แย้งในลักษณะเดียวกันและสามารถป้องกันการสูญเสียน้อยที่สุดได้อย่างแน่นอน:

.

ความไม่เท่าเทียมกันเป็นจริงเสมอ:

ปริมาณเรียกว่า ราคาต่ำสุดเกม .

ปริมาณเรียกว่า ราคาสูงสุดของเกม .

กลยุทธ์ที่เหมาะสมเรียกว่า ทำความสะอาด หากพวกเขาตอบสนองความเท่าเทียมกัน:

,

.

ปริมาณเรียกว่า ราคาที่แท้จริงของเกม , ถ้า .

กลยุทธ์และรูปแบบบริสุทธิ์ที่เหมาะสมที่สุด จุดอาน เมทริกซ์การชำระเงิน

สำหรับจุดอานจะเป็นไปตามเงื่อนไขต่อไปนี้:

นั่นคือองค์ประกอบจะเล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์

ดังนั้น หากเมทริกซ์ผลตอบแทนมี จุดอาน แล้วคุณจะพบ กลยุทธ์การทำความสะอาดที่เหมาะสมที่สุด ผู้เล่น

กลยุทธ์ที่บริสุทธิ์ของผู้เล่น I สามารถแสดงได้ด้วยชุดตัวเลข (เวกเตอร์) ที่เรียงลำดับ ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในหลักที่ th ซึ่งเท่ากับหนึ่ง

กลยุทธ์ที่บริสุทธิ์ของผู้เล่น II สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในหลักที่ th ซึ่งเท่ากับหนึ่ง

ตัวอย่าง

.

โดยการเลือกแถวใดๆ ของเมทริกซ์การจ่ายผลตอบแทน ผู้เล่นฉันมั่นใจว่าตัวเองจะได้รับผลตอบแทนในกรณีที่เลวร้ายที่สุดอย่างน้อยมูลค่าในคอลัมน์ที่ระบุโดย:

ดังนั้น ผู้เล่นฉันจะเลือกแถวที่ 2 ของเมทริกซ์การจ่ายเงิน ซึ่งให้ผลตอบแทนสูงสุดแก่เขาโดยไม่คำนึงถึงการเคลื่อนไหวของผู้เล่น II ซึ่งจะพยายามลดค่านี้ให้น้อยที่สุด:

ผู้เล่น II คิดเช่นเดียวกันและเลือกคอลัมน์ที่ 1 เป็นการเคลื่อนไหวของเขา:

ดังนั้นจึงมีจุดอานของเมทริกซ์การชำระเงิน:

สอดคล้องกับกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น I และสำหรับผู้เล่น II ซึ่งผู้เล่น I จะไม่ลดกำไรของเขาสำหรับการเปลี่ยนแปลงใดๆ ในกลยุทธ์โดยผู้เล่น II และผู้เล่น II จะไม่เพิ่มการสูญเสียของเขาสำหรับการเปลี่ยนแปลงในกลยุทธ์โดยผู้เล่น I

5.3. กลยุทธ์ผสมที่เหมาะสมที่สุดในเกมเมทริกซ์

หากเมทริกซ์ผลตอบแทนไม่มีจุดอาน ก็ไม่มีเหตุผลสำหรับผู้เล่นที่จะใช้กลยุทธ์เพียงอย่างเดียว มันทำกำไรได้มากกว่าที่จะใช้ "สารผสมความน่าจะเป็น" กลยุทธ์ที่บริสุทธิ์ จากนั้น กลยุทธ์แบบผสมแล้วจะถูกกำหนดเป็นกลยุทธ์ที่เหมาะสมที่สุด

กลยุทธ์ผสม ของผู้เล่นมีลักษณะเฉพาะโดยการแจกแจงความน่าจะเป็นของเหตุการณ์สุ่มซึ่งประกอบด้วยการเลือกการย้ายโดยผู้เล่นรายนี้

กลยุทธ์ผสมของผู้เล่น I เป็นชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ที่ตรงตามเงื่อนไขสองประการ:

1) สำหรับนั่นคือความน่าจะเป็นของการเลือกแต่ละแถวของเมทริกซ์การชำระเงินนั้นไม่เป็นค่าลบ

2) นั่นคือ ตัวเลือกของแต่ละแถวของเมทริกซ์การชำระเงินในผลรวมหมายถึง เต็มกลุ่มเหตุการณ์

กลยุทธ์ผสมของผู้เล่น II คือชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) เป็นไปตามเงื่อนไข:

จำนวนเงินที่ชำระ ให้กับผู้เล่น I ที่ได้เลือกกลยุทธ์แบบผสม

จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสม

,

หมายถึงค่าเฉลี่ย

.

เหมาะสมที่สุด เรียกว่ากลยุทธ์ผสม

และ ,

ถ้าสำหรับกลยุทธ์ผสมตามอำเภอใจใด ๆ และเป็นไปตามเงื่อนไข:

นั่นคือ ภายใต้กลยุทธ์แบบผสมที่เหมาะสมที่สุด ผลตอบแทนของผู้เล่น I จะมากที่สุด และการสูญเสียผู้เล่น II จะน้อยที่สุด

หากไม่มีจุดอานในเมทริกซ์ผลตอบแทน แล้ว

,

กล่าวคือ มีความแตกต่างในเชิงบวก ( ส่วนต่างที่ไม่ได้จัดสรร )

- ³ 0,

และผู้เล่นจำเป็นต้องมองหาโอกาสเพิ่มเติมเพื่อรับส่วนแบ่งที่มากขึ้นของความแตกต่างนี้อย่างมั่นใจ

ตัวอย่าง

พิจารณาเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน:

.

ตรวจสอบว่ามีจุดอานหรือไม่:

, .

ปรากฎว่าไม่มีจุดอานในเมทริกซ์ผลตอบแทนและผลต่างที่ไม่ได้ปันส่วนจะเท่ากับ:

.

5.4. ค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุด

สำหรับเกม 2 × 2

การกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเมทริกซ์การชำระเงินในมิตินั้นดำเนินการโดยวิธีการหาจุดที่เหมาะสมที่สุดของฟังก์ชันของตัวแปรสองตัว

ให้ความน่าจะเป็นของผู้เล่นที่ฉันเลือกแถวแรกของเมทริกซ์การชำระเงิน

มีค่าเท่ากัน แล้วความน่าจะเป็นที่จะเลือกแถวที่สองคือ

ให้ความน่าจะเป็นของผู้เล่น II เลือกคอลัมน์แรกเท่ากับ ความน่าจะเป็นที่จะเลือกคอลัมน์ที่สองคือ

จำนวนเงินที่จ่ายให้กับผู้เล่น I โดยผู้เล่น II เท่ากับ:

มูลค่าสูงสุดของการเพิ่มของผู้เล่น I และการสูญเสียผู้เล่น II สอดคล้องกับเงื่อนไข:

;

.

ดังนั้น กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I และ II เท่ากับ:

5.5. วิธีแก้ปัญหาทางเรขาคณิตของเกม 2 ×

ด้วยการเพิ่มมิติของเมทริกซ์ผลตอบแทนจาก เป็น ถึง เป็นไปไม่ได้อีกต่อไปที่จะลดการกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดเพื่อค้นหาฟังก์ชันที่เหมาะสมที่สุดของสองตัวแปร อย่างไรก็ตาม เนื่องจากผู้เล่นคนใดคนหนึ่งมีเพียงสองกลยุทธ์ จึงสามารถใช้โซลูชันทางเรขาคณิตได้

ขั้นตอนหลักในการหาวิธีแก้ปัญหาของเกมมีดังนี้

ให้เราแนะนำระบบพิกัดบนเครื่องบิน วาดส่วนบนแกน วาดเส้นตั้งฉากจากปลายด้านซ้ายและขวาของส่วนนี้


ปลายด้านซ้ายและขวาของส่วนหน่วยสอดคล้องกับสองกลยุทธ์และพร้อมใช้งานสำหรับผู้เล่น I ในแนวตั้งฉากที่วาดออกมา เราจะเลื่อนการชนะของผู้เล่นรายนี้ออกไป ตัวอย่างเช่น สำหรับเมทริกซ์การชำระเงิน


ผลตอบแทนดังกล่าวของผู้เล่น I เมื่อเลือกกลยุทธ์จะเป็น และ และเมื่อเลือกกลยุทธ์จะเป็น และ

ให้เราเชื่อมต่อโดยการแบ่งส่วนเส้นตรงจุดจ่ายของผู้เล่น I ที่สอดคล้องกับกลยุทธ์ของผู้เล่น II จากนั้นเส้นแบ่งที่เกิดขึ้นซึ่งล้อมรอบกราฟจากด้านล่างจะกำหนดขอบเขตล่างของผลตอบแทนของผู้เล่น I



ค้นหากลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I

,

ซึ่งสอดคล้องกับจุดบนขอบเขตล่างของการจ่ายเงินของผู้เล่น I ด้วยพิกัดสูงสุด

โปรดทราบว่าในตัวอย่างที่กำลังพิจารณา ใช้เพียงสองกลยุทธ์และสอดคล้องกับเส้นตรงที่ตัดกันที่จุดที่พบบนขอบเขตล่างของผลตอบแทนของผู้เล่น I ผู้เล่น II สามารถป้องกันไม่ให้ผู้เล่น I ได้รับผลตอบแทนที่มากขึ้น

ดังนั้นเกมจะลดลงเป็นเกมและกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II ในตัวอย่างที่พิจารณาจะเป็น

,

โดยจะพบความน่าจะเป็นในลักษณะเดียวกับในเกม:

5.6. โซลูชันเกม×

หากเกมเมทริกซ์ไม่มีวิธีแก้ปัญหาในกลยุทธ์ล้วนๆ (เช่น ไม่มีจุดอาน) และเนื่องจากเมทริกซ์ผลตอบแทนมีขนาดใหญ่จึงไม่สามารถแก้ไขได้แบบกราฟิก เพื่อให้ได้วิธีแก้ปัญหา ให้ใช้ วิธีการเขียนโปรแกรมเชิงเส้น .

ให้เมทริกซ์ผลตอบแทนของมิติได้รับ:

.

ต้องหาความน่าจะเป็น โดยผู้เล่นคนใดที่ฉันต้องเลือกการเคลื่อนไหวของเขาเพื่อให้กลยุทธ์แบบผสมนี้รับประกันว่าเขาจะได้รับผลตอบแทนอย่างน้อยที่สุดโดยไม่คำนึงถึงทางเลือกของการเคลื่อนไหวโดยผู้เล่น II

สำหรับการย้ายแต่ละครั้งที่เลือกโดยผู้เล่น II ผลตอบแทนของผู้เล่น I จะพิจารณาจากการขึ้นต่อกัน:

เราหารอสมการทั้งสองข้างด้วยและแนะนำสัญลักษณ์ใหม่:

ความเท่าเทียมกัน

จะใช้แบบฟอร์ม:

เนื่องจากผู้เล่นที่ฉันพยายามที่จะเพิ่มผลตอบแทนสูงสุด การแลกเปลี่ยนซึ่งกันและกันจะต้องถูกย่อให้เล็กสุด จากนั้นปัญหาการเขียนโปรแกรมเชิงเส้นสำหรับผู้เล่นที่ฉันใช้แบบฟอร์ม:

มีข้อจำกัด

ในทำนองเดียวกัน ปัญหาสำหรับผู้เล่น II ถูกสร้างขึ้นเป็นคู่:

มีข้อจำกัด

การแก้ปัญหาโดยใช้วิธีซิมเพล็กซ์ เราได้รับ:

,

5.7. คุณสมบัติของการแก้เกมเมทริกซ์

ก่อนแก้ปัญหาการหากลยุทธ์ที่เหมาะสม ควรตรวจสอบสองเงื่อนไข:

เป็นไปได้ไหมที่จะทำให้เมทริกซ์การชำระเงินง่ายขึ้น

เมทริกซ์การชำระเงินมีจุดอานหรือไม่

พิจารณาความเป็นไปได้ของการลดความซับซ้อนของเมทริกซ์การชำระเงิน:

เนื่องจากผู้เล่นที่ฉันพยายามที่จะได้รับ ชัยชนะที่ยิ่งใหญ่ที่สุดจากนั้นคุณสามารถขีดฆ่าบรรทัดที่ออกจากเมทริกซ์การชำระเงิน เนื่องจากเขาจะไม่ใช้การย้ายนี้หากความสัมพันธ์ต่อไปนี้เป็นที่พอใจกับแถวอื่น:

ในทำนองเดียวกัน การดิ้นรนเพื่อการสูญเสียที่น้อยที่สุด ผู้เล่น II จะไม่เลือกคอลัมน์ ith ในเมทริกซ์การจ่ายเงินเป็นการเคลื่อนไหว และคอลัมน์นี้สามารถถูกขีดฆ่าได้หากความสัมพันธ์ต่อไปนี้มีกับคอลัมน์ ith อื่น:

ที่สุด วิธีแก้ปัญหาง่ายๆเกมคือการมีอยู่ในเมทริกซ์การชำระเงินแบบง่ายของจุดอานที่ตรงตามเงื่อนไขต่อไปนี้ (ตามคำจำกัดความ):

ตัวอย่าง

กำหนดเมทริกซ์การชำระเงิน:

.

การลดความซับซ้อนของเมทริกซ์การชำระเงิน:

จุดอาน:

5.8. เล่นกับธรรมชาติ

ตรงกันข้ามกับปัญหาของทฤษฎีเกมใน ปัญหาทางทฤษฎี การตัดสินใจทางสถิติ สถานการณ์ที่ไม่แน่นอนไม่มีความขัดแย้งที่เป็นปฏิปักษ์และขึ้นอยู่กับความเป็นจริงตามวัตถุประสงค์ซึ่งมักจะเรียกว่า "ธรรมชาติ" .

ในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ ผู้เล่น II จะเล่นโดยปัจจัยที่ไม่แน่นอนซึ่งส่งผลต่อประสิทธิภาพของการตัดสินใจ

เกมเมทริกซ์ที่มีธรรมชาติแตกต่างจากเกมเมทริกซ์ทั่วไปตรงที่ เมื่อเลือกกลยุทธ์ที่เหมาะสม ผู้เล่นไม่สามารถถูกชี้นำโดยข้อเท็จจริงที่ว่าผู้เล่น II จะพยายามลดการสูญเสียของเขาให้เหลือน้อยที่สุด ดังนั้น ควบคู่ไปกับเมทริกซ์การชำระเงิน เราขอแนะนำ เมทริกซ์ความเสี่ยง :

ค่าความเสี่ยงของผู้เล่น I อยู่ที่ไหนเมื่อใช้การเคลื่อนไหวภายใต้เงื่อนไขเท่ากับส่วนต่าง ระหว่างผลตอบแทนที่ผู้เล่นจะได้รับ ถ้าเขารู้ว่าเงื่อนไขจะถูกสร้างขึ้น กล่าวคือ และเงินรางวัลที่เขาจะได้รับโดยไม่รู้ว่าเมื่อเลือกย้ายแล้วจะมีการกำหนดเงื่อนไข

ดังนั้นเมทริกซ์ผลตอบแทนจึงถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไม่น่าสงสัย และการแปลงแบบย้อนกลับมีความคลุมเครือ

ตัวอย่าง

เมทริกซ์ผลตอบแทน:

.

เมทริกซ์ความเสี่ยง:

เป็นไปได้ สองประโยคปัญหา เกี่ยวกับการเลือกวิธีแก้ปัญหา ในเกมเมทริกซ์กับธรรมชาติ :

เพิ่มเงินรางวัลของคุณให้สูงสุด

ลดความเสี่ยง

ปัญหาการตัดสินใจสามารถเกิดขึ้นได้จากสองเงื่อนไข:

- มีความเสี่ยง เมื่อทราบฟังก์ชันการกระจายความน่าจะเป็นของกลยุทธ์ของธรรมชาติ ตัวอย่างเช่น ค่าสุ่มของการเกิดขึ้นของแต่ละสถานการณ์ทางเศรษฐกิจที่สมมติขึ้น

- ท่ามกลางความไม่แน่นอน เมื่อไม่ทราบฟังก์ชันการกระจายความน่าจะเป็นดังกล่าว

5.9. การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติ

มีความเสี่ยง

เมื่อทำการตัดสินใจภายใต้สภาวะเสี่ยง ผู้เล่นทราบความน่าจะเป็น การเริ่มต้นของสถานะของธรรมชาติ

จากนั้นจึงเป็นการสมควรสำหรับผู้เล่นที่ 1 เลือกกลยุทธ์ที่ เงินรางวัลเฉลี่ยต่อบรรทัด สูงสุด :

.

เมื่อแก้ปัญหานี้ด้วยเมทริกซ์ความเสี่ยง เราจะได้โซลูชันเดียวกันกับ ความเสี่ยงเฉลี่ยขั้นต่ำ :

.

5.10. การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติ

ท่ามกลางความไม่แน่นอน

ในการตัดสินใจภายใต้สภาวะที่ไม่แน่นอน คุณสามารถใช้สิ่งต่อไปนี้ได้ เกณฑ์ :

เกณฑ์ Maximin ของ Wald;

เกณฑ์ ความเสี่ยงน้อยที่สุดเซวิจา;

เกณฑ์สำหรับการมองโลกในแง่ร้ายคือการมองโลกในแง่ดีของ Hurwitz;

หลักการของ Laplace ไม่เพียงพอ

พิจารณา การทดสอบแม็กซิมินของ Wald .

เกมที่มีลักษณะเป็นธรรมชาตินั้นเล่นร่วมกับคู่ต่อสู้ที่ก้าวร้าวที่สมเหตุสมผล นั่นคือ วิธีการประกันต่อจะดำเนินการจากตำแหน่งที่มองโลกในแง่ร้ายอย่างรุนแรงสำหรับเมทริกซ์การชำระเงิน:

.

พิจารณา เกณฑ์ความเสี่ยงขั้นต่ำของอำมหิต .

แนวทางที่คล้ายกับวิธีก่อนหน้าจากตำแหน่งของการมองโลกในแง่ร้ายที่รุนแรงสำหรับเมทริกซ์ความเสี่ยง:

.

พิจารณา เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของHurwitz .

มีการเสนอโอกาสที่จะไม่ถูกชี้นำโดยการมองโลกในแง่ร้ายสุดโต่งหรือการมองโลกในแง่ดีอย่างสุดขั้ว:

ระดับของการมองโลกในแง่ร้ายอยู่ที่ไหน

ใน - การมองโลกในแง่ดีสุดขีด

ใน - การมองโลกในแง่ร้ายสุดขีด

พิจารณา หลักการของลาปลาซเรื่องพื้นฐานไม่เพียงพอ .

เป็นที่เชื่อกันว่าสภาวะธรรมชาติทั้งหมดมีโอกาสเท่าเทียมกัน:

,

.

บทสรุปในส่วนที่ห้า

ผู้เล่นสองคนมีส่วนร่วมในเกมเมทริกซ์ และฟังก์ชันการจ่ายเงิน ซึ่งทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ จะแสดงในรูปแบบของเมทริกซ์การจ่ายเงิน ตกลงกันว่าผู้เล่นที่ฉันเลือกแถวหนึ่งของเมทริกซ์ผลตอบแทนเป็นการย้าย และผู้เล่น II เลือกคอลัมน์ใดคอลัมน์หนึ่ง จากนั้น ที่จุดตัดของแถวและคอลัมน์ที่เลือกของเมทริกซ์นี้ มีค่าตัวเลขของการชำระเงินให้กับผู้เล่น I จากผู้เล่น II (หากค่านี้เป็นค่าบวก ผู้เล่นที่ฉันชนะจริง ๆ และหากเป็นค่าลบ แสดงว่าผู้เล่น II ชนะเป็นหลัก)

หากมีจุดอานในเมทริกซ์ผลตอบแทน ผู้เล่นมีกลยุทธ์ที่ดีที่สุด นั่นคือ เพื่อที่จะชนะ แต่ละคนจะต้องทำซ้ำการเคลื่อนไหวที่เหมาะสมที่สุดของเขาในครั้งเดียว หากไม่มีจุดอาน เพื่อที่จะชนะ แต่ละคนต้องใช้กลยุทธ์ผสมที่เหมาะสม นั่นคือ ใช้ท่าผสม ซึ่งแต่ละท่าจะต้องดำเนินการด้วยความน่าจะเป็นที่เหมาะสมที่สุด

การค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2 ดำเนินการโดยการคำนวณความน่าจะเป็นที่เหมาะสมที่สุดโดยใช้สูตรที่ทราบ ทาง โซลูชันทางเรขาคณิตสำหรับเกม 2 × n เกม คำจำกัดความของกลยุทธ์แบบผสมที่เหมาะสมที่สุดในเกมจะลดลงเป็นการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2 ในการแก้ปัญหา m × n เกม ใช้วิธีการเขียนโปรแกรมเชิงเส้นเพื่อค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด

เมทริกซ์การชำระเงินบางตัวช่วยให้เข้าใจง่าย ซึ่งเป็นผลมาจากการที่มิติข้อมูลลดลงโดยการลบแถวและคอลัมน์ที่สอดคล้องกับการเคลื่อนไหวที่ไม่คาดฝัน

หากผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งขึ้นอยู่กับความเป็นจริงของวัตถุและไม่มีสีแห่งความขัดแย้งที่เป็นปรปักษ์กัน เกมดังกล่าวจะเรียกว่าเกมที่มีธรรมชาติ และปัญหาของทฤษฎีการตัดสินใจทางสถิติจะถูกนำมาใช้ในการแก้ปัญหา จากนั้นพร้อมกับเมทริกซ์การจ่ายผลตอบแทน เมทริกซ์ความเสี่ยงจะถูกแนะนำและสองประโยคของปัญหาในการเลือกวิธีแก้ปัญหาในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาตินั้นเป็นไปได้: การเพิ่มผลตอบแทนสูงสุดและการลดความเสี่ยง

การแก้ปัญหาในทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขความเสี่ยงแสดงให้เห็นว่า แนะนำให้ผู้เล่น I เลือกกลยุทธ์ที่ค่าเฉลี่ย (การคาดหมายทางคณิตศาสตร์) ของผลตอบแทนที่ได้รับเหนือแถวของเมทริกซ์ผลตอบแทนสูงสุด หรือ (ซึ่งเหมือนกัน) ค่าเฉลี่ย (การคาดหมายทางคณิตศาสตร์) ของความเสี่ยง ที่นำมาโดยแถวของเมทริกซ์ความเสี่ยงนั้นน้อยที่สุด ในการตัดสินใจภายใต้สภาวะที่ไม่แน่นอน ให้ใช้ หลักเกณฑ์ดังต่อไปนี้: เกณฑ์สูงสุดของ Wald, เกณฑ์ความเสี่ยงขั้นต่ำของ Sevidge, เกณฑ์การมองโลกในแง่ดีในแง่ร้ายของ Hurwitz, หลักการ Laplace เกี่ยวกับพื้นฐานไม่เพียงพอ

คำถามทดสอบตัวเอง

แนวคิดพื้นฐานของทฤษฎีเกมกำหนดไว้อย่างไร: การเคลื่อนไหว กลยุทธ์ และฟังก์ชันผลตอบแทน

ฟังก์ชันการจ่ายเงินแสดงในเกมเมทริกซ์อย่างไร

เหตุใดเกมเมทริกซ์จึงเรียกว่าผลรวมเป็นศูนย์

กระบวนการเล่นเกมเมทริกซ์เป็นอย่างไร?

เกมอะไรที่เรียกว่าเกม m × n?

กลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์คืออะไร?

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่า pure?

จุดอานของเมทริกซ์ผลตอบแทนหมายความว่าอย่างไร

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่ามิกซ์?

กลยุทธ์ผสมของผู้เล่นปรากฏอย่างไร?

จำนวนเงินที่จ่ายให้กับผู้เล่น I จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสมคืออะไร?

กลยุทธ์แบบผสมใดที่เรียกว่าเหมาะสมที่สุด

ความแตกต่างที่ไม่ได้ถูกจัดสรรหมายความว่าอย่างไร

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × 2

กลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2 × n เกมพบได้อย่างไร?

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม m × n

อะไรคือคุณสมบัติของการแก้เกมเมทริกซ์?

การลดความซับซ้อนของเมทริกซ์การชำระเงินหมายถึงอะไรและสามารถทำได้ภายใต้เงื่อนไขใด

เกมเมทริกซ์ใดตัดสินใจง่ายกว่าเมื่อเมทริกซ์ผลตอบแทนมีหรือไม่มีจุดอาน

ปัญหาใดในทฤษฎีเกมที่เกี่ยวข้องกับปัญหาในทฤษฎีการตัดสินใจทางสถิติ

เมทริกซ์การชำระเงินถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไร

สองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาที่เป็นไปได้ในเกมเมทริกซ์ที่มีธรรมชาติคืออะไร?

สำหรับสองเงื่อนไขใดที่สามารถกำหนดปัญหาในการตัดสินใจในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ?

กลยุทธ์ใดที่เหมาะสมสำหรับผู้เล่น I ที่จะเลือกเมื่อแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้สภาวะเสี่ยง?

เกณฑ์การตัดสินใจใดที่สามารถนำมาใช้ในการแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขของความไม่แน่นอน

ตัวอย่างการแก้ปัญหา

1. เมทริกซ์การชำระเงินแสดงจำนวนกำไรขององค์กรเมื่อขายได้ ประเภทต่างๆผลิตภัณฑ์ (คอลัมน์) ขึ้นอยู่กับความต้องการคงที่ (แถว) จำเป็นต้องกำหนดกลยุทธ์ที่เหมาะสมที่สุดขององค์กรสำหรับการผลิตผลิตภัณฑ์ประเภทต่างๆ และรายได้สูงสุด (โดยเฉลี่ย) ที่สอดคล้องกันจากการขาย

ให้เราแสดงเมทริกซ์ที่กำหนดโดยและแนะนำตัวแปร เราจะใช้เมทริกซ์ (เวกเตอร์) ด้วย จากนั้นและนั่นคือ

คำนวณเมทริกซ์ผกผัน:

พบค่า:

.

คำนวณความน่าจะเป็น:

รายได้เฉลี่ยจากการขายถูกกำหนด:

.

2. บริษัท "เภสัช" เป็นผู้ผลิตยาและผลิตภัณฑ์ชีวการแพทย์ในภูมิภาค เป็นที่ทราบกันดีว่าความต้องการยาบางชนิดมีความต้องการสูงสุด ช่วงฤดูร้อน(ยากลุ่มหัวใจและหลอดเลือด, ยาแก้ปวด) สำหรับคนอื่น ๆ - สำหรับช่วงฤดูใบไม้ร่วงและฤดูใบไม้ผลิ (ป้องกันการติดเชื้อ, ฤทธิ์ต้านฤทธิ์)

ค่าใช้จ่ายสำหรับ 1 Conv. หน่วย ผลิตภัณฑ์สำหรับเดือนกันยายนถึงตุลาคมคือ: สำหรับกลุ่มแรก (ยารักษาโรคหัวใจและหลอดเลือดและยาแก้ปวด) - 20 รูเบิล; ในกลุ่มที่สอง (ยาต้านการติดเชื้อ, ยาแก้ไอ) - 15 รูเบิล

ตามข้อสังเกตสำหรับหลาย ๆ ปีที่ผ่านมาบริการการตลาดของบริษัทพบว่าสามารถขายได้ในช่วงสองเดือนภายใต้การพิจารณาในสภาพอากาศอบอุ่น 3050 Conv. หน่วย สินค้ากลุ่มแรกและ 1100 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มที่สอง ในสภาพอากาศหนาวเย็น - 1525 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 3690 Conv. หน่วย กลุ่มที่สอง

ในการเชื่อมต่อกับการเปลี่ยนแปลงของสภาพอากาศที่เป็นไปได้งานถูกกำหนด - เพื่อกำหนดกลยุทธ์ของ บริษัท ในการผลิตผลิตภัณฑ์ที่ให้รายได้สูงสุดจากการขายในราคาขาย 40 รูเบิล สำหรับ 1 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 30 รูเบิล - กลุ่มที่สอง

สารละลาย. บริษัทมีสองกลยุทธ์:

ปีนี้อากาศจะอบอุ่น

อากาศจะเย็น

หาก บริษัท ใช้กลยุทธ์และในความเป็นจริงจะมีอากาศอบอุ่น (กลยุทธ์ของธรรมชาติ) ผลิตภัณฑ์ที่ผลิต (3050 หน่วยทั่วไปของยากลุ่มแรกและ 1100 หน่วยทั่วไปของกลุ่มที่สอง) จะถูกขายอย่างเต็มที่และรายได้จะ เป็น

3050 × (40-20) + 1100 × (30-15) = 77500 หน้า

ในอากาศเย็น (กลยุทธ์ธรรมชาติ) ยากลุ่มที่ 2 จะขายเต็มจำนวน และกลุ่มแรกเพียงจำนวน 1,525 Conv. หน่วย และยาบางชนิดก็ยังไม่เกิดขึ้นจริง รายได้จะ

1525 × (40-20) + 1100 × (30-15) -20 × () = 16500 หน้า

ในทำนองเดียวกัน หากรูปแบบใช้กลยุทธ์และอากาศหนาวจริง รายได้ก็จะเป็น

1525 × (40-20) + 3690 × (30-15) = 85850 หน้า

อากาศร้อนมีรายได้

1525 × (40-20) + 1100 × (30-15) - () × 15 = 8150 หน้า

เมื่อพิจารณาถึงบริษัทและสภาพอากาศในฐานะผู้เล่นสองคน เราจะได้เมทริกซ์การชำระเงิน

,

ราคาของเกมอยู่ในช่วง

จะเห็นได้จากเมทริกซ์การชำระเงินว่าภายใต้เงื่อนไขทั้งหมด รายได้ของบริษัทจะอยู่ที่ 16,500 รูเบิลเป็นอย่างน้อย แต่ถ้าสภาพอากาศตรงกับกลยุทธ์ที่เลือก รายได้ของบริษัทจะอยู่ที่ 77,500 รูเบิล

มาหาวิธีแก้ปัญหาของเกมกันเถอะ

ให้เราแสดงถึงความน่าจะเป็นของการนำกลยุทธ์ของบริษัทไปใช้ กลยุทธ์ผ่าน และ แก้เกมแบบกราฟิกด้วยวิธีการเราได้รับ ในขณะที่ราคาของเกมคือ p.

แผนการผลิตยาที่เหมาะสมจะเป็น

ดังนั้นจึงแนะนำให้บริษัทผลิตในช่วงเดือนกันยายนและตุลาคม 2379 conv. หน่วย ยากลุ่มแรกและ 2239.6 Conv. หน่วย ยาเสพติดของกลุ่มที่สองจากนั้นในทุกสภาพอากาศเธอจะได้รับรายได้อย่างน้อย 46986 รูเบิล

ในสภาวะที่ไม่แน่นอน หากบริษัทไม่สามารถใช้กลยุทธ์แบบผสม (สัญญากับองค์กรอื่น) เพื่อกำหนดกลยุทธ์ที่เหมาะสมที่สุดของบริษัท เราใช้เกณฑ์ต่อไปนี้:

เกณฑ์ Walde:

เกณฑ์ของ Hurwitz: เพื่อความแน่นอนเราจะยอมรับแล้วสำหรับกลยุทธ์ของ บริษัท

สำหรับกลยุทธ์

ขอแนะนำให้บริษัทใช้กลยุทธ์

เกณฑ์ความป่าเถื่อน องค์ประกอบสูงสุดในคอลัมน์แรกคือ 77500 ในคอลัมน์ที่สองคือ 85850

องค์ประกอบของเมทริกซ์ความเสี่ยงพบได้จากนิพจน์

,

ที่ไหน , ,

เมทริกซ์ความเสี่ยงมีรูปแบบ

,

ขอแนะนำให้ใช้กลยุทธ์หรือ

ดังนั้นจึงแนะนำให้บริษัทนำกลยุทธ์ไปใช้หรือ

โปรดทราบว่าเกณฑ์ที่พิจารณาแต่ละข้อไม่สามารถถือว่าน่าพอใจอย่างสมบูรณ์สำหรับ ทางเลือกสุดท้ายอย่างไรก็ตาม การตัดสินใจ การวิเคราะห์ร่วมกันทำให้คุณสามารถแสดงถึงผลที่ตามมาของการตัดสินใจด้านการจัดการบางอย่างได้ชัดเจนยิ่งขึ้น

ด้วยการกระจายความน่าจะเป็นที่ทราบกันดีสำหรับสภาวะต่างๆ ของธรรมชาติ เกณฑ์สำหรับการตัดสินใจคือความคาดหวังทางคณิตศาสตร์สูงสุดของผลตอบแทน

ให้ทราบปัญหาที่พิจารณาว่าความน่าจะเป็นของสภาพอากาศที่อบอุ่นและเย็นมีค่าเท่ากับ 0.5 แล้วจึงกำหนดกลยุทธ์ที่เหมาะสมของบริษัทดังนี้

ขอแนะนำให้บริษัทใช้กลยุทธ์หรือ

งานที่มอบหมายให้ศึกษาด้วยตนเอง

1. องค์กรสามารถผลิตสินค้าได้ 3 ประเภท (A, B และ C) โดยได้รับผลกำไรตามความต้องการ ในทางกลับกัน ความต้องการสามารถรับหนึ่งในสี่สถานะ (I, II, III และ IV) ในเมทริกซ์ต่อไปนี้ องค์ประกอบจะแสดงลักษณะกำไรที่องค์กรจะได้รับเมื่อผลิตผลิตภัณฑ์ที่ - และ - สถานะของอุปสงค์:

ในกรณีทั่วไป V * ≠ V * - ไม่มีจุดอาน ไม่มีวิธีแก้ปัญหาที่เหมาะสมในกลยุทธ์ล้วนๆ อย่างไรก็ตาม หากเราขยายแนวคิดของกลยุทธ์ล้วนๆ โดยการแนะนำแนวคิดของกลยุทธ์แบบผสม ก็เป็นไปได้ที่จะนำอัลกอริธึมมาใช้เพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับปัญหาเกมที่กำหนดไม่สมบูรณ์ ในสถานการณ์เช่นนี้ ขอเสนอให้ใช้วิธีการทางสถิติ (ความน่าจะเป็น) เพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับเกมที่เป็นปฏิปักษ์ สำหรับผู้เล่นแต่ละคน พร้อมกับชุดของกลยุทธ์ที่เป็นไปได้สำหรับเขา มีการแนะนำเวกเตอร์ที่ไม่รู้จักของความน่าจะเป็น (ความถี่สัมพัทธ์) ซึ่งควรใช้กลยุทธ์อย่างใดอย่างหนึ่ง

เราแสดงถึงเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ของทางเลือกของกลยุทธ์ที่กำหนดของผู้เล่น A ดังนี้:
P = (p 1, p 2, ..., p ม.),
โดยที่ p i ≥ 0, p 1 + p 2 +… + p m = 1 ค่า p i เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ A i

ในทำนองเดียวกัน สำหรับผู้เล่น B จะมีการแนะนำเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ที่ไม่รู้จักดังนี้:
Q = (q 1, q 2, ..., q n),
โดยที่ q j ≥ 0, q 1 + q 2 +… + q n = 1 ปริมาณ q j เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ B j ชุด (รวมกัน) ของกลยุทธ์บริสุทธิ์ A 1, A 2, ... A m และ B 1, B 2, ... B n ร่วมกับเวกเตอร์ของความน่าจะเป็นของการเลือกแต่ละรายการเรียกว่า กลยุทธ์ผสม

ทฤษฎีบทหลักในทฤษฎีเกมที่เป็นปรปักษ์กันคือ ทฤษฎีบทของฟอน นอยมันน์: เกมเมทริกซ์ไฟไนต์แต่ละเกมมีโดย อย่างน้อยทางออกที่ดีที่สุดวิธีหนึ่ง อาจเป็นกลยุทธ์แบบผสมก็ได้.
จากทฤษฎีบทนี้เกมที่กำหนดอย่างไม่สมบูรณ์มีวิธีแก้ปัญหาที่ดีที่สุดอย่างน้อยหนึ่งวิธีในกลยุทธ์แบบผสม ในเกมดังกล่าว การแก้ปัญหาคือคู่ของกลยุทธ์ผสมที่เหมาะสมที่สุด P * และ Q * ดังนั้นหากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่เหมาะสมที่สุดของเขา ผู้เล่นอื่นจะไม่ได้รับประโยชน์จากกลยุทธ์ที่เหมาะสมที่สุดของเขา
ผลตอบแทนเฉลี่ยของผู้เล่น A ถูกกำหนดโดยความคาดหวังทางคณิตศาสตร์:

หากความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ไม่เป็นศูนย์ กลยุทธ์ดังกล่าวจะเรียกว่า คล่องแคล่ว.

กลยุทธ์ P *, Q * เรียกว่า ผสมที่ดีที่สุดกลยุทธ์ถ้า MA (P, Q *) ≤ MA (P *, Q *) ≤ MA (P *, Q) (1)
ในกรณีนี้ จะเรียก MA (P *, Q *) ว่า ที่ค่าใช้จ่ายเกมและแสดงด้วย V (V * ≤ V ≤ V *) ความไม่เท่าเทียมกันครั้งแรก (1) หมายความว่า การเบี่ยงเบนของผู้เล่น A จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น B ปฏิบัติตามกลยุทธ์การผสมผสานที่เหมาะสมที่สุดของเขา ส่งผลให้ผลตอบแทนเฉลี่ยลดลงผู้เล่น A. ความไม่เท่าเทียมกันที่สองหมายความว่า การเบี่ยงเบนของผู้เล่น B จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น A ปฏิบัติตามกลยุทธ์การผสมผสานที่เหมาะสมที่สุดของเขา นำไปสู่การเพิ่มขึ้นในการสูญเสียเฉลี่ยของผู้เล่นB.

โดยทั่วไป งานดังกล่าวจะแก้ไขได้สำเร็จด้วยเครื่องคิดเลขนี้

ตัวอย่าง.

4 7 2
7 3 2
2 1 8

1. ตรวจสอบว่าเมทริกซ์การชำระเงินมีจุดอานหรือไม่... ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ

เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาเพื่อให้ได้ผลตอบแทนสูงสุด และผู้เล่น II เลือกกลยุทธ์ของเขาเพื่อลดผลตอบแทนของผู้เล่น I

ผู้เล่น บี 1 บี2 บี 3 a = นาที (A ผม)
A 1 4 7 2 2
A 2 7 3 2 2
A 3 2 1 8 1
b = สูงสุด (Bi) 7 7 8

เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = สูงสุด (a i) = 2 ซึ่งบ่งชี้ถึงกลยุทธ์บริสุทธิ์สูงสุด A 1
ราคาสูงสุดของเกมคือ b = นาที (bj) = 7 ซึ่งบ่งชี้ว่าไม่มีจุดอาน เนื่องจาก a ≠ b ดังนั้นราคาของเกมจะอยู่ในช่วง 2 ≤ y ≤ 7 ค้นหาวิธีแก้ปัญหา เกมในกลยุทธ์แบบผสม นี่คือคำอธิบายโดยข้อเท็จจริงที่ว่าผู้เล่นไม่สามารถประกาศกลยุทธ์ที่บริสุทธิ์ของตนต่อศัตรูได้: พวกเขาควรซ่อนการกระทำของพวกเขา เกมสามารถแก้ไขได้โดยให้ผู้เล่นเลือกกลยุทธ์ของพวกเขา สุ่ม(ผสมกลยุทธ์ล้วนๆ)

2. ตรวจสอบเมทริกซ์การจ่ายเงินสำหรับแถวที่โดดเด่นและคอลัมน์ที่โดดเด่น.
ไม่มีแถวที่โดดเด่นและคอลัมน์ที่โดดเด่นในเมทริกซ์ผลตอบแทน

3. ค้นหาวิธีแก้ปัญหาในเกมด้วยกลยุทธ์แบบผสม.
มาเขียนระบบสมการกัน
สำหรับผู้เล่น I
4p 1 + 7p 2 + 2p 3 = y
7p 1 + 3p 2 + p 3 = y
2p 1 + 2p 2 + 8p 3 = y
p 1 + p 2 + p 3 = 1

สำหรับผู้เล่น II
4q 1 + 7q 2 + 2q 3 = y
7q 1 + 3q 2 + 2q 3 = y
2q 1 + q 2 + 8q 3 = y
q 1 + q 2 + q 3 = 1

การแก้ปัญหาระบบเหล่านี้ด้วยวิธีเกาส์ เราพบว่า:

y = 4 1/34
p 1 = 29/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
p 2 = 4/17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
p 3 = 23/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)

กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I: P = (29/68; 4/17; 23/68)
q 1 = 6/17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
q 2 = 9/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
q 3 = 13/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)

กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II: Q = (6/17; 9/34; 13/34)
ราคาเกม: y = 4 1/34

หากเกมไม่มีจุดอาน จะเกิดปัญหาในการกำหนดมูลค่าของเกมและกลยุทธ์ที่ดีที่สุดของผู้เล่น พิจารณาตัวอย่างเช่นเกม:

ในเกมนี้และ ดังนั้นผู้เล่นคนแรกสามารถรับประกันว่าตัวเองชนะได้เท่ากับ 4 และคนที่สองสามารถจำกัดการสูญเสียของเขาได้ 5 พื้นที่ระหว่างและเป็นเหมือนเดิมคือเสมอและผู้เล่นแต่ละคนสามารถพยายามปรับปรุงผลงานของเขาด้วยค่าใช้จ่ายของพื้นที่นี้ . กลยุทธ์ที่เหมาะสมของผู้เล่นควรเป็นอย่างไร?

หากผู้เล่นแต่ละคนใช้กลยุทธ์ที่มีเครื่องหมายดอกจัน การได้รับของผู้เล่นคนแรกและการสูญเสียคนที่สองจะเป็น 5 ซึ่งเป็นผลเสียสำหรับผู้เล่นคนที่สอง เนื่องจากคนแรกชนะมากกว่าที่เขารับประกันได้ ตัวเขาเอง. อย่างไรก็ตาม หากผู้เล่นคนที่สองเปิดเผยเจตนาของผู้เล่นคนแรกเกี่ยวกับความตั้งใจที่จะใช้กลยุทธ์ในทางใดทางหนึ่ง เขาก็สามารถใช้กลยุทธ์นั้นและลดกำไรของคนแรกเป็น 4 ได้ จริงหากผู้เล่นคนแรกเปิดเผยความตั้งใจของ วินาทีที่ใช้กลยุทธ จากนั้นใช้กลยุทธ เขาจะเพิ่มกำไรเป็น 6 ดังนั้นสถานการณ์จึงเกิดขึ้นเมื่อผู้เล่นแต่ละคนต้องเก็บกลยุทธ์ที่เขาจะใช้เป็นความลับ อย่างไรก็ตาม คุณจะทำสิ่งนี้ได้อย่างไร? ท้ายที่สุดแล้ว หากเกมมีการเล่นหลายครั้งและผู้เล่นคนที่สองใช้กลยุทธ์ตลอดเวลา ผู้เล่นคนแรกจะเข้าใจความตั้งใจของคนที่สองในไม่ช้า และเมื่อใช้กลยุทธ์นี้แล้วจะได้รับผลตอบแทนเพิ่มเติม เห็นได้ชัดว่าผู้เล่นคนที่สองต้องเปลี่ยนกลยุทธ์ในแต่ละเกมใหม่ แต่เขาต้องทำในลักษณะที่คนแรกไม่ได้คาดเดากลยุทธ์ที่เขาจะใช้ในแต่ละกรณี

สำหรับกลไกการเลือกแบบสุ่ม การชนะและแพ้ของผู้เล่นจะเป็น ตัวแปรสุ่ม... ผลลัพธ์ของเกมในกรณีนี้สามารถประมาณได้จากการสูญเสียผู้เล่นคนที่สองโดยเฉลี่ย ลองกลับไปที่ตัวอย่าง ดังนั้นหากผู้เล่นคนที่สองใช้กลยุทธ์และสุ่มด้วยความน่าจะเป็น 0.5 0.5 จากนั้นด้วยกลยุทธ์ของผู้เล่นคนแรก ค่าเฉลี่ยของการสูญเสียของเขาจะเป็น:

และด้วยกลยุทธของผู้เล่นคนแรก

ดังนั้นผู้เล่นคนที่สองสามารถจำกัดการสูญเสียเฉลี่ยของเขาไว้ที่ 4.5 โดยไม่คำนึงถึงกลยุทธ์ที่ผู้เล่นคนแรกใช้

ดังนั้น ในหลายกรณี เราไม่แนะนำให้สรุปกลยุทธ์ล่วงหน้า แต่ให้เลือกอย่างใดอย่างหนึ่งโดยการสุ่ม โดยใช้กลไกของการเลือกแบบสุ่ม กลยุทธ์ที่ใช้การสุ่มเลือกเรียกว่า กลยุทธ์ผสมตรงกันข้ามกับกลยุทธ์ที่ร่างไว้ซึ่งเรียกว่า กลยุทธ์ที่บริสุทธิ์.

ให้เราให้คำจำกัดความที่เข้มงวดมากขึ้นของกลยุทธ์ที่บริสุทธิ์และผสม



ให้มีเกมที่ไม่มีจุดอาน:

ให้เราระบุความถี่ของการใช้กลยุทธ์บริสุทธิ์ของผู้เล่นคนแรกผ่าน (ความน่าจะเป็นของการใช้กลยุทธ์ที่ i) ในทำนองเดียวกัน เราแสดงถึงความถี่ของการใช้กลยุทธ์บริสุทธิ์ของผู้เล่นคนที่สองโดย (ความน่าจะเป็นของการใช้กลยุทธ์ j-th) สำหรับเกมจุดอานมีวิธีการแก้ปัญหาเชิงกลยุทธ์ที่บริสุทธิ์ สำหรับเกมจุดอาน มีวิธีแก้ปัญหาในกลยุทธ์แบบผสม นั่นคือเมื่อการเลือกกลยุทธ์ขึ้นอยู่กับความน่าจะเป็น แล้ว

กลยุทธ์ผู้เล่นคนแรกที่บริสุทธิ์มากมาย

กลยุทธ์ที่หลากหลายของผู้เล่นคนแรก

กลยุทธ์ผู้เล่นที่ 2 บริสุทธิ์มากมาย

กลยุทธ์ผู้เล่นที่ 2 แบบผสมจำนวนมาก

พิจารณาตัวอย่าง: มาเล่นเกมกันเถอะ

ผู้เล่นคนที่สองเลือกความน่าจะเป็น ... ให้เราประเมินการสูญเสียโดยเฉลี่ยของผู้เล่นคนที่สองเมื่อเขาใช้กลยุทธ์และตามลำดับ

แยกแยะระหว่างกลยุทธ์แบบบริสุทธิ์และแบบผสม กลยุทธ์สะอาด
ผู้เล่นคนแรก (กลยุทธ์บริสุทธิ์
ผู้เล่นคนที่สอง) คือการย้ายที่เป็นไปได้ของผู้เล่นคนแรก (คนที่สอง) ซึ่งเขาเลือกโดยมีความน่าจะเป็นเท่ากับ 1

หากผู้เล่นคนแรกมีกลยุทธ์ m และคนที่สองมี n กลยุทธ์ ดังนั้นสำหรับกลยุทธ์คู่ใด ๆ ของผู้เล่นคนแรกและคนที่สอง กลยุทธ์ที่บริสุทธิ์สามารถแสดงเป็นเวกเตอร์หน่วยได้ ตัวอย่างเช่น สำหรับคู่กลยุทธ์
,
กลยุทธ์ที่บริสุทธิ์ของผู้เล่นคนแรกและคนที่สองจะถูกเขียนเป็น:
,
... สำหรับคู่ของกลยุทธ์ ,กลยุทธ์บริสุทธิ์สามารถเขียนได้ดังนี้:

,

.

ทฤษฎีบท: ในเกมเมทริกซ์ ราคาเกมสุทธิที่ต่ำกว่าจะไม่เกินราคาเกมสุทธิบน กล่าวคือ
.

คำนิยาม:ถ้าสำหรับกลยุทธ์ที่บริสุทธิ์ ,ผู้เล่น A และ B ตามลำดับ ความเท่าเทียมกัน
แล้วคู่ของกลยุทธ์ที่บริสุทธิ์ ( ,) เรียกว่าจุดอานของเกมเมทริกซ์องค์ประกอบ เมทริกซ์ที่จุดตัดของแถวที่ i และคอลัมน์ที่ j เป็นองค์ประกอบอานของเมทริกซ์การชำระเงินและตัวเลข
- ราคาที่แท้จริงของเกม

ตัวอย่าง:ค้นหาราคาสุทธิที่ต่ำกว่าและบน กำหนดจุดอานของเกมเมทริกซ์

.

ให้เรากำหนดราคาสุทธิบนและล่างของเกม:,,
.

ในกรณีนี้ เรามีจุดอานหนึ่งจุด (A 1; B 2) และองค์ประกอบอานคือ 5 องค์ประกอบนี้มีขนาดเล็กที่สุดในแถวที่ 1 และใหญ่ที่สุดในคอลัมน์ที่ 2 การเบี่ยงเบนของผู้เล่น A จากกลยุทธ์สูงสุดของ A1 ทำให้กำไรของเขาลดลง และการเบี่ยงเบนของผู้เล่น B จากกลยุทธ์ขั้นต่ำสุดของ B 2 ทำให้เขาสูญเสียเพิ่มขึ้น กล่าวอีกนัยหนึ่ง หากเกมเมทริกซ์มีองค์ประกอบอาน กลยุทธ์ที่ดีที่สุดสำหรับผู้เล่นคือกลยุทธ์ขั้นต่ำ และกลยุทธ์ที่บริสุทธิ์เหล่านี้ซึ่งสร้างจุดอานและเลือกองค์ประกอบอาน 12 = 5 ในเมทริกซ์เกมเป็นกลยุทธ์ที่ดีที่สุด และ ผู้เล่น A และ B ตามลำดับ

หากเกมเมทริกซ์ไม่มีจุดอาน การแก้ปัญหาของเกมจะกลายเป็นเรื่องยาก ในเกมเหล่านี้
... การใช้กลยุทธ์ minimax ในเกมดังกล่าวนำไปสู่ความจริงที่ว่าสำหรับผู้เล่นแต่ละคนผลตอบแทนไม่เกิน และขาดทุนไม่น้อย ... สำหรับผู้เล่นแต่ละคน คำถามเกิดขึ้นจากการเพิ่มเงินรางวัล (ลดการขาดทุน) พบวิธีแก้ปัญหาโดยใช้กลยุทธ์แบบผสม

คำนิยาม:กลยุทธ์ผสมของผู้เล่นคนแรก (ที่สอง) คือ vector
, ที่ไหน
และ
(
, ที่ไหน
และ
).

เวกเตอร์ p (q) แสดงถึงความน่าจะเป็นของกลยุทธ์บริสุทธิ์ลำดับที่ i ที่ผู้เล่นคนแรกใช้ (กลยุทธ์ที่บริสุทธิ์ลำดับที่ j โดยผู้เล่นคนที่สอง)

เนื่องจากผู้เล่นเลือกกลยุทธ์ที่บริสุทธิ์ของพวกเขาแบบสุ่มและเป็นอิสระจากกัน เกมจึงมีตัวละครแบบสุ่มและจำนวนกำไร (ขาดทุน) จะกลายเป็นแบบสุ่ม ในกรณีนี้ กำไร (ขาดทุน) เฉลี่ย - การคาดหมายทางคณิตศาสตร์ - เป็นฟังก์ชันของกลยุทธ์แบบผสม p, q:

.

คำนิยาม:ฟังก์ชั่น f (p, q) เรียกว่าฟังก์ชันการจ่ายเงินของเกมด้วยเมทริกซ์
.

คำนิยาม:กลยุทธ์
,
เรียกว่าเหมาะสมที่สุดหากเป็นกลยุทธ์ตามอำเภอใจ
,
เงื่อนไขเป็นที่น่าพอใจ

การใช้กลยุทธ์แบบผสมที่ดีที่สุดในเกมให้ผลตอบแทนแก่ผู้เล่นคนแรกไม่น้อยกว่าเมื่อเขาใช้กลยุทธ์อื่น p; ผู้เล่นคนที่สองมีการสูญเสียไม่เกินถ้าเขาใช้กลยุทธ์อื่น q

การผสมผสานระหว่างกลยุทธ์ที่เหมาะสมและราคาเกมประกอบกันเป็นโซลูชั่นเกม

© 2021 skudelnica.ru - ความรัก, การทรยศ, จิตวิทยา, การหย่าร้าง, ความรู้สึก, การทะเลาะวิวาท