คำนวณกำลังสองเฉลี่ยราก. ค่าเบี่ยงเบนมาตรฐานคืออะไร - การใช้ฟังก์ชันค่าเบี่ยงเบนมาตรฐานเพื่อคำนวณค่าเบี่ยงเบนมาตรฐานใน Excel
คุณลักษณะที่สมบูรณ์แบบที่สุดของการเปลี่ยนแปลงคือค่าเบี่ยงเบนกำลังสองเฉลี่ย ซึ่งเรียกว่าค่ามาตรฐาน (หรือค่าเบี่ยงเบนมาตรฐาน) ส่วนเบี่ยงเบนมาตรฐาน() เท่ากับรากที่สองของค่าเบี่ยงเบนกำลังสองเฉลี่ยของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ยเลขคณิต:
ค่าเบี่ยงเบนมาตรฐานนั้นง่าย:
ค่าเบี่ยงเบนมาตรฐานแบบถ่วงน้ำหนักใช้กับข้อมูลที่จัดกลุ่ม:
ระหว่างค่ารากกำลังสองและการเบี่ยงเบนเชิงเส้นเฉลี่ยภายใต้เงื่อนไขการแจกแจงแบบปกติ อัตราส่วนต่อไปนี้จะเกิดขึ้น: ~ 1.25
ค่าเบี่ยงเบนมาตรฐานซึ่งเป็นการวัดความแปรผันหลักสัมบูรณ์ใช้ในการกำหนดค่าพิกัดของเส้นโค้งการกระจายปกติในการคำนวณที่เกี่ยวข้องกับการจัดองค์กรของการสังเกตตัวอย่างและการสร้างความแม่นยำของคุณลักษณะตัวอย่างตลอดจนในการประเมิน ขีดจำกัดของการแปรผันของคุณลักษณะในประชากรเนื้อเดียวกัน
การกระจายตัว ชนิดของมัน ส่วนเบี่ยงเบนมาตรฐาน
ความแปรปรวนของตัวแปรสุ่ม— การวัดการแพร่กระจายของตัวแปรสุ่มที่กำหนด เช่น การเบี่ยงเบนไปจากความคาดหวังทางคณิตศาสตร์ ในทางสถิติ สัญกรณ์ หรือ มักใช้ รากที่สองของความแปรปรวนเรียกว่าส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนมาตรฐาน หรือสเปรดมาตรฐาน
ผลต่างรวม (ซิ 2) วัดความแปรผันของคุณลักษณะทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ ในเวลาเดียวกัน ด้วยวิธีการจัดกลุ่ม ทำให้สามารถระบุและวัดความแปรผันเนื่องจากลักษณะการจัดกลุ่มและความแปรผันที่เกิดขึ้นภายใต้อิทธิพลของปัจจัยที่ไม่สามารถนับได้
ความแปรปรวนระหว่างกลุ่ม (σ 2 มก) กำหนดลักษณะความแปรปรวนอย่างเป็นระบบ เช่น ความแตกต่างในคุณค่าของลักษณะที่กำลังศึกษาซึ่งเกิดขึ้นภายใต้อิทธิพลของลักษณะ - ปัจจัยที่สร้างพื้นฐานของกลุ่ม
ส่วนเบี่ยงเบนมาตรฐาน(คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนกำลังสอง; คำที่เกี่ยวข้อง: ส่วนเบี่ยงเบนมาตรฐาน, สเปรดมาตรฐาน) - ในทฤษฎีความน่าจะเป็นและสถิติซึ่งเป็นตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าของตัวแปรสุ่มที่สัมพันธ์กับความคาดหวังทางคณิตศาสตร์ ด้วยอาร์เรย์ที่จำกัดของตัวอย่างค่า แทนที่จะใช้ความคาดหวังทางคณิตศาสตร์ จะใช้ค่าเฉลี่ยเลขคณิตของชุดตัวอย่าง
ค่าเบี่ยงเบนมาตรฐานวัดเป็นหน่วยของตัวแปรสุ่ม และใช้ในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต เมื่อสร้างช่วงความเชื่อมั่น เมื่อทดสอบสมมติฐานทางสถิติ เมื่อวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม กำหนดให้เป็นรากที่สองของความแปรปรวนของตัวแปรสุ่ม
ส่วนเบี่ยงเบนมาตรฐาน:
ส่วนเบี่ยงเบนมาตรฐาน(การประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม xสัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง):
การกระจายตัวอยู่ที่ไหน — ฉันองค์ประกอบที่ 3 ของการเลือก - ขนาดตัวอย่าง; — ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง:
ควรสังเกตว่าการประมาณการทั้งสองมีความลำเอียง ในกรณีทั่วไป ไม่สามารถสร้างการประมาณการที่เป็นกลางได้ อย่างไรก็ตาม การประมาณการตามการประมาณค่าความแปรปรวนที่เป็นกลางมีความสอดคล้องกัน
สาระสำคัญ ขอบเขต และขั้นตอนในการกำหนดรูปแบบและค่ามัธยฐาน
นอกเหนือจากค่าเฉลี่ยกำลังในสถิติแล้ว ค่าเฉลี่ยโครงสร้างยังใช้สำหรับการอธิบายลักษณะสัมพัทธ์ของค่าของคุณลักษณะที่แตกต่างกันและโครงสร้างภายในของซีรีย์การแจกแจง ซึ่งส่วนใหญ่แสดงด้วย แฟชั่นและค่ามัธยฐาน.
แฟชั่น- นี่คือรูปแบบที่พบบ่อยที่สุดของซีรีส์ ตัวอย่างเช่น มีการใช้แฟชั่นในการกำหนดขนาดของเสื้อผ้าและรองเท้าที่เป็นที่ต้องการมากที่สุดในหมู่ผู้ซื้อ โหมดสำหรับซีรีย์แยกคือโหมดที่มีความถี่สูงสุด เมื่อคำนวณโหมดสำหรับซีรีย์การเปลี่ยนแปลงช่วงเวลา คุณต้องกำหนดช่วงเวลาโมดอลก่อน (ขึ้นอยู่กับความถี่สูงสุด) จากนั้นจึงหาค่าของค่าโมดอลของแอททริบิวต์โดยใช้สูตร:
- - คุณค่าแฟชั่น
- — ขีดจำกัดล่างของช่วงเวลาโมดอล
- — ขนาดช่วงเวลา
- — ความถี่ช่วงโมดอล
- — ความถี่ของช่วงเวลาก่อนโมดอล
- — ความถี่ของช่วงเวลาตามโมดอล
ค่ามัธยฐาน -นี่คือค่าของแอตทริบิวต์ที่รองรับซีรีส์ที่ได้รับการจัดอันดับ และแบ่งซีรีส์นี้ออกเป็นสองส่วนเท่าๆ กัน
หากต้องการหาค่ามัธยฐานในชุดข้อมูลแยกกันเมื่อมีความถี่ ขั้นแรกให้คำนวณผลรวมครึ่งหนึ่งของความถี่ จากนั้นจึงพิจารณาว่าค่าของตัวแปรตรงกับค่าใด (หากชุดข้อมูลที่เรียงลำดับมีจำนวนคุณลักษณะเป็นเลขคี่ จำนวนค่ามัธยฐานจะถูกคำนวณโดยใช้สูตร:
M e = (n (จำนวนคุณสมบัติทั้งหมด) + 1)/2,
ในกรณีที่มีคุณสมบัติเป็นเลขคู่ ค่ามัธยฐานจะเท่ากับค่าเฉลี่ยของคุณสมบัติทั้งสองที่อยู่ตรงกลางแถว)
เมื่อคำนวณแล้ว ค่ามัธยฐานสำหรับอนุกรมการแปรผันช่วง ขั้นแรกให้กำหนดช่วงค่ามัธยฐานซึ่งค่ามัธยฐานตั้งอยู่ จากนั้นจึงกำหนดค่าของค่ามัธยฐานโดยใช้สูตร:
- — ค่ามัธยฐานที่ต้องการ
- - ขีดจำกัดล่างของช่วงเวลาที่มีค่ามัธยฐาน
- — ขนาดช่วงเวลา
- — ผลรวมของความถี่หรือจำนวนเทอมอนุกรม
ผลรวมของความถี่สะสมของช่วงก่อนค่ามัธยฐาน
- — ความถี่ของช่วงค่ามัธยฐาน
ตัวอย่าง. ค้นหาโหมดและค่ามัธยฐาน
สารละลาย:
ในตัวอย่างนี้ ช่วงโมดอลอยู่ภายในกลุ่มอายุ 25-30 ปี เนื่องจากช่วงนี้มีความถี่สูงสุด (1,054)
มาคำนวณขนาดของโหมดกัน:
ซึ่งหมายความว่าอายุกิริยาของนักเรียนคือ 27 ปี
มาคำนวณค่ามัธยฐานกัน. ช่วงค่ามัธยฐานอยู่ในกลุ่มอายุ 25-30 ปี เนื่องจากภายในช่วงเวลานี้มีตัวเลือกที่แบ่งประชากรออกเป็นสองส่วนเท่า ๆ กัน (Σf i /2 = 3462/2 = 1731) ต่อไป เราจะแทนที่ข้อมูลตัวเลขที่จำเป็นลงในสูตรและรับค่ามัธยฐาน:
ซึ่งหมายความว่าครึ่งหนึ่งของนักเรียนมีอายุต่ำกว่า 27.4 ปี และอีกครึ่งหนึ่งมีอายุมากกว่า 27.4 ปี
นอกจากโหมดและค่ามัธยฐานแล้ว ยังสามารถใช้ตัวบ่งชี้ เช่น ควอร์ไทล์ โดยแบ่งอนุกรมการจัดอันดับออกเป็น 4 ส่วนเท่าๆ กัน เดซิล- 10 ส่วนและเปอร์เซ็นไทล์ - ต่อ 100 ส่วน
แนวคิดของการสังเกตแบบเลือกสรรและขอบเขต
การสังเกตแบบเลือกสรรใช้เมื่อมีการใช้การเฝ้าระวังอย่างต่อเนื่อง เป็นไปไม่ได้ทางกายภาพเนื่องจากมีข้อมูลจำนวนมากหรือ ไม่สามารถทำได้ในเชิงเศรษฐกิจ. ความเป็นไปไม่ได้ทางกายภาพเกิดขึ้นเมื่อศึกษาจำนวนผู้โดยสาร ราคาตลาด และงบประมาณของครอบครัว ความไม่สะดวกทางเศรษฐกิจเกิดขึ้นเมื่อประเมินคุณภาพของสินค้าที่เกี่ยวข้องกับการทำลายล้าง เช่น การชิม การทดสอบอิฐเพื่อความแข็งแรง เป็นต้น
หน่วยทางสถิติที่เลือกสำหรับการสังเกตประกอบด้วยกรอบการสุ่มตัวอย่างหรือตัวอย่าง และหน่วยทางสถิติทั้งหมดประกอบด้วยประชากรทั่วไป (GS) ในกรณีนี้ จำนวนหน่วยในกลุ่มตัวอย่างจะแสดงด้วย nและใน HS ทั้งหมด - เอ็น. ทัศนคติ ไม่มี/ไม่มีเรียกว่าขนาดสัมพัทธ์หรือสัดส่วนของกลุ่มตัวอย่าง
คุณภาพของผลลัพธ์จากการสังเกตตัวอย่างขึ้นอยู่กับความเป็นตัวแทนของตัวอย่าง ซึ่งก็คือความเป็นตัวแทนใน HS มากน้อยเพียงใด เพื่อให้มั่นใจถึงความเป็นตัวแทนของตัวอย่าง จึงจำเป็นต้องปฏิบัติตาม หลักการสุ่มเลือกหน่วยซึ่งถือว่าการรวมหน่วย HS ไว้ในตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยอื่นใดนอกจากโอกาส
มีอยู่ 4 วิธีในการสุ่มเลือกตัวอย่าง:
- จริงๆแล้วสุ่มเลยการเลือกหรือ "วิธีล็อตโต้" เมื่อมีการกำหนดปริมาณทางสถิติให้กับหมายเลขซีเรียล โดยบันทึกไว้บนวัตถุบางอย่าง (เช่น ถัง) จากนั้นจึงผสมในภาชนะบางชนิด (เช่น ในถุง) และเลือกโดยการสุ่ม ในทางปฏิบัติวิธีนี้ดำเนินการโดยใช้เครื่องกำเนิดตัวเลขสุ่มหรือตารางทางคณิตศาสตร์ของตัวเลขสุ่ม
- เครื่องกลการคัดเลือกตามแต่ละ ( ไม่มี)-ค่าอันดับที่ 1 ของประชากรทั่วไป ตัวอย่างเช่น หากมีค่า 100,000 และคุณต้องเลือก 1,000 ทุก ๆ 100,000 / 1,000 = ค่าที่ 100 จะรวมอยู่ในตัวอย่าง ยิ่งไปกว่านั้น หากไม่ได้รับการจัดอันดับ ก็จะเลือกอันแรกโดยการสุ่มจากร้อยแรก และจำนวนอื่นๆ จะสูงกว่าหนึ่งร้อย เช่น ถ้าหน่วยแรกเป็นหมายเลข 19 หน่วยถัดไปก็ควรเป็นหมายเลข 119 ตามด้วยหมายเลข 219 และหมายเลข 319 เป็นต้น หากมีการจัดอันดับหน่วยประชากร หมายเลข 50 จะถูกเลือกก่อน จากนั้นจึงเลือกหมายเลข 150 และหมายเลข 250 และอื่นๆ
- ดำเนินการเลือกค่าจากอาร์เรย์ข้อมูลที่ต่างกัน แบ่งชั้น(แบ่งชั้น) เมื่อประชากรถูกแบ่งออกเป็นกลุ่มเนื้อเดียวกันเป็นครั้งแรก โดยใช้การเลือกแบบสุ่มหรือเชิงกล
- วิธีการสุ่มตัวอย่างแบบพิเศษคือ อนุกรมการเลือกซึ่งพวกเขาสุ่มหรือเลือกโดยกลไกไม่ใช่ค่าแต่ละค่า แต่เป็นอนุกรม (ลำดับจากตัวเลขบางตัวถึงตัวเลขบางตัวในแถว) ซึ่งดำเนินการสังเกตอย่างต่อเนื่อง
คุณภาพของการสังเกตตัวอย่างก็ขึ้นอยู่กับเช่นกัน ประเภทตัวอย่าง: ซ้ำแล้วซ้ำเล่าหรือ หยาบคาย.
ที่ การคัดเลือกใหม่ค่าทางสถิติหรือชุดค่าที่รวมอยู่ในตัวอย่างจะถูกส่งกลับไปยังประชากรทั่วไปหลังการใช้งานโดยมีโอกาสที่จะรวมไว้ในตัวอย่างใหม่ ยิ่งกว่านั้นค่าทั้งหมดในประชากรมีความน่าจะเป็นที่เท่ากันในการรวมไว้ในตัวอย่าง
การเลือกแบบไม่มีซ้ำหมายความว่าค่าทางสถิติหรืออนุกรมที่รวมอยู่ในตัวอย่างจะไม่กลับสู่ประชากรทั่วไปหลังการใช้งาน ดังนั้นสำหรับค่าที่เหลือของค่าหลังความน่าจะเป็นที่จะรวมอยู่ในตัวอย่างถัดไปจะเพิ่มขึ้น
การสุ่มตัวอย่างแบบไม่ทำซ้ำจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น ดังนั้นจึงมีการใช้บ่อยกว่า แต่มีบางสถานการณ์ที่ไม่สามารถนำมาใช้ได้ (ศึกษาจำนวนผู้โดยสาร ความต้องการของผู้บริโภค ฯลฯ) จากนั้นจึงทำการเลือกซ้ำ
ข้อผิดพลาดในการสุ่มตัวอย่างจากการสังเกตสูงสุด ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย ขั้นตอนการคำนวณ
ให้เราพิจารณารายละเอียดเกี่ยวกับวิธีการสร้างประชากรตัวอย่างที่ระบุไว้ข้างต้นและข้อผิดพลาดที่เกิดขึ้นเมื่อทำเช่นนั้น ความเป็นตัวแทน .
สุ่มพอดีการสุ่มตัวอย่างจะขึ้นอยู่กับการเลือกหน่วยจากประชากรโดยการสุ่มโดยไม่มีองค์ประกอบที่เป็นระบบ ในทางเทคนิคแล้ว การเลือกสุ่มตามจริงจะดำเนินการโดยการจับสลาก (เช่น ลอตเตอรี่) หรือใช้ตารางตัวเลขสุ่ม
การเลือกสุ่มที่เหมาะสม "ในรูปแบบบริสุทธิ์" ไม่ค่อยถูกนำมาใช้ในการฝึกการสังเกตแบบเลือก แต่เป็นการเลือกดั้งเดิมในบรรดาการเลือกประเภทอื่น ๆ โดยจะใช้หลักการพื้นฐานของการสังเกตแบบเลือก ลองพิจารณาคำถามบางข้อเกี่ยวกับทฤษฎีวิธีการสุ่มตัวอย่างและสูตรข้อผิดพลาดสำหรับตัวอย่างสุ่มอย่างง่าย
อคติในการสุ่มตัวอย่างคือความแตกต่างระหว่างค่าของพารามิเตอร์ในประชากรทั่วไปกับค่าที่คำนวณจากผลลัพธ์ของการสังเกตตัวอย่าง สำหรับคุณลักษณะเชิงปริมาณโดยเฉลี่ย ข้อผิดพลาดในการสุ่มตัวอย่างจะถูกกำหนดโดย
ตัวบ่งชี้นี้เรียกว่าข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม
ค่าเฉลี่ยตัวอย่างเป็นตัวแปรสุ่มที่สามารถรับค่าที่แตกต่างกันได้ขึ้นอยู่กับหน่วยที่รวมอยู่ในตัวอย่าง ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นตัวแปรสุ่มและอาจรับค่าที่ต่างกันได้ ดังนั้นจึงกำหนดค่าเฉลี่ยของข้อผิดพลาดที่เป็นไปได้ - ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยซึ่งขึ้นอยู่กับ:
ขนาดตัวอย่าง: ยิ่งตัวเลขมากเท่าไร ความคลาดเคลื่อนโดยเฉลี่ยก็จะน้อยลงเท่านั้น
ระดับของการเปลี่ยนแปลงในลักษณะที่กำลังศึกษา: ยิ่งความแปรผันของคุณลักษณะน้อยลง และผลที่ตามมาคือการกระจายตัว ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลง
ที่ สุ่มเลือกใหม่คำนวณข้อผิดพลาดโดยเฉลี่ย:
.
ในทางปฏิบัติ ความแปรปรวนทั่วไปไม่เป็นที่ทราบแน่ชัด แต่ทราบใน ทฤษฎีความน่าจะเป็นได้รับการพิสูจน์แล้วว่า
.
เนื่องจากค่าของ n ที่มีขนาดใหญ่เพียงพอนั้นใกล้กับ 1 เราจึงสามารถสรุปได้ว่า จากนั้นสามารถคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยได้:
.
แต่ในกรณีตัวอย่างเล็กๆ น้อยๆ (มี n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.
ที่ การสุ่มตัวอย่างแบบไม่ทำซ้ำสูตรที่กำหนดจะถูกปรับตามค่า ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างแบบไม่ซ้ำโดยเฉลี่ยคือ:
และ .
เพราะ จะน้อยกว่าเสมอ ดังนั้นตัวคูณ () จะน้อยกว่า 1 เสมอ ซึ่งหมายความว่าข้อผิดพลาดโดยเฉลี่ยระหว่างการเลือกแบบไม่ซ้ำจะน้อยกว่าระหว่างการเลือกซ้ำเสมอ
การสุ่มตัวอย่างทางกลใช้เมื่อมีการเรียงลำดับประชากรทั่วไปด้วยวิธีใดวิธีหนึ่ง (เช่น รายชื่อผู้มีสิทธิเลือกตั้งเรียงตามตัวอักษร หมายเลขโทรศัพท์ เลขที่บ้าน เลขที่อพาร์ตเมนต์) การเลือกหน่วยจะดำเนินการในช่วงเวลาหนึ่งซึ่งเท่ากับค่าผกผันของเปอร์เซ็นต์การสุ่มตัวอย่าง ดังนั้น ด้วยตัวอย่าง 2% ทุก ๆ 50 หน่วย = 1/0.02 จะถูกเลือก โดยมีตัวอย่าง 5% ทุก ๆ 1/0.05 = 20 หน่วยของประชากรทั่วไป
จุดอ้างอิงถูกเลือกด้วยวิธีต่างๆ: แบบสุ่ม จากกึ่งกลางของช่วงเวลา โดยมีการเปลี่ยนแปลงในจุดอ้างอิง สิ่งสำคัญคือการหลีกเลี่ยงข้อผิดพลาดอย่างเป็นระบบ ตัวอย่างเช่น ด้วยตัวอย่าง 5% หากหน่วยแรกคือหน่วยที่ 13 หน่วยถัดไปคือ 33, 53, 73 เป็นต้น
ในแง่ของความแม่นยำ การเลือกทางกลนั้นใกล้เคียงกับการสุ่มตัวอย่างจริง ดังนั้น เพื่อกำหนดความคลาดเคลื่อนโดยเฉลี่ยของการสุ่มตัวอย่างเชิงกล จึงใช้สูตรการคัดเลือกแบบสุ่มที่เหมาะสม
ที่ การเลือกทั่วไป ประชากรที่ถูกสำรวจเบื้องต้นจะแบ่งออกเป็นกลุ่มที่เป็นเนื้อเดียวกันและคล้ายคลึงกัน ตัวอย่างเช่น เมื่อสำรวจวิสาหกิจ อาจเป็นอุตสาหกรรม ภาคส่วนย่อย เมื่อศึกษาประชากร อาจเป็นภูมิภาค สังคม หรือกลุ่มอายุ จากนั้นจะทำการเลือกอย่างอิสระจากแต่ละกลุ่มโดยใช้กลไกหรือแบบสุ่มล้วนๆ
การสุ่มตัวอย่างโดยทั่วไปจะให้ผลลัพธ์ที่แม่นยำมากกว่าวิธีอื่นๆ การพิมพ์ประชากรทั่วไปช่วยให้แน่ใจว่าแต่ละกลุ่มการพิมพ์จะแสดงอยู่ในตัวอย่าง ซึ่งทำให้สามารถขจัดอิทธิพลของความแปรปรวนระหว่างกลุ่มที่มีต่อข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยได้ ดังนั้นเมื่อค้นหาข้อผิดพลาดของกลุ่มตัวอย่างทั่วไปตามกฎการเพิ่มความแปรปรวน () จำเป็นต้องคำนึงถึงเฉพาะค่าเฉลี่ยของความแปรปรวนกลุ่มเท่านั้น ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยคือ:
เมื่อทำการคัดเลือกใหม่
,
ด้วยการเลือกแบบไม่ซ้ำซาก
,
ที่ไหน - ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มในกลุ่มตัวอย่าง
การเลือกแบบอนุกรม (หรือรัง)
ใช้เมื่อแบ่งประชากรออกเป็นชุดหรือกลุ่มก่อนเริ่มการสำรวจตัวอย่าง ซีรีส์เหล่านี้สามารถบรรจุภัณฑ์ของผลิตภัณฑ์สำเร็จรูป กลุ่มนักเรียน ทีม ชุดการตรวจสอบจะถูกเลือกโดยกลไกหรือแบบสุ่ม และภายในชุดจะมีการตรวจสอบหน่วยอย่างต่อเนื่อง ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจึงขึ้นอยู่กับความแปรปรวนระหว่างกลุ่ม (interseries) เท่านั้น ซึ่งคำนวณโดยสูตร:
โดยที่ r คือจำนวนซีรี่ส์ที่เลือก
- ค่าเฉลี่ยของซีรีส์ i-th
ข้อผิดพลาดในการสุ่มตัวอย่างอนุกรมโดยเฉลี่ยได้รับการคำนวณ:
เมื่อทำการเลือกใหม่:
,
ด้วยการเลือกแบบไม่ซ้ำกัน:
,
โดยที่ R คือจำนวนตอนทั้งหมด
รวมการเลือกเป็นการผสมผสานวิธีการคัดเลือกที่พิจารณาแล้ว
ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับวิธีการสุ่มตัวอย่างใดๆ ขึ้นอยู่กับขนาดสัมบูรณ์ของกลุ่มตัวอย่างเป็นหลัก และขึ้นอยู่กับเปอร์เซ็นต์ของกลุ่มตัวอย่างในระดับที่น้อยกว่า สมมติว่ามีการสังเกต 225 ครั้งในกรณีแรกจากประชากร 4,500 หน่วย และกรณีที่ 2 จากประชากร 225,000 หน่วย ความแปรปรวนในทั้งสองกรณีจะเท่ากับ 25 จากนั้นในกรณีแรก เมื่อเลือก 5% ข้อผิดพลาดในการสุ่มตัวอย่างจะเป็น:
ในกรณีที่สอง เมื่อเลือก 0.1% จะเท่ากับ:
ดังนั้นเมื่อเปอร์เซ็นต์การสุ่มตัวอย่างลดลง 50 เท่า ข้อผิดพลาดในการสุ่มตัวอย่างเพิ่มขึ้นเล็กน้อย เนื่องจากขนาดตัวอย่างไม่เปลี่ยนแปลง
สมมติว่าขนาดตัวอย่างเพิ่มขึ้นเป็น 625 การสังเกต ในกรณีนี้ ข้อผิดพลาดในการสุ่มตัวอย่างคือ:
การเพิ่มตัวอย่าง 2.8 เท่าด้วยขนาดประชากรเท่ากันจะช่วยลดขนาดของข้อผิดพลาดในการสุ่มตัวอย่างได้มากกว่า 1.6 เท่า
วิธีการและวิธีการสร้างประชากรตัวอย่าง
ในสถิติมีการใช้วิธีการต่างๆ ในการสร้างประชากรตัวอย่าง ซึ่งกำหนดโดยวัตถุประสงค์ของการศึกษาและขึ้นอยู่กับลักษณะเฉพาะของวัตถุประสงค์ของการศึกษา
เงื่อนไขหลักในการดำเนินการสำรวจตัวอย่างคือการป้องกันการเกิดข้อผิดพลาดอย่างเป็นระบบที่เกิดจากการละเมิดหลักการของโอกาสที่เท่าเทียมกันสำหรับแต่ละหน่วยของประชากรทั่วไปที่จะรวมไว้ในกลุ่มตัวอย่าง การป้องกันข้อผิดพลาดอย่างเป็นระบบทำได้โดยการใช้วิธีการทางวิทยาศาสตร์เพื่อสร้างประชากรตัวอย่าง
มีวิธีการเลือกหน่วยจากประชากรดังต่อไปนี้:
1) การเลือกรายบุคคล - เลือกแต่ละหน่วยสำหรับตัวอย่าง
2) การเลือกกลุ่ม - ตัวอย่างรวมถึงกลุ่มที่เป็นเนื้อเดียวกันหรือชุดของหน่วยที่กำลังศึกษาในเชิงคุณภาพ
3) การคัดเลือกแบบรวมคือการรวมกันของการเลือกรายบุคคลและกลุ่ม
วิธีการคัดเลือกถูกกำหนดโดยกฎสำหรับการสร้างประชากรตัวอย่าง
ตัวอย่างอาจเป็น:
- สุ่มจริงๆประกอบด้วยข้อเท็จจริงที่ว่าประชากรตัวอย่างเกิดขึ้นจากการสุ่มเลือกหน่วยแต่ละหน่วยจากประชากรทั่วไปโดยการสุ่ม (โดยไม่ได้ตั้งใจ) ในกรณีนี้ จำนวนหน่วยที่เลือกในประชากรตัวอย่างมักจะถูกกำหนดตามสัดส่วนตัวอย่างที่ยอมรับ สัดส่วนตัวอย่างคืออัตราส่วนของจำนวนหน่วยในประชากรตัวอย่าง n ต่อจำนวนหน่วยในประชากรทั่วไป N เช่น
- เครื่องกลประกอบด้วยการเลือกหน่วยในประชากรตัวอย่างโดยเลือกจากประชากรทั่วไปโดยแบ่งเป็นช่วงเท่าๆ กัน (กลุ่ม) ในกรณีนี้ ขนาดของช่วงเวลาในประชากรจะเท่ากับค่าผกผันของสัดส่วนตัวอย่าง ดังนั้น ด้วยตัวอย่าง 2% ทุกๆ หน่วยที่ 50 จะถูกเลือก (1:0.02) โดยมีตัวอย่าง 5% ทุกๆ หน่วยที่ 20 (1:0.05) เป็นต้น ดังนั้น ตามสัดส่วนการคัดเลือกที่ยอมรับ ประชากรทั่วไปจึงถูกแบ่งโดยอัตโนมัติออกเป็นกลุ่มที่มีขนาดเท่ากัน จากแต่ละกลุ่ม จะมีการเลือกเพียงหนึ่งหน่วยสำหรับตัวอย่างเท่านั้น
- ทั่วไป -โดยที่ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่มทั่วไปที่เป็นเนื้อเดียวกันก่อน จากนั้น จากกลุ่มทั่วไปแต่ละกลุ่ม จะมีการใช้ตัวอย่างแบบสุ่มหรือตัวอย่างเชิงกลเพื่อเลือกหน่วยต่างๆ ในกลุ่มตัวอย่าง คุณลักษณะที่สำคัญของกลุ่มตัวอย่างทั่วไปคือ ให้ผลลัพธ์ที่แม่นยำมากกว่าเมื่อเปรียบเทียบกับวิธีอื่นๆ ในการเลือกหน่วยในประชากรตัวอย่าง
- อนุกรม- โดยที่ประชากรทั่วไปแบ่งออกเป็นกลุ่มที่มีขนาดเท่ากัน - อนุกรม ชุดข้อมูลจะถูกเลือกในกลุ่มประชากรตัวอย่าง ภายในอนุกรม จะมีการสังเกตหน่วยที่รวมอยู่ในอนุกรมอย่างต่อเนื่อง
- รวมกัน- การสุ่มตัวอย่างสามารถเป็นสองขั้นตอน ในกรณีนี้ ประชากรจะถูกแบ่งออกเป็นกลุ่มก่อน จากนั้นจะมีการเลือกกลุ่ม และภายในกลุ่มหลังจะมีการเลือกแต่ละหน่วย
ในสถิติ มีวิธีการเลือกหน่วยในประชากรตัวอย่างดังนี้:
- ขั้นตอนเดียวการสุ่มตัวอย่าง - แต่ละหน่วยที่เลือกจะต้องได้รับการศึกษาทันทีตามเกณฑ์ที่กำหนด (การสุ่มตัวอย่างและการสุ่มตัวอย่างแบบอนุกรมที่เหมาะสม)
- หลายขั้นตอนการสุ่มตัวอย่าง - การเลือกจะทำจากประชากรทั่วไปของแต่ละกลุ่ม และเลือกแต่ละหน่วยจากกลุ่ม (การสุ่มตัวอย่างทั่วไปด้วยวิธีเชิงกลในการเลือกหน่วยเข้าไปในประชากรตัวอย่าง)
นอกจากนี้ยังมี:
- การคัดเลือกใหม่- ตามรูปแบบการคืนบอล ในกรณีนี้ แต่ละหน่วยหรือซีรีส์ที่รวมอยู่ในตัวอย่างจะถูกส่งกลับไปยังประชากรทั่วไป ดังนั้นจึงมีโอกาสที่จะรวมไว้ในตัวอย่างอีกครั้ง
- เลือกซ้ำ- ตามแผนบอลที่ไม่ถูกคืน ให้ผลลัพธ์ที่แม่นยำยิ่งขึ้นด้วยขนาดตัวอย่างที่เท่ากัน
การกำหนดขนาดตัวอย่างที่ต้องการ (โดยใช้ตารางทีของนักเรียน)
หลักการทางวิทยาศาสตร์ประการหนึ่งในทฤษฎีการสุ่มตัวอย่างคือต้องแน่ใจว่าได้เลือกหน่วยในจำนวนที่เพียงพอ ตามทฤษฎี ความจำเป็นในการปฏิบัติตามหลักการนี้แสดงไว้ในบทพิสูจน์ทฤษฎีบทขีดจำกัดในทฤษฎีความน่าจะเป็น ซึ่งทำให้สามารถกำหนดปริมาตรของหน่วยที่ควรเลือกจากประชากรเพื่อให้เพียงพอและรับประกันความเป็นตัวแทนของกลุ่มตัวอย่าง
การลดลงของข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐานและดังนั้นความแม่นยำของการประมาณการที่เพิ่มขึ้นจึงสัมพันธ์กับการเพิ่มขนาดตัวอย่างเสมอดังนั้นในขั้นตอนของการจัดระเบียบการสังเกตตัวอย่างจึงจำเป็นต้องตัดสินใจว่าขนาดของตัวอย่างจะขนาดไหน ประชากรตัวอย่างควรอยู่เพื่อให้แน่ใจว่าผลการสังเกตมีความถูกต้องแม่นยำ การคำนวณขนาดตัวอย่างที่ต้องการสร้างขึ้นโดยใช้สูตรที่ได้มาจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด (A) ซึ่งสอดคล้องกับประเภทและวิธีการเลือกเฉพาะ ดังนั้น สำหรับการสุ่มขนาดตัวอย่างซ้ำ (n) เรามี:
สาระสำคัญของสูตรนี้คือ ด้วยการสุ่มเลือกหมายเลขที่ต้องการซ้ำ ขนาดตัวอย่างจะเป็นสัดส่วนโดยตรงกับกำลังสองของสัมประสิทธิ์ความเชื่อมั่น (ที2)และความแปรปรวนของคุณลักษณะแปรผัน (?2) และแปรผกผันกับกำลังสองของค่าคลาดเคลื่อนตัวอย่างสูงสุด (?2) โดยเฉพาะอย่างยิ่ง เมื่อค่าความผิดพลาดสูงสุดเพิ่มขึ้น 2 เท่า ขนาดตัวอย่างที่ต้องการจะลดลง 4 เท่า จากพารามิเตอร์ทั้งสามตัวนั้น ผู้วิจัยเป็นผู้กำหนดสองตัว (t และ?)
ขณะเดียวกันผู้วิจัยก็อาศัยจากวัตถุประสงค์และวัตถุประสงค์ของการสำรวจตัวอย่าง คำถามจะต้องได้รับการแก้ไข: ควรรวมพารามิเตอร์เหล่านี้ไว้ในชุดค่าผสมเชิงปริมาณใดเพื่อให้แน่ใจว่าเป็นตัวเลือกที่เหมาะสมที่สุด ในกรณีหนึ่ง เขาอาจพอใจกับความน่าเชื่อถือของผลลัพธ์ที่ได้รับ (t) มากกว่าการวัดความแม่นยำ (?) ในอีกทางหนึ่ง - ในทางกลับกัน การแก้ไขปัญหาเกี่ยวกับค่าของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดนั้นยากกว่า เนื่องจากผู้วิจัยไม่มีตัวบ่งชี้นี้ในขั้นตอนการออกแบบการสังเกตตัวอย่าง ดังนั้นในทางปฏิบัติจึงเป็นเรื่องปกติที่จะตั้งค่าของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด โดยปกติจะอยู่ภายใน 10% ของระดับเฉลี่ยที่คาดหวังของแอตทริบิวต์ การสร้างค่าเฉลี่ยโดยประมาณสามารถทำได้หลายวิธี: การใช้ข้อมูลจากการสำรวจครั้งก่อนที่คล้ายกัน หรือใช้ข้อมูลจากกรอบการสุ่มตัวอย่างและดำเนินการตัวอย่างนำร่องขนาดเล็ก
สิ่งที่ยากที่สุดในการออกแบบการสังเกตตัวอย่างคือพารามิเตอร์ที่สามในสูตร (5.2) - การกระจายตัวของประชากรตัวอย่าง ในกรณีนี้จำเป็นต้องใช้ข้อมูลทั้งหมดตามที่ผู้วิจัยได้รับจากการสำรวจที่คล้ายกันและการสำรวจนำร่องที่ดำเนินการก่อนหน้านี้
คำถามเกี่ยวกับคำจำกัดความขนาดตัวอย่างที่ต้องการจะซับซ้อนมากขึ้นหากการสำรวจการสุ่มตัวอย่างเกี่ยวข้องกับการศึกษาคุณลักษณะหลายประการของหน่วยสุ่มตัวอย่าง ในกรณีนี้ ระดับเฉลี่ยของแต่ละลักษณะและการแปรผันตามกฎจะแตกต่างกัน ดังนั้นการตัดสินใจว่าความแปรปรวนใดของลักษณะที่จะให้ความสำคัญนั้นเป็นไปได้โดยคำนึงถึงวัตถุประสงค์และวัตถุประสงค์ของ สำรวจ.
เมื่อออกแบบการสังเกตตัวอย่าง ค่าที่กำหนดไว้ล่วงหน้าของข้อผิดพลาดในการสุ่มตัวอย่างที่อนุญาตจะถือว่าเป็นไปตามวัตถุประสงค์ของการศึกษาเฉพาะและความน่าจะเป็นของข้อสรุปตามผลการสังเกต
โดยทั่วไป สูตรสำหรับข้อผิดพลาดสูงสุดของค่าเฉลี่ยตัวอย่างช่วยให้เราสามารถระบุ:
ขนาดความเบี่ยงเบนที่เป็นไปได้ของตัวบ่งชี้ประชากรทั่วไปจากตัวบ่งชี้ประชากรตัวอย่าง
ขนาดตัวอย่างที่ต้องการ เพื่อให้มั่นใจถึงความแม่นยำที่ต้องการ ซึ่งขีดจำกัดของข้อผิดพลาดที่เป็นไปได้จะไม่เกินค่าที่ระบุ
ความน่าจะเป็นที่ข้อผิดพลาดในตัวอย่างจะมีขีดจำกัดที่ระบุ
การกระจายตัวของนักเรียนในทฤษฎีความน่าจะเป็น มันเป็นกลุ่มพารามิเตอร์เดียวของการแจกแจงต่อเนื่องอย่างแน่นอน
อนุกรมไดนามิก (ช่วงเวลา, โมเมนต์), อนุกรมไดนามิกปิด
ซีรี่ส์ไดนามิก- นี่คือค่าของตัวชี้วัดทางสถิติที่นำเสนอตามลำดับเวลาที่แน่นอน
แต่ละอนุกรมเวลาประกอบด้วยสององค์ประกอบ:
1) ตัวบ่งชี้ช่วงเวลา (ปี ไตรมาส เดือน วัน หรือวันที่)
2) ตัวบ่งชี้ที่แสดงลักษณะของวัตถุที่กำลังศึกษาตามช่วงเวลาหรือวันที่ที่เกี่ยวข้องซึ่งเรียกว่าระดับอนุกรม
ระดับของซีรีส์จะแสดงออกมาทั้งค่าสัมบูรณ์และค่าเฉลี่ยหรือค่าสัมพัทธ์ ขึ้นอยู่กับลักษณะของตัวบ่งชี้ อนุกรมเวลาของค่าสัมบูรณ์ ค่าสัมพัทธ์ และค่าเฉลี่ยจะถูกสร้างขึ้น อนุกรมไดนามิกจากค่าสัมพัทธ์และค่าเฉลี่ยถูกสร้างขึ้นบนพื้นฐานของอนุกรมที่ได้รับของค่าสัมบูรณ์ มีอนุกรมช่วงเวลาและโมเมนต์ของไดนามิก
อนุกรมช่วงไดนามิกมีค่าตัวบ่งชี้สำหรับช่วงระยะเวลาหนึ่ง ในอนุกรมช่วงเวลา สามารถสรุประดับต่างๆ เพื่อให้ได้ปริมาตรของปรากฏการณ์ในช่วงเวลาที่นานขึ้น หรือที่เรียกว่าผลรวมสะสม
ซีรีส์ช่วงเวลาแบบไดนามิกสะท้อนถึงค่าของตัวชี้วัด ณ จุดใดจุดหนึ่ง (วันที่เวลา) ในซีรีส์โมเมนต์ ผู้วิจัยอาจสนใจเพียงความแตกต่างของปรากฏการณ์ที่สะท้อนถึงการเปลี่ยนแปลงระดับของซีรีส์ระหว่างวันที่กำหนด เนื่องจากผลรวมของระดับที่นี่ไม่มีเนื้อหาที่แท้จริง ผลรวมสะสมจะไม่ถูกคำนวณที่นี่
เงื่อนไขที่สำคัญที่สุดสำหรับการสร้างอนุกรมเวลาที่ถูกต้องคือความสามารถในการเปรียบเทียบระดับของอนุกรมที่อยู่ในช่วงเวลาต่างๆ ระดับจะต้องนำเสนอในปริมาณที่เป็นเนื้อเดียวกัน และจะต้องมีความสมบูรณ์เท่ากันของความครอบคลุมของส่วนต่างๆ ของปรากฏการณ์
เพื่อที่จะเพื่อหลีกเลี่ยงการบิดเบือนของไดนามิกที่แท้จริง ในการศึกษาเชิงสถิติจะมีการคำนวณเบื้องต้น (ปิดอนุกรมไดนามิก) ซึ่งอยู่หน้าการวิเคราะห์ทางสถิติของอนุกรมเวลา การปิดซีรีย์ไดนามิกนั้นเข้าใจว่าเป็นการรวมกันเป็นซีรีย์เดียวจากสองซีรีย์ขึ้นไป โดยระดับของซีรีย์นั้นคำนวณโดยใช้วิธีการที่แตกต่างกัน หรือไม่สอดคล้องกับขอบเขตอาณาเขต เป็นต้น การปิดซีรีส์ไดนามิกอาจหมายความถึงการนำระดับสัมบูรณ์ของซีรีส์ไดนามิกมาสู่พื้นฐานทั่วไป ซึ่งจะทำให้ระดับของซีรีส์ไดนามิกที่ไม่มีใครเทียบได้เป็นกลาง
แนวคิดเรื่องความสามารถในการเปรียบเทียบอนุกรมไดนามิก สัมประสิทธิ์ การเติบโต และอัตราการเติบโต
ซีรี่ส์ไดนามิก- เป็นชุดของตัวบ่งชี้ทางสถิติที่แสดงถึงพัฒนาการของปรากฏการณ์ทางธรรมชาติและสังคมเมื่อเวลาผ่านไป คอลเลกชันทางสถิติที่เผยแพร่โดยคณะกรรมการสถิติแห่งรัฐของรัสเซียประกอบด้วยชุดไดนามิกจำนวนมากในรูปแบบตาราง อนุกรมไดนามิกทำให้สามารถระบุรูปแบบของการพัฒนาปรากฏการณ์ที่กำลังศึกษาได้
ซีรี่ส์ Dynamics มีตัวบ่งชี้สองประเภท ตัวบ่งชี้เวลา(ปี ไตรมาส เดือน ฯลฯ) หรือจุดในเวลา (ต้นปี ต้นเดือนของแต่ละเดือน เป็นต้น) ตัวบ่งชี้ระดับแถว. ตัวบ่งชี้ระดับของชุดไดนามิกสามารถแสดงเป็นค่าสัมบูรณ์ (การผลิตผลิตภัณฑ์เป็นตันหรือรูเบิล) ค่าสัมพัทธ์ (ส่วนแบ่งของประชากรในเมืองเป็น %) และค่าเฉลี่ย (ค่าจ้างเฉลี่ยของคนงานในอุตสาหกรรมต่อปี ฯลฯ) ในรูปแบบตาราง อนุกรมเวลาประกอบด้วยสองคอลัมน์หรือสองแถว
การสร้างอนุกรมเวลาที่ถูกต้องจำเป็นต้องปฏิบัติตามข้อกำหนดหลายประการ:
- ตัวชี้วัดทั้งหมดของชุดของพลวัตจะต้องมีพื้นฐานทางวิทยาศาสตร์และเชื่อถือได้
- ตัวบ่งชี้ของชุดของไดนามิกจะต้องเปรียบเทียบกันได้เมื่อเวลาผ่านไปเช่น จะต้องคำนวณในช่วงเวลาเดียวกันหรือวันเดียวกัน
- ตัวบ่งชี้ของพลวัตจำนวนหนึ่งจะต้องเปรียบเทียบได้ทั่วทั้งอาณาเขต
- ตัวบ่งชี้ของชุดของไดนามิกจะต้องเปรียบเทียบได้ในเนื้อหาเช่น คำนวณตามวิธีการเดียวในลักษณะเดียวกัน
- ตัวชี้วัดของการเปลี่ยนแปลงจำนวนหนึ่งควรจะสามารถเปรียบเทียบได้ตลอดช่วงของฟาร์มที่นำมาพิจารณา ตัวบ่งชี้ทั้งหมดของชุดไดนามิกจะต้องได้รับในหน่วยการวัดเดียวกัน
ตัวชี้วัดทางสถิติสามารถบอกลักษณะผลลัพธ์ของกระบวนการที่กำลังศึกษาในช่วงเวลาหนึ่งหรือสถานะของปรากฏการณ์ที่กำลังศึกษา ณ จุดใดจุดหนึ่งได้ เช่น ตัวบ่งชี้สามารถเป็นช่วงเวลา (เป็นระยะ) และชั่วขณะ ดังนั้น ในตอนแรกอนุกรมไดนามิกสามารถเป็นได้ทั้งช่วงเวลาหรือโมเมนต์ อนุกรมโมเมนต์ไดนามิกส์อาจมีช่วงเวลาเท่ากันหรือไม่เท่ากันก็ได้
ซีรีย์ไดนามิกดั้งเดิมสามารถเปลี่ยนเป็นชุดของค่าเฉลี่ยและชุดของค่าสัมพัทธ์ (ลูกโซ่และพื้นฐาน) อนุกรมเวลาดังกล่าวเรียกว่าอนุกรมเวลาที่ได้รับ
วิธีการคำนวณระดับเฉลี่ยในชุดไดนามิกจะแตกต่างกัน ขึ้นอยู่กับประเภทของซีรีส์ไดนามิก จากตัวอย่าง เราจะพิจารณาประเภทของชุดไดนามิกและสูตรสำหรับการคำนวณระดับเฉลี่ย
เพิ่มขึ้นอย่างแน่นอน (∆y) แสดงจำนวนหน่วยที่ระดับต่อมาของซีรีส์มีการเปลี่ยนแปลงเมื่อเปรียบเทียบกับระดับก่อนหน้า (gr. 3. - การเพิ่มขึ้นแบบสัมบูรณ์ของลูกโซ่) หรือเปรียบเทียบกับระดับเริ่มต้น (gr. 4. - การเพิ่มขึ้นแบบสัมบูรณ์พื้นฐาน) สูตรการคำนวณสามารถเขียนได้ดังนี้:
เมื่อค่าสัมบูรณ์ของอนุกรมลดลง ก็จะมี “ลดลง” หรือ “ลดลง” ตามลำดับ
ตัวชี้วัดการเติบโตที่แน่นอนบ่งชี้ว่าตัวอย่างเช่นในปี 1998 การผลิตผลิตภัณฑ์ "A" เพิ่มขึ้น 4,000 ตันเมื่อเทียบกับปี 1997 และ 34,000 ตันเมื่อเทียบกับปี 1994 สำหรับปีอื่นๆ ดูตาราง 11.5 กรัม 3 และ 4.
อัตราการเจริญเติบโตแสดงจำนวนครั้งที่ระดับของซีรีส์มีการเปลี่ยนแปลงเมื่อเทียบกับระดับก่อนหน้า (gr. 5 - ค่าสัมประสิทธิ์ลูกโซ่ของการเติบโตหรือการลดลง) หรือเปรียบเทียบกับระดับเริ่มต้น (gr. 6 - สัมประสิทธิ์พื้นฐานของการเติบโตหรือการลดลง) สูตรการคำนวณสามารถเขียนได้ดังนี้:
อัตราการเจริญเติบโตแสดงเปอร์เซ็นต์ของระดับถัดไปของซีรีส์เมื่อเปรียบเทียบกับระดับก่อนหน้า (กรัม 7 - อัตราการเติบโตของห่วงโซ่) หรือเปรียบเทียบกับระดับเริ่มต้น (กรัม 8 - อัตราการเติบโตพื้นฐาน) สูตรการคำนวณสามารถเขียนได้ดังนี้:
ตัวอย่างเช่นในปี 1997 ปริมาณการผลิตผลิตภัณฑ์ "A" เทียบกับปี 1996 คือ 105.5% (
อัตราการเจริญเติบโตแสดงเป็นเปอร์เซ็นต์ของระดับของระยะเวลาการรายงานที่เพิ่มขึ้นเมื่อเทียบกับระดับก่อนหน้า (คอลัมน์ 9 - อัตราการเติบโตของห่วงโซ่) หรือเปรียบเทียบกับระดับเริ่มต้น (คอลัมน์ 10 - อัตราการเติบโตพื้นฐาน) สูตรการคำนวณสามารถเขียนได้ดังนี้:
T pr = T r - 100% หรือ T pr = การเติบโตสัมบูรณ์ / ระดับของช่วงก่อนหน้า * 100%
ตัวอย่างเช่นในปี 1996 เมื่อเทียบกับปี 1995 ผลิตภัณฑ์ "A" ผลิตขึ้น 3.8% (103.8% - 100%) หรือมากขึ้น (8:210)x100% และเมื่อเทียบกับปี 1994 - 9% (109% - 100%)
หากระดับสัมบูรณ์ในชุดข้อมูลลดลง อัตราจะน้อยกว่า 100% และจะมีอัตราการลดลงตามไปด้วย (อัตราการเพิ่มขึ้นที่มีเครื่องหมายลบ)
ค่าสัมบูรณ์เพิ่มขึ้น 1%(คอลัมน์ 11) แสดงจำนวนหน่วยที่ต้องผลิตในช่วงเวลาที่กำหนด เพื่อให้ระดับของช่วงก่อนหน้าเพิ่มขึ้น 1% ในตัวอย่างของเราในปี 1995 จำเป็นต้องผลิต 2.0 พันตันและในปี 1998 - 2.3 พันตันนั่นคือ ใหญ่กว่ามาก
ค่าสัมบูรณ์ของการเติบโต 1% สามารถกำหนดได้สองวิธี:
ระดับของช่วงเวลาก่อนหน้านี้หารด้วย 100
การเพิ่มขึ้นแบบสัมบูรณ์ของลูกโซ่จะถูกหารด้วยอัตราการเติบโตของลูกโซ่ที่สอดคล้องกัน
ค่าสัมบูรณ์เพิ่มขึ้น 1% =
ในการเปลี่ยนแปลง โดยเฉพาะอย่างยิ่งในระยะยาว การวิเคราะห์อัตราการเติบโตร่วมกับเนื้อหาของการเพิ่มหรือลดลงแต่ละเปอร์เซ็นต์เป็นสิ่งสำคัญ
โปรดทราบว่าวิธีการที่พิจารณาสำหรับการวิเคราะห์อนุกรมเวลานั้นใช้ได้กับทั้งอนุกรมเวลาซึ่งระดับจะแสดงเป็นค่าสัมบูรณ์ (t, พันรูเบิล, จำนวนพนักงาน ฯลฯ ) และสำหรับอนุกรมเวลาซึ่งเป็นระดับที่ แสดงเป็นตัวบ่งชี้สัมพัทธ์ (% ของข้อบกพร่อง % ปริมาณเถ้าของถ่านหิน ฯลฯ ) หรือค่าเฉลี่ย (ผลผลิตเฉลี่ยเป็น c/ha ค่าจ้างเฉลี่ย ฯลฯ )
นอกเหนือจากตัวบ่งชี้การวิเคราะห์ที่พิจารณาแล้ว ซึ่งคำนวณในแต่ละปีโดยเปรียบเทียบกับระดับก่อนหน้าหรือระดับเริ่มต้น เมื่อวิเคราะห์ชุดไดนามิกส์ จำเป็นต้องคำนวณตัวบ่งชี้การวิเคราะห์โดยเฉลี่ยสำหรับช่วงเวลานั้น: ระดับเฉลี่ยของชุดข้อมูล การเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ยต่อปี (ลดลง) และอัตราการเติบโตเฉลี่ยต่อปีและอัตราการเติบโต
วิธีการคำนวณระดับเฉลี่ยของชุดของไดนามิกถูกกล่าวถึงข้างต้น ในซีรีย์ไดนามิกตามช่วงเวลาที่เรากำลังพิจารณา ระดับเฉลี่ยของซีรีย์นั้นคำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตอย่างง่าย:
ปริมาณการผลิตเฉลี่ยต่อปีของผลิตภัณฑ์ พ.ศ. 2537-2541 มีจำนวน 218.4 พันตัน
การเติบโตแบบสัมบูรณ์โดยเฉลี่ยต่อปียังคำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตอย่างง่าย:
การเพิ่มขึ้นที่แน่นอนต่อปีแตกต่างกันไปในช่วงหลายปีที่ผ่านมาตั้งแต่ 4 ถึง 12,000 ตัน (ดูคอลัมน์ 3) และการเพิ่มขึ้นเฉลี่ยต่อปีของการผลิตในช่วงปี 1995 - 1998 มีจำนวน 8.5 พันตัน
วิธีการคำนวณอัตราการเติบโตเฉลี่ยและอัตราการเติบโตเฉลี่ยต้องพิจารณารายละเอียดเพิ่มเติม ให้เราพิจารณาโดยใช้ตัวอย่างของตัวบ่งชี้ระดับอนุกรมประจำปีที่ระบุในตาราง
ระดับเฉลี่ยของซีรีย์ไดนามิก
อนุกรมไดนามิก (หรืออนุกรมเวลา)- ค่าเหล่านี้เป็นค่าตัวเลขของตัวบ่งชี้ทางสถิติบางอย่างในช่วงเวลาหรือช่วงระยะเวลาต่อเนื่องกัน (เช่น จัดเรียงตามลำดับเวลา)
มีการเรียกค่าตัวเลขของตัวบ่งชี้ทางสถิติหนึ่งหรือตัวอื่นที่ประกอบเป็นชุดไดนามิก ระดับซีรีส์และมักจะแสดงด้วยตัวอักษร ย. ภาคแรกของซีรีส์ คุณ 1เรียกว่าเริ่มต้นหรือ ระดับพื้นฐานและอันสุดท้าย ใช่ - สุดท้าย. ช่วงเวลาหรือช่วงเวลาที่เกี่ยวข้องกับระดับที่กำหนดโดย ที.
โดยปกติแล้วซีรีส์ Dynamics จะแสดงในรูปแบบของตารางหรือกราฟ และมาตราส่วนเวลาจะถูกสร้างขึ้นตามแกน Abscissa ทีและตามแกนกำหนด - สเกลของระดับอนุกรม ย.
ตัวชี้วัดเฉลี่ยของซีรีย์ไดนามิก
ไดนามิกแต่ละชุดถือได้ว่าเป็นชุดที่แน่นอน nตัวชี้วัดที่แปรผันตามเวลาที่สามารถสรุปเป็นค่าเฉลี่ยได้ ตัวบ่งชี้ทั่วไป (โดยเฉลี่ย) ดังกล่าวมีความจำเป็นอย่างยิ่งเมื่อเปรียบเทียบการเปลี่ยนแปลงของตัวบ่งชี้เฉพาะในช่วงเวลาต่างๆ ในประเทศต่างๆ เป็นต้น
คุณสมบัติทั่วไปของซีรีย์ไดนามิกสามารถให้บริการได้ ประการแรกคือ ระดับแถวกลาง. วิธีการคำนวณระดับเฉลี่ยขึ้นอยู่กับว่าอนุกรมนั้นเป็นอนุกรมชั่วขณะหรือเป็นช่วง (คาบ)
เมื่อไร ช่วงเวลาของอนุกรม ระดับเฉลี่ยจะถูกกำหนดโดยสูตรของค่าเฉลี่ยเลขคณิตอย่างง่ายของระดับของอนุกรม เช่น
=
ถ้ามี ช่วงเวลาแถวที่มี nระดับ ( ย1, y2, …, ยิน) โดยมีช่วงเวลาเท่ากันระหว่างวันที่ (เวลา) ดังนั้นชุดดังกล่าวจึงสามารถแปลงเป็นชุดของค่าเฉลี่ยได้อย่างง่ายดาย ในกรณีนี้ ตัวบ่งชี้ (ระดับ) ที่จุดเริ่มต้นของแต่ละช่วงเวลาจะเป็นตัวบ่งชี้ที่จุดสิ้นสุดของช่วงเวลาก่อนหน้าพร้อมกัน จากนั้นค่าเฉลี่ยของตัวบ่งชี้สำหรับแต่ละช่วงเวลา (ช่วงเวลาระหว่างวันที่) สามารถคำนวณได้เท่ากับครึ่งหนึ่งของผลรวมของค่า ที่ในตอนต้นและปลายงวดเช่น ยังไง . จำนวนค่าเฉลี่ยดังกล่าวจะเป็น ตามที่ระบุไว้ข้างต้น สำหรับชุดของค่าเฉลี่ย ระดับเฉลี่ยจะคำนวณโดยใช้ค่าเฉลี่ยเลขคณิต
ดังนั้นเราจึงสามารถเขียนได้ว่า:
.
หลังจากแปลงตัวเศษแล้วเราจะได้:
,
ที่ไหน Y1และ ยิน— ระดับแรกและสุดท้ายของแถว ยี่— ระดับกลาง.
ค่าเฉลี่ยนี้เป็นที่รู้จักในสถิติว่า ลำดับเหตุการณ์โดยเฉลี่ยสำหรับซีรี่ส์ช่วงเวลา ได้ชื่อมาจากคำว่า "cronos" (เวลา, ภาษาละติน) เนื่องจากคำนวณจากตัวบ่งชี้ที่เปลี่ยนแปลงไปตามกาลเวลา
ในกรณีที่ไม่เท่ากันช่วงเวลาระหว่างวันที่ ค่าเฉลี่ยตามลำดับเวลาสำหรับอนุกรมช่วงเวลาสามารถคำนวณได้เป็นค่าเฉลี่ยเลขคณิตของค่าเฉลี่ยของระดับสำหรับแต่ละคู่ช่วงเวลา โดยถ่วงน้ำหนักด้วยระยะทาง (ช่วงเวลา) ระหว่างวันที่ เช่น
.
ในกรณีนี้สันนิษฐานว่าในช่วงเวลาระหว่างวันที่ ระดับใช้ค่าที่แตกต่างกัน และเราเป็นหนึ่งในสองค่าที่ทราบ ( ยี่และ ยี่+1) เรากำหนดค่าเฉลี่ย จากนั้นเราจะคำนวณค่าเฉลี่ยโดยรวมสำหรับช่วงเวลาที่วิเคราะห์ทั้งหมด
หากจะถือว่าแต่ละค่า ยี่ยังคงไม่เปลี่ยนแปลงจนกว่าจะถึงครั้งต่อไป (ฉัน+ 1)-
ช่วงเวลาที่นั่นคือ หากทราบวันที่แน่นอนของการเปลี่ยนแปลงระดับ การคำนวณสามารถทำได้โดยใช้สูตรค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
,
โดยที่ช่วงเวลาที่ระดับยังคงไม่เปลี่ยนแปลง
นอกเหนือจากระดับเฉลี่ยในชุดไดนามิกแล้ว ยังมีการคำนวณตัวบ่งชี้เฉลี่ยอื่น ๆ - การเปลี่ยนแปลงโดยเฉลี่ยในระดับของซีรีส์ (วิธีพื้นฐานและลูกโซ่) อัตราการเปลี่ยนแปลงโดยเฉลี่ย
เส้นฐานหมายถึงการเปลี่ยนแปลงโดยสมบูรณ์คือผลหารของการเปลี่ยนแปลงสัมบูรณ์ล่าสุดหารด้วยจำนวนการเปลี่ยนแปลง นั่นคือ
โซ่ หมายถึง การเปลี่ยนแปลงโดยสมบูรณ์ ระดับของอนุกรมคือผลหารของการหารผลรวมของการเปลี่ยนแปลงสัมบูรณ์ของลูกโซ่ทั้งหมดด้วยจำนวนการเปลี่ยนแปลงนั่นคือ
สัญญาณของการเปลี่ยนแปลงสัมบูรณ์โดยเฉลี่ยยังใช้เพื่อตัดสินลักษณะของการเปลี่ยนแปลงในปรากฏการณ์โดยเฉลี่ย: การเติบโต การลดลง หรือความมั่นคง
จากกฎสำหรับการควบคุมการเปลี่ยนแปลงพื้นฐานและการเปลี่ยนแปลงสัมบูรณ์ของลูกโซ่ การเปลี่ยนแปลงขั้นพื้นฐานและค่าเฉลี่ยลูกโซ่จะต้องเท่ากัน
นอกจากการเปลี่ยนแปลงสัมบูรณ์ของค่าเฉลี่ยแล้ว ค่าเฉลี่ยสัมพัทธ์ยังถูกคำนวณโดยใช้วิธีพื้นฐานและแบบลูกโซ่อีกด้วย
การเปลี่ยนแปลงสัมพัทธ์เฉลี่ยพื้นฐานกำหนดโดยสูตร:
การเปลี่ยนแปลงสัมพัทธ์ของค่าเฉลี่ยลูกโซ่กำหนดโดยสูตร:
โดยธรรมชาติแล้ว การเปลี่ยนแปลงสัมพัทธ์พื้นฐานและค่าเฉลี่ยลูกโซ่จะต้องเหมือนกัน และเมื่อเปรียบเทียบกับค่าเกณฑ์ 1 จะได้ข้อสรุปเกี่ยวกับธรรมชาติของการเปลี่ยนแปลงในปรากฏการณ์โดยเฉลี่ย ได้แก่ การเติบโต การลดลง หรือความมั่นคง
โดยการลบ 1 ออกจากการเปลี่ยนแปลงสัมพัทธ์ของค่าเฉลี่ยฐานหรือลูกโซ่ ค่าที่สอดคล้องกัน อัตราการเปลี่ยนแปลงโดยเฉลี่ยโดยสัญญาณที่สามารถตัดสินลักษณะของการเปลี่ยนแปลงในปรากฏการณ์ที่กำลังศึกษาได้ซึ่งสะท้อนให้เห็นจากชุดของพลวัตนี้
ความผันผวนตามฤดูกาลและดัชนีฤดูกาล
ความผันผวนตามฤดูกาลมีความผันผวนภายในปีคงที่
หลักการพื้นฐานของการจัดการเพื่อให้ได้ผลสูงสุดคือการเพิ่มรายได้สูงสุดและลดค่าใช้จ่ายให้เหลือน้อยที่สุด จากการศึกษาความผันผวนตามฤดูกาล ปัญหาของสมการสูงสุดจะได้รับการแก้ไขในแต่ละระดับของปี
เมื่อศึกษาความผันผวนตามฤดูกาล ปัญหาสองประการที่เกี่ยวข้องกันได้รับการแก้ไข:
1. การระบุลักษณะเฉพาะของการพัฒนาปรากฏการณ์ในพลวัตระหว่างปี
2. การวัดความผันผวนตามฤดูกาลด้วยการสร้างแบบจำลองคลื่นตามฤดูกาล
ในการวัดการเปลี่ยนแปลงตามฤดูกาล มักจะนับไก่งวงตามฤดูกาล โดยทั่วไป สมการเหล่านี้จะถูกกำหนดโดยอัตราส่วนของสมการเริ่มต้นของอนุกรมไดนามิกต่อสมการทางทฤษฎี ซึ่งทำหน้าที่เป็นพื้นฐานสำหรับการเปรียบเทียบ
เนื่องจากการเบี่ยงเบนแบบสุ่มซ้อนทับกับความผันผวนตามฤดูกาล ดัชนีฤดูกาลจึงถูกเฉลี่ยเพื่อกำจัดสิ่งเหล่านั้น
ในกรณีนี้ ในแต่ละช่วงของรอบปี ตัวบ่งชี้ทั่วไปจะถูกกำหนดในรูปแบบของดัชนีฤดูกาลโดยเฉลี่ย:
ดัชนีความผันผวนตามฤดูกาลโดยเฉลี่ยจะปราศจากอิทธิพลของการเบี่ยงเบนแบบสุ่มของแนวโน้มการพัฒนาหลัก
สูตรสำหรับดัชนีฤดูกาลโดยเฉลี่ยอาจมีรูปแบบต่อไปนี้ ขึ้นอยู่กับลักษณะของแนวโน้ม
1.สำหรับชุดของพลวัตภายในปีพร้อมแนวโน้มการพัฒนาหลักที่แสดงออกมาอย่างชัดเจน:
2. สำหรับชุดของพลวัตระหว่างปีซึ่งไม่มีแนวโน้มเพิ่มขึ้นหรือลดลงหรือไม่มีนัยสำคัญ:
ค่าเฉลี่ยโดยรวมอยู่ที่ไหน
วิธีการวิเคราะห์แนวโน้มหลัก
การพัฒนาปรากฏการณ์เมื่อเวลาผ่านไปได้รับอิทธิพลจากปัจจัยที่มีลักษณะแตกต่างกันและความแข็งแกร่งของอิทธิพล บางส่วนมีลักษณะสุ่ม บางส่วนมีผลกระทบเกือบคงที่และสร้างแนวโน้มการพัฒนาบางอย่างในพลวัต
งานสำคัญของสถิติคือการระบุไดนามิกของเทรนด์เป็นอนุกรม โดยปราศจากอิทธิพลของปัจจัยสุ่มต่างๆ เพื่อจุดประสงค์นี้ อนุกรมเวลาจะถูกประมวลผลโดยวิธีการขยายช่วงเวลา ค่าเฉลี่ยเคลื่อนที่ และการปรับระดับเชิงวิเคราะห์ ฯลฯ
วิธีการขยายช่วงขึ้นอยู่กับการขยายช่วงเวลาซึ่งรวมถึงระดับของชุดของไดนามิก เช่น คือการแทนที่ข้อมูลที่เกี่ยวข้องกับช่วงเวลาที่สั้นด้วยข้อมูลในช่วงเวลาที่ใหญ่ขึ้น โดยเฉพาะอย่างยิ่งเมื่อระดับเริ่มต้นของซีรีส์เกี่ยวข้องกับช่วงเวลาสั้นๆ ตัวอย่างเช่น ชุดตัวบ่งชี้ที่เกี่ยวข้องกับเหตุการณ์รายวันจะถูกแทนที่ด้วยชุดที่เกี่ยวข้องกับรายสัปดาห์ รายเดือน ฯลฯ จะแสดงให้เห็นได้ชัดเจนยิ่งขึ้น “แกนการพัฒนาปรากฏการณ์”. ค่าเฉลี่ยที่คำนวณตามช่วงเวลาที่ขยาย ช่วยให้เราสามารถระบุทิศทางและธรรมชาติ (การเร่งหรือการชะลอตัวของการเติบโต) ของแนวโน้มการพัฒนาหลัก
วิธีค่าเฉลี่ยเคลื่อนที่คล้ายกับครั้งก่อน แต่ในกรณีนี้ระดับจริงจะถูกแทนที่ด้วยระดับเฉลี่ยที่คำนวณสำหรับช่วงเวลาที่ขยาย (เลื่อน) ตามลำดับซึ่งครอบคลุม มระดับซีรีส์
ตัวอย่างเช่นถ้าเรายอมรับ ม.=3,จากนั้นคำนวณค่าเฉลี่ยของสามระดับแรกของซีรีส์ก่อนจากนั้น - จากจำนวนระดับเดียวกัน แต่เริ่มจากระดับที่สองจากนั้น - เริ่มจากระดับที่สามเป็นต้น ดังนั้นค่าเฉลี่ยของ "สไลด์" ในชุดไดนามิกจะเคลื่อนที่ไปทีละเทอม คำนวณจาก มสมาชิก ค่าเฉลี่ยเคลื่อนที่หมายถึงจุดกึ่งกลาง (กึ่งกลาง) ของแต่ละช่วงเวลา
วิธีนี้จะกำจัดความผันผวนแบบสุ่มเท่านั้น หากชุดข้อมูลมีคลื่นตามฤดูกาล ค่าดังกล่าวจะคงอยู่แม้ว่าจะปรับให้เรียบแล้วโดยใช้วิธีค่าเฉลี่ยเคลื่อนที่ก็ตาม
การจัดตำแหน่งเชิงวิเคราะห์ เพื่อขจัดความผันผวนแบบสุ่มและระบุแนวโน้ม จึงมีการใช้การปรับระดับของระดับอนุกรมโดยใช้สูตรการวิเคราะห์ (หรือการปรับระดับเชิงวิเคราะห์) สาระสำคัญของมันคือการแทนที่ระดับเชิงประจักษ์ (จริง) ด้วยระดับเชิงทฤษฎี ซึ่งคำนวณโดยใช้สมการบางอย่างที่ใช้เป็นแบบจำลองแนวโน้มทางคณิตศาสตร์ โดยที่ระดับทางทฤษฎีถือเป็นฟังก์ชันของเวลา: ในกรณีนี้ แต่ละระดับจริงจะถือเป็นผลรวมของสององค์ประกอบ: โดยที่ องค์ประกอบที่เป็นระบบและแสดงโดยสมการหนึ่ง และเป็นตัวแปรสุ่มที่ทำให้เกิดความผันผวนรอบแนวโน้ม
งานการจัดตำแหน่งเชิงวิเคราะห์มีดังต่อไปนี้:
1. การกำหนดประเภทของฟังก์ชันสมมุติที่สามารถสะท้อนแนวโน้มการพัฒนาของตัวบ่งชี้ที่กำลังศึกษาอยู่บนพื้นฐานของข้อมูลจริงได้อย่างเหมาะสมที่สุด
2. ค้นหาพารามิเตอร์ของฟังก์ชันที่ระบุ (สมการ) จากข้อมูลเชิงประจักษ์
3. การคำนวณโดยใช้สมการที่พบของระดับทางทฤษฎี (แนว)
ตามกฎแล้วการเลือกฟังก์ชันเฉพาะนั้นดำเนินการบนพื้นฐานของการแสดงข้อมูลเชิงประจักษ์แบบกราฟิก
แบบจำลองคือสมการการถดถอย ซึ่งพารามิเตอร์ต่างๆ คำนวณโดยใช้วิธีกำลังสองน้อยที่สุด
ด้านล่างนี้คือสมการการถดถอยที่ใช้บ่อยที่สุดสำหรับการจัดลำดับอนุกรมเวลา ซึ่งบ่งชี้ว่าแนวโน้มการพัฒนาแบบใดที่เหมาะสมที่สุดสำหรับการสะท้อน
เพื่อค้นหาพารามิเตอร์ของสมการข้างต้นมีอัลกอริธึมพิเศษและโปรแกรมคอมพิวเตอร์ โดยเฉพาะอย่างยิ่ง หากต้องการค้นหาพารามิเตอร์ของสมการเส้นตรง สามารถใช้อัลกอริธึมต่อไปนี้:
หากมีการกำหนดหมายเลขช่วงเวลาหรือช่วงเวลาเพื่อให้ St = 0 อัลกอริทึมข้างต้นจะง่ายขึ้นอย่างมากและเปลี่ยนเป็น
ระดับที่จัดเรียงไว้บนกราฟจะอยู่บนเส้นตรงเส้นเดียว โดยผ่านระยะทางที่ใกล้ที่สุดจากระดับจริงของซีรีย์ไดนามิกนี้ ผลรวมของการเบี่ยงเบนกำลังสองเป็นการสะท้อนถึงอิทธิพลของปัจจัยสุ่ม
เมื่อใช้มัน เราจะคำนวณค่าคลาดเคลื่อนโดยเฉลี่ย (มาตรฐาน) ของสมการ:
โดยที่ n คือจำนวนการสังเกต และ m คือจำนวนพารามิเตอร์ในสมการ (เรามีสองตัวคือ b 1 และ b 0)
แนวโน้มหลัก (แนวโน้ม) แสดงให้เห็นว่าปัจจัยที่เป็นระบบมีอิทธิพลต่อระดับของชุดของไดนามิกอย่างไร และความผันผวนของระดับรอบแนวโน้ม () ทำหน้าที่เป็นตัววัดอิทธิพลของปัจจัยคงเหลือ
เพื่อประเมินคุณภาพของแบบจำลองอนุกรมเวลาที่ใช้ ก็จะใช้เช่นกัน การทดสอบ F ของฟิชเชอร์. เป็นอัตราส่วนของความแปรปรวนสองค่า กล่าวคือ อัตราส่วนของความแปรปรวนที่เกิดจากการถดถอย กล่าวคือ ปัจจัยที่กำลังศึกษาถึงความแปรปรวนที่เกิดจากสาเหตุที่สุ่ม ได้แก่ การกระจายตัวของสารตกค้าง:
ในรูปแบบขยายสามารถนำเสนอสูตรสำหรับเกณฑ์นี้ได้ดังนี้:
โดยที่ n คือจำนวนการสังเกตเช่น จำนวนระดับแถว
m คือจำนวนพารามิเตอร์ในสมการ y คือระดับที่แท้จริงของอนุกรม
ระดับแถวเรียงกัน-ระดับแถวกลาง
โมเดลที่ประสบความสำเร็จมากกว่าโมเดลอื่นอาจไม่ได้น่าพึงพอใจเพียงพอเสมอไป สามารถรับรู้ได้เฉพาะในกรณีที่เกณฑ์ F ข้ามขีดจำกัดวิกฤตที่ทราบเท่านั้น ขอบเขตนี้กำหนดขึ้นโดยใช้ตารางการแจกแจงแบบ F
สาระสำคัญและการจำแนกดัชนี
ในสถิติ ดัชนีถือเป็นตัวบ่งชี้สัมพัทธ์ที่แสดงลักษณะการเปลี่ยนแปลงขนาดของปรากฏการณ์ในเวลา พื้นที่ หรือเมื่อเปรียบเทียบกับมาตรฐานใดๆ
องค์ประกอบหลักของความสัมพันธ์ดัชนีคือค่าที่จัดทำดัชนี ค่าที่จัดทำดัชนีเข้าใจว่าเป็นมูลค่าของคุณลักษณะของประชากรทางสถิติ การเปลี่ยนแปลงซึ่งเป็นเป้าหมายของการศึกษา
เมื่อใช้ดัชนี งานหลักสามประการจะได้รับการแก้ไข:
1) การประเมินการเปลี่ยนแปลงในปรากฏการณ์ที่ซับซ้อน
2) การกำหนดอิทธิพลของปัจจัยส่วนบุคคลต่อการเปลี่ยนแปลงในปรากฏการณ์ที่ซับซ้อน
3) การเปรียบเทียบขนาดของปรากฏการณ์กับขนาดของช่วงเวลาที่ผ่านมา ขนาดของดินแดนอื่น ตลอดจนมาตรฐาน แผนงาน และการพยากรณ์
ดัชนีจำแนกตามเกณฑ์ 3 ประการ:
2) ตามระดับความครอบคลุมขององค์ประกอบของประชากร
3) ตามวิธีการคำนวณดัชนีทั่วไป
ตามเนื้อหาปริมาณที่จัดทำดัชนี ดัชนีจะแบ่งออกเป็นดัชนีตัวบ่งชี้เชิงปริมาณ (ปริมาณ) และดัชนีตัวบ่งชี้เชิงคุณภาพ ดัชนีตัวชี้วัดเชิงปริมาณ - ดัชนีปริมาณทางกายภาพของผลิตภัณฑ์อุตสาหกรรม, ปริมาณการขายทางกายภาพ, จำนวนพนักงาน ฯลฯ ดัชนีตัวชี้วัดเชิงคุณภาพ - ดัชนีราคา, ต้นทุน, ผลิตภาพแรงงาน, ค่าจ้างเฉลี่ย ฯลฯ
ตามระดับความครอบคลุมของหน่วยประชากร ดัชนีจะแบ่งออกเป็นสองประเภท: รายบุคคลและทั่วไป เพื่ออธิบายลักษณะเหล่านี้ เราแนะนำแบบแผนต่อไปนี้ที่นำมาใช้ในการฝึกใช้วิธีดัชนี:
ถาม- ปริมาณ (ปริมาตร) ของผลิตภัณฑ์ใด ๆ ในแง่กายภาพ ; ร- ราคาต่อหน่วย; z- ต้นทุนต่อหน่วยการผลิต ที— เวลาที่ใช้ในการผลิตหน่วยผลิตภัณฑ์ (ความเข้มข้นของแรงงาน) ; ว- การผลิตผลิตภัณฑ์ในแง่มูลค่าต่อหน่วยเวลา โวลต์- ผลผลิตในแง่กายภาพต่อหน่วยเวลา ต— เวลาทั้งหมดที่ใช้หรือจำนวนพนักงาน
เพื่อแยกแยะว่าปริมาณที่จัดทำดัชนีเป็นของช่วงเวลาหรือวัตถุใด เป็นเรื่องปกติที่จะวางตัวห้อยไว้ที่มุมขวาล่างของสัญลักษณ์ที่เกี่ยวข้อง ตัวอย่างเช่นในดัชนีไดนามิกตามกฎแล้วตัวห้อย 1 จะถูกใช้สำหรับช่วงเวลาที่มีการเปรียบเทียบ (ปัจจุบันการรายงาน) และสำหรับช่วงเวลาที่ทำการเปรียบเทียบ
ดัชนีส่วนบุคคลทำหน้าที่อธิบายลักษณะการเปลี่ยนแปลงในแต่ละองค์ประกอบของปรากฏการณ์ที่ซับซ้อน (เช่นการเปลี่ยนแปลงปริมาณผลผลิตของผลิตภัณฑ์ประเภทหนึ่ง) พวกเขาแสดงถึงค่าสัมพัทธ์ของพลวัต, การปฏิบัติตามภาระผูกพัน, การเปรียบเทียบค่าที่จัดทำดัชนี
มีการกำหนดดัชนีแต่ละรายการของปริมาณทางกายภาพของผลิตภัณฑ์
จากมุมมองเชิงวิเคราะห์ ดัชนีไดนามิกที่กำหนดแต่ละรายการจะคล้ายกับค่าสัมประสิทธิ์การเติบโต (อัตรา) และแสดงลักษณะการเปลี่ยนแปลงของค่าที่จัดทำดัชนีในช่วงเวลาปัจจุบันเมื่อเปรียบเทียบกับช่วงฐาน เช่น พวกเขาแสดงจำนวนครั้งที่เพิ่มขึ้น (ลดลง) หรือโต(ลดลง)กี่เปอร์เซ็นต์ ค่าดัชนีจะแสดงเป็นค่าสัมประสิทธิ์หรือเปอร์เซ็นต์
ดัชนีทั่วไป (คอมโพสิต)สะท้อนการเปลี่ยนแปลงในทุกองค์ประกอบของปรากฏการณ์ที่ซับซ้อน
ดัชนีรวมเป็นรูปแบบพื้นฐานของดัชนี มันถูกเรียกว่ามวลรวมเพราะตัวเศษและส่วนเป็นชุดของ "มวลรวม"
ดัชนีเฉลี่ย คำจำกัดความ
นอกเหนือจากดัชนีรวมแล้ว ยังมีการใช้รูปแบบอื่นในสถิติ - ดัชนีถัวเฉลี่ยถ่วงน้ำหนัก การคำนวณจะใช้เมื่อข้อมูลที่มีอยู่ไม่อนุญาตให้คำนวณดัชนีรวมทั่วไป ดังนั้นหากไม่มีข้อมูลเกี่ยวกับราคา แต่มีข้อมูลเกี่ยวกับต้นทุนของผลิตภัณฑ์ในช่วงเวลาปัจจุบันและทราบดัชนีราคาแต่ละรายการสำหรับแต่ละผลิตภัณฑ์แล้วดัชนีราคาทั่วไปก็ไม่สามารถกำหนดเป็นดัชนีรวมได้ แต่เป็นไปได้ เพื่อคำนวณเป็นค่าเฉลี่ยของแต่ละบุคคล ในทำนองเดียวกัน หากไม่ทราบปริมาณของผลิตภัณฑ์แต่ละประเภทที่ผลิต แต่ทราบดัชนีแต่ละรายการและต้นทุนการผลิตในช่วงเวลาฐาน ดัชนีทั่วไปของปริมาณทางกายภาพของการผลิตสามารถกำหนดเป็นค่าเฉลี่ยถ่วงน้ำหนักได้ ค่า.
ดัชนีเฉลี่ย -นี้ดัชนีที่คำนวณเป็นค่าเฉลี่ยของแต่ละดัชนี ดัชนีรวมเป็นรูปแบบพื้นฐานของดัชนีทั่วไป ดังนั้นดัชนีเฉลี่ยจะต้องเหมือนกันกับดัชนีรวม เมื่อคำนวณดัชนีเฉลี่ย จะใช้ค่าเฉลี่ยสองรูปแบบ: เลขคณิตและฮาร์มอนิก
ดัชนีค่าเฉลี่ยเลขคณิตจะเหมือนกันกับดัชนีรวม หากน้ำหนักของดัชนีแต่ละรายการเป็นเงื่อนไขของตัวส่วนของดัชนีรวม เฉพาะในกรณีนี้ ค่าของดัชนีที่คำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตจะเท่ากับดัชนีรวม
ความคาดหวังและความแปรปรวน
ให้เราวัดตัวแปรสุ่ม เอ็นเช่นเราวัดความเร็วลมสิบครั้งแล้วต้องการหาค่าเฉลี่ย ค่าเฉลี่ยเกี่ยวข้องกับฟังก์ชันการแจกแจงอย่างไร
เราจะทอยลูกเต๋าเป็นจำนวนมาก จำนวนแต้มที่จะปรากฏบนลูกเต๋าในการโยนแต่ละครั้งเป็นตัวแปรสุ่มและสามารถรับค่าธรรมชาติใดๆ ได้ตั้งแต่ 1 ถึง 6 ค่าเฉลี่ยเลขคณิตของแต้มที่หล่นซึ่งคำนวณสำหรับการโยนลูกเต๋าทั้งหมดก็เป็นตัวแปรสุ่มเช่นกัน แต่สำหรับขนาดใหญ่ เอ็นมันมีแนวโน้มที่จะเป็นจำนวนที่เฉพาะเจาะจงมาก - ความคาดหวังทางคณิตศาสตร์ เอ็ม เอ็กซ์. ในกรณีนี้ เอ็ม เอ็กซ์ = 3,5.
คุณได้รับคุณค่านี้มาได้อย่างไร? ให้เข้า เอ็นการทดสอบ เมื่อคุณได้รับ 1 คะแนน เมื่อคุณได้รับ 2 คะแนน และอื่นๆ แล้วเมื่อไหร่ เอ็น→ ∞ จำนวนผลลัพธ์ที่มีการทอยหนึ่งแต้ม ในทำนองเดียวกัน ดังนั้น
รุ่น 4.5 ลูกเต๋า
ให้เราสมมติว่าเรารู้กฎการกระจายของตัวแปรสุ่ม xนั่นคือเรารู้ว่าตัวแปรสุ่ม xสามารถรับค่าได้ x 1 , x 2 , ..., เอ็กซ์ เคด้วยความน่าจะเป็น พี 1 , พี 2 , ..., พีเค.
มูลค่าที่คาดหวัง เอ็ม เอ็กซ์ตัวแปรสุ่ม xเท่ากับ:
คำตอบ. 2,8.
ความคาดหวังทางคณิตศาสตร์ไม่ใช่การประมาณการที่สมเหตุสมผลของตัวแปรสุ่มบางตัวเสมอไป ดังนั้นในการประมาณเงินเดือนโดยเฉลี่ยจึงสมเหตุสมผลกว่าที่จะใช้แนวคิดเรื่องค่ามัธยฐานนั่นคือค่าที่จำนวนผู้ที่ได้รับเงินเดือนต่ำกว่าค่ามัธยฐานและจำนวนที่มากกว่าตรงกัน
ค่ามัธยฐานตัวแปรสุ่มเรียกว่าตัวเลข x 1/2 เป็นเช่นนั้น พี (x < x 1/2) = 1/2.
กล่าวอีกนัยหนึ่งคือความน่าจะเป็น พี 1 ว่าตัวแปรสุ่ม xจะเล็กลง x 1/2 และความน่าจะเป็น พี 2 นั่นคือตัวแปรสุ่ม xจะยิ่งใหญ่กว่า x 1/2 เท่ากันและเท่ากับ 1/2 ค่ามัธยฐานไม่ได้ถูกกำหนดไว้โดยเฉพาะสำหรับการแจกแจงทั้งหมด
ลองกลับไปสู่ตัวแปรสุ่มกัน xซึ่งสามารถรับค่าได้ x 1 , x 2 , ..., เอ็กซ์ เคด้วยความน่าจะเป็น พี 1 , พี 2 , ..., พีเค.
ความแปรปรวนตัวแปรสุ่ม xค่าเฉลี่ยของค่าเบี่ยงเบนกำลังสองของตัวแปรสุ่มจากความคาดหวังทางคณิตศาสตร์เรียกว่า:
ตัวอย่างที่ 2
ภายใต้เงื่อนไขของตัวอย่างก่อนหน้านี้ ให้คำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม x.
คำตอบ. 0,16, 0,4.
รุ่น 4.6 การยิงไปที่เป้าหมาย
ตัวอย่างที่ 3
ค้นหาการกระจายความน่าจะเป็นของจำนวนแต้มที่ปรากฏบนลูกเต๋าในการโยนครั้งแรก ค่ามัธยฐาน ค่าคาดหวังทางคณิตศาสตร์ ความแปรปรวน และค่าเบี่ยงเบนมาตรฐาน
ขอบใดๆ มีโอกาสหลุดออกเท่าๆ กัน ดังนั้นการกระจายจะมีลักษณะดังนี้:
ค่าเบี่ยงเบนมาตรฐาน จะเห็นได้ว่าค่าเบี่ยงเบนจากค่าเฉลี่ยมีขนาดใหญ่มาก
คุณสมบัติของความคาดหวังทางคณิตศาสตร์:
- ความคาดหวังทางคณิตศาสตร์ของผลรวมของตัวแปรสุ่มอิสระเท่ากับผลรวมของความคาดหวังทางคณิตศาสตร์:
ตัวอย่างที่ 4
ค้นหาความคาดหวังทางคณิตศาสตร์ของผลรวมและผลคูณของแต้มที่ทอยบนลูกเต๋าสองลูก
ในตัวอย่างที่ 3 เราพบว่าสำหรับหนึ่งลูกบาศก์ ม (x) = 3.5 ดังนั้นสำหรับสองลูกบาศก์
คุณสมบัติการกระจายตัว:
- ความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระเท่ากับผลรวมของความแปรปรวน:
ดีเอ็กซ์ + ย = ดีเอ็กซ์ + ดี.
ปล่อยให้ เอ็นทอยลูกเต๋า ยคะแนน แล้ว
ผลลัพธ์นี้เป็นจริงไม่เพียงแต่สำหรับการทอยลูกเต๋าเท่านั้น ในหลายกรณี จะกำหนดความแม่นยำในการวัดความคาดหวังทางคณิตศาสตร์เชิงประจักษ์ จะเห็นได้ว่าด้วยจำนวนการวัดที่เพิ่มขึ้น เอ็นการแพร่กระจายของค่ารอบค่าเฉลี่ยซึ่งก็คือส่วนเบี่ยงเบนมาตรฐานจะลดลงตามสัดส่วน
ความแปรปรวนของตัวแปรสุ่มสัมพันธ์กับความคาดหวังทางคณิตศาสตร์ของกำลังสองของตัวแปรสุ่มนี้โดยความสัมพันธ์ต่อไปนี้:
ลองหาความคาดหวังทางคณิตศาสตร์ของทั้งสองด้านของความเท่าเทียมกันนี้กัน A-ไพรเออรี่
ความคาดหวังทางคณิตศาสตร์ของด้านขวาของความเท่าเทียมกันตามคุณสมบัติของความคาดหวังทางคณิตศาสตร์จะเท่ากับ
ส่วนเบี่ยงเบนมาตรฐาน
ส่วนเบี่ยงเบนมาตรฐานเท่ากับรากที่สองของความแปรปรวน:
เมื่อกำหนดค่าเบี่ยงเบนมาตรฐานสำหรับประชากรที่กำลังศึกษาในปริมาณมากเพียงพอ (n > 30) จะใช้สูตรต่อไปนี้:
ข้อมูลที่เกี่ยวข้อง.
ในการทดสอบสมมติฐานทางสถิติ เมื่อทำการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม
ส่วนเบี่ยงเบนมาตรฐาน:
ส่วนเบี่ยงเบนมาตรฐาน(ค่าประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม พื้น ผนังรอบตัวเรา และเพดาน xสัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง):
การกระจายตัวอยู่ที่ไหน - พื้น ผนังรอบตัวเรา และเพดาน ฉันองค์ประกอบที่ 3 ของการเลือก - ขนาดตัวอย่าง; - ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง:
ควรสังเกตว่าการประมาณการทั้งสองมีความลำเอียง ในกรณีทั่วไป ไม่สามารถสร้างการประมาณการที่เป็นกลางได้ อย่างไรก็ตาม การประมาณการตามการประมาณค่าความแปรปรวนที่เป็นกลางมีความสอดคล้องกัน
กฎสามซิกมา
กฎสามซิกมา() - ค่าเกือบทั้งหมดของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลา เข้มงวดมากขึ้น - ด้วยความเชื่อมั่นไม่ต่ำกว่า 99.7% ค่าของตัวแปรสุ่มแบบกระจายแบบปกติจะอยู่ในช่วงที่ระบุ (โดยมีเงื่อนไขว่าค่าเป็นจริงและไม่ได้รับจากการประมวลผลตัวอย่าง)
หากไม่ทราบมูลค่าที่แท้จริง เราก็ไม่ควรใช้ แต่พื้น ผนังรอบตัวเรา และเพดาน ส. ดังนั้น กฎสามซิกมาจึงเปลี่ยนเป็นกฎสามชั้น ผนังรอบตัวเรา และเพดาน ส .
การตีความค่าส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐานที่มีค่ามากจะแสดงค่าสเปรดจำนวนมากในชุดที่นำเสนอพร้อมกับค่าเฉลี่ยของชุด ค่าเล็กน้อยแสดงว่าค่าในชุดจัดกลุ่มอยู่รอบค่ากลาง
ตัวอย่างเช่น เรามีชุดตัวเลขสามชุด: (0, 0, 14, 14), (0, 6, 8, 14) และ (6, 6, 8, 8) ทั้งสามชุดมีค่าเฉลี่ยเท่ากับ 7 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 7, 5 และ 1 ตามลำดับ ชุดสุดท้ายมีค่าเบี่ยงเบนมาตรฐานเล็กน้อยเนื่องจากค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ชุดแรกมีค่าเบี่ยงเบนมาตรฐานที่ใหญ่ที่สุด - ค่าภายในชุดแตกต่างจากค่าเฉลี่ยอย่างมาก
โดยทั่วไปแล้ว ค่าเบี่ยงเบนมาตรฐานถือได้ว่าเป็นการวัดความไม่แน่นอน ตัวอย่างเช่น ในวิชาฟิสิกส์ ค่าเบี่ยงเบนมาตรฐานใช้ในการระบุข้อผิดพลาดของชุดการวัดปริมาณบางค่าที่ต่อเนื่องกัน ค่านี้มีความสำคัญมากในการพิจารณาความน่าเชื่อถือของปรากฏการณ์ภายใต้การศึกษาเมื่อเปรียบเทียบกับค่าที่ทำนายโดยทฤษฎี: หากค่าเฉลี่ยของการวัดแตกต่างอย่างมากจากค่าที่ทำนายโดยทฤษฎี (ส่วนเบี่ยงเบนมาตรฐานขนาดใหญ่) ดังนั้นควรตรวจสอบค่าที่ได้รับหรือวิธีการรับอีกครั้ง
การใช้งานจริง
ในทางปฏิบัติ ค่าเบี่ยงเบนมาตรฐานช่วยให้คุณสามารถกำหนดได้ว่าค่าในชุดอาจแตกต่างจากค่าเฉลี่ยมากน้อยเพียงใด
ภูมิอากาศ
สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนบก เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าค่าเบี่ยงเบนมาตรฐานของเมืองที่สอง แม้ว่าค่าเฉลี่ยของค่านี้จะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่อุณหภูมิอากาศสูงสุดบน วันใดวันหนึ่งของปีจะสูงกว่าแตกต่างจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในแผ่นดิน
กีฬา
สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าที่ดีกว่า บนพารามิเตอร์เพิ่มเติม ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าใด ผลลัพธ์ของทีมก็จะยิ่งคาดเดาได้มากขึ้นเท่านั้น ทีมดังกล่าวจะมีความสมดุล ในทางกลับกัน ทีมที่มีค่าเบี่ยงเบนมาตรฐานสูงนั้นยากที่จะคาดเดาผลลัพธ์ ซึ่งในทางกลับกัน อธิบายได้จากความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่การโจมตีที่อ่อนแอ
การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและจุดอ่อนของทีม และดังนั้นวิธีการต่อสู้ที่เลือก
การวิเคราะห์ทางเทคนิค
ดูสิ่งนี้ด้วย
วรรณกรรม
บทความนี้เสนอให้ลบ
คำอธิบายเหตุผลและการสนทนาที่เกี่ยวข้องสามารถพบได้ในหน้า Wikipedia: จะถูกลบ/17 ธันวาคม 2012 |
* โบโรวิคอฟ, วี.สถิติ. ศิลปะการวิเคราะห์ข้อมูลบนคอมพิวเตอร์: สำหรับมืออาชีพ / V. Borovikov - เซนต์ปีเตอร์สเบิร์ก. : ปีเตอร์, 2546. - 688 น. - ไอ 5-272-00078-1.
ตัวชี้วัดทางสถิติ | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
บรรยาย สถิติ |
|
||||||||||
เชิงสถิติ เอาท์พุทและ การตรวจสอบ สมมติฐาน |
|
นักคณิตศาสตร์และนักสถิติที่ชาญฉลาดได้คิดค้นตัวบ่งชี้ที่น่าเชื่อถือมากขึ้น แม้ว่าจะมีจุดประสงค์ที่แตกต่างกันเล็กน้อยก็ตาม ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย. ตัวบ่งชี้นี้เป็นการระบุลักษณะการวัดการกระจายตัวของค่าของชุดข้อมูลรอบค่าเฉลี่ย
ในการแสดงการวัดการกระจายของข้อมูล คุณต้องตัดสินใจก่อนว่าจะคำนวณการกระจายนี้ว่าใด ซึ่งโดยปกติจะเป็นค่าเฉลี่ย ถัดไปคุณต้องคำนวณว่าค่าของชุดข้อมูลที่วิเคราะห์นั้นอยู่ห่างจากค่าเฉลี่ยมากน้อยเพียงใด เห็นได้ชัดว่าแต่ละค่าสอดคล้องกับค่าเบี่ยงเบนที่แน่นอน แต่เราสนใจในการประเมินโดยรวมซึ่งครอบคลุมประชากรทั้งหมด ดังนั้นค่าเบี่ยงเบนเฉลี่ยจึงคำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตปกติ แต่! แต่เพื่อที่จะคำนวณค่าเฉลี่ยของการเบี่ยงเบนนั้น จะต้องบวกเข้าด้วยกันก่อน และถ้าเราบวกจำนวนบวกและลบ พวกมันจะหักล้างกัน และผลรวมของพวกมันจะมีแนวโน้มเป็นศูนย์ เพื่อหลีกเลี่ยงปัญหานี้ การเบี่ยงเบนทั้งหมดจะถูกนำมาใช้แบบโมดูโล กล่าวคือ จำนวนลบทั้งหมดจะกลายเป็นบวก ตอนนี้ค่าเบี่ยงเบนเฉลี่ยจะแสดงการวัดโดยทั่วไปของการแพร่กระจายของค่า เป็นผลให้ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยจะถูกคำนวณโดยใช้สูตร:
ก– ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย
x– ตัวบ่งชี้ที่วิเคราะห์ โดยมีขีดด้านบน – ค่าเฉลี่ยของตัวบ่งชี้
n– จำนวนค่าในชุดข้อมูลที่วิเคราะห์
ฉันหวังว่าตัวดำเนินการรวมจะไม่ทำให้ใครกลัว
ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยที่คำนวณโดยใช้สูตรที่ระบุสะท้อนถึงค่าเบี่ยงเบนสัมบูรณ์โดยเฉลี่ยจากค่าเฉลี่ยสำหรับประชากรที่กำหนด
ในภาพเส้นสีแดงคือค่าเฉลี่ย การเบี่ยงเบนของการสังเกตแต่ละครั้งจากค่าเฉลี่ยจะแสดงด้วยลูกศรเล็กๆ เป็นแบบโมดูโลและสรุปผล จากนั้นทุกอย่างจะถูกหารด้วยจำนวนค่า
เพื่อให้ภาพสมบูรณ์ เราต้องยกตัวอย่าง สมมติว่ามีบริษัทหนึ่งที่ผลิตใบตัดสำหรับพลั่ว การตัดแต่ละครั้งควรมีความยาว 1.5 เมตร แต่ที่สำคัญกว่านั้นคือทั้งหมดควรเท่ากันหรือบวกหรือลบ 5 ซม. เป็นอย่างน้อย อย่างไรก็ตาม คนงานที่ไม่ระมัดระวังจะตัดออก 1.2 ม. หรือ 1.8 ม. ผู้อยู่อาศัยในฤดูร้อนไม่พอใจ ผู้อำนวยการของบริษัทตัดสินใจทำการวิเคราะห์ทางสถิติเกี่ยวกับความยาวของการตัด ฉันเลือกชิ้นส่วน 10 ชิ้นแล้ววัดความยาว หาค่าเฉลี่ย และคำนวณค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย ค่าเฉลี่ยกลายเป็นเพียงสิ่งที่จำเป็น - 1.5 ม. แต่ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยอยู่ที่ 0.16 ม. ปรากฎว่าการตัดแต่ละครั้งยาวหรือสั้นกว่าที่ต้องการโดยเฉลี่ย 16 ซม. มีบางอย่างที่จะพูดคุยเกี่ยวกับ คนงาน อันที่จริง ฉันไม่เคยเห็นการใช้ตัวบ่งชี้นี้จริง ๆ เลย ดังนั้นฉันจึงคิดตัวอย่างขึ้นมาเอง อย่างไรก็ตาม มีตัวบ่งชี้ดังกล่าวในสถิติ
การกระจายตัว
เช่นเดียวกับค่าเบี่ยงเบนเชิงเส้นโดยเฉลี่ย ความแปรปรวนยังสะท้อนถึงขอบเขตของการแพร่กระจายของข้อมูลรอบๆ ค่าเฉลี่ยอีกด้วย
สูตรการคำนวณความแปรปรวนมีลักษณะดังนี้:
(สำหรับอนุกรมรูปแบบ (ผลต่างถ่วงน้ำหนัก))
(สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม (ความแปรปรวนอย่างง่าย))
โดยที่: σ 2 – การกระจายตัว สี– เราวิเคราะห์ตัวบ่งชี้ sq (ค่าของคุณลักษณะ), – ค่าเฉลี่ยของตัวบ่งชี้, f i – จำนวนค่าในชุดข้อมูลที่วิเคราะห์
การกระจายตัวคือกำลังสองเฉลี่ยของการเบี่ยงเบน
ขั้นแรกให้คำนวณค่าเฉลี่ย จากนั้นนำความแตกต่างระหว่างค่าดั้งเดิมและค่าเฉลี่ยแต่ละค่า ยกกำลังสอง คูณด้วยความถี่ของค่าแอตทริบิวต์ที่เกี่ยวข้อง เพิ่มแล้วหารด้วยจำนวนค่าในประชากร
อย่างไรก็ตาม ในรูปแบบบริสุทธิ์ เช่น ค่าเฉลี่ยเลขคณิตหรือดัชนี จะไม่มีการใช้การกระจายตัว ค่อนข้างเป็นตัวบ่งชี้เสริมและระดับกลางที่ใช้สำหรับการวิเคราะห์ทางสถิติประเภทอื่นๆ
วิธีง่ายๆ ในการคำนวณความแปรปรวน
ส่วนเบี่ยงเบนมาตรฐาน
หากต้องการใช้ความแปรปรวนในการวิเคราะห์ข้อมูล จะต้องหารากที่สองของความแปรปรวน ปรากฎสิ่งที่เรียกว่า ส่วนเบี่ยงเบนมาตรฐาน.
อย่างไรก็ตาม ค่าเบี่ยงเบนมาตรฐานเรียกอีกอย่างว่าซิกมา - จากอักษรกรีกที่แสดงถึงค่าดังกล่าว
แน่นอนว่าค่าเบี่ยงเบนมาตรฐานยังเป็นตัวกำหนดลักษณะการวัดการกระจายตัวของข้อมูล แต่ตอนนี้ (ไม่เหมือนกับความแปรปรวน) สามารถนำมาเปรียบเทียบกับข้อมูลต้นฉบับได้ ตามกฎแล้ว การวัดรากกำลังสองในสถิติจะให้ผลลัพธ์ที่แม่นยำมากกว่าการวัดเชิงเส้น ดังนั้น ค่าเบี่ยงเบนมาตรฐานจึงเป็นการวัดการกระจายตัวของข้อมูลที่แม่นยำมากกว่าค่าเบี่ยงเบนเฉลี่ยเชิงเส้น
เนื้อหาจากวิกิพีเดีย - สารานุกรมเสรี
ส่วนเบี่ยงเบนมาตรฐาน(คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนกำลังสอง; คำที่เกี่ยวข้อง: ส่วนเบี่ยงเบนมาตรฐาน, สเปรดมาตรฐาน) - ในทฤษฎีความน่าจะเป็นและสถิติ ตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าของตัวแปรสุ่มที่สัมพันธ์กับความคาดหวังทางคณิตศาสตร์ ด้วยอาร์เรย์ที่จำกัดของตัวอย่างค่า แทนที่จะใช้ความคาดหวังทางคณิตศาสตร์ จะใช้ค่าเฉลี่ยเลขคณิตของชุดตัวอย่าง
ข้อมูลพื้นฐาน
ค่าเบี่ยงเบนมาตรฐานวัดเป็นหน่วยของตัวแปรสุ่ม และใช้ในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต ในการสร้างช่วงความเชื่อมั่น ในการทดสอบสมมติฐานทางสถิติ และในการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม กำหนดให้เป็นรากที่สองของความแปรปรวนของตัวแปรสุ่ม
ส่วนเบี่ยงเบนมาตรฐาน:
ส่วนเบี่ยงเบนมาตรฐาน(การประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม xสัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง) :
กฎสามซิกมา
กฎสามซิกมา () - ค่าเกือบทั้งหมดของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลา . เข้มงวดมากขึ้น - ด้วยความน่าจะเป็นประมาณ 0.9973 ค่าของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลาที่ระบุ (โดยมีเงื่อนไขว่าค่า จริง และไม่ได้รับจากการประมวลผลตัวอย่าง)
ถ้าเห็นคุณค่าที่แท้จริง ไม่รู้จัก ก็ไม่ควรใช้ , ก ส. ดังนั้นกฎสามซิกมาจึงเปลี่ยนเป็นกฎสามซิกมา ส .
การตีความค่าส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐานที่มากขึ้นจะแสดงค่าสเปรดที่มากขึ้นในชุดที่นำเสนอพร้อมกับค่าเฉลี่ยของชุด ค่าที่น้อยกว่าแสดงว่าค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย
ตัวอย่างเช่น เรามีชุดตัวเลขสามชุด: (0, 0, 14, 14), (0, 6, 8, 14) และ (6, 6, 8, 8) ทั้งสามชุดมีค่าเฉลี่ยเท่ากับ 7 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 7, 5 และ 1 ตามลำดับ ชุดสุดท้ายมีค่าเบี่ยงเบนมาตรฐานเล็กน้อยเนื่องจากค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ชุดแรกมีค่าเบี่ยงเบนมาตรฐานที่ใหญ่ที่สุด - ค่าภายในชุดแตกต่างจากค่าเฉลี่ยอย่างมาก
โดยทั่วไปแล้ว ค่าเบี่ยงเบนมาตรฐานถือได้ว่าเป็นการวัดความไม่แน่นอน ตัวอย่างเช่น ในวิชาฟิสิกส์ ค่าเบี่ยงเบนมาตรฐานใช้ในการระบุข้อผิดพลาดของชุดการวัดปริมาณบางค่าที่ต่อเนื่องกัน ค่านี้มีความสำคัญมากในการพิจารณาความน่าเชื่อถือของปรากฏการณ์ภายใต้การศึกษาเมื่อเปรียบเทียบกับค่าที่ทำนายโดยทฤษฎี: หากค่าเฉลี่ยของการวัดแตกต่างอย่างมากจากค่าที่ทำนายโดยทฤษฎี (ส่วนเบี่ยงเบนมาตรฐานขนาดใหญ่) ดังนั้นควรตรวจสอบค่าที่ได้รับหรือวิธีการรับอีกครั้ง
การใช้งานจริง
ในทางปฏิบัติ ค่าเบี่ยงเบนมาตรฐานทำให้คุณสามารถประมาณค่าจากชุดหนึ่งที่อาจแตกต่างจากค่าเฉลี่ยได้
เศรษฐศาสตร์และการเงิน
ส่วนเบี่ยงเบนมาตรฐานของผลตอบแทนพอร์ตโฟลิโอ ระบุด้วยความเสี่ยงของพอร์ตการลงทุน
ภูมิอากาศ
สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนที่ราบ เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าค่าเบี่ยงเบนมาตรฐานของเมืองที่สอง แม้ว่าค่าเฉลี่ยของค่านี้จะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่อุณหภูมิอากาศสูงสุดบน วันใดวันหนึ่งของปีจะสูงกว่าแตกต่างจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในแผ่นดิน
กีฬา
สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าที่ดีกว่า บนพารามิเตอร์เพิ่มเติม ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าใด ผลลัพธ์ของทีมก็จะยิ่งคาดเดาได้มากขึ้นเท่านั้น ทีมดังกล่าวจะมีความสมดุล ในทางกลับกัน ทีมที่มีค่าเบี่ยงเบนมาตรฐานสูงนั้นยากที่จะคาดเดาผลลัพธ์ ซึ่งในทางกลับกัน อธิบายได้จากความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่การโจมตีที่อ่อนแอ
การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและจุดอ่อนของทีม และดังนั้นวิธีการต่อสู้ที่เลือก
ดูสิ่งนี้ด้วย
เขียนบทวิจารณ์เกี่ยวกับบทความ "Root Mean Square Deviation"
วรรณกรรม
- โบโรวิคอฟ วี.สถิติ. ศิลปะการวิเคราะห์ข้อมูลบนคอมพิวเตอร์: สำหรับมืออาชีพ / V. Borovikov - เซนต์ปีเตอร์สเบิร์ก. : ปีเตอร์, 2546. - 688 น. - ไอ 5-272-00078-1..
|
ข้อความที่ตัดตอนมาซึ่งแสดงถึงค่าเบี่ยงเบนมาตรฐาน
และรีบเปิดประตูเขาก็ก้าวออกไปที่ระเบียงพร้อมกับก้าวย่างเด็ดขาด บทสนทนาหยุดกะทันหัน หมวกและหมวกแก๊ปถูกถอดออก และทุกสายตาก็หันไปมองการนับคนที่ออกมา- สวัสดีทุกคน! - เคานต์พูดอย่างรวดเร็วและดัง - ขอบคุณที่มา. ฉันจะออกมาหาคุณตอนนี้ แต่ก่อนอื่นเราต้องจัดการกับคนร้ายก่อน เราต้องลงโทษคนร้ายที่ฆ่ามอสโกว รอฉันด้วย! “และเคานต์ก็รีบกลับไปที่ห้องของเขาและกระแทกประตูอย่างแน่นหนา
เสียงพึมพำแห่งความสุขวิ่งผ่านฝูงชน “นั่นหมายความว่าเขาจะควบคุมคนร้ายทั้งหมด! แล้วคุณพูดภาษาฝรั่งเศส... เขาจะให้คุณระยะทางทั้งหมด!” - ผู้คนพูดราวกับประณามกันเพราะขาดศรัทธา
ไม่กี่นาทีต่อมา เจ้าหน้าที่คนหนึ่งก็รีบออกมาจากประตูหน้า สั่งอะไรบางอย่าง และมังกรก็ลุกขึ้นยืน ฝูงชนจากระเบียงต่างกระตือรือร้นเคลื่อนตัวไปที่ระเบียง เดินออกไปที่ระเบียงด้วยความโกรธและรวดเร็ว Rostopchin รีบมองไปรอบ ๆ เขาราวกับกำลังมองหาใครบางคน
- เขาอยู่ที่ไหน? - นับกล่าวและในขณะเดียวกันเมื่อเขาพูดสิ่งนี้เขาเห็นจากมุมหนึ่งของบ้านออกมาระหว่างมังกรสองตัวมีชายหนุ่มผู้มีคอยาวบางโกนศีรษะครึ่งหนึ่งและรกเกินไป ชายหนุ่มคนนี้แต่งกายด้วยชุดที่ครั้งหนึ่งเคยเป็นโค้ตหนังแกะจิ้งจอกโทรมๆ ที่ดูหรูหรา คลุมด้วยผ้าสีน้ำเงิน และกางเกงฮาเร็มของนักโทษสกปรก ยัดไว้ในรองเท้าบูทบางๆ ที่ไม่สะอาดและชำรุด โซ่ตรวนแขวนไว้อย่างแน่นหนาบนขาที่บางและอ่อนแอของเขา ทำให้ชายหนุ่มเดินอย่างไม่แน่ใจได้ยาก
- อ! - Rastopchin กล่าวโดยรีบหันสายตาไปจากชายหนุ่มในเสื้อคลุมหนังแกะจิ้งจอกแล้วชี้ไปที่ขั้นล่างสุดของระเบียง - ว่างมันไว้ตรงนี้! “ชายหนุ่มคล้องโซ่ตรวน ก้าวอย่างแรงไปยังขั้นที่บอกไว้ จับปกเสื้อโค้ตหนังแกะที่กดนิ้วไว้ หมุนคอยาวสองครั้งแล้วถอนหายใจ พับมือบาง ๆ ที่ไม่ได้ใช้งานไว้ข้างหน้า ท้องของเขาด้วยท่าทางยอมแพ้
ความเงียบดำเนินต่อไปหลายวินาทีในขณะที่ชายหนุ่มวางตัวบนขั้นบันได มีเพียงคนแถวหลังที่อัดแน่นอยู่ในที่เดียวเท่านั้นที่ได้ยินเสียงคร่ำครวญ คร่ำครวญ ตัวสั่น และเสียงฝีเท้าที่เคลื่อนไหว
รัสโทชินรอให้เขาหยุด ณ สถานที่ที่ระบุ ขมวดคิ้วและเอามือลูบหน้า
- พวก! - Rastopchin กล่าวด้วยเสียงกริ่งโลหะ - ชายคนนี้ Vereshchagin เป็นคนโกงคนเดียวกับที่มอสโกเสียชีวิต
ชายหนุ่มในชุดโค้ตหนังแกะจิ้งจอกยืนในท่าที่ยอมจำนน ประสานมือประสานกันที่หน้าท้องและงอเล็กน้อย การแสดงออกที่ผอมแห้งและสิ้นหวังของเขาทำให้เสียโฉมเพราะโกนศีรษะของเขาตกต่ำลง เมื่อเริ่มนับคำแรก เขาค่อย ๆ เงยหน้าขึ้นและมองลงไปที่การนับ ราวกับว่าต้องการบอกอะไรบางอย่างหรืออย่างน้อยก็สบตาเขา แต่รัสโทชินไม่ได้มองเขา บนคอยาวบางของชายหนุ่มราวกับเชือก หลอดเลือดดำหลังใบหูเริ่มตึงและเปลี่ยนเป็นสีน้ำเงิน และทันใดนั้นใบหน้าของเขาก็เปลี่ยนเป็นสีแดง
ทุกสายตาจับจ้องไปที่เขา เขามองดูฝูงชน และราวกับได้รับกำลังใจจากสีหน้าที่เขาอ่านบนใบหน้าของผู้คน เขาก็ยิ้มอย่างเศร้าๆ และขี้อาย และก้มศีรษะลงอีกครั้ง และปรับเท้าของเขาบนขั้นบันได
“ เขาทรยศต่อซาร์และปิตุภูมิของเขาเขามอบตัวให้กับโบนาปาร์ตเขาเพียงคนเดียวในบรรดาชาวรัสเซียทั้งหมดที่ทำให้ชื่อเสียงของรัสเซียเสื่อมเสียและมอสโกก็กำลังจะพินาศไปจากเขา” รัสโทชินกล่าวด้วยน้ำเสียงที่เฉียบคม แต่ทันใดนั้นเขาก็มองลงไปที่ Vereshchagin อย่างรวดเร็วซึ่งยังคงยืนในท่ายอมแพ้แบบเดิม ราวกับว่ารูปลักษณ์นี้ทำให้เขาระเบิด เขายกมือขึ้น เกือบจะตะโกน หันไปหาผู้คน: "จัดการกับเขาด้วยวิจารณญาณของคุณ!" ฉันให้มันกับคุณ!
ผู้คนต่างเงียบงันและเพียงแต่กดดันกันให้ใกล้ชิดยิ่งขึ้นเท่านั้น กอดกันหายใจเอาความอึดอัดที่ติดเชื้อนี้ ไม่มีแรงจะเคลื่อนไหวและรอสิ่งที่ไม่รู้ เข้าใจยาก และน่ากลัวจนทนไม่ไหว ผู้คนที่ยืนอยู่แถวหน้าซึ่งเห็นและได้ยินทุกสิ่งที่เกิดขึ้นต่อหน้าพวกเขา ทุกคนต่างเบิกตากว้างอย่างหวาดกลัวและอ้าปากค้าง พยายามใช้กำลังทั้งหมด ระงับแรงกดดันของผู้ที่อยู่ข้างหลังพวกเขาที่อยู่ด้านหลัง
- ทุบตีเขา!.. ปล่อยให้คนทรยศตายและไม่ทำให้ชื่อของรัสเซียเสื่อมเสีย! - ตะโกน Rastopchin - รูบี้! ฉันสั่ง! - ไม่ได้ยินคำพูด แต่เป็นเสียงโกรธของเสียงของ Rastopchin ฝูงชนก็ส่งเสียงครวญครางและก้าวไปข้างหน้า แต่หยุดอีกครั้ง
“ นับ!.. ” Vereshchagin พูดอย่างขี้อายและในเวลาเดียวกันก็มีเสียงแสดงละครท่ามกลางความเงียบชั่วขณะที่เกิดขึ้นอีกครั้ง “ นับพระเจ้าองค์หนึ่งอยู่เหนือเรา ... ” Vereshchagin กล่าวพร้อมเงยหน้าขึ้นและอีกครั้งที่มีเส้นเลือดหนาที่คอบางของเขาเต็มไปด้วยเลือดและสีก็ปรากฏขึ้นอย่างรวดเร็วและวิ่งหนีจากใบหน้าของเขา เขาไม่ได้จบสิ่งที่เขาต้องการจะพูด
- สับเขา! ฉันสั่ง!.. - ตะโกน Rastopchin ทันใดนั้นก็หน้าซีดเหมือน Vereshchagin
- เซเบอร์ออกไป! - เจ้าหน้าที่ตะโกนบอกมังกรและชักดาบของเขาเอง
คลื่นที่แรงกว่าอีกลูกหนึ่งพัดผ่านผู้คน และเมื่อถึงแถวหน้า คลื่นนี้ก็เคลื่อนตัวแถวหน้าอย่างเซและพาพวกเขาไปที่ขั้นบันไดของระเบียง เพื่อนร่างสูงที่มีสีหน้าตกตะลึงและยกมือขึ้นยืนอยู่ข้าง Vereshchagin
- รูบี้! - เกือบจะมีเจ้าหน้าที่คนหนึ่งกระซิบกับมังกรและทันใดนั้นทหารคนหนึ่งก็ถูกโจมตีด้วยดาบทื่อด้วยใบหน้าของเขาบิดเบี้ยวด้วยความโกรธ
"เอ!" - Vereshchagin ร้องออกมาสั้น ๆ และด้วยความประหลาดใจมองไปรอบ ๆ ด้วยความกลัวและราวกับไม่เข้าใจว่าทำไมถึงทำสิ่งนี้กับเขา เสียงครวญครางของความประหลาดใจและความสยดสยองดังก้องไปทั่วฝูงชน
"โอ้พระเจ้า!" – ได้ยินเสียงอุทานอันน่าเศร้าของใครบางคน
แต่หลังจากเสียงอุทานด้วยความประหลาดใจที่หนีจาก Vereshchagin เขาก็ร้องออกมาอย่างสมเพชด้วยความเจ็บปวดและเสียงร้องนี้ก็ทำลายเขา กำแพงกั้นความรู้สึกของมนุษย์นั้นขยายไปถึงระดับสูงสุดซึ่งยังคงยึดฝูงชนไว้ได้ทะลุทะลวงออกไปในทันที อาชญากรรมได้เริ่มต้นขึ้นแล้ว จำเป็นต้องทำให้เสร็จ เสียงคร่ำครวญที่น่าสมเพชถูกกลบด้วยเสียงคำรามที่คุกคามและโกรธเกรี้ยวของฝูงชน เช่นเดียวกับคลื่นลูกที่เจ็ดสุดท้าย ทำลายเรือ คลื่นลูกสุดท้ายที่ผ่านพ้นไม่ได้ลุกขึ้นจากแนวหลังไปถึงแนวหน้า ล้มพวกเขาลงและกลืนทุกสิ่ง มังกรที่โจมตีต้องการโจมตีซ้ำ Vereshchagin ด้วยเสียงร้องแห่งความสยดสยองปกป้องตัวเองด้วยมือของเขารีบไปหาผู้คน เพื่อนร่างสูงที่เขาชนเข้าไปคว้าคอบางของ Vereshchagin ด้วยมือของเขาและด้วยเสียงร้องอันดุเดือดเขาและเขาล้มลงใต้เท้าของฝูงชนที่คำราม
บางคนทุบตี Vereshchagin และบางคนก็สูงและเล็ก และเสียงร้องของผู้คนที่ถูกบดขยี้และผู้ที่พยายามช่วยชีวิตเพื่อนตัวสูงกลับกระตุ้นความโกรธเกรี้ยวของฝูงชนเท่านั้น เป็นเวลานานแล้วที่พวกมังกรไม่สามารถปลดปล่อยคนงานในโรงงานที่นองเลือดได้ซึ่งถูกทุบตีจนทำให้คนงานในโรงงานเสียชีวิตไปครึ่งหนึ่ง และเป็นเวลานานแม้ว่าฝูงชนจะพยายามทำงานให้เสร็จเมื่อเริ่มต้น แต่คนที่ทุบตีรัดคอและฉีก Vereshchagin ก็ไม่สามารถฆ่าเขาได้ แต่ฝูงชนเบียดเสียดพวกเขาจากทุกทิศทุกทางโดยให้พวกเขาอยู่ตรงกลางเหมือนมวลกลุ่มเดียวกันโยกไปจากด้านหนึ่งไปอีกด้านและไม่เปิดโอกาสให้พวกเขาไล่หรือโยนเขาออกไป