احسب جذر متوسط ​​التربيع. ما هو الانحراف المعياري - استخدام دالة الانحراف المعياري لحساب الانحراف المعياري في Excel

الرئيسي / الحب

أكثر خصائص التباين مثالية هو الانحراف المعياري ، والذي يسمى الانحراف المعياري (أو الانحراف المعياري). الانحراف المعياري() يساوي الجذر التربيعي للمربع المتوسط ​​لانحرافات القيم الفردية للميزة عن الوسط الحسابي:

الانحراف المعياري بسيط:

يستخدم الانحراف المعياري المرجح للبيانات المجمعة:

بين متوسط ​​الانحرافات الخطية المربعة والمعيارية في ظل ظروف التوزيع العادية ، تحدث العلاقة التالية: ~ 1.25.

يتم استخدام الانحراف المعياري ، باعتباره المقياس الرئيسي المطلق للتغير ، لتحديد قيم إحداثيات منحنى التوزيع الطبيعي ، في الحسابات المتعلقة بتنظيم مراقبة العينة وتحديد دقة خصائص العينة ، وكذلك عند تقييم حدود تباين عنصر في مجموعة متجانسة.

التشتت ، أنواعه ، الانحراف المعياري.

تباين المتغير العشوائي- قياس انتشار متغير عشوائي معين ، أي انحرافه عن التوقع الرياضي. في الإحصاء ، يتم استخدام التسمية أو غالبًا. يسمى الجذر التربيعي للتباين الانحراف المعياري ، أو الانحراف المعياري ، أو الانحراف المعياري.

التباين الكلي (σ 2) يقيس تباين سمة في المجموع تحت تأثير جميع العوامل التي تسببت في هذا الاختلاف. في الوقت نفسه ، بفضل طريقة التجميع ، من الممكن عزل وقياس التباين بسبب سمة التجميع ، والتباين الناشئ تحت تأثير العوامل غير المحسوبة.

التباين بين المجموعات (σ 2 مجم) يميز الاختلاف المنهجي ، أي الاختلافات في حجم السمة قيد الدراسة والتي تنشأ تحت تأثير سمة - عامل أساسي للتجميع.

الانحراف المعياري(المرادفات: الانحراف المعياري ، الانحراف المعياري ، الانحراف المعياري ؛ مصطلحات مماثلة: الانحراف المعياري ، الانتشار القياسي) - في نظرية الاحتمالات والإحصاءات ، المؤشر الأكثر شيوعًا لتشتت قيم المتغير العشوائي بالنسبة لتوقعاته الرياضية. باستخدام المصفوفات المحدودة لعينات القيم ، يتم استخدام المتوسط ​​الحسابي لمجموعة العينات بدلاً من التوقع الرياضي.

يقاس الانحراف المعياري بوحدات قياس المتغير العشوائي نفسه ويستخدم لحساب الخطأ المعياري للمتوسط ​​الحسابي ، عند بناء فترات الثقة ، عند اختبار الفرضيات إحصائياً ، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يعرف بأنه الجذر التربيعي لتباين المتغير العشوائي.


الانحراف المعياري:

الانحراف المعياري(تقدير الانحراف المعياري لمتغير عشوائي xبالنسبة لتوقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

أين التباين؟ - أناالعنصر عشر من العينة ؛ - حجم العينة؛ - المتوسط ​​الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة ، من المستحيل بناء تقدير غير متحيز. ومع ذلك ، فإن التقدير المستند إلى تقدير التباين غير المتحيز متسق.

جوهر ونطاق وإجراءات تحديد الوضع والوسيط.

بالإضافة إلى متوسطات قانون القوة في الإحصاء ، بالنسبة للخصائص النسبية لحجم الميزة المتغيرة والهيكل الداخلي لسلسلة التوزيع ، يتم استخدام المتوسطات الهيكلية ، والتي يتم تمثيلها بشكل أساسي الموضة والوسيط.

موضة- هذا هو البديل الأكثر شيوعًا للصف. يتم استخدام الموضة ، على سبيل المثال ، في تحديد حجم الملابس والأحذية الأكثر طلبًا بين العملاء. يعد وضع السلسلة المنفصلة هو الوضع الذي يحتوي على أعلى تردد. عند حساب الوضع لسلسلة اختلاف الفاصل الزمني ، من الضروري أولاً تحديد الفاصل الزمني الشرطي (حسب التردد الأقصى) ، ثم - قيمة القيمة النموذجية للميزة وفقًا للصيغة:

- - قيمة الموضة

- - الحد الأدنى للفاصل الزمني الشرطي

- - قيمة الفاصل الزمني

- - تواتر الفاصل الزمني

- هو تكرار الفاصل الزمني السابق للوضع

- هو تردد الفاصل الزمني الذي يلي الوسيط

الوسيط -هذه هي قيمة السمة التي تقوم عليها السلسلة المرتبة وتقسم هذه السلسلة إلى جزأين متساويين.

لتحديد الوسيط في سلسلة منفصلة في وجود الترددات ، احسب أولاً نصف مجموع الترددات ، ثم حدد قيمة المتغير التي تقع عليها. (إذا كانت السلسلة التي تم فرزها تحتوي على عدد فردي من الميزات ، فسيتم حساب الرقم المتوسط ​​بالصيغة:

M e = (n (عدد الميزات في المجموع) + 1) / 2 ،

في حالة وجود عدد زوجي من المعالم ، فإن الوسيط سيكون مساويًا لمتوسط ​​السمتين في منتصف الصف).

عند حساب متوسطاتبالنسبة لسلسلة تباين الفاصل الزمني ، حدد أولاً الفاصل الزمني الوسيط الذي يقع خلاله الوسيط ، ثم قيمة الوسيط باستخدام الصيغة:

- - الوسيط المطلوب

- - الحد الأدنى للفترة التي تحتوي على الوسيط

- - قيمة الفاصل الزمني

- - مجموع الترددات أو عدد أعضاء المسلسل

مجموع الترددات المتراكمة للفترات التي تسبق الوسيط

- - تكرار الفاصل الوسيط

مثال... ابحث عن الموضة والوسيط.

قرار:
في هذا المثال ، يقع الفاصل الزمني الشرطي ضمن الفئة العمرية 25-30 عامًا ، نظرًا لأن هذا الفاصل الزمني له أعلى تردد (1054).

دعنا نحسب حجم الوضع:

هذا يعني أن العمر النموذجي للطلاب هو 27 عامًا.

نحسب الوسيط... الفاصل الزمني الوسيط في الفئة العمرية 25-30 سنة ، حيث يوجد خلال هذه الفترة متغير يقسم السكان إلى قسمين متساويين (Σf i / 2 = 3462/2 = 1731). بعد ذلك ، نستبدل البيانات العددية الضرورية في الصيغة ونحصل على القيمة المتوسطة:

هذا يعني أن نصف الطلاب أقل من 27.4 عامًا والآخر فوق 27.4 عامًا.

بالإضافة إلى الوضع والوسيط ، يمكن استخدام مؤشرات مثل الأرباع التي تقسم السلسلة المرتبة إلى 4 أجزاء متساوية ، عشري- 10 أجزاء ونسب مئوية - لكل 100 جزء.

مفهوم الملاحظة الانتقائية ونطاقها.

الملاحظة الانتقائيةينطبق عند تطبيق المراقبة المستمرة مستحيل جسديابسبب كمية كبيرة من البيانات ، أو غير عملي اقتصاديًا... تحدث الاستحالة المادية ، على سبيل المثال ، عند دراسة تدفقات الركاب وأسعار السوق وميزانيات الأسرة. تحدث عدم الكفاءة الاقتصادية عند تقييم جودة السلع المرتبطة بتدميرها ، على سبيل المثال ، تذوق واختبار الطوب من أجل القوة ، إلخ.

تشكل الوحدات الإحصائية المختارة للمراقبة عينة من السكان أو عينة ، ومجموعة كاملة - السكان العام (HS). في هذه الحالة ، يشير عدد الوحدات في العينة ن، وفي النظام المنسق ككل - ن... موقف سلوك ن / نيسمى الحجم النسبي أو جزء من العينة.

تعتمد جودة نتائج ملاحظة العينة على تمثيل العينة ، أي على مدى تمثيلها في النظام المنسق. لضمان تمثيل العينة ، من الضروري المراقبة اختيار عشوائي للوحدات، والذي يفترض أن إدراج وحدة النظام المنسق في العينة لا يمكن أن يتأثر بأي عامل آخر غير الحالة.

موجود 4 طرق للاختيار بشكل عشوائيللعينة:

  1. في الواقع عشوائياختيار أو "طريقة لوتو" ، عندما يتم تعيين أرقام تسلسلية للكميات الإحصائية ، يتم إدخالها على عناصر معينة (على سبيل المثال ، البراميل) ، والتي يتم خلطها بعد ذلك في بعض الحاويات (على سبيل المثال ، في كيس) واختيارها عشوائيًا. في الممارسة العملية ، يتم تنفيذ هذه الطريقة باستخدام مولد أرقام عشوائي أو جداول رياضية للأرقام العشوائية.
  2. ميكانيكيالاختيار ، وفقًا لكل منهما ( غير متاح) -th لعموم السكان. على سبيل المثال ، إذا كانت تحتوي على 100000 قيمة ، وتريد تحديد 1000 ، فسيتم تضمين كل 100000/1000 = 100 في العينة. علاوة على ذلك ، إذا لم يتم تصنيفهم ، فسيتم اختيار الأول عشوائيًا من المائة الأولى ، وسيكون عدد الآخرين مائة أكثر. على سبيل المثال ، إذا تبين أن الوحدة رقم 19 هي الأولى ، فيجب أن تكون التالية # 119 ، ثم # 219 ، ثم # 319 ، وهكذا. إذا تم ترتيب وحدات عامة السكان ، فسيتم تحديد # 50 أولاً ، ثم # 150 ، ثم # 250 ، وهكذا.
  3. يتم اختيار القيم من مجموعة بيانات غير متجانسة طبقية(طبقي) ، عندما يتم تقسيم السكان بشكل مسبق إلى مجموعات متجانسة ، يتم تطبيق الاختيار العشوائي أو الميكانيكي عليها.
  4. طريقة خاصة لأخذ العينات مسلسلالانتقاء ، حيث لا يتم اختيار الكميات الفردية بشكل عشوائي أو ميكانيكي ، ولكن يتم اختيار سلاسلها (تسلسلات من عدد ما إلى البعض في صف واحد) ، والتي يتم خلالها إجراء المراقبة المستمرة.

تعتمد جودة ملاحظات العينة أيضًا على نوع العينة: معادأو غير قابل للتكرار.

متي إعادة الاختياريتم إرجاع الكميات الإحصائية التي تم إدخالها في العينة أو سلسلتها بعد الاستخدام إلى عامة السكان ، مع وجود فرصة للدخول في عينة جديدة. علاوة على ذلك ، فإن جميع قيم عامة السكان لها نفس احتمالية تضمينها في العينة.

اختيار غير متكرريعني أن الكميات الإحصائية المدرجة في العينة أو سلسلتها بعد الاستخدام لا يتم إرجاعها إلى عامة السكان ، وبالتالي بالنسبة للكميات المتبقية من الأخير ، يزداد احتمال الوقوع في العينة التالية.

يعطي أخذ العينات المتكرر نتائج أكثر دقة ، لذلك يتم استخدامه في كثير من الأحيان. ولكن هناك حالات لا يمكن فيها تطبيقها (دراسة تدفقات الركاب ، طلب المستهلك ، وما إلى ذلك) ثم يتم إعادة الاختيار.

خطأ أخذ العينات الهامشي للملاحظة ، متوسط ​​خطأ أخذ العينات ، ترتيب حسابهم.

دعونا نفكر بالتفصيل في طرق تكوين عينة السكان المذكورة أعلاه والأخطاء التي تنشأ في هذه الحالة. التمثيلية .
في الواقع عشوائيتعتمد العينة على اختيار عشوائي للوحدات من عامة السكان دون أي عناصر منهجية. من الناحية الفنية ، يتم إجراء الاختيار العشوائي المناسب عن طريق سحب القرعة (على سبيل المثال ، سحب اليانصيب) أو وفقًا لجدول أرقام عشوائية.

في الواقع ، نادرًا ما يستخدم الاختيار العشوائي "في شكله النقي" في ممارسة الملاحظة الانتقائية ، ولكنه الاختيار الأولي من بين أنواع الاختيار الأخرى ، فهو يطبق المبادئ الأساسية للملاحظة الانتقائية. دعونا نفكر في بعض أسئلة نظرية طريقة أخذ العينات ومعادلة الخطأ لعينة عشوائية بسيطة.

عينة خطأ في الملاحظةهو الفرق بين قيمة المعلمة في عموم السكان ، وقيمتها المحسوبة من نتائج ملاحظة عينة. بالنسبة للخاصية الكمية المتوسطة ، يتم تحديد خطأ أخذ العينات

يسمى المؤشر خطأ أخذ العينات الهامشي.
متوسط ​​العينة هو متغير عشوائي يمكن أن يأخذ قيمًا مختلفة اعتمادًا على الوحدات التي تم تضمينها في العينة. لذلك ، فإن أخطاء أخذ العينات هي أيضًا قيم عشوائية ويمكن أن تأخذ قيمًا مختلفة. لذلك ، يتم تحديد متوسط ​​الأخطاء المحتملة - يعني خطأ أخذ العيناتالذي يعتمد على:

حجم العينة: كلما زاد الرقم ، انخفضت قيمة متوسط ​​الخطأ ؛

درجة تغير السمة المدروسة: كلما كان التباين في السمة أصغر ، وبالتالي التباين ، كان متوسط ​​خطأ أخذ العينات أصغر.

متي إعادة اختيار عشوائييتم حساب متوسط ​​الخطأ:
.
من الناحية العملية ، فإن التباين العام غير معروف تمامًا ، ولكن في نظرية الاحتمالاتأثبت أن
.
نظرًا لأن قيمة n الكبيرة بما يكفي قريبة من 1 ، يمكننا افتراض ذلك. ثم يمكن حساب متوسط ​​خطأ أخذ العينات:
.
ولكن في حالات عينة صغيرة (لـ n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

متي عينة عشوائية غير مكررةيتم تصحيح الصيغ المعطاة بالقيمة. ثم يكون الخطأ المتوسط ​​لأخذ العينات غير المتكرر هو:
و .
لأن دائمًا ما يكون أقل ، يكون المضاعف () دائمًا أقل من 1. وهذا يعني أن متوسط ​​الخطأ في الاختيار غير المتكرر يكون دائمًا أقل منه في التحديد المتكرر.
أخذ العينات الميكانيكيةيتم استخدامه عندما يتم ترتيب عموم السكان بطريقة ما (على سبيل المثال ، قوائم الناخبين الأبجدية وأرقام الهواتف وأرقام المنازل والشقق). يتم اختيار الوحدات في فترة زمنية معينة ، والتي تساوي مقلوب النسبة المئوية للعينة. لذلك ، مع عينة 2٪ ، يتم اختيار كل 50 وحدة = 1 / 0.02 ، مع 5٪ لكل 1 / 0.05 = 20 وحدة من عموم السكان.

يتم تحديد الأصل بطرق مختلفة: عشوائيًا ، من منتصف الفترة الزمنية ، مع تغيير الأصل. الشيء الرئيسي هنا هو تجنب الخطأ المنهجي. على سبيل المثال ، مع عينة 5٪ ، إذا كانت الوحدة الأولى 13 ، فإن الوحدة التالية هي 33 ، 53 ، 73 ، إلخ.

من حيث الدقة ، فإن الاختيار الميكانيكي قريب من أخذ العينات العشوائي نفسه. لذلك ، لتحديد متوسط ​​الخطأ في أخذ العينات الميكانيكية ، يتم استخدام صيغ الاختيار العشوائي المناسب.

متي اختيار نموذجي يتم تقسيم السكان الذين تم مسحهم مبدئيًا إلى مجموعات متجانسة من نفس النوع. على سبيل المثال ، عند إجراء مسح للمؤسسات ، يمكن أن تكون هذه الصناعات ، أو القطاعات الفرعية ، عند دراسة السكان - المناطق أو الفئات الاجتماعية أو الفئات العمرية. بعد ذلك ، يتم إجراء اختيار مستقل من كل مجموعة ميكانيكيًا أو بطريقة عشوائية بحتة.

يعطي أخذ العينات النموذجي نتائج أكثر دقة من الطرق الأخرى. يضمن تصنيف السكان عمومًا أن يتم تمثيل كل مجموعة نمطية في العينة ، مما يجعل من الممكن استبعاد تأثير التباين بين المجموعات على متوسط ​​خطأ أخذ العينات. وبالتالي ، عند العثور على خطأ عينة نموذجية وفقًا لقاعدة إضافة التباينات () ، من الضروري مراعاة متوسط ​​تباينات المجموعة فقط. ثم متوسط ​​خطأ أخذ العينات:
عند إعادة الاختيار
,
مع اختيار غير متكرر
,
أين هو متوسط ​​الفروق داخل المجموعة في العينة.

تحديد تسلسلي (أو متداخل) ينطبق في الحالة التي يتم فيها تقسيم عامة السكان إلى سلاسل أو مجموعات قبل بدء مسح العينة. يمكن لهذه السلسلة تغليف المنتجات النهائية ، ومجموعات الطلاب ، والكتائب. يتم اختيار سلسلة المسح ميكانيكياً أو بطريقة عشوائية بحتة ، وضمن السلسلة ، يتم إجراء مسح مستمر للوحدات. لذلك ، يعتمد خطأ أخذ العينات المتوسط ​​فقط على التباين بين المجموعات (بين السلاسل) ، والذي يتم حسابه بواسطة الصيغة:

حيث r هو عدد السلاسل المختارة ؛
- متوسط ​​السلسلة i.

يتم حساب متوسط ​​خطأ أخذ العينات التسلسلي:

عند إعادة الاختيار:
,
مع اختيار غير متكرر:
,
حيث R هو العدد الإجمالي للسلسلة.

مشتركاختيارهو مزيج من طرق الاختيار المدروسة.

يعتمد متوسط ​​خطأ أخذ العينات لأي طريقة اختيار بشكل أساسي على الحجم المطلق للعينة ، وبدرجة أقل ، على النسبة المئوية للعينة. لنفترض أنه تم تنفيذ 225 ملاحظة في الحالة الأولى من إجمالي عدد السكان البالغ 4500 وحدة وفي الحالة الثانية - من 225000 وحدة. الفروق في كلتا الحالتين تساوي 25. ثم ، في الحالة الأولى ، مع أخذ العينات بنسبة 5٪ ، سيكون خطأ أخذ العينات:

في الحالة الثانية ، مع تحديد 0.1٪ ، سيكون مساوياً لـ:


في هذا الطريقمع انخفاض النسبة المئوية للعينة بمقدار 50 مرة ، زاد خطأ العينة بشكل ضئيل ، حيث لم يتغير حجم العينة.
افترض أن حجم العينة زاد إلى 625 ملاحظة. في هذه الحالة ، يكون خطأ أخذ العينات هو:

تؤدي الزيادة في العينة بمقدار 2.8 مع نفس الحجم من عامة السكان إلى تقليل حجم خطأ العينة بأكثر من 1.6 مرة.

طرق وطرق تكوين العينة.

في الإحصاء ، يتم استخدام طرق مختلفة لتشكيل مجموعات العينات ، والتي تحددها أهداف البحث وتعتمد على تفاصيل موضوع الدراسة.

الشرط الرئيسي لإجراء مسح العينة هو منع حدوث أخطاء منهجية ناشئة عن انتهاك مبدأ تكافؤ الفرص لكل وحدة من عموم السكان يتم تضمينها في العينة. يتم تحقيق الوقاية من الأخطاء المنهجية نتيجة لاستخدام الأساليب القائمة على أسس علمية لتشكيل عينة من السكان.

هناك الطرق التالية لاختيار الوحدات من عامة السكان:

1) الاختيار الفردي - يتم اختيار الوحدات الفردية في العينة ؛

2) اختيار المجموعة - تقع المجموعات المتجانسة نوعياً أو سلسلة من الوحدات المدروسة في العينة ؛

3) الاختيار المشترك هو مزيج من الاختيار الفردي والجماعي.
يتم تحديد طرق الاختيار من خلال قواعد تكوين عينة السكان.

يمكن أن تكون العينة:

  • عرضي مناسبيتكون من حقيقة أن عينة السكان تتكون نتيجة اختيار عشوائي (غير مقصود) للوحدات الفردية من عامة السكان. في هذه الحالة ، يتم تحديد عدد الوحدات المختارة للعينة عادةً بناءً على النسبة المقبولة للعينة. نسبة العينة هي نسبة عدد الوحدات في العينة n إلى عدد الوحدات في عموم السكان N ، أي
  • ميكانيكييتكون من حقيقة أن اختيار الوحدات في عينة السكان يتم من عامة السكان ، مقسمة إلى فترات متساوية (مجموعات). علاوة على ذلك ، فإن حجم الفاصل الزمني في عموم السكان يساوي مقلوب نسبة العينة. لذلك ، مع عينة 2٪ ، يتم اختيار كل 50 وحدة (1: 0.02) ، مع عينة 5٪ ، كل 20 وحدة (1: 0.05) ، إلخ. وبالتالي ، وفقًا لحصة الاختيار المقبولة ، يتم تقسيم عموم السكان ميكانيكيًا إلى مجموعات متساوية الحجم. يتم تحديد وحدة واحدة فقط من كل مجموعة.
  • عادي -حيث ينقسم عامة السكان أولاً إلى مجموعات نموذجية متجانسة. ثم ، من كل مجموعة نموذجية ، يتم إجراء اختيار فردي للوحدات عن طريق أخذ عينات عشوائية أو ميكانيكية في عينة السكان. من السمات المهمة للعينة النموذجية أنها تعطي نتائج أكثر دقة مقارنة بالطرق الأخرى لاختيار الوحدات في العينة ؛
  • مسلسل- حيث ينقسم عامة السكان إلى مجموعات من نفس الحجم - سلسلة. سلسلة مختارة للعينة. داخل السلسلة ، يتم إجراء مراقبة مستمرة للوحدات التي تقع في السلسلة ؛
  • مشترك- يمكن أن تكون العينة على مرحلتين. في هذه الحالة ، يتم تقسيم عامة السكان أولاً إلى مجموعات. ثم يتم اختيار المجموعات ، وداخل الأخير ، يتم اختيار الوحدات الفردية.

في الإحصاء ، يتم تمييز الطرق التالية لاختيار الوحدات في العينة:

  • مرحلة واحدةأخذ العينات - يتم فحص كل وحدة مختارة على الفور وفقًا لمعيار معين (أخذ العينات العشوائية والتسلسلية المناسبة) ؛
  • متعدد المراحلأخذ العينات - يتم الاختيار من عامة السكان للمجموعات الفردية ، ويتم اختيار الوحدات الفردية من المجموعات (أخذ عينات نموذجي باستخدام طريقة ميكانيكية لاختيار الوحدات في عينة السكان).

بالإضافة إلى ذلك ، هناك:

  • إعادة الاختيار- حسب مخطط الكرة المعادة. علاوة على ذلك ، فإن كل وحدة أو سلسلة دخلت في العينة تعود إلى عامة السكان ، وبالتالي لديها فرصة للدخول في العينة مرة أخرى ؛
  • اختيار غير متكرر- وفقًا لمخطط الكرة غير المعادة. لها نتائج أكثر دقة بنفس حجم العينة.

تحديد حجم العينة المطلوب (باستخدام جدول الطالب).

أحد المبادئ العلمية في نظرية أخذ العينات هو ضمان وجود عدد كافٍ من الوحدات المأخوذة. من الناحية النظرية ، يتم تقديم الحاجة إلى الامتثال لهذا المبدأ في البراهين على نظريات الحد لنظرية الاحتمالات ، والتي تجعل من الممكن تحديد حجم الوحدات التي يجب اختيارها من عامة السكان حتى تكون كافية ولضمان تمثيل العينة.

دائمًا ما يرتبط انخفاض الخطأ المعياري للعينة ، وبالتالي زيادة دقة التقدير ، بزيادة حجم العينة ، لذلك ، بالفعل في مرحلة تنظيم ملاحظة العينة ، من الضروري اتخاذ قرار السؤال عن حجم العينة الذي يجب أن يكون لضمان الدقة المطلوبة لنتائج الملاحظة. يتم حساب حجم العينة المطلوب باستخدام الصيغ المشتقة من الصيغ الخاصة بأخطاء أخذ العينات الهامشية (أ) ، المقابلة لنوع وطريقة معينة في الاختيار. لذلك ، بالنسبة لحجم العينة المتكرر العشوائي (ن) لدينا:

جوهر هذه الصيغة هو أنه مع الاختيار العشوائي المتكرر للحجم المطلوب ، يتناسب حجم العينة بشكل مباشر مع مربع معامل الثقة (ر 2)والتباين في خاصية التباين (؟ 2) ويتناسب عكسياً مع مربع الخطأ الهامشي لأخذ العينات (؟ 2). على وجه الخصوص ، مع مضاعفة الخطأ الهامشي ، يمكن تقليل حجم العينة المطلوب بمقدار أربعة أضعاف. من بين المعلمات الثلاثة ، تم تعيين اثنين (t و؟) من قبل الباحث.

في هذه الحالة يقوم الباحث بإجراءلغرض أهداف مسح العينة ، يجب أن يحل السؤال: في أي تركيبة كمية من الأفضل تضمين هذه المعلمات لضمان المتغير الأمثل؟ في إحدى الحالات ، قد يكون أكثر رضىً عن موثوقية النتائج التي تم الحصول عليها (t) مقارنةً بمقياس الدقة (؟) ، وفي الحالة الأخرى - العكس. من الصعب حل المشكلة المتعلقة بقيمة خطأ أخذ العينات الهامشي ، نظرًا لأن الباحث ليس لديه هذا المؤشر في مرحلة تصميم ملاحظة العينة ، لذلك ، من الناحية العملية ، من المعتاد تعيين خطأ أخذ العينات الهامشي ، باعتباره ، ضمن ما يصل إلى 10٪ من المستوى المتوسط ​​المتوقع للميزة. يمكن التعامل مع إنشاء متوسط ​​مفترض بطرق مختلفة: استخدام بيانات من استطلاعات سابقة مماثلة ، أو استخدام بيانات من إطار أخذ العينات وعمل عينة تجريبية صغيرة.

عند تصميم عينة الملاحظة ، يكون من الأصعب إنشاء المعلمة الثالثة في الصيغة (5.2) - تباين مجتمع العينة. في هذه الحالة ، من الضروري استخدام جميع المعلومات المتاحة للباحث ، والتي تم الحصول عليها في الاستطلاعات السابقة المماثلة والتجريبية.

مسألة التعريفيكون حجم العينة المطلوب معقدًا إذا اشتمل مسح العينة على دراسة العديد من خصائص وحدات المعاينة. في هذه الحالة ، عادةً ما تكون المستويات المتوسطة لكل خاصية من الخصائص وتنوعها مختلفة ، وبالتالي ، من الممكن تحديد مسألة أي من خصائص التباين التي يجب تفضيلها ، مع الأخذ في الاعتبار فقط غرض وأهداف الدراسة الاستقصائية.

عند تصميم ملاحظة عينة ، يتم افتراض القيمة المحددة مسبقًا لخطأ أخذ العينات المقبول وفقًا لمهام دراسة معينة واحتمال الاستنتاجات بناءً على نتائج الملاحظة.

بشكل عام ، فإن صيغة الخطأ الهامشي لمتوسط ​​العينة تجعل من الممكن تحديد:

مقدار الانحرافات المحتملة لمؤشرات عامة السكان عن مؤشرات مجتمع العينة ؛

الحجم المطلوب للعينة ، مع ضمان الدقة المطلوبة ، بحيث لا تتجاوز حدود الخطأ المحتمل قيمة معينة محددة ؛

احتمال أن يكون للخطأ في العينة حد معين.

توزيع t للطالبفي نظرية الاحتمالات ، إنها عائلة ذات معلمة واحدة من التوزيعات المستمرة تمامًا.

سلسلة من الديناميكيات (فاصل زمني ، لحظة) ، إغلاق صفوف الديناميكيات.

صفوف من الديناميكيات- هذه هي قيم المؤشرات الإحصائية التي يتم تقديمها بترتيب زمني معين.

تحتوي كل سلسلة زمنية على عنصرين:

1) مؤشرات الفترات الزمنية (السنوات ، أرباع السنة ، الأشهر ، الأيام أو التواريخ) ؛

2) المؤشرات التي تميز الكائن قيد الدراسة لفترات زمنية أو للتواريخ المقابلة ، والتي تسمى مستويات السلسلة.

يتم التعبير عن مستويات المتسلسلةالقيم المطلقة والمتوسط ​​أو النسبية. اعتمادًا على طبيعة المؤشرات ، يتم إنشاء سلسلة ديناميكية من القيم المطلقة والنسبية والمتوسطة. سلسلة من الديناميات من القيم النسبية والمتوسطة مبنية على أساس سلسلة مشتقة من القيم المطلقة. يميز بين الفاصل الزمني وسلسلة اللحظة من الديناميات.

سلسلة الفواصل الديناميكيةيحتوي على قيم المؤشرات لفترات زمنية محددة. في سلسلة الفترات ، يمكن تلخيص المستويات ، والحصول على حجم الظاهرة على مدى فترة أطول ، أو ما يسمى بالمجاميع المتراكمة.

سلسلة عزم الدوران الديناميكييعكس قيم المؤشرات في وقت معين (تاريخ الوقت). في سلسلة اللحظات ، يمكن للباحث أن يهتم فقط باختلاف الظواهر ، مما يعكس التغير في مستوى السلسلة بين تواريخ معينة ، حيث أن مجموع المستويات هنا ليس له محتوى حقيقي. لا يتم احتساب المجاميع المتراكمة هنا.

الشرط الأكثر أهمية للبناء الصحيح للسلاسل الزمنية هو قابلية المقارنة بين مستويات السلسلة التي تنتمي إلى فترات مختلفة. يجب تقديم المستويات بكميات متجانسة ، ويجب أن تكون الأجزاء المختلفة للظاهرة شاملة بنفس القدر.

بغرضلتجنب تشويه الديناميكيات الحقيقية ، في دراسة إحصائية ، يتم إجراء حسابات أولية (إغلاق سلسلة الديناميات) ، والتي تسبق التحليل الإحصائي للسلاسل الزمنية. يُفهم إغلاق سلسلة الديناميكيات على أنه توحيد سلسلتين أو أكثر في صف واحد ، والتي يتم حساب مستوياتها وفقًا لمنهجيات مختلفة أو لا تتوافق مع الحدود الإقليمية ، إلخ. قد يعني تقارب سلسلة الديناميكيات أيضًا إحضار المستويات المطلقة لسلسلة الديناميات إلى قاعدة مشتركة ، مما يلغي عدم قابلية المقارنة بين مستويات سلسلة الديناميكيات.

مفهوم المقارنة لسلسلة الديناميات والمعاملات ومعدلات النمو والنمو.

صفوف من الديناميكياتهي سلسلة من المؤشرات الإحصائية التي تميز تطور الظواهر الطبيعية والاجتماعية في الوقت المناسب. تحتوي التجميعات الإحصائية التي نشرتها Goskomstat في روسيا على عدد كبير من الديناميكيات في شكل جدول. تتيح سلسلة الديناميكيات الكشف عن أنماط تطور الظواهر قيد الدراسة.

تحتوي سلسلة الديناميكيات على نوعين من المؤشرات. مؤشرات الوقت(سنوات ، أرباع السنة ، شهور ، إلخ) أو نقاط زمنية (في بداية العام ، في بداية كل شهر ، إلخ). مؤشرات مستوى الصف... يمكن التعبير عن مؤشرات مستويات سلسلة الديناميات بالقيم المطلقة (إنتاج المنتج بالأطنان أو الروبل) ، والقيم النسبية (حصة سكان الحضر بالنسبة المئوية) ومتوسط ​​القيم (متوسط ​​الأجور عاملين في الصناعة بالسنوات ، وما إلى ذلك). في شكل جدولي ، يحتوي الصف الديناميكي على عمودين أو صفين.

يفترض البناء الصحيح لسلسلة الديناميكيات تحقيق عدد من المتطلبات:

  1. يجب أن تكون جميع مؤشرات عدد من الديناميكيات قائمة على أسس علمية وموثوقة ؛
  2. يجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة في الوقت المناسب ، أي يجب أن تحسب لنفس الفترات الزمنية أو لنفس التواريخ ؛
  3. يجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر الإقليم ؛
  4. يجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة في المحتوى ، أي محسوبة وفق منهجية موحدة بنفس الطريقة.
  5. يجب أن تكون مؤشرات عدد من الديناميكيات قابلة للمقارنة عبر نطاق المزارع المدروسة. يجب إعطاء جميع مؤشرات عدد من الديناميكيات في نفس وحدات القياس.

المؤشرات الإحصائيةيمكن أن يميز إما نتائج العملية قيد الدراسة على مدى فترة زمنية ، أو حالة الظاهرة قيد الدراسة في وقت معين ، أي يمكن أن تكون المؤشرات فاصلة (دورية) ولحظية. وفقًا لذلك ، يمكن أن تكون السلسلة الأولية من الديناميكيات فاصلة أو لحظية. يمكن أن تكون السلسلة اللحظية للديناميكيات بدورها ذات فترات زمنية متساوية وغير متكافئة.

يمكن تحويل سلسلة الديناميكيات الأصلية إلى سلسلة من القيم المتوسطة وسلسلة من القيم النسبية (سلسلة وأساسية). تسمى هذه السلسلة من الديناميكيات سلسلة مشتقة من الديناميكيات.

تختلف منهجية حساب المستوى المتوسط ​​في سلسلة الديناميكيات ، بسبب نوع سلسلة الديناميكيات. باستخدام الأمثلة ، سننظر في أنواع سلاسل الديناميكيات والصيغ لحساب المستوى المتوسط.

مكاسب مطلقة (Δy) يوضح عدد الوحدات التي تغير فيها المستوى التالي من السلسلة مقارنة بالمستوى السابق (العمود 3. - الزيادات المطلقة في السلسلة) أو بالمقارنة مع المستوى الأولي (العمود 4. - الزيادات المطلقة الأساسية). يمكن كتابة الصيغ الحسابية على النحو التالي:

مع انخفاض القيم المطلقة للسلسلة ، سيكون هناك على التوالي "انخفاض" ، "انخفاض".

وتشير مؤشرات النمو المطلق ، على سبيل المثال ، في عام 1998 ، إلى زيادة إنتاج المنتج "أ" بمقدار 4 آلاف طن مقارنة بعام 1997 ، وبمقدار 34 ألف طن مقارنة بعام 1994 ؛ انظر الجدول لبقية السنوات. 11.5 جرام 3 و 4.

معدل النمويوضح عدد المرات التي تغير فيها مستوى السلسلة مقارنة بالمستوى السابق (العمود 5 - معاملات السلسلة للنمو أو الانخفاض) أو بالمقارنة مع المستوى الأولي (العمود 6 - المعاملات الأساسية للنمو أو الانخفاض). يمكن كتابة الصيغ الحسابية على النحو التالي:

معدلات النموأظهر عدد النسبة المئوية للمستوى التالي من السلسلة مقارنة بالمستوى السابق (العمود 7 - معدلات نمو السلسلة) أو بالمقارنة مع المستوى الأولي (العمود 8 - معدلات النمو الأساسية). يمكن كتابة الصيغ الحسابية على النحو التالي:

لذلك ، على سبيل المثال ، في عام 1997 بلغ حجم إنتاج المنتج "أ" 105.5٪ مقارنة بعام 1996 (

معدلات النموتبين عدد النسبة المئوية التي زاد مستوى فترة التقرير عنها مقارنة بالمستوى السابق (العمود 9 - معدلات نمو السلسلة) أو بالمقارنة مع المستوى الأولي (العمود 10 - معدلات النمو الأساسية). يمكن كتابة الصيغ الحسابية على النحو التالي:

T pr = T p - 100٪ أو T pr = الزيادة المطلقة / مستوى الفترة السابقة * 100٪

لذلك ، على سبيل المثال ، في عام 1996 ، مقارنة بعام 1995 ، تم إنتاج المنتج "أ" بنسبة 3.8٪ (103.8٪ - 100٪) أو (8: 210) × 100٪ ، ومقارنة بعام 1994 - بنسبة 9٪ (109٪ -) 100٪).

إذا انخفضت المستويات المطلقة في السلسلة ، فسيكون المعدل أقل من 100٪ ، وبالتالي سيكون هناك معدل انخفاض (معدل الزيادة بعلامة ناقص).

القيمة المطلقة لكسب 1٪(العمود 11) يوضح عدد الوحدات التي يجب إنتاجها في فترة معينة من أجل زيادة مستوى الفترة السابقة بنسبة 1٪. في مثالنا ، في عام 1995 كان من الضروري إنتاج 2.0 ألف طن ، وفي عام 1998 - 2.3 ألف طن ، أي أكبر بكثير.

هناك طريقتان لتحديد حجم القيمة المطلقة للزيادة بنسبة 1٪:

قسّم مستوى الفترة السابقة على 100 ؛

قسّم الزيادات المطلقة في السلسلة على معدلات نمو السلسلة المقابلة.

القيمة المطلقة لكسب 1٪ =

في الديناميكيات ، خاصة على مدى فترة طويلة ، من المهم إجراء تحليل مشترك لمعدلات النمو مع محتوى كل نسبة مئوية من الزيادة أو النقصان.

لاحظ أن الطريقة المدروسة لتحليل سلسلة الديناميكيات قابلة للتطبيق على كل من سلسلة الديناميكيات ، والتي يتم التعبير عن مستوياتها بالقيم المطلقة (t ، ألف روبل ، عدد الموظفين ، إلخ) ، ولسلسلة الديناميكيات ، التي يتم التعبير عن مستوياتها من خلال المؤشرات النسبية (٪ من الخردة ،٪ محتوى الرماد من الفحم ، إلخ.) أو متوسط ​​القيم (متوسط ​​العائد بالسنترات / هكتار ، متوسط ​​الأجور ، إلخ).

إلى جانب المؤشرات التحليلية المدروسة ، والمحسوبة لكل سنة مقارنة بالمستوى السابق أو الأولي ، عند تحليل سلسلة الديناميكيات ، من الضروري حساب متوسط ​​المؤشرات التحليلية للفترة: متوسط ​​مستوى السلسلة ، المتوسط ​​السنوي الزيادة (النقصان) المطلقة ومتوسط ​​معدل النمو السنوي ومعدل النمو.

تمت مناقشة طرق حساب المستوى المتوسط ​​لسلسلة من الديناميكيات أعلاه. في سلسلة الديناميكيات الفاصلة التي ندرسها ، يتم حساب المستوى المتوسط ​​للسلسلة باستخدام صيغة المتوسط ​​الحسابي البسيط:

متوسط ​​الإنتاج السنوي للمنتج في الفترة 1994-1998 بلغت 218.4 ألف طن.

يتم أيضًا حساب متوسط ​​النمو السنوي المطلق باستخدام معادلة المتوسط ​​الحسابي البسيط:

وتفاوتت الزيادات السنوية المطلقة على مدى السنوات من 4 إلى 12 ألف طن (انظر العمود 3) ، ومتوسط ​​الزيادة السنوية في الإنتاج للفترة 1995 - 1998. بلغت 8.5 ألف طن.

تتطلب طرق حساب متوسط ​​معدل النمو ومتوسط ​​معدل النمو مزيدًا من الدراسة التفصيلية. دعونا نفكر فيها باستخدام مثال المؤشرات السنوية لمستوى السلسلة الموضح في الجدول.

المستوى المتوسط ​​لعدد من الديناميكيات.

سلسلة من الديناميكيات (أو سلاسل زمنية)هي القيم العددية لإحصاء معين في لحظات أو فترات زمنية متتالية (أي مرتبة ترتيبًا زمنيًا).

يتم استدعاء القيم العددية لمؤشر إحصائي واحد أو آخر تشكل سلسلة من الديناميكيات مستوياتوعادة ما يشار إليها بالحرف ذ... أول عضو في السلسلة ص 1يسمى الأولي أو حدودوآخر واحد ذ ن - الاخير... اللحظات أو الفترات الزمنية التي تشير إليها المستويات ر.

يتم تقديم سلسلة الديناميكيات ، كقاعدة عامة ، في شكل جدول أو رسم بياني ، ويتم رسم المقياس الزمني على طول محور الإحداثي ر، وعلى المحور الإحداثي - مقياس مستويات السلسلة ذ.

متوسط ​​مؤشرات عدد من الديناميكيات

يمكن عرض كل صف من الديناميكيات كنوع من التجميع نمؤشرات متغيرة بمرور الوقت يمكن تلخيصها كمتوسطات. هذه المؤشرات (المتوسط) المعممة ضرورية بشكل خاص عند مقارنة التغييرات في مؤشر معين في فترات مختلفة ، في بلدان مختلفة ، إلخ.

يمكن أن تكون السمة المعممة لعدد من الديناميكيات في المقام الأول المستوى المتوسط ​​من الصف... تعتمد طريقة حساب المستوى المتوسط ​​على ما إذا كانت سلسلة لحظة أو سلسلة فاصلة (فترة).

متي فترةمن السلسلة ، يتم تحديد مستواها المتوسط ​​بواسطة معادلة متوسط ​​حسابي بسيط من مستويات السلسلة ، أي

=
إذا كان هناك الوقت الحاضرصف يحتوي على نالمستويات ( y1، y2،…، yn) بفواصل زمنية متساوية بين التواريخ (نقاط زمنية) ، يمكن تحويل هذه السلسلة بسهولة إلى سلسلة من المتوسطات. في هذه الحالة ، يكون المؤشر (المستوى) في بداية كل فترة هو المؤشر في وقت واحد في نهاية الفترة السابقة. ثم يمكن حساب متوسط ​​قيمة المؤشر لكل فترة (الفترة الفاصلة بين التواريخ) كنصف مجموع القيم فيفي بداية ونهاية الفترة ، أي مثل . سيكون عدد هذه المتوسطات. كما ذكرنا سابقًا ، بالنسبة لسلسلة المتوسطات ، يتم حساب المستوى المتوسط ​​من المتوسط ​​الحسابي.

لذلك يمكننا أن نكتب:
.
بعد تحويل البسط نحصل على:
,

أين Y1و ي- المستويات الأولى والأخيرة من الصف ؛ يي- المستويات المتوسطة.

يُعرف هذا المتوسط ​​في الإحصائيات باسم متوسط ​​التسلسل الزمنيلسلسلة اللحظة. حصلت على هذا الاسم من كلمة "كرونوس" (الوقت ، خطوط الطول) ، حيث يتم حسابها من المؤشرات التي تتغير بمرور الوقت.

في حالة عدم المساواةمن الفواصل الزمنية بين التواريخ ، يمكن حساب المتوسط ​​الزمني للسلسلة اللحظية كمتوسط ​​حسابي لمتوسط ​​قيم المستويات لكل زوج من اللحظات ، مرجحًا بالمسافة (الفواصل الزمنية) بين التواريخ ، أي
.
في هذه الحالةمن المفترض أنه في الفترات الفاصلة بين التواريخ ، اتخذت المستويات قيمًا مختلفة ، ونحن من الاثنين المعروفين ( ييو يي + 1) نحدد المتوسطات ، ومن ثم نحسب المتوسط ​​العام للفترة التي تم تحليلها بأكملها.
إذا افترض أن كل قيمة يييبقى دون تغيير حتى المقبل (أنا + 1)- اللحظة ، أي التاريخ الدقيق للتغيير في المستويات معروف ، ثم يمكن إجراء الحساب وفقًا لمعادلة المتوسط ​​المرجح الحسابي:
,

أين هو الوقت الذي ظل فيه المستوى دون تغيير.

بالإضافة إلى المستوى المتوسط ​​في سلسلة الديناميكيات ، يتم حساب متوسط ​​المؤشرات الأخرى - متوسط ​​التغيير في مستويات السلسلة (بالطرق الأساسية وسلسلة) ، متوسط ​​معدل التغيير.

خط الأساس يعني التغيير المطلقهو حاصل قسمة آخر تغيير أساسي مطلق مقسومًا على عدد التغييرات. أي

السلسلة تعني التغيير المطلق مستويات السلسلة هي حاصل قسمة مجموع كل التغييرات المطلقة للسلسلة على عدد التغييرات ، أي

كما تُستخدم علامة متوسط ​​التغيرات المطلقة للحكم على طبيعة التغيير في الظاهرة في المتوسط: النمو أو التراجع أو الاستقرار.

من قاعدة التحكم في التغييرات الأساسية وسلسلة التغييرات المطلقة ، يترتب على ذلك أن التغيير الأساسي ومتوسط ​​السلسلة يجب أن يكون متساويًا.

إلى جانب متوسط ​​التغيير المطلق ، يتم حساب المتوسط ​​النسبي أيضًا باستخدام الطرق الأساسية والمتسلسلة.

خط الأساس يعني التغيير النسبيتحددها الصيغة:

السلسلة تعني التغيير النسبيتحددها الصيغة:

بطبيعة الحال ، يجب أن تكون التغييرات النسبية لخط الأساس والسلسلة هي نفسها ، ومن خلال مقارنتها مع قيمة المعيار 1 ، يتم استخلاص استنتاج حول طبيعة التغيير في الظاهرة في المتوسط: النمو أو التراجع أو الاستقرار.
بطرح 1 من متوسط ​​القاعدة أو السلسلة للتغيير النسبي ، يكون المقابل متوسط ​​معدل التغيير، من خلال العلامة التي من الممكن أيضًا الحكم عليها في طبيعة التغيير في الظاهرة المدروسة ، والتي تنعكس في سلسلة معينة من الديناميكيات.

التقلبات الموسمية ومؤشرات الموسمية.

التقلبات الموسمية هي تقلبات ثابتة داخل السنة.

المبدأ الرئيسي للإدارة للحصول على أقصى تأثير هو زيادة الدخل وتقليل التكاليف. من خلال دراسة التقلبات الموسمية ، يتم حل مشكلة المعادلة القصوى في كل مستوى من مستويات السنة.

عند دراسة التقلبات الموسمية ، يتم حل مهمتين مترابطتين:

1. الكشف عن خصوصيات تطور الظاهرة في الديناميكيات السنوية.

2. قياس التقلبات الموسمية مع بناء نموذج الموجة الموسمية.

لقياس التقلبات الموسمية ، عادة ما يتم حساب الديوك الرومية حسب الموسمية. بشكل عام ، يتم تحديدها من خلال نسبة المعادلات الأولية لعدد من الديناميكيات إلى المعادلات النظرية ، والتي تعمل كأساس للمقارنة.

نظرًا لأن الانحرافات العشوائية يتم فرضها على التقلبات الموسمية ، يتم حساب متوسط ​​مؤشرات الموسمية للقضاء عليها.

في هذه الحالة ، لكل فترة من الدورة السنوية ، يتم تحديد المؤشرات المعممة في شكل متوسط ​​المؤشرات الموسمية:

مؤشرات متوسط ​​التقلبات الموسمية خالية من تأثير الانحرافات العشوائية لاتجاه التنمية الرئيسي.

اعتمادًا على طبيعة الاتجاه ، يمكن أن تتخذ صيغة مؤشر متوسط ​​الموسمية الأشكال التالية:

1.بالنسبة لسلسلة الديناميكيات السنوية ذات الاتجاه التنموي الرئيسي الواضح:

2 - بالنسبة لسلسلة الديناميات خلال السنة التي لا يوجد فيها اتجاه تصاعدي أو تناقصي ، أو ليس لها أهمية:

أين العوارية العامة؟

طرق تحليل الاتجاه الرئيسي.

يتأثر تطور الظواهر بمرور الوقت بعوامل مختلفة الطبيعة وقوة التأثير. بعضها عشوائي بطبيعته ، والبعض الآخر له تأثير شبه دائم ويشكل اتجاهًا إنمائيًا معينًا في صفوف الديناميكيات.

تتمثل مهمة الإحصاء المهمة في تحديد ديناميكيات الاتجاه في السلسلة ، المحررة من تأثير العوامل العشوائية المختلفة. لهذا الغرض ، تتم معالجة سلسلة الديناميكيات من خلال طرق دمج الفترات ، والمتوسط ​​المتحرك والمحاذاة التحليلية ، إلخ.

طريقة التخشين الفاصلبناءً على توسيع الفترات الزمنية التي تنتمي إليها مستويات عدد من الديناميكيات ، أي هو استبدال البيانات المتعلقة بفترات زمنية صغيرة ببيانات من فترات زمنية أطول. إنه فعال بشكل خاص عندما تكون المستويات الأولية للسلسلة لفترات زمنية قصيرة. على سبيل المثال ، يتم استبدال صفوف المؤشرات المتعلقة بالأحداث اليومية بالصفوف المتعلقة بالأسبوعية والشهرية وما إلى ذلك. سيسمح لك هذا بالعرض بشكل أكثر وضوحًا "محور تطور الظاهرة"... المتوسط ​​، المحسوب على الفترات الموسعة ، يجعل من الممكن تحديد اتجاه وطبيعة (تسارع أو تباطؤ النمو) لاتجاه التنمية الرئيسي.

طريقة المتوسط ​​المتحركمشابه للمستوى السابق ، ولكن في هذه الحالة يتم استبدال المستويات الفعلية بمتوسط ​​المستويات المحسوبة على فترات متتالية تتحرك (انزلاق) موسعة تغطي ممستويات السلسلة.

على سبيل المثالإذا قبلنا م = 3 ،ثم يتم أولاً حساب متوسط ​​المستويات الثلاثة الأولى من السلسلة ، ثم - من نفس عدد المستويات ، ولكن بدءًا من المستوى الثاني على التوالي ، ثم البدء من المستوى الثالث ، إلخ. وهكذا ، فإن المتوسط ​​، كما كان ، "ينزلق" على طول عدد من الديناميكيات ، متحركًا بفترة واحدة. محسوب من متشير المتوسطات المتحركة للأعضاء إلى منتصف (وسط) كل فترة.

هذه الطريقة تقضي فقط على التقلبات العشوائية. إذا كانت السلسلة تحتوي على موجة موسمية ، فستستمر بعد التنعيم بطريقة المتوسط ​​المتحرك.

محاذاة تحليلية. من أجل القضاء على التقلبات العشوائية وتحديد الاتجاه ، يتم تطبيق محاذاة مستويات السلسلة بواسطة الصيغ التحليلية (أو المحاذاة التحليلية). يتمثل جوهرها في استبدال المستويات التجريبية (الفعلية) بالمستويات النظرية ، والتي يتم حسابها وفقًا لمعادلة معينة تم تبنيها كنموذج اتجاه رياضي ، حيث يتم اعتبار المستويات النظرية كدالة للوقت:. في هذه الحالة ، يعتبر كل مستوى فعلي كمجموع مكونين: ، أين هو المكون النظامي ويتم التعبير عنه بمعادلة معينة ، وهو متغير عشوائي يسبب تقلبات حول الاتجاه.

تتلخص مهمة المحاذاة التحليلية في ما يلي:

1. التحديد ، بناءً على البيانات الفعلية ، لنوع الوظيفة الافتراضية التي يمكن أن تعكس بشكل ملائم اتجاه تطور المؤشر قيد الدراسة.

2. إيجاد معاملات الوظيفة المحددة (المعادلة) من البيانات التجريبية

3. الحساب وفقًا للمعادلة التي تم العثور عليها للمستويات النظرية (المحاذاة).

يتم اختيار وظيفة معينة ، كقاعدة عامة ، على أساس تمثيل رسومي للبيانات التجريبية.

تستخدم معادلات الانحدار كنماذج يتم حساب معلماتها باستخدام طريقة المربعات الصغرى

فيما يلي معادلات الانحدار الأكثر استخدامًا لتسوية السلاسل الزمنية ، مع الإشارة إلى اتجاهات التنمية الأكثر ملاءمة لها.

للعثور على معلمات المعادلات أعلاه ، هناك خوارزميات وبرامج كمبيوتر خاصة. على وجه الخصوص ، للعثور على معلمات معادلة الخط المستقيم ، يمكن استخدام الخوارزمية التالية:

إذا تم ترقيم الفترات أو اللحظات الزمنية بحيث تكون St = 0 ، فسيتم تبسيط الخوارزميات المذكورة أعلاه بشكل كبير وتتحول إلى

ستكون المستويات المحاذية على الرسم البياني موجودة على خط مستقيم واحد يمر على أقرب مسافة من المستويات الفعلية لهذه السلسلة الزمنية. مجموع مربعات الانحرافات هو انعكاس لتأثير العوامل العشوائية.

بمساعدتها ، نحسب متوسط ​​الخطأ (القياسي) للمعادلة:

هنا n هو عدد المشاهدات ، و m هو عدد المعلمات في المعادلة (لدينا اثنان منهم - b 1 و b 0).

يوضح الاتجاه الرئيسي (الاتجاه) كيف تؤثر العوامل المنهجية على مستويات عدد من الديناميكيات ، وتعمل التقلبات في المستويات حول الاتجاه () كمقياس لتأثير العوامل المتبقية.

لتقييم جودة نموذج السلاسل الزمنية المستخدم ، يتم استخدامه أيضًا اختبار فيشر F... هي نسبة تباينين ​​، وهما نسبة التباين الناتج عن الانحدار ، أي العامل المدروس إلى التباين الناتج عن الأسباب العشوائية ، أي التشتت المتبقي:

في شكل موسع ، يمكن تمثيل صيغة هذا المعيار على النحو التالي:

حيث n هو عدد الملاحظات ، أي عدد المستويات على التوالي ،

م هو عدد المعلمات في المعادلة ، ص هو المستوى الفعلي للسلسلة ،

مستوى الصف المحاذي - مستوى الصف الأوسط.

قد لا يكون النموذج الأكثر نجاحًا من غيره دائمًا مرضيًا بدرجة كافية. لا يمكن التعرف عليه على هذا النحو إلا إذا تجاوز معياره F الحدود الحرجة المعروفة. يتم تعيين هذه الحدود باستخدام جداول التوزيع F.

جوهر وتصنيف المؤشرات.

يُفهم مؤشر الإحصاء على أنه مؤشر نسبي يميز التغيير في حجم ظاهرة في الزمان أو المكان أو بالمقارنة مع أي معيار.

العنصر الرئيسي لنسبة المؤشر هو القيمة المفهرسة. تُفهم القيمة المفهرسة على أنها قيمة سمة المجتمع الإحصائي ، والتغيير الذي يكون موضوع الدراسة.

هناك ثلاث مهام رئيسية مع الفهارس:

1) تقييم التغيرات في ظاهرة معقدة ؛

2) تحديد تأثير العوامل الفردية على التغيير في ظاهرة معقدة ؛

3) مقارنة حجم ظاهرة ما بحجم الفترة الماضية ، وحجم منطقة أخرى ، وكذلك مع المعايير والخطط والتنبؤات.

تصنف المؤشرات وفق 3 معايير:

2) حسب درجة تغطية عناصر السكان ؛

3) وفق طرق حساب المؤشرات العامة.

حسب المحتوىمن القيم المفهرسة ، تنقسم المؤشرات إلى مؤشرات كمية (حجمية) ومؤشرات مؤشرات نوعية. مؤشرات المؤشرات الكمية - مؤشرات الحجم المادي للإنتاج الصناعي ، الحجم المادي للمبيعات ، عدد الموظفين ، إلخ. مؤشرات المؤشرات النوعية - مؤشرات الأسعار ، تكاليف الإنتاج ، إنتاجية العمالة ، متوسط ​​الأجور ، إلخ.

حسب درجة تغطية وحدات السكان ، تنقسم المؤشرات إلى فئتين: فردية وعامة. لتوصيفها ، نقدم الاصطلاحات التالية المعتمدة في ممارسة استخدام طريقة الفهرس:

ف- كمية (حجم) أي منتج في التعبير الطبيعي ؛ ر- سعر الوحده؛ ض- تكلفة وحدة الإنتاج ؛ ر- الوقت الذي يقضيه في إنتاج وحدة الإنتاج (كثافة اليد العاملة) ؛ ث- إنتاج المنتجات من حيث القيمة لكل وحدة زمنية ؛ الخامس- إنتاج منتجات عينية لكل وحدة زمنية ؛ تي- إجمالي الوقت المستغرق أو عدد الموظفين.

من أجل التمييز بين الفترة أو العنصر الذي تنتمي إليه القيم المفهرسة ، من المعتاد وضع الرموز في أسفل اليمين بعد الرمز المقابل. لذلك ، على سبيل المثال ، في مؤشرات الديناميكيات ، كقاعدة عامة ، بالنسبة للفترات (الحالية ، والتقارير) ، يتم استخدام الرمز 1 وللفترات التي تتم بها المقارنة ،

فهارس فرديةتعمل على وصف التغيير في العناصر الفردية لظاهرة معقدة (على سبيل المثال ، التغيير في حجم إنتاج نوع واحد من المنتجات). أنها تمثل القيم النسبية للديناميات ، والوفاء بالالتزامات ، ومقارنة القيم المفهرسة.

يتم تحديد المؤشر الفردي للحجم المادي للإنتاج

من وجهة نظر تحليلية ، تتشابه مؤشرات الديناميكيات الفردية مع معدلات النمو (المعدلات) وتميز التغيير في القيمة المفهرسة في الفترة الحالية مقارنة بخط الأساس ، أي أنها توضح عدد مرات زيادة (انخفاض) ) أو كم نسبة النمو (النقصان). يتم التعبير عن قيم الفهرس بالمعاملات أو النسب المئوية.

الفهرس العام (الملخص)يعكس التغيير في جميع عناصر ظاهرة معقدة.

الفهرس الإجماليهو الشكل الرئيسي للفهرس. يطلق عليه التجميع لأن البسط والمقام عبارة عن مجموعة من "التجميع"

متوسط ​​المؤشرات وتعريفها.

بالإضافة إلى المؤشرات المجمعة ، تستخدم الإحصائيات شكلاً آخر منها - مؤشرات المتوسط ​​المرجح. يتم اللجوء إليها عندما لا تسمح المعلومات المتاحة بحساب إجمالي المؤشر الإجمالي. لذلك ، إذا لم تكن هناك بيانات عن الأسعار ، ولكن هناك معلومات حول تكلفة المنتجات في الفترة الحالية وكانت مؤشرات الأسعار الفردية لكل منتج معروفة ، فلا يمكن تحديد مؤشر الأسعار العام كمجموع ، ولكن من الممكن احسبه على أنه متوسط ​​الأفراد. بالطريقة نفسها ، إذا كانت كميات الأنواع الفردية من المنتجات المنتجة غير معروفة ، ولكن المؤشرات الفردية وتكلفة منتجات فترة الأساس معروفة ، فيمكن تحديد المؤشر العام للحجم المادي للإنتاج كمتوسط ​​مرجح .

متوسط ​​المؤشر -هذا هويتم احتساب المؤشر على أنه متوسط ​​المؤشرات الفردية. الفهرس التجميعي هو الشكل الرئيسي للمؤشر العام ، لذلك يجب أن يكون المؤشر المتوسط ​​هو نفسه الفهرس التجميعي. عند حساب المتوسطات ، يتم استخدام شكلين من المتوسطات: الحسابية والتوافقية.

يكون مؤشر المتوسط ​​الحسابي مطابقًا للمؤشر التجميعي إذا كانت أوزان المؤشرات الفردية هي شروط مقام الفهرس التجميعي. فقط في هذه الحالة ، ستكون قيمة المؤشر ، المحسوبة بواسطة صيغة المتوسط ​​الحسابي ، مساوية للفهرس التجميعي.

التوقع والتباين

دعونا نقيس متغير عشوائي نمرات ، على سبيل المثال ، نقيس سرعة الرياح عشر مرات ونريد إيجاد القيمة المتوسطة. كيف يرتبط المتوسط ​​بوظيفة التوزيع؟

سنقوم برمي النرد عدة مرات. عدد النقاط التي ستسقط في النرد مع كل لفة هو متغير عشوائي ويمكن أن يأخذ أي قيم طبيعية من 1 إلى 6. المتوسط ​​الحسابي للنقاط المسقطة المحسوبة لجميع لفات النرد هو أيضًا قيمة عشوائية ، ولكن لكبير نتميل إلى رقم محدد للغاية - التوقع الرياضي م س... في هذه الحالة م س = 3,5.

كيف نشأت هذه القيمة؟ اتركه نانخفضت المحاكمات مرة واحدة نقطة ، مرة واحدة - نقطتان ، وهكذا. ثم ل ن→ ∞ عدد النتائج التي تم فيها إسقاط نقطة واحدة ، وبالمثل ، وبالتالي

نموذج 4.5. حجر النرد

افترض الآن أننا نعرف قانون توزيع متغير عشوائي xأي أننا نعلم أن المتغير العشوائي xيمكن أن تأخذ القيم x 1 , x 2 , ..., س كمع الاحتمالات ص 1 , ص 2 , ..., ص ك.

القيمة المتوقعة م سمتغير عشوائي xبالتساوي:

إجابه. 2,8.

التوقع الرياضي ليس دائمًا تقديرًا معقولًا لبعض المتغيرات العشوائية. لذلك ، لتقدير متوسط ​​الأجر ، من المعقول أكثر استخدام مفهوم الوسيط ، أي أن عدد الأشخاص الذين يتلقون أقل من متوسط ​​الأجر وأكثر متماثلًا.

الوسيطالمتغير العشوائي يسمى الرقم x 1/2 من هذا القبيل ص (x < x 1/2) = 1/2.

بمعنى آخر ، الاحتمال ص 1 أن المتغير العشوائي xسيكون أقل x 1/2 والاحتمال ص 2 ـ أن المتغير العشوائي xسيكون أكبر x 1/2 هي نفسها وتساوي 1/2. لم يتم تحديد الوسيط بشكل فريد لجميع التوزيعات.

دعنا نعود إلى متغير عشوائي x، والتي يمكن أن تأخذ القيم x 1 , x 2 , ..., س كمع الاحتمالات ص 1 , ص 2 , ..., ص ك.

تشتتمتغير عشوائي xتسمى القيمة المتوسطة لمربع انحراف متغير عشوائي عن توقعه الرياضي:

مثال 2

في ظل ظروف المثال السابق ، احسب التباين والانحراف المعياري لمتغير عشوائي x.

إجابه. 0,16, 0,4.

نموذج 4.6. الرماية

مثال 3

أوجد التوزيع الاحتمالي لعدد النقاط التي تم إسقاطها على قالب نرد من أول لفة ومتوسط ​​ومتوسط ​​وتباين وانحراف معياري.

السقوط من أي وجه هو احتمال متساوٍ ، لذا سيبدو التوزيع كما يلي:

انحراف RMS من الملاحظ أن انحراف القيمة عن المتوسط ​​كبير جدًا.

خصائص التوقع الرياضي:

  • التوقع الرياضي لمجموع المتغيرات العشوائية المستقلة يساوي مجموع توقعاتهم الرياضية:

مثال 4

أوجد التوقع الرياضي لمجموع وحاصل النقاط الملفوفة على نردتين.

في المثال 3 ، وجدنا ذلك لمكعب واحد م (x) = 3.5. لذلك ، لمكعبين

خصائص التشتت:

  • التباين في مجموع المتغيرات العشوائية المستقلة يساوي مجموع الفروق:

د x + ذ = د x + د ذ.

اسمحوا ل نتوالت النرد ذنقاط. ثم

هذه النتيجة صحيحة ليس فقط لفات النرد. في كثير من الحالات ، تحدد دقة قياس التوقع الرياضي تجريبياً. يمكن ملاحظة ذلك مع زيادة عدد القياسات نيتناقص انتشار القيم حول المتوسط ​​، أي الانحراف المعياري ، بشكل متناسب

يرتبط تباين المتغير العشوائي بالتوقع الرياضي لمربع هذا المتغير العشوائي بالعلاقة التالية:

دعونا نجد التوقعات الرياضية لكلا الجانبين من هذه المساواة. الدير ،

التوقع الرياضي للجانب الأيمن من المساواة من خلال خاصية التوقعات الرياضية يساوي

الانحراف المعياري

الانحراف المعيارييساوي الجذر التربيعي للتباين:
عند تحديد الانحراف المعياري بحجم كبير بدرجة كافية من السكان المدروسين (ن> 30) ، يتم استخدام الصيغ التالية:

معلومات مماثلة.


عند اختبار الفرضيات إحصائياً ، عند قياس العلاقة الخطية بين المتغيرات العشوائية.

الانحراف المعياري:

الانحراف المعياري(تقدير الانحراف المعياري للأرضيات المتغيرة العشوائية والجدران من حولنا والسقف ، xبالنسبة لتوقعاتها الرياضية بناءً على تقدير غير متحيز لتباينها):

أين التباين؟ - الأرضية والجدران من حولنا والسقف ، أناالعنصر عشر من العينة ؛ - حجم العينة؛ - المتوسط ​​الحسابي للعينة:

وتجدر الإشارة إلى أن كلا التقديرين متحيزان. في الحالة العامة ، من المستحيل بناء تقدير غير متحيز. ومع ذلك ، فإن التقدير المستند إلى تقدير التباين غير المتحيز متسق.

قاعدة سيغما الثلاثة

قاعدة سيغما الثلاثة() - تقع جميع قيم المتغير العشوائي الموزع بشكل طبيعي تقريبًا في الفاصل الزمني. أكثر دقة - مع ثقة لا تقل عن 99.7٪ ، تكمن قيمة المتغير العشوائي الموزع بشكل طبيعي في الفاصل الزمني المحدد (بشرط أن تكون القيمة صحيحة ، ولم يتم الحصول عليها نتيجة معالجة العينة).

إذا كانت القيمة الحقيقية غير معروفة ، فلا يجب أن تستخدم ، بل الأرضية والجدران من حولنا والسقف ، س... وهكذا تتحول قاعدة الثلاث سيجما إلى قاعدة ثلاثة طوابق ، جدران من حولنا وسقف ، س .

تفسير قيمة الانحراف المعياري

تُظهر القيمة الكبيرة للانحراف المعياري انتشارًا كبيرًا للقيم في المجموعة المقدمة بمتوسط ​​قيمة المجموعة ؛ تشير القيمة الصغيرة ، وفقًا لذلك ، إلى أن القيم الموجودة في المجموعة مجمعة حول المتوسط.

على سبيل المثال ، لدينا ثلاث مجموعات أرقام: (0 ، 0 ، 14 ، 14) ، (0 ، 6 ، 8 ، 14) و (6 ، 6 ، 8 ، 8). بالنسبة لجميع المجموعات الثلاث ، تكون القيم المتوسطة هي 7 ، والانحرافات المعيارية هي ، على التوالي ، 7 و 5 و 1. المجموعة الأخيرة لها انحراف معياري صغير ، حيث يتم تجميع القيم الموجودة في المجموعة حول المتوسط ​​؛ المجموعة الأولى لها أكبر انحراف معياري - تختلف القيم داخل المجموعة بشدة عن المتوسط.

بشكل عام ، يمكن اعتبار الانحراف المعياري مقياسًا لعدم اليقين. على سبيل المثال ، في الفيزياء ، يتم استخدام الانحراف المعياري لتحديد خطأ سلسلة من القياسات المتتالية للكمية. هذه القيمة مهمة جدًا لتحديد احتمالية الظاهرة قيد الدراسة مقارنة بالقيمة المتوقعة للنظرية: إذا كان متوسط ​​قيمة القياسات يختلف اختلافًا كبيرًا عن القيم التي تنبأت بها النظرية (قيمة كبيرة للانحراف المعياري) ، ثم يجب إعادة فحص القيم التي تم الحصول عليها أو طريقة الحصول عليها.

الاستخدام العملي

في الممارسة العملية ، يسمح لك الانحراف المعياري بتحديد مدى اختلاف القيم في مجموعة عن المتوسط.

مناخ

لنفترض أن هناك مدينتين لهما نفس متوسط ​​درجة الحرارة اليومية القصوى ، لكن إحداهما على الساحل والأخرى داخلية. من المعروف أن المدن الساحلية بها درجات حرارة قصوى مختلفة أثناء النهار أقل من المدن الداخلية. لذلك ، فإن الانحراف المعياري لدرجات الحرارة القصوى خلال النهار بالقرب من المدينة الساحلية سيكون أقل من المدينة الثانية ، على الرغم من حقيقة أن لديهم نفس متوسط ​​قيمة هذه القيمة ، مما يعني عمليًا أن احتمال أن تكون درجة حرارة الهواء القصوى من سيكون كل يوم محدد من العام أقوى يختلف عن المتوسط ​​، وأعلى بالنسبة لمدينة تقع في داخل القارة.

رياضة

لنفترض أن هناك العديد من فرق كرة القدم التي تم تقييمها وفقًا لمجموعة معينة من المعايير ، على سبيل المثال ، عدد الأهداف التي تم تسجيلها وتسجيلها في شباكها ، وفرص التسجيل ، وما إلى ذلك. من المرجح أن يكون أفضل فريق في هذه المجموعة لديه أفضل القيم في مزيد من المعلمات. كلما كان لدى الفريق انحراف معياري أقل لكل من المعلمات المقدمة ، كلما زادت إمكانية التنبؤ بنتيجة الفريق ، كانت هذه الفرق متوازنة. من ناحية أخرى ، من الصعب التنبؤ بنتيجة فريق لديه انحراف معياري كبير ، والذي بدوره يرجع إلى اختلالات ، على سبيل المثال ، دفاع قوي ، لكن هجوم ضعيف.

يسمح استخدام الانحراف المعياري لمعايير الفريق ، بدرجة أو بأخرى ، بالتنبؤ بنتيجة المباراة بين فريقين ، وتقييم نقاط القوة والضعف للفريقين ، وبالتالي طرق النضال المختارة.

التحليل الفني

أنظر أيضا

المؤلفات

* بوروفيكوف ، ف. STATISTICA. فن تحليل البيانات على الحاسوب: للمحترفين / ف. بوروفيكوف. - SPb. : بيتر ، 2003. - 688 ص. - ردمك 5-272-00078-1.

توصل علماء الرياضيات والإحصاء الحكيمون إلى مؤشر أكثر موثوقية ، على الرغم من اختلاف الغرض قليلاً - يعني الانحراف الخطي... يميز هذا المؤشر قياس انتشار قيم مجموعة البيانات حول متوسطها.

لإظهار مقياس تشتت البيانات ، عليك أولاً تحديد ما سيتم اعتباره هذا التبعثر بالنسبة له - عادةً ما يكون هذا هو متوسط ​​القيمة. بعد ذلك ، تحتاج إلى حساب مدى بُعد قيم مجموعة البيانات التي تم تحليلها عن المتوسط. من الواضح أن قدرًا معينًا من الانحراف يتوافق مع كل قيمة ، لكننا مهتمون بإجراء تقييم عام يغطي المجتمع بأكمله. لذلك ، يتم حساب متوسط ​​الانحراف باستخدام معادلة المتوسط ​​الحسابي المعتادة. لكن! ولكن من أجل حساب متوسط ​​الانحرافات ، يجب إضافتها أولاً. وإذا جمعنا الأعداد الموجبة والسالبة ، فسيلغي أحدهما الآخر وسيميل مجموعهما إلى الصفر. لتجنب ذلك ، يتم أخذ جميع الانحرافات بطريقة معيارية ، أي أن جميع الأرقام السالبة تصبح موجبة. الآن سيظهر متوسط ​​الانحراف مقياسًا عامًا لانتشار القيم. نتيجة لذلك ، سيتم حساب متوسط ​​الانحراف الخطي بالصيغة:

أ- متوسط ​​الانحراف الخطي ،

x- المؤشر الذي تم تحليله ، مع شرطة أعلاه - متوسط ​​قيمة المؤشر ،

ن- عدد القيم في مجموعة البيانات التي تم تحليلها ،

آمل ألا يخيف عامل الجمع أحداً.

يعكس متوسط ​​الانحراف الخطي المحسوب وفقًا للصيغة المحددة متوسط ​​الانحراف المطلق عن المتوسط ​​لمجتمع معين.

في الصورة ، الخط الأحمر هو المتوسط. يشار إلى انحرافات كل ملاحظة عن المتوسط ​​بواسطة أسهم صغيرة. يتم أخذها modulo وتلخيصها. ثم يتم تقسيم كل شيء على عدد القيم.

لإكمال الصورة ، يجب أيضًا إعطاء مثال. لنفترض أن هناك شركة لإنتاج قصاصات المجرفة. يجب أن يبلغ طول كل ساق 1.5 متر ، ولكن الأهم من ذلك ، يجب أن تكون جميعها متماثلة ، أو على الأقل زائد أو ناقص 5 سم ، ومع ذلك ، فإن العمال المهملين سيقطعون 1.2 متر أو 1.8 متر.المقيمون في الصيف غير سعداء ... قرر مدير الشركة إجراء تحليل إحصائي لطول القطع. اخترت 10 قطع وقمت بقياس طولها ، ووجدت المتوسط ​​وحسبت متوسط ​​الانحراف الخطي. تبين أن المتوسط ​​هو بالضبط ما نحتاجه - 1.5 متر ، لكن متوسط ​​الانحراف الخطي جاء 0.16 متر ، لذلك اتضح أن كل ساق أطول أو أقصر من المطلوب في المتوسط ​​بمقدار 16 سم ، وهناك شيء نتحدث عنه مع العمال ... في الواقع ، لم أر استخدامًا حقيقيًا لهذا المؤشر ، لذلك توصلت إلى مثال بنفسي. ومع ذلك ، هناك مثل هذا المؤشر في الإحصاء.

تشتت

مثل المتوسط ​​الخطي ، يعكس التباين أيضًا قياس انتشار البيانات حول المتوسط.

تبدو صيغة حساب التباين كما يلي:

(للسلسلة المتغيرة (التباين الموزون))

(للبيانات غير المبوبة (تباين بسيط))

حيث: σ 2 - التباين ، شي- نقوم بتحليل مؤشر المربع (قيمة السمة) ، - متوسط ​​قيمة المؤشر ، f i - عدد القيم في مجموعة البيانات التي تم تحليلها.

التباين هو متوسط ​​مربع الانحرافات.

أولاً ، يتم حساب متوسط ​​القيمة ، ثم يتم أخذ الفرق بين كل قيمة أولية ومتوسط ​​، في تربيعه ، وضربه في تكرار قيمة الميزة المقابلة ، ثم يُضاف ثم يُقسَّم على عدد القيم في المجتمع المحدد.

ومع ذلك ، لا يتم استخدام التباين في شكله النقي ، مثل المتوسط ​​الحسابي أو الفهرس. إنه بالأحرى مؤشر مساعد ومتوسط ​​يستخدم لأنواع أخرى من التحليل الإحصائي.

طريقة مبسطة لحساب التباين

الانحراف المعياري

لاستخدام التباين في تحليل البيانات ، يتم استخراج الجذر التربيعي منه. اتضح أن ما يسمى ب الانحراف المعياري.

بالمناسبة ، يُطلق على الانحراف المعياري أيضًا اسم سيجما - من الحرف اليوناني الذي يشير إليه.

من الواضح أن الانحراف المعياري يميز أيضًا مقياس تشتت البيانات ، ولكن الآن (على عكس التباين) يمكن مقارنته بالبيانات الأصلية. كقاعدة عامة ، تعطي المربعات الجذرية في الإحصاء نتائج أكثر دقة من النتائج الخطية. لذلك ، يعد الانحراف المعياري مقياسًا أكثر دقة لتشتت البيانات من المتوسط ​​الخطي.

من ويكيبيديا، الموسوعة الحرة

جذور الانحراف مربع متوسط(المرادفات: جذور الانحراف مربع متوسط, جذور الانحراف مربع متوسط, انحراف مربع؛ المصطلحات ذات الصلة: الانحراف المعياري, انتشار قياسي) - في نظرية الاحتمالات والإحصاء ، المؤشر الأكثر شيوعًا لتشتت قيم متغير عشوائي بالنسبة لتوقعاته الرياضية. باستخدام المصفوفات المحدودة لعينات القيم ، بدلاً من التوقع الرياضي ، يتم استخدام المتوسط ​​الحسابي لمجموعة العينات.

معلومات اساسية

يقاس الانحراف المعياري بوحدات قياس المتغير العشوائي نفسه ويستخدم لحساب الخطأ المعياري للمتوسط ​​الحسابي ، عند بناء فترات الثقة ، عند اختبار الفرضيات إحصائياً ، عند قياس العلاقة الخطية بين المتغيرات العشوائية. يتم تعريفه على أنه الجذر التربيعي لتباين متغير عشوائي.

الانحراف المعياري:

\ سيجما = \ sqrt (\ frac (1) (n) \ sum_ (i = 1) ^ n \ left (x_i- \ bar (x) \ right) ^ 2).

الانحراف المعياري(تقدير الانحراف المعياري لمتغير عشوائي xبالنسبة لتوقعاتها الرياضية القائمة على تقدير غير متحيز لتباينها) س:

s = \ sqrt (\ frac (n) (n-1) \ sigma ^ 2) = \ sqrt (\ frac (1) (n-1) \ sum_ (i = 1) ^ n \ left (x_i- \ bar (خ) حق) ^ 2) ؛

قاعدة سيغما الثلاثة

قاعدة سيغما الثلاثة (3 \ سيجما) - تقع جميع قيم المتغير العشوائي الموزع بشكل طبيعي تقريبًا في الفاصل الزمني \ يسار (\ بار (س) -3 \ سيغما ؛ \ شريط (س) +3 \ سيغما \ يمين)... بشكل أكثر صرامة - مع احتمال 0.9973 تقريبًا ، تقع قيمة المتغير العشوائي الموزع بشكل طبيعي ضمن الفاصل الزمني المحدد (بشرط أن تكون القيمة \ شريط (س)صحيح ، غير مأخوذ من العينات).

إذا كانت القيمة الحقيقية \ شريط (س)غير معروف ، فلا يجب عليك استخدام \ سيجما، لكن س... وهكذا ، يتم تحويل قاعدة الثلاث سيجما إلى قاعدة من ثلاثة س .

تفسير قيمة الانحراف المعياري

تُظهر القيمة الأكبر للانحراف المعياري انتشارًا أكبر للقيم في المجموعة المقدمة بمتوسط ​​قيمة المجموعة ؛ تشير القيمة الأقل ، على التوالي ، إلى أن القيم الموجودة في المجموعة مجمعة حول المتوسط.

على سبيل المثال ، لدينا ثلاث مجموعات أرقام: (0 ، 0 ، 14 ، 14) ، (0 ، 6 ، 8 ، 14) و (6 ، 6 ، 8 ، 8). بالنسبة لجميع المجموعات الثلاث ، تكون القيم المتوسطة هي 7 ، والانحرافات المعيارية هي ، على التوالي ، 7 و 5 و 1. المجموعة الأخيرة لها انحراف معياري صغير ، حيث يتم تجميع القيم الموجودة في المجموعة حول المتوسط ​​؛ المجموعة الأولى لها أكبر انحراف معياري - تختلف القيم داخل المجموعة بشدة عن المتوسط.

بشكل عام ، يمكن اعتبار الانحراف المعياري مقياسًا لعدم اليقين. على سبيل المثال ، في الفيزياء ، يتم استخدام الانحراف المعياري لتحديد خطأ سلسلة من القياسات المتتالية للكمية. هذه القيمة مهمة جدًا لتحديد احتمالية الظاهرة قيد الدراسة مقارنة بالقيمة المتوقعة للنظرية: إذا كان متوسط ​​قيمة القياسات يختلف اختلافًا كبيرًا عن القيم التي تنبأت بها النظرية (قيمة كبيرة للانحراف المعياري) ، ثم يجب إعادة فحص القيم التي تم الحصول عليها أو طريقة الحصول عليها.

الاستخدام العملي

في الممارسة العملية ، يسمح لك الانحراف المعياري بتقدير مدى اختلاف القيم من مجموعة عن المتوسط.

الاقتصاد والتمويل

الانحراف المعياري لعائد المحفظة \ سيجما = \ الجذر التربيعي (D [X])المحددة مع مخاطر المحفظة.

مناخ

لنفترض أن هناك مدينتين لهما نفس متوسط ​​درجات الحرارة القصوى خلال النهار ، لكن إحداهما على الساحل والأخرى في السهل. من المعروف أن المدن الساحلية بها درجات حرارة قصوى مختلفة أثناء النهار أقل من المدن الداخلية. لذلك ، فإن الانحراف المعياري لدرجات الحرارة القصوى خلال النهار بالقرب من المدينة الساحلية سيكون أقل من المدينة الثانية ، على الرغم من حقيقة أن لديهم نفس متوسط ​​قيمة هذه القيمة ، مما يعني عمليًا أن احتمال أن تكون درجة حرارة الهواء القصوى من سيكون كل يوم محدد من العام أقوى يختلف عن المتوسط ​​، وأعلى بالنسبة لمدينة تقع في داخل القارة.

رياضة

لنفترض أن هناك العديد من فرق كرة القدم التي تم تقييمها وفقًا لمجموعة معينة من المعايير ، على سبيل المثال ، عدد الأهداف التي تم تسجيلها وتسجيلها في شباكها ، وفرص التسجيل ، وما إلى ذلك. من المرجح أن يكون أفضل فريق في هذه المجموعة لديه أفضل القيم في مزيد من المعلمات. كلما كان لدى الفريق انحراف معياري أقل لكل من المعلمات المقدمة ، كلما زادت إمكانية التنبؤ بنتيجة الفريق ، كانت هذه الفرق متوازنة. من ناحية أخرى ، من الصعب التنبؤ بنتيجة فريق لديه انحراف معياري كبير ، والذي بدوره يرجع إلى اختلالات ، على سبيل المثال ، دفاع قوي ، لكن هجوم ضعيف.

يسمح استخدام الانحراف المعياري لمعايير الفريق ، بدرجة أو بأخرى ، بالتنبؤ بنتيجة المباراة بين فريقين ، وتقييم نقاط القوة والضعف للفريقين ، وبالتالي طرق النضال المختارة.

أنظر أيضا

اكتب مراجعة عن مقالة "الانحراف المعياري"

المؤلفات

  • بوروفيكوف ف. STATISTICA. فن تحليل البيانات على الحاسوب: للمحترفين / ف. بوروفيكوف. - SPb. : بيتر ، 2003. - 688 ص. - ردمك 5-272-00078-1..

مقتطف يصف الانحراف المعياري

وسرعان ما فتح الباب وخرج إلى الشرفة بخطوات حاسمة. توقفت المحادثة فجأة ، وأزيلت القبعات والقبعات ، وذهبت كل العيون إلى الكونت الذي خرج.
- مرحبا يا شباب! - قال العد بسرعة وبصوت عال. - شكرا لقدومك. سوف أخرج إليك الآن ، لكن أولاً وقبل كل شيء علينا التعامل مع الشرير. نحن بحاجة إلى معاقبة الشرير الذي قتل موسكو. الانتظار لي! - وعاد العد بالسرعة نفسها إلى غرفه ، وأغلق الباب بقوة.
سرت نفخة الموافقة على السرور بين الحشد. "هذا يعني أن الأوغاد سيحكمهم الوسيط! وأنت تقول الفرنسية ... سوف يفكك كل المسافة! " - قال الناس كأنهم يوبخون بعضهم بعضا على قلة إيمانهم.
بعد بضع دقائق ، هرع ضابط من الباب الأمامي ، وأمر بشيء ، وتمدد الفرسان. تحرك الحشد بشغف من الشرفة إلى الشرفة. عندما خرج روستوفشين بخطوات سريعة غاضبة إلى الشرفة ، نظر حوله على عجل ، كما لو كان يبحث عن شخص ما.
- أين هو؟ - قال العد ، وفي نفس اللحظة قال هذا ، رأى من حول زاوية المنزل يخرج بين اثنين من الفرسان لشاب طويل ، رقبة رفيعة ، نصف حليق ورأس متضخم. كان هذا الشاب يرتدي رداءًا أنيقًا ذات مرة ، ومغطى بقطعة قماش زرقاء ، ومعطفًا رثًا من جلد الغنم والثعلب ، وبنطلونًا متسخًا للسجناء بجانب السرير ، مدسوسًا في حذاء رفيع غير نظيف ومهتر. كانت الأغلال معلقة بشدة على رجليه النحيفتين والضعيفتين ، مما يجعل من الصعب على الشاب أن يتردد.
- لكن! - قال روستوفشين ، أدار عينيه على عجل بعيدًا عن الشاب الذي يرتدي معطفًا من جلد الغنم الثعلب وأشار إلى الدرجة السفلية من الشرفة. - ضعه هنا! - صعد الشاب ، وهو قعقعة بالأصفاد ، بخطى كثيفة على الدرج المشار إليه ، ممسكًا ياقة معطفه المصنوع من جلد الغنم بإصبعه ، ولف رقبته الطويلة مرتين ، وتنهد ، طوى يديه الرفيعة غير العاملة أمام بطنه. لفتة خاضعة.
لبضع ثوان ، بينما كان الشاب يجلس على الدرج ، ساد الصمت. فقط في الصفوف الخلفية من الناس الذين يضغطون على مكان واحد كان يسمع الأنين ، والآهات ، والصدمات ، وقعقعة الأرجل المعاد ترتيبها.
فرك روستوفتشين ، متوقعا منه أن يتوقف عند المكان المشار إليه ، بيده عابسًا.
- رفاق! - قال روستوفشين بصوت معدني رقيق - هذا الرجل ، فيريشاجين ، هو نفس اللقيط الذي قتل موسكو.
وقف شاب يرتدي معطفًا من جلد الغنم الثعلب في وضع خاضع ، ويداه متشابكتان معًا أمام بطنه ومنحنين قليلاً. تم إنزال وجهه الشاب ، الهزيل ، بتعبير ميؤوس منه ، مشوهًا برأسه المحلوق. في الكلمات الأولى من العد ، رفع رأسه ببطء ونظر من الأسفل إلى العد ، كما لو كان يريد أن يقول له شيئًا أو على الأقل يلقى بصره. لكن روستوفشين لم ينظر إليه. على رقبة الشاب الطويلة الرفيعة ، مثل الحبل ، توترت وتحولت إلى اللون الأزرق خلف الأذن ، وفجأة تحول وجهه إلى اللون الأحمر.
تم وضع كل العيون عليه. نظر إلى الحشد ، وكأنه مطمئن بالتعبير الذي قرأه على وجوه الناس ، ابتسم بحزن وخجول ، ثم خفض رأسه مرة أخرى ، وصحح نفسه بقدميه على الدرجة.
"لقد خان قيصره ووطنه ، وانتقل إلى بونابرت ، وكان واحدًا من جميع الروس الذين عاروا على اسم الروسي ، وموسكو تموت منه" ، قال روستوبشين بصوت قاسٍ. لكنه فجأة نظر سريعًا إلى Vereshchagin ، الذي استمر في الوقوف في نفس الموقف الخاضع. كأن هذه النظرة فجرته ، رفع يده وكاد يصرخ مخاطبًا الناس: - بحكمك ، تعامل معه! أعطيتك إياها!
كان الناس صامتين وضغطوا أكثر فأكثر ضد بعضهم البعض. أصبح ممسكًا ببعضهم البعض ، والتنفس في هذا الاحتقان الملوث ، وعدم امتلاك القوة للتحرك وانتظار شيء غير معروف وغير مفهوم ومخيف لا يطاق. الأشخاص الواقفون في الصفوف الأمامية ، يرون ويسمعون كل ما حدث أمامهم ، كلهم ​​بعيون واسعة ومخيفة وأفواه مفجعة ، يجهدون كل قوتهم ، ويحتفظون بضغط المؤخرة على ظهورهم.
- اضربه! .. فليهلك الخائن ولا يخجل اسم الروسي! - صاح روستوفشين. - اقطعها! انا اطلب! - لم يسمعوا كلامًا ، بل أصوات غضب صوت روستوفتشين ، تأوه الحشد وتقدموا ، لكنهم توقفوا مرة أخرى.
- عد! .. - قال Vereshchagin الخجول وفي نفس الوقت صوت مسرحي في خضم الصمت المؤقت مرة أخرى. - عد ، إله واحد فوقنا ... - قال Vereshchagin ، ورفع رأسه ، ومرة ​​أخرى كان الوريد السميك على رقبته الرقيقة ممتلئًا بالدماء ، وسرعان ما خرج الطلاء وهرب من وجهه. لم يكمل ما يريد قوله.
- اقطعها! أطلب! .. - صرخ روستوفشين ، فجأة أصبح شاحبًا مثل Vereshchagin.
- صابر بالخارج! صرخ الضابط على الفرسان ، وأخذ صابره بنفسه.
ارتفعت موجة أخرى لا تزال أقوى عبر الناس ، وبعد أن وصلت إلى الصفوف الأمامية ، حركت هذه الموجة الصفوف الأمامية ، بشكل مذهل ، وأخذتهم إلى درجات السلم ذاتها. وقف رجل طويل القامة ، مع تعبير متحجر على وجهه ويده مرفوعة ، بجانب Vereshchagin.
- اقطعها! كاد الضابط أن يهمس للفرسان ، وفجأة قام أحد الجنود ، بوجه مشوه ، بضرب Vereshchagin على رأسه بسيف حاد.
"لكن!" - صرخ Vereshchagin بعد قليل ومفاجئ ، نظر حوله في خوف وكأنه لا يفهم سبب حدوث ذلك له. نفس أنين المفاجأة والرعب كان يمر عبر الحشد.
"يا إلهي!" - سمع تعجب حزين لشخص ما.
لكن بعد صيحة المفاجأة التي هربت من فيريشاجين ، صرخ في حزن من الألم ، وهذا الصراخ أفسده. امتد ذلك إلى أعلى درجة من الحواجز التي يشعر بها الإنسان ، والتي لا تزال تحبس الأنفاس ، وقد اخترقت على الفور. لقد بدأت الجريمة وكان لا بد من استكمالها. إن أنين العار المؤسف غرقه هدير الحشد المهدد والغاضب. مثل الموجة السابعة الأخيرة ، التي حطمت السفن ، ارتفعت هذه الموجة الأخيرة التي لا يمكن السيطرة عليها من الصفوف الخلفية ، ووصلت إلى الأمام ، وأسقطتها وابتلعت كل شيء. أراد الفارس الضارب تكرار إضرابه. Vereshchagin مع صرخة من الرعب ، واندفع مع نفسه بيديه ، واندفع إلى الناس. أمسك الرجل الطويل ، الذي عثر عليه ، بيديه في العنق الرقيق لـ Vereshchagin وبصراخ شديد ، سقط معه تحت أقدام الناس الهائجين الذين تراكموا عليهم.
ضرب البعض وتمزق في Vereshchagin ، والبعض الآخر الرجل طويل القامة. وأثارت صرخات الشعب المسحوق وأولئك الذين حاولوا إنقاذ الرجل الطويل غضب الحشد. لفترة طويلة لم يستطع الفرسان تحرير عامل المصنع الدموي الذي تعرض للضرب نصف. ولفترة طويلة ، على الرغم من كل التسرع المحموم الذي حاول به الحشد إكمال الأعمال التي كانت قد بدأت ، لم يستطع أولئك الأشخاص الذين ضربوه وخنقوه ومزقوه فيرشاجين ؛ لكن الحشد ضغط عليهم من جميع الجهات ، وهم في المنتصف ، مثل كتلة واحدة ، يتأرجحون من جانب إلى آخر ولم يمنحهم الفرصة إما للتخلص منه أو رميه.

© 2021 skudelnica.ru - الحب والخيانة وعلم النفس والطلاق والمشاعر والمشاجرات