الانحراف المعياري هو المفهوم الأكثر سوء فهم في الإحصاء التمهيدي. يعرف الناس أنه "يقيس التشتت" لكنهم يتجمّدون عندما يُسألون عمّا يعنيه الرقم فعلًا. يشرحه هذا الدليل بثلاث طرق — هندسية وحسابية وحدسية — لكي تفهم حقًّا ما يوجد هناك في المرة القادمة التي ترى فيها في بحث أو تقرير.
تعريف بلغة بسيطة
يجيب الانحراف المعياري عن: في المتوسط، كم يبعد كل نقطة بيانات عن المتوسط؟
رمزيًا، لمجتمع من قيمة بمتوسط :
اقرأها بصوت عالٍ: "متوسط الانحراف المربّع، ثم الجذر التربيعي."
لماذا التربيع ثم الجذر التربيعي؟
محاولة أولى معقولة لـ "متوسط المسافة عن المتوسط" قد تكون — وهو متوسط الانحراف المطلق. يعمل، ويستخدمه الإحصائيون أحيانًا (فهو أكثر متانة تجاه القيم الشاذة).
لكن القيمة المطلقة محرجة رياضيًا — فهي غير قابلة للاشتقاق عند الصفر، والمشتقات تنفجر، ولا يمكنك إجراء حساب التفاضل والتكامل بها بنظافة. التربيع يتجاوز كل ذلك، والجذر التربيعي في النهاية يعيد الوحدات إلى المقياس الأصلي (إذن بالدولارات إذا كان بالدولارات، لا بالدولارات²).
هذا هو نفس السبب الذي يجعل تعلّم الآلة يستخدم خسارة مربّعة (متوسط الخطأ التربيعي) — فالتربيع قابل للاشتقاق، ويتعامل جيدًا مع حساب التفاضل والتكامل، وكثيرًا ما تكون المقدِّرات الناتجة مثلى.
المجتمع مقابل العينة — مسألة مقابل
توجد صيغتان، والفرق مهم:
- المجتمع (لديك كل البيانات): اقسم على . الرمز .
- العينة (لديك عينة وتريد تقدير المجتمع): اقسم على . الرمز .
الـ في صيغة العينة هو تصحيح بسيل. لماذا؟ استخدام سيُقلّل بشكل منهجي تقدير الانحراف المعياري للمجتمع لأنك استخدمت متوسط العينة (الذي هو بطبيعته أفضل ملاءمة للعينة)، مما يضغط الانحرافات لتكون أصغر مما ستكون عليه مقابل متوسط المجتمع الحقيقي. القسمة على بدل تعوّض ذلك تمامًا.
تتخذ معظم الحاسبات والبرامج صيغة العينة افتراضيًا. انتبه.
مثال محلول 1: مجموعة بيانات صغيرة متناظرة
البيانات: . (8 قيم؛ مثال كتاب دراسي كلاسيكي.)
- المتوسط: .
- الانحرافات عن المتوسط: .
- الانحرافات المربّعة: .
- المجموع: .
- المجتمع (): التباين ، .
- العينة (): التباين ، .
قاعدة 68-95-99.7 (للتوزيعات الطبيعية فقط)
إذا كانت بياناتك طبيعية تقريبًا (على شكل جرس):
- نحو من القيم تقع ضمن من المتوسط.
- نحو ضمن .
- نحو ضمن .
لهذا السبب فإن "" أو "اثنين سيغما" هو التعريف العفوي الافتراضي لـ "غير معتاد إحصائيًا".
⚠️ تحذير: تنطبق هذه القاعدة فقط على التوزيعات الطبيعية. للبيانات المنحرفة أو ثقيلة الذيل (الدخل، زمن الاستجابة)، قد يغطّي نسبة 80% من البيانات — أو 50%. تحقّق دائمًا من شكل التوزيع (مدرّج تكراري، مخطط QQ) قبل اقتباس أرقام 68-95-99.7.
الانحراف المعياري مقابل التباين
التباين هو ببساطة . يحتويان معلومات متطابقة، فلماذا نحتفظ بكليهما؟
- الانحراف المعياري له الوحدات نفسها كالبيانات — قابل للتفسير.
- التباين يتفكّك جمعيًا للمتغيّرات المستقلة ( عند الاستقلال)، مما يجعله الكمية الملائمة جبريًا للبراهين والتوقّعات وتحليل التباين (ANOVA).
استخدم عند إعداد التقارير؛ استخدم عند إجراء الحسابات.
أخطاء شائعة
- اقتباس بلا سياق. "" لا يعني شيئًا إن لم تعرف المتوسط. اقرنهما دائمًا: "المتوسط ، ".
- الخلط بين صيغتي المجتمع والعينة. مع العينات الصغيرة يُحدث فرقًا حقيقيًا. مع العينات الكبيرة () يكون الفرق مهملًا.
- نسيان الحساسية للقيم الشاذة. قيمة متطرّفة واحدة قد تنفخ . للبيانات ثقيلة الذيل، أبلِغ أيضًا عن انحراف الوسيط المطلق (MAD) من أجل المتانة.
- تطبيق 68-95-99.7 على بيانات غير طبيعية. انظر أعلاه.
جرّب بنفسك
أدخِل أي مجموعة بيانات في حاسبة الانحراف المعياري المجانية — اختر المجتمع أو العينة، وشاهد الحساب خطوة بخطوة، وتحقّق منه مقابل هذا الدليل.
مواد ذات صلة: