اختبار الفرضيات هو حصان العمل في الاستدلال الإحصائي، ويُستخدم في كل مكان من التجارب السريرية إلى اختبارات A/B على المواقع الإلكترونية. ومع ذلك فهو أيضًا أكثر المواضيع سوء فهم في الإحصاء. يمرّ هذا الدليل بكامل المسار مرة واحدة — بوضوح — حتى تفهم ما الذي تعنيه قيمة p حقًا.
الخطوات الخمس
- حدِّد و: فرضية العدم (الوضع الراهن) والفرضية البديلة (الادعاء الذي تريد دعمه).
- اختر مستوى دلالة : عادةً 0.05 أو 0.01.
- احسب إحصاءة الاختبار من بياناتك (، ، ، إلخ).
- أوجد قيمة p: احتمال رؤية بيانات بهذا التطرّف إذا كانت صحيحة.
- قرِّر: إذا كان ، فارفض ؛ وإلا فإنك تفشل في رفضها.
ملاحظة: "الفشل في الرفض" ≠ "قبول ". أنت ببساطة لا تملك أدلة كافية ضدها.
اختبار z لعينة واحدة (مثال محلول)
يدّعي مصنع أن مصابيحه تدوم 1000 ساعة في المتوسط (). تختبر 25 مصباحًا وتقيس . هل يُدحَض الادعاء عند ؟
- ، .
- ، ذو طرفين.
- إحصاءة الاختبار: .
- قيمة p: .
- بما أن ، ارفض . متوسط العمر يختلف اختلافًا دالًّا عن 1000 ساعة.
اختيار الاختبار الصحيح
| الحالة | الاختبار |
|---|---|
| متوسط واحد، معلوم | اختبار z لعينة واحدة |
| متوسط واحد، مجهول، n صغير | اختبار t لعينة واحدة |
| متوسطان، عينتان مستقلتان | اختبار t لعينتين |
| متوسطان مزدوجان | اختبار t مزدوج |
| نسبة (أو نسب) | اختبار z للنسبة |
| جودة المطابقة / الاقتران | كاي تربيع |
خطأ النوع الأول مقابل النوع الثاني
- النوع الأول: رفض صحيحة. الاحتمال = .
- النوع الثاني: الفشل في رفض خاطئة. الاحتمال = .
- القوة = : احتمال الكشف الصحيح عن أثر حقيقي.
تتحرك هذه الثلاثة معًا: تقليص يرفع عند حجم عينة ثابت؛ وزيادة حجم العينة يخفض كليهما.
أخطاء شائعة
- "قيمة p = احتمال أن تكون صحيحة" — خطأ. قيمة p هي ، وليست .
- المقارنات المتعددة — إجراء 20 اختبارًا عند يضمن في المتوسط ≈1 نتيجة موجبة كاذبة. استخدم تصحيحًا.
- الخلط بين الدلالة والأهمية — أثر ضئيل مع ضخم قد يكون دالًّا للغاية لكنه غير ذي صلة عمليًا.
جرّب باستخدام حلّال اختبار الفرضيات بالذكاء الاصطناعي
استخدم حلّال اختبار الفرضيات لإدخال بياناتك والحصول على إحصاءة الاختبار وقيمة p والقرار.
مراجع ذات صلة:
- حاسبة درجة z — اللبنة الأساسية لكل اختبار z
- حاسبة الانحراف المعياري — مُدخَل التشتت
- حاسبة التوزيع الطبيعي — ما تفترضه اختبارات z