การทดสอบสมมติฐาน เป็นกรอบสำหรับใช้ข้อมูลตัวอย่างเพื่อตัดสินระหว่างข้อกล่าวอ้างที่แข่งขันกันสองข้อเกี่ยวกับประชากร:

สมมติฐานว่าง $H_0$ : ข้อกล่าวอ้างตั้งต้น / "ไม่มีอะไรน่าสนใจ" (เช่น เหรียญเที่ยงตรง ยาไม่มีผล)
สมมติฐานทางเลือก $H_a$ : สิ่งที่เราสงสัย / ต้องการแสดงให้เห็น

ขั้นตอน:

ระบุ $H_0$ และ $H_a$
เลือก ระดับนัยสำคัญ $\alpha$ (ทั่วไปคือ 0.05) — ความน่าจะเป็นของการปฏิเสธผิดพลาด (ความคลาดเคลื่อนแบบที่ 1)
คำนวณ สถิติทดสอบ จากข้อมูล (คะแนน z, สถิติ t, ไค-สแควร์, อัตราส่วน F)
คำนวณ ค่า p — ความน่าจะเป็นภายใต้ $H_0$ ที่จะพบข้อมูลที่สุดขั้วอย่างน้อยเท่าที่สังเกตได้
ตัดสิน: ถ้า $p < \alpha$ ให้ ปฏิเสธ $H_0$ ; มิฉะนั้นปฏิเสธไม่ได้

ความคลาดเคลื่อนสองชนิด:

แบบที่ 1: ปฏิเสธ $H_0$ ที่เป็นจริง (ความน่าจะเป็น $\alpha$ )
แบบที่ 2: ปฏิเสธ $H_0$ ที่เป็นเท็จไม่ได้ (ความน่าจะเป็น $\beta$ ); $1 - \beta$ คือ กำลังการทดสอบ (power)

ความสับสนที่พบบ่อย: "ปฏิเสธไม่ได้" ≠ "ยอมรับ $H_0$ " การไม่มีหลักฐานไม่ใช่หลักฐานของการไม่มีอยู่ — ขนาดตัวอย่างเล็กอาจซ่อนผลที่เป็นจริงไว้

กรอบนี้เป็นรากฐานของการทดลองทางคลินิก การทดสอบ A/B การควบคุมคุณภาพ และข้อกล่าวอ้างเรื่อง "นัยสำคัญทางสถิติ" ที่ตีพิมพ์เป็นส่วนใหญ่