statistics

Kiểm định giả thuyết từng bước: từ H0 đến giá trị p

Một hướng dẫn thực hành về kiểm định giả thuyết — xác định H0 và H1, chọn đúng phép kiểm định, tính thống kê kiểm định, và diễn giải giá trị p mà không lạm dụng.
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-01

Kiểm định giả thuyết là cỗ máy chủ lực của suy luận thống kê, được dùng ở khắp nơi từ thử nghiệm lâm sàng đến kiểm định A/B trên website. Tuy nhiên đây cũng là chủ đề bị hiểu sai nhiều nhất trong thống kê. Hướng dẫn này đi qua toàn bộ quy trình một lần — một cách rõ ràng — để bạn hiểu giá trị p thực sự nghĩa là gì.

Năm bước

  1. Phát biểu H0H_0H1H_1: giả thuyết không (hiện trạng) và đối thuyết (điều bạn muốn ủng hộ).
  2. Chọn mức ý nghĩa α\alpha: thường là 0.05 hoặc 0.01.
  3. Tính thống kê kiểm định từ dữ liệu của bạn (zz, tt, χ2\chi^2, v.v.).
  4. Tìm giá trị p: xác suất quan sát được dữ liệu cực đoan đến mức này nếu H0H_0 đúng.
  5. Quyết định: nếu p<αp < \alpha, bác bỏ H0H_0; ngược lại không bác bỏ được.

Lưu ý: "không bác bỏ được" ≠ "chấp nhận H0H_0". Bạn chỉ đơn giản là không có đủ bằng chứng chống lại nó.

Kiểm định z một mẫu (ví dụ có lời giải)

Một nhà máy tuyên bố bóng đèn của họ có tuổi thọ trung bình 1000 giờ (σ=50\sigma = 50). Bạn kiểm tra 25 bóng và đo được xˉ=980\bar x = 980. Tuyên bố này có bị bác bỏ ở mức α=0.05\alpha = 0.05 không?

  1. H0:μ=1000H_0: \mu = 1000, H1:μ1000H_1: \mu \ne 1000.
  2. α=0.05\alpha = 0.05, hai phía.
  3. Thống kê kiểm định: z=xˉμ0σ/n=980100050/25=2010=2z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} = \frac{980 - 1000}{50/\sqrt{25}} = \frac{-20}{10} = -2.
  4. Giá trị p: 2P(Z<2)20.0228=0.04562 \cdot P(Z < -2) \approx 2 \cdot 0.0228 = 0.0456.
  5. 0.0456<0.050.0456 < 0.05, bác bỏ H0H_0. Tuổi thọ trung bình khác biệt đáng kể so với 1000 giờ.

Chọn đúng phép kiểm định

Tình huốngPhép kiểm định
Một trung bình, biết σ\sigmakiểm định z một mẫu
Một trung bình, không biết σ\sigma, n nhỏkiểm định t một mẫu
Hai trung bình, mẫu độc lậpkiểm định t hai mẫu
Hai trung bình ghép cặpkiểm định t ghép cặp
Tỷ lệkiểm định z cho tỷ lệ
Mức độ phù hợp / bảng tương liênkhi bình phương

Sai lầm loại I và sai lầm loại II

  • Loại I: bác bỏ một H0H_0 đúng. Xác suất = α\alpha.
  • Loại II: không bác bỏ được một H0H_0 sai. Xác suất = β\beta.
  • Lực kiểm định = 1β1 - \beta: xác suất phát hiện đúng một hiệu ứng có thật.

Ba đại lượng này dịch chuyển cùng nhau: thu nhỏ α\alpha làm tăng β\beta với cỡ mẫu cố định; tăng cỡ mẫu làm giảm cả hai.

Những lỗi thường gặp

  • "giá trị p = xác suất H0H_0 đúng" — sai. Giá trị p là P(dữ liệuH0)P(\text{dữ liệu} \mid H_0), không phải P(H0dữ liệu)P(H_0 \mid \text{dữ liệu}).
  • So sánh bội — chạy 20 phép kiểm định ở mức α=0.05\alpha = 0.05 bảo đảm trung bình ≈1 dương tính giả. Hãy dùng một hiệu chỉnh.
  • Lẫn lộn ý nghĩa thống kê với tầm quan trọng — một hiệu ứng nhỏ xíu với nn khổng lồ có thể rất có ý nghĩa thống kê nhưng thực tế lại không liên quan.

Thử với AI Hypothesis Test Solver

Dùng Solver Kiểm định Giả thuyết để nhập dữ liệu của bạn và nhận thống kê kiểm định, giá trị p và quyết định.

Tài liệu tham khảo liên quan:

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-01

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.