statistics

Kiểm định giả thuyết

Kiểm định giả thuyết quyết định giữa hai khẳng định cạnh tranh về một tổng thể bằng cách dùng dữ liệu mẫu. Ta tính một thống kê kiểm định và bác bỏ giả thuyết không nếu giá trị p nhỏ.

Kiểm định giả thuyết là một khuôn khổ dùng dữ liệu mẫu để quyết định giữa hai khẳng định cạnh tranh về một tổng thể:

  • Giả thuyết không H0H_0: khẳng định mặc định / "không có gì đáng chú ý" (ví dụ đồng xu cân đối, thuốc không có tác dụng).
  • Giả thuyết đối HaH_a: điều mà ta nghi ngờ / muốn chứng minh.

Quy trình:

  1. Phát biểu H0H_0HaH_a.
  2. Chọn một mức ý nghĩa α\alpha (thường là 0,05) — xác suất bác bỏ sai (sai lầm loại I).
  3. Tính một thống kê kiểm định từ dữ liệu (điểm z, thống kê t, khi bình phương, tỉ số F).
  4. Tính giá trị p — xác suất, dưới H0H_0, quan sát được dữ liệu ít nhất cũng cực đoan như vậy.
  5. Quyết định: nếu p<αp < \alpha, bác bỏ H0H_0; ngược lại thì không bác bỏ.

Hai loại sai lầm:

  • Loại I: bác bỏ một H0H_0 đúng (xác suất α\alpha).
  • Loại II: không bác bỏ một H0H_0 sai (xác suất β\beta); 1β1 - \betalực kiểm định (power).

Nhầm lẫn thường gặp: "không bác bỏ" ≠ "chấp nhận H0H_0". Vắng bằng chứng không phải là bằng chứng về sự vắng mặt — cỡ mẫu nhỏ có thể che giấu các hiệu ứng thực sự.

Khuôn khổ này là nền tảng của các thử nghiệm lâm sàng, kiểm thử A/B, kiểm soát chất lượng, và phần lớn các khẳng định "ý nghĩa thống kê" được công bố.