Kiểm định giả thuyết là cỗ máy chủ lực của suy luận thống kê, được dùng ở khắp nơi từ thử nghiệm lâm sàng đến kiểm định A/B trên website. Tuy nhiên đây cũng là chủ đề bị hiểu sai nhiều nhất trong thống kê. Hướng dẫn này đi qua toàn bộ quy trình một lần — một cách rõ ràng — để bạn hiểu giá trị p thực sự nghĩa là gì.
Năm bước
- Phát biểu và : giả thuyết không (hiện trạng) và đối thuyết (điều bạn muốn ủng hộ).
- Chọn mức ý nghĩa : thường là 0.05 hoặc 0.01.
- Tính thống kê kiểm định từ dữ liệu của bạn (, , , v.v.).
- Tìm giá trị p: xác suất quan sát được dữ liệu cực đoan đến mức này nếu đúng.
- Quyết định: nếu , bác bỏ ; ngược lại không bác bỏ được.
Lưu ý: "không bác bỏ được" ≠ "chấp nhận ". Bạn chỉ đơn giản là không có đủ bằng chứng chống lại nó.
Kiểm định z một mẫu (ví dụ có lời giải)
Một nhà máy tuyên bố bóng đèn của họ có tuổi thọ trung bình 1000 giờ (). Bạn kiểm tra 25 bóng và đo được . Tuyên bố này có bị bác bỏ ở mức không?
- , .
- , hai phía.
- Thống kê kiểm định: .
- Giá trị p: .
- Vì , bác bỏ . Tuổi thọ trung bình khác biệt đáng kể so với 1000 giờ.
Chọn đúng phép kiểm định
| Tình huống | Phép kiểm định |
|---|---|
| Một trung bình, biết | kiểm định z một mẫu |
| Một trung bình, không biết , n nhỏ | kiểm định t một mẫu |
| Hai trung bình, mẫu độc lập | kiểm định t hai mẫu |
| Hai trung bình ghép cặp | kiểm định t ghép cặp |
| Tỷ lệ | kiểm định z cho tỷ lệ |
| Mức độ phù hợp / bảng tương liên | khi bình phương |
Sai lầm loại I và sai lầm loại II
- Loại I: bác bỏ một đúng. Xác suất = .
- Loại II: không bác bỏ được một sai. Xác suất = .
- Lực kiểm định = : xác suất phát hiện đúng một hiệu ứng có thật.
Ba đại lượng này dịch chuyển cùng nhau: thu nhỏ làm tăng với cỡ mẫu cố định; tăng cỡ mẫu làm giảm cả hai.
Những lỗi thường gặp
- "giá trị p = xác suất đúng" — sai. Giá trị p là , không phải .
- So sánh bội — chạy 20 phép kiểm định ở mức bảo đảm trung bình ≈1 dương tính giả. Hãy dùng một hiệu chỉnh.
- Lẫn lộn ý nghĩa thống kê với tầm quan trọng — một hiệu ứng nhỏ xíu với khổng lồ có thể rất có ý nghĩa thống kê nhưng thực tế lại không liên quan.
Thử với AI Hypothesis Test Solver
Dùng Solver Kiểm định Giả thuyết để nhập dữ liệu của bạn và nhận thống kê kiểm định, giá trị p và quyết định.
Tài liệu tham khảo liên quan:
- Máy tính Điểm-Z — viên gạch nền tảng của mọi kiểm định z
- Máy tính Độ lệch chuẩn — đầu vào về độ biến thiên
- Máy tính Phân phối Chuẩn — điều mà kiểm định z giả định