Máy Tính Giá Trị P
Tính và diễn giải giá trị p cho kiểm định giả thuyết với lời giải từng bước hỗ trợ bởi AI
Kéo & thả hoặc nhấp để thêm hình ảnh hoặc PDF
Giá Trị P Là Gì?
Một giá trị p là xác suất quan sát được kết quả kiểm định cực đoan bằng, hoặc cực đoan hơn, kết quả thực tế — với giả định giả thuyết không là đúng.
Một cách hình thức, với một thống kê kiểm định có giá trị quan sát :
- Đuôi phải:
- Đuôi trái:
- Hai đuôi:
Diễn giải: một giá trị p nhỏ nghĩa là dữ liệu quan sát sẽ đáng ngạc nhiên nếu đúng, nên ta có bằng chứng chống lại . Một giá trị p lớn nghĩa là dữ liệu nhất quán với — nhưng không chứng minh đúng.
Quy tắc quyết định: so sánh với mức ý nghĩa chọn trước (thường 0.05):
- → bác bỏ ('có ý nghĩa thống kê')
- → không bác bỏ (không đủ bằng chứng)
Giá trị p KHÔNG phải là:
- Không phải xác suất đúng.
- Không phải xác suất giả thuyết đối đúng.
- Không phải một số đo cỡ tác động.
- Không phân biệt 'ý nghĩa thực tiễn' với 'ý nghĩa thống kê'.
Cách Tính và Dùng Giá Trị P
Từng Bước
- Phát biểu các giả thuyết và .
- Chọn một kiểm định phù hợp với dữ liệu (kiểm định z, kiểm định t, khi bình phương, kiểm định F, ...).
- Tính thống kê kiểm định từ dữ liệu.
- Xác định (các) đuôi dựa trên : đuôi phải (), đuôi trái (), hoặc hai đuôi ().
- Tìm giá trị p từ phân phối của kiểm định.
- So sánh với và kết luận.
Giá Trị P Từ Thống Kê Z
Với một phân phối chuẩn tắc :
- Đuôi phải:
- Đuôi trái:
- Hai đuôi:
Tham chiếu nhanh: → hai đuôi . → hai đuôi .
Giá Trị P Từ Thống Kê T
Dùng phân phối t với bậc tự do (hoặc theo kiểm định chỉ định). Cùng logic đuôi như z, nhưng phân phối có đuôi hơi dày hơn với df nhỏ.
Giá Trị P Từ Thống Kê Khi Bình Phương
Kiểm định khi bình phương vốn là đuôi phải vì và các giá trị lớn hơn cho thấy độ khớp với tệ hơn:
Một Đuôi So Với Hai Đuôi: Dùng Cái Nào?
- Hai đuôi: khi bạn quan tâm đến độ lệch khỏi theo cả hai hướng. Mặc định trong hầu hết các bối cảnh học thuật.
- Một đuôi: khi giả thuyết đối có hướng và được chỉ định trước (, không phải ). Làm giảm một nửa giá trị p nếu hướng khớp.
Đừng bao giờ chọn đuôi sau khi đã thấy dữ liệu — đó là p-hacking.
Các Ngưỡng Ý Nghĩa Thường Gặp
| Nhãn thường dùng | |
|---|---|
| 0.10 | gợi ý |
| 0.05 | tiêu chuẩn |
| 0.01 | mạnh |
| 0.001 | rất mạnh |
Hiệp hội Thống kê Hoa Kỳ đã cảnh báo chống lại việc xem như một ranh giới rạch ròi — bối cảnh và cỡ tác động quan trọng hơn việc vượt qua một ngưỡng.
Những Lỗi Thường Gặp Cần Tránh
- 'Giá trị p là xác suất đúng': SAI. Giá trị p được tính với giả định đúng; nó không đo có khả năng đúng đến mức nào.
- Xem và là khác nhau về bản chất: chúng không khác. Ngưỡng 0.05 là một quy ước, không phải một chuyển pha.
- Chọn đuôi sau khi thấy dữ liệu: nếu bạn thấy và chuyển sang kiểm định đuôi trái, bạn đã tăng gấp đôi tỉ lệ dương tính giả. Hãy chỉ định trước.
- Nhầm ý nghĩa thống kê với cỡ tác động: một tác động nhỏ với mẫu rất lớn có thể 'rất có ý nghĩa' nhưng thực tế không liên quan. Luôn báo cáo cỡ tác động bên cạnh giá trị p.
- Phồng do so sánh nhiều: chạy 20 kiểm định ở , một dương tính giả là kỳ vọng do ngẫu nhiên. Dùng hiệu chỉnh Bonferroni hoặc FDR.
- ' chứng minh ': KHÔNG. Không bác bỏ không giống chấp nhận. Nó chỉ nghĩa là dữ liệu không có đủ bằng chứng chống lại ở cỡ mẫu này.
Examples
Frequently Asked Questions
Nó nghĩa là dữ liệu quan sát (hoặc dữ liệu cực đoan hơn) sẽ xảy ra trong ít hơn 5% các mẫu lặp lại nếu giả thuyết không đúng. Theo quy ước, điều này được xem là 'có ý nghĩa thống kê' — nhưng nó không nghĩa là giả thuyết không nhất thiết sai, và nó không đo cỡ của tác động.
Giá trị p được tính *với giả định* H₀ đúng — nó có điều kiện trên H₀. Tính P(H₀ đúng | dữ liệu) cần các phương pháp Bayes với một xác suất tiên nghiệm cho H₀, điều mà giá trị p theo trường phái tần suất không dùng.
Chỉ khi câu hỏi nghiên cứu thực sự có hướng và được chỉ định trước khi thấy dữ liệu — ví dụ, một loại thuốc mới phải hoạt động *tốt hơn* giả dược mới hữu ích, với hiệu quả tệ hơn tương đương không có tác dụng. Chọn đuôi sau khi quan sát là p-hacking.
P-hacking là thực hành chạy nhiều phân tích (các tập con, biến đổi, loại trừ khác nhau) và chỉ báo cáo những cái có ý nghĩa, hoặc chuyển hướng kiểm định sau khi thấy dữ liệu. Nó làm phồng tỉ lệ dương tính giả và là một tác nhân chính gây ra khủng hoảng tái lặp.
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving