Máy Tính Giá Trị P

Tính và diễn giải giá trị p cho kiểm định giả thuyết với lời giải từng bước hỗ trợ bởi AI

Kéo & thả hoặc nhấp để thêm hình ảnh hoặc PDF

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

Giá Trị P Là Gì?

Một giá trị p là xác suất quan sát được kết quả kiểm định cực đoan bằng, hoặc cực đoan hơn, kết quả thực tế — với giả định giả thuyết không H0H_0 là đúng.

Một cách hình thức, với một thống kê kiểm định TT có giá trị quan sát tt:

  • Đuôi phải: p=P(TtH0)p = P(T \geq t \mid H_0)
  • Đuôi trái: p=P(TtH0)p = P(T \leq t \mid H_0)
  • Hai đuôi: p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

Diễn giải: một giá trị p nhỏ nghĩa là dữ liệu quan sát sẽ đáng ngạc nhiên nếu H0H_0 đúng, nên ta có bằng chứng chống lại H0H_0. Một giá trị p lớn nghĩa là dữ liệu nhất quán với H0H_0 — nhưng không chứng minh H0H_0 đúng.

Quy tắc quyết định: so sánh pp với mức ý nghĩa α\alpha chọn trước (thường 0.05):

  • p<αp < \alpha → bác bỏ H0H_0 ('có ý nghĩa thống kê')
  • pαp \geq \alpha → không bác bỏ H0H_0 (không đủ bằng chứng)

Giá trị p KHÔNG phải là:

  • Không phải xác suất H0H_0 đúng.
  • Không phải xác suất giả thuyết đối H1H_1 đúng.
  • Không phải một số đo cỡ tác động.
  • Không phân biệt 'ý nghĩa thực tiễn' với 'ý nghĩa thống kê'.

Cách Tính và Dùng Giá Trị P

Từng Bước

  1. Phát biểu các giả thuyết H0H_0H1H_1.
  2. Chọn một kiểm định phù hợp với dữ liệu (kiểm định z, kiểm định t, khi bình phương, kiểm định F, ...).
  3. Tính thống kê kiểm định từ dữ liệu.
  4. Xác định (các) đuôi dựa trên H1H_1: đuôi phải (>>), đuôi trái (<<), hoặc hai đuôi (\neq).
  5. Tìm giá trị p từ phân phối của kiểm định.
  6. So sánh với α\alpha và kết luận.

Giá Trị P Từ Thống Kê Z

Với một phân phối chuẩn tắc ZZ:

  • Đuôi phải: p=1Φ(z)p = 1 - \Phi(z)
  • Đuôi trái: p=Φ(z)p = \Phi(z)
  • Hai đuôi: p=2(1Φ(z))p = 2(1 - \Phi(|z|))

Tham chiếu nhanh: z=1.96z = 1.96 → hai đuôi p0.05p \approx 0.05. z=2.576z = 2.576 → hai đuôi p0.01p \approx 0.01.

Giá Trị P Từ Thống Kê T

Dùng phân phối t với n1n - 1 bậc tự do (hoặc theo kiểm định chỉ định). Cùng logic đuôi như z, nhưng phân phối có đuôi hơi dày hơn với df nhỏ.

Giá Trị P Từ Thống Kê Khi Bình Phương

Kiểm định khi bình phương vốn là đuôi phảiχ20\chi^2 \geq 0 và các giá trị lớn hơn cho thấy độ khớp với H0H_0 tệ hơn:

p=P(χdf2quan saˊt)p = P(\chi^2_{df} \geq \text{quan sát})

Một Đuôi So Với Hai Đuôi: Dùng Cái Nào?

  • Hai đuôi: khi bạn quan tâm đến độ lệch khỏi H0H_0 theo cả hai hướng. Mặc định trong hầu hết các bối cảnh học thuật.
  • Một đuôi: khi giả thuyết đối có hướng và được chỉ định trước (H1:μ>0H_1: \mu > 0, không phải μ0\mu \neq 0). Làm giảm một nửa giá trị p nếu hướng khớp.

Đừng bao giờ chọn đuôi sau khi đã thấy dữ liệu — đó là p-hacking.

Các Ngưỡng Ý Nghĩa Thường Gặp

α\alphaNhãn thường dùng
0.10gợi ý
0.05tiêu chuẩn
0.01mạnh
0.001rất mạnh

Hiệp hội Thống kê Hoa Kỳ đã cảnh báo chống lại việc xem α=0.05\alpha = 0.05 như một ranh giới rạch ròi — bối cảnh và cỡ tác động quan trọng hơn việc vượt qua một ngưỡng.

Những Lỗi Thường Gặp Cần Tránh

  • 'Giá trị p là xác suất H0H_0 đúng': SAI. Giá trị p được tính với giả định H0H_0 đúng; nó không đo H0H_0 có khả năng đúng đến mức nào.
  • Xem p=0.049p = 0.049p=0.051p = 0.051 là khác nhau về bản chất: chúng không khác. Ngưỡng 0.05 là một quy ước, không phải một chuyển pha.
  • Chọn đuôi sau khi thấy dữ liệu: nếu bạn thấy z=2z = -2 và chuyển sang kiểm định đuôi trái, bạn đã tăng gấp đôi tỉ lệ dương tính giả. Hãy chỉ định trước.
  • Nhầm ý nghĩa thống kê với cỡ tác động: một tác động nhỏ với mẫu rất lớn có thể 'rất có ý nghĩa' nhưng thực tế không liên quan. Luôn báo cáo cỡ tác động bên cạnh giá trị p.
  • Phồng do so sánh nhiều: chạy 20 kiểm định ở α=0.05\alpha = 0.05, một dương tính giả là kỳ vọng do ngẫu nhiên. Dùng hiệu chỉnh Bonferroni hoặc FDR.
  • 'p>0.05p > 0.05 chứng minh H0H_0': KHÔNG. Không bác bỏ không giống chấp nhận. Nó chỉ nghĩa là dữ liệu không có đủ bằng chứng chống lại H0H_0 ở cỡ mẫu này.

Examples

Step 1: Tra cứu Φ(2.1)0.9821\Phi(2.1) \approx 0.9821
Step 2: Xác suất đuôi phải: 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: Giá trị p hai đuôi: 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (có ý nghĩa ở α=0.05\alpha = 0.05)

Step 1: Dùng phân phối t với df=19df = 19
Step 2: Từ bảng t: P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: So với các ngưỡng thường gặp: có ý nghĩa ở α=0.05\alpha = 0.05, không ở α=0.01\alpha = 0.01
Answer: p0.044p \approx 0.044 (có ý nghĩa ở α=0.05\alpha = 0.05)

Step 1: Khi bình phương là đuôi phải
Step 2: P(χ327.5)P(\chi^2_3 \geq 7.5) từ bảng khi bình phương
Step 3: Các giá trị tới hạn cho df = 3: χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 nằm giữa, nên 0.05<p<0.100.05 < p < 0.10
Step 5: Chính xác hơn, p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (không có ý nghĩa ở α=0.05\alpha = 0.05, gợi ý ở α=0.10\alpha = 0.10)

Frequently Asked Questions

Nó nghĩa là dữ liệu quan sát (hoặc dữ liệu cực đoan hơn) sẽ xảy ra trong ít hơn 5% các mẫu lặp lại nếu giả thuyết không đúng. Theo quy ước, điều này được xem là 'có ý nghĩa thống kê' — nhưng nó không nghĩa là giả thuyết không nhất thiết sai, và nó không đo cỡ của tác động.

Giá trị p được tính *với giả định* H₀ đúng — nó có điều kiện trên H₀. Tính P(H₀ đúng | dữ liệu) cần các phương pháp Bayes với một xác suất tiên nghiệm cho H₀, điều mà giá trị p theo trường phái tần suất không dùng.

Chỉ khi câu hỏi nghiên cứu thực sự có hướng và được chỉ định trước khi thấy dữ liệu — ví dụ, một loại thuốc mới phải hoạt động *tốt hơn* giả dược mới hữu ích, với hiệu quả tệ hơn tương đương không có tác dụng. Chọn đuôi sau khi quan sát là p-hacking.

P-hacking là thực hành chạy nhiều phân tích (các tập con, biến đổi, loại trừ khác nhau) và chỉ báo cáo những cái có ý nghĩa, hoặc chuyển hướng kiểm định sau khi thấy dữ liệu. Nó làm phồng tỉ lệ dương tính giả và là một tác nhân chính gây ra khủng hoảng tái lặp.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving