P 值計算機

以 AI 驅動的逐步解題,計算並詮釋假設檢定的 p 值

拖放或 點擊 以新增圖片或 PDF

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

什麼是 P 值?

p 值是觀察到與實際結果一樣極端或更極端的檢定結果——在虛無假設 H0H_0 為真的假設下的機率。

形式上,對於觀測值為 tt 的檢定統計量 TT

  • 右尾p=P(TtH0)p = P(T \geq t \mid H_0)
  • 左尾p=P(TtH0)p = P(T \leq t \mid H_0)
  • 雙尾p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

詮釋:小的 p 值表示若 H0H_0 為真,觀測到的資料會令人意外,所以我們有不利於 H0H_0 的證據。大的 p 值表示資料與 H0H_0 一致——但並不證明 H0H_0 為真。

決策法則:將 pp 與預先選定的顯著水準 α\alpha(通常為 0.05)比較:

  • p<αp < \alpha → 拒絕 H0H_0(「具統計顯著性」)
  • pαp \geq \alpha → 未能拒絕 H0H_0(證據不足)

p 值不是什麼

  • 不是 H0H_0 為真的機率。
  • 不是對立假設 H1H_1 為真的機率。
  • 不是效果量的度量。
  • 區分「實務顯著性」與「統計顯著性」。

如何計算與使用 P 值

逐步說明

  1. 陳述假設 H0H_0H1H_1
  2. 選擇適合資料的檢定(z 檢定、t 檢定、卡方、F 檢定……)。
  3. 從資料計算檢定統計量
  4. 根據 H1H_1 判斷尾數:右尾(>>)、左尾(<<)或雙尾(\neq)。
  5. 從該檢定的分配求出 p 值
  6. α\alpha 比較並下結論。

由 Z 統計量求 P 值

對於標準常態 ZZ

  • 右尾:p=1Φ(z)p = 1 - \Phi(z)
  • 左尾:p=Φ(z)p = \Phi(z)
  • 雙尾:p=2(1Φ(z))p = 2(1 - \Phi(|z|))

快速參考:z=1.96z = 1.96 → 雙尾 p0.05p \approx 0.05z=2.576z = 2.576 → 雙尾 p0.01p \approx 0.01

由 T 統計量求 P 值

使用自由度為 n1n - 1(或依檢定指定)的 t 分配。尾數邏輯與 z 相同,但對小自由度其分配尾部略重。

由卡方統計量求 P 值

卡方檢定本質上是右尾的,因為 χ20\chi^2 \geq 0 且較大值表示與 H0H_0 的契合度較差:

p=P(χdf2observed)p = P(\chi^2_{df} \geq \text{observed})

單尾 vs 雙尾:該用哪個?

  • 雙尾:當你關心相對 H0H_0 任一方向的偏離時。大多數學術情境的預設。
  • 單尾:當對立假設具方向性且事先指定時(H1:μ>0H_1: \mu > 0,而非 μ0\mu \neq 0)。若方向相符,p 值減半。

切勿在看到資料後才選尾數——那是 p 值操弄(p-hacking)。

常見的顯著性門檻

α\alpha常見標籤
0.10有暗示性
0.05標準
0.01
0.001非常強

美國統計學會曾警告,不應將 α=0.05\alpha = 0.05 當作明確的分界線——情境與效果量比跨越門檻更重要。

應避免的常見錯誤

  • 「p 值是 H0H_0 為真的機率」:錯誤。p 值是假設 H0H_0 為真而計算的;它並不衡量 H0H_0 有多可能。
  • p=0.049p = 0.049p=0.051p = 0.051 視為根本不同:它們並不是。0.05 門檻是慣例,而非相變。
  • 看到資料後才選尾數:若你看到 z=2z = -2 後改用左尾檢定,你的偽陽性率就翻倍了。要事先指定。
  • 混淆顯著性與效果量:在巨大樣本下微小效果可能「高度顯著」卻在實務上無關緊要。務必在 p 值旁一併報告效果量。
  • 多重比較膨脹:在 α=0.05\alpha = 0.05 下做 20 次檢定,依機率預期會有一個偽陽性。使用 Bonferroni 或 FDR 校正。
  • p>0.05p > 0.05 證明 H0H_0:不。未能拒絕不等於接受。它只表示在此樣本數下資料沒有足夠不利於 H0H_0 的證據。

Examples

Step 1:Φ(2.1)0.9821\Phi(2.1) \approx 0.9821
Step 2: 右尾機率:10.9821=0.01791 - 0.9821 = 0.0179
Step 3: 雙尾 p 值:2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358(在 α=0.05\alpha = 0.05 下顯著)

Step 1: 使用自由度 df=19df = 19 的 t 分配
Step 2: 由 t 表:P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: 與常見門檻比較:在 α=0.05\alpha = 0.05 下顯著,在 α=0.01\alpha = 0.01 下不顯著
Answer: p0.044p \approx 0.044(在 α=0.05\alpha = 0.05 下顯著)

Step 1: 卡方為右尾
Step 2: 由卡方表求 P(χ327.5)P(\chi^2_3 \geq 7.5)
Step 3: df = 3 的臨界值:χ0.102=6.25\chi^2_{0.10} = 6.25χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 介於兩者之間,所以 0.05<p<0.100.05 < p < 0.10
Step 5: 更精確地,p0.058p \approx 0.058
Answer: p0.058p \approx 0.058(在 α=0.05\alpha = 0.05 下不顯著,在 α=0.10\alpha = 0.10 下有暗示性)

Frequently Asked Questions

它表示若虛無假設為真,觀測到的資料(或更極端的資料)在重複抽樣中出現的機率低於 5%。依慣例,這被視為「具統計顯著性」——但這不表示虛無假設必然為假,也不衡量效果的大小。

p 值是*假設* H₀ 為真而計算的——它以 H₀ 為條件。計算 P(H₀ 為真 | 資料) 需要貝氏方法搭配 H₀ 的先驗機率,而頻率學派的 p 值並不使用。

只有當研究問題確實具方向性且在看到資料前就已指定時——例如,新藥必須*優於*安慰劑才有用,表現較差等同於無效。事後才選尾數是 p 值操弄。

p 值操弄是進行多種分析(不同子集、轉換、排除),只報告顯著的那些,或在看到資料後切換檢定方向的做法。它會膨脹偽陽性率,是再現性危機的主要成因之一。

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving