P 值計算機
以 AI 驅動的逐步解題,計算並詮釋假設檢定的 p 值
拖放或 點擊 以新增圖片或 PDF
什麼是 P 值?
p 值是觀察到與實際結果一樣極端或更極端的檢定結果——在虛無假設 為真的假設下的機率。
形式上,對於觀測值為 的檢定統計量 :
- 右尾:
- 左尾:
- 雙尾:
詮釋:小的 p 值表示若 為真,觀測到的資料會令人意外,所以我們有不利於 的證據。大的 p 值表示資料與 一致——但並不證明 為真。
決策法則:將 與預先選定的顯著水準 (通常為 0.05)比較:
- → 拒絕 (「具統計顯著性」)
- → 未能拒絕 (證據不足)
p 值不是什麼:
- 它不是 為真的機率。
- 它不是對立假設 為真的機率。
- 它不是效果量的度量。
- 它不區分「實務顯著性」與「統計顯著性」。
如何計算與使用 P 值
逐步說明
- 陳述假設 與 。
- 選擇適合資料的檢定(z 檢定、t 檢定、卡方、F 檢定……)。
- 從資料計算檢定統計量。
- 根據 判斷尾數:右尾()、左尾()或雙尾()。
- 從該檢定的分配求出 p 值。
- 與 比較並下結論。
由 Z 統計量求 P 值
對於標準常態 :
- 右尾:
- 左尾:
- 雙尾:
快速參考: → 雙尾 。 → 雙尾 。
由 T 統計量求 P 值
使用自由度為 (或依檢定指定)的 t 分配。尾數邏輯與 z 相同,但對小自由度其分配尾部略重。
由卡方統計量求 P 值
卡方檢定本質上是右尾的,因為 且較大值表示與 的契合度較差:
單尾 vs 雙尾:該用哪個?
- 雙尾:當你關心相對 任一方向的偏離時。大多數學術情境的預設。
- 單尾:當對立假設具方向性且事先指定時(,而非 )。若方向相符,p 值減半。
切勿在看到資料後才選尾數——那是 p 值操弄(p-hacking)。
常見的顯著性門檻
| 常見標籤 | |
|---|---|
| 0.10 | 有暗示性 |
| 0.05 | 標準 |
| 0.01 | 強 |
| 0.001 | 非常強 |
美國統計學會曾警告,不應將 當作明確的分界線——情境與效果量比跨越門檻更重要。
應避免的常見錯誤
- 「p 值是 為真的機率」:錯誤。p 值是假設 為真而計算的;它並不衡量 有多可能。
- 把 與 視為根本不同:它們並不是。0.05 門檻是慣例,而非相變。
- 看到資料後才選尾數:若你看到 後改用左尾檢定,你的偽陽性率就翻倍了。要事先指定。
- 混淆顯著性與效果量:在巨大樣本下微小效果可能「高度顯著」卻在實務上無關緊要。務必在 p 值旁一併報告效果量。
- 多重比較膨脹:在 下做 20 次檢定,依機率預期會有一個偽陽性。使用 Bonferroni 或 FDR 校正。
- 「 證明 」:不。未能拒絕不等於接受。它只表示在此樣本數下資料沒有足夠不利於 的證據。
Examples
Frequently Asked Questions
它表示若虛無假設為真,觀測到的資料(或更極端的資料)在重複抽樣中出現的機率低於 5%。依慣例,這被視為「具統計顯著性」——但這不表示虛無假設必然為假,也不衡量效果的大小。
p 值是*假設* H₀ 為真而計算的——它以 H₀ 為條件。計算 P(H₀ 為真 | 資料) 需要貝氏方法搭配 H₀ 的先驗機率,而頻率學派的 p 值並不使用。
只有當研究問題確實具方向性且在看到資料前就已指定時——例如,新藥必須*優於*安慰劑才有用,表現較差等同於無效。事後才選尾數是 p 值操弄。
p 值操弄是進行多種分析(不同子集、轉換、排除),只報告顯著的那些,或在看到資料後切換檢定方向的做法。它會膨脹偽陽性率,是再現性危機的主要成因之一。
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving