假設檢定是統計推論的主力工具,從臨床試驗到網站的 A/B 測試,處處都在用它。然而它也是統計學中最被誤解的主題。本指南把整條流程清晰地走一遍,讓你真正明白 p 值到底代表什麼。
五個步驟
- 陳述 和 :虛無假設(現狀)和對立假設(你想支持的論斷)。
- 選定顯著水準 :通常是 0.05 或 0.01。
- 從你的資料計算檢定統計量(、、 等)。
- 求 p 值:在 為真的前提下,看到這麼極端資料的機率。
- 作出判斷:若 ,拒絕 ;否則無法拒絕。
注意:「無法拒絕」≠「接受 」。你只是沒有足夠的證據反對它而已。
單樣本 z 檢定(解題範例)
某工廠聲稱其燈泡平均壽命 1000 小時()。你檢定了 25 顆燈泡,測得 。在 下,這個聲稱被推翻了嗎?
- ,。
- ,雙尾檢定。
- 檢定統計量:。
- p 值:。
- 由於 ,拒絕 。平均壽命與 1000 小時有顯著差異。
選對檢定方法
| 情形 | 檢定 |
|---|---|
| 一個平均數, 已知 | 單樣本 z 檢定 |
| 一個平均數, 未知,n 較小 | 單樣本 t 檢定 |
| 兩個平均數,獨立樣本 | 雙樣本 t 檢定 |
| 兩個成對平均數 | 成對 t 檢定 |
| 比例 | 比例的 z 檢定 |
| 適合度 / 列聯表 | 卡方 |
第一型錯誤 vs 第二型錯誤
- 第一型錯誤:拒絕一個為真的 。機率 = 。
- 第二型錯誤:沒有拒絕一個為假的 。機率 = 。
- 檢定力 = :正確檢出真實效應的機率。
這三者會一起連動:在樣本數固定時,縮小 會抬高 ;增大樣本數則會同時降低兩者。
常見錯誤
- 「p 值 = 為真的機率」——錯誤。p 值是 ,而不是 。
- 多重比較——在 下做 20 次檢定,平均必然會出現約 1 個偽陽性。要使用校正。
- 把顯著性與重要性混為一談——一個伴隨巨大 的微小效應可能在統計上高度顯著,但在實務上無關緊要。
用 AI 假設檢定求解器試試
用假設檢定求解器輸入你的資料,得到檢定統計量、p 值和判斷結論。
相關參考: