假設檢定是一套利用樣本資料,在關於母體的兩個相互競爭的主張之間做出判定的架構:
- 虛無假設 :預設的/「沒有什麼有趣之處」的主張(例如硬幣是公正的、藥物沒有效果)。
- 對立假設 :我們所懷疑/想要證明的事。
步驟:
- 陳述 與 。
- 選擇一個顯著水準 (常用 0.05)——錯誤拒絕的機率(型一誤差)。
- 由資料計算一個檢定統計量(z 分數、t 統計量、卡方、F 比值)。
- 計算 p 值——在 之下,觀察到至少同樣極端之資料的機率。
- 判定:若 則拒絕 ;否則無法拒絕。
兩種誤差類型:
- 型一誤差:拒絕了為真的 (機率為 )。
- 型二誤差:未能拒絕為假的 (機率為 ); 稱為檢定力。
常見的混淆:「無法拒絕」≠「接受 」。沒有證據並不等於不存在的證據——樣本數過小可能掩蓋真實的效應。
這套架構是臨床試驗、A/B 測試、品質管制,以及大多數已發表之「統計顯著性」主張的基礎。