statistics

假設檢定

假設檢定利用樣本資料在關於母體的兩個相互競爭的主張之間做出判定。我們計算一個檢定統計量,若 p 值很小則拒絕虛無假設。

假設檢定是一套利用樣本資料,在關於母體的兩個相互競爭的主張之間做出判定的架構:

  • 虛無假設 H0H_0:預設的/「沒有什麼有趣之處」的主張(例如硬幣是公正的、藥物沒有效果)。
  • 對立假設 HaH_a:我們所懷疑/想要證明的事。

步驟:

  1. 陳述 H0H_0HaH_a
  2. 選擇一個顯著水準 α\alpha(常用 0.05)——錯誤拒絕的機率(型一誤差)。
  3. 由資料計算一個檢定統計量(z 分數、t 統計量、卡方、F 比值)。
  4. 計算 p 值——在 H0H_0 之下,觀察到至少同樣極端之資料的機率。
  5. 判定:若 p<αp < \alpha拒絕 H0H_0;否則無法拒絕。

兩種誤差類型:

  • 型一誤差:拒絕了為真的 H0H_0(機率為 α\alpha)。
  • 型二誤差:未能拒絕為假的 H0H_0(機率為 β\beta);1β1 - \beta 稱為檢定力

常見的混淆:「無法拒絕」≠「接受 H0H_0」。沒有證據並不等於不存在的證據——樣本數過小可能掩蓋真實的效應。

這套架構是臨床試驗、A/B 測試、品質管制,以及大多數已發表之「統計顯著性」主張的基礎。