What are the steps of a hypothesis test?

(1) State the null hypothesis H₀ and alternative H₁; (2) choose a significance level α (commonly 0.05); (3) collect data and compute the test statistic; (4) calculate the p-value; (5) reject H₀ if p < α, otherwise fail to reject.

What does a p-value mean?

The p-value is the probability of observing a result as extreme as (or more extreme than) the computed statistic, assuming H₀ is true. A small p-value (below α) provides evidence against H₀, but does not prove H₁ is true.

What is the difference between Type I and Type II errors?

A Type I error (false positive) is rejecting H₀ when it is true; its probability equals α. A Type II error (false negative) is failing to reject H₀ when it is false; its probability is β. Statistical power is 1 − β.

AI-Math - 假設檢定逐步詳解：從 H0 到 p 值

假設檢定是統計推論的主力工具，從臨床試驗到網站的 A/B 測試，處處都在用它。然而它也是統計學中最被誤解的主題。本指南把整條流程清晰地走一遍，讓你真正明白 p 值到底代表什麼。

五個步驟

陳述 $H_0$ 和 $H_1$ ：虛無假設（現狀）和對立假設（你想支持的論斷）。
選定顯著水準 $\alpha$ ：通常是 0.05 或 0.01。
從你的資料計算檢定統計量（ $z$ 、 $t$ 、 $\chi^2$ 等）。
求 p 值：在 $H_0$ 為真的前提下，看到這麼極端資料的機率。
作出判斷：若 $p < \alpha$ ，拒絕 $H_0$ ；否則無法拒絕。

注意：「無法拒絕」≠「接受 $H_0$ 」。你只是沒有足夠的證據反對它而已。

單樣本 z 檢定（解題範例）

某工廠聲稱其燈泡平均壽命 1000 小時（ $\sigma = 50$ ）。你檢定了 25 顆燈泡，測得 $\bar x = 980$ 。在 $\alpha = 0.05$ 下，這個聲稱被推翻了嗎？

$H_0: \mu = 1000$ ， $H_1: \mu \ne 1000$ 。
$\alpha = 0.05$ ，雙尾檢定。
檢定統計量： $z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} = \frac{980 - 1000}{50/\sqrt{25}} = \frac{-20}{10} = -2$ 。
p 值： $2 \cdot P(Z < -2) \approx 2 \cdot 0.0228 = 0.0456$ 。
由於 $0.0456 < 0.05$ ，拒絕 $H_0$ 。平均壽命與 1000 小時有顯著差異。

選對檢定方法

情形	檢定
一個平均數， $\sigma$ 已知	單樣本 z 檢定
一個平均數， $\sigma$ 未知，n 較小	單樣本 t 檢定
兩個平均數，獨立樣本	雙樣本 t 檢定
兩個成對平均數	成對 t 檢定
比例	比例的 z 檢定
適合度 / 列聯表	卡方

第一型錯誤 vs 第二型錯誤

第一型錯誤：拒絕一個為真的 $H_0$ 。機率 = $\alpha$ 。
第二型錯誤：沒有拒絕一個為假的 $H_0$ 。機率 = $\beta$ 。
檢定力 = $1 - \beta$ ：正確檢出真實效應的機率。

這三者會一起連動：在樣本數固定時，縮小 $\alpha$ 會抬高 $\beta$ ；增大樣本數則會同時降低兩者。

常見錯誤

「p 值 = $H_0$ 為真的機率」——錯誤。p 值是 $P(\text{資料} \mid H_0)$ ，而不是 $P(H_0 \mid \text{資料})$ 。
多重比較——在 $\alpha = 0.05$ 下做 20 次檢定，平均必然會出現約 1 個偽陽性。要使用校正。
把顯著性與重要性混為一談——一個伴隨巨大 $n$ 的微小效應可能在統計上高度顯著，但在實務上無關緊要。

用 AI 假設檢定求解器試試

用假設檢定求解器輸入你的資料，得到檢定統計量、p 值和判斷結論。

相關參考：

Z 分數計算器 — 每個 z 檢定的基石
標準差計算器 — 離散程度的輸入
常態分布計算器 — z 檢定所假定的前提

假設檢定逐步詳解：從 H0 到 p 值

一份實用的假設檢定指南——定義 H0 與 H1、選對檢定方法、計算檢定統計量，以及不被誤用地解讀 p 值。