statistics

假设检验

假设检验利用样本数据在关于总体的两个相互竞争的主张之间做出判定。我们计算一个检验统计量,若 p 值很小则拒绝原假设。

假设检验是一套利用样本数据,在关于总体的两个相互竞争的主张之间做出判定的框架:

  • 原假设 H0H_0:默认的/「没有什么有趣之处」的主张(例如硬币是公正的、药物没有效果)。
  • 备择假设 HaH_a:我们所怀疑/想要证明的事。

步骤:

  1. 陈述 H0H_0HaH_a
  2. 选择一个显著性水平 α\alpha(常用 0.05)——错误拒绝的概率(第一类错误)。
  3. 由数据计算一个检验统计量(z 分数、t 统计量、卡方、F 比值)。
  4. 计算 p 值——在 H0H_0 之下,观察到至少同样极端之数据的概率。
  5. 判定:若 p<αp < \alpha拒绝 H0H_0;否则无法拒绝。

两种错误类型:

  • 第一类错误:拒绝了为真的 H0H_0(概率为 α\alpha)。
  • 第二类错误:未能拒绝为假的 H0H_0(概率为 β\beta);1β1 - \beta 称为检验功效

常见的混淆:「无法拒绝」≠「接受 H0H_0」。没有证据并不等于不存在的证据——样本量过小可能掩盖真实的效应。

这套框架是临床试验、A/B 测试、质量管控,以及大多数已发表之「统计显著性」主张的基础。