statistics

假设检验分步详解:从 H0 到 p 值

一份实用的假设检验指南——定义 H0 与 H1、选对检验方法、计算检验统计量,以及不被误用地解读 p 值。
AI-Math Editorial Team

作者: AI-Math Editorial Team

发布于 2026-05-01

假设检验是统计推断的主力工具,从临床试验到网站的 A/B 测试,处处都在用它。然而它也是统计学中最被误解的话题。本指南把整条流程清晰地走一遍,让你真正明白 p 值到底意味着什么。

五个步骤

  1. 陈述 H0H_0H1H_1:原假设(现状)和备择假设(你想支持的论断)。
  2. 选定显著性水平 α\alpha:通常是 0.05 或 0.01。
  3. 从你的数据计算检验统计量zzttχ2\chi^2 等)。
  4. 求 p 值H0H_0 为真的前提下,看到这样极端数据的概率。
  5. 作出判断:若 p<αp < \alpha,拒绝 H0H_0;否则不能拒绝。

注意:"不能拒绝" ≠ "接受 H0H_0"。你只是没有足够的证据反对它而已。

单样本 z 检验(解题示例)

某工厂声称其灯泡平均寿命 1000 小时(σ=50\sigma = 50)。你检验了 25 个灯泡,测得 xˉ=980\bar x = 980。在 α=0.05\alpha = 0.05 下,这个声称被推翻了吗?

  1. H0:μ=1000H_0: \mu = 1000H1:μ1000H_1: \mu \ne 1000
  2. α=0.05\alpha = 0.05,双侧检验。
  3. 检验统计量:z=xˉμ0σ/n=980100050/25=2010=2z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} = \frac{980 - 1000}{50/\sqrt{25}} = \frac{-20}{10} = -2
  4. p 值:2P(Z<2)20.0228=0.04562 \cdot P(Z < -2) \approx 2 \cdot 0.0228 = 0.0456
  5. 由于 0.0456<0.050.0456 < 0.05拒绝 H0H_0。平均寿命与 1000 小时有显著差异。

选对检验方法

情形检验
一个均值,σ\sigma 已知单样本 z 检验
一个均值,σ\sigma 未知,n 较小单样本 t 检验
两个均值,独立样本双样本 t 检验
两个配对均值配对 t 检验
比例比例的 z 检验
拟合优度 / 列联表卡方

第一类错误 vs 第二类错误

  • 第一类错误:拒绝一个为真的 H0H_0。概率 = α\alpha
  • 第二类错误:没有拒绝一个为假的 H0H_0。概率 = β\beta
  • 检验功效 = 1β1 - \beta:正确检出真实效应的概率。

这三者一起联动:在样本量固定时,缩小 α\alpha 会抬高 β\beta;增大样本量则会同时降低两者。

常见错误

  • "p 值 = H0H_0 为真的概率"——错误。p 值是 P(数据H0)P(\text{数据} \mid H_0),而不是 P(H0数据)P(H_0 \mid \text{数据})
  • 多重比较——在 α=0.05\alpha = 0.05 下做 20 次检验,平均必然会出现约 1 个假阳性。要使用校正。
  • 把显著性与重要性混为一谈——一个伴随巨大 nn 的微小效应可能在统计上高度显著,但在实践中无关紧要。

用 AI 假设检验求解器试试

假设检验求解器输入你的数据,得到检验统计量、p 值和判断结论。

相关参考:

常见问题

(1) State the null hypothesis H₀ and alternative H₁; (2) choose a significance level α (commonly 0.05); (3) collect data and compute the test statistic; (4) calculate the p-value; (5) reject H₀ if p < α, otherwise fail to reject.

The p-value is the probability of observing a result as extreme as (or more extreme than) the computed statistic, assuming H₀ is true. A small p-value (below α) provides evidence against H₀, but does not prove H₁ is true.

A Type I error (false positive) is rejecting H₀ when it is true; its probability equals α. A Type II error (false negative) is failing to reject H₀ when it is false; its probability is β. Statistical power is 1 − β.

AI-Math Editorial Team

作者: AI-Math Editorial Team

发布于 2026-05-01

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.