statistics

卡方(χ²)检验

卡方检验在分类数据中比较观测次数与期望次数。χ² = Σ(O−E)²/E。用于拟合优度检验与独立性检验。

卡方(χ2\chi^2)检验是处理分类数据的标准工具。检验统计量为:

χ2=i(OiEi)2Ei\chi^2 = \sum_i \frac{(O_i - E_i)^2}{E_i}

其中 OiO_i 为观测次数,EiE_i 为原假设 H0H_0 下的期望次数。

三种常见类型:

  • 拟合优度检验:观测分布是否与理论分布相符?(骰子是否公平?)。df=k1df = k - 1
  • 独立性检验:两个分类变量是否独立?(性别是否与投票倾向独立?)。对 r×cr \times c 列联表,df=(r1)(c1)df = (r-1)(c-1)
  • 方差检验:较不常见。

前提:期望次数须足够大(通常每格 5\geq 5)。样本过小时,改用费希尔精确检验

卡方分布本身是标准正态变量平方和的分布——用以构造临界值。