卡方(χ2\chi^2χ2)检验是处理分类数据的标准工具。检验统计量为: χ2=∑i(Oi−Ei)2Ei\chi^2 = \sum_i \frac{(O_i - E_i)^2}{E_i}χ2=∑iEi(Oi−Ei)2 其中 OiO_iOi 为观测次数,EiE_iEi 为原假设 H0H_0H0 下的期望次数。 三种常见类型: 拟合优度检验:观测分布是否与理论分布相符?(骰子是否公平?)。df=k−1df = k - 1df=k−1。 独立性检验:两个分类变量是否独立?(性别是否与投票倾向独立?)。对 r×cr \times cr×c 列联表,df=(r−1)(c−1)df = (r-1)(c-1)df=(r−1)(c−1)。 方差检验:较不常见。 前提:期望次数须足够大(通常每格 ≥5\geq 5≥5)。样本过小时,改用费希尔精确检验。 卡方分布本身是标准正态变量平方和的分布——用以构造临界值。