statistics

学生 t 分布

t 分布像正态分布一样呈钟形,但尾部更厚。当样本量较小或 σ 未知时,用于对均值的推断。

学生 t 分布是一种连续概率分布,外型类似正态分布——钟形、对称——但尾部更厚。它取决于一个称为**自由度(df)**的参数。

使用时机:对总体均值进行推断,且 (1) 总体标准差 σ\sigma 未知(以样本的 ss 估计),且 (2) 样本量 nn 较小时。

t 统计量t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} 服从自由度为 n1n - 1 的 t 分布。

性质:当 dfdf \to \infty 时,t 分布收敛至标准正态分布 N(0,1)N(0, 1)。当 df<30df < 30 时,厚尾会显著加宽置信区间——这是不知道 σ\sigma 所付出的「代价」。

历史:由威廉·戈塞特于健力士酿酒厂提出(因健力士禁止员工发表著作,故以笔名「Student」发表)。它是 t 检验(单样本、双样本、配对)以及方差未知时均值置信区间的基础。