statistics

正态分布

正态分布(高斯分布)是一条钟形概率曲线,完全由其平均数 μ 与标准差 σ 描述。它是统计学中许多内容的基础。

正态分布(或高斯分布)是那条具代表性的钟形连续概率分布。其密度函数:

f(x)=1σ2πexp ⁣((xμ)22σ2)f(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\!\left(-\frac{(x - \mu)^2}{2\sigma^2}\right)

完全由两个参数决定:平均数 μ\mu(位置)与标准差 σ\sigma(离散程度)。

主要性质:

  • μ\mu 对称。
  • 68-95-99.7 法则:约 68%68\% 的数值落在 1σ1\sigma 以内,95%95\% 落在 2σ2\sigma 以内,99.7%99.7\% 落在 3σ3\sigma 以内。
  • 标准正态分布 N(0,1)N(0, 1) 是标准参考;任何正态分布都可透过 z=(xμ)/σz = (x - \mu)/\sigma 加以标准化。

正态分布之所以无所不在,是因为中心极限定理:许多独立随机变量之和,无论个别分布为何,都趋近于正态分布。这使它成为测量误差、IQ、身高、考试分数的默认模型,并成为置信区间、假设检验与高斯过程的基础。