描述性统计
均值(总体)
总体所有取值的平均。
均值(样本)
样本的平均。
方差(总体)
离散程度的平方,除以 N。
方差(样本)
贝塞尔校正:除以 。
标准差
方差的平方根——与数据单位相同。
极差
最简单的离散度量。
概率法则
加法法则
A 或 B 的概率(容斥原理)。
乘法法则
A 且 B 的概率;独立时简化为乘积。
条件概率
在 A 发生的条件下 B 的概率。
贝叶斯定理
反转条件概率——诊断检测、机器学习。
独立性
当且仅当 与 独立时成立。
计数
排列
顺序重要:从 个中排 个。
组合
顺序无关:从 个中选 个。
离散分布
二项分布 PMF
次独立试验中 次成功,单次成功概率为 。
二项分布均值
期望的成功次数。
二项分布方差
二项分布的离散程度。
泊松分布 PMF
稀有事件计数,平均速率为 。
正态分布
概率密度函数
钟形曲线,均值 ,标准差 。
Z 分数
标准化以便跨分布比较。
标准正态
Z 分数变换之后。
68-95-99.7 法则
对于 ——仅对正态数据有效。
推断统计
均值标准误
作为估计量的 的标准差。
置信区间(均值,已知 $\sigma$)
95% 置信区间时 。
t 统计量(单样本)
当 未知时检验均值 = 。
卡方统计量
分类数据的拟合优度 / 独立性检验。
线性回归
斜率
最佳拟合斜率(最小二乘)。
截距
使回归线经过 。
皮尔逊相关系数
线性关系的强度与方向,。
决定系数
的方差中由 解释的比例。