記述統計
平均(母集団)
母集団のすべての値の平均。
平均(標本)
標本の平均。
分散(母集団)
ばらつきの 2 乗、N で割る。
分散(標本)
ベッセルの補正: で割る。
標準偏差
分散の平方根——データと同じ単位。
範囲
最も単純なばらつきの指標。
確率の法則
加法定理
A または B の確率(包除原理)。
乗法定理
A かつ B の確率;独立なら積に簡約される。
条件付き確率
A が起こったときの B の確率。
ベイズの定理
条件付き確率を反転——診断検査、機械学習。
独立性
と が独立であるとき、かつそのときに限り成り立つ。
場合の数
順列
順序が重要: から を並べる。
組み合わせ
順序は無関係: から を選ぶ。
離散分布
二項分布の確率質量関数
成功確率 の 回の独立試行で 回成功。
二項分布の平均
成功回数の期待値。
二項分布の分散
二項分布のばらつき。
ポアソン分布の確率質量関数
平均発生率 の稀少事象の回数。
正規分布
確率密度関数
ベル型曲線、平均 、標準偏差 。
Zスコア
分布間で比較するために標準化する。
標準正規分布
Zスコア変換後。
68-95-99.7 ルール
の場合——正規データにのみ有効。
推測統計
平均の標準誤差
推定量としての の標準偏差。
信頼区間(平均、$\sigma$ 既知)
95% 信頼区間で 。
t 統計量(1 標本)
が未知のとき平均 = を検定。
カイ二乗統計量
カテゴリデータの適合度・独立性の検定。
線形回帰
傾き
最適なあてはめの傾き(最小二乗法)。
切片
直線を を通るようにする。
ピアソンの相関係数
線形関係の強さと向き、。
決定係数
で説明される の分散の割合。