Cheat Sheet

統計学 Formulas

入門統計から推測統計まで学生が必要とするすべての統計公式:記述統計量、確率の法則、正規分布、仮説検定、線形回帰。それぞれに一行の使い方メモ付き。AI-Math のソルバーと組み合わせて代入検算できます。

記述統計

平均(母集団)

μ=1Ni=1Nxi\mu = \frac{1}{N}\sum_{i=1}^N x_i

母集団のすべての値の平均。

平均(標本)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

標本の平均。

分散(母集団)

σ2=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum (x_i - \mu)^2

ばらつきの 2 乗、N で割る。

分散(標本)

s2=1n1(xixˉ)2s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2

ベッセルの補正:n1n-1 で割る。

標準偏差

σ=σ2\sigma = \sqrt{\sigma^2}

分散の平方根——データと同じ単位。

範囲

R=xmaxxminR = x_{\max} - x_{\min}

最も単純なばらつきの指標。

確率の法則

加法定理

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

A または B の確率(包除原理)。

乗法定理

P(AB)=P(A)P(BA)P(A \cap B) = P(A) \cdot P(B \mid A)

A かつ B の確率;独立なら積に簡約される。

条件付き確率

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

A が起こったときの B の確率。

ベイズの定理

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

条件付き確率を反転——診断検査、機械学習。

独立性

P(AB)=P(A)P(B)P(A \cap B) = P(A) P(B)

AABB が独立であるとき、かつそのときに限り成り立つ。

場合の数

順列

P(n,r)=n!(nr)!P(n,r) = \frac{n!}{(n-r)!}

順序が重要:nn から rr を並べる。

組み合わせ

C(n,r)=(nr)=n!r!(nr)!C(n,r) = \binom{n}{r} = \frac{n!}{r!(n-r)!}

順序は無関係:nn から rr を選ぶ。

離散分布

二項分布の確率質量関数

P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

成功確率 ppnn 回の独立試行で kk 回成功。

二項分布の平均

μ=np\mu = np

成功回数の期待値。

二項分布の分散

σ2=np(1p)\sigma^2 = np(1-p)

二項分布のばらつき。

ポアソン分布の確率質量関数

P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

平均発生率 λ\lambda の稀少事象の回数。

正規分布

確率密度関数

f(x)=1σ2πexp ⁣((xμ)22σ2)f(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\!\bigl(-\tfrac{(x-\mu)^2}{2\sigma^2}\bigr)

ベル型曲線、平均 μ\mu、標準偏差 σ\sigma

Zスコア

z=xμσz = \frac{x - \mu}{\sigma}

分布間で比較するために標準化する。

標準正規分布

ZN(0,1)Z \sim N(0, 1)

Zスコア変換後。

68-95-99.7 ルール

P(Xμ<kσ): 0.68, 0.95, 0.997P(|X - \mu| < k\sigma):\ 0.68,\ 0.95,\ 0.997

k=1,2,3k = 1, 2, 3 の場合——正規データにのみ有効。

推測統計

平均の標準誤差

SE=snSE = \frac{s}{\sqrt{n}}

推定量としての xˉ\bar{x} の標準偏差。

信頼区間(平均、$\sigma$ 既知)

xˉ±zα/2σn\bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

95% 信頼区間で zα/2=1.96z_{\alpha/2} = 1.96

t 統計量(1 標本)

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}

σ\sigma が未知のとき平均 = μ0\mu_0 を検定。

カイ二乗統計量

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

カテゴリデータの適合度・独立性の検定。

線形回帰

傾き

b1=(xixˉ)(yiyˉ)(xixˉ)2b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}

最適なあてはめの傾き(最小二乗法)。

切片

b0=yˉb1xˉb_0 = \bar{y} - b_1 \bar{x}

直線を (xˉ,yˉ)(\bar{x}, \bar{y}) を通るようにする。

ピアソンの相関係数

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}

線形関係の強さと向き、r[1,1]r \in [-1, 1]

決定係数

R2=r2R^2 = r^2

xx で説明される yy の分散の割合。