Cheat Sheet

統計學 Formulas

學生從入門統計到推論分析所需的每一個統計公式:描述性度量、機率規則、常態分布、假設檢定和線性迴歸。每條都附一句話用法說明。搭配 AI-Math 的求解器即可代入驗證。

描述性統計

平均數(母體)

μ=1Ni=1Nxi\mu = \frac{1}{N}\sum_{i=1}^N x_i

母體所有取值的平均。

平均數(樣本)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

樣本的平均。

變異數(母體)

σ2=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum (x_i - \mu)^2

離散程度的平方,除以 N。

變異數(樣本)

s2=1n1(xixˉ)2s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2

貝塞爾校正:除以 n1n-1

標準差

σ=σ2\sigma = \sqrt{\sigma^2}

變異數的平方根——與資料單位相同。

全距

R=xmaxxminR = x_{\max} - x_{\min}

最簡單的離散度量。

機率法則

加法法則

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

A 或 B 的機率(排容原理)。

乘法法則

P(AB)=P(A)P(BA)P(A \cap B) = P(A) \cdot P(B \mid A)

A 且 B 的機率;獨立時簡化為乘積。

條件機率

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

在 A 發生的條件下 B 的機率。

貝氏定理

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

反轉條件機率——診斷檢測、機器學習。

獨立性

P(AB)=P(A)P(B)P(A \cap B) = P(A) P(B)

當且僅當 AABB 獨立時成立。

計數

排列

P(n,r)=n!(nr)!P(n,r) = \frac{n!}{(n-r)!}

順序重要:從 nn 個中排 rr 個。

組合

C(n,r)=(nr)=n!r!(nr)!C(n,r) = \binom{n}{r} = \frac{n!}{r!(n-r)!}

順序無關:從 nn 個中選 rr 個。

離散分布

二項分布 PMF

P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

nn 次獨立試驗中 kk 次成功,單次成功機率為 pp

二項分布平均數

μ=np\mu = np

期望的成功次數。

二項分布變異數

σ2=np(1p)\sigma^2 = np(1-p)

二項分布的離散程度。

卜瓦松分布 PMF

P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

稀有事件計數,平均速率為 λ\lambda

常態分布

機率密度函數

f(x)=1σ2πexp ⁣((xμ)22σ2)f(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\!\bigl(-\tfrac{(x-\mu)^2}{2\sigma^2}\bigr)

鐘形曲線,平均數 μ\mu,標準差 σ\sigma

Z 分數

z=xμσz = \frac{x - \mu}{\sigma}

標準化以便跨分布比較。

標準常態

ZN(0,1)Z \sim N(0, 1)

Z 分數變換之後。

68-95-99.7 法則

P(Xμ<kσ): 0.68, 0.95, 0.997P(|X - \mu| < k\sigma):\ 0.68,\ 0.95,\ 0.997

對於 k=1,2,3k = 1, 2, 3——僅對常態資料有效。

推論統計

平均數標準誤

SE=snSE = \frac{s}{\sqrt{n}}

作為估計量的 xˉ\bar{x} 的標準差。

信賴區間(平均數,已知 $\sigma$)

xˉ±zα/2σn\bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

95% 信賴區間時 zα/2=1.96z_{\alpha/2} = 1.96

t 統計量(單樣本)

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}

σ\sigma 未知時檢定平均數 = μ0\mu_0

卡方統計量

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

分類資料的適合度 / 獨立性檢定。

線性迴歸

斜率

b1=(xixˉ)(yiyˉ)(xixˉ)2b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}

最佳擬合斜率(最小平方)。

截距

b0=yˉb1xˉb_0 = \bar{y} - b_1 \bar{x}

使迴歸線經過 (xˉ,yˉ)(\bar{x}, \bar{y})

皮爾森相關係數

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}

線性關係的強度與方向,r[1,1]r \in [-1, 1]

決定係數

R2=r2R^2 = r^2

yy 的變異數中由 xx 解釋的比例。