statistics

Z 分數(標準分數)

Z 分數衡量某個數值高於或低於平均數多少個標準差。z = (x − μ) / σ。用於跨分布比較數值以及查表求機率。

Z 分數(標準分數)是某個數值與平均數的距離,以標準差為單位來表示:

z=xμσz = \frac{x - \mu}{\sigma}

(樣本資料則改用 xˉ\bar{x}ss)。

Z 分數為 +2+2 表示「在平均數之上兩個標準差」;1.5-1.5 表示「在平均數之下 1.5 個標準差」。

Z 分數讓你能夠:

  • 比較來自不同分布的數值——在測驗 A(μ=70,σ=5\mu=70, \sigma=5)考 80 分的學生(z=2)比在測驗 B(μ=75,σ=10\mu=75, \sigma=10,z=0.5)考 80 分更為出色。
  • 在標準常態分布表中查找機率——P(Z<1.96Z < 1.96) ≈ 0.975,這是 95% 信賴區間的基礎。
  • 辨識離群值——依慣例,在近似常態的資料中 z>3|z| > 3 即標示出一個不尋常的觀測值。

標準化(轉換為 z 分數)也是機器學習中一個基本的前處理步驟:將輸入縮放到平均數 0、標準差 1,有助於梯度下降收斂,並可避免單位較大的特徵(例如以美元計的收入相對於以年計的年齡)主宰以距離為基礎的模型。