statistics

貝氏定理

貝氏定理可反轉條件機率:P(A|B) = P(B|A)P(A)/P(B)。它是貝氏推論、醫學檢測與機器學習的基礎。

貝氏定理將條件機率彼此關聯起來,讓你能反轉條件化的方向:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

給定先驗 P(A)P(A)(看到證據前的信念)與似然 P(BA)P(B \mid A),即可算出後驗 P(AB)P(A \mid B)——觀察到 BB 之後更新的信念。

經典醫學檢測例:疾病盛行率 1%、檢測敏感度 99%、偽陽性率 1%。檢測呈陽性時罹病的機率為:

0.990.010.990.01+0.010.99=12\frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.01 \cdot 0.99} = \frac{1}{2}

即使檢測有 99% 的準確度,陽性結果也只代表 50% 的罹病機率——因為該疾病罕見。「基率謬誤」(忽略先驗)是最常見的貝氏錯誤。

貝氏定理支撐貝氏推論、單純貝氏分類器、垃圾郵件過濾與鑑識推理。