statistics

베이즈 정리

베이즈 정리는 조건부 확률을 뒤집는다: P(A|B) = P(B|A)P(A)/P(B). 베이즈 추론, 의료 검사, 머신러닝의 기초이다.

베이즈 정리는 조건부 확률들을 서로 관련짓고, 조건화의 방향을 뒤집을 수 있게 해 준다.

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

사전확률 P(A)P(A)(증거를 보기 전의 믿음)와 가능도 P(BA)P(B \mid A) 가 주어지면, 사후확률 P(AB)P(A \mid B)BB 를 관측한 후 갱신된 믿음 — 을 계산한다.

고전적인 의료 검사 예: 질병 유병률 1%, 검사 민감도 99%, 위양성률 1%. 검사가 양성일 때 질병이 있을 확률은 다음과 같다.

0.990.010.990.01+0.010.99=12\frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.01 \cdot 0.99} = \frac{1}{2}

99% 정확한 검사임에도, 양성 결과가 의미하는 질병 확률은 50%에 불과하다 — 질병이 드물기 때문이다. "기저율 오류"(사전확률을 잊는 것)는 베이즈에서 가장 흔한 실수이다.

베이즈는 베이즈 추론, 나이브 베이즈 분류기, 스팸 필터, 법과학적 추론을 뒷받침한다.