statistics

Định lý Bayes

Định lý Bayes đảo ngược các xác suất có điều kiện: P(A|B) = P(B|A)P(A)/P(B). Đây là nền tảng của suy luận Bayes, xét nghiệm y khoa và học máy.

Định lý Bayes liên hệ các xác suất có điều kiện với nhau, cho phép bạn đảo ngược chiều của điều kiện:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

Cho xác suất tiên nghiệm P(A)P(A) (niềm tin của bạn trước khi có bằng chứng) và hàm hợp lý P(BA)P(B \mid A), ta tính được xác suất hậu nghiệm P(AB)P(A \mid B) — niềm tin được cập nhật sau khi quan sát thấy BB.

Ví dụ kinh điển về xét nghiệm y khoa: tỷ lệ mắc bệnh 1%, độ nhạy của xét nghiệm 99%, tỷ lệ dương tính giả 1%. Xác suất mắc bệnh khi xét nghiệm dương tính:

0.990.010.990.01+0.010.99=12\frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.01 \cdot 0.99} = \frac{1}{2}

Mặc dù xét nghiệm chính xác tới 99%, một kết quả dương tính chỉ có nghĩa là 50% khả năng mắc bệnh — vì căn bệnh này hiếm gặp. "Ngụy biện tỷ lệ nền" (quên mất xác suất tiên nghiệm) là sai lầm phổ biến nhất khi dùng Bayes.

Bayes là động lực của suy luận Bayes, bộ phân loại Bayes ngây thơ, bộ lọc thư rác và lập luận pháp y.