statistics

Théorème de Bayes

Le théorème de Bayes inverse les probabilités conditionnelles : P(A|B) = P(B|A)P(A)/P(B). C'est le fondement de l'inférence bayésienne, des tests médicaux et de l'apprentissage automatique.

Le théorème de Bayes relie les probabilités conditionnelles, ce qui permet d'inverser le sens du conditionnement :

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

Étant donné la probabilité a priori P(A)P(A) (votre croyance avant la preuve) et la vraisemblance P(BA)P(B \mid A), on calcule la probabilité a posteriori P(AB)P(A \mid B) — votre croyance mise à jour après avoir observé BB.

Exemple classique du test médical : prévalence de la maladie 1 %, sensibilité du test 99 %, taux de faux positifs 1 %. La probabilité d'être malade sachant un test positif :

0.990.010.990.01+0.010.99=12\frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.01 \cdot 0.99} = \frac{1}{2}

Malgré un test exact à 99 %, un résultat positif ne signifie qu'une probabilité de 50 % d'être malade — parce que la maladie est rare. Le « sophisme du taux de base » (oublier la probabilité a priori) est l'erreur la plus courante avec Bayes.

Bayes est le moteur de l'inférence bayésienne, des classificateurs bayésiens naïfs, des filtres anti-spam et du raisonnement médico-légal.