statistics

Teorema di Bayes

Il teorema di Bayes inverte le probabilità condizionate: P(A|B) = P(B|A)P(A)/P(B). È il fondamento dell'inferenza bayesiana, dei test medici e del machine learning.

Il teorema di Bayes mette in relazione le probabilità condizionate, consentendo di invertire la direzione del condizionamento:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

Date la probabilità a priori P(A)P(A) (la tua convinzione prima dell'evidenza) e la verosimiglianza P(BA)P(B \mid A), si calcola la probabilità a posteriori P(AB)P(A \mid B) — la tua convinzione aggiornata dopo aver osservato BB.

Classico esempio del test medico: prevalenza della malattia 1%, sensibilità del test 99%, tasso di falsi positivi 1%. La probabilità di avere la malattia dato un test positivo:

0.990.010.990.01+0.010.99=12\frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.01 \cdot 0.99} = \frac{1}{2}

Nonostante un test accurato al 99%, un risultato positivo significa solo il 50% di probabilità di essere malati — perché la malattia è rara. La "fallacia del tasso di base" (dimenticare la probabilità a priori) è l'errore più comune con Bayes.

Bayes alimenta l'inferenza bayesiana, i classificatori naïve Bayes, i filtri antispam e il ragionamento forense.