statistics

Satz von Bayes

Der Satz von Bayes kehrt bedingte Wahrscheinlichkeiten um: P(A|B) = P(B|A)P(A)/P(B). Er ist die Grundlage der Bayesschen Inferenz, medizinischer Tests und des maschinellen Lernens.

Der Satz von Bayes setzt bedingte Wahrscheinlichkeiten zueinander in Beziehung und erlaubt es, die Richtung der Bedingung umzukehren:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

Aus der A-priori-Wahrscheinlichkeit P(A)P(A) (Ihrem Glauben vor der Evidenz) und der Likelihood P(BA)P(B \mid A) berechnet man die A-posteriori-Wahrscheinlichkeit P(AB)P(A \mid B) — Ihren aktualisierten Glauben, nachdem BB beobachtet wurde.

Klassisches Beispiel eines medizinischen Tests: Krankheitsprävalenz 1 %, Testsensitivität 99 %, Falsch-positiv-Rate 1 %. Die Wahrscheinlichkeit, krank zu sein, bei einem positiven Test:

0.990.010.990.01+0.010.99=12\frac{0.99 \cdot 0.01}{0.99 \cdot 0.01 + 0.01 \cdot 0.99} = \frac{1}{2}

Trotz eines zu 99 % genauen Tests bedeutet ein positives Ergebnis nur eine 50-prozentige Wahrscheinlichkeit der Erkrankung — weil die Krankheit selten ist. Der „Basisratenfehler" (das Vergessen der A-priori-Wahrscheinlichkeit) ist der häufigste Bayes-Fehler.

Bayes ist die Grundlage der Bayesschen Inferenz, der Naive-Bayes-Klassifikatoren, von Spamfiltern und forensischem Schließen.