Satz von Bayes
P(A | B) = P(B | A) · P(A) / P(B). Umkehrung einer bedingten Wahrscheinlichkeit — Grundlage diagnostischer Tests, Spam-Filter und vieler KI-Verfahren.
Satz von Bayes berechnen
P(A | B) = P(B | A) · P(A) / P(B). Umkehrung einer bedingten Wahrscheinlichkeit — Grundlage diagnostischer Tests, Spam-Filter und vieler KI-Verfahren.
Was leistet der Satz von Bayes?
Der Satz von Bayes verknüpft zwei bedingte Wahrscheinlichkeiten miteinander. Er erlaubt, von P(B | A) auf P(A | B) zu schließen — also die Bedingungsrichtung umzudrehen:
P(A | B) = P(B | A) · P(A) / P(B)
In Worten: Die Wahrscheinlichkeit für A nach der Beobachtung von B (A-posteriori) ist proportional zur ursprünglichen Wahrscheinlichkeit P(A) (A-priori), gewichtet mit der Likelihood P(B | A) und normiert durch die Evidenz P(B).
Anwendungen: medizinische Diagnostik, Spam-Filter, forensische Statistik, Bayes-Klassifikation, Update von Glauben angesichts neuer Daten.
Die Formel
P(B | A) · P(A)
P(A | B) = ──────────────────
P(B)
Vollformel mit totaler Wahrscheinlichkeit:
P(B) = P(B | A) · P(A) + P(B | Ā) · P(Ā)Die Variablen
| Symbol | Bedeutung | Einheit | Erklärung |
|---|---|---|---|
| PBA | P(B | A) | — |
| PA | P(A) | — | A-priori-Wahrscheinlichkeit von A. |
| PB | P(B) | — | Gesamtwahrscheinlichkeit von B (> 0). |
| PAB | P(A | B) | — |
Minimal-Beispiel
P(B | A) = 0,9; P(A) = 0,2; P(B) = 0,5.
P(A | B) = 0,9 · 0,2 / 0,5
= 0,18 / 0,5
= 0,36 = 36 %Praxis-Beispiele
Beispiel 1 — Mammografie-Klassiker
In einer Population haben 1 % der Frauen Brustkrebs (K). Der Test erkennt Erkrankte zu 90 % (Sensitivität). Bei Gesunden zeigt der Test zu 9 % fälschlich positiv (Falsch-Positiv-Rate). Wie wahrscheinlich ist eine Erkrankung bei positivem Test?
P(K) = 0,01
P(T | K) = 0,90
P(T | K̄) = 0,09
P(K̄) = 0,99
P(T) = 0,90 · 0,01 + 0,09 · 0,99
= 0,009 + 0,0891 = 0,0981
P(K | T) = (0,90 · 0,01) / 0,0981
≈ 0,0917 = 9,17 %
→ Trotz „positivem Test" liegt die Wahrscheinlichkeit
für die Krankheit nur bei rund 9 %.Beispiel 2 — Spam-Filter
Wort „Gewinn" tritt in 60 % aller Spam-Mails (S) und in 5 % aller normalen Mails auf. 20 % aller Mails sind Spam. Eine Mail enthält „Gewinn":
P(W | S) = 0,60; P(S) = 0,20
P(W | S̄) = 0,05; P(S̄) = 0,80
P(W) = 0,60 · 0,20 + 0,05 · 0,80 = 0,12 + 0,04 = 0,16
P(S | W) = (0,60 · 0,20) / 0,16
= 0,75 = 75 %Beispiel 3 — Drogentest am Arbeitsplatz
5 % der Beschäftigten konsumieren tatsächlich (K). Test: Sensitivität 99 %, Falsch-Positiv-Rate 2 %.
P(K) = 0,05
P(T | K) = 0,99
P(T | K̄) = 0,02
P(T) = 0,99 · 0,05 + 0,02 · 0,95
= 0,0495 + 0,019 = 0,0685
P(K | T) = 0,0495 / 0,0685 ≈ 0,7226 ≈ 72,3 %Beispiel 4 — Drei Maschinen, defektes Stück
Maschinen M1 (50 %, 1 % Defekt), M2 (30 %, 2 %), M3 (20 %, 5 %). Ein defektes Stück: Wahrscheinlichkeit, dass es von M3 stammt?
P(D) = 0,50·0,01 + 0,30·0,02 + 0,20·0,05
= 0,005 + 0,006 + 0,010 = 0,021
P(M3 | D) = (0,20 · 0,05) / 0,021
= 0,010 / 0,021 ≈ 0,4762 ≈ 47,6 %