/ Statistik & Wahrscheinlichkeit

Satz von Bayes

P(A | B) = P(B | A) · P(A) / P(B). Umkehrung einer bedingten Wahrscheinlichkeit — Grundlage diagnostischer Tests, Spam-Filter und vieler KI-Verfahren.

Satz von Bayes

01 · Eingabe

Satz von Bayes berechnen

P(A | B) = P(B | A) · P(A) / P(B). Umkehrung einer bedingten Wahrscheinlichkeit — Grundlage diagnostischer Tests, Spam-Filter und vieler KI-Verfahren.

P(A | B) = P(B | A) · P(A) / P(B)

PBA P(B | A)

PA P(A)

PB P(B)

Was leistet der Satz von Bayes?

Der Satz von Bayes verknüpft zwei bedingte Wahrscheinlichkeiten miteinander. Er erlaubt, von P(B | A) auf P(A | B) zu schließen — also die Bedingungsrichtung umzudrehen:

P(A | B) = P(B | A) · P(A) / P(B)

In Worten: Die Wahrscheinlichkeit für A nach der Beobachtung von B (A-posteriori) ist proportional zur ursprünglichen Wahrscheinlichkeit P(A) (A-priori), gewichtet mit der Likelihood P(B | A) und normiert durch die Evidenz P(B).

Anwendungen: medizinische Diagnostik, Spam-Filter, forensische Statistik, Bayes-Klassifikation, Update von Glauben angesichts neuer Daten.

Die Formel

Formel Satz von Bayes

            P(B | A) · P(A)
P(A | B) = ──────────────────
                  P(B)

Vollformel mit totaler Wahrscheinlichkeit:
P(B) = P(B | A) · P(A) + P(B | Ā) · P(Ā)

Die Variablen

Symbol	Bedeutung	Einheit	Erklärung
PBA	P(B	A)	—
PA	P(A)	—	A-priori-Wahrscheinlichkeit von A.
PB	P(B)	—	Gesamtwahrscheinlichkeit von B (> 0).
PAB	P(A	B)	—

Minimal-Beispiel

P(B | A) = 0,9; P(A) = 0,2; P(B) = 0,5.

Rechnung Beispiel

P(A | B) = 0,9 · 0,2 / 0,5
         = 0,18 / 0,5
         = 0,36 = 36 %

Praxis-Beispiele

Beispiel 1 — Mammografie-Klassiker

In einer Population haben 1 % der Frauen Brustkrebs (K). Der Test erkennt Erkrankte zu 90 % (Sensitivität). Bei Gesunden zeigt der Test zu 9 % fälschlich positiv (Falsch-Positiv-Rate). Wie wahrscheinlich ist eine Erkrankung bei positivem Test?

Rechnung Diagnose-Test

P(K)       = 0,01
P(T | K)   = 0,90
P(T | K̄)   = 0,09
P(K̄)       = 0,99

P(T) = 0,90 · 0,01 + 0,09 · 0,99
     = 0,009 + 0,0891 = 0,0981

P(K | T) = (0,90 · 0,01) / 0,0981
         ≈ 0,0917 = 9,17 %

→ Trotz „positivem Test" liegt die Wahrscheinlichkeit
  für die Krankheit nur bei rund 9 %.

Beispiel 2 — Spam-Filter

Wort „Gewinn" tritt in 60 % aller Spam-Mails (S) und in 5 % aller normalen Mails auf. 20 % aller Mails sind Spam. Eine Mail enthält „Gewinn":

Rechnung Spam

P(W | S)  = 0,60;  P(S) = 0,20
P(W | S̄)  = 0,05;  P(S̄) = 0,80

P(W) = 0,60 · 0,20 + 0,05 · 0,80 = 0,12 + 0,04 = 0,16

P(S | W) = (0,60 · 0,20) / 0,16
         = 0,75 = 75 %

Beispiel 3 — Drogentest am Arbeitsplatz

5 % der Beschäftigten konsumieren tatsächlich (K). Test: Sensitivität 99 %, Falsch-Positiv-Rate 2 %.

Rechnung Drogentest

P(K) = 0,05
P(T | K) = 0,99
P(T | K̄) = 0,02

P(T) = 0,99 · 0,05 + 0,02 · 0,95
     = 0,0495 + 0,019 = 0,0685

P(K | T) = 0,0495 / 0,0685 ≈ 0,7226 ≈ 72,3 %

Beispiel 4 — Drei Maschinen, defektes Stück

Maschinen M1 (50 %, 1 % Defekt), M2 (30 %, 2 %), M3 (20 %, 5 %). Ein defektes Stück: Wahrscheinlichkeit, dass es von M3 stammt?

Rechnung Defektquelle

P(D) = 0,50·0,01 + 0,30·0,02 + 0,20·0,05
     = 0,005 + 0,006 + 0,010 = 0,021

P(M3 | D) = (0,20 · 0,05) / 0,021
          = 0,010 / 0,021 ≈ 0,4762 ≈ 47,6 %