Jukes-Cantor-Distanz
Evolutionäre Distanz aus dem Anteil unterschiedlicher Basen: d = −(3/4) · ln(1 − (4/3) · p). Korrigiert Mehrfachsubstitutionen; gültig für p < 0,75.
Jukes-Cantor-Distanz berechnen
Evolutionäre Distanz aus dem Anteil unterschiedlicher Basen: d = −(3/4) · ln(1 − (4/3) · p). Korrigiert Mehrfachsubstitutionen; gültig für p < 0,75.
- d — Evolutionäre Distanz
- p — Anteil Unterschiede
Worum geht es?
Vergleicht man zwei DNA-Sequenzen, zählt man den Anteil unterschiedlicher Positionen p (auch „p-Distanz"). Je länger zwei Linien getrennt sind, desto mehr Mehrfachsubstitutionen treten auf — derselbe Locus kann mehrfach mutiert sein, ohne dass das beim einfachen Vergleich auffällt.
Das Jukes-Cantor-Modell (1969) korrigiert dafür unter der einfachsten Annahme: Alle vier Basen gehen mit gleicher Rate ineinander über. Die Formel ist nur für p < 0,75 definiert; bei höheren Werten ist die Sequenzähnlichkeit nicht mehr vom Zufall unterscheidbar.
Die Formel
d = −(3/4) · ln(1 − (4/3) · p)
Umstellung (rückwärts):
p = (3/4) · (1 − e^(−4d/3))
Gültigkeitsbereich: 0 ≤ p < 0,75Die Variablen
| Symbol | Bedeutung | Einheit | Erklärung |
|---|---|---|---|
| d | Evolutionäre Distanz | — | Substitutionen pro Position. |
| p | Anteil unterschiedlicher Basen | — | Beobachtete p-Distanz (0 ≤ p < 0,75). |
Minimal-Beispiel
Zwei Sequenzen unterscheiden sich in 10 % der Positionen, p = 0,10.
d = −(3/4) · ln(1 − (4/3) · 0,10)
= −0,75 · ln(0,8667)
= −0,75 · (−0,1431)
≈ 0,107Praxis-Beispiele
Beispiel 1 — Eng verwandte Sequenzen
p = 0,05 (5 % Unterschied).
d = −0,75 · ln(1 − 0,0667)
= −0,75 · ln(0,9333)
= −0,75 · (−0,0690)
≈ 0,0517Beispiel 2 — Stark divergente Sequenzen
p = 0,40.
d = −0,75 · ln(1 − 0,5333)
= −0,75 · ln(0,4667)
= −0,75 · (−0,7621)
≈ 0,572
Die korrigierte Distanz ist deutlich größer als die rohen 40 %.Beispiel 3 — Rückwärts: p aus d
Phylogenetische Schätzung liefert d = 0,3. Welchem beobachteten p entspricht das?
p = 0,75 · (1 − e^(−4 · 0,3 / 3))
= 0,75 · (1 − e^(−0,4))
= 0,75 · (1 − 0,6703)
= 0,75 · 0,3297
≈ 0,247
Eine korrigierte Distanz von 0,3 entspricht ca. 24,7 % beobachteten Unterschieden.