/ Genetik & Vererbung

Jukes-Cantor-Distanz

Evolutionäre Distanz aus dem Anteil unterschiedlicher Basen: d = −(3/4) · ln(1 − (4/3) · p). Korrigiert Mehrfachsubstitutionen; gültig für p < 0,75.

Jukes-Cantor-Distanz
01 · Eingabe

Jukes-Cantor-Distanz berechnen

Evolutionäre Distanz aus dem Anteil unterschiedlicher Basen: d = −(3/4) · ln(1 − (4/3) · p). Korrigiert Mehrfachsubstitutionen; gültig für p < 0,75.

Lösen für
d = −(3/4) · ln(1 (4/3) · p)

Worum geht es?

Vergleicht man zwei DNA-Sequenzen, zählt man den Anteil unterschiedlicher Positionen p (auch „p-Distanz"). Je länger zwei Linien getrennt sind, desto mehr Mehrfachsubstitutionen treten auf — derselbe Locus kann mehrfach mutiert sein, ohne dass das beim einfachen Vergleich auffällt.

Das Jukes-Cantor-Modell (1969) korrigiert dafür unter der einfachsten Annahme: Alle vier Basen gehen mit gleicher Rate ineinander über. Die Formel ist nur für p < 0,75 definiert; bei höheren Werten ist die Sequenzähnlichkeit nicht mehr vom Zufall unterscheidbar.

Die Formel

Formel Jukes-Cantor
d = −(3/4) · ln(1 − (4/3) · p)

Umstellung (rückwärts):
    p = (3/4) · (1 − e^(−4d/3))

Gültigkeitsbereich: 0 ≤ p < 0,75

Die Variablen

SymbolBedeutungEinheitErklärung
dEvolutionäre DistanzSubstitutionen pro Position.
pAnteil unterschiedlicher BasenBeobachtete p-Distanz (0 ≤ p < 0,75).

Minimal-Beispiel

Zwei Sequenzen unterscheiden sich in 10 % der Positionen, p = 0,10.

Rechnung p = 0,10
d = −(3/4) · ln(1 − (4/3) · 0,10)
  = −0,75 · ln(0,8667)
  = −0,75 · (−0,1431)
  ≈ 0,107

Praxis-Beispiele

Beispiel 1 — Eng verwandte Sequenzen

p = 0,05 (5 % Unterschied).

Rechnung Nahe Verwandte
d = −0,75 · ln(1 − 0,0667)
  = −0,75 · ln(0,9333)
  = −0,75 · (−0,0690)
  ≈ 0,0517

Beispiel 2 — Stark divergente Sequenzen

p = 0,40.

Rechnung Divergent
d = −0,75 · ln(1 − 0,5333)
  = −0,75 · ln(0,4667)
  = −0,75 · (−0,7621)
  ≈ 0,572

Die korrigierte Distanz ist deutlich größer als die rohen 40 %.

Beispiel 3 — Rückwärts: p aus d

Phylogenetische Schätzung liefert d = 0,3. Welchem beobachteten p entspricht das?

Rechnung p aus d
p = 0,75 · (1 − e^(−4 · 0,3 / 3))
  = 0,75 · (1 − e^(−0,4))
  = 0,75 · (1 − 0,6703)
  = 0,75 · 0,3297
  ≈ 0,247

Eine korrigierte Distanz von 0,3 entspricht ca. 24,7 % beobachteten Unterschieden.