/ Statistik & Wahrscheinlichkeit

Lineare Regression (Steigung)

Steigung b der Ausgleichsgeraden y = b·x + a nach der Methode der kleinsten Quadrate: b = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)².

Lineare Regression (Steigung)
01 · Eingabe

Lineare Regression (Steigung) berechnen

Steigung b der Ausgleichsgeraden y = b·x + a nach der Methode der kleinsten Quadrate: b = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)².

b = Sxy / Sxx

Was ist die Regressionssteigung?

Die lineare Regression findet diejenige Gerade y = b · x + a, die eine Punktwolke (xᵢ, yᵢ) am besten beschreibt. „Am besten" heißt nach der Methode der kleinsten Quadrate: die Summe der quadrierten vertikalen Abweichungen der Datenpunkte von der Geraden wird minimiert.

Die Steigung b sagt aus, um wie viele Einheiten y im Mittel steigt, wenn x um eine Einheit zunimmt. Ist b positiv, steigt die Gerade; ist b negativ, fällt sie.

Die Formel

Formel Regressionssteigung
      Σ(xᵢ − x̄)(yᵢ − ȳ)        Sxy
b  =  ─────────────────────  =  ────
         Σ(xᵢ − x̄)²              Sxx

Der Achsenabschnitt a folgt aus a = ȳ − b · x̄ und steckt im separaten Rechner.

Die Variablen

SymbolBedeutungEinheitErklärung
xᵢunabhängige Variablebeliebigx-Reihe der Datenpunkte.
yᵢabhängige Variablebeliebigy-Reihe der Datenpunkte.
x̄, ȳMittelwertewie xᵢ/yᵢMittelwerte der Reihen.
bSteigungyᵢ / xᵢRegressionskoeffizient.

Minimal-Beispiel

x = 1, 2, 3, 4, 5; y = 2, 4, 5, 4, 5:

Rechnung Beispiel
x̄ = 3;  ȳ = 4

Σ(xᵢ − x̄)(yᵢ − ȳ) = 6
Σ(xᵢ − x̄)²         = 10

b = 6 / 10 = 0,6

Praxis-Beispiele

Beispiel 1 — Werbeausgaben und Umsatz

Ausgaben (k€): 5, 10, 15, 20, 25. Umsatz (k€): 50, 70, 95, 110, 130.

Rechnung Werbung
x̄ = 15;  ȳ = 91

Σ(xᵢ − x̄)(yᵢ − ȳ) = 1.000
Σ(xᵢ − x̄)²         = 250

b = 1.000 / 250 = 4,0

⇒ jeder zusätzliche 1.000 € Werbung bringt im
  Mittel 4.000 € zusätzlichen Umsatz.

Beispiel 2 — Heizöl pro °C

Außentemperatur (°C): 0, 5, 10, 15, 20. Verbrauch (l/Tag): 20, 17, 14, 10, 6.

Rechnung Heizöl
b ≈ −0,71  l/(Tag · °C)

⇒ pro Grad Erwärmung sinkt der Tagesverbrauch
  um etwa 0,71 Liter.

Beispiel 3 — Lernzeit und Klausurpunkte

Stunden: 2, 4, 6, 8, 10. Punkte: 55, 65, 75, 85, 95.

Rechnung Lernen
x̄ = 6;  ȳ = 75

Σ(xᵢ − x̄)(yᵢ − ȳ) = 100
Σ(xᵢ − x̄)²         = 40

b = 100 / 40 = 2,5

⇒ pro zusätzliche Lernstunde im Mittel 2,5 Punkte mehr.

Beispiel 4 — Maschinenlaufzeit und Defektrate

Stunden seit Wartung: 100, 200, 300, 400, 500. Defekte/100 Stück: 2, 3, 5, 6, 9.

Rechnung Wartung
x̄ = 300;  ȳ = 5

Σ(xᵢ − x̄)(yᵢ − ȳ) = 1.700
Σ(xᵢ − x̄)²         = 100.000

b = 0,017 Defekte / Std.
  ≈ 1,7 zusätzliche Defekte je 100 Stunden Laufzeit.