Lineare Regression (Steigung)
Steigung b der Ausgleichsgeraden y = b·x + a nach der Methode der kleinsten Quadrate: b = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)².
Lineare Regression (Steigung) berechnen
Steigung b der Ausgleichsgeraden y = b·x + a nach der Methode der kleinsten Quadrate: b = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)².
Was ist die Regressionssteigung?
Die lineare Regression findet diejenige Gerade y = b · x + a, die eine Punktwolke (xᵢ, yᵢ) am besten beschreibt. „Am besten" heißt nach der Methode der kleinsten Quadrate: die Summe der quadrierten vertikalen Abweichungen der Datenpunkte von der Geraden wird minimiert.
Die Steigung b sagt aus, um wie viele Einheiten y im Mittel steigt, wenn x um eine Einheit zunimmt. Ist b positiv, steigt die Gerade; ist b negativ, fällt sie.
Die Formel
Σ(xᵢ − x̄)(yᵢ − ȳ) Sxy
b = ───────────────────── = ────
Σ(xᵢ − x̄)² SxxDer Achsenabschnitt a folgt aus a = ȳ − b · x̄ und steckt im separaten Rechner.
Die Variablen
| Symbol | Bedeutung | Einheit | Erklärung |
|---|---|---|---|
| xᵢ | unabhängige Variable | beliebig | x-Reihe der Datenpunkte. |
| yᵢ | abhängige Variable | beliebig | y-Reihe der Datenpunkte. |
| x̄, ȳ | Mittelwerte | wie xᵢ/yᵢ | Mittelwerte der Reihen. |
| b | Steigung | yᵢ / xᵢ | Regressionskoeffizient. |
Minimal-Beispiel
x = 1, 2, 3, 4, 5; y = 2, 4, 5, 4, 5:
x̄ = 3; ȳ = 4
Σ(xᵢ − x̄)(yᵢ − ȳ) = 6
Σ(xᵢ − x̄)² = 10
b = 6 / 10 = 0,6Praxis-Beispiele
Beispiel 1 — Werbeausgaben und Umsatz
Ausgaben (k€): 5, 10, 15, 20, 25. Umsatz (k€): 50, 70, 95, 110, 130.
x̄ = 15; ȳ = 91
Σ(xᵢ − x̄)(yᵢ − ȳ) = 1.000
Σ(xᵢ − x̄)² = 250
b = 1.000 / 250 = 4,0
⇒ jeder zusätzliche 1.000 € Werbung bringt im
Mittel 4.000 € zusätzlichen Umsatz.Beispiel 2 — Heizöl pro °C
Außentemperatur (°C): 0, 5, 10, 15, 20. Verbrauch (l/Tag): 20, 17, 14, 10, 6.
b ≈ −0,71 l/(Tag · °C)
⇒ pro Grad Erwärmung sinkt der Tagesverbrauch
um etwa 0,71 Liter.Beispiel 3 — Lernzeit und Klausurpunkte
Stunden: 2, 4, 6, 8, 10. Punkte: 55, 65, 75, 85, 95.
x̄ = 6; ȳ = 75
Σ(xᵢ − x̄)(yᵢ − ȳ) = 100
Σ(xᵢ − x̄)² = 40
b = 100 / 40 = 2,5
⇒ pro zusätzliche Lernstunde im Mittel 2,5 Punkte mehr.Beispiel 4 — Maschinenlaufzeit und Defektrate
Stunden seit Wartung: 100, 200, 300, 400, 500. Defekte/100 Stück: 2, 3, 5, 6, 9.
x̄ = 300; ȳ = 5
Σ(xᵢ − x̄)(yᵢ − ȳ) = 1.700
Σ(xᵢ − x̄)² = 100.000
b = 0,017 Defekte / Std.
≈ 1,7 zusätzliche Defekte je 100 Stunden Laufzeit.