/ Informatik

Performance & Benchmarking

MIPS, FLOPS, CPI, CPU-Taktzeit, Ausführungszeit, Amdahls und Gustafsons Gesetz, Cache-Trefferrate, effektive Zugriffszeit, Speicherbandbreite, Latenz-Bandbreite-Produkt und Parallelisierungseffizienz.

12 Rechner in dieser Kategorie, jeweils mit automatischer Variablen-Umstellung.

I01
MIPS (Millionen Instruktionen pro Sekunde)
Klassische Performance-Kennzahl: MIPS = Instruktionen / (Zeit · 10⁶). Misst die Instruktionsrate einer CPU in Millionen Instruktionen pro Sekunde.
I02
FLOPS (Gleitkomma-Operationen pro Sekunde)
Gleitkomma-Performance: FLOPS = Operationen / Zeit. Standardkennzahl für numerische Workloads und HPC.
I03
CPI (Zyklen pro Instruktion)
Durchschnittliche Anzahl Taktzyklen pro Instruktion: CPI = Taktzyklen / Instruktionen. Niedriger CPI = höhere Effizienz pro Takt.
I04
CPU-Taktzeit
Dauer eines Taktzyklus: Taktzeit = 1 / Taktfrequenz. Kehrwert der Taktrate.
I05
Ausführungszeit
Gesamtausführungszeit eines Programms: Zeit = Instruktionen · CPI / Taktfrequenz. Verknüpft Instruktionszahl, CPI und Taktrate.
I06
Amdahls Gesetz (Speedup)
Maximaler Speedup durch Parallelisierung: S = 1 / ((1 − p) + p / n). p = parallelisierbarer Anteil, n = Prozessoren. Der serielle Rest begrenzt den Speedup.
I07
Gustafsons Gesetz (skalierter Speedup)
Skalierter Speedup bei wachsender Problemgröße: S = (1 − p) + p · n. Optimistischer als Amdahl, da mit n auch die Arbeit pro Prozessor mitwächst.
I08
Cache-Trefferrate
Anteil der Cache-Treffer an den Zugriffen: HitRate = Treffer / Zugriffe. Zentrale Kennzahl für Cache-Effizienz.
I09
Effektive Zugriffszeit
Gewichtete mittlere Zugriffszeit über Cache und Hauptspeicher: EAT = h · Tc + (1 − h) · Tm. h = Trefferrate.
I10
Speicherbandbreite
Theoretische Datenrate des Speichers: Bandbreite = Busbreite · Takt · Transfers. Bei DDR ist Transfers = 2 (Double Data Rate).
I11
Latenz-Bandbreite-Produkt
Datenmenge, die zu jedem Zeitpunkt in der Pipeline unterwegs ist: LBP = Latenz · Bandbreite. Wichtig für TCP-Fenster und Pipelining.
I12
Parallelisierungseffizienz
Effizienz einer Parallelisierung: Effizienz = Speedup / Prozessoren. Wert nahe 1 = nahezu lineare Skalierung.