Die Messlatte höher legen: Neue SLOs bei 99 % (und 99,9 % für die Gesamtgesundheit)

created: Sonntag, Juni 15, 2025

TL;DR

Metrik Altes SLO Neues SLO
Jeder DTZ kundenorientierte Dienst 95 % 99 %
dtz Gesamtgesundheit (aggregierter Heartbeat) 95 % 99,9 %

Die neuen Ziele treten am **1. Juli 2025** in Kraft und werden über dasselbe rollierende 30-Tage-Fenster gemessen, das Sie bereits von der [Statusseite](https://status.dtz.rocks) kennen.

Warum wir bereit sind für eine weitere Neun

Im vergangenen Jahr hat sich unsere Plattform still und leise von „vielversprechend“ zu „kampferprobt“ entwickelt:


Was sich für Sie ändert

  1. Engere Fehlerbudgets. Bei 99 % Verfügbarkeit darf ein Dienst jetzt etwa ~7 h 18 m pro Monat ausfallen (zuvor ~36 h). Für die 99,9 %-Gesamtgesundheitsprüfung sind es nur 43 m.
  2. Schnellere Vorfallreaktion. Die Pager-Schwellen werden von 3 m auf 60 s fehlerhafte Prüfungen verkürzt, damit wir handeln können, bevor Sie es bemerken.
  3. Transparente Gutschriften. Wenn wir das SLO überschreiten, werden Service-Gutschriften automatisch gutgeschrieben – ohne Ticket. Die aktualisierten AGB treten nächste Woche in Kraft.
  4. Umfassendere öffentliche Telemetrie. Latenz-Perzentile und Burn-Rate-Grafiken werden für jede Komponente auf der Statusseite hinzugefügt, damit Sie Probleme mit Ihren eigenen Dashboards korrelieren können.

Wie wir im Budget bleiben


Ein kurzer Blick auf die Zahlen

Seit dem 1. April 2025 haben wir gesehen:

Diese Zahlen geben uns ausreichenden Spielraum, um die neuen Ziele zu erreichen, noch bevor die bevorstehenden Redundanz-Upgrades umgesetzt sind.


Danke

Zuverlässigkeit ist kein Schalter, den man umlegt – sie ist die kumulative Wirkung von Design-Reviews, Testabdeckung, Observability und einem Team, dem es am Herzen liegt. Ihre Fehlerberichte und Funktionsvorschläge haben uns motiviert, die Messlatte höher zu legen. Bitte geben Sie weiterhin Feedback, und auf weniger Pager-Meldungen, umweltfreundlichere Abläufe und eine zusätzliche Neun.