Die Messlatte erhöhen: Neue SLOs bei 99 % (und 99,9 % für Overall Health)

created: Sonntag, Juni 15, 2025

TL;DR

Metric Old SLO New SLO
Jeder DTZ-kundenorientierte Dienst 95 % 99 %
dtz overall health (aggregierter Heartbeat) 95 % 99,9 %

Die neuen Ziele treten am **1. Juli 2025** in Kraft und werden über dasselbe rollierende 30-Tage-Fenster gemessen, das Sie bereits von der [status page](https://status.dtz.rocks) kennen.

Warum wir bereit für eine zusätzliche Neun sind

Im vergangenen Jahr hat sich unsere Plattform stillschweigend von „vielversprechend“ zu „kampferprobt“ entwickelt:


Was sich für Sie ändert

  1. Engere Error Budgets. Bei 99 % Verfügbarkeit darf ein Dienst nun ~7 h 18 m pro Monat ausfallen (zuvor ~36 h). Für die 99,9 %-Overall-Health-Prüfung beträgt die Zulassung nur 43 m.
  2. Schnellere Incident-Reaktion. Die Pager-Schwellen werden von 3 m auf 60 s bei fehlschlagenden Probes verkürzt, damit wir reagieren können, bevor Sie es bemerken.
  3. Transparente Gutschriften. Wenn wir das SLO verletzen, werden Service-Guthaben automatisch gutgeschrieben—kein Ticket erforderlich. Die aktualisierten AGB treten nächste Woche in Kraft.
  4. Erweiterte öffentliche Telemetrie. Latenz-Perzentile und Burn-Rate-Grafiken werden zu jeder Komponente auf der Statusseite hinzugefügt, damit Sie Probleme mit Ihren eigenen Dashboards korrelieren können.

Wie wir innerhalb des Budgets bleiben


Ein kurzer Blick auf die Zahlen

Seit 1. April 2025 haben wir:

Diese Zahlen geben uns einen komfortablen Puffer, um die neuen Ziele bereits vor den anstehenden Redundanz-Upgrades zu erreichen.


Vielen Dank

Zuverlässigkeit ist kein Schalter, den man umlegt—sie ist die kumulative Wirkung von Design-Reviews, Testabdeckung, Observability und einer Crew, der es wichtig ist. Ihre Fehlerberichte und Feature-Vorschläge haben uns dazu gebracht, die Messlatte zu erhöhen. Weiterhin Feedback erwünscht — auf weniger Pager, grünere Betriebsabläufe und eine zusätzliche Neun.