Schulungsübersicht
SRE-Anti-Patterns
- Identifizierung kontraproduktiver Praktiken.
- Erkennen der Auswirkungen von Anti-Patterns auf die Zuverlässigkeit.
- Bewährte Verfahren und korrigierende Alternativen.
SLO als Stellvertreter für Kundenzufriedenheit
- Definition von Service Level Indicators (SLIs) und Service Level Objectives (SLOs).
- Verwaltung von Error Budgets und Ausgleich zwischen Innovation und Zuverlässigkeit.
- Verständnis der Grenzen verteilter Systeme.
Aufbau sicherer und zuverlässiger Systeme
- Konstruktion fehlertoleranter und resilienter Architekturen.
- Integration von Sicherheit in das Reliability Engineering.
- Strategien für Skalierbarkeit und Datenschutz.
Ganzheitliche Observability
- Instrumentierung und Metrikenerfassung.
- Verteilte Nachverfolgung (Distributed Tracing) und synthetisches Monitoring.
- Observability-driven Development.
Plattformengineering und AIOps
- Plattformzentrierte Engineering-Ansätze.
- Automatisierung und Orchestrierung im SRE-Bereich.
- Nutzung von DataOps und operationaler Intelligenz.
Incident Management im SRE
- Rollen und Verantwortlichkeiten beim Incident Response.
- Anwendung von Frameworks wie OODA.
- Automatisierte Behebung und KI-/ML-unterstützte Auflösung.
Chaos Engineering
- Prinzipien und Strategien für Resilienztests.
- Planung und Durchführung von „Game Day“-Übungen.
- Lernen aus kontrollierten Ausfallexperimenten.
SRE als reine Form von DevOps
- Integration von SRE in DevOps-Arbeitsabläufe.
- Kulturelle Ausrichtung und Zusammenarbeit.
- Anstoss der organisationalen Transformation durch SRE.
Übungen nach dem Kurs
- Fallstudien zur Architektur grossskaliger Systeme.
- Fortgeschrittene Instrumentierungs- und Monitoring-Szenarien.
- Lösung realistischer Zuverlässigkeitsprobleme.
Zusammenfassung und Prüfungsvorbereitung
- Letzte Durchsicht des Lehrplans für die DevOps Institute SRE Practitioner-Zertifizierung.
- Beispielfragen und Übungstests.
- Strategien und Empfehlungen für die Prüfungsabwicklung.
Zusammenfassung und weitere Schritte
Voraussetzungen
- Grundlegendes Verständnis der Kernprinzipien des Site Reliability Engineering.
- Erfahrung mit DevOps-Praktiken und den entsprechenden Tools.
- Vertrautheit mit Systemüberwachung, Incident Management und Automatisierung.
Zielgruppe
- SRE-Fachkräfte, die die DevOps Institute SRE Practitioner-Zertifizierung anstreben.
- DevOps-Ingenieure, die sich in zuverlässigkeitsorientierte Rollen weiterentwickeln möchten.
- Führungskräfte im Operationsbereich, die für die Strategie und Umsetzung von Zuverlässigkeitsmassnahmen verantwortlich sind.
Erfahrungsberichte (2)
Craig war extrem engagiert im Training und hat stets darauf geachtet, dass wir aufmerksam sind. Er passte die Beispiele an unsere täglichen Aktivitäten an und gab immer eine Antwort, wenn danach gefragt wurde, auch wenn die Information nicht im Präsentationsmaterial enthalten war.
Ecaterina Ioana Nicoale - BOOKING HOLDINGS ROMANIA SRL
Kurs - DevOps Foundation®
Maschinelle Übersetzung
Hoher Einsatz und Fachwissen des Trainers
Jacek - Softsystem
Kurs - DevOps Engineering Foundation (DOEF)®
Maschinelle Übersetzung