Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in AIOps
- Was ist AIOps und warum es wichtig ist
- Traditionelle Überwachung vs. observability durch AIOps
- AIOps-Architektur und Schlüsselkomponenten
Sammeln und Normalisieren von Operationsdaten
- Arten von Observability-Daten: Metriken, Logs und Spuren
- Datenbeschaffung aus mehreren Quellen (Server, Container, Cloud)
- Nutzung von Agents und Exportern (Prometheus, Beats, Fluentd)
Datencorrelation und Anomalieerkennung
- Zeitreihenkorrelation und statistische Methoden
- Verwendung von ML-Modellen zur Anomalieerkennung
- Erfassung von Ausfällen in verteilten Systemen
Auswertung und Geräuschreduktion
- Gestaltung intelligent gerichteter Warnregeln und -schwellenwerte
- Unterdrückung, Duplikatsauflösung und Warnungsgruppierung
- Integration mit Alertmanager, Slack, PagerDuty oder Opsgenie
Wurzelursachenanalyse und Visualisierung
- Nutzung von Dashboards zur Visualisierung von Metriken und Trendserkennung
- Aufdecken von Ereignissen und Zeitachsen für Wurzelursachenanalyse (RCA)
- Spurenprobleme über Schichten mit verteilten Spurwerkzeugen
Automatisierung und Beseitigung von Ausfällen
- Auslösen automatischer Skripte oder Workflows aus Ausfällen
- Integration mit ITSM-Systemen (ServiceNow, Jira)
- Anwendungsfälle: Selbstheilung, Skalierung, Traffic-Rerouting
Open Source und kommerzielle AIOps-Plattformen
- Überblick über Tools: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Auswahlkriterien für eine AIOps-Plattform
- Demo und praktische Anwendung einer ausgewählten Stack-Plattform
Zusammenfassung und Nächste Schritte
Voraussetzungen
- Eine Grundkenntnis von IT-Betriebsprozessen und Systemüberwachungskonzepten
- Erfahrung mit Überwachungstools oder -dashboards
- Grundlegendes Verständnis für Log- und Metrikformate
Zielgruppe
- Betriebsmannschaften, die für Infrastruktur und Anwendungen verantwortlich sind
- Site Reliability Engineers (SREs)
- IT-Monitoring- und Observability-Teams
14 Stunden