Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in AIOps mit Open-Source-Tools
- Überblick über AIOps-Konzepte und deren Vorteile
- Prometheus und Grafana im Observability-Stack
- Die Rolle von ML in AIOps: prädiktive vs. reaktive Analysen
Einrichtung von Prometheus und Grafana
- Installation und Konfiguration von Prometheus zur Erfassung von Zeitreihendaten
- Erstellung von Dashboards in Grafana mit Echtzeitmetriken
- Erkundung von Exporters, Relabeling und Service Discovery
Datenbereinigung für ML
- Extraktion und Transformation von Prometheus-Metriken
- Vorbereitung von Datensätzen für die Anomalieerkennung und Prognose
- Verwendung von Grafana-Transformationen oder Python-Pipelines
Anwendung von ML für die Anomalieerkennung
- Einfache ML-Modelle zur Erkennung von Ausreißern (z. B. Isolation Forest, One-Class SVM)
- Schulung und Bewertung der Modelle auf Zeitreihendaten
- Visualisierung von Anomalien in Grafana-Dashboards
Prognose von Metriken mit ML
- Erstellung einfacher Prognosemodelle (ARIMA, Prophet, Einführung in LSTM)
- Vorhersage der Systemauslastung oder Ressourcennutzung
- Verwendung von Prognosen für frühe Warnungen und Skalierungsentscheidungen
Integration von ML mit Alerting und Automatisierung
- Definition von Alert-Regeln basierend auf ML-Ausgaben oder Schwellenwerten
- Verwendung von Alertmanager und Benachrichtigungs-Routing
- Auslösen von Skripten oder Automatisierungsworkflows bei Anomalieerkennung
Skalierung und Einsatz von AIOps im produktiven Betrieb
- Integration externer Observability-Tools (z. B. ELK-Stack, Moogsoft, Dynatrace)
- Einsatz von ML-Modellen in Observability-Pipelines
- Best Practices für AIOps im grossen Umfang (Scale-Out)
Zusammenfassung und nächste Schritte
Voraussetzungen
- Verständnis von Systemmonitoring- und Observability-Konzepten
- Erfahrung mit Grafana oder Prometheus
- Vertrautheit mit Python und grundlegenden Prinzipien des maschinellen Lernens
Zielgruppe
- Observability-Ingenieure
- Infrastruktur- und DevOps-Teams
- Architekten von Monitoringplattformen und Site Reliability Engineers (SREs)
14 Stunden