Kontakt aufnehmen

Schulungsübersicht

Einführung in AIOps mit Open-Source-Tools

  • Überblick über AIOps-Konzepte und deren Vorteile
  • Prometheus und Grafana im Observability-Stack
  • Die Rolle von ML in AIOps: prädiktive vs. reaktive Analysen

Einrichtung von Prometheus und Grafana

  • Installation und Konfiguration von Prometheus zur Erfassung von Zeitreihendaten
  • Erstellung von Dashboards in Grafana mit Echtzeitmetriken
  • Erkundung von Exporters, Relabeling und Service Discovery

Datenbereinigung für ML

  • Extraktion und Transformation von Prometheus-Metriken
  • Vorbereitung von Datensätzen für die Anomalieerkennung und Prognose
  • Verwendung von Grafana-Transformationen oder Python-Pipelines

Anwendung von ML für die Anomalieerkennung

  • Einfache ML-Modelle zur Erkennung von Ausreißern (z. B. Isolation Forest, One-Class SVM)
  • Schulung und Bewertung der Modelle auf Zeitreihendaten
  • Visualisierung von Anomalien in Grafana-Dashboards

Prognose von Metriken mit ML

  • Erstellung einfacher Prognosemodelle (ARIMA, Prophet, Einführung in LSTM)
  • Vorhersage der Systemauslastung oder Ressourcennutzung
  • Verwendung von Prognosen für frühe Warnungen und Skalierungsentscheidungen

Integration von ML mit Alerting und Automatisierung

  • Definition von Alert-Regeln basierend auf ML-Ausgaben oder Schwellenwerten
  • Verwendung von Alertmanager und Benachrichtigungs-Routing
  • Auslösen von Skripten oder Automatisierungsworkflows bei Anomalieerkennung

Skalierung und Einsatz von AIOps im produktiven Betrieb

  • Integration externer Observability-Tools (z. B. ELK-Stack, Moogsoft, Dynatrace)
  • Einsatz von ML-Modellen in Observability-Pipelines
  • Best Practices für AIOps im grossen Umfang (Scale-Out)

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Verständnis von Systemmonitoring- und Observability-Konzepten
  • Erfahrung mit Grafana oder Prometheus
  • Vertrautheit mit Python und grundlegenden Prinzipien des maschinellen Lernens

Zielgruppe

  • Observability-Ingenieure
  • Infrastruktur- und DevOps-Teams
  • Architekten von Monitoringplattformen und Site Reliability Engineers (SREs)
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien