Schulungsübersicht

Einführung in AIOps mit Open-Source-Werkzeugen

  • Überblick über Konzepte und Vorteile von AIOps
  • Prometheus und Grafana im Observability-Stack
  • Anwendungsbereiche der ML in AIOps: Vorhersageanalyse vs. Reaktive Analyse

Einrichten von Prometheus und Grafana

  • Installieren und Konfigurieren von Prometheus für die Sammlung von Zeitreihendaten
  • Erstellen von Dashboards in Grafana mit Echtzeitmetriken
  • Explorieren von Exportern, Relabeling und Dienstentdeckung

Datenvorbereitung für ML

  • Auslesen und Transformieren der Prometheus-Metriken
  • Vorbereiten von Datensätzen zur Ausreißerkennung und Vorhersage
  • Verwenden der Transformationen in Grafana oder Python-Pipelines

Anwendung von Machine Learning für die Ausreißerkennung

  • Basierte ML-Modelle zur Erkennung von Ausreißern (z.B. Isolation Forest, One-Class SVM)
  • Training und Evaluierung von Modellen anhand von Zeitreihendaten
  • Vorisualisieren von Ausreißern in den Grafana-Dashboards

Forecasting-Metriken mit ML

  • Aufbau einfacher Vorhersagemodelle (ARIMA, Prophet, LSTM-Einführung)
  • Vorhersage der Systemlast oder Ressourcenverwendung
  • Nutzung von Vorhersagen für frühzeitige Warnungen und Skalierungszusammenhänge

Integrieren von ML mit Warnungen und Automatisierung

  • Festlegen von Warnregeln auf Basis der ML-Ausgabe oder Schwellenwerte
  • Nutzung des Alertmanagers und Notification Routing
  • Auslösen von Skripten oder Automatisierungsworkflows bei Ausreißerkennungen

Skalieren und Betriebsaufbau von AIOps

  • Integrieren externer Observability-Tools (z.B. ELK-Stack, Moogsoft, Dynatrace)
  • Betriebsfähigung der ML-Modelle in den Observability-Pipelines
  • Beste Praktiken für AIOps auf großem Umfang

Zusammenfassung und Nächste Schritte

Voraussetzungen

  • Eine Grundverständnis von Systemmonitoring und Observability-Konzepten
  • Erfahrung mit Grafana oder Prometheus
  • Kenntnisse in Python und grundlegenden maschinellem Lernprinzipien

Zielgruppe

  • Observability-Ingenieure
  • Infrastruktur- und DevOps-Teams
  • Architekten von Monitoring-Plattformen und Site Reliability Engineers (SREs)
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Kommende Kurse

Verwandte Kategorien