Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Entwurf einer offenen AIOps-Architektur
- Überblick über die Kernkomponenten offener AIOps-Pipelines
- Datenfluss von der Ingestion bis zum Alerting
- Toolvergleiche und Integrationsstrategie
Datenerfassung und -aggregation
- Erfassung von Zeitreihendaten mit Prometheus
- Aufzeichnung von Logs mit Logstash und Beats
- Normalisierung der Daten zur quellenübergreifenden Korrelation
Aufbau von Observability-Dashboards
- Visualisierung von Metriken mit Grafana
- Erstellung von Kibana-Dashboards für Loganalysen
- Nutzung von Elasticsearch-Abfragen zur Gewinnung von Betriebseinblicken
Anomalieerkennung und Incident-Vorhersage
- Exportieren von Observability-Daten an Python-Pipelines
- Trainieren von ML-Modellen zur Erkennung von Ausreissern und Prognosen
- Bereitstellen der Modelle für Live-Inferenz in der Observability-Pipeline
Alerting und Automatisierung mit Open-Source-Tools
- Erstellen von Prometheus-Alert-Regeln und Konfiguration des Alertmanager-Routings
- Auslösen von Skripten oder API-Workflows zur automatischen Reaktion
- Einsatz von Open-Source-Orchestrierungstools (z. B. Ansible, Rundeck)
Aspekte der Integration und Skalierbarkeit
- Bewältigung hochvolumiger Ingestion und langfristiger Speicherung
- Sicherheit und Zugriffssteuerung in Open-Source-Stacks
- Unabhängiges Skalieren jeder Schicht: Ingestion, Verarbeitung, Alerting
Praxisanwendungen und Erweiterungsmöglichkeiten
- Fallstudien: Performance-Tuning, Ausfallvermeidung und Kostenoptimierung
- Erweiterung der Pipelines durch Tracing-Tools oder Service Graphs
- Best Practices für Betrieb und Wartung von AIOps in Produktion
Zusammenfassung und nächste Schritte
Voraussetzungen
- Erfahrung mit Observability-Tools wie Prometheus oder ELK
- Gute Kenntnisse in Python und Grundlagen des maschinellen Lernens
- Verständnis von IT-Betrieb und Alerting-Arbeitsabläufen
Zielgruppe
- Erfahrene Site Reliability Engineers (SREs)
- Data Engineerinnen und Data Engineer im Operativen Einsatz
- DevOps-Plattformleitungsen und Infrastrukturarchitektinnen/Architekten
14 Stunden