Schulungsübersicht

Einführung in die Überwachung großer Umgebungen

  • Herausforderungen der Überwachung in hochfrequenten Umgebungen
  • Skalierungsstrategien für Prometheus und Grafana
  • Architekturüberlegungen für verteilte Systeme

Skalierung von Prometheus

  • Einrichtung von Prometheus in einer aufgeteilten Umgebung
  • Verwendung der Prometheus-Föderation für groß angelegte Systeme
  • Implementierung von Prometheus-Speicheroptimierungen

Optimierung von Grafana für große Umgebungen

  • Konfiguration von Grafana zur Verarbeitung großer Datensätze
  • Verbesserung der Dashboardleistung und Ladezeiten
  • Best Practices für komplexe Visualisierungen

Verteilte Überwachung mit Prometheus und Grafana

  • Integration von Prometheus mit verteilten Tracing-Tools
  • Überwachung von Microservices in Kubernetes-Umgebungen
  • Fortgeschrittene Alarm- und Benachrichtigungsstrategien

Verwaltung der Hochverfügbarkeit

  • Einrichtung redundanten Prometheus- und Grafana-Instanzen
  • Failover-Strategien für Überwachungssysteme
  • Sicherstellung der Datensicherheit und Verlässlichkeit

Fehlersuche und Debugging

  • Identifizierung und Behebung von Leistungsengpässen
  • Debugging von PromQL-Abfragen und Dashboard-Konfigurationen
  • Häufige Fallstricke bei der Überwachung großer Umgebungen

Fortgeschrittene Integrationen

  • Integration von Prometheus und Grafana mit externen Datenbanken
  • Verwendung von Grafana-Plugins zur Erweiterung der Funktionalität
  • Nutzen von Drittanbieter-Tools für erweiterte Überwachung

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Festes Grundverständnis von Prometheus und Grafana-Grundlagen
  • Erfahrung mit Linux-Systemadministration
  • Vertrautheit mit verteilten Systemarchitekturen

Zielgruppe

  • DevOps-Ingenieure
  • Site Reliability Engineers (SREs)
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien