Schulungsübersicht

Einführung

Überblick über Spark Streaming Funktionen und Architektur

  • Unterstützte Datenquellen
  • Kern-APIs

Vorbereiten der Umgebung

  • Abhängigkeiten
  • Spark- und Streaming-Kontext
  • Verbinden mit Kafka

Verarbeiten von Nachrichten

  • Parsen eingehender Nachrichten als JSON
  • ETL-Prozesse
  • Starten des Streaming-Kontextes

Durchführen eines Windowed Stream Processing

  • Dia-Intervall
  • Konfiguration der Checkpoint-Zustellung
  • Starten der Umgebung

Prototyping des Verarbeitungscodes

  • Verbinden mit einem Kafka-Thema
  • Abrufen von JSON aus der Datenquelle mit Paw
  • Variationen und zusätzliche Verarbeitung

Streaming des Codes

  • Variablen zur Auftragssteuerung
  • Definieren von Werten, die übereinstimmen sollen
  • Funktionen und Bedingungen

Erfassen der Stream-Ausgabe

  • Zähler
  • Kafka-Ausgabe (übereinstimmend und nicht übereinstimmend)

Fehlersuche

Zusammenfassung und Schlussfolgerung

Voraussetzungen

  • Erfahrung mit Python und Apache Kafka
  • Vertrautheit mit Stream-Processing-Plattformen

Zielgruppe

  • Dateningenieure
  • Datenwissenschaftler
  • Programmierer
 7 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (5)

Kommende Kurse

Verwandte Kategorien