Schulungsübersicht

Einführung in Big Data Ecosystems

  • Überblick über Big-Data-Technologien und -Architekturen
  • Batchverarbeitung im Vergleich zur Echtzeiterfassung
  • Datenhaltungsstrategien für Skalierbarkeit

Erweiterte Datenverarbeitung mit Apache Spark

  • Optimierung von Spark-Jobs zur Leistungssteigerung
  • Erfahrenere Transformationen und Aktionen
  • Arbeiten mit strukturierten Streams

Machine Learning in großem Maßstab

  • Distributed Modellierungstechniken für das Training
  • Hyperparameter-Tuning auf großen Datensätzen
  • Modellanwendung in Umgebungen mit großer Datenmenge

Deep Learning für Big Data

  • Verschmelzung von TensorFlow und PyTorch mit Spark
  • Distributed Deep-Learning-Trainingspipelines
  • Anwendungsbeispiele in der Bild-, Text- und Zeitreihenanalyse

Echtzeit-Analytics und Datenstreaming

  • Apache Kafka zur Einfangung von Streaming-Daten
  • Frameworks für Streamverarbeitung
  • Überwachung und Warnsysteme in Echtzeitsystemen

Data Governance, Sicherheit und Ethik

  • Datenschutz und Anforderungen an die Einhaltung gesetzlicher Vorschriften
  • Access-Steuerung und Verschlüsselung in Systemen mit großer Datenmenge
  • Ethische Überlegungen bei der Analyse von großen Datensätzen

Integration von Big Data mit Business Intelligence

  • Datenvisualisierung und Dashboards für große Mengen an Daten
  • Verschmelzung großer Datenaufbereitungsprozesse mit BI-Tools
  • Erreichung von Geschäftsergebnissen durch erweiterte Analytiken

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Feste Verständnis von Datenanalyse und statistischen Modellierungskonzepten
  • Erfahrung mit Datenauswertungstools und Programmiersprachen wie Python, R oder Scala
  • Bekanntschaft mit verteilten Rechenframeworks wie Hadoop oder Spark

Zielgruppe

  • Datenscientisten, die sich auf das Beherrschen der großen Datenverarbeitung und vorausschauenden Analyse konzentrieren möchten
  • Senioranalysten, die erweiterte analytische Workflows designen und umsetzen wollen
  • F&E-Professionelle, die auf innovativen datengesteuerten Lösungen fokussiert sind
 42 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (5)

Kommende Kurse

Verwandte Kategorien