Schulungsübersicht

  1. Grundlagen von Big Data
    • Big Data und seine Rolle in der Unternehmenswelt
    • Die Phasen der Entwicklung einer Big Data-Strategie innerhalb eines Unternehmens
    • Erläuterung des Grundprinzips eines ganzheitlichen Ansatzes für Big Data
    • Erforderliche Komponenten einer Big Data-Plattform
    • Big Data-Speicherlösung
    • Grenzen der traditionellen Technologien
    • Überblick über die Datenbanktypen
    • Die vier Dimensionen von Big Data
  2. Auswirkungen von Big Data auf das Geschäft
    • Business Bedeutung von Big Data
    • Herausforderungen bei der Extraktion nützlicher Daten
    • Integration von Big Data mit traditionellen Daten
  3. Speichertechnologien für große Daten
    • Überblick über Big-Data-Technologien
      • Modelle zur Datenspeicherung
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Die Wahl der richtigen Big-Data-Technologie
  4. Verarbeitung von Big Data
    • Verbinden und Extrahieren von Daten aus Datenbanken
    • Umwandlung und Vorbereitung von Daten für die Verarbeitung
    • Verwendung von Hadoop MapReduce für die Verarbeitung verteilter Daten
    • Überwachen und Ausführen von Hadoop MapReduce-Aufträgen
    • Hadoop Bausteine eines verteilten Dateisystems
    • Mapreduce und Yarn
    • Verarbeitung von Streaming-Daten mit Spark
  5. Big-Data-Analyse-Tools und -Technologien
    • Programming Hadoop mit der Sprache Pig Latin
    • Abfragen von Big Data mit Hive
    • Mining von Daten mit Mahout
    • Visualisierungs- und Berichtstools
  6. Big Data in der Wirtschaft
    • Verwaltung und Festlegung von Big Data Bedürfnissen
    • Business Bedeutung von Big Data
    • Auswahl der richtigen Big-Data-Tools für das jeweilige Problem

Data Warehousing-Konzepte

  • Was ist Data Ware House?
  • Unterschied zwischen OLTP und Data Ware Housing
  • Datenerfassung
  • Datenextraktion
  • Datenumwandlung.
  • Laden von Daten
  • Daten-Marts
  • Abhängiger vs. unabhängiger Data Mart
  • Datenbank-Design

ETL-Testing-Konzepte:

  • Einführung.
  • Lebenszyklus der Softwareentwicklung.
  • Test-Methodologien.
  • ETL-Prüfung Arbeitsablaufprozess.
  • Zuständigkeiten für ETL-Tests in der Datenphase.

Grundlagen von Big Data

  • Big Data und seine Rolle in der Unternehmenswelt
  • Die Phasen der Entwicklung einer Big Data-Strategie innerhalb eines Unternehmens
  • Erklären Sie die Gründe für einen ganzheitlichen Ansatz für Big Data
  • Erforderliche Komponenten einer Big Data-Plattform
  • Big Data-Speicherlösung
  • Grenzen der traditionellen Technologien
  • Überblick über die Datenbanktypen

NoSQL Databases

Hadoop

Map Reduce

Apache Spark

Voraussetzungen

Die Teilnehmer sollten über Kenntnisse und Erfahrungen im Umgang mit Storage-Tools und großen Datenbeständen verfügen.

  14 Stunden
 

Teilnehmerzahl


Beginnt

Endet


Die Termine sind abhängig von der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.

Preis je Teilnehmer

Erfahrungsberichte (4)

Kombinierte Kurse

Unified Batch and Stream Processing with Apache Beam

  14 Stunden

Verwandte Kategorien