Schulungsübersicht

Big Data Überblick:

  • Was ist Big Data
  • Warum Big Data an Popularität gewinnt
  • Big Data Fallstudien
  • Big Data Merkmale
  • Lösungen für die Arbeit an Big Data.

Hadoop und seine Komponenten:

  • Was ist Hadoop und was sind seine Komponenten.
  • Hadoop Architektur und die Eigenschaften der Daten, die es verarbeiten kann.
  • Kurzer Überblick über die Geschichte von Hadoop, Unternehmen, die es verwenden und warum sie damit begonnen haben, es zu verwenden.
  • Hadoop Rahmenwerk und seine Komponenten - im Detail erklärt.
  • Was ist HDFS und Lese- und Schreibvorgänge in Hadoop Distributed File System.
  • Wie man einen Hadoop Cluster in verschiedenen Modi einrichtet - Stand-Alone/Pseudo/Multi Node Cluster.

(Dies beinhaltet das Einrichten eines Hadoop Clusters in VirtualBox/KVM/VMware, Netzwerkkonfigurationen, die sorgfältig geprüft werden müssen, das Ausführen von Hadoop Daemons und das Testen des Clusters).

  • Was ist Map Reduce Frame Work und wie funktioniert es.
  • Ausführen von Map-Reduce-Aufträgen auf einem Hadoop-Cluster.
  • Verstehen von Replikation, Spiegelung und Rack Awareness im Kontext von Hadoop Clustern.

Hadoop Cluster-Planung:

  • Wie Sie Ihren Hadoop-Cluster planen.
  • Verstehen von Hardware und Software zur Planung eines Hadoop-Clusters.
  • Verstehen von Workloads und Planung von Clustern, um Ausfälle zu vermeiden und optimale Leistung zu erzielen.

Was ist MapR und warum MapR :

  • Überblick über MapR und seine Architektur.
  • Verstehen und Funktionieren von MapR Control System, MapR Volumes, Snapshots und Mirrors.
  • Planung eines Clusters im Kontext von MapR.
  • Vergleich von MapR mit anderen Distributionen und Apache Hadoop.
  • MapR-Installation und Cluster-Bereitstellung.

Cluster Einrichtung & Verwaltung:

  • Verwaltung von Diensten, Knoten, Snapshots, Mirror Volumes und Remote Clustern.
  • Verstehen und Verwalten von Nodes.
  • Verstehen von Hadoop-Komponenten, Installieren von Hadoop-Komponenten neben MapR-Diensten.
  • Accessing Data on cluster including via NFS Verwalten von Services & Nodes.
  • Verwalten von Daten mit Hilfe von Volumes, Verwalten von Benutzern und Gruppen, Verwalten und Zuweisen von Rollen zu Nodes, Inbetriebnahme und Außerbetriebnahme von Nodes, Cluster-Administration und Leistungsüberwachung, Konfigurieren/Analysieren und Überwachen von Metriken zur Leistungsüberwachung, Konfigurieren und Verwalten von MapR-Sicherheit.
  • Verstehen und Arbeiten mit M7- Native Storage für MapR Tabellen.
  • Cluster-Konfiguration und -Tuning für optimale Leistung.

Cluster-Upgrade und Integration mit anderen Setups:

  • Upgrade der Softwareversion von MapR und Arten von Upgrades.
  • Konfigurieren des MapR-Clusters für den Zugriff auf den HDFS-Cluster.
  • Einrichten von MapR-Clustern auf Amazon Elastic Mapreduce.

Alle oben genannten Themen beinhalten Demonstrationen und Übungseinheiten, damit die Teilnehmer praktische Erfahrungen mit der Technologie sammeln können.

Voraussetzungen

  • Grundkenntnisse in Linux FS
  • Grundkenntnisse in Java
  • Kenntnisse von Apache Hadoop (empfohlen)
  28 Stunden
 

Teilnehmerzahl


Beginnt

Endet


Die Termine sind abhängig von der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Erfahrungsberichte (1)

Kombinierte Kurse

Verwandte Kategorien