Startseite
Big Data Schulungen
Hadoop Schulungen
Administratorschulung für Apache Hadoop Schulung

Administratorschulung für Apache Hadoop Schulung

Zielgruppe:

Der Kurs richtet sich an IT-Spezialisten, die nach einer Lösung suchen, um große Datensätze in einer verteilten Systemumgebung zu speichern und zu verarbeiten.

GoVoraussetzungen:

Tiefes Wissen über die Verwaltung von Hadoop-Clustern.

Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.

Schulungsübersicht

1: HDFS (17%)

Beschreiben Sie die Funktion der HDFS Daemons
Beschreiben Sie den normalen Betrieb einer Apache Hadoop Cluster, sowohl bei Daten speichern als auch bei Daten verarbeiten.
Identifizieren Sie aktuelle Merkmale von Rechnersystemen, die ein System wie Apache Hadoop motivieren.
Klassifizieren Sie die Hauptziele der HDFS Design
Gegeben eine Situation, identifizieren Sie den passenden Anwendungsbereich für HDFS Federation
Identifizieren Sie Komponenten und Daemon eines HDFS HA-Quorum Clusters
Analyisieren Sie die Rolle der HDFS Sicherheit (Kerberos)
Bestimmen Sie die beste Datenserialisierungsoption für eine gegebene Situation
Beschreiben Sie den Pfad zur Dateilese- und Schreiboperationen
Identifizieren Sie die Befehle zum Manipulieren von Dateien im Hadoop File System Shell

2: YARN und MapReduce Version 2 (MRv2) (17%)

Verstehen Sie, wie die Aktualisierung eines Clusters von Hadoop 1 zu Hadoop 2 die Cluster-Einstellungen beeinflusst
Verstehen Sie, wie MapReduce v2 (MRv2 / YARN) bereitgestellt wird, einschließlich aller YARN Daemons
Verstehen Sie die grundlegende Designstrategie für MapReduce v2 (MRv2)
Bestimmen Sie, wie YARN Ressourcen zuweist
Identifizieren Sie den Ablauf eines MapReduce Jobs auf YARN
Bestimmen Sie, welche Dateien geändert werden müssen und wie, um einen Cluster von MapReduce Version 1 (MRv1) zu MapReduce Version 2 (MRv2) auf YARN zu migrieren.

3: Hadoop Cluster Planung (16%)

Hauptpunkte zu berücksichtigen beim Wahl von Hardware und Betriebssysteme für die Hosting eines Apache Hadoop Clusters.
Analysieren Sie die Auswahlmöglichkeiten bei der Betriebssystemauswahl
Verstehen Sie Kernel-Optimierung und Festplattenaustausch
Gegeben eine Situation und ein Arbeitsmuster, identifizieren Sie eine passende Hardware-Konfiguration für die Situation
Gegeben eine Situation, bestimmen Sie die Komponenten des Ökosystems, die Ihr Cluster benötigen um die SLA zu erfüllen
Clusterskalierung: gegeben eine Situation und Häufigkeit der Ausführung, identifizieren Sie die spezifischen Anforderungen für den Arbeitslasten, einschließlich CPU, Speicher, Speicherplatz, Festplatten I/O
Festplattengröße und -Konfiguration, einschließlich JBOD gegen RAID, SANs, Virtualisierung und Festplattengrößenanforderungen in einem Cluster
Netztopologien: Verstehen Sie die Netzwerkverwendung in Hadoop (für sowohl HDFS als auch MapReduce) und schlagen oder identifizieren Sie wichtige Komponenten der Netzwerkdesign für eine gegebene Situation vor

4: Hadoop Cluster Installation und Verwaltung (25%)

Gegeben eine Situation, identifizieren Sie, wie der Cluster Festplatten- und Maschinenschäden behandelt
Analysieren Sie die Konfiguration des Loggings und die Dateiformate der Logging-Konfiguration
Verstehen Sie die Grundlagen von Hadoop Metriken und Cluster-Gesundheitsüberwachung
Identifizieren Sie die Funktionen und Zwecke der verfügbaren Tools zur Überwachung des Clusters
Installieren Sie alle Komponenten des Ökosystems in CDH 5, einschließlich (aber nicht beschränkt auf): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive und Pig
Identifizieren Sie die Funktionen und Zwecke der verfügbaren Tools zur Verwaltung des Apache Hadoop Dateisystems

5: RessourcenManagement (10%)

Verstehen Sie die übergeordneten Designziele jedes Hadoop-Scheduler
Gegeben eine Situation, bestimmen Sie, wie der FIFO Scheduler Ressourcen des Clusters zuweist
Gegeben eine Situation, bestimmen Sie, wie der Fair Scheduler Ressourcen unter YARN zuweist
Gegeben eine Situation, bestimmen Sie, wie der Capacity Scheduler Ressourcen des Clusters zuweist

6: Überwachung und Logging (15%)

Verstehen Sie die Funktionen und Merkmale der Metrik-Sammlungs-Verfahren von Hadoop
Analysieren Sie die NameNode und JobTracker Web UIs
Verstehen Sie, wie Cluster-Daemons überwacht werden
Identifizieren und überwachen Sie den CPU-Aufwand auf Master-Knoten
Beschreiben Sie die Überwachung von Auslagerungs- und Speicherallokation auf allen Knoten
Identifizieren Sie, wie Sie Hadoop-Logfiles ansehen und verwalten können
Interpretieren Sie eine Logdatei

Voraussetzungen

Grundlegende Administrationsfähigkeiten Linux
Grundlegende Programmierkenntnisse

35 Stunden

Teilnehmerzahl

(Online)

Klassenzimmer

Schulungsort auswählen

Bitte wählen Sie einen Veranstaltungsort

Preis je Teilnehmer (exkl. USt)

Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Administratorschulung für Apache Hadoop Schulung - Buchung

Vollständiger Name *

E-Mail *

Telefon *

Job Titel

Firmenname

Adresse 1 *

Stadt *

Bundesland / Region

Land *

Postleitzahl *

Starttermin

Steuer-ID

Die Termine unterliegen der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.

Zahlung *

Banküberweisung (Rechnung, Bestellung)

Debit / Kredit Karte

Kommentare

Allgemeine Geschäftsbedingungen *

Ich bin ein bevollmächtigter Vertreter des oben genannten Kunden und möchte die oben genannten Kurse oder Dienstleistungen in Übereinstimmung mit den Allgemeinen Geschäftsbedingungen und der Datenschutzrichtlinie von NobleProg buchen.

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Administratorschulung für Apache Hadoop Schulung - Anfrage

Vollständiger Name *

E-Mail *

Telefon *

Teilnehmerzahl

Firmenname

Firmenadresse

Wie möchten Sie den Kurs absolvieren?

Geschäftsräume des Kunden

Online

Schulungsraum

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Administratorschulung für Apache Hadoop - Beratungsanfrage

Vollständiger Name *

Telefon *

E-Mail *

Firmenname

Thema der Beratung *

Ziel der Beratung

Mit wem wird der Berater zusammenarbeiten?

Dringlichkeit der Beratung *

Kommentare

Informieren Sie mich über Rabatte und Sonderangebote

Bitte lesen Sie unsere Datenschutzerklärung , um zu erfahren, wie wir Ihre Daten verwenden.

Erfahrungsberichte (3)

8680 CHF (Online)

9930 CHF (Schulungsraum)

Kombinierte Kurse

Fortgeschrittenes R

14 Stunden

Diese vom Dozenten geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an R-Anwender mit mittlerem Erfahrungslevel im Bereich Advanced R, die R nutzen möchten, um schnellere Arbeitsabläufe zu gestalten, die Codequalität zu verbessern und komplexere Analyseaufgaben zu bewältigen.

Bis zum Ende dieser Schulung werden die Teilnehmer in der Lage sein: wiederverwendbare Funktionen zu erstellen, Datenabläufe zu verbessern, Code zu debuggen und zu optimieren sowie reproduzierbare Berichte zu erstellen.

Mehr Informationen...

Algorithmisches Handeln mit Python und R

14 Stunden

Diese leitungsgeleitete Live-Training in Schweiz (online oder vor Ort) richtet sich an Business-Analysten, die Handel durch algorithmisches Handeln, Python und R automatisieren möchten.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Algorithmen einzusetzen, um Wertpapiere in spezialisierten Intervallen schnell zu kaufen und zu verkaufen.
Kosten im Zusammenhang mit dem Handel durch algorithmisches Handeln zu reduzieren.
Aktienkurse automatisch zu überwachen und Handelsaufträge zu platzieren.

Mehr Informationen...

Programming mit Big Data in R

21 Stunden

Big Data ist ein Begriff, der sich auf Lösungen zur Speicherung und Verarbeitung großer Datensätze bezieht. Ursprünglich von Google entwickelt, haben diese Big Data-Lösungen sich weiterentwickelt und andere ähnliche Projekte inspiriert, viele davon sind als Open-Source verfügbar. R ist eine weit verbreitete Programmiersprache in der Finanzbranche.

Mehr Informationen...

Einführung in R (Grundlagen bis fortgeschritten)

14 Stunden

Dieser von einem Dozenten geleitete, lebendige Training in Schweiz (online oder vor Ort) richtet sich an Anfänger-Datenanalysten, die R-Programmierung zur Datenmanipulation, grundlegenden Datenanalyse und erstellen überzeugender Visualisierungen für Einblicke nutzen möchten.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Die Grundlagen von R-Programmierung zu verstehen.
Fundamentale Datenwissenschaftsprozesse anzuwenden.
Visuelle Darstellungen von Daten zu erstellen.

Mehr Informationen...

R-Grundlagen

21 Stunden

R ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R hat auch Anhänger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Programmierkenntnisse gefunden, die es einfach finden, es zu benutzen. Seine Popularität ist auf den zunehmenden Einsatz von Data Mining für verschiedene Zwecke zurückzuführen, z. B. die Festlegung von Anzeigenpreisen, die schnellere Suche nach neuen Arzneimitteln oder die Feinabstimmung von Finanzmodellen. R bietet eine Vielzahl von Paketen für das Data Mining.

Mehr Informationen...

Clusteranalyse mit R und SAS

14 Stunden

Diese von einem Dozenten geleitete Live-Training in Schweiz (online oder vor Ort) richtet sich an Datenanalysten, die mit R in SAS programmieren möchten, um Clusteranalysen durchzuführen.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Clusteranalyse für Data Mining zu verwenden
Die R-Syntax für Clustering-Lösungen zu beherrschen.
Hierarchische und nicht-hierarchische Clusterverfahren umzusetzen.
Datengetriebene Entscheidungen zu treffen, um die Geschäftsvorgänge zu verbessern.

Mehr Informationen...

Data und Analytics - von Grund auf

42 Stunden

Data analytics ist ein entscheidendes Werkzeug im heutigen Geschäftsumfeld. Wir konzentrieren uns darauf, praktische Fähigkeiten zur datenbasierten Analyse zu entwickeln. Das Ziel ist es, den Teilnehmern dabei zu helfen, beispielsweise nachgewiesene Antworten auf folgende Fragen zu geben:

Was ist geschehen?

Verarbeitung und Analyse von Daten
Erstellung informativer Datendarstellungen

Was wird geschehen?

Prognose zukünftiger Leistungen
Bewertung von Prognosen

Was sollte geschehen?

Umwandlung von Daten in beispielsbasierte Geschäftsentscheidungen
Optimierung von Prozessen

Mehr Informationen...

Datenanalyse mit Python, R, Power Query und Power BI

21 Stunden

Diese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Einsteiger, die mit diesen Tools Daten bereinigen und analysieren, statistische Hochrechnungen durchführen und aufschlussreiche Visualisierungen erstellen möchten.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:

Die Grundlagen von Python, R, Power Query und Power BI für die Datenanalyse zu verstehen.
Bereinigung und Organisation von Datensätzen mit Python und Power Query.
Statistische Analysen und Hochrechnungen mit R durchführen.
Erstellen von professionellen Dashboards und Berichten mit Power BI.
Effektive Integration und Analyse von Daten aus verschiedenen Quellen.

Mehr Informationen...

Datenanalyse mit R

21 Stunden

R ist eine sehr beliebte, Open-Source-Umgebung für statistische Berechnungen, Datenanalyse und Grafiken. Dieser Kurs führt Studenten in die R-Programmiersprache ein. Er behandelt Sprachgrundlagen, Bibliotheken und fortgeschrittene Konzepte. Fortgeschrittene Datenanalyse und Visualisierung mit realen Daten.

Zielgruppe

Entwickler / Datenanalysten

Dauer

3 Tage

Format

Vorlesungen und praktische Übungen

Mehr Informationen...

Econometrics: Eviews und Risk Simulator

21 Stunden

Dieses von einem Trainer geleitete, live-Training in Schweiz (online oder vor Ort) richtet sich an alle, die das Grundwissen der ökonometrischen Analyse und Modellierung erlernen und meistern möchten.

Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:

Das Grundwissen der Ökonometrie zu erlernen und zu verstehen.
Eviews und Risikosimulatoren zu nutzen.

Mehr Informationen...

Prognosen mit R

14 Stunden

Diese von einem Trainer durchgeführte Live-Ausbildung in Schweiz (online oder vor Ort) richtet sich an fortgeschrittene Datenanalytiker und Geschäftsanalysten, die Zeitreihenvorhersagen durchführen und Prozesse der Datenauswertung mit R automatisieren möchten.

Am Ende dieser Ausbildung werden die Teilnehmer in der Lage sein:

Grundlagen der Vorhersageverfahren in R zu verstehen.
Exponentielles Glätten und ARIMA-Modelle für Zeitreihenanalyse anzuwenden.
Das Paket ‘forecast’ zur Generierung genauer Vorhersagemodelle zu nutzen.
Vorhersageprozesse für Geschäftsanwendungen und Forschung automatisieren.

Mehr Informationen...

HR-Analytik für öffentliche Organisationen

14 Stunden

Dieser von einem Trainer geleitete Live-Kurs (online oder vor Ort) richtet sich an HR-Professionals, die analytische Methoden einsetzen möchten, um die Organisationsleistung zu verbessern. Der Kurs deckt qualitative und quantitative sowie empirische und statistische Ansätze ab.

Format des Kurses

Interaktive Vorlesung und Diskussion.
Viel Übungsmaterial und Praxis.

Anpassungsoptionen des Kurses

Wenn Sie eine angepasste Ausbildung zu diesem Kurs wünschen, kontaktieren Sie uns bitte für die Abwicklung.

Mehr Informationen...

Marktprognose

14 Stunden

Zielgruppe

Dieser Kurs richtet sich an Analysten und Prognostiker, die Prognosen einführen oder verbessern wollen, z. B. in den Bereichen Absatzprognose, Wirtschaftsprognose, Technologieprognose, Lieferkettenmanagement und Nachfrage- oder Angebotsprognose.

Beschreibung

Dieser Kurs führt die Teilnehmer durch eine Reihe von Methoden, Rahmenwerken und Algorithmen, die bei der Entscheidung, wie die Zukunft auf der Grundlage historischer Daten vorhergesagt werden kann, nützlich sind.

Es werden Standardwerkzeuge wie Microsoft Excel oder einige Open-Source-Programme (insbesondere das R-Projekt) verwendet.

Die in diesem Kurs behandelten Prinzipien können mit jeder Software implementiert werden (z.B. SAS, SPSS, Statistica, MINITAB ...)

Mehr Informationen...

Statistische Analyse mit SPSS

21 Stunden

Diese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und Fortgeschrittene, die statistische Analysen mit SPSS durchführen möchten, um Daten genau zu interpretieren, komplexe statistische Tests durchzuführen und aussagekräftige Erkenntnisse zu gewinnen.

Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:

Die SPSS-Oberfläche zu navigieren und Datensätze effizient zu verwalten.
Deskriptive und inferentielle statistische Analysen durchzuführen.
t-Tests, ANOVA, MANOVA, Regressions- und Korrelationsanalysen durchzuführen.
Nicht-parametrische Tests, Hauptkomponentenanalyse und Faktorenanalyse zur erweiterten Dateninterpretation anzuwenden.

Mehr Informationen...

Einführung in die Datenvisualisierung mit Tidyverse und R

7 Stunden

Zielgruppe

Kursformat

Am Ende des Trainings werden die Teilnehmer in der Lage sein:

In diesem unterrichteten und live durchgeführten Kurs lernen die Teilnehmer, wie man Daten mit den Tools aus dem Tidyverse manipuliert und visualisiert.

Der Tidyverse ist eine Sammlung vielseitiger R-Pakete zur Bereinigung, Verarbeitung, Modellierung und Visualisierung von Daten. Einige der enthaltenen Pakete sind: ggplot2, dplyr, tidyr, readr, purrr und tibble.

Anfänger in der R-Sprache
Anfänger im Bereich Datenanalyse und Datavisualisierung

Teil Vorlesung, teil Diskussion, Übungen und intensives Praktikum

Datenanalyse durchführen und ansprechende Visualisierungen erstellen
Nützliche Schlussfolgerungen aus verschiedenen Datensätzen von Beispieldaten ziehen
Daten filtern, sortieren und zusammenfassen, um forschungsorientierte Fragen zu beantworten
Verarbeitete Daten in informatische Linien-, Balken- und Histogramme umwandeln
Daten aus diversen Datensources importieren und filtern, einschließlich Excel, CSV und SPSS-Dateien

Mehr Informationen...

Administratorschulung für Apache Hadoop Schulung

Zielgruppe:

GoVoraussetzungen:

Schulungsübersicht

1: HDFS (17%)

2: YARN und MapReduce Version 2 (MRv2) (17%)

3: Hadoop Cluster Planung (16%)

4: Hadoop Cluster Installation und Verwaltung (25%)

5: RessourcenManagement (10%)

6: Überwachung und Logging (15%)

Voraussetzungen

Erfahrungsberichte (3)

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Kommende Kurse

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Administratorschulung für Apache Hadoop

Verwandte Kategorien

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites