Schulungsübersicht

Einführung

  • Graphdatenbanken und Bibliotheken

Verständnis von Graphdaten

  • Der Graph als Datenstruktur
  • Verwendung von Eckpunkten (Punkten) und Kanten (Linien) zur Modellierung realer Szenarien

Verwendung von Graphen Database zur Modellierung, Persistenz und Verarbeitung von Graphdaten

  • Lokale Graphenalgorithmen/Traversalen
  • neo4j, OrientDB und Titan

Übung: Modellierung von Graphdaten mit neo4j

  • Whiteboard Datenmodellierung

Jenseits des Graphen Databases: Graph Computing

  • Verstehen des Eigenschaftsgraphen
  • Graphmodellierung verschiedener Szenarien (Softwaregraph, Diskussionsgraph, Konzeptgraph)

Lösen von Problemen der realen Welt mit Traversalen

  • Algorithmische/gerichtete Wanderung über den Graphen
  • Ermitteln von zirkulären Abhängigkeiten

Fallstudie: Ranking von Diskussionsbeiträgen

  • Ranking nach Anzahl und Tiefe der Diskussionsbeiträge
  • Eine Anmerkung zur Stimmungsanalyse und Konzeptanalyse

Graph Computing: Lokale In-Memory-Graphen-Toolkits

  • Graphenanalyse und -visualisierung
  • JUNG, NetworkX, und iGraph

Übung: Modellierung von Graphdaten mit NetworkX

  • Verwendung von NetworkX zur Modellierung eines komplexen Systems

Graph Computing: Batch-Verarbeitung von Graph-Frameworks

  • Nutzung von Hadoop für Speicherung (HDFS) und Verarbeitung (MapReduce)
  • Überblick über iterative Algorithmen
  • Hama, Giraph und GraphLab

Graph Computing: Graph-Parallele Berechnungen

  • Vereinheitlichung von ETL, explorativer Analyse und iterativer Graphenberechnung in einem einzigen System
  • GraphX

Einrichtung und Installation

  • Hadoop und Spark

GraphX Operatoren

  • Eigenschaft, Struktur, Verknüpfung, Nachbarschaftsaggregation, Zwischenspeicherung und Aufhebung der Zwischenspeicherung

Iteration mit Pregel API

  • Übergabe von Argumenten zum Senden, Empfangen und Berechnen

Erstellen eines Graphen

  • Verwendung von Eckpunkten und Kanten in einem RDD oder auf der Festplatte

Entwerfen von Scalable Algorithmen

  • GraphXOptimierung

Accessing Zusätzliche Algorithmen

  • PageRank, Verbundene Komponenten, Dreieckszählung

Übung: Page Rank und Top User

  • Aufbau und Verarbeitung von Graphdaten mit Textdateien als Eingabe

Einsatz in der Produktion

Abschließende Bemerkungen

Voraussetzungen

  • Verständnis für Java-Programmierung und Frameworks
  • Ein allgemeines Verständnis von Python ist hilfreich, aber nicht erforderlich
  • Ein allgemeines Verständnis von Datenbankkonzepten

Publikum

  • Entwickler
  28 Stunden
 

Teilnehmerzahl


Beginnt

Endet


Die Termine sind abhängig von der Verfügbarkeit und finden zwischen 09:30 und 16:30 statt.
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.

Erfahrungsberichte (2)

Kombinierte Kurse

Verwandte Kategorien