Schulungsübersicht

Einführung

    Die Data Science Prozessrollen und Verantwortlichkeiten eines Datenwissenschaftlers

Vorbereiten der Entwicklungsumgebung

    Bibliotheken, Frameworks, Sprachen und Tools Lokale Entwicklung Kollaborative webbasierte Entwicklung

Datensammlung

    Verschiedene Arten von Daten Strukturierte lokale Datenbanken Datenbankkonnektoren Gängige Formate: xlxs, XML, Json, csv, ...
Unstrukturierte Klicks, Zensoren, Smartphones
  • APIs
  • Internet of Things (IoT)
  • Dokumente, Bilder, Videos, Töne
  • Fallstudie: Kontinuierliches Sammeln großer Mengen unstrukturierter Daten
  • DatenspeicherRelationale Datenbanken Nicht relationale Datenbanken Hadoop: Distributed File System (HDFS) Spark: Resilient Distributed Dataset (RDD) Cloud-Speicher
  • Datenaufbereitung
  • Aufnahme, Auswahl, Bereinigung und Transformation. Sicherstellung der Datenqualität – Korrektheit, Aussagekraft und Sicherheit. Ausnahmeberichte

      Languages wird zur Vorbereitung, Verarbeitung und Analyse verwendet

    R-Sprache Einführung in R Datenmanipulation, Berechnung und grafische Anzeige

      Python Einführung in Python

    Bearbeiten, Verarbeiten, Bereinigen und Verarbeiten von Daten

      Datenanalyse
    Explorative Analyse Grundlegende Statistiken Visualisierungen entwerfen Daten verstehen
  • Kausalität
  • Funktionen und Transformationen
  • Machine Learning Beaufsichtigt vs. unbeaufsichtigt

      Wann welches Modell verwendet werden soll
    Natural Language Processing (NLP)
  • Data Visualization
  • Best Practices Auswahl des richtigen Diagramms für die richtigen Daten Farbpaletten Bringen Sie es auf die nächste Ebene Dashboards Interaktive Visualisierungen
  • Storytelling mit Daten
  • Zusammenfassung und Schlussfolgerung
  • Voraussetzungen

    • Allgemeines Verständnis von Datenbankkonzepten
    • Grundkenntnisse in Statistik
     35 Stunden

    Teilnehmerzahl



    Preis je Teilnehmer

    Erfahrungsberichte (2)

    Verwandte Kategorien