Schulungsübersicht

Einführung

  • Die Bedeutung der Datenvorbereitung in Analyse und maschinellem Lernen verstehen
  • Datenvorbereitungsprozess und seine Rolle im Datenzyklus
  • Auf die häufigen Herausforderungen bei Rohdaten eingehen und deren Auswirkung auf die Analyse

Datenerhebung und -erfassung

  • Datenquellen: Datenbanken, APIs, Tabellenkalkulationsdateien, Textdateien und mehr
  • Mitarbeit an Techniken zur Datensammlung und zum Sicherstellen der Datengüte während des Sammelns
  • Sammeln von Daten aus verschiedenen Quellen

Data Cleaning Techniken

  • Aufdecken und Handhaben von fehlenden Werten, Ausreißern und Inkonsistenzen
  • Umgang mit Duplikaten und Fehlern in Datensätzen
  • Bereinigung realer Datensätze

Datenumwandlung und -standardisierung

  • Techniken der Datennormalisierung und -standardisierung
  • Handhabung kategorialer Daten: Kodierung, Binning und Merkmalsingenieurwesen
  • Umwandlung von Rohdaten in nutzbare Formate

Data Integration und Aggregation

  • Kombinieren und Verbinden von Datensätzen aus verschiedenen Quellen
  • Auflösen von Datenkonflikten und Ausrichtung der Datentypen
  • Techniken zur Datenumfassung und -konsolidierung

Data Quality Zusicherung

  • Methode zur Gewährleistung der Datengüte und -integrität über den gesamten Prozess hinweg
  • Implementieren von Qualitätskontrollen und Validierungsprozeduren
  • Fallstudien und praktische Anwendungen der Datensicherstellung

Dimensionalitätsreduktion und Merkmalsauswahl

  • Vermitteln des Bedarfs an dimensionalitätseinschränkenden Techniken
  • Mitarbeit an Techniken wie PCA, Merkmalsextraktion und Reduktionsstrategien
  • Implementieren von Techniken zur dimensionalen Einschränkung

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Basisverständnis von Datenkonzepten

Publikum

  • Datenanalysten
  • Database Administratoren
  • IT-Professionals
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien