Schulungsübersicht

Einführung

  • Verständnis der Bedeutung der Datenvorbereitung für Analysen und maschinelles Lernen
  • Datenaufbereitungspipeline und ihre Rolle im Lebenszyklus der Daten
  • Erkundung allgemeiner Herausforderungen bei Rohdaten und deren Auswirkungen auf die Analyse

Datenerhebung und -erfassung

  • Datenquellen: Datenbanken, APIs, Tabellenkalkulationen, Textdateien und mehr
  • Techniken zum Sammeln von Daten und zur Sicherstellung der Datenqualität während der Sammlung
  • Sammeln von Daten aus verschiedenen Quellen

Data Cleaning Techniken

  • Identifizierung und Behandlung von fehlenden Werten, Ausreißern und Inkonsistenzen
  • Umgang mit Duplikaten und Fehlern im Datensatz
  • Bereinigung realer Datensätze

Datenumwandlung und -standardisierung

  • Techniken zur Normalisierung und Standardisierung von Daten
  • Verarbeitung kategorischer Daten: Kodierung, Binning und Feature Engineering
  • Umwandlung von Rohdaten in brauchbare Formate

Data Integration und Aggregation

  • Zusammenführen und Kombinieren von Datensätzen aus verschiedenen Quellen
  • Lösen von Datenkonflikten und Angleichung von Datentypen
  • Techniken zur Datenaggregation und -konsolidierung

Data Quality Zusicherung

  • Methoden zur Gewährleistung der Datenqualität und -integrität während des gesamten Prozesses
  • Durchführung von Qualitätsprüfungen und Validierungsverfahren
  • Fallstudien und praktische Anwendungen der Datenqualitätssicherung

Dimensionalitätsreduktion und Merkmalsauswahl

  • Verständnis für die Notwendigkeit der Dimensionalitätsreduktion
  • Techniken wie PCA, Merkmalsauswahl und Reduktionsstrategien
  • Implementierung von Techniken zur Dimensionalitätsreduktion

Zusammenfassung und nächste Schritte

Voraussetzungen

    Grundlegendes Verständnis von Datenkonzepten

Publikum

    Datenanalysten Database Administratoren IT-Fachleute
 14 Stunden

Teilnehmerzahl



Preis je Teilnehmer

Erfahrungsberichte (2)

Kombinierte Kurse

Verwandte Kategorien