Kontakt aufnehmen

Schulungsübersicht

Grundlagen der Audio-Klassifikation

  • Typen von Klangereignissen: Umgebungsgeräusche, mechanische Klänge, menschengenerierte Töne
  • Überblick über Anwendungsfälle: Überwachung, Monitoring, Automatisierung
  • Unterschied zwischen Audio-Klassifikation, -Erkennung und -Segmentierung

Audio-Daten und Merkmalsextraktion

  • Arten von Audiodateien und -formaten
  • Abtastrate, Fensterung und Berücksichtigung der Frame-Grösse
  • Extrahieren von MFCCs, Chroma-Merkmalen und Mel-Spektrogrammen

Datenvorbereitung und Annotation

  • UrbanSound8K, ESC-50 und benutzerdefinierte Datensätze
  • Markierung von Klangereignissen und zeitlichen Grenzen
  • Ausgewogenheit der Datensätze und Audiokomplementierung (Augmentation)

Erstellung von Audio-Klassifikationsmodellen

  • Einsatz von Faltungsnetzwerken (CNNs) für Audio
  • Modelleingabe: Rohe Wellenform vs. Merkmale
  • Verlustfunktionen, Bewertungsmetriken und Overfitting

Ereigniserkennung und zeitliche Lokalisierung

  • Rahmenbasierte und segmentbasierte Erkennungsstrategien
  • Nachbearbeitung der Erkennungen mittels Schwellwerten und Glättung
  • Visualisierung der Vorhersagen auf Audiotimeline

Fortschrittliche Themen und Echtzeitverarbeitung

  • Transferlernen für Szenarien mit geringen Datenmengen
  • Bereitstellung von Modellen mit TensorFlow Lite oder ONNX
  • Streaming-Audio-Verarbeitung und Latenzbetrachtungen

Projektentwicklung und Anwendungsszenarien

  • Entwurf einer vollständigen Pipeline: Vom Ingest bis zur Klassifikation
  • Entwicklung eines Proof-of-Concept für Überwachung, Qualitätskontrolle oder Monitoring
  • Protokollierung, Alarmierung und Integration mit Dashboards oder APIs

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Verständnis von Machine-Learning-Konzepten und dem Modelltraining
  • Erfahrung mit Python-Programmierung und Datenvorverarbeitung
  • Grundkenntnisse in digitalen Audio-Fundamentals

Zielgruppe

  • Datenwissenschaftler
  • Machine-Learning-Ingenieure
  • Forscher und Entwickler im Bereich der Audi Signalverarbeitung
 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien