Schulungsübersicht

Einführung in die Multimodale KI

  • Überblick über multimedialen KI und real-world-Anwendungen
  • Herausforderungen bei der Integration von Text-, Bild- und Audiodaten
  • Aktuelle Forschungserkenntnisse und Fortschritte

Datenverarbeitung und Features Engineering

  • Umgang mit Text-, Bild- und Audiodatensätzen
  • Vorkennzeichnungs-Techniken für multimediale Lernprozesse
  • Extraktion von Merkmalen und Strategien zur Datenvereinigung

Erstellen multimodal von Modellen mit PyTorch und Hugging Face

  • Einführung in PyTorch für multimediales Lernen
  • Nutzung von Hugging Face Transformers für NLP- und Sehbare Aufgaben
  • Vereinigung unterschiedlicher Modalitäten in einem einheitlichen KI-Modell

Implementierung von Sprache, Vision und Text-Vereinigung

  • Integration von OpenAI Whisper für die Spracherkennung
  • Anwendung von DeepSeek-Vision für Bildverarbeitung
  • Fusionstechniken für das intermodalen Lernen

Training und Optimierung multimodal von KI-Modellen

  • Modelltrainingsstrategien für multimediale KI
  • Optimierungstechniken und Hyperparameter-Anpassung
  • Umgang mit Bias und Verbesserung der Modellverallgemeinerung

Bereitstellung multimodal von KI in real-world Anwendungen

  • Exportieren von Modellen für die Produktionsnutzung
  • Bereitstellen von AI-Modellen auf Cloudplattformen
  • Überwachung der Leistung und Wartung des Modells

Fortgeschrittene Themen und Zukunftstrends

  • Zero-Shot- und Few-Shot-Lernen in der multimedialen KI
  • Ethische Überlegungen und verantwortungsvolle AI-Entwicklung
  • Aufstrebende Trends in der multimedialen Forschungsarbeit

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Solides Verständnis von Konzepten der maschinellen und tiefen Lernverfahren
  • Erfahrung mit KI-Frameworks wie PyTorch oder TensorFlow
  • Kenntnisse im Umgang mit Text-, Bild- und Audiodatenverarbeitung

Zielgruppe

  • KI-Entwickler
  • Maschinenlern-Ingenieure
  • Forscher
 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien