Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in die multimodale KI
- Was ist multimodale KI?
- Zentrale Herausforderungen und Anwendungen
- Überblick über führende multimodale Modelle
Textverarbeitung und natürliches Sprachverstehen
- Nutzung von LLMs für textbasierte KI-Agenten
- Verstehen von Prompt Engineering für multimodale Aufgaben
- Feinabstimmung von Textmodellen für domänenspezifische Anwendungen
Bilderkennung und -generierung
- Verarbeitung von Bildern mit KI: Klassifizierung, Beschriftung und Objekterkennung
- Generierung von Bildern mit Diffusionsmodellen (Stable Diffusion, DALLE)
- Integration von Bilddaten mit textbasierten Modellen
Sprach- und Audioverarbeitung
- Spracherkennung mit Whisper ASR
- Text-to-Speech (TTS) Synthesetechniken
- Verbesserung der Benutzerinteraktion mit sprachbasierter KI
Integration von multimodalen Eingaben
- Aufbau von KI-Pipelines für die Verarbeitung mehrerer Eingabearten
- Fusionstechniken für die Kombination von Text-, Bild- und Sprachdaten
- Reale Anwendungen von multimodalen KI-Agenten
Einsatz von Multi-Modal AI Agents
- Aufbau von API-gesteuerten multimodalen KI-Lösungen
- Optimierung von Modellen für Leistung und Skalierbarkeit
- Bewährte Verfahren für den Einsatz von multimodaler KI in der Produktion
Ethische Überlegungen und zukünftige Trends
- Voreingenommenheit und Fairness in multimodaler KI
- Bedenken hinsichtlich des Datenschutzes bei multimodalen Daten
- Zukünftige Entwicklungen in der multimodalen KI
Zusammenfassung und nächste Schritte
Voraussetzungen
- Verständnis der Grundlagen des maschinellen Lernens
- Erfahrung mit Python Programmierung
- Vertrautheit mit Deep-Learning-Frameworks (z. B. TensorFlow, PyTorch)
Zielgruppe
- KI-Entwickler
- Forscher
- Multimedia-Ingenieure
21 Stunden
Erfahrungsberichte (1)
Trainer beantwortet Fragen spontan.
Adrian
Kurs - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Maschinelle Übersetzung