Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung in die Feinabstimmung von DeepSeek-Modellen
- Überblick über DeepSeek-Modelle, z.B. DeepSeek-R1 und DeepSeek-V3
- Verständnis der Notwendigkeit der Feinabstimmung von Großsprachmodellen (LLMs)
- Vergleich zwischen Feinabstimmung und Prompt-Engineering
Vorbereitung des Datensatzes für die Feinabstimmung
- Zusammenstellen von domänenspezifischen Datensätzen
- Techniken zur Datenvorbereitung und -reinigung
- Tokenisierung und Formatierung des Datensatzes für DeepSeek-LLMs
Einrichtung der Umgebung für die Feinabstimmung
- Konfiguration von GPU und TPU-Acceleration
- Einrichtung von Hugging Face Transformers mit DeepSeek-LLMs
- Verständnis der Hyperparameter für die Feinabstimmung
Feinabstimmung von DeepSeek-Modellen
- Implementierung der supervisionsbasierten Feinabstimmung
- Nutzung von LoRA (Low-Rank Adaptation) und PEFT (Parameter-Effiziente Feinabstimmung)
- Durchführen verteilter Feinabstimmungen für große Datensätze
Bewertung und Optimierung der feinabgestimmten Modelle
- Beurteilung der Modellleistung mit Bewertungsmaßen
- Umgang mit Overfitting und Underfitting
- Optimierung von Inferenzgeschwindigkeit und Modelleffizienz
Bereitstellung feinabgestimmter DeepSeek-Modelle
- Packen der Modelle für die API-Bereitstellung
- Integrierung feinabgestimmter Modelle in Anwendungen
- Skalierung von Bereitstellungen mit Cloud- und Edge-Rechnung
Reale Use Cases und Anwendungen
- Feinabgestimmte LLMs für Finance, Healthcare und Kundendienstleistungen
- Fallstudien von Branchenanwendungen
- Ethische Überlegungen zu domänenspezifischen AI-Modellen
Zusammenfassung und weitere Schritte
Voraussetzungen
- Erfahrung mit Frameworks für maschinelles Lernen und tiefes Lernen
- Kenntnisse von Transformer-Modellen und großen Sprachmodellen (LLMs)
- Verständnis der Datenverarbeitung und Modellausbildungstechniken
Zielgruppe
- KI-Forscher, die LLMs anpassen möchten
- Maschinenlerningenieur, die benutzerdefinierte AI-Modelle entwickeln
- Fortgeschrittene Entwickler, die AI-gesteuerte Lösungen implementieren
21 Stunden