Schulungsübersicht

Einführung in die Feinabstimmung von DeepSeek-Modellen

  • Überblick über DeepSeek-Modelle, z.B. DeepSeek-R1 und DeepSeek-V3
  • Verständnis der Notwendigkeit der Feinabstimmung von Großsprachmodellen (LLMs)
  • Vergleich zwischen Feinabstimmung und Prompt-Engineering

Vorbereitung des Datensatzes für die Feinabstimmung

  • Zusammenstellen von domänenspezifischen Datensätzen
  • Techniken zur Datenvorbereitung und -reinigung
  • Tokenisierung und Formatierung des Datensatzes für DeepSeek-LLMs

Einrichtung der Umgebung für die Feinabstimmung

  • Konfiguration von GPU und TPU-Acceleration
  • Einrichtung von Hugging Face Transformers mit DeepSeek-LLMs
  • Verständnis der Hyperparameter für die Feinabstimmung

Feinabstimmung von DeepSeek-Modellen

  • Implementierung der supervisionsbasierten Feinabstimmung
  • Nutzung von LoRA (Low-Rank Adaptation) und PEFT (Parameter-Effiziente Feinabstimmung)
  • Durchführen verteilter Feinabstimmungen für große Datensätze

Bewertung und Optimierung der feinabgestimmten Modelle

  • Beurteilung der Modellleistung mit Bewertungsmaßen
  • Umgang mit Overfitting und Underfitting
  • Optimierung von Inferenzgeschwindigkeit und Modelleffizienz

Bereitstellung feinabgestimmter DeepSeek-Modelle

  • Packen der Modelle für die API-Bereitstellung
  • Integrierung feinabgestimmter Modelle in Anwendungen
  • Skalierung von Bereitstellungen mit Cloud- und Edge-Rechnung

Reale Use Cases und Anwendungen

  • Feinabgestimmte LLMs für Finance, Healthcare und Kundendienstleistungen
  • Fallstudien von Branchenanwendungen
  • Ethische Überlegungen zu domänenspezifischen AI-Modellen

Zusammenfassung und weitere Schritte

Voraussetzungen

  • Erfahrung mit Frameworks für maschinelles Lernen und tiefes Lernen
  • Kenntnisse von Transformer-Modellen und großen Sprachmodellen (LLMs)
  • Verständnis der Datenverarbeitung und Modellausbildungstechniken

Zielgruppe

  • KI-Forscher, die LLMs anpassen möchten
  • Maschinenlerningenieur, die benutzerdefinierte AI-Modelle entwickeln
  • Fortgeschrittene Entwickler, die AI-gesteuerte Lösungen implementieren
 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Kommende Kurse

Verwandte Kategorien