Schulungsübersicht

Einführung in Retrieval-Augmented Generation (RAG)

  • Was ist RAG und warum es für UnternehmenskI relevant ist
  • Komponenten eines RAG-Systems: Retriever, Generator, Dokumentenspeicher
  • Vergleich mit standalone LLMs und Vektorsuche

Einrichtung einer RAG-Pipeline

  • Installieren und Konfigurieren von Haystack oder ähnlichen Frameworks
  • Dokumenteneingabe und Vorverarbeitung
  • Verschmelzung von Retrievers mit Vektordatenbanken (z.B. FAISS, Pinecone)

Fine-Tuning der Retriever

  • Ausbildung dichter Retrievers mithilfe von domänenspezifischen Daten
  • Verwendung von Satztransformern und kontrastiver Lernmethode
  • Bewertung der Qualität des Retrievers mit top-k-Accuracy

Fine-Tuning der Generator

  • Auswahl von Basismodellen (z.B. BART, T5, FLAN-T5)
  • Instruction Tuning vs. überwachtes Feintuning
  • LoRA und PEFT-Methoden für effiziente Aktualisierungen

Bewertung und Optimierung

  • Metriken zur Bewertung der RAG-Leistung (z.B. BLEU, EM, F1)
  • Latenz, Retrieval-Qualität und Verringerung von Halluzinationen
  • Experimentenverfolgung und iterative Verbesserung

Bereitstellung und Realweltintegration

  • Bereitstellen von RAG in internen Suchmaschinen und Chatbots
  • Sicherheit, Datenzugriff und Governanceaspekte
  • Integration mit APIs, Dashboards oder Wissensportalen

Fallstudien und Best Practices

  • Unternehmensanwendungen in Finance, Healthcare und Recht
  • Verwaltung von Domänenverschiebungen und Aktualisierung des Wissensspeichers
  • Zukünftige Richtungen bei retrieval-augmented LLM-Systemen

Zusammenfassung und nächste Schritte

Voraussetzungen

  • Eine Verständnis von Konzepten der natursprachlichen Verarbeitung (NLP)
  • Erfahrung mit transformer-basierten Sprachmodellen
  • Bekanntschaft mit Python und grundlegenden maschinellem Lern-Workflows

Zielgruppe

  • NLP-Ingenieure
  • Wissensmanagements-Teams
 14 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Kommende Kurse

Verwandte Kategorien