Retrieval-Augmented Generation (RAG) – Wissensunterstützte Textgenerierung

Retrieval-Augmented Generation (RAG) ist ein modernes Verfahren in der Künstlichen Intelligenz, das zwei zentrale Technologien kombiniert:

  1. Textgenerierung durch große Sprachmodelle (wie GPT)
  2. Informationsabruf aus einer externen Wissensquelle (z. B. Datenbanken, Dokumentensammlungen, Webseiten)

Ziel ist es, verlässlichere und faktenbasierte Antworten zu erzeugen – also Halluzinationen zu vermeiden, wie sie bei klassischen Sprachmodellen auftreten können.


🔧 So funktioniert RAG – Schritt für Schritt:

  1. Die Nutzeranfrage (Prompt) wird vom System entgegengenommen – z. B.:
    „Welche Nebenwirkungen hat das Medikament Ibuprofen?“
  2. Die KI durchsucht eine externe Wissensdatenbank nach passenden, aktuellen oder verifizierten Informationen.
    Das kann z. B. ein Index wissenschaftlicher Artikel, ein Firmen-Intranet oder eine medizinische Fachliteratur sein.
  3. Die relevantesten Dokumente oder Textpassagen werden ausgewählt und in die Antworterzeugung einbezogen.
  4. Das Sprachmodell erzeugt auf Basis dieser externen Inhalte eine Antwort – also nicht allein aus dem Trainingswissen, sondern gestützt durch geprüfte Informationen.

🎯 Vorteile von RAG:

  • Faktenbasierte Antworten: Die KI „weiß“, woher die Information stammt.
  • Aktualisierbarkeit: Neue Inhalte können sofort in die Wissensdatenbank eingespeist werden – ohne dass das ganze Modell neu trainiert werden muss.
  • Transparenz: Oft kann die Quelle mitgeliefert werden, was Vertrauen schafft.

🛠 Technische Bestandteile:

KomponenteFunktion
RetrieverFindet die relevantesten Textstellen zu einer Anfrage.
GeneratorFormuliert die endgültige Antwort auf Basis der gefundenen Informationen.
WissensbasisEine durchsuchbare Sammlung von Texten oder Daten (z. B. PDF-Dateien, Webseiten, FAQ-Datenbanken).

🧪 Praxisbeispiel:

Ein Pharmakonzern richtet ein internes RAG-System ein.
Mitarbeitende geben eine medizinische Frage ein, etwa:
„Wie ist die empfohlene Dosierung bei Patienten mit Lebererkrankung?“

Das System durchsucht die interne Arzneimitteldatenbank, zieht Fachartikel aus Studien und formt daraus eine Antwort – inklusive Verweis auf die Originalquelle.
Ergebnis: Präzise, nachvollziehbare und aktuelle Informationen für Fachpersonal.


🧠 Vergleich mit klassischen Sprachmodellen:

MerkmalKlassisches Sprachmodell (z. B. GPT)RAG-Modell
Quelle der InformationIntern, aus TrainingsdatenExtern, aus durchsuchten Texten
Aktualität der InhalteNur bis zum TrainingszeitpunktLaufend aktualisierbar
Faktenprüfung möglich?EingeschränktJa, durch Rückgriff auf Originalquellen
Risiko für HalluzinationenHochDeutlich reduziert

Möchtest du dazu eine PowerPoint-Folie, ein Schaubild oder eine Version als PDF-Dokument?

Schreibe einen Kommentar