Retrieval-Augmented Generation (RAG) ist ein modernes Verfahren in der Künstlichen Intelligenz, das zwei zentrale Technologien kombiniert:
- Textgenerierung durch große Sprachmodelle (wie GPT)
- Informationsabruf aus einer externen Wissensquelle (z. B. Datenbanken, Dokumentensammlungen, Webseiten)
Ziel ist es, verlässlichere und faktenbasierte Antworten zu erzeugen – also Halluzinationen zu vermeiden, wie sie bei klassischen Sprachmodellen auftreten können.
🔧 So funktioniert RAG – Schritt für Schritt:
- Die Nutzeranfrage (Prompt) wird vom System entgegengenommen – z. B.:
„Welche Nebenwirkungen hat das Medikament Ibuprofen?“ - Die KI durchsucht eine externe Wissensdatenbank nach passenden, aktuellen oder verifizierten Informationen.
Das kann z. B. ein Index wissenschaftlicher Artikel, ein Firmen-Intranet oder eine medizinische Fachliteratur sein. - Die relevantesten Dokumente oder Textpassagen werden ausgewählt und in die Antworterzeugung einbezogen.
- Das Sprachmodell erzeugt auf Basis dieser externen Inhalte eine Antwort – also nicht allein aus dem Trainingswissen, sondern gestützt durch geprüfte Informationen.
🎯 Vorteile von RAG:
- ✅ Faktenbasierte Antworten: Die KI „weiß“, woher die Information stammt.
- ✅ Aktualisierbarkeit: Neue Inhalte können sofort in die Wissensdatenbank eingespeist werden – ohne dass das ganze Modell neu trainiert werden muss.
- ✅ Transparenz: Oft kann die Quelle mitgeliefert werden, was Vertrauen schafft.
🛠 Technische Bestandteile:
Komponente | Funktion |
---|---|
Retriever | Findet die relevantesten Textstellen zu einer Anfrage. |
Generator | Formuliert die endgültige Antwort auf Basis der gefundenen Informationen. |
Wissensbasis | Eine durchsuchbare Sammlung von Texten oder Daten (z. B. PDF-Dateien, Webseiten, FAQ-Datenbanken). |
🧪 Praxisbeispiel:
Ein Pharmakonzern richtet ein internes RAG-System ein.
Mitarbeitende geben eine medizinische Frage ein, etwa:
„Wie ist die empfohlene Dosierung bei Patienten mit Lebererkrankung?“
Das System durchsucht die interne Arzneimitteldatenbank, zieht Fachartikel aus Studien und formt daraus eine Antwort – inklusive Verweis auf die Originalquelle.
Ergebnis: Präzise, nachvollziehbare und aktuelle Informationen für Fachpersonal.
🧠 Vergleich mit klassischen Sprachmodellen:
Merkmal | Klassisches Sprachmodell (z. B. GPT) | RAG-Modell |
---|---|---|
Quelle der Information | Intern, aus Trainingsdaten | Extern, aus durchsuchten Texten |
Aktualität der Inhalte | Nur bis zum Trainingszeitpunkt | Laufend aktualisierbar |
Faktenprüfung möglich? | Eingeschränkt | Ja, durch Rückgriff auf Originalquellen |
Risiko für Halluzinationen | Hoch | Deutlich reduziert |
Möchtest du dazu eine PowerPoint-Folie, ein Schaubild oder eine Version als PDF-Dokument?