RAG (Retrieval-Augmented Generation)

Retrieval-Augmented Generation kombiniert große Sprachmodelle (LLMs) mit externen Wissensquellen. Statt nur auf Trainingsdaten zu basieren, durchsucht RAG in Echtzeit eigene Datenbanken und liefert faktenbasierte, aktuelle Antworten. Für B2B relevant als Grundlage intelligenter FAQ-Systeme und Knowledge Bases.

Definition

RAG (Retrieval-Augmented Generation) ist eine Architektur für künstliche Intelligenz, die große Sprachmodelle (LLMs) mit externen, dynamischen Datenbanken verknüpft. Das System ruft vor der Generierung einer Antwort spezifische Informationen aus einem Index ab, um die Ausgabe des Sprachmodells mit aktuellen und verifizierbaren Fakten anzureichern.

Bedeutung

Im Kontext von Suchmaschinenoptimierung (SEO) und KI-gestützten Suchmaschinen (wie Google SGE oder Perplexity) bildet RAG die technologische Grundlage für die Beantwortung von Nutzeranfragen. Die Methode reduziert Halluzinationen (das Erfinden von Fakten durch die KI), da die generierten Antworten auf abgerufenen Echtzeitdaten oder spezifischen Unternehmensdokumenten basieren. Dies zwingt Content-Produzenten dazu, Informationen so zu strukturieren, dass sie von Retrieval-Systemen effizient erfasst und zitiert werden können.

Funktionsweise

Der RAG-Prozess besteht aus zwei Hauptkomponenten: dem Information Retrieval (Informationsabruf) und der Textgenerierung. Zunächst wandelt ein Embedding-Modell (ein Algorithmus, der Text in numerische Vektoren übersetzt) die Suchanfrage des Nutzers um und gleicht diese mit einer Vektordatenbank ab. Das System extrahiert die relevantesten Textpassagen aus dieser Datenbank und übergibt sie zusammen mit der ursprünglichen Anfrage als Kontext an das Sprachmodell (Prompt). Das Sprachmodell nutzt diese bereitgestellten Fakten, um eine kohärente und quellenbasierte Antwort zu formulieren, wodurch es nicht ausschließlich auf sein statisches Trainingswissen angewiesen ist.

Praxisbeispiel

Eine KI-gestützte Suchmaschine beantwortet eine komplexe B2B-Suchanfrage zu aktuellen Software-Preisen, indem sie im Hintergrund per RAG die neuesten Preislisten und Fachartikel aus dem Web abruft. Die generierte Antwort fasst die abgerufenen Daten zusammen und verlinkt die Originalquellen als Fußnoten, wodurch der Nutzer die Herkunft der Preisinformationen direkt nachvollziehen kann.

Verwandte Begriffe

  • LLM (Large Language Model): Das zugrundeliegende Sprachmodell, das im RAG-Prozess die finale Textantwort auf Basis der abgerufenen Daten generiert.
  • Vektordatenbank: Ein Speichersystem für numerische Datenrepräsentationen, das den schnellen Abruf von semantisch ähnlichen Inhalten während des RAG-Prozesses ermöglicht.
  • SGE (Search Generative Experience): Ein KI-Suchkonzept von Google, das RAG-Mechanismen nutzt, um direkte Antworten aus indexierten Webseiten zu generieren.
  • Halluzination (Künstliche Intelligenz): Die fehlerhafte Generierung von Fakten durch ein KI-Modell, welche durch den Einsatz von RAG signifikant minimiert wird.