RAG (Retrieval Augmented Generation) — KI mit eigenen Daten füttern

Was ist RAG?

RAG steht für Retrieval Augmented Generation — auf Deutsch etwa abrufgestützte Generierung. Es ist eine Technik, bei der ein LLM nicht nur auf sein Trainingswissen zurückgreift, sondern zuerst relevante Dokumente aus einer eigenen Datenquelle durchsucht und diese als Kontext für seine Antwort nutzt. Das Ergebnis: Die KI antwortet auf Basis deiner tatsächlichen Daten statt auf Basis von möglicherweise veraltetem oder falschem Trainingswissen.

Warum braucht man RAG?

LLMs haben zwei grundlegende Probleme: Ihr Wissen hat einen Stichtag (sie kennen nichts nach dem Trainingsdatum) und sie können halluzinieren. RAG löst beide Probleme, indem es der KI aktuelles, geprüftes Wissen zur Verfügung stellt. Stell dir vor, du hast eine interne Firmendokumentation — ein normales LLM kennt sie nicht, aber mit RAG kann es darauf zugreifen und präzise Fragen dazu beantworten.

Wie funktioniert RAG technisch?

Der typische RAG-Ablauf hat vier Schritte:

Embedding: Deine Dokumente werden in numerische Vektoren umgewandelt, die ihre Bedeutung abbilden
Vektordatenbank: Diese Vektoren werden in einer spezialisierten Datenbank gespeichert (z. B. Pinecone, Weaviate oder Chroma)
Retrieval (Suche): Wenn du eine Frage stellst, wird sie ebenfalls in einen Vektor umgewandelt und die ähnlichsten Dokumente werden gefunden
Generation (Antwort): Die gefundenen Dokumente werden dem LLM als Kontext mitgegeben, und es generiert eine Antwort basierend auf diesen echten Quellen

RAG im Vibe-Coding-Kontext

Für Vibe Coder ist RAG besonders spannend, weil du damit KI-Anwendungen bauen kannst, die mit eigenen Daten arbeiten. Denk an einen Chatbot für deine Projektdokumentation, ein Frage-Antwort-System für dein Unternehmen oder einen Code-Assistenten, der deine spezifischen Coding-Standards kennt. Tools wie LangChain oder LlamaIndex machen den Aufbau eines RAG-Systems auch für Einsteiger zugänglich.

RAG (Retrieval Augmented Generation) — KI mit eigenen Daten füttern

Was ist RAG?

Warum braucht man RAG?

Wie funktioniert RAG technisch?

RAG im Vibe-Coding-Kontext

Verwandte Artikel

LLM (Large Language Model) — Große Sprachmodelle erklärt

Halluzination — Wenn KI überzeugende Falschinformationen erzeugt

Context Window — Das Gedächtnis eines KI-Modells