Was ist Google ReasoningBank? Guide für KI-Agenten im Jahr 2026

ReasoningBank ist ein von Google Research entwickeltes Framework, das KI-Agenten ein dynamisches Gedächtnis verleiht, um sowohl aus erfolgreichen als auch aus fehlgeschlagenen Aktionen nachhaltig zu lernen. Während herkömmliche Systeme wie Synapse oder AWM oft nur erfolgreiche Durchläufe speichern konnten und bei Fehlern sogar an Präzision verloren, nutzt ReasoningBank gescheiterte Versuche aktiv als Lehrmaterial. In aktuellen Tests im Jahr 2026 zeigt sich, dass Agenten durch diese Methode abstrakte Strategien entwickeln, die über spezifische Webseiten oder Code-Umgebungen hinausgehen.

Wie funktioniert ReasoningBank in der Praxis?

Das System verändert grundlegend, wie ein Agent komplexe Aufgaben im Browser oder in Entwicklungsumgebungen angeht. Erhält ein Agent beispielsweise den Auftrag, das Datum eines ersten Kaufs in einem Account zu finden, würde ein Modell ohne Gedächtnis oft nur die erste Seite der Bestellhistorie prüfen und dort fälschlicherweise die neueste Bestellung melden. Ein mit ReasoningBank ausgestatteter Agent erinnert sich hingegen an die validierte Strategie: „Prüfe immer die gesamte Historie, nicht nur die erste Ansicht“. Er navigiert gezielt zum Ende der Liste und liefert das korrekte Ergebnis.

Auch die Effizienz beim Navigieren durch Online-Shops verbessert sich drastisch. In Szenarien, in denen ein Agent das beste Produkt einer Kategorie finden soll, reduziert sich die Anzahl der benötigten Schritte von 29 auf lediglich 10. Dies liegt daran, dass der Agent Filtermechanismen und Suchmuster aus früheren Sitzungen abruft, anstatt diese jedes Mal neu explorieren zu müssen.

Welche technische Struktur nutzt das Framework?

Nach jedem abgeschlossenen Task bewertet dasselbe Sprachmodell, ob der Versuch erfolgreich war oder nicht. Aus diesem Prozess werden Trajektorien extrahiert, die in Titel, Beschreibung und Inhalt unterteilt sind. Wichtig ist hierbei die Abstraktion: Die Informationen werden so gespeichert, dass sie nicht an ein spezifisches UI-Design gebunden sind, sondern allgemeine Lösungswege beschreiben. Vor einem neuen Task führt der Agent eine Vektorsuche (Embedding Search) durch, um relevante Erfahrungen zu finden und diese direkt in den Prompt zu integrieren.

Zusätzlich wurde auf Basis von ReasoningBank die Methode MaTTS (Memory-aware Test-Time Scaling) entwickelt. Diese skaliert die Berechnungen während der Inferenzzeit unter Berücksichtigung des Gedächtnisses. Der Agent generiert mehrere Lösungsansätze, vergleicht diese und identifiziert stabile Muster. Dadurch entsteht ein Kreislauf: Ein gutes Gedächtnis leitet die Versuche in erfolgversprechende Richtungen, während vielfältige Versuche wiederum das Gedächtnis anreichern.

Welche Performance-Gewinne bietet ReasoningBank?

Die Integration von ReasoningBank führt in verschiedenen Benchmarks zu einer signifikanten Steigerung der Zuverlässigkeit und Effizienz. Besonders beeindruckend ist die Skalierbarkeit, da auch kleinere Modelle massiv profitieren. Im Vergleich zu Standard-Setups ohne Gedächtnis konnten folgende Metriken erzielt werden:

Modell / Benchmark	Metrik	Verbesserung
Gemini-2.5-flash (WebArena)	Success Rate	+8,3 Prozentpunkte
Gemini-2.5-pro (WebArena)	Success Rate	+7,2 Prozentpunkte
Gemma-3-12B (Shopping)	Success Rate	von 17,1 % auf 24,1 %
SWE-Bench-Verified	Resolve Rate	von 54 % auf 57,4 %

Die Anzahl der benötigten Navigationsschritte sank im Durchschnitt um 16 %. Trotz des zusätzlichen Abrufs von Gedächtnisinhalten stieg der Token-Verbrauch auf dem SWE-Bench nur moderat um etwa 4,3 %. Dies macht ReasoningBank zu einer hocheffizienten Lösung für die nächste Generation autonomer KI-Agenten im Jahr 2026.

Quelle: https://research.google/blog/reasoningbank-enabling-agents-to-learn-from-experience/

Häufige Fragen

Was unterscheidet die Google ReasoningBank von herkömmlichen KI-Gedächtnissystemen?

ReasoningBank nutzt im Gegensatz zu älteren Systemen nicht nur erfolgreiche Durchläufe, sondern auch gescheiterte Versuche aktiv als Lehrmaterial. Du profitierst davon, dass Agenten durch diese Methode abstrakte Strategien entwickeln, die über spezifische Webseiten oder Code-Umgebungen hinausgehen. Das System verhindert so den Präzisionsverlust, der bei Systemen wie Synapse oder AWM oft auftrat.

Wie verbessert ReasoningBank die Effizienz von KI-Agenten in der Praxis?

Agenten reduzieren die Anzahl der benötigten Navigationsschritte in komplexen Umgebungen drastisch, beispielsweise in Online-Shops von 29 auf nur 10 Schritte. Du erhältst präzisere Ergebnisse bei Suchaufgaben, da der Agent auf validierte Strategien wie das Prüfen der gesamten Historie zurückgreift. Das Framework speichert Informationen abstrakt ab, wodurch sie unabhängig vom spezifischen UI-Design anwendbar bleiben.

Welche Rolle spielt die MaTTS-Methode innerhalb des Frameworks?

Die Methode Memory-aware Test-Time Scaling skaliert die Berechnungen während der Inferenzzeit unter direkter Berücksichtigung des Gedächtnisses. Deine KI-Agenten generieren dadurch mehrere Lösungsansätze, vergleichen diese und identifizieren stabile Muster für zukünftige Aufgaben. Ein Kreislauf aus gutem Gedächtnis und vielfältigen Versuchen steigert so kontinuierlich die Erfolgsrate.

Welche Leistungssteigerungen sind bei Modellen wie Gemini durch ReasoningBank messbar?

Modelle wie Gemini-2.5-flash erzielen eine um 8,3 Prozentpunkte höhere Erfolgsrate im WebArena-Benchmark. Du siehst deutliche Verbesserungen auch bei kleineren Modellen wie Gemma-3-12B, deren Erfolgsrate im Shopping-Bereich von 17,1 % auf 24,1 % ansteigt. Trotz der höheren Intelligenz bleibt der zusätzliche Token-Verbrauch mit etwa 4,3 % moderat.

Was ist Google ReasoningBank? Guide für KI-Agenten im Jahr 2026

Wie funktioniert ReasoningBank in der Praxis?

Welche technische Struktur nutzt das Framework?

Welche Performance-Gewinne bietet ReasoningBank?

Häufige Fragen

Was unterscheidet die Google ReasoningBank von herkömmlichen KI-Gedächtnissystemen?

Wie verbessert ReasoningBank die Effizienz von KI-Agenten in der Praxis?

Welche Rolle spielt die MaTTS-Methode innerhalb des Frameworks?

Welche Leistungssteigerungen sind bei Modellen wie Gemini durch ReasoningBank messbar?

Quellen

Verwandte Artikel

Agentic RAG für Gemini Enterprise 2026: Ein Deep Dive Guide

Was ist TabFM? Googles Foundation-Modell für Tabellen 2026

Google Gemini Embedding 2: Eine Ära der multimodalen Embeddings beginnt