VIBE CODING
NEWS3 min read

ByteDance revolutioniert KI-Agenten: DeerFlow 2.0 startet mit Multi-Agenten-Architektur

ByteDance hat DeerFlow 2.0 neu aufgelegt: Eine von Grund auf neu entwickelte KI-Agenten-Runtime, die auf LangGraph und LangChain basiert.

ByteDance hat DeerFlow 2.0 neu aufgelegt und damit eine von Grund auf neu entwickelte Plattform für KI-Agenten vorgestellt. Im Gegensatz zur ersten Version, die ein Framework für Deep Research war, ist DeerFlow 2.0 ein vollwertiges Runtime für Agenten, das auf LangGraph und LangChain basiert.

Kernarchitektur und Multi-Agenten-Orchestrierung

Das Herzstück von DeerFlow 2.0 ist eine intelligente Multi-Agenten-Architektur. Ein Hauptagent empfängt eine Aufgabe, zerlegt diese in Unteraufgaben und generiert bei Bedarf Sub-Agenten.

Jeder dieser Sub-Agenten arbeitet in einem isolierten Kontext, was bedeutet, dass er weder die Daten anderer Agenten noch des Hauptprozesses einsehen kann. Wo immer möglich, werden Sub-Agenten parallel ausgeführt und liefern strukturierte Ergebnisse, die der Hauptagent dann zu einem finalen Output zusammenfügt.

Eine Session läuft in einem isolierten Docker-Container mit einem vollwertigen Dateisystem, in dem der Hauptagent und die Sub-Agenten gemeinsam agieren. Agenten können Dateien lesen und schreiben, Bash-Befehle ausführen und mit Bildern arbeiten, ohne dass es zu Verwechslungen zwischen den Sessions kommt.

Skills und Tools für vielseitige Agenten

Die Fähigkeiten eines Agenten werden über sogenannte Skills definiert. Standardmäßig sind Fähigkeiten wie Recherche, Berichtserstellung, Erstellung von Folien, Webseiten, Bildern und Videos enthalten. Skills werden bedarfsorientiert geladen, nur wenn die Aufgabe sie erfordert. Dies reduziert die Belastung des Kontextfensters und ermöglicht die Arbeit mit Modellen, die sensibel auf den Token-Verbrauch reagieren.

Tools folgen der gleichen Logik: Ein Basissatz (Web-Suche, Fetch, Dateisystemzugriff, Bash) wird durch die Unterstützung von MCP-Servern und beliebigen Python-Funktionen ergänzt. Alle Tools können ersetzt oder erweitert werden.

Intelligentes Gedächtnis und Kontextmanagement

DeerFlow merkt sich den Benutzer über mehrere Sessions hinweg. Dabei wird ein Profil aufgebaut, das Schreibstil, technischen Stack und wiederkehrende Szenarien umfasst. Diese Daten werden lokal gespeichert.

Innerhalb einer langen Session verwaltet das System den Kontext selbstständig: Abgeschlossene Unteraufgaben werden zusammengefasst, und Zwischenergebnisse werden auf die Festplatte ausgelagert, um ein Aufblähen des Kontextfensters zu verhindern.

Integrationen und Modellunterstützung

Das System unterstützt Integrationen mit Telegram, Slack und Feishu. Eine besondere Funktion bietet die Interaktion mit einer laufenden DeerFlow-Instanz direkt aus Claude Code über einen speziellen Skill: Hier können Aufgaben gesendet, Threads verwaltet und der Ausführungsmodus gewählt werden.

DeerFlow ist mit jedem Modell über die OpenAI API kompatibel, einschließlich lokaler Modelle über Ollama. ByteDance empfiehlt die Verwendung von Modellen, die einen langen Kontext (100k+ Tokens), Reasoning-Fähigkeiten, Multimodalität und zuverlässigen Tool-Use unterstützen.

DeerFlow lässt sich auch als Python-Bibliothek ohne den Start von HTTP-Diensten einbetten:

from src.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("Analyze this paper", thread_id="my-thread")

Quelle: https://github.com/bytedance/deer-flow