Was ist Ornith-1.0? Agentic Coding Modelle im Check 2026 Guide
Ornith-1.0 bietet spezialisierte Open-Source-LLMs für Agentic Coding. Erfahre mehr über Benchmarks wie SWE-Bench und die MIT-Lizenz in unserem Guide für 2026.
Ornith-1.0 ist eine neue Familie von Open-Source-Sprachmodellen, die speziell für Aufgaben im Bereich Agentic Coding entwickelt wurden. Die kürzlich veröffentlichte Modellreihe von DeepReinforce basiert auf den Architekturen von Gemma 4 sowie Qwen 3.5 und deckt verschiedene Größen von 9 Milliarden bis 397 Milliarden Parametern ab. Durch den Einsatz von Reinforcement Learning verbessern diese Modelle sowohl die Code-Lösungen als auch die zugrunde liegenden aufgabenspezifischen Strukturen (Scaffolds).
Welche Modelle umfasst die Ornith-1.0 Familie?
Die Modellfamilie ist in vier verschiedene Konfigurationen unterteilt, um unterschiedliche Hardware-Anforderungen und Leistungsansprüche zu bedienen. Dabei kommen sowohl klassische Dense-Modelle als auch effiziente Mixture-of-Experts-Architekturen (MoE) zum Einsatz. Alle Varianten stehen unter der liberalen MIT-Lizenz zur Verfügung, was den Einsatz in kommerziellen Projekten im Jahr 2026 problemlos ermöglicht.
| Modell-Variante | Architektur-Typ | Besonderheit |
|---|---|---|
| Ornith-9B | Dense | Kompakt & Schnell |
| Ornith-31B | Dense | Balance aus Power & Effizienz |
| Ornith-35B | MoE | Hohe Kapazität bei geringem Rechenaufwand |
| Ornith-397B | MoE | Maximale Performance für komplexe Agenten |
Wie schlägt sich Ornith-1.0 in Coding-Benchmarks?
In aktuellen Leistungstests erzielt Ornith-1.0 Spitzenwerte und positioniert sich als State-of-the-Art im Open-Source-Sektor. Besonders hervorzuheben ist die Performance im SWE-Bench, einem harten Test für die Lösung realer Softwareprobleme. Hier erreicht die Modellfamilie einen Wert von 82,4 auf dem „Verified“-Set, was eine deutliche Steigerung gegenüber vielen Vorgängermodellen darstellt.
Die wichtigsten Leistungswerte im Überblick:
- SWE-Bench: 82,4 (Verified), 62,2 (Pro), 78,9 (Multilingual)
- Terminal-Bench 2.1: 77,5
- ClawEval: 77,1
- NL2Repo: 48,2
- SWE Atlas: 41,2 (QnA), 42,6 (RF)
Warum ist der Ansatz des Task-Specific Scaffolding neu?
Der technische Durchbruch von Ornith-1.0 liegt in der Art des Trainings begründet. Während herkömmliche Modelle primär auf die Generierung von Text oder Code optimiert werden, nutzt DeepReinforce Reinforcement Learning (RL) für einen dualen Prozess. Das Modell lernt während des Trainings, sogenannte aufgabenspezifische Scaffolds zu erstellen.
Diese Gerüste dienen als Anleitung oder Denkrahmen, die den Lösungsweg strukturieren. Das Modell verbessert somit zyklisch den Rahmen der Aufgabe und die finale Lösung gleichzeitig. Dieser integrierte Prozess führt dazu, dass die KI bei komplexen Coding-Aufgaben, die mehrere Schritte oder das Navigieren in großen Repositories erfordern, deutlich weniger Fehler macht als klassische LLMs. Da die Modelle auf Gemma 4 und Qwen 3.5 aufbauen, profitieren Anwender von einer extrem stabilen Basis mit modernster Tokenisierung.
Die Modelle sind ab sofort über Hugging Face verfügbar: huggingface.co/collections/deepreinforce-ai/ornith-10
Häufige Fragen
Was zeichnet die Ornith-1.0 Modellfamilie aus?
Ornith-1.0 ist eine Open-Source-Modellreihe von DeepReinforce, die speziell für Agentic Coding entwickelt wurde. Diese Modelle basieren auf Gemma 4 sowie Qwen 3.5 und nutzen Reinforcement Learning zur Optimierung von Code-Lösungen.
Welche Modellvarianten stehen zur Verfügung?
Die Modellfamilie umfasst vier Konfigurationen von 9B bis 397B Parametern in Dense- oder MoE-Architekturen. Du kannst zwischen kompakten Varianten wie Ornith-9B oder der Hochleistungs-Variante Ornith-397B für komplexe Agenten wählen.
Wie gut ist die Performance in Coding-Benchmarks?
Ornith-1.0 erzielt im SWE-Bench einen Spitzenwert von 82,4 auf dem Verified-Set und setzt damit neue Standards im Open-Source-Bereich. Die Modelle zeigen zudem starke Ergebnisse im Terminal-Bench 2.1 und bei multilingualen Coding-Aufgaben.
Was verbirgt sich hinter dem Task-Specific Scaffolding?
Dieser neue Ansatz nutzt Reinforcement Learning, um gleichzeitig die Code-Lösung und den strukturellen Denkrahmen zu verbessern. Das Modell minimiert durch diese zyklische Optimierung der Scaffolds Fehler beim Navigieren in großen Repositories.
Quellen
- deep-reinforce.com — deep-reinforce.com (abgerufen 2026-06-26)
- huggingface.co — huggingface.co (abgerufen 2026-06-26)
- remio.ai — remio.ai (abgerufen 2026-06-26)
- marktechpost.com — marktechpost.com (abgerufen 2026-06-26)
- huggingface.co — huggingface.co (abgerufen 2026-06-26)
- infohub.delltechnologies.com — infohub.delltechnologies.com (abgerufen 2026-06-26)
- mindstudio.ai — mindstudio.ai (abgerufen 2026-06-26)
- reddit.com — reddit.com (abgerufen 2026-06-26)
- deep-reinforce.com — deep-reinforce.com (abgerufen 2026-06-26)