Was ist MiniMax M3? Neues KI-Modell mit 1M Kontext im Guide 2026

MiniMax M3 ist ein leistungsstarkes Open-Weight-KI-Modell, das speziell für den Einsatz als Agent, die Verarbeitung von extrem langen Kontexten und native Multimodalität entwickelt wurde. Die Architektur basiert auf der sogenannten MiniMax Sparse Attention, die es ermöglicht, bis zu 1.000.000 Token stabil zu verarbeiten. Damit positioniert sich das Modell als eine der stärksten Veröffentlichungen im Jahr 2026.

Welche Benchmarks erreicht MiniMax M3?

Das Modell demonstriert eine bemerkenswerte Effizienz in spezialisierten Testumgebungen, insbesondere im Bereich Software-Engineering und Terminal-Interaktion. In internen Messungen übertrifft MiniMax M3 etablierte Modelle wie GPT-5.5 und Opus in Kategorien wie BrowseComp und SVG Bench. Besonders hervorzuheben ist die Leistung auf OSWorld Verified, wo es eine höhere Genauigkeit als Opus erzielt.

Benchmark	Ergebnis	Fokusbereich
SWE-Bench Pro	59.0%	Software Engineering
Terminal Bench 2.1	66.0%	Terminal-Steuerung
MCP Atlas	74.2%	Agenten-Protokolle
KernelBench Hard	28.8%	Kernel-Programmierung

Die Ergebnisse verdeutlichen, dass das Modell vor allem bei komplexen Programmieraufgaben (Coding) und der Arbeit mit tiefen Systemstrukturen seine Stärken ausspielt. Seit Kurzem steht MiniMax M3 Entwicklern zur Verfügung, um diese Kapazitäten in eigenen Anwendungen zu testen.

Wie funktioniert MiniMax Code?

Zusätzlich zum Basismodell wurde MiniMax Code veröffentlicht, eine dedizierte Arbeitsumgebung für die Softwareentwicklung. Diese Umgebung nutzt die nativen Fähigkeiten von MiniMax M3, um Code-Kontexte über massive Dateistrukturen hinweg zu verstehen. Durch die Integration der 1M-Kontext-Länge können Entwickler ganze Repositories in den Arbeitsspeicher der KI laden, ohne wichtige Informationen durch Kürzungen (Truncation) zu verlieren.

Die Funktionen von MiniMax Code umfassen:

Native Unterstützung verschiedener Modalitäten (Bild, Text, Code).
Optimierte Workflows für autonome Agenten.
Direkte Anbindung an die MiniMax-API für skalierbare Projekte.

Welche Kosten fallen für die Nutzung an?

Die Preisgestaltung von MiniMax ist auf Flexibilität ausgelegt, wobei der Fokus auf dem Token-Verbrauch liegt. In der ersten Woche nach der Veröffentlichung gewährt der Anbieter einen Rabatt von 50 % auf die Standardnutzung mit einem Kontext von bis zu 512K Token. Dies macht den Einstieg für Teams, die von proprietären Modellen auf Open-Weight-Lösungen umsteigen möchten, besonders attraktiv.

Standard-Kontext: Bis 512K (aktuell rabattiert).
Extended-Kontext: Bis 1M Token via Sparse Attention.
API-Verfügbarkeit: Über die offizielle Plattform zugänglich.

Für Entwickler, die das Modell in ihre Infrastruktur integrieren möchten, stehen detaillierte Tarifpläne auf der Plattform bereit. Die Kombination aus hoher Leistung in Benchmarks wie BankerToolBench und der moderaten Preispolitik markiert einen wichtigen Schritt für Open-Source-KI im Jahr 2026.

Quelle: http://platform.minimax.io

Häufige Fragen

Was zeichnet die Architektur von MiniMax M3 aus?

MiniMax M3 nutzt die sogenannte MiniMax Sparse Attention, um einen extrem langen Kontext von bis zu 1.000.000 Token stabil zu verarbeiten. Diese Struktur ermöglicht dir den Einsatz des Modells als leistungsstarker Agent mit nativer Multimodalität.

In welchen Bereichen erzielt MiniMax M3 die besten Benchmark-Ergebnisse?

Das Modell erzielt Bestwerte in den Bereichen Software-Engineering und Terminal-Interaktion, wie beispielsweise 59,0 % im SWE-Bench Pro. Du profitierst hierbei von einer Genauigkeit, die etablierte Modelle wie GPT-5.5 oder Opus in Kategorien wie OSWorld übertrifft.

Welche Vorteile bietet MiniMax Code für Entwickler?

MiniMax Code stellt dir eine dedizierte Arbeitsumgebung bereit, die massive Dateistrukturen über die gesamte 1M-Kontext-Länge hinweg ohne Informationsverlust versteht. Du kannst damit ganze Repositories laden und optimierte Workflows für autonome Agenten direkt über die API nutzen.

Wie ist die Preisgestaltung für das KI-Modell aufgebaut?

Die Kosten orientieren sich flexibel am Token-Verbrauch, wobei zwischen einem Standard-Kontext bis 512K und einem Extended-Kontext bis 1M Token unterschieden wird. Du erhältst in der Einführungswoche einen Rabatt von 50 % auf die Standardnutzung, was den Umstieg auf diese Open-Weight-Lösung besonders attraktiv macht.

Quellen

platform.minimax.io — platform.minimax.io (abgerufen 2026-06-01)

code.minimax.io — code.minimax.io (abgerufen 2026-06-01)

felloai.com — felloai.com (abgerufen 2026-06-01)

llmreference.com — llmreference.com (abgerufen 2026-06-01)

ollama.com — ollama.com (abgerufen 2026-06-01)