VIBE CODING
NEWS2 min read

Was ist MiniMax M3? Neues MoE-Modell mit 1M Kontextfenster 2026

MiniMax M3 ist ein neues MoE-Modell mit 1M Token Kontext. Erfahre alles über Benchmarks, Sparse Attention und Open-Source-Vorteile im Guide für das Jahr 2026.

MiniMax M3 ist ein leistungsstarkes Mixture-of-Experts-Sprachmodell mit einer Gesamtkapazität von 428 Milliarden Parametern und 23 Milliarden aktiven Parametern pro Inferenzschritt. Das Modell zeichnet sich durch eine native Multimodalität sowie ein massives Kontextfenster von einer Million Token aus, was die Verarbeitung extrem umfangreicher Dokumente ermöglicht.

Wie funktioniert die Architektur von MiniMax M3?

Das Modell nutzt eine fortschrittliche Mixture-of-Experts-Struktur (MoE), um Effizienz und Leistung zu balancieren. Während die Gesamtzahl der Parameter bei 428 Milliarden liegt, werden pro Token nur 23 Milliarden Parameter aktiviert. Ein zentrales technisches Merkmal ist der eigens entwickelte MiniMax-Sparse-Attention-Mechanismus. Dieses Verfahren optimiert die Aufmerksamkeitsschicht des Modells, wodurch die Geschwindigkeit bei der lokalen Ausführung (Inferenz) sowie die allgemeine Aufgaben-Effizienz im Vergleich zu Standard-Attention-Mechanismen um ein Vielfaches steigt.

Durch die native Multimodalität kann MiniMax M3 unterschiedliche Datentypen wie Text und Bilder ohne externe Zusatzmodule verarbeiten. Das Kontextfenster von 1.000.000 Token erlaubt es Entwicklern, ganze Code-Repositories oder hunderte PDF-Dokumente in einem einzigen Prompt zu analysieren.

Welche Benchmarks erreicht MiniMax M3 im Vergleich?

In aktuellen Leistungstests zeigt MiniMax M3 eine überlegene Performance gegenüber etablierten Modellen der Branche. Besonders in spezialisierten Entwickler-Benchmarks wie SWE-Bench Pro oder BrowseComp erzielt das Modell Spitzenwerte, die teilweise über denen von Claude Opus 4.7 liegen.

BenchmarkMiniMax M3 ScoreVergleichsmodell (Claude Opus 4.7)
BrowseComp83,5 %79,3 %
Terminal Bench 2.166,0 %N/A
SWE-Bench Pro59,0 %N/A

Die Ergebnisse verdeutlichen, dass MiniMax M3 insbesondere bei der Interaktion mit Browser-Umgebungen und komplexen Software-Engineering-Aufgaben im Jahr 2026 neue Standards setzt.

Wo ist MiniMax M3 verfügbar?

Die Modellgewichte von MiniMax M3 wurden kürzlich als Open-Source-Ressourcen für die Community bereitgestellt. Entwickler können auf die Daten über gängige Plattformen wie Hugging Face und GitHub zugreifen, um das Modell in eigene Workflows zu integrieren oder lokal zu hosten.

Folgende Ressourcen stehen zur Verfügung:

  • Vollständige Modellgewichte für die Inferenz
  • Dokumentation zur Sparse-Attention-Implementierung
  • Beispiel-Skripte für das 1M-Kontext-Handling

Durch die Veröffentlichung auf GitHub wird die Barriere für den Einsatz hochperformanter KI-Modelle in privaten Infrastrukturen weiter gesenkt. github.com/MiniMax-AI/MiniMax-M3

Häufige Fragen

Was zeichnet die Architektur von MiniMax M3 aus?

MiniMax M3 nutzt eine Mixture-of-Experts-Struktur mit insgesamt 428 Milliarden Parametern, wobei pro Inferenzschritt lediglich 23 Milliarden Parameter aktiv sind. Ein spezieller Sparse-Attention-Mechanismus optimiert die Rechenleistung und ermöglicht eine hocheffiziente Verarbeitung lokaler Anfragen.

Wie groß ist das Kontextfenster von MiniMax M3?

Das Modell bietet ein massives Kontextfenster von einer Million Token für die Analyse extrem umfangreicher Datenmengen. Du kannst damit ganze Code-Repositories oder hunderte PDF-Dokumente gleichzeitig in einem einzigen Prompt verarbeiten.

Wie schneidet MiniMax M3 in Benchmarks ab?

MiniMax M3 erzielt Spitzenwerte in spezialisierten Tests wie BrowseComp und SWE-Bench Pro, die teilweise über der Leistung von Claude Opus 4.7 liegen. Das Modell setzt damit im Jahr 2026 neue Standards für Software-Engineering und Aufgaben in Browser-Umgebungen.

Ist MiniMax M3 als Open Source verfügbar?

Die Modellgewichte stehen der Community als Open-Source-Ressourcen auf Plattformen wie Hugging Face und GitHub zur Verfügung. Entwickler können die Daten für die lokale Inferenz nutzen und auf Skripte für das Handling des großen Kontextfensters zugreifen.

Quellen

  1. github.com github.com (abgerufen 2026-06-12)
  2. opensourceforu.com opensourceforu.com (abgerufen 2026-06-12)
  3. ollama.com ollama.com (abgerufen 2026-06-12)
  4. openrouter.ai openrouter.ai (abgerufen 2026-06-12)
  5. youtube.com youtube.com (abgerufen 2026-06-12)
  6. youtube.com youtube.com (abgerufen 2026-06-12)
  7. platform.minimax.io platform.minimax.io (abgerufen 2026-06-12)
  8. together.ai together.ai (abgerufen 2026-06-12)
  9. huggingface.co huggingface.co (abgerufen 2026-06-12)