senn-techsenn-tech
Zurück zum Blog
KI-News
KI-News2026-06-15

KI-Radar: MiniMax M3 — Open-Weight mit Millionen-Kontext

Wir hatten MiniMax schon als unterschätzten Herausforderer auf dem Schirm. Mit der Sprung von der M2-Reihe (M2.5, M2.7) auf M3 wird der Anbieter jetzt deutlich interessanter — vor allem für einen Anwendungsfall, der im Mittelstand oft unterschätzt wird: sehr lange Kontexte.

Was M3 besonders macht

  • Eine Million Token Kontext: ganze Akten, Verträge oder Codebasen passen am Stück ins Modell — ohne mühsames Zerstückeln.
  • Neue Attention (MSA): die "MiniMax Sparse Attention" filtert relevante Speicherblöcke vor, statt jedes Token mit jedem zu vergleichen. Laut MiniMax sinkt der Rechenaufwand bei vollem Kontext drastisch, Eingaben und Antworten werden um ein Vielfaches schneller. Genau das macht lange Kontexte überhaupt erst bezahlbar.
  • Nativ multimodal: Text und Bild werden gemeinsam verarbeitet, nicht nachträglich angeflanscht.
  • Coding & Agenten: in ersten öffentlichen Coding-Benchmarks (SWE-Bench Pro) spielt M3 auf Augenhöhe mit führenden proprietären Modellen — interessant für agentische Workflows.
  • Offene Gewichte: M3 erscheint auf Hugging Face und GitHub und lässt sich damit prinzipiell selbst hosten.

Der wichtige Vorbehalt

Die gehostete MiniMax-API wird aus China betrieben. Für personenbezogene oder vertrauliche Daten ist das ein klares DSGVO-Thema — die Eingaben verlassen die EU. Und der Millionen-Kontext ist kein Selbstläufer: im Eigenbetrieb braucht er ernsthafte GPU-Ressourcen. Beides gehört vor dem Produktiveinsatz geprüft.

Unsere Sicht

Wir bewerten Modelle nach Aufgabe, nicht nach Marke. M3 wandert auf unsere Testliste — gerade für kontextlastige Fälle auf eigener Hardware, bei denen Datenhoheit und lange Dokumente zusammenkommen. Das beste Werkzeug fürs Problem, nicht das lauteste.