KI-Radar: NVIDIA Nemotron 3 — offen bis auf die Trainingsdaten
Modelle, die ihre Gewichte offenlegen, gibt es inzwischen viele. NVIDIA geht mit Nemotron 3 einen Schritt weiter und legt das gesamte Rezept offen — genau das ist für den Eigenbetrieb der eigentliche Unterschied.
Was Nemotron 3 ausmacht
- Drei Größen, ein Ansatz: Nano (31,6 Mrd. Parameter), Super (120 Mrd.) und das im Juni veröffentlichte Ultra (550 Mrd.) decken vom Edge-Server bis zum Multi-GPU-Knoten alles ab.
- Hybrid-Architektur: ein Mamba-Transformer-MoE mit bis zu einer Million Token Kontext — auf Effizienz statt auf reine Größe getrimmt.
- Wirklich offen: NVIDIA veröffentlicht nicht nur die Gewichte, sondern auch die Trainingsdaten, die Reinforcement-Learning-Umgebungen, die Post-Training-Rezepte und den Fine-Tuning-Code. Das macht Modelle nachvollziehbar und gezielt anpassbar.
- Multimodal: die Omni-Varianten verarbeiten Text, Bild und Audio in einem Modell.
Warum uns das interessiert
Wir betreiben die 120-Mrd.-Super-Stufe bereits produktiv auf eigener Hardware — sie trifft den Punkt zwischen Leistungsfähigkeit und vertretbarem GPU-Bedarf. Dass NVIDIA die Trainingsdaten mitliefert, ist kein Marketing-Detail: Wer ein Modell auf die eigene Domäne nachziehen will, braucht genau diese Bausteine.
Der Vorbehalt
Das Ultra-Modell mit 550 Mrd. Parametern ist kein Fall für eine einzelne Karte — hier braucht es einen ernsthaften Multi-GPU-Knoten. Und "offen" heißt nicht automatisch "grenzenlos kommerziell": die Lizenzbedingungen gehören vor dem Produktiveinsatz gelesen.
Unsere Sicht
Nemotron 3 ist für uns das derzeit interessanteste offene US-Modell — weniger wegen einzelner Benchmark-Punkte, mehr wegen der Nachvollziehbarkeit. Ein Modell, dessen Herkunft man kennt, lässt sich verantworten. Genau darum geht es im Mittelstand.