KI-Radar: NVIDIA Nemotron 3 — offen bis auf die Trainingsdaten

Modelle, die ihre Gewichte offenlegen, gibt es inzwischen viele. NVIDIA geht mit Nemotron 3 einen Schritt weiter und legt das gesamte Rezept offen — genau das ist für den Eigenbetrieb der eigentliche Unterschied.

Was Nemotron 3 ausmacht

Drei Größen, ein Ansatz: Nano (31,6 Mrd. Parameter), Super (120 Mrd.) und das im Juni veröffentlichte Ultra (550 Mrd.) decken vom Edge-Server bis zum Multi-GPU-Knoten alles ab.
Hybrid-Architektur: ein Mamba-Transformer-MoE mit bis zu einer Million Token Kontext — auf Effizienz statt auf reine Größe getrimmt.
Wirklich offen: NVIDIA veröffentlicht nicht nur die Gewichte, sondern auch die Trainingsdaten, die Reinforcement-Learning-Umgebungen, die Post-Training-Rezepte und den Fine-Tuning-Code. Das macht Modelle nachvollziehbar und gezielt anpassbar.
Multimodal: die Omni-Varianten verarbeiten Text, Bild und Audio in einem Modell.

Warum uns das interessiert

Wir betreiben die 120-Mrd.-Super-Stufe bereits produktiv auf eigener Hardware — sie trifft den Punkt zwischen Leistungsfähigkeit und vertretbarem GPU-Bedarf. Dass NVIDIA die Trainingsdaten mitliefert, ist kein Marketing-Detail: Wer ein Modell auf die eigene Domäne nachziehen will, braucht genau diese Bausteine.

Der Vorbehalt

Das Ultra-Modell mit 550 Mrd. Parametern ist kein Fall für eine einzelne Karte — hier braucht es einen ernsthaften Multi-GPU-Knoten. Und "offen" heißt nicht automatisch "grenzenlos kommerziell": die Lizenzbedingungen gehören vor dem Produktiveinsatz gelesen.

Unsere Sicht

Nemotron 3 ist für uns das derzeit interessanteste offene US-Modell — weniger wegen einzelner Benchmark-Punkte, mehr wegen der Nachvollziehbarkeit. Ein Modell, dessen Herkunft man kennt, lässt sich verantworten. Genau darum geht es im Mittelstand.