KI-Radar: Gemini 3.5 Flash & Gemma 4 — schnell gehostet, offen daheim

Google bedient gerade beide Lager auf einmal: ein schnelles geschlossenes Modell für die Cloud und ein offenes für das eigene Haus. Genau dieser Spagat macht die jüngsten Releases interessant.

Zwei Modelle, zwei Welten

Gemini 3.5 Flash: auf agentische Workflows und Coding optimiert, deutlich schnellere Ausgabe als die Vorgänger und stark in werkzeugorientierten Benchmarks. Geschlossen, läuft in Googles Cloud.
Gemma 4 (12B): die offene Linie, frei auf Hugging Face verfügbar und damit selbst hostbar — der Gegenpol zur geschlossenen Flash-Variante.
Tempo vs. Hoheit: Flash punktet mit Geschwindigkeit und Reichweite, Gemma mit Kontrolle und Eigenbetrieb. Beides aus demselben Haus.

Der Vorbehalt

Gemini 3.5 Flash ist schnell und günstig — aber die Eingaben laufen über Googles Cloud. Für personenbezogene oder vertrauliche Daten bleibt das ein DSGVO-Thema. Gemma 4 löst genau das, kostet dafür eigene Hardware und Betrieb. Die Wahl ist keine technische, sondern eine über Datenhoheit.

Unsere Sicht

Dass Google beide Wege parallel bedient, ist ehrlicher als es klingt: Wer Tempo für unkritische Aufgaben braucht, nimmt Flash; wer Hoheit über die Daten will, hostet Gemma selbst. Wir bewerten das pro Aufgabe — und im Mittelstand fällt die Antwort öfter auf die offene Seite, als viele erwarten.