← Zurück zur Übersicht Gemma 4 ist da: Google öffnet seine lokalen KI-Modelle jetzt unter Apache 2.0

Gemma 4 ist da: Google öffnet seine lokalen KI-Modelle jetzt unter Apache 2.0

Gemma 4 ist da: Google macht offene KI lokal deutlich interessanter

Am 2. April 2026 hat Google Gemma 4 offiziell gestartet. Der Zeitpunkt ist relevant, weil es nicht nur um ein weiteres Modell-Update geht. Google stellt die neue Familie ausdrücklich als seine bisher leistungsfähigsten offenen Modelle vor und veröffentlicht sie zugleich unter Apache 2.0.

Das ist die eigentliche Nachricht: Für Entwickler, Teams und Unternehmen wird lokaler Einsatz damit schlagartig einfacher planbar. Wer Modelle auf eigener Hardware, im Firmennetz oder direkt auf Geräten einsetzen will, muss sich nicht mehr durch eine speziell zugeschnittene Modelllizenz arbeiten, sondern kann mit einem bekannten Open-Source-Standard kalkulieren.

Screenshot der offiziellen Google-Gemma-4-Seite

Was Google am 2. April konkret bestätigt hat

Google nennt vier neue Varianten:

Modell Fokus Genannter Einsatz
E2B Edge, geringe Latenz Smartphones, Raspberry Pi, Jetson Orin Nano
E4B Edge, multimodal Mobile und IoT-nahe Offline-Workloads
26B MoE Tempo bei weniger aktiven Parametern Lokale Entwickler-Workstations, Agent-Workflows
31B Dense Maximale Qualität in der Familie Anspruchsvollere lokale Reasoning- und Coding-Aufgaben

Laut Google bringt Gemma 4 unter anderem:

  • native Unterstützung für Function Calling, strukturiertes JSON und System Instructions
  • multimodale Verarbeitung von Bildern und Video in allen Modellen
  • Audio-Eingabe bei E2B und E4B
  • bis zu 128K Kontext bei den Edge-Modellen und 256K Kontext bei den größeren Varianten
  • Training auf mehr als 140 Sprachen

Damit zielt Gemma 4 nicht nur auf Chatbots, sondern sehr direkt auf lokale Coding-Assistenten, Tool-Agents und On-Device-Anwendungen.

Warum Apache 2.0 hier mehr ist als ein Nebensatz

Google hat parallel im Google Open Source Blog klargestellt, dass Gemma 4 die ersten Modelle der Gemma-Reihe mit OSI-anerkannter Apache-2.0-Lizenz sind. Für viele Teams ist genau das der Unterschied zwischen "interessant" und "produktionsreif".

Der praktische Effekt:

  • klarere Regeln für Modifikation und Weitergabe
  • weniger Reibung bei interner Prüfung durch Legal- und Compliance-Teams
  • bessere Passform für lokale, souveräne oder regulatorisch empfindliche Deployments
  • mehr Planungssicherheit für Produkte, die nicht nur experimentell laufen sollen

Gerade am 3. April 2026, also einen Tag nach dem Launch, ist das der Punkt mit der größten Tragweite. Benchmarks altern schnell. Eine Lizenzänderung dieser Größe verändert dagegen sofort, wer das Modell real einsetzen darf und wie schnell daraus echte Produkte werden.

Was davon schon jetzt nutzbar ist

Google nennt zum Start mehrere direkte Einstiegspunkte:

  • Google AI Studio für die größeren Modelle
  • Google AI Edge Gallery für E2B und E4B
  • AICore Developer Preview für Android-nahe agentische Flows
  • Day-one-Support über Tools wie vLLM, llama.cpp, Ollama, Docker und LM Studio

Google schreibt außerdem, dass die größeren Varianten auf starker Hardware lokal laufen können und quantisierte Versionen ausdrücklich für Consumer-GPUs gedacht sind. Für Leser mit RTX-Workstation oder leistungsstarkem Homelab ist das die entscheidende Schwelle: Gemma 4 ist nicht nur Cloud-Material, sondern von Tag eins an als lokal betreibbare Modellfamilie positioniert.

Warum das Thema gerade jetzt wichtig ist

Die AI-Branche bewegt sich im April 2026 in zwei Richtungen gleichzeitig: Modelle werden stärker agentisch, und zugleich wächst der Druck, Daten lokal, privat und auditierbar zu verarbeiten. Genau in diese Lücke stößt Gemma 4.

Google kombiniert hier drei Signale in einer einzigen Veröffentlichung:

  1. mehr Modellleistung pro Hardware-Budget
  2. klarere Open-Source-Lizenz
  3. offizieller Fokus auf Edge, Android und lokale Workstations statt nur Cloud-Inferenz

Das macht den Launch vom 2. April 2026 relevanter als ein normales Modell-Refresh. Für Entwickler bedeutet er, dass lokale AI-Projekte mit Funktionsaufrufen, strukturierten Outputs und multimodalen Eingaben deutlich realistischer werden, ohne sofort in proprietäre Plattformlogik zu kippen.

Einordnung

Ob Gemma 4 in realen Projekten sofort gegen die stärksten offenen Konkurrenten gewinnt, muss sich erst im Alltag zeigen. Bestätigt ist aber schon jetzt: Google hat seine offene Modellstrategie einen Schritt näher an produktionsreife lokale Nutzung geschoben.

Wer heute an On-Device-AI, lokalen Coding-Assistenten, privaten Agent-Workflows oder Android-naher Inferenz arbeitet, sollte diesen Start nicht als bloßen Modellnamen abtun. Der eigentliche Hebel ist die Kombination aus Apache 2.0, breiter Tool-Unterstützung und einem klaren Fokus auf Hardware außerhalb der reinen Cloud.

Quellen