DeepSeek V4: Der neue Gigant der Open-Source-KI
Am heutigen 2. Mai 2026 hat DeepSeek den offiziellen Release von DeepSeek V4 abgeschlossen. Während die Gewichte bereits in den letzten Apriltagen schrittweise hochgeladen wurden, ist seit heute die volle API-Integration und die Verfügbarkeit auf Hugging Face finalisiert. Mit einer bahnbrechenden Architektur von 1,6 Billionen Parametern (1.6T) setzt das chinesische Unternehmen neue Maßstäbe, die selbst Branchengrößen wie OpenAI und Anthropic unter Druck setzen.
Architektur: Mixture-of-Experts 2.0
DeepSeek V4 basiert auf der neuen MoE 2.0-Architektur. Das Modell ist zwar riesig, arbeitet aber extrem effizient: Von den 1,6 Billionen Parametern sind pro Token nur etwa 49 Milliarden (49B) aktiv. Dies ermöglicht blitzschnelle Antwortzeiten bei gleichzeitig enormem Wissensschatz.
Zusätzlich zur Flaggschiff-Version "Pro" wurde auch eine "Flash"-Variante veröffentlicht:
| Feature | DeepSeek-V4-Pro | DeepSeek-V4-Flash |
|---|---|---|
| Gesamtparameter | 1,6 Billionen (1.6T) | 284 Milliarden (284B) |
| Aktive Parameter | 49 Milliarden (49B) | 13 Milliarden (13B) |
| Context Window | 1.000.000 Tokens | 1.000.000 Tokens |
| Präzision | FP4 / INT8 | FP4 / INT8 |
Technologische Innovationen: Engram Memory & FP4
Was DeepSeek V4 von bisherigen Modellen unterscheidet, sind zwei fundamentale Neuerungen:
- Engram Memory Module: Dieses Modul erlaubt eine O(1) Wissensabfrage für statische Fakten. Etwa 20-25% der spärlich genutzten Parameter sind speziell für das Gedächtnis reserviert. Dadurch wird das "Wissen" von der "Logik" entkoppelt, was Halluzinationen signifikant reduziert.
- FP4-Präzision: Durch die Nutzung von FP4-Arithmetik für die Experten-Gewichte sinkt der Hardware-Bedarf drastisch. Das 1.6T-Modell kann nun auf deutlich kleineren Clustern (z. B. H200 oder sogar optimierten RTX 5090 Systemen) betrieben werden, was bisher undenkbar war.
Benchmarks: Die Spitze ist erreicht
In den heute veröffentlichten verifizierten Benchmarks zeigt DeepSeek V4 eine beeindruckende Performance, die es auf Augenhöhe mit den neuesten Modellen von Claude (4.7) und GPT (5.5) hebt:
- SWE-Bench Verified: 91,2 % (Spitzenwert in der Softwareentwicklung)
- HumanEval: 96,4 %
- MMLU-Pro: 90,1 %
Besonders hervorzuheben ist das Context Window von 1 Million Tokens, das nun standardmäßig für alle Nutzer – auch in der kostenlosen Chat-Oberfläche – verfügbar ist. Dank der neuen Hybrid Attention (CSA & HCA) wurde der Speicherbedarf für den KV-Cache um bis zu 90 % reduziert.
Verfügbarkeit und Lizenz
DeepSeek bleibt seiner Linie treu: Die Gewichte der Modelle sind unter der MIT-Lizenz frei verfügbar. Dies erlaubt sowohl die private als auch die kommerzielle Nutzung ohne Einschränkungen.
Die API-Preise sind zudem aggressiv gestaltet:
- V4-Pro: $1,74 pro 1 Mio. Input-Tokens / $3,48 pro 1 Mio. Output-Tokens.
- V4-Flash: $0,14 pro 1 Mio. Input-Tokens / $0,28 pro 1 Mio. Output-Tokens.
Fazit: Ein Beben im KI-Markt
Mit dem Release von DeepSeek V4 am heutigen Tag wird klar: Die Dominanz proprietärer Modelle wackelt. Wenn ein Open-Weight-Modell mit 1,6 Billionen Parametern effizient auf erschwinglicher Hardware läuft und gleichzeitig bei Coding- und Reasoning-Aufgaben dominiert, verändert das die Spielregeln für Entwickler und Unternehmen weltweit.
„V4 ist nicht nur ein größeres Modell, es ist ein intelligenteres Modell. Die Trennung von Wissen und Logik durch das Engram-Modul ist der Wendepunkt, auf den wir gewartet haben.“ – Analysten-Stimme zum Launch.