DeepSeek är ett kinesiskt AI-forskningslabb som skakade AI-branschen 2025 med DeepSeek-R1 och V3. DeepSeek V4 (1T parametrar, 1M tokens kontext, nativt multimodal) har missat flera lanseringsfönster, men en 'V4 Lite' dök upp 9 mars 2026. V4 är en hybridmodell som slår samman resonemang och generella uppgifter (R2 troligen inte separat). Har ny Engram-minnesarkitektur och mHC-design. Träningen flyttades till NVIDIA GPU:er efter stabilitetsproblem med Huawei Ascend.
Transformer architecture used by DeepSeek models
DeepSeek scaled following these principles
Published by DeepSeek
China AI competition discussed
DeepSeek grundat
Kinesiskt AI-labb grundat av Liang Wenfeng, VD för hedgefonden High-Flyer.
DeepSeek-V2 lanserad
Kostnadseffektiv MoE-modell som utmanar västerländska konkurrenter till ett bråkdel av priset.
DeepSeek-V3 släppt som öppen källkod
671B MoE-modell tränad för under 6 miljoner dollar som överträffar betydligt dyrare modeller.
DeepSeek-R1 lanserad — chockar AI-industrin
Resonerandemodell som matchar OpenAIs o1 och skapar panik på Wall Street. NVIDIA-aktien tappar 17% på en dag.
DeepSeek-appen når nr 1 på App Store i USA
Gratis AI-appen går om ChatGPT som mest nedladdad i USA och skapar geopolitisk debatt.
USA överväger exportrestriktioner specifikt mot DeepSeek
Amerikanska politiker diskuterar hårdare chipexportregler efter DeepSeeks framgångar.
DeepSeek-V4 lanserad
Fjärde generationen som fortsätter trenden av hög prestanda till låg kostnad.