DeepSeek
Kostnadseffektiva öppna AI-modeller — V4 ännu ej lanserad
DeepSeek-R1 visade att reinforcement learning kan producera avancerade resonemangsfähigheter i LLM:er utan supervised fine-tuning. Modellen matchade OpenAIs o1 på matematik- och kodningsbenchmarks och släpptes som öppen källkod, vilket demokratiserade tillgången till resonemangsmodeller. Artikeln blev en av de mest diskuterade AI-publikationerna i början av 2025.