DeepSeek V3

Text

Stor språkmodell med DeepSeek Sparse Attention för effektiv lång kontext och stark resonering.

Modalitet:TextLicens:Open WeightsKontext:164K tokens

Översikt

DeepSeek V3.2 är en stor öppen språkmodell med DeepSeek Sparse Attention för effektiv hantering av lång kontext. Den kombinerar stark allround-prestanda med öppna vikter.

V3.2 är ett kostnadseffektivt arbetshäst-alternativ för team som vill ha kontroll över modellen och driften.

Bäst för

Kostnadseffektiv, öppen allround-modell med bra hantering av långt kontext.

Styrkor

Öppna vikter — kör själv
Effektiv lång kontext (Sparse Attention)
Stark allround-prestanda
Kostnadseffektiv

Begränsningar

Kräver egen hårdvara för full kontroll
Inte en renodlad resonerandemodell

Användningsområden

Textgenerering och sammanfattning

Självhostade applikationer

Långkontextuppgifter

Kostnadskänslig produktion

Specifikationer

Kontextfönster164K tokens

ModalitetText

LicensOpen Weights

Utgivning2025-12-01

APIdeepseek/deepseek-v3.2

Relaterade entiteter

Utvecklad av

Serving optimization partner

Används av

Refererad av

deepseek-v3-technical-report

Publikation

Documents V3 architecture