DeepSeek V3.1 發布了
昨天深夜 DeepSeek V3.1 發布了,今天看了一下有幾個值得注意的更新:
混合推理架構:一個模型支援「思考模式」與「非思考模式」,用戶可以在官方 App 裡直接切換。這其實跟最近大家在討論的「多階段 reasoning」概念有點呼應。
思考效率提升:跟之前的 R1-0528 比,V3.1 在思考模式下 token 數減少 20%-50%,但表現不掉,代表他們做了 chain-of-thought 壓縮。這對落地應用蠻關鍵,因為推理成本下降。
Agent 能力:特別提到 post-training 強化了工具使用與 Agent 任務表現,像 SWE、Terminal-Bench、browsecomp、HLE 這些 benchmark 都有顯著提升,意味著他們真的在針對「實際 agent 場景」調校。
V3.1 Base Open-source weights: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
V3.1 Open-source weights: https://huggingface.co/deepseek-ai/DeepSeek-V3.1

好像需要一個 LLM 版?
作者:Peter LY