DeepSeek-V3.1 發(fā)布,邁向 Agent 時代的第一步
2025-08-21 19:33:03AI云資訊3980
今天,我們正式發(fā)布DeepSeek-V3.1。本次升級包含以下主要變化:
混合推理架構(gòu):一個模型同時支持思考模式與非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時間內(nèi)給出答案;
更強(qiáng)的 Agent 能力:通過 Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
官方 App 與網(wǎng)頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實現(xiàn)思考模式與非思考模式的自由切換。
DeepSeek API 也已同步升級,deepseek-chat對應(yīng)非思考模式,deepseek-reasoner對應(yīng)思考模式,且上下文均已擴(kuò)展為 128K。同時,API Beta 接口支持了strict模式的 Function Calling,以確保輸出的 Function 滿足 schema 定義。(詳見官方文檔:https://api-docs.deepseek.com/zh-cn/guides/function_calling)
另外,我們增加了對Anthropic API格式的支持,讓大家可以輕松將 DeepSeek-V3.1 的能力接入Claude Code框架。(詳見官方文檔:https://api-docs.deepseek.com/zh-cn/guides/anthropic_api)
工具調(diào)用/智能體支持增強(qiáng)編程智能體

表 1:編程智能體測評(SWE 使用內(nèi)部框架測評,相比開源框架 OpenHands 所需輪數(shù)更少;Terminal Bench 使用官方 Terminus 1 framework)
在代碼修復(fù)測評 SWE 與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。
搜索智能體

表 2:搜索智能體測評(測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window;R1-0528 使用內(nèi)部 workflow 模式測試;HLE 測試同時使用 python 與 search 工具)
DeepSeek-V3.1 在多項搜索評測指標(biāo)上取得了較大提升。在需要多步推理的復(fù)雜搜索測試(browsecomp)與多學(xué)科專家級難題測試(HLE)上,DeepSeek-V3.1 性能已大幅領(lǐng)先 R1-0528。
思考效率提升
我們的測試結(jié)果顯示,經(jīng)過思維鏈壓縮訓(xùn)練后,V3.1-Think 在輸出 token 數(shù)減少 20%-50% 的情況下,各項任務(wù)的平均表現(xiàn)與 R1-0528 持平。

在各項評測指標(biāo)得分基本持平的情況下(AIME 2025: 87.5/88.4, GPQA: 81/80.1, liveCodeBench: 73.3/74.8),R1-0528 與 V3.1-Think 的 token 消耗量對比圖
同時,V3.1 在非思考模式下的輸出長度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能夠在輸出長度明顯減少的情況下保持相同的模型性能。
API & 模型開源
模型開源V3.1的Base模型在V3的基礎(chǔ)上重新做了外擴(kuò)訓(xùn)練,一共增加訓(xùn)練了 840B tokens。Base 模型與后訓(xùn)練模型均已在 Huggingface 與魔搭開源。
Base 模型:
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后訓(xùn)練模型:
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。另外,V3.1對分詞器及 chat template 進(jìn)行了較大調(diào)整,與 DeepSeek-V3 存在明顯差異。建議有部署需求的用戶仔細(xì)閱讀新版說明文檔。
價格調(diào)整
我們將于北京時間 2025 年 9 月 6 日凌晨起,對 DeepSeek 開放平臺API接口調(diào)用價格進(jìn)行如下調(diào)整:
執(zhí)行新版價格表(如下圖所示,詳見定價頁面);
取消夜間時段優(yōu)惠。

在9月6日前,所有API服務(wù)仍按原價格政策計費,您可繼續(xù)享受當(dāng)前優(yōu)惠。
同時,為更好地滿足用戶的調(diào)用需求,我們已進(jìn)一步擴(kuò)容 API 服務(wù)資源,歡迎使用!
相關(guān)文章
- 如何查找全國新建工程項目信息?RCC瑞達(dá)恒接入DEEPSEEK,推出AI助手
- DeepSeek-R2要來了?速領(lǐng)450元代金券,模型測評快人一步!
- 禁令解除72小時:141GB H20 跑滿血實測,DeepSeek 性能超預(yù)期
- 工學(xué)通與 DeepSeek:AI 領(lǐng)域的專業(yè)細(xì)分與通用探索
- 百度AI搜索全面接入DeepSeek R1 最新版 進(jìn)一步強(qiáng)化智能搜索體驗
- 青云科技AI算力云大模型服務(wù)上線 DeepSeek-R1-0528
- AI營響力:DeepSeek和智能體寫短視頻腳本,有什么不同?
- 北大楊仝團(tuán)隊發(fā)布FairyR1模型:5%參數(shù)量數(shù)學(xué)和代碼能力超越滿血DeepSeek
- 中文大模型幻覺測評:豆包大模型準(zhǔn)確率全球第一,超越DeepSeek-R1、Gemini-2.5、GPT-4o
- 騰訊云智算全新升級,相關(guān)技術(shù)能力剛獲DeepSeek公開點贊
- 易聯(lián)眾醫(yī)信助力泉州市中醫(yī)院DeepSeek項目入選泉州十佳數(shù)字賦能案例
- DeepSeek+物流行業(yè),AI大模型破解五大場景效能困局
- IBM專家觀點:假如DeepSeek們使用了IBM AI存儲
- 從會議記錄到戰(zhàn)略智庫:訊飛聽見AI紀(jì)要—DeepSeek模式上線!
- 智能協(xié)作新紀(jì)元,華天動力協(xié)同OA系統(tǒng)的HR管理平臺深度融合 DeepSeek的四大應(yīng)用場景
- 聯(lián)想官方零售發(fā)力AI普惠!來酷科技推出DeepSeek本地部署服務(wù)
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案