DeepSeek-V3.1发布 具备更高的思考效率以及更强的Agent能力

模型架构升级 - 推出混合推理架构 支持思考模式与非思考模式自由切换 [1] - 思考模式效率显著提升 相比R1-0528版本能在更短时间内给出答案 [1] - 上下文长度扩展至128K 同步更新官方App、网页端及API接口 [1] 工具调用与智能体能力 - 编程智能体性能大幅提升 SWE-bench基准测试得分从44.6提高至66.0 [2] - 多语言代码修复能力增强 SWE-bench Multilingual得分从30.5提升至54.5 [2] - 终端任务处理能力显著改善 Terminal-Bench得分从5.7跃升至31.3 [2] 搜索智能体性能 - 复杂搜索任务表现突出 browsecomp指标从8.9提升至30.0 [4] - 中文搜索能力显著增强 browsecomp_zh指标从35.7提升至49.2 [4] - 多学科专家级难题处理改善 HLE测试得分从24.8提升至29.8 [4] 输出效率优化 - 思维链压缩技术实现突破 输出token数减少20%-50%同时保持性能持平 [4] - 非思考模式输出长度得到有效控制 较V3-0324版本明显缩短且性能稳定 [7] - 严格模式Function Calling支持 确保API输出符合schema定义规范 [1] 跨平台兼容性 - 新增Anthropic API格式支持 可无缝接入Claude Code框架 [1] - API接口分化设计 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 [1] - 综合基准测试表现稳定 AIME 2025保持87.5/88.4 GPQA维持81/80.1水平 [5]