刚刚,DeepSeek发了“终极版”
Seek .Seek .(US:SKLTY) 36氪·2025-09-23 08:54

模型升级发布 - DeepSeek于9月22日晚间在官方API平台发布最新升级的DeepSeek-V3.1-Terminus模型并宣布开源[1] - 新模型在保持原有能力基础上改进了语言一致性和偶发异常字符等Bug,并优化了编程和搜索智能体表现[1] 性能基准测试 - 在非Agent类基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现0.2%-36.5%不等的表现提升[3] - Humanity's Last Exam测试性能提升最明显,从15.9提升至21.7,主要考察专家级高难度知识和多模态深度推理能力[3][5] - Agent测评中网页浏览(BrowseComp)从30.0提升至38.5,简单问答(SimpleQA)从93.4提升至96.8,编程测试(SWE Verified)从66.0提升至68.4[5] Bug修复情况 - 修复了API调用时随机输出"极"、"極"、"extreme"等字样的严重Bug[7] - 解决了多语言混用问题,此前小语种翻译时语言混用比例有时达5%[9] - 经测试确认高危提示词不再触发Bug,多语言翻译问题已得到修复[8][10] 功能应用提升 - 编程能力显著提升,能够创建具有逼真重力摩擦力效果的小球弹跳动画[13] - 搜索智能体能力增强,能够进行交叉验证信息可靠性并整合提炼,提供周全准确的建议[17] 版本部署与命名 - DeepSeek官方App、网页端、小程序与API模型均已同步更新为DeepSeek-V3.1-Terminus[6] - Terminus在拉丁语中意为终点或界限,可能象征该版本是V3.1系列架构的终极版本[20]