新突破!DeepSeek推出新模型
新华网财经·2025-11-28 09:15

模型发布与技术突破 - 公司于11月27日晚间在HuggingFace推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架[2] - 新模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,利用高难度样本持续优化性能[3] - 核心架构构建自驱动的验证-生成闭环:一个LLM作为“审稿人”担任证明验证器,另一个LLM作为“作者”负责证明生成,两者通过强化学习机制相互协作,并引入“元验证”层抑制模型幻觉[5] 竞赛表现与性能指标 - 在IMO 2025和CMO 2024中均达到金牌水平,在Putnam 2024竞赛中取得118/120(98.3%)近乎满分的优异成绩[3] - IMO 2025竞赛中P1-P5问题解决率达到83.3%,CMO 2024竞赛中得分率为73.8%[4] - 在自主构建的91个CNML级别问题测试中,在代数、几何、数论、组合学和不等式等所有类别均超越GPT-5-Thinking-High和Gemini 2.5-Pro的表现[7] - 在IMO-ProofBench基准测试中,基础集上人工评估结果优于DeepMind的DeepThink(IMO金牌水平),在高级集上保持强劲竞争力并显著超越所有其他基准模型[8] 技术验证与开源策略 - 该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向[5] - 新模型代码与权重已开源,发布于Hugging Face及GitHub平台[5] - 公司认为自我验证的数学推理是可行研究方向,有助于开发功能更强大的数学人工智能系统[10]