新突破！DeepSeek推出新模型

模型发布与技术突破 - 公司于11月27日晚间在HuggingFace推出新型数学推理模型DeepSeekMath-V2，采用可自我验证的训练框架[2] - 新模型基于DeepSeek-V3.2-Exp-Base构建，通过LLM验证器自动审查生成的数学证明，利用高难度样本持续优化性能[3] - 核心架构构建自驱动的验证-生成闭环：一个LLM作为“审稿人”担任证明验证器，另一个LLM作为“作者”负责证明生成，两者通过强化学习机制相互协作，并引入“元验证”层抑制模型幻觉[5] 竞赛表现与性能指标 - 在IMO 2025和CMO 2024中均达到金牌水平，在Putnam 2024竞赛中取得118/120（98.3%）近乎满分的优异成绩[3] - IMO 2025竞赛中P1-P5问题解决率达到83.3%，CMO 2024竞赛中得分率为73.8%[4] - 在自主构建的91个CNML级别问题测试中，在代数、几何、数论、组合学和不等式等所有类别均超越GPT-5-Thinking-High和Gemini 2.5-Pro的表现[7] - 在IMO-ProofBench基准测试中，基础集上人工评估结果优于DeepMind的DeepThink（IMO金牌水平），在高级集上保持强劲竞争力并显著超越所有其他基准模型[8] 技术验证与开源策略 - 该成果验证了自验证推理路径的可行性，为构建可靠数学智能系统提供新方向[5] - 新模型代码与权重已开源，发布于Hugging Face及GitHub平台[5] - 公司认为自我验证的数学推理是可行研究方向，有助于开发功能更强大的数学人工智能系统[10]