DeepSeek上新,“奥数金牌水平”
第一财经·2025-11-28 08:35
模型发布与性能表现 - 公司于2025年11月27日晚在Hugging Face上开源新模型DeepSeek-Math-V2,这是行业首个达到国际奥林匹克数学竞赛金牌水平且开源的模型[3] - 在Basic基准上,该模型取得近99%的高分,远高于第二名谷歌Gemini Deep Think的89%[5] - 在更难的Advanced子集上,该模型分数为61.9%,略逊于谷歌Gemini Deep Think的65.7%[5] 技术创新与突破 - 模型从结果导向转向过程导向,具备强大的定理证明能力,不依赖大量数学题答案数据,而是教会AI像数学家一样严谨地审查证明过程[8] - 该技术突破当前AI数学推理的研究局限,即正确的最终答案不能保证正确的推理,通过自我验证来扩展测试时间计算,特别是针对没有已知解决方案的开放问题[8] - 模型在IMO 2025和CMO 2024上取得金牌级成绩,在Putnam 2024上通过扩展测试计算实现接近满分的118/120分[8] 行业影响与市场反应 - 海外市场反应积极,有评论称“鲸鱼终于回来了”,并以10个百分点优势击败谷歌的IMO Gold获奖模型DeepThink[9] - 行业头部厂商模型近期密集迭代,包括OpenAI发布GPT-5.1、xAI发布Grok 4.1、谷歌发布Gemini 3系列,市场期待公司下一步动作[9] - 外界更关注公司旗舰模型的更新时间,行业期待“鲸鱼”的下一个动作[9]