第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!
华尔街见闻·2025-11-28 12:35
模型性能突破 - 最新开源数学模型DeepSeekMath-V2在模拟2025年国际数学奥林匹克竞赛中解决6个问题中的5个,达到金牌水平[1] - 该模型成为首个在IMO级别竞赛中获得金牌的开源模型,其表现直接对标谷歌DeepMind的Gemini高级版本和OpenAI的实验性推理模型[2] - 在中国数学奥林匹克竞赛中达到金牌水平,在普特南数学竞赛中12道题完全解决11道,最终得分118/120,超过人类参赛者90分的最高分记录[4] 技术创新优势 - 采用创新的自我验证训练框架,核心是训练专门"验证器"评估证明过程质量而非最终答案对错[3][10] - 通过验证-生成闭环机制,激励模型在最终确定答案前尽可能多地发现和解决自身推理链条中的问题[10][12] - 采用动态进化策略防止模型过度拟合自身检查机制,通过增加计算量和自动标记难以验证的证明来提升验证难度[3][13] 开源战略意义 - 模型权重根据Apache 2.0许可证公开发布,可供公众下载,被视为人工智能民主化的重要一步[3][5] - 开源社区有能力在尖端AI研究领域追赶甚至比肩顶级闭源实验室,可能引发市场对开源模型是否会侵蚀闭源产品商业护城河的讨论[3] - Hugging Face联合创始人盛赞用户可免费拥有IMO金牌水平模型能力,不受限制地探索、微调和优化模型[5] 行业影响评价 - 社区评价此次发布为"了不起的发布",认为技术堆叠方式更偏向工程创新而非单纯研究[7][9] - 模型解决了AI模型在数学任务中缺乏严谨推理过程的问题,专注于逐步推导而不仅仅是数值答案[10] - 自我验证框架在解决没有已知解决方案的开放性问题时尤为重要,特别是在扩展测试时计算方面[12]