OpenAI新模型突破 - 公司研发的通用推理模型在IMO 2025竞赛中解决6题中的5题,得分35/42,远超此前最佳AI模型Gemini 2.5 Pro的13分 [3][7] - 模型在完全模拟人类比赛条件下(无工具、无网络)完成证明过程,并由前IMO奖牌得主评分 [7] - 该模型具备持续数小时的深度推理能力,突破传统AI以秒或分钟为单位的思维限制 [11][12][13] 技术突破点 - 推理时间范围显著扩展:从GSM8K(0.1分钟)→MATH(1分钟)→AIME(10分钟)→IMO(100分钟) [15] - 模型通过通用强化学习实现能力,而非针对IMO任务专门训练 [19] - 能够构建多页复杂数学证明,超越传统可验证奖励的强化学习范式 [16][17][18] 解题能力细节 - 第一题(解析几何):通过归约引理和n≥3情况分析完成证明 [23][29][30][31] - 第二题(平面几何):转换问题表述并完成四点关键证明步骤 [32][36][37][39] - 第三题(函数):分析素数模同余关系及非恒等函数结构 [40][41][42] - 第五题(博弈论):分三种情况讨论参数λ与阈值c的关系 [50][54] - 第六题未被任何AI模型(包括该新模型)攻克,全球仅6名人类选手解决 [57][58] 模型背景与影响 - 模型代号为"Strawberry",属于实验性项目且不会公开发布 [60] - 此次突破被视为超越"AI攻克IMO"本身的意义,可能标志推理技术新时代 [4][7] - 团队核心成员Alexander Wei曾主导开发达到人类水平的AI外交游戏智能体CICERO [63]
刚刚,OpenAI神秘新模型斩获IMO 2025金牌!攻克奥数巅峰,硅谷沸腾
猿大侠·2025-07-20 12:20