刚刚，OpenAI神秘新模型斩获IMO 2025金牌！攻克奥数巅峰，硅谷沸腾

OpenAI新模型突破 - 公司研发的通用推理模型在IMO 2025竞赛中解决6题中的5题，得分35/42，远超此前最佳AI模型Gemini 2.5 Pro的13分 [3][7] - 模型在完全模拟人类比赛条件下（无工具、无网络）完成证明过程，并由前IMO奖牌得主评分 [7] - 该模型具备持续数小时的深度推理能力，突破传统AI以秒或分钟为单位的思维限制 [11][12][13] 技术突破点 - 推理时间范围显著扩展：从GSM8K（0.1分钟）→MATH（1分钟）→AIME（10分钟）→IMO（100分钟） [15] - 模型通过通用强化学习实现能力，而非针对IMO任务专门训练 [19] - 能够构建多页复杂数学证明，超越传统可验证奖励的强化学习范式 [16][17][18] 解题能力细节 - 第一题（解析几何）：通过归约引理和n≥3情况分析完成证明 [23][29][30][31] - 第二题（平面几何）：转换问题表述并完成四点关键证明步骤 [32][36][37][39] - 第三题（函数）：分析素数模同余关系及非恒等函数结构 [40][41][42] - 第五题（博弈论）：分三种情况讨论参数λ与阈值c的关系 [50][54] - 第六题未被任何AI模型（包括该新模型）攻克，全球仅6名人类选手解决 [57][58] 模型背景与影响 - 模型代号为"Strawberry"，属于实验性项目且不会公开发布 [60] - 此次突破被视为超越"AI攻克IMO"本身的意义，可能标志推理技术新时代 [4][7] - 团队核心成员Alexander Wei曾主导开发达到人类水平的AI外交游戏智能体CICERO [63]