核心观点 - GPT-5在组合优化领域的数学推理能力取得重大突破,首次通过「哥德尔测试」,成功破解三大数学猜想,并能在某些情况下自主推翻原有猜想,提供新的有效解法[1][8][31] - 该研究标志着AI正从学习数学向真正进行数学研究的关键跨越,为未来科研范式变革提供了预演[8] - 尽管在明确、单一的推理路径上表现出色,但GPT-5在需要整合不同证明的复杂问题上仍存在短板,缺乏「整合性推理」能力[41][44] 研究背景与设计 - 研究由海法大学和思科主导,首次让AI直面「开放性数学猜想」的挑战,模拟了数学家从少量线索出发独立探索的真实研究场景[3][14][18] - 研究团队设计了五项「组合优化」领域的测试任务,每个问题仅提供最小化描述和1-2篇参考文献,难度设定为优秀本科生或研究生有望在一天内解决[14][15][16] - 与陶哲轩此前需要大量提示的合作模式不同,此次测试没有提供大量提示或指导,旨在评估AI的独立推理能力[14] GPT-5具体表现 - 在三个相对简单的问题上,GPT-5给出了近乎完美的解法,证明了其强大的逻辑推理水平[4] - 在猜想一(「单调+非单调」的子模函数最大化)中,GPT-5套用连续Frank-Wolfe思路,得到了至少约63%的G(o)加上37%的H(o)的拆分保证[22] - 在猜想二(p-system约束下的「双指标」算法)中,GPT-5提出了一个朴素而有效的流程,通过多轮贪心选集将价值推到1−ε,甚至推导出不同的近似保证,推翻了原有猜想[26][31] - 在猜想三(γ-弱DR子模+凸约束的最大化)中,GPT-5使用Frank-Wolfe方法,将经典的1−1/e近似比提升为更一般的1−e^{−γ}[36] - 在五道题中,GPT-5有三道能给出几乎正确的证明,但在需要结合不同证明的题目(如猜想四和五)上表现不佳[41]
刚刚,GPT-5首次通过“哥德尔测试”,破解三大数学猜想
36氪·2025-09-25 15:36