刚刚，GPT-5首次通过“哥德尔测试”，破解三大数学猜想

核心观点 - GPT-5在组合优化领域的数学推理能力取得重大突破，首次通过「哥德尔测试」，成功破解三大数学猜想，并能在某些情况下自主推翻原有猜想，提供新的有效解法[1][8][31] - 该研究标志着AI正从学习数学向真正进行数学研究的关键跨越，为未来科研范式变革提供了预演[8] - 尽管在明确、单一的推理路径上表现出色，但GPT-5在需要整合不同证明的复杂问题上仍存在短板，缺乏「整合性推理」能力[41][44] 研究背景与设计 - 研究由海法大学和思科主导，首次让AI直面「开放性数学猜想」的挑战，模拟了数学家从少量线索出发独立探索的真实研究场景[3][14][18] - 研究团队设计了五项「组合优化」领域的测试任务，每个问题仅提供最小化描述和1-2篇参考文献，难度设定为优秀本科生或研究生有望在一天内解决[14][15][16] - 与陶哲轩此前需要大量提示的合作模式不同，此次测试没有提供大量提示或指导，旨在评估AI的独立推理能力[14] GPT-5具体表现 - 在三个相对简单的问题上，GPT-5给出了近乎完美的解法，证明了其强大的逻辑推理水平[4] - 在猜想一（「单调+非单调」的子模函数最大化）中，GPT-5套用连续Frank-Wolfe思路，得到了至少约63%的G(o)加上37%的H(o)的拆分保证[22] - 在猜想二（p-system约束下的「双指标」算法）中，GPT-5提出了一个朴素而有效的流程，通过多轮贪心选集将价值推到1−ε，甚至推导出不同的近似保证，推翻了原有猜想[26][31] - 在猜想三（γ-弱DR子模+凸约束的最大化）中，GPT-5使用Frank-Wolfe方法，将经典的1−1/e近似比提升为更一般的1−e^{−γ}[36] - 在五道题中，GPT-5有三道能给出几乎正确的证明，但在需要结合不同证明的题目（如猜想四和五）上表现不佳[41]