AI证明数学猜想
搜索文档
45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误
量子位· 2026-01-19 15:00
事件概述 - OpenAI最新模型GPT-5.2 Pro独立证明了数学界一道悬置45年的埃尔德什猜想(第281号问题),论证过程经菲尔兹奖得主陶哲轩验证成立,并被评价为“迄今为止最明确的第一类结果(AI主要贡献)” [2][3] - 该问题由传奇数学家保罗·埃尔德什与罗纳德·格雷厄姆于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系 [4] - 证明结果已被埃尔德什问题网站收录 [8] AI证明过程与特点 - 证明由研究者Neel Somani于2025年1月17日提交给GPT-5.2 Pro完成,整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁 [6][9] - 陶哲轩指出,该证明是“Furstenberg对应原理”的一个变体,但比通常的论证更依赖伯克霍夫定理 [12][13] - 陶哲轩特别指出,该证明避免了前几代大语言模型容易犯的极限交换或量词顺序等微妙错误 [15] - 为验证证明,陶哲轩亲自动手将整套遍历论论证翻译成组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理重新推导,结论为证明成立 [16][17] 经典解法的意外发现 - 在讨论AI证明时,有用户发现该问题其实存在更简单的经典解法,所需两个定理(达文波特-埃尔德什密度收敛定理和罗杰斯定理)分别于1936年和1966年就已存在,将两者结合后该问题几乎是直接推论 [18][19] - 陶哲轩就此请教法国数学家特南鲍姆,后者确认了经典解法成立,但猜测问题的表述可能曾被改动过 [21] - 陶哲轩指出,罗杰斯定理因未单独发表且引用寥寥而传播不广,此前(2007年)五位顶尖专家在解决另一道埃尔德什问题时同样不知道该定理的存在 [22] - 目前该问题拥有两份不同的证明:一份来自GPT-5.2 Pro的遍历论路径,另一份来自经典文献组合 [22][23] AI数学能力的评估与行业现状 - 消息传开后,其他AI模型(如Gemini 3 Pro)交叉验证后也表示证明没有问题 [24] - 陶哲轩发出冷静提醒,指出评估AI工具真实成功率时存在强烈的报告偏差,负面结果几乎不会被披露 [27] - 他推荐了一个系统记录大语言模型在埃尔德什问题上正面和负面结果的开源项目,数据显示这些工具在埃尔德什问题上的真实成功率大约只有1%到2% [28][30] - 考虑到埃尔德什问题库中有超过600道未解难题,1%-2%的成功率仍意味着一批数量可观且非平凡的AI贡献 [31]