Workflow
遍历理论
icon
搜索文档
45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误
猿大侠· 2026-01-21 12:18
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI证明数学猜想,这次来真的了。 OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔德什猜想。 论证过程经菲尔兹奖得主陶哲轩验证成立,还被评价为"迄今为止最明确的第一类结果(AI主要贡献)"。 这道题是埃尔德什问题库中的第281号,由传奇数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同 提出,涉及同余覆盖系统与自然密度的深层关系。 45年来,这道题一直静静躺在问题库里,等待解答。 直到2025年1月17日,一位名叫Neel Somani的研究者把这道题扔给了GPT-5.2 Pro。 证明只用到GPT 5.2 Pro 埃尔德什问题网站已收录AI证明结果。 整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁。 $$\bar{\Phi}=\operatorname*{lim}_{k\to\infty}\bar{\Phi}_{k}.$$ 按陶哲轩的话说,它是"Furstenberg对应原理"的一个变体,这是遍历理论与组合数学交叉领域的 ...
45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误
36氪· 2026-01-19 15:29
事件概述 - OpenAI最新模型GPT-5.2 Pro独立证明了一道45年未解的埃尔德什猜想(第281号),论证过程经菲尔兹奖得主陶哲轩验证成立,并被评价为“迄今为止最明确的第一类结果(AI主要贡献)” [1][2] - 该问题由传奇数学家保罗·埃尔德什与罗纳德·格雷厄姆于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系 [2] - 埃尔德什问题网站已收录AI证明结果 [3] 证明过程与技术细节 - 整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁 [3] - 陶哲轩指出,该证明是“Furstenberg对应原理”的一个变体,但比通常的论证更依赖伯克霍夫定理 [6] - 陶哲轩亲自动手验证,将整套遍历论论证翻译成组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理,重新推导后确认证明成立 [8] - 验证过程中,AI避免了极限交换或量词顺序等微妙错误,而前几代大语言模型几乎肯定会在这些地方栽跟头 [8] 替代证明与学术发现 - 一位网名KoishiChan的用户指出,该问题有更简单的解法,所需两个定理(达文波特-埃尔德什密度收敛定理和罗杰斯定理)早在1936年和1966年就已存在,组合后问题几乎是直接推论 [9] - 法国数学家特南鲍姆确认,只要满足上述两个经典结果,问题就能立即解决,但猜测问题表述可能在某个环节被改动过 [10] - 陶哲轩感慨罗杰斯定理没有得到应有的传播,它只出现在一本专著中,没有单独发表,文献引用寥寥无几 [10] - 目前该问题有两份不同的证明:一份来自GPT-5.2 Pro的遍历论路径,一份来自经典文献组合 [10] AI验证与行业评估 - 消息传开后,Gemini 3 Pro等AI模型交叉验证后表示证明没有问题 [11] - 陶哲轩指出,评估AI工具真实成功率时存在强烈的报告偏差,负面结果几乎不会被披露,这导致统计偏差 [11] - 一个开源项目系统记录前沿大语言模型在埃尔德什问题上的结果,数据显示这些工具在埃尔德什问题上的真实成功率大约只有百分之一到二 [12] - 考虑到问题库里有超过600道未解难题,百分之一到二的成功率仍然意味着一批数量可观且非平凡的AI贡献 [12]
45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误
量子位· 2026-01-19 15:00
事件概述 - OpenAI最新模型GPT-5.2 Pro独立证明了数学界一道悬置45年的埃尔德什猜想(第281号问题),论证过程经菲尔兹奖得主陶哲轩验证成立,并被评价为“迄今为止最明确的第一类结果(AI主要贡献)” [2][3] - 该问题由传奇数学家保罗·埃尔德什与罗纳德·格雷厄姆于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系 [4] - 证明结果已被埃尔德什问题网站收录 [8] AI证明过程与特点 - 证明由研究者Neel Somani于2025年1月17日提交给GPT-5.2 Pro完成,整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁 [6][9] - 陶哲轩指出,该证明是“Furstenberg对应原理”的一个变体,但比通常的论证更依赖伯克霍夫定理 [12][13] - 陶哲轩特别指出,该证明避免了前几代大语言模型容易犯的极限交换或量词顺序等微妙错误 [15] - 为验证证明,陶哲轩亲自动手将整套遍历论论证翻译成组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理重新推导,结论为证明成立 [16][17] 经典解法的意外发现 - 在讨论AI证明时,有用户发现该问题其实存在更简单的经典解法,所需两个定理(达文波特-埃尔德什密度收敛定理和罗杰斯定理)分别于1936年和1966年就已存在,将两者结合后该问题几乎是直接推论 [18][19] - 陶哲轩就此请教法国数学家特南鲍姆,后者确认了经典解法成立,但猜测问题的表述可能曾被改动过 [21] - 陶哲轩指出,罗杰斯定理因未单独发表且引用寥寥而传播不广,此前(2007年)五位顶尖专家在解决另一道埃尔德什问题时同样不知道该定理的存在 [22] - 目前该问题拥有两份不同的证明:一份来自GPT-5.2 Pro的遍历论路径,另一份来自经典文献组合 [22][23] AI数学能力的评估与行业现状 - 消息传开后,其他AI模型(如Gemini 3 Pro)交叉验证后也表示证明没有问题 [24] - 陶哲轩发出冷静提醒,指出评估AI工具真实成功率时存在强烈的报告偏差,负面结果几乎不会被披露 [27] - 他推荐了一个系统记录大语言模型在埃尔德什问题上正面和负面结果的开源项目,数据显示这些工具在埃尔德什问题上的真实成功率大约只有1%到2% [28][30] - 考虑到埃尔德什问题库中有超过600道未解难题,1%-2%的成功率仍意味着一批数量可观且非平凡的AI贡献 [31]