Workflow
Erdős问题
icon
搜索文档
AI又要颠覆数学?陶哲轩紧急发声:停止造神
36氪· 2026-01-12 09:49
文章核心观点 - 陶哲轩澄清AI解决数学问题的能力被夸大,旨在纠正将AI产出可验证结果等同于AI具备独立数学创新和替代人类能力的叙事[1][2] - AI在数学研究中的实际角色是工具链的一环,擅长执行体力活和工程活,但数学的灵魂如提出深刻问题、创造新概念等仍高度依赖人类[6][12] AI在Erdős问题上的贡献与案例 - AI在特定Erdős问题上生成了完整或部分解答,例如问题728在2026年1月6日由Aristotle与ChatGPT 5.2 Pro给出完整解答并通过Lean验证,问题729在2026年1月8日至10日也获得完整解答并使用了对728解法的修改版本[8][9] - AI被用于文献检索,以核查问题是否已被解决,例如GPT-5在2025年10月13日对问题[35]、[66]等进行了审核并找到了部分结果,在2025年11月2日对问题[94]找到了完整解法[11] - 存在AI完全解决问题后才发现已有文献解法的案例,例如问题[333]在2025年12月25日由ChatGPT 5.2 Pro和Claude Opus 4.5给出完整解决方案,但结果与Erdős和Newman (1977)的工作相似[10] 评估AI数学进展需考量的多维因素 - Erdős问题难度跨度极大,包含大量研究很少的“长尾题”和超级硬核的核心难题,仅比较“解题数”可能不是同一难度段的对比[2] - 许多问题“是否未解”本身不确定,网站标签“Open”往往是暂定的,AI解出后常发现文献早有解法,这使得“AI首解”的叙事容易翻车[3] - AI生成的证明常缺少背景、动机、文献对比等知识网络连接,其数学价值可能低于人类证明,且解出冷门题不等于够格投顶级期刊[3] - 将AI证明形式化到Lean等证明助手中虽提高可信度,但仍可能因引入额外公理、误形式化问题陈述或利用数学库的“边角行为”而被钻空子[4] AI在数学研究中的实际定位与未来展望 - AI当前擅长数学的体力活和工程活,如跑套路、补漏洞、做形式化、写稿改稿、查文献[12] - 数学的真正“灵魂”——提出深刻问题、创造新概念、将结果嵌入学科知识网络——仍然高度依赖人类[12] - 未来数学家可能扮演统领硅基智能大军的指挥官角色,由人类指引方向,AI负责开路架桥[12]
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
量子位· 2025-12-13 12:34
事件概述:AI辅助解决Erdős 1026数学难题 - 陶哲轩与多名数学家合作,在多种AI工具的辅助下,仅用48小时便完全解决了尘封50年的Erdős 1026数学难题[1][2][3] - 陶哲轩指出,若使用传统方法,可能需要数周或数月才能解决[5] - 此次问题的快速解决,体现了“人与人的协作”与“人与AI的协作”相结合的新趋势[46][47] 问题背景与定义 - Erdős 1026问题最早于1975年被提出,初始表述模糊[8] - 数学家Desmond Weisenberg引入最大常数c(n)进行研究,使得S(x1,…,xn) ≥ c(n) * Σxi,其中c(n)针对所有长度为n的不同实数序列[10][11] - 博弈论解释:Alice将N个硬币分为n堆,Bob选择一个单调子序列的堆并拿走其中硬币,c(n)是Bob能保证拿走的最小比例[12][13] - 通过计算得到c(n)的前几个近似值:1, 1, 2/3, 1/2, 1/2, 3/7, 2/5, 3/8, 1/3[15] 解决过程与AI工具应用 - 数学家Boris Alexeev使用Harmonic的数学AI模型“亚里士多德”,在证明助手Lean中自动构造并证明了关键不等式,将原问题转化为计算几何领域的矩形填充问题[16][17] - 数学家Koishi Chan随后给出了基于原始Erdős–Szekeres定理的替代证明,印证了AI的发现[18] - 陶哲轩将问题放入AlphaEvolve,要求其通过生成总和为10的6次方的实数序列来获取c(n)的上界,运行一小时后,AI生成了包含结构清晰潜在极值解的上界结果[18][19] - 陶哲轩利用John Cook的公开专用工具整理序列,为c(n)的值提供了猜想[21] - Boris Alexeev找到了该猜想的简洁表述:c(k²+2a+1) = k / (k²+a),其中0 ≤ a ≤ k[22] - 使用ChatGPT Pro生成1/c(n)的图像,直观显示其基本是对平方根函数的分段线性逼近[26] - 数学家Lawrence Wu结合正方形填充问题(Erdős 106)进行阐述,引入f(n)并设定c(n) ≥ 1/f(n)[28][30] - Lawrence Wu通过AI论文检索,找到一篇去年发表的论文,最终证明了猜想中的公式,从而完成了整体证明[32] AI在数学研究中的广泛应用 - 陶哲轩近期还借助Gemini 2.5 Deep Think破解了Erdős问题 367,全程只用了十分钟[34][35] - 陶哲轩利用GPT-5进行半自动化文献检索,对相关数列进行高精度计算后输入OEIS数据库检索对照,发现部分Erdős问题其实早已在既有研究中被解决[37] - 来自Harmonic的数学AI模型被曝独立证明了Erdős问题 124,微软前AI副总裁Sebastien Bubeck表示该解决方案100%由AI生成,总计耗时6小时[43][44] - Erdős问题网站公开鼓励使用AI辅助解题,但需满足公开说明、用户独立验证及评论长度合理等条件[45] - 陶哲轩表示,在Erdős问题网站上,AI辅助已经变得很常见[42] Erdős问题背景 - Erdős问题出自20世纪著名匈牙利数学家Paul Erdős,他一生合作了超500位数学家,发表了约1525篇数学论文[39] - 他提出或转述了上千道问题,被收录于erdosproblems.com网站,目前绝大多数难题依然悬而未解[39][41]
GPT-5又帮陶哲轩解决了一个难题
量子位· 2025-09-03 15:30
文章核心观点 - 著名数学家陶哲轩利用OpenAI最新模型GPT-5,结合OEIS数据库,成功解决了一个长期悬而未决的Erdős问题,展示了AI在半自动化文献检索和跨知识库关联方面的独特价值 [1][3][4][18] AI在数学研究中的应用模式 - AI在此次研究中扮演了“定位器”或“桥梁”的角色,通过将复杂数学问题转化为高精度小数(数字指纹),并与现有数据库进行比对,从而连接起分散的知识源 [3][4][11][14] - 具体流程是:陶哲轩要求GPT-5将Erdős问题中的无理性相关级数展开成高精度小数,然后将这些小数输入OEIS进行搜索匹配 [11][12][15] - 该方法成功匹配到Erdős问题 259与OEIS数列A371134,并通过OEIS的参考文献找到了已存在的完整解决方案,最终将该问题的状态更新为“已解决” [15][17] 项目背景与运作机制 - 此次研究是“Erdosproblems/OEIS关联项目”的一部分,该项目由陶哲轩和英国数学家Thomas Bloom提议发起,并在GitHub社区开源 [20][24] - 项目旨在解决数学研究中信息分散和遗漏的问题:一方面,部分数列已在OEIS中但未被Erdosproblems网站收录;另一方面,许多Erdős问题相关的数列尚未被OEIS收录 [25][28] - 项目采用众包方案推进:第一步,参与者尝试计算出Erdős问题对应的整数数列;第二步,与OEIS数据库进行比对;第三步,将关联结果记录到GitHub表格中 [26][27] 涉及的关键实体与数据 - 涉及的数学家Paul Erdős一生合作了超过500位数学家,发表了约1525篇数学论文 [5] - Erdős问题库由Thomas Bloom搭建的网站收录,包含了近1000道问题 [15][28] - OEIS是一个更庞大的数据库,收录了几十万条整数数列 [28]