Workflow
ChatGPT DeepResearch
icon
搜索文档
AI又要颠覆数学?陶哲轩紧急发声:停止造神
36氪· 2026-01-12 09:49
文章核心观点 - 陶哲轩澄清AI解决数学问题的能力被夸大,旨在纠正将AI产出可验证结果等同于AI具备独立数学创新和替代人类能力的叙事[1][2] - AI在数学研究中的实际角色是工具链的一环,擅长执行体力活和工程活,但数学的灵魂如提出深刻问题、创造新概念等仍高度依赖人类[6][12] AI在Erdős问题上的贡献与案例 - AI在特定Erdős问题上生成了完整或部分解答,例如问题728在2026年1月6日由Aristotle与ChatGPT 5.2 Pro给出完整解答并通过Lean验证,问题729在2026年1月8日至10日也获得完整解答并使用了对728解法的修改版本[8][9] - AI被用于文献检索,以核查问题是否已被解决,例如GPT-5在2025年10月13日对问题[35]、[66]等进行了审核并找到了部分结果,在2025年11月2日对问题[94]找到了完整解法[11] - 存在AI完全解决问题后才发现已有文献解法的案例,例如问题[333]在2025年12月25日由ChatGPT 5.2 Pro和Claude Opus 4.5给出完整解决方案,但结果与Erdős和Newman (1977)的工作相似[10] 评估AI数学进展需考量的多维因素 - Erdős问题难度跨度极大,包含大量研究很少的“长尾题”和超级硬核的核心难题,仅比较“解题数”可能不是同一难度段的对比[2] - 许多问题“是否未解”本身不确定,网站标签“Open”往往是暂定的,AI解出后常发现文献早有解法,这使得“AI首解”的叙事容易翻车[3] - AI生成的证明常缺少背景、动机、文献对比等知识网络连接,其数学价值可能低于人类证明,且解出冷门题不等于够格投顶级期刊[3] - 将AI证明形式化到Lean等证明助手中虽提高可信度,但仍可能因引入额外公理、误形式化问题陈述或利用数学库的“边角行为”而被钻空子[4] AI在数学研究中的实际定位与未来展望 - AI当前擅长数学的体力活和工程活,如跑套路、补漏洞、做形式化、写稿改稿、查文献[12] - 数学的真正“灵魂”——提出深刻问题、创造新概念、将结果嵌入学科知识网络——仍然高度依赖人类[12] - 未来数学家可能扮演统领硅基智能大军的指挥官角色,由人类指引方向,AI负责开路架桥[12]
陶哲轩亲测:我用Gemini十分钟搞定了困扰学界多年的难题
量子位· 2025-11-24 15:30
文章核心观点 - 著名数学家陶哲轩借助Gemini 2.5 Deep Think模型,仅用十分钟便成功补全并验证了一个前人未完成的数学难题的证明[1][2][3] - 该事件是AI辅助解决数学问题的典型案例,并非孤例,近期已有6个困扰数学界多年的Erdős难题通过AI辅助得以解决[6] - AI在数学研究中的应用正变得日益普遍和系统化,许多研究者使用AI工具进行文献查询和解题思路探索[7] - AI被视为数学家的重要辅助工具而非替代者,其角色是充当证明的“中介”并帮助发现新的研究路径[35][37] AI模型性能表现 - Gemini 2.5 Deep Think模型在十分钟内完成了从论证分析到结论确认的全过程[3][20] - 该模型由IMO金牌得主参与开发,在最新的FrontierMath测试中,其数学能力远超GPT-5(high)等模型[10] - 在后续的文献查询任务中,Gemini DeepResearch和ChatGPT DeepResearch均能识别出问题所属范畴,但在细节上仍存在混淆[27] 具体问题与解决过程 - 解决的数学问题是由Paul Erdős提出的367号问题,涉及连续整数结构的乘法数论[12] - 数学家Wouter van Doorn基于一个未验证的同余恒等式提出了反证,陶哲轩将此交给Gemini进行完整证明[16][19] - 在Gemini完成p-adic代数数论证明后,陶哲轩手动花费半小时将其转换为更基础的论证方式[21] - Boris Alexeev使用Harmonic的Aristotle工具,花费两到三小时完成了该证明的Lean形式化验证[24] AI在数学领域的应用趋势 - 陶哲轩自三年前ChatGPT发布起就开始系统性探索AI在数学证明中的应用[29][30] - AI的进步使得数学研究未来将拥有更多的实验性方法,而不仅仅是理论推演[30] - 对于缺乏专业知识但怀有热忱的学习者,AI将帮助他们达到难以想象的学习深度[32] - 需要警惕AI可能产生的“幻觉错误”,数学家的细心纠正仍是不可或缺的环节[34]