Workflow
Gemini DeepResearch
icon
搜索文档
AI又要颠覆数学?陶哲轩紧急发声:停止造神
36氪· 2026-01-12 09:49
文章核心观点 - 陶哲轩澄清AI解决数学问题的能力被夸大,旨在纠正将AI产出可验证结果等同于AI具备独立数学创新和替代人类能力的叙事[1][2] - AI在数学研究中的实际角色是工具链的一环,擅长执行体力活和工程活,但数学的灵魂如提出深刻问题、创造新概念等仍高度依赖人类[6][12] AI在Erdős问题上的贡献与案例 - AI在特定Erdős问题上生成了完整或部分解答,例如问题728在2026年1月6日由Aristotle与ChatGPT 5.2 Pro给出完整解答并通过Lean验证,问题729在2026年1月8日至10日也获得完整解答并使用了对728解法的修改版本[8][9] - AI被用于文献检索,以核查问题是否已被解决,例如GPT-5在2025年10月13日对问题[35]、[66]等进行了审核并找到了部分结果,在2025年11月2日对问题[94]找到了完整解法[11] - 存在AI完全解决问题后才发现已有文献解法的案例,例如问题[333]在2025年12月25日由ChatGPT 5.2 Pro和Claude Opus 4.5给出完整解决方案,但结果与Erdős和Newman (1977)的工作相似[10] 评估AI数学进展需考量的多维因素 - Erdős问题难度跨度极大,包含大量研究很少的“长尾题”和超级硬核的核心难题,仅比较“解题数”可能不是同一难度段的对比[2] - 许多问题“是否未解”本身不确定,网站标签“Open”往往是暂定的,AI解出后常发现文献早有解法,这使得“AI首解”的叙事容易翻车[3] - AI生成的证明常缺少背景、动机、文献对比等知识网络连接,其数学价值可能低于人类证明,且解出冷门题不等于够格投顶级期刊[3] - 将AI证明形式化到Lean等证明助手中虽提高可信度,但仍可能因引入额外公理、误形式化问题陈述或利用数学库的“边角行为”而被钻空子[4] AI在数学研究中的实际定位与未来展望 - AI当前擅长数学的体力活和工程活,如跑套路、补漏洞、做形式化、写稿改稿、查文献[12] - 数学的真正“灵魂”——提出深刻问题、创造新概念、将结果嵌入学科知识网络——仍然高度依赖人类[12] - 未来数学家可能扮演统领硅基智能大军的指挥官角色,由人类指引方向,AI负责开路架桥[12]