高德纳:「震惊!震惊!」Claude破解《计算机程序设计艺术》难题
机器之心·2026-03-05 19:03

AI在数学与计算机科学领域的突破性进展 - 著名计算机科学家、图灵奖得主高德纳对AI(Claude Opus 4.6)的强大能力表示震惊,因其解决了他研究数周的开放性问题[2][5][8] - 该事件标志着自动推理和创造性问题解决领域的巨大进步,引发了技术社区的广泛关注[8][22] AI解决具体图论难题的过程 - 高德纳在为著作撰写内容时,遇到了一个关于有向图分解为三个长度为m³的有向环的开放性问题[13] - 他的朋友Filip Stappers将问题交给Claude处理,在人类指导下,Claude通过超过30次探索,最终编写了一个能为所有奇数m找到解的Python程序[11][14][25] - 探索过程中,Claude自主更换数学工具,识别出有向图为凯莱图,并引入了“纤维分解”框架,最终在第31次探索时给出具体构造程序[15][16][25] - 高德纳随后进行了严谨的数学证明,验证了3到101之间所有奇数m的分解方案,并指出在所有同类分解法中恰好有760种对奇数m有效的解,Claude准确找到了其中一种[19][20] AI在数学研究中的能力与局限 - 开发者认为,此次事件的核心意义在于AI展现了自主更换探索工具、排查无效路径的能力[22] - 对于偶数m的情况,Claude未能发现通用规律,后续甚至无法正确编写探索程序,目前仍是未解之谜[11][21][26] - 另一位研究者借助gpt-5.3-codex生成了处理偶数m(高达m=2000)的代码,但由于模式复杂,人工证明其正确性难度极大[26] AI在数学与编程竞赛中的整体进展 - 在数学竞赛方面,2025年7月,Google DeepMind的Gemini(Deep Think模式)在国际数学奥林匹克(IMO)试题评测中达到金牌标准成绩(35分),并能输出完整自然语言证明[27] - OpenAI的内部模型也达到了类似水平[27] - 在编程竞赛方面,2025年9月,OpenAI和Gemini都声称达到了国际大学生程序设计竞赛(ICPC)金牌水平,能在严格时间限制内解决高难度算法问题[27] AI在科研协作中的角色演变 - AI在科研中的角色显著增强,开始借助外部工具参与数学研究与问题验证[27] - 例如,GPT-5.2借助外部工具,协助数学家解决了数个悬而未决的Erdős猜想,并得到了数学家陶哲轩的验证[27] - 部分系统已展示出生成研究草稿与进行结构化推理的能力[27] - 驱动突破的核心机制转向“测试时计算扩展”或“慢思考”策略,通过在推理阶段投入更多算力,并行探索多条路径并进行自我验证[27] - 展望未来,随着自然语言理解与形式化逻辑的深度融合,AI将成为数学家与工程师身边得力的合作者,帮助攻克停滞多年的科学难题[27]