高德纳：「震惊！震惊！」Claude破解《计算机程序设计艺术》难题

AI在数学与计算机科学领域的突破性进展 - 著名计算机科学家、图灵奖得主高德纳对AI（Claude Opus 4.6）的强大能力表示震惊，因其解决了他研究数周的开放性问题[2][5][8] - 该事件标志着自动推理和创造性问题解决领域的巨大进步，引发了技术社区的广泛关注[8][22] AI解决具体图论难题的过程 - 高德纳在为著作撰写内容时，遇到了一个关于有向图分解为三个长度为m³的有向环的开放性问题[13] - 他的朋友Filip Stappers将问题交给Claude处理，在人类指导下，Claude通过超过30次探索，最终编写了一个能为所有奇数m找到解的Python程序[11][14][25] - 探索过程中，Claude自主更换数学工具，识别出有向图为凯莱图，并引入了“纤维分解”框架，最终在第31次探索时给出具体构造程序[15][16][25] - 高德纳随后进行了严谨的数学证明，验证了3到101之间所有奇数m的分解方案，并指出在所有同类分解法中恰好有760种对奇数m有效的解，Claude准确找到了其中一种[19][20] AI在数学研究中的能力与局限 - 开发者认为，此次事件的核心意义在于AI展现了自主更换探索工具、排查无效路径的能力[22] - 对于偶数m的情况，Claude未能发现通用规律，后续甚至无法正确编写探索程序，目前仍是未解之谜[11][21][26] - 另一位研究者借助gpt-5.3-codex生成了处理偶数m（高达m=2000）的代码，但由于模式复杂，人工证明其正确性难度极大[26] AI在数学与编程竞赛中的整体进展 - 在数学竞赛方面，2025年7月，Google DeepMind的Gemini（Deep Think模式）在国际数学奥林匹克（IMO）试题评测中达到金牌标准成绩（35分），并能输出完整自然语言证明[27] - OpenAI的内部模型也达到了类似水平[27] - 在编程竞赛方面，2025年9月，OpenAI和Gemini都声称达到了国际大学生程序设计竞赛（ICPC）金牌水平，能在严格时间限制内解决高难度算法问题[27] AI在科研协作中的角色演变 - AI在科研中的角色显著增强，开始借助外部工具参与数学研究与问题验证[27] - 例如，GPT-5.2借助外部工具，协助数学家解决了数个悬而未决的Erdős猜想，并得到了数学家陶哲轩的验证[27] - 部分系统已展示出生成研究草稿与进行结构化推理的能力[27] - 驱动突破的核心机制转向“测试时计算扩展”或“慢思考”策略，通过在推理阶段投入更多算力，并行探索多条路径并进行自我验证[27] - 展望未来，随着自然语言理解与形式化逻辑的深度融合，AI将成为数学家与工程师身边得力的合作者，帮助攻克停滞多年的科学难题[27]