形式化
搜索文档
大模型开始“批量破解”数学难题
华尔街见闻· 2026-01-15 15:08
人工智能在数学研究领域取得突破性进展 - 自圣诞节以来,著名数学家保罗·埃尔德什遗留的超过1000道未解难题中,已有15道从“未解决”状态转为“已解决”,其中11道明确标注AI模型参与了求解过程[1] - OpenAI最新发布的GPT 5.2模型在数学推理能力上实现显著提升,能够在15分钟内给出完整的数学证明并通过形式化工具验证无误[1] - 菲尔兹奖得主陶哲轩统计,AI模型已在8道不同的埃尔德什问题上取得实质性自主进展,另有6例通过定位和扩展先前研究实现突破[1] AI工具性能与测试结果 - 软件工程师Neel Somani在测试中发现,GPT 5.2模型在数学推理方面比以前的版本更熟练,能够有效解决开放数学问题[3] - 该模型对一道数学难题的解答引用了勒让德公式、伯特兰假设和大卫之星定理等数学公理,并给出了埃尔德什问题某个版本的更完整解答[3] - 首批针对埃尔德什问题的自主解决方案于去年11月由Gemini驱动的AlphaEvolve模型产生,但最近GPT 5.2在高级数学方面表现更为出色[3] 对数学研究生态的影响与定位 - AI系统的可扩展性使其更适合系统性地应用于大量不为人知的埃尔德什问题的“长尾”,其中许多实际上有直接的解决方案[4] - 许多较简单的埃尔德什问题现在更有可能通过纯AI方法解决,而非人类或混合方式[4] - AI在数学研究中的定位是高效处理大量中等难度、但因人力有限而长期未被关注的问题,这种分工可能重塑数学研究的资源配置[4] 形式化工具的应用与行业趋势 - 形式化工具如微软研究院开发的开源证明助手Lean,以及Harmonic公司的Aristotle等AI工具,正在被顶尖数学家和计算机科学教授广泛采用[2][5] - 数学界近期向形式化的转变,结合新一代自动化工具,大幅降低了这项原本劳动密集型任务的难度[5] - 顶尖数学家和计算机科学教授开始认真使用这些AI工具,标志着相关技术已从实验阶段进入学术界的主流应用,可能为技术公司开辟新的商业机会[6]
陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
36氪· 2025-09-14 13:16
核心观点 - 人工智能公司Math开发的AI智能体Gauss在数学形式化验证领域取得重大突破 仅用三周时间完成陶哲轩等数学家18个月未能解决的强素数定理形式化挑战 展示出AI在复杂数学问题求解上的巨大潜力 [1][2][4][6] 技术突破 - Gauss作为首个协助顶级数学家进行形式验证的自动形式化Agent 能够将人类数学内容转换为机器可读的形式语言并验证正确性 [4][5] - 该智能体生成约25000行Lean代码 包含上千个定理和定义 这种规模的形式化证明传统上需要多年时间完成 [7] - 项目突破复分析核心难题 Gauss作为硅基生命可持续工作 极大压缩顶尖形式化专家的工作量 [6] 性能表现 - 相比历史上最大的单个形式化项目(最多50万行代码) Gauss的产出规模达到同数量级 [7] - Lean标准数学库Mathlib包含200万行代码和35万个定理 由600多位贡献者耗时8年完成 而Gauss三周的产出效率显著超越人类团队 [7] - 团队计划在未来12个月内将形式化代码总量提升100到1000倍 目标实现"可验证的超级智能"和"通才型机器数学家" [9] 基础设施 - 为支撑Gauss运行 团队与Morph Labs合作开发Trinity环境基础设施 [8] - 系统涉及数千个并发Agent 每个Agent拥有独立Lean运行环境 消耗数TB集群内存 属于复杂系统工程挑战 [8] 团队背景 - Math公司创始人Christian Szegedy为ICML'25时间检验奖得主 其2015年提出的Batch Normalization技术引用量超过6万次 是深度学习领域的里程碑突破 [13][15][17] 行业影响 - AI工具采用与人类截然不同的方法 可能专注于明确目标而忽略隐含目标 这要求项目组织者需要更明确阐述所有目标 [10][11] - 陶哲轩指出随着强大AI工具出现 需要重新评估形式化项目的多重目标 包括知识传承、社区建设等隐含价值 [10][11]