人工智能与数学发现
搜索文档
谷歌AlphaEvolve太香了,陶哲轩甚至发了篇论文,启发数学新构造
机器之心· 2025-11-06 16:58
AlphaEvolve系统概述 - 该系统是由Google DeepMind开发、由大型语言模型驱动的革命性进化编码智能体,能够自主发现极其复杂的算法,代码长度可达数百行[2] - 核心创新在于将大语言模型与进化计算、严格的自动化评估机制相结合,能够在大规模上发现显式数学构造,其结果可达到甚至超越许多长期数学问题中当前已知的最佳界限[8] - 该系统展示了AI系统与数学家之间全新互动方式的潜力,能够自主发现数学构造并补充人类直觉[11] 技术能力与性能表现 - 在覆盖数学分析、组合数学、几何学与数论的67个问题测试中,多数任务重新发现了已知最佳解,并在若干问题上取得了改进结果[9][10] - 系统具备从有限输入值结果泛化为适用于所有输入值通式的能力,在部分案例中甚至启发了新的数学论文[11][31] - 与传统数学研究方式相比,使用AlphaEvolve搭建并准备一个问题的时间通常只需数小时,而传统方法完成同等规模研究通常耗费更长时间[11] 核心技术机制 - 系统采用分层优化方法,具备同时在多个抽象层面上运行与优化的能力,不仅优化数学构造参数,还能优化发现这些构造的算法策略本身[12] - 引入"元层级进化"概念,优化过程本身成为被优化对象,系统能够自动为优化过程的不同阶段发现专门化的搜索启发式策略[12][13] - 系统在程序空间中进行搜索而非直接搜索解空间,通过简洁性与结构性先验帮助算法避开复杂局部最优点[24][25] 工作模式创新 - 搜索模式:进化搜索启发式算法,每个程序分配固定时间预算寻找最佳构造,有效解决计算速度不平衡问题[28] - 泛化器模式:要求系统编写能解决任意给定值的程序,基于一系列值上的表现进行评估,能够发现适用于所有参数的通用构造[31] - 构建AI工具流水线,结合模式发现(AlphaEvolve)、符号证明生成(Deep Think)和形式化验证(AlphaProof),实现从经验观察到形式化验证的完整闭环[33][34] 系统设计与关键洞察 - 验证器设计对系统性能和结果质量至关重要,连续损失函数比离散损失函数更能有效指导进化搜索过程[39] - 人类专家的提示和经验对最终构造质量有重大影响,领域专家使用AlphaEvolve的表现远胜于非领域专家[39][40] - 系统表现出"少即是多"的泛化特性,限制数据量反而能促进基本思想的涌现,跨问题训练可显著改善结果[41][42] 应用前景与局限性 - 系统擅长发现那些已在当前数学能力范围内但尚未被发现的构造,特别适用于需要大量时间和精力寻找特定问题标准思想正确组合的情况[43] - 对于需要真正新颖、深刻见解才能取得进展的问题,AlphaEvolve可能不是合适工具[44] - 未来可用于系统性地评估大类数学界限或猜想的难度,建立新的问题分类法,更有效地指导数学研究工作[45][46]