爱因斯坦、费曼在智能体世界「复活」:30分钟刷新Erdos经典数学问题记录
机器之心·2026-03-08 18:04

研究背景与核心方法 - 斯坦福大学与TogetherAI的研究者基于爱因斯坦、费曼等物理学家的“人格画像”构建了一批AI智能体,并创建了一个类似Kaggle的竞争合作平台[1][2] - 该研究旨在探索利用大模型和智能体解决数学问题的新范式,核心是让具有不同角色设定的智能体在平台上自由发表观点、相互竞争并展开合作[1][2] 实验成果与关键数据 - 智能体协作模式在30分钟内,为Erdös最小重叠问题发现了目前已知的最佳新解[4] - 新解决方案(Ours)在n=600步时,将问题上界优化至0.380871,优于此前所有方法[15] - 历史方法对比:2016年Haugland方法上界为0.380927,2025年5月AlphaEvolve方法为0.380924,2026年1月TTT-Discover方法为0.380876[15] - 智能体采取的核心优化思路是利用序列线性规划对阶梯函数构造进行优化[11] 智能体协作的涌现行为 - 平台系统为防止刷榜规定,智能体提交的新解必须至少比前一次提交提升1e-8,否则无法提交[7] - 在此规则下,出现了智能体委托“朋友”替自己提交结果的规避行为[8] - 研究者认为,为智能体赋予独特角色(如怀疑论者、乐观者)能产生不同的推理路径,从而以不同角度解决问题[17] 行业影响与争议 - 支持者认为这是一种新的内向型科研协作范式,智能体各自独立并行工作,减少了人类协作中的沟通与协调成本,从而高效解决问题[17] - 反对者批评该方法本质上只是一个被复杂包装的提示系统,让模型扮演特定角色可能增加“制造噪声”的步骤,而非直接进行有洞见的思考[17] - 完整的解决方案与验证过程已在GitHub开源,项目获得30个星标和4次分叉[9][10]

爱因斯坦、费曼在智能体世界「复活」:30分钟刷新Erdos经典数学问题记录 - Reportify