上海AI Lab&华师大：AI智能编程新框架，节省一半时间就能“聪明”地写代码

文章核心观点 - 上海人工智能实验室与华东师范大学联合提出AutoMLGen框架，旨在解决现有大语言模型在机器学习工程中优化能力不足的问题 [1] - 该框架通过融合领域知识与创新的蒙特卡洛图搜索，使AI智能体从“代码生成”进阶到“算法优化”，实现了自主探索与持续提升 [2][4] - 在MLE-Bench基准测试中，AutoMLGen仅用标准时长一半的计算预算（12小时）即达到36.4%的平均奖牌率和18.7%的金牌率，表现优于其他方法 [11][12] 技术框架与创新 - AutoMLGen由领域知识库、蒙特卡洛图搜索和细粒度算子库三大模块组成，构建了从经验指引到智能探索再到方案精修的自进化闭环 [6] - 领域知识库系统化地汇总了模型层、数据层和策略层的专家经验，使智能体能从“零经验”快速启动并实现经验迁移 [7] - 创新的蒙特卡洛图搜索取代传统树状搜索，通过主扩展、分支内演化、跨分支参考和多分支聚合四种机制，实现不同搜索分支间的节点与轨迹动态融合及经验共享 [8] - 细粒度算子库定义了方案间的演化方式，为MCGS提供通用演化逻辑，使优化过程更连贯高效 [9] 性能表现与实验结果 - 在MLE-Bench榜单上，AutoMLGen使用DeepSeek-R1模型，以12小时计算预算取得36.4%的平均奖牌率和18.7%的金牌率，优于使用24小时预算的R&D-Agent（22.4%平均奖牌率）和AIDE（8.6%平均奖牌率）等竞争对手 [11] - 在低复杂度任务中奖牌率达到62.1% ± 3.0%，中复杂度任务中达到26.3% ± 2.6%，有效方案生成率高达96.4% ± 0.4% [11] - 模块消融实验显示，完整框架（知识库+MCGS）将奖牌率从基线40.91%提升至68.12%，证明了各模块的关键作用 [15] - 该系统在不同基础模型上均展现出优异适配性，且性能曲线能快速收敛并持续上升 [16] 行业意义与发展前景 - AutoMLGen标志着AI智能体在复杂工程与算法设计任务中的能力演进，证明了AI在高复杂度任务中具备自主探索与持续提升的潜力 [19] - 该框架的理念可向更广泛的智能系统范式扩展，包括算法发现、科研自动化、工程设计和多智能体协作等领域 [20] - 基于图结构的搜索逻辑与知识复用机制，为未来智能体的发展提供了通用的演化框架，有望推动人工智能向更高层次的智能化与自我改进 [20]