Workflow
EPLB算法
icon
搜索文档
AI五小时发现MoE新算法,比人类算法快5倍,成本狂降26%
36氪· 2025-10-24 21:03
AI驱动的算法研究 - 加州大学伯克利分校研究团队提出AI驱动的系统研究方法ADRS,通过“生成—评估—改进”的迭代循环实现算法持续优化[1] - 基于开源框架OpenEvolve的案例研究表明,AI发现的算法显著优于人类设计算法,实现高达5倍的运行效率提升或26%的成本降低[2] 算法性能提升案例 - 在遥测修复任务中,AI算法比已发布解决方案的计数器修复得分提高9%,置信校准得分提高30%,耗时8小时且成本低于10美元[3] - 专家并行负载均衡器算法在保持相同平衡度的同时,运行时间比内部实现快2倍,耗时5小时且成本低于10美元[3] - 全局模型放置算法比已发布解决方案成本降低18.5%,仅需40分钟且成本低于85美元[3] - 在多区域spot实例调度中,AI算法比单区域基线成本降低26%,耗时1小时且成本低于22美元[3] 专家并行负载均衡技术 - 大型语言模型采用混合专家架构时面临关键性能挑战,即如何在各专家间实现负载均衡,避免某些专家“热点化”导致计算瓶颈[4] - 专家并行负载均衡器算法通过动态调整专家在GPU间的分布,追求最小化负载不均衡和最小化运行时间两个核心目标[6] 算法优化过程 - 研究团队使用OpenEvolve搜索EPLB算法,优化目标包含最大化负载均衡因子和降低算法运行时间的双重维度[8] - 实验采用80% Gemini 2.5 Flash与20% Gemini 2.5 Flash Lite混合配置,进化过程以开源贪心算法作为初始程序,设置300次迭代上限,完整流程耗时约五小时且成本低于10美元[8] 创新算法设计 - OpenEvolve生成的新算法发现巧妙启发式方法,通过对专家索引张量进行重塑与转置,利用PyTorch高速张量操作以“之字形”交错分配专家[10][12] - 该算法在保持与其他基线相当负载平衡因子的同时,将运行时间缩短至仅3.7毫秒,较内部参考实现性能提升达5倍[12] 相关研究进展 - Nature报道类似研究,Oh及其同事开发能发现新型强化学习算法的元学习算法,该算法在多项陌生任务中表现超越人类设计的强化学习算法[18][20][22]