Workflow
专家并行负载均衡器(EPLB)算法
icon
搜索文档
AI五小时发现MoE新算法,比人类算法快5倍,成本狂降26%
量子位· 2025-10-24 15:50
文章核心观点 - AI已从单纯使用算法发展到能够自主创造新算法的阶段,其创造的算法在性能上显著超越人类设计[1][2] - 加州大学伯克利分校提出的ADRS系统通过"生成-评估-改进"的迭代循环实现算法持续优化,其发现的算法比人类设计算法快5倍或降低成本26%[2][4] - 在专家并行负载均衡等具体案例中,AI创造的算法实现了运行时间从19.6毫秒缩短至3.7毫秒的5倍性能提升[25] ADRS系统研究方法 - ADRS系统采用"生成—评估—改进"的迭代循环实现算法持续优化[2] - 基于开源框架OpenEvolve在多个领域案例研究表明,发现的算法显著优于人类设计算法[4] - 在专家并行负载均衡器优化案例中,通过300次迭代耗时约5小时,成本低于10美元即发现更优算法[19] 算法性能提升案例 - 专家并行负载均衡器优化:运行时间从19.6毫秒缩短至3.7毫秒,性能提升达5倍[14][25] - 全局模型放置优化:成本比已发布解决方案降低18.5%[5] - LLM-SQL优化:运行速度提升3.9倍[5] - 多区域实例调度:成本比单区域基线降低26%[5] - 事务调度优化:比贪心算法性能提升20%[5] 专家并行负载均衡技术细节 - 混合专家架构中路由器将输入文本token动态分配给特定专家网络,仅使用模型总参数的一小部分提升推理效率[6] - 专家并行负载均衡器通过动态调整专家在GPU间分布,最小化负载不均、最大化系统吞吐量[9] - 基础版EPLB算法分三阶段:确定专家副本数量、映射副本到GPU、优化负载均衡[10][12] - AI发现的新算法采用"之字形"张量操作在高负载与低负载GPU间交错分配专家,替代传统的线性for循环[20][23] 相关研究进展 - Nature报道的元学习算法能发现新型强化学习算法,在多项陌生任务中表现超越人类设计算法[34][35][38] - 该研究的元学习层采用神经网络充当强化学习算法,命名为元网络[36] - AI在算法创新领域的突破表明其具备自主创新能力,可能自主产生下一个重大突破[39][40]