进化算法

搜索文档
京东集团算法总监韩艾将在 AICon 北京站分享基于强化学习的异构多智能体联合进化算法
AI前线· 2025-06-20 10:47
AICon全球人工智能开发与应用大会北京站 - 大会将于6月27日-28日举办,聚焦AI前沿技术与落地实践 [1] - 汇聚腾讯、阿里、百度、字节跳动等头部大厂及50+资深专家 [1] - 设置AI Agent、多模态应用、推理性能优化等10多个专题论坛 [1][4] 京东集团算法总监韩艾的主题分享 - 演讲主题为《JDAgents-R1:基于强化学习的异构多智能体联合进化算法》 [2] - 提出JDAgents-R1框架,首次将GRPO应用于异构多智能体联合训练 [2] - 通过迭代优化LLMs与自适应记忆机制实现决策与记忆能力动态均衡 [2] - 在通用和商家定制化场景中达到与大规模语言模型相媲美的性能 [2] 韩艾的专业背景 - 中科院与康奈尔大学联合培养博士,北京大学双学士 [3] - 现任京东集团算法总监,京东零售数据与算法通道委员 [3] - 在国际顶级期刊发表数十篇论文,专注AI技术创新 [3] - 主持设计Multi-Agent Planning算法架构并落地京东商家智能助手 [3] 演讲内容框架 - 涵盖多智能体训练技术、应用案例、LLM决策与Memory进化等 [3][5] - 重点介绍GRPO联合训练算法技术和Memory更新技术 [3][5] - 探讨多模型联合训练的信息通信难题和memory进化评估 [5] 大会其他亮点 - 设置AI Agent构建、多模态实践、大模型助力研发等专题论坛 [4] - 50+专家将分享前沿技术洞察和一线实践经验 [4] - 报名可享9折优惠,单张门票立省580元 [4]
打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”
量子位· 2025-05-18 10:01
核心观点 - AlphaEvolve是谷歌DeepMind联合顶尖科学家打造的通用科学人工智能,其数学能力被类比为AlphaGo的"神之一手",打破了矩阵乘法领域56年以来的效率基准[1][2] - AlphaEvolve将4x4矩阵乘法的标量乘法次数从49次降至48次,虽然数字进步小但意义重大,可应用于解决复杂数学难题、改进芯片设计、提高数据中心和AI训练效率[3][4][5] - 在谷歌内部使用中,AlphaEvolve将Gemini架构中大型矩阵乘法运算加速23%,训练时间缩短1%,FlashAttention提速32.5%[5] 技术原理 算法突破 - AlphaEvolve基于Alpha Tensor框架引入进化算法,通过迭代生成、评估和优化候选算法来探索更优解,不依赖预设经验法则而是完全自由探索[11][12] - 突破传统算法的"对称性陷阱"限制,在复数矩阵乘法搜索中发现48次乘法算法,优于Strassen递归的49次,并通过数学验证[13][14] - 在更大矩阵如5×5、6×6上未能超越现有最优解,因搜索空间爆炸且未引入对称性偏置,显示完全开放搜索与约束之间需平衡[16][17][18] 系统架构 - 核心采用进化算法框架,借鉴"适者生存"理念,对Gemini生成的代码初始种群进行适应度评估、保留优异算法并迭代优化[21][26] - 结合Gemini Flash和Pro模型,Flash快速处理数据筛选代码片段,Pro深入挖掘规律整合最优代码[23][24][25] - 自动化评估系统通过多维度指标、自动化测试和反馈迭代保障算法持续优化,评估结果用于筛选和指导后续优化方向[30][31][33][34][35][36] - 异步分布式架构实现高效并行进化,不同节点分别负责算法生成、数据优化和适用度评估[38][39][40][41] 应用与前景 - 性能直接受益于基础语言模型提升,当前采用混合模型策略,模型性能与算法发现效率呈正相关[43] - 初步实现递归自我改进,将改进算法应用于基础模型形成优化闭环,如加速Gemini训练[44] - 资源消耗高度灵活,简单问题即时解决,复杂问题如矩阵乘法需数百小时计算,系统自动匹配问题难度调整资源[45] - 未来方向包括提升自动化水平替代人类主导,保持人机协作核心[46] - 被评价为"能够催生真正新技术的技术",具有重大创新潜力[47]