进化算法 - 财报，业绩电话会，研报，新闻

进化算法

搜索文档

机器之心· 2025-09-14 13:16

核心技术创新 - 提出EvolKV进化框架仅使用完整KV cache预算的1.5%即可实现超越完整模型的性能表现大幅降低大语言模型推理成本 [1][6][11] - 采用任务驱动的进化算法优化KV cache分配通过下游任务性能反馈自适应调整每层缓存预算突破传统基于规则启发式方法的局限性 [4][6][13] - 将层分组优化与黑盒进化搜索结合在减少搜索空间的同时实现细粒度性能感知分配支持多样化评估标准包括准确率和F1分数 [6][9][16] 性能表现 - 在Needle-in-a-Haystack基准测试中比最佳基线提升多达13% 在RULER基准测试中提升多达3.6% [11][31] - LongBench评估显示在128到2048的KV cache预算范围内持续优于所有基线在GSM8K数学任务中128预算下比最强基线准确率提升7个百分点 [11][25] - Mistral-7B-Instruct模型在多个子数据集(MultiFieldQA-en/2WikiMultihopQA/MuSiQue等)上不仅保持完整模型竞争力甚至在某些预算下实现超越 [22] 方法架构 - 设计缓存效率评分机制CacheScore ∈ [0,1] 通过平滑折扣函数确保方案平均预算接近目标值c 超参数λ平衡原始性能与缓存效率 [14][15] - 采用层分组策略将L个transformer层划分为J=⌈L/n_g⌉个连续组显著降低搜索维度并优化稳定性的同时保持细粒度控制 [16] - 通过迭代进化算法逐组优化固定已优化组参数并动态更新未优化组最终通过比例补全机制确保总预算精确匹配目标值 [17][20] 实验结果 - 在Llama-3-8B-Instruct上TREC子集128预算时比最强基线高7.69个百分点在GSM8K任务中512预算下达到完整模型95.7%性能显著优于基线84.5% [23][25] - 可视化显示不同预算下KV cache分配呈非均匀模式验证了模型不同层级在信息处理中的功能差异性 [7][27][28] - RULER基准测试表明优化策略具备强泛化能力迁移到其他评估场景仍保持性能优势在Mistral-7B-Instruct上提升0.99分 Llama-3-8B-Instruct提升3.6分 [31]

打破56年数学铁律！谷歌AlphaEvolve自我进化实现算法效率狂飙，堪比AlphaGo“神之一手”

量子位· 2025-05-18 10:01

核心观点 - AlphaEvolve是谷歌DeepMind联合顶尖科学家打造的通用科学人工智能，其数学能力被类比为AlphaGo的"神之一手"，打破了矩阵乘法领域56年以来的效率基准[1][2] - AlphaEvolve将4x4矩阵乘法的标量乘法次数从49次降至48次，虽然数字进步小但意义重大，可应用于解决复杂数学难题、改进芯片设计、提高数据中心和AI训练效率[3][4][5] - 在谷歌内部使用中，AlphaEvolve将Gemini架构中大型矩阵乘法运算加速23%，训练时间缩短1%，FlashAttention提速32.5%[5] 技术原理算法突破 - AlphaEvolve基于Alpha Tensor框架引入进化算法，通过迭代生成、评估和优化候选算法来探索更优解，不依赖预设经验法则而是完全自由探索[11][12] - 突破传统算法的"对称性陷阱"限制，在复数矩阵乘法搜索中发现48次乘法算法，优于Strassen递归的49次，并通过数学验证[13][14] - 在更大矩阵如5×5、6×6上未能超越现有最优解，因搜索空间爆炸且未引入对称性偏置，显示完全开放搜索与约束之间需平衡[16][17][18] 系统架构 - 核心采用进化算法框架，借鉴"适者生存"理念，对Gemini生成的代码初始种群进行适应度评估、保留优异算法并迭代优化[21][26] - 结合Gemini Flash和Pro模型，Flash快速处理数据筛选代码片段，Pro深入挖掘规律整合最优代码[23][24][25] - 自动化评估系统通过多维度指标、自动化测试和反馈迭代保障算法持续优化，评估结果用于筛选和指导后续优化方向[30][31][33][34][35][36] - 异步分布式架构实现高效并行进化，不同节点分别负责算法生成、数据优化和适用度评估[38][39][40][41] 应用与前景 - 性能直接受益于基础语言模型提升，当前采用混合模型策略，模型性能与算法发现效率呈正相关[43] - 初步实现递归自我改进，将改进算法应用于基础模型形成优化闭环，如加速Gemini训练[44] - 资源消耗高度灵活，简单问题即时解决，复杂问题如矩阵乘法需数百小时计算，系统自动匹配问题难度调整资源[45] - 未来方向包括提升自动化水平替代人类主导，保持人机协作核心[46] - 被评价为"能够催生真正新技术的技术"，具有重大创新潜力[47]