Workflow
Gemini 2.0 Pro
icon
搜索文档
AlphaEvolve: A coding agent for scientific and algorithmic discovery
Google DeepMind· 2025-05-16 00:00
报告行业投资评级 未提及相关内容 报告的核心观点 - AlphaEvolve结合了最先进的大语言模型和自动化评估指标,在进化框架内展现出强大能力,能在数学问题上取得新发现,并对计算堆栈进行实际改进 [88] - AlphaEvolve可通过不同方式处理同一问题,且能作为测试时计算代理,增强基础大语言模型的能力,未来可考虑将其增强性能融入下一代基础模型 [89][90] 根据相关目录分别进行总结 1. 引言 - 发现新知识通常是个漫长过程,虽大语言模型和智能体的发展推动了自动化,但实现全新科学或实际发现仍具挑战 [2] - AlphaEvolve是基于进化计算和大语言模型代码生成的优化代理,专注于可自动评估的科学和工程发现问题,能进化复杂代码,超越以往系统 [3][7] - 因自动化评估指标的限制,AlphaEvolve主要聚焦于数学、计算机科学和系统优化领域 [9] 2. AlphaEvolve 2.1 任务规范 - 用户需提供自动评估生成解决方案的机制,以函数形式将解决方案映射到一组标量评估指标,且这些指标通常需最大化 [13] - 用户可通过在代码中添加特殊注释标记进化块,块内代码作为初始解决方案,其余代码构成骨架 [19][20] - AlphaEvolve可通过多种方式应用于同一问题,不同抽象级别适用于不同问题 [21][22] 2.2 提示采样 - AlphaEvolve支持多种定制和提供长上下文的提示,包括显式上下文、随机格式化、渲染评估结果和元提示进化等 [23][25] 2.3 创造性生成 - AlphaEvolve利用大语言模型的能力,消化先前解决方案信息并提出改进方案,且模型性能越好,结果越佳 [24] - 要求大语言模型以特定格式提供代码修改,短代码或需完全重写时可直接输出代码块 [29][30] - AlphaEvolve采用Gemini 2.0 Flash和Gemini 2.0 Pro的组合,平衡计算吞吐量和解决方案质量 [31] 2.4 评估 - 新解决方案通过执行用户提供的评估函数进行自动评估,支持评估级联、大语言模型生成反馈和并行化评估等机制 [32] - AlphaEvolve允许优化多个用户提供的分数,有助于提高单一目标指标的结果 [33] 2.5 进化 - AlphaEvolve在进化过程中生成的解决方案存储在进化数据库中,该数据库结合了MAP elites算法和基于岛屿的种群模型 [34] 2.6 分布式管道 - AlphaEvolve是异步计算管道,由控制器、大语言模型采样器和评估节点组成,优化吞吐量以提高计算效率 [35] 3. 结果 3.1 更快的矩阵乘法 - 矩阵乘法是计算机科学的基础操作,找到低秩张量分解可开发更快的算法,但该问题极具挑战性 [38] - AlphaEvolve能开发出优于现有方法的张量分解算法,通过评估级联和特定评估方法衡量性能,改进了14种不同矩阵乘法目标的现有技术 [39][40] 3.2 解决数学问题 - AlphaEvolve可作为强大工具探索数学问题的搜索空间,在超50个数学问题中,约75%的情况重现了已知最佳构造,约20%的情况发现了更好的构造 [42][43] - AlphaEvolve通过进化启发式搜索算法而非直接进化构造本身,实现了高效的大规模探索 [50] 3.3 优化谷歌计算生态系统 - **数据中心调度**:将在线作业调度问题建模为向量装箱问题,AlphaEvolve发现的启发式函数优于生产中的函数,平均可回收0.7%的计算资源,且具有可解释性等优势 [60][61] - **Gemini内核工程**:AlphaEvolve优化矩阵乘法操作的平铺启发式,使内核平均加速23%,减少了Gemini训练时间,加速了内核优化过程 [64][67] - **硬件电路设计**:AlphaEvolve优化TPU算术电路,减少面积和功耗,其建议以Verilog语言呈现,便于硬件工程师采用 [69][70] - **直接优化编译器生成的代码**:AlphaEvolve优化了FlashAttention内核及前后处理代码,分别加速32%和15%,展示了优化编译器生成代码的能力 [73] 4. 消融实验 - 对矩阵乘法和接吻数问题进行消融实验,结果表明进化方法和提示中的上下文对AlphaEvolve的结果有显著提升作用 [74][75] 5. 相关工作 - AlphaEvolve扩展了进化或遗传编程的研究传统,与FunSearch等系统相比,具有可进化整个代码库、多目标优化和使用前沿大语言模型等优势 [76][80] - 其他相关工作包括使用大语言模型引导进化的各种方法,但AlphaEvolve在规模、灵活性和通用性方面有所不同 [81] 6. 讨论 - AlphaEvolve结合大语言模型和自动化评估指标的进化框架具有强大能力,但主要处理可自动评估的问题,未来可与其他方法结合处理更广泛的问题 [88][92]
速递丨智谱完成新一轮超10亿元融资,京杭联手重仓押注下一个Deepseek!
Z Finance· 2025-03-03 09:41
图片来源:智谱 当全国目光聚焦于杭州"六小龙 " 的快速崛起时,这座数字经济重镇在生成式AI领域再落关键一子。 ZF获悉, 智谱AI近期完成了由杭州城投产业基金、上城资本等机构联合主导的超10亿元战略投资。 这是杭州国资体系首次在大模型赛道进行战略性布局,甚至早于杭州本土明星企业深度求索 (DeepSeek)。 为何是智谱?开源具有标杆意义 在人工智能技术迭代加速的背景下,开源模式正重构全球AI创新格局。DeepSeek的开源实践揭示了 国产AI技术突破的两大路径:一是通过算法创新降低算力依赖,其自研混合专家架构(MoE)使模型 推理成本降至行业平均水平的30%,二是构建开源生态形成技术反哺闭环,其开源策略吸引全球50万 开发者参与生态共建。这种"技术民主化"趋势正推动中国AI产业从应用层创新向底层技术攻坚跃迁。 开源战略的本质是重构技术壁垒。DeepSeek-R1模型以560万美元成本实现与百亿美元级模型相当性 能,打破了"算力=竞争力"的传统范式,印证了算法优化对硬件依赖的替代效应。这种突破不仅体现 在技术指标上,更反映在产业链话语权重构——通过与华为昇腾等国产硬件深度适配,中国AI企业正 逐步摆脱对CU ...
获3.5亿美元投资,谷歌押注的人形机器人进厂造奔驰
创业邦· 2025-03-01 11:03
人形机器人行业发展背景 - 2013年DARPA机器人挑战赛(DRC)因福岛核电站事故暴露机器人应对灾难不足而举办 旨在探索机器人未来 [1] - NASA为参赛打造的Valkyrie类人机器人仅用9个月完成雏形 外观设计刻意模仿真人以降低距离感 [2] - Valkyrie实际表现不佳但影响深远 部分开发成员后来创办的初创公司成为具身智能浪潮先驱 [4] Apptronik公司起源 - 2010年斯坦福教授Luis Sentis在德克萨斯大学建立人本机器人实验室 提出新型全身控制框架理论 [8] - 2013年实验室与NASA合作开发Valkyrie机器人 技术商业化硕士Jeff Cardenas被其吸引加入团队 [8][9] - 2016年团队分拆成立Apptronik 初期拒绝外部融资 通过NASA等政府合同获得750万美元研发资金 [10] Apollo机器人技术特点 - 2023年推出的Apollo人形机器人高173cm/重73kg 可举25kg物体 续航4小时 模块化设计包含32个专利执行器 [14] - 采用串联弹性扭矩控制架构实现人机安全交互 各部件可更换适配不同场景需求 [14] - 硬件能力突出 已迭代15版原型机 执行器领域积累超300项专利 [14] 商业化进展 - 2024年与梅赛德斯-奔驰合作试点 数据显示提升配送效率40% 降低人力成本32% [16] - 计划2025年商业化 目标售价低于5万美元 已与特雷克斯/GXO等十余家企业达成协议 [15][26] - 2024年完成3.5亿美元A轮融资 资金用于扩大生产 预计2024年量产近百台 2025年达数百台 [26] 技术合作路径 - 选择与大模型厂商合作路线 先后与NVIDIA GR00T模型/谷歌Gemini 2.0 Pro达成技术整合 [20][21] - 与Figure AI自研路线形成对比 行业尚未形成统一技术路径 [22] - 当前重点解决训练数据获取问题 工业场景成为最佳数据来源和商业化突破口 [24] 产能扩张计划 - 与制造业巨头Jabil达成战略合作 未来可能实现机器人自主生产机器人 [27] - 计划2026年实现真正规模化 正在与约60个潜在客户进行商业谈判 [26][27]