Gemini 2.0 Pro

搜索文档
AlphaEvolve: A coding agent for scientific and algorithmic discovery
Google DeepMind· 2025-05-16 00:00
报告行业投资评级 未提及相关内容 报告的核心观点 - AlphaEvolve结合了最先进的大语言模型和自动化评估指标,在进化框架内展现出强大能力,能在数学问题上取得新发现,并对计算堆栈进行实际改进 [88] - AlphaEvolve可通过不同方式处理同一问题,且能作为测试时计算代理,增强基础大语言模型的能力,未来可考虑将其增强性能融入下一代基础模型 [89][90] 根据相关目录分别进行总结 1. 引言 - 发现新知识通常是个漫长过程,虽大语言模型和智能体的发展推动了自动化,但实现全新科学或实际发现仍具挑战 [2] - AlphaEvolve是基于进化计算和大语言模型代码生成的优化代理,专注于可自动评估的科学和工程发现问题,能进化复杂代码,超越以往系统 [3][7] - 因自动化评估指标的限制,AlphaEvolve主要聚焦于数学、计算机科学和系统优化领域 [9] 2. AlphaEvolve 2.1 任务规范 - 用户需提供自动评估生成解决方案的机制,以函数形式将解决方案映射到一组标量评估指标,且这些指标通常需最大化 [13] - 用户可通过在代码中添加特殊注释标记进化块,块内代码作为初始解决方案,其余代码构成骨架 [19][20] - AlphaEvolve可通过多种方式应用于同一问题,不同抽象级别适用于不同问题 [21][22] 2.2 提示采样 - AlphaEvolve支持多种定制和提供长上下文的提示,包括显式上下文、随机格式化、渲染评估结果和元提示进化等 [23][25] 2.3 创造性生成 - AlphaEvolve利用大语言模型的能力,消化先前解决方案信息并提出改进方案,且模型性能越好,结果越佳 [24] - 要求大语言模型以特定格式提供代码修改,短代码或需完全重写时可直接输出代码块 [29][30] - AlphaEvolve采用Gemini 2.0 Flash和Gemini 2.0 Pro的组合,平衡计算吞吐量和解决方案质量 [31] 2.4 评估 - 新解决方案通过执行用户提供的评估函数进行自动评估,支持评估级联、大语言模型生成反馈和并行化评估等机制 [32] - AlphaEvolve允许优化多个用户提供的分数,有助于提高单一目标指标的结果 [33] 2.5 进化 - AlphaEvolve在进化过程中生成的解决方案存储在进化数据库中,该数据库结合了MAP elites算法和基于岛屿的种群模型 [34] 2.6 分布式管道 - AlphaEvolve是异步计算管道,由控制器、大语言模型采样器和评估节点组成,优化吞吐量以提高计算效率 [35] 3. 结果 3.1 更快的矩阵乘法 - 矩阵乘法是计算机科学的基础操作,找到低秩张量分解可开发更快的算法,但该问题极具挑战性 [38] - AlphaEvolve能开发出优于现有方法的张量分解算法,通过评估级联和特定评估方法衡量性能,改进了14种不同矩阵乘法目标的现有技术 [39][40] 3.2 解决数学问题 - AlphaEvolve可作为强大工具探索数学问题的搜索空间,在超50个数学问题中,约75%的情况重现了已知最佳构造,约20%的情况发现了更好的构造 [42][43] - AlphaEvolve通过进化启发式搜索算法而非直接进化构造本身,实现了高效的大规模探索 [50] 3.3 优化谷歌计算生态系统 - **数据中心调度**:将在线作业调度问题建模为向量装箱问题,AlphaEvolve发现的启发式函数优于生产中的函数,平均可回收0.7%的计算资源,且具有可解释性等优势 [60][61] - **Gemini内核工程**:AlphaEvolve优化矩阵乘法操作的平铺启发式,使内核平均加速23%,减少了Gemini训练时间,加速了内核优化过程 [64][67] - **硬件电路设计**:AlphaEvolve优化TPU算术电路,减少面积和功耗,其建议以Verilog语言呈现,便于硬件工程师采用 [69][70] - **直接优化编译器生成的代码**:AlphaEvolve优化了FlashAttention内核及前后处理代码,分别加速32%和15%,展示了优化编译器生成代码的能力 [73] 4. 消融实验 - 对矩阵乘法和接吻数问题进行消融实验,结果表明进化方法和提示中的上下文对AlphaEvolve的结果有显著提升作用 [74][75] 5. 相关工作 - AlphaEvolve扩展了进化或遗传编程的研究传统,与FunSearch等系统相比,具有可进化整个代码库、多目标优化和使用前沿大语言模型等优势 [76][80] - 其他相关工作包括使用大语言模型引导进化的各种方法,但AlphaEvolve在规模、灵活性和通用性方面有所不同 [81] 6. 讨论 - AlphaEvolve结合大语言模型和自动化评估指标的进化框架具有强大能力,但主要处理可自动评估的问题,未来可与其他方法结合处理更广泛的问题 [88][92]
获3.5亿美元投资,谷歌押注的人形机器人进厂造奔驰
创业邦· 2025-03-01 11:03
人形机器人行业发展背景 - 2013年DARPA机器人挑战赛(DRC)因福岛核电站事故暴露机器人应对灾难不足而举办 旨在探索机器人未来 [1] - NASA为参赛打造的Valkyrie类人机器人仅用9个月完成雏形 外观设计刻意模仿真人以降低距离感 [2] - Valkyrie实际表现不佳但影响深远 部分开发成员后来创办的初创公司成为具身智能浪潮先驱 [4] Apptronik公司起源 - 2010年斯坦福教授Luis Sentis在德克萨斯大学建立人本机器人实验室 提出新型全身控制框架理论 [8] - 2013年实验室与NASA合作开发Valkyrie机器人 技术商业化硕士Jeff Cardenas被其吸引加入团队 [8][9] - 2016年团队分拆成立Apptronik 初期拒绝外部融资 通过NASA等政府合同获得750万美元研发资金 [10] Apollo机器人技术特点 - 2023年推出的Apollo人形机器人高173cm/重73kg 可举25kg物体 续航4小时 模块化设计包含32个专利执行器 [14] - 采用串联弹性扭矩控制架构实现人机安全交互 各部件可更换适配不同场景需求 [14] - 硬件能力突出 已迭代15版原型机 执行器领域积累超300项专利 [14] 商业化进展 - 2024年与梅赛德斯-奔驰合作试点 数据显示提升配送效率40% 降低人力成本32% [16] - 计划2025年商业化 目标售价低于5万美元 已与特雷克斯/GXO等十余家企业达成协议 [15][26] - 2024年完成3.5亿美元A轮融资 资金用于扩大生产 预计2024年量产近百台 2025年达数百台 [26] 技术合作路径 - 选择与大模型厂商合作路线 先后与NVIDIA GR00T模型/谷歌Gemini 2.0 Pro达成技术整合 [20][21] - 与Figure AI自研路线形成对比 行业尚未形成统一技术路径 [22] - 当前重点解决训练数据获取问题 工业场景成为最佳数据来源和商业化突破口 [24] 产能扩张计划 - 与制造业巨头Jabil达成战略合作 未来可能实现机器人自主生产机器人 [27] - 计划2026年实现真正规模化 正在与约60个潜在客户进行商业谈判 [26][27]
TMT行业周报(2月第2周):DeepSeek引领国内推理侧行情-20250319
世纪证券· 2025-02-17 16:11
报告行业投资评级 未提及 报告的核心观点 - TMT板块整体跑赢沪深300 DeepSeek相关催化使TMT板块在2025.02.05 - 2025.02.14期间,计算机、传媒、电子、通信一级行业均有涨幅 计算机涨幅22.29%、传媒涨幅17.43%、电子涨幅6.43%、通信涨幅6.13% 沪深300涨幅3.19% [3] - DeepSeek引发鲶鱼效应 其V3及R1模型推出重塑AI大模型竞争格局 推动应用端爆发 R1及o3等推理模型迭代有望在垂类细分场景取得应用端突破 建议关注AI医疗、AI教育及AI金融等产业链 [3] - DeepSeek拉动推理侧算力需求增长 DeepSeek APP上线20天全球日活DAU达2215万 推理需求爆发拉动算力增长 海外芯片供应受阻下 建议关注国内算力相关产业链 [3] 市场周度回顾 - TMT板块一级行业表现 2025.02.05 - 2025.02.14期间 计算机涨幅22.29%、传媒涨幅17.43%、电子涨幅6.43%、通信涨幅6.13% 整体跑赢沪深300(3.19%) [3] - TMT板块三级子行业表现 涨幅靠前的为影视动漫制作(50.61%)、横向通用软件(27.75%)、IT服务Ⅲ(26.30%) 靠后的为印制电路板(1.80%)、通信线缆及配套(1.76%)、通信网络设备及器件( - 1.89%) [3] - 细分个股表现 电子周涨幅前三为弘信电子(50.35%)、联创电子(47.96%)、福立旺(42.75%) 计算机为青云科技(208.19%)、优刻得 - W(177.44%)、每日互动(111.66%) 传媒为光线传媒(264.43%)、浙数文化(75.81%)、福石控股(40.57%) 通信为梦网科技(114.45%)、润建股份(71.92%)、数据港(71.79%) [3] 行业要闻及重点公司公告 行业重要事件 未提及 行业要闻 AI模型侧 - 近期行业展会及会议安排 2月4日2025中东迪拜AI技术人工智能展 2月6日《网络游戏分类》和《游戏分发与推广基本要求》实施 2月10日法国巴黎人工智能行动峰会 2月19日2025工业互联网大会和英伟达公布业绩数据 3月17日英伟达GTC大会 [16] - 各公司模型动态 2月5日DeepSeek发布52个在招职位 京东云和国家超算互联网平台上线相关模型 2月6日谷歌发布新模型 华为平台支持DeepSeek模型 研究人员训练s1模型 2月7日即梦AI发布新功能预告片 2月8日据AI产品榜1月DeepSeek用户增长1.25亿 特朗普称DeepSeek无安全威胁 上海人工智能产业规模突破4000亿 腾讯申请专利 2月9日DeepSeek - V3 API服务调整价格 2月10日豆包发布视频生成实验模型 奥尔特曼称AI成本下降及宣布布局AI智能体 [17][19] AI应用侧 - 各公司应用及产品进展 2月12日字节跳动提出UltraMem架构 OpenAI称不售予马斯克 宣布推GPT - 5 马斯克称Grok 3将发布 奥特曼计划与DeepSeek会面 文心一言宣布免费开放 2月13日百度宣布推文心大模型4.5系列并开源 2月5 - 24日期间 多家公司接入DeepSeek模型 苹果与阿里合作开发AI功能等 [22][24][26] AI算力侧 - 行业政策及公司动态 2月14日苏州发布支持人工智能人才措施 中国信通院启动DeepSeek国产化适配测评 苹果努力引入AI功能 2月5日集邦咨询称DeepSeek影响数据中心建置量 光收发模块出货量增长 DIGITIMES Research称2025年半导体产业营收增长 2月6日日本研发量子计算机 村田社长看好被动元件需求 2月9日家电以旧换新数据公布 2月10日台积电受地震影响收入预计 法国宣布AI产业投资 [29] 公司公告 - 行业倡议及研究报告 2月11日欧盟发起“人工智能投资”倡议 2月12日TrendForce报告称2025年全球AI服务器出货量有望年增近28% 2024年出货量年增46% 联想发布报告 软银集团表示项目资金来源 [32] - 公司业务及财务动态 2月13日阿里云泰国数据中心启用 天津人工智能计算中心接入DeepSeek模型 2月5 - 14日期间 多家公司有业务合作、产品接入、业绩、减持、中标等相关公告 [34][35][37]