Workflow
icon
搜索文档
2025 年代理与基础用白皮书(英文版)
谷歌· 2025-01-13 14:45
行业投资评级 - 报告未明确提及行业投资评级 [1][2][3] 核心观点 - 生成式AI代理通过利用工具访问实时信息、建议实际操作行动,并自主规划和执行复杂任务,扩展了语言模型的能力 [114] - 代理操作的核心是编排层,这是一种认知架构,用于结构化推理、规划、决策并指导其行动 [115] - 工具如扩展、函数和数据存储,作为代理与外界世界的钥匙,允许它们与外部系统互动并访问超出训练数据的知识 [116] 行业概述 - 生成式AI代理通过观察世界并利用自身拥有的工具来实现目标,具有自主性,可以在没有人类干预的情况下独立行动 [8] - 代理的认知架构中包含三个基本组成部分:模型、工具和编排层 [9][11][13][14] 模型 - 模型是代理的集中决策制定者,可以是通用、多模态或根据特定需求进行微调的语言模型 [11] - 模型通常不会专门针对代理的具体配置设置进行训练,但可以通过提供展示代理能力的例子进一步细化 [11] 工具 - 工具赋能代理与外部数据和服务进行交互,解锁超出基础模型单独功能范围的一系列新动作 [13] - 工具可以采用多种形式,通常与常见的Web API方法相对应,如GET、POST、PATCH和DELETE [13] 编排层 - 编排层规范了代理如何接收信息、执行内部推理,并使用这些推理来指导其下一步行动或决策 [14] - 编排层的复杂度因代理及其执行的任务而异,可能包含链式逻辑、机器学习算法或其他概率推理技术 [14] 代理与模型的区别 - 模型的知识仅限于其训练数据,而代理的知识通过工具与外部系统扩展 [16] - 代理具有会话历史记录和连续上下文,允许基于多轮推理和预测 [16] - 工具在代理中本地实现,而模型没有本机工具实现 [16] 认知架构 - 代理通过迭代处理信息、做出有根据的决策,并根据之前的输出优化下一步行动来达到最终目标 [21] - 代理认知架构的核心是协调层,负责维护记忆、状态、推理和规划 [21] 推理技术 - 代理可以利用多种推理技术,如ReAct、链式思维(Chain-of-Thought)和树状思维(Tree-of-Thoughts) [22][24][25] - ReAct框架为语言模型提供了一种思维过程策略,使其能够在有或没有上下文示例的情况下对用户查询进行推理和采取行动 [22] 扩展 - 扩展通过标准化方式在API和代理之间建立桥梁,允许代理无缝执行API [34][37] - 扩展可以独立于代理进行构建,但应作为代理配置的一部分提供 [38] 函数 - 函数允许模型输出一个函数及其参数,但不进行实时API调用 [47] - 函数在客户端执行,而扩展在代理端执行 [48] 数据存储 - 数据存储通过提供更动态和最新的信息访问途径,确保模型的响应始终保持在事实性和相关性之上 [74] - 数据存储将传入的文档转换为一组向量数据库嵌入,代理可以使用它来提取需要的信息 [77] 实施和应用 - 数据存储通常被实现为矢量数据库,允许代理在运行时访问各种格式的数据 [79] - 基于RAG的应用程序通过给模型访问各种格式的数据,旨在扩展和加深模型的知识范围 [81] 工具回顾 - 扩展、功能和数据存储构成了几种不同的工具类型,供代理在运行时使用 [90] - 每种工具都有其特定的目的,代理开发者可以根据需要将它们单独使用或组合使用 [90] 提高模型性能 - 上下文学习、基于检索的上下文学习和基于微调的学习是提高模型性能的几种方法 [94][95][96] - 这些方法在速度、成本和延迟方面各有独特的优势和劣势 [102] 代理快速入门 - 使用LangChain和LangGraph库可以构建一个快速原型,展示模型、编排和工具等基础组件如何共同工作以实现特定目标 [104][105] 生产应用程序 - Vertex AI平台通过提供一个全面管理的环境,简化了构建生产级应用的过程 [111] - 该平台包括Vertex Agent Builder、Vertex Extensions、Vertex Function Calling和Vertex Example Store等功能 [112] 总结 - 代理的未来蕴含着激动人心的进步,随着工具变得更加复杂且推理能力得到增强,代理将被赋予解决越来越复杂问题的能力 [117] - 通过结合专门的代理,可以创建一种"代理专家混合"方法,能够在各个行业和问题领域交付卓越的结果 [118]
2025 年代理与基础用白皮书
谷歌· 2025-01-08 09:50
行业投资评级 - 报告未明确提及行业投资评级 [1][2][3] 核心观点 - 生成式AI代理通过利用工具访问实时信息、建议实际动作,并自主规划和执行复杂任务来扩展语言模型的能力 [6][8][113] - 代理操作的核心是编排层,这是一种认知架构,用于结构化推理、规划、决策并指导其行动 [14][114] - 工具如扩展、函数和数据存储是代理与外界世界的钥匙,允许它们与外部系统互动并访问超出训练数据的知识 [13][31][115] 目录总结 什么是代理人 - 生成式AI代理是一种应用程序,通过观察世界并利用自身拥有的工具来实现目标,具有自主性 [8] The model - 代理使用的模型可以是通用语言模型,能够基于指令推理和逻辑框架进行工作 [11] 工具 - 工具弥补了基础模型无法与外部世界互动的能力,赋能代理与外部数据和服务进行交互 [13] 编排层 - 编排层规范了代理如何接收信息、进行内部推理,并利用这些推理来指导其下一步行动或决策 [14] 代理与模型 - 代理通过工具与外部系统连接,扩展了知识范围,而模型的知识仅限于其训练数据 [16] 认知架构:代理如何运作 - 代理的认知架构包括信息摄入、规划、执行和调整的循环过程,类似于厨师的烹饪过程 [17][19][20] 工具:我们通往外部世界的钥匙 - 工具使代理能够实时、上下文感知地与外部系统进行互动,扩展了模型的能力 [30][31] Extensions - 扩展通过标准化方式在API和代理之间搭建桥梁,允许代理无缝执行API [33][36] 函数 - 函数在代理的世界中工作方式类似于软件开发中的函数,模型可以接受一组已知函数并根据其规范决定何时使用 [45][46] 用例 - 代理可以通过函数调用处理复杂的客户端执行流程,生成结构化格式的输出以便解析 [54][55] 数据存储 - 数据存储通过提供动态和最新的信息访问途径,确保模型的响应始终保持事实性和相关性 [71][74] 实施和应用 - 数据存储通常被实现为矢量数据库,允许代理在运行时访问各种格式的数据 [76][78] 工具回顾 - 扩展、函数和数据存储构成了几类不同的工具类型,供代理在运行时使用 [87][88] 通过有针对性的学习提高模型性能 - 上下文学习、基于检索的上下文学习和基于微调的学习是提高模型性能的几种方法 [91][92][93] 代理快速入门与 LangChain - 使用LangChain和LangGraph库可以构建客户代理,通过将逻辑、推理和工具调用的序列链接在一起来回答用户的问题 [101][102] 使用 Vertex AI 代理的生产应用程序 - Vertex AI平台提供了一个全面管理的环境,简化了构建生产级代理应用的过程 [108][109] Summary - 代理通过利用工具访问实时信息、建议实际动作,并自主规划和执行复杂任务来扩展语言模型的能力 [113][114][115]
2025年Agents与基础应用白皮书
谷歌· 2025-01-07 13:40
代理人 作者:Julia Wiesinger, Patrick Marlow和 Vladimir Vuskovic Agents 致谢 审稿人和贡献者 Evan Huang Emily Xue Olcan Sercinoglu Sebastian Riedel Satinder Baveja Antonio Gulli Anant Nawalgaria 策展人和编辑 安东尼奥·古利 Anant Nawalgaria 格雷斯·莫⾥森 技术作家 乔伊·海梅克 设计师 迈克尔·兰宁 September 2024 2 目录 | 介绍 | 4 | | --- | --- | | 什么是代理? | 5 | | 模型 | 6 | | ⼯具 | 7 | | 编排层 | 7 | | 代理⼈ vs. 模型 | 8 | | 认知架构:代理⼈如何运作 | 8 | | ⼯具:我们与外界的钥匙 | 12 | | 扩展 | 13 | | ⽰例扩展 | 15 | | 功能 | 18 | | 使⽤情况 | 21 | | 函数⽰例代码 | 24 | | 数据存储 | 27 | | 实施和应⽤ | 28 | | ⼯具总结 | 32 | | 通过有 ...
谷歌20241030
谷歌· 2024-10-31 00:38
纪要涉及的行业或者公司: 1. 上市公司Alphabet及其子公司Google、Google Cloud、YouTube、Waymo等 [1][2][3][4][5][6][7][8] 纪要提到的核心观点和论据: 1. Alphabet在AI领域拥有独特优势,包括强大的AI基础设施、顶尖的研究团队以及广泛的全球用户触达能力,正在推动AI在各业务领域的应用和创新 [1][2][3][4] 2. Google Search通过AI驱动的新功能如AI概览、Lens等不断提升用户体验,带动搜索量和广告收入增长 [4][5][9][10] 3. Google Cloud业务增长强劲,得益于在AI基础设施、AI平台、数据分析等方面的技术领先优势,为客户带来显著的业务价值 [5][6][14][15] 4. YouTube在短视频和直播电视等领域保持强劲增长,并通过AI推荐等提升用户体验和广告变现 [11][12] 5. Waymo自动驾驶业务取得重大进展,已成为行业技术领导者,并开始实现商业化应用 [7][8] 6. Alphabet正在通过组织架构调整等方式,提升公司敏捷性和执行力,以更好地推动AI等关键技术的创新和应用 [3][4][28] 7. Alphabet在保持高增长的同时,也在持续优化成本结构,提升运营效率和盈利能力 [12][13][27][28][29] 其他重要但可能被忽略的内容: 1. Alphabet在清洁能源等领域的投资,包括与小型模块化反应堆的首个企业协议 [2] 2. Alphabet研究团队成员Demis Hassabis和John Jumper获得诺贝尔化学奖,以及Jeff Fenton获得诺贝尔物理学奖,突出了公司在AI领域的领先地位 [3] 3. Alphabet正在加强Gemini模型在内部和外部开发者中的应用,包括在GitHub Copilot等平台上的推广 [3][4] 4. Alphabet在内部使用AI提高编码效率,超过四分之一的新代码由AI生成 [4] 5. Alphabet在第四季度可能面临一些广告收入增长放缓的因素,如亚太地区电商广告的基数效应等 [16]
美国加征关税对消费品影响更大,谷歌继续加码AI基础投资,人民币汇率后续“补涨”空间有限---0730宏观脱水 - 华尔街见闻
谷歌· 2024-07-30 23:20
美国加征关税对消费品影响更大 - 关税豁免到期或小幅影响,主要为中间品、资本品 [7] - 假设最惠国待遇取消,将更多影响消费品 [10][13] - 假设关税逐步加征,对消费品影响更大 [14][17] - 加征前,抢出口更多为高依赖商品或中间品、资本品 [18][20] - 加征中,关税豁免清单对冲关税影响,但有效果的更多是中间品、资本品 [21][25] - 加征后,我国出口模式已在转型,总体模式从依赖美国的加工贸易,转向依赖自主产业竞争力的一般贸易 [26][28] 谷歌继续加码AI基础投资 - 谷歌指出全球人工智能企业将继续大力投资于人工智能培训基础设施,以开发最先进的LLM(大语言模型) [30] - 谷歌在2024年第二季度的资本支出主要是对技术基础设施的投资,其中最大的组成部分是服务器,其次是数据中心 [33] - 谷歌的LLM(Gemini)的开发和生成式人工智能技术和应用已经产生了数十亿美元的收入 [36][37] - 谷歌第六代张量处理单元(TPU)——Trillium——每块芯片的峰值计算性能提高了近5倍 [38] 人民币汇率后续"补涨"空间有限 - 人民币急升的宏观基础有三:美元指数回落,稳增长政策加码,贸易顺差新高 [41][42][43] - 人民币急升的触发因素有二:日元升值产生联动,政策调控信号 [44][46] - 人民币汇率后续"补涨"空间有限,本次升值后的人民币汇率水平基本处于合理区间 [47][49]
谷歌20240726
谷歌· 2024-07-27 20:32
会议主要讨论的核心内容 搜索业务 - 公司正在通过AI技术不断改善搜索体验,推出了AI概述功能,提高了用户满意度和搜索使用量,尤其是18-24岁年轻用户的使用量[1][2] - 公司正在扩展搜索的类型和方式,如视觉搜索、视频搜索等,为用户提供更多搜索选择[2][3] AI技术发展 - 公司的AI基础设施和生成式AI解决方案已为云业务带来数十亿美元收入,被超过200万开发者使用[1] - 公司正在不同层面创新AI技术,从芯片到代理等,并持续提升AI模型的性能和效率[3][4] - 公司的AI模型Gemini已广泛应用于Google的六大拥有超20亿月活用户的产品中[3] 云业务 - 云业务Q2季度收入首次超过100亿美元,同时季度经营利润也超过10亿美元[1][2] - 公司的AI基础设施和生成式AI解决方案正帮助云业务快速增长,受到众多客户的青睐[1][4][5] - 公司正在不断推出新的云计算产品和服务,如Trillium AI加速器、A3 Mega等,提升云业务的竞争力[4][5] YouTube业务 - YouTube在美国流媒体观看时间保持领先地位,短视频和联网电视观看量去年翻倍[6] - 公司正在帮助广告主通过视频广告提升营销效果,并推出YouTube购物等新功能[8][9] 其他业务 - Waymo自动驾驶业务进展良好,已提供超过200万次付费乘客服务,每周提供超过5万次无人驾驶服务[6] - 公司正在优化内部成本,利用AI技术提升工程师效率,但仍处于早期阶段[9][10]
Jefferies:英伟达博通苹果等会议纪要
谷歌· 2024-07-09 20:45
会议主要讨论的核心内容 - Nvidia和Broadcom认为AI领域的投资是长期需求,而非短期机会主义行为[1][2] - 超大规模公司正在积极确保所需资源,为未来50年的基础设施建设做出重大赌注[1][2] - Nvidia的供应链自5月中旬以来出现上升趋势,新一代Blackwell芯片的产量比之前计划高出40%[1][2] - Nvidia预计明年将生产60,000台MVL系统,包括50,000台MVL36和10,000台MVL72[2] - Nvidia的ASP从Hopper时代的20,000美元跃升至Blackwell时代的45,000美元,预计今年单位增长超过100%[1][2] - Broadcom向Google和Meta供货,其中Google的业务增长显著,从20亿美元增至48亿美元,目前指导目标为110亿美元[1][2] 问答环节重要的提问和回答 问题1 **Nvidia和Broadcom在AI领域的投资回报和可持续性方面有何看法?** **回答** Nvidia和Broadcom认为这些是长期需求,而不是短期机会主义行为。超大规模公司明确知道自己的方向,并提前采购数据中心场地,正在为未来50年的基础设施建设做出重大赌注[1][2] 问题2 **Nvidia近期在供应链和产品周期方面有哪些重要进展?** **回答** 自5月中旬以来,Nvidia的供应链出现上升趋势,新一代Blackwell芯片的产量比之前计划高出40%。Blackwell芯片的月产量从不到200,000增加到250,000-270,000之间,新平台将在第三季度开始发货[1][2] 问题3 **Nvidia在MVL系统方面有哪些新的发展?** **回答** Nvidia明年将生产60,000台MVL系统,其中包括50,000台MVL36和10,000台MVL72。MVL36可能会在今年底出货,而MVL72则可能要等到明年第一或第二季度[2]
2024面向教育的生成式AI的负责任发展:评价驱动的方法(英译中)
谷歌· 2024-06-25 16:25
报告研究的公司和行业概述 - 报告研究的公司是谷歌DeepMind,谷歌研究,谷歌LearnX,谷歌创意实验室,YouTube Learning等组成的跨项目团队 [429] - 该团队致力于为教育领域开发负责任的生成式人工智能技术 [1][2][3] 报告的核心观点 1. 生成式人工智能技术在教育领域有巨大潜力,但目前仍存在一些局限性 [4][9] 2. 该团队提出了一种评估驱动的方法来开发教育用途的生成式人工智能,包括参与式研究、多学科合作和全面的教学评估 [1][10] 3. 该团队开发了一个名为LearnLM-tutor的对话式AI导师,并使用七个不同的教学评估基准对其进行了评估,结果显示其在大多数教学维度上优于基准模型 [5][6][10] 报告的主要内容 1. 参与式方法: - 通过研讨会、访谈和用户研究等方式与学习者和教育工作者进行了广泛参与 [19][20][21][22][29] - 确定了一套教学原则和能力,作为开发工作的指导 [76][136][146] 2. 教学评估: - 开发了七个全面的教学评估基准,包括定量、定性、自动和人工评估 [72][76][89][98][99][100][103][104] - 将LearnLM-tutor与基准模型进行了比较,结果显示LearnLM-tutor在大多数教学维度上表现更优 [89][90][91][92][93][94][95][96][97][98][99][100][101][102][103][104][105][106] 3. 负责任的发展: - 进行了影响评估,识别了相关的风险和缓解措施 [182][183][184] - 制定了针对LearnLM-tutor的特定政策,并进行了额外的安全微调 [185][186][187][188][189][190][191] - 采用了自动和人工红队方法来测试模型的安全性 [191][192][193]
教育生成式人工智能开发技术报告英
谷歌· 2024-06-18 14:40
报告研究的具体公司和行业 行业投资评级 报告给出了行业的投资评级。[1] 报告的核心观点 1) 报告指出,近年来人工智能技术的发展,特别是生成式人工智能(gen AI)的兴起,给教育领域带来了新的机遇和挑战。[2][3] 2) 报告认为,要充分发挥gen AI在教育中的潜力,需要解决两个关键问题:一是将教学理念转化为可操作的人工智能提示,二是缺乏针对教育目标的评估体系。[2] 3) 报告提出了一种负责任的gen AI教育应用开发方法,强调了参与式设计、多学科协作以及全面的评估体系的重要性。[11][12][19] 报告内容分类总结 1. 参与式设计:报告详细介绍了参与式研究方法,包括与学习者和教育者的研讨会、初步访谈和共同设计活动。[19][20][21][22] 2. 评估体系:报告提出了7个维度的教学评估指标体系,涵盖定量、定性、自动化和人工评估等多种方式。[14] 3. 模型改进:报告介绍了基于监督学习微调的方法,逐步提升了gen AI在教学方面的能力。[13]