Workflow
谷歌(GOOG)
icon
搜索文档
AI编程的“作坊时代”即将终结!Google Cloud全套企业级“驾驭工程”底座,正在重构开发者的一切
AI科技大本营· 2026-04-24 07:54
文章核心观点 - Google Cloud通过一场马拉松规划与模拟的演示,系统性地展示了其构建企业级多智能体(Agent)平台所需的全套基础设施与工程范式,旨在解决将AI智能体从概念验证(Demo)落地到复杂生产环境时所面临的核心工程挑战[59] - 公司认为,软件开发正从传统的“Cloud Native”工程范式向“Agent Native”或“驾驭工程(Harness Engineering)”范式转变,其核心是为能够自主决策、协同工作的智能体网络提供生产级的管理、编排、观测与安全能力[60][61] 平台架构与核心组件 - Google Cloud为企业级智能体平台提供了一张完整的架构图,涵盖从开发套件(ADK)、运行时(Agent Runtime)、注册表(Agent Registry)到可观测性(Agent Observability)和安全网关(Agent Gateway)等模块[8][9] - 模型上下文协议(MCP)作为关键标准,使平台能够为智能体与外部工具(如Google Maps)建立安全的标准化连接,极大简化了集成工作[9][15] - 智能体注册表(Agent Registry)充当多智能体网络的“DNS解析中心”,智能体通过暴露“智能体卡片”声明能力,并通过A2A协议自动发现和对话,从而将系统内部耦合度降至最低[24][26] 智能体开发与协作模式 - 开发模式从编写线性逻辑转变为定义模块化的“技能”,并通过智能体设计器进行配置,例如为规划师智能体挂载地图技能、GIS技能和从历史文档转化的“赛事总监技能”[15][16] - 面对复杂任务,应采用多智能体协同架构,将单体应用拆解为各司其职的智能体团队,例如演示中构建了规划师、评估师和模拟器三个独立智能体进行分工协作[19][20][21] - 评估师智能体职责纯粹,仅对规划师的结果进行严苛打分;模拟器智能体则利用Gemini Deep Research学习到的现实世界人类跑步行为模式,在沙盒中生成成千上万个独立的跑者会话来模拟交通影响[23] 状态、记忆与知识管理 - 通过引入“智能体平台会话”和全托管的“记忆库”服务,解决了智能体像“金鱼”一样每次对话失忆的问题,使智能体能在时间轴上保持状态并积累结构化的长期经验[30][33] - 通过数据工程智能体自动处理非结构化地方法规文档,并利用AlloyDB数据库的内置自动嵌入功能生成向量,构建了完整的RAG闭环,使智能体具备了精准的地方性知识[34][36][37] 运维、排障与基础设施自治 - 当多智能体系统因复杂级联调用崩溃时,传统的单步调试失效,需依赖“智能体可观测性”控制台进行链路追踪,并借助“Gemini Cloud Assist”这类诊断智能体进行根因分析[39][41][42] - Cloud Assist不仅能诊断出应用层问题(如因未及时压缩事件导致上下文Token超过100万个限制),还能直接在IDE中提供带修复参数的代码差异对比视图,并自动提交触发CI/CD流程[42][43][45] - 智能体的能力可超越应用层,直接重构底层基础设施,例如通过自然语言指令,让Cloud Assist将服务从Cloud Run迁移至GKE,并自动优化存储方案和模型推理服务器配置[49][50][52] 低代码集成与跨团队协作 - 平台通过统一的Agent Registry,打破了高代码(开发者用Python编写)与无代码(业务人员通过自然语言生成)智能体之间的壁垒,使它们能基于暴露的能力接口在同一网络中协同工作[54][57][58] - 演示中,用无代码方式生成的“供应链智能体”与高代码开发的“规划师智能体”通过相互@调用,共同制定出了包含物资放置点的最终计划,实现了业务与工程团队的高效协作[57][58] 工程范式转变的意义 - 公司指出,依赖手写胶水代码、硬编码API对接、在Prompt中强塞历史记录的“小作坊时代”即将过去,开发者需要从“实现者”转变为“编排者”[26][61] - 通过提供完整的智能体家族产品,Google Cloud将“驾驭工程”从概念框架转化为一套可产品化的工程实践,旨在实现“知道、行动、反馈”的闭环,为开发者构建下一代复杂AI系统提供了底座和脚手架[60][61][62]
“训练为王”终结:AI推理新浪潮,英伟达谷歌华为切换赛道
新浪财经· 2026-04-24 07:10
AI算力需求结构向推理侧迁移 - 市场共识认为AI推理的转折点已至,英伟达CEO黄仁勋预测AI推理的规模很快将达到训练负载的十亿倍[1] - AI推理芯片企业曦望董事长预计,2026年AI推理计算需求将达到训练需求的4—5倍,推理算力租赁价格半年涨幅近40%[1] - IDC预计到2028年,推理工作负载占比将达到73%,智能体应用规模化将推动算力需求进一步向推理侧迁移[1] - 头部厂商动作表明,AI算力重心已从训练逐步切换至推理,国产算力厂商正加大押注力度[1] AI推理的技术特征与市场要求 - AI推理是持续性、碎片化的运营支出,对时延、并发和单位Token成本敏感,与传统批量化的训练不同[2] - 智能体应用需要多轮推理和长上下文记忆,单个任务消耗的Token数量可能是传统对话的数十倍[2] - 目前多数推理任务仍由CPU承担,GPU虽快但主要用于训练,推理算力需求更少但需要更多内存以避免瓶颈[2] - 不同应用场景对推理时延要求差异大,游戏用户期望15毫秒首Token时延,电商约20毫秒,智能体自助服务约50毫秒,客服机器人约100毫秒[3] - 时延的差异化要求意味着单一通用推理芯片难以覆盖全部负载,硬件厂商需在吞吐、时延、成本间取舍[3] 行业定价趋势与竞争格局 - 英伟达CEO黄仁勋认为推理Token价值已显著抬升,市场具备按响应速度分层定价的条件,高价值用户愿为更低延迟付费[3] - 英伟达将Groq纳入CUDA生态,开辟响应更快但吞吐量较低的推理细分市场,以覆盖对速度敏感的高端需求[3] - 云服务进入涨价周期,算力资源稀缺性强化,国产模型与国产硬件协同优化持续推进,国产加速卡与超节点方案进入密集落地阶段[3] 国际巨头产品战略动向 - 谷歌在Google Cloud Next26大会上发布第八代TPU新品,首次按训练/推理拆分架构,推出面向推理的TPU 8i[4] - TPU 8i瞄准AI实时推理需求,发力多智能体协同等复杂场景,通过优化内存配置与片内数据吞吐降低延迟[5] - 谷歌称TPU 8i在推理环节的性价比提升了近80%,同等算力成本下可支撑更大规模的AI并发调用[5] - 谷歌云高管指出,芯片根据训练和服务需求进行个性化定制将使整个社区受益[5] 国产算力厂商发展现状与技术路线 - 中国AI训练与推理需求爆发式增长,全国算力总量已跃居全球第二,全球占比超过30%[5] - 以华为昇腾、寒武纪思元系列为代表的国产AI芯片正加速崛起,行业地位持续攀升[5] - 华为在推理产品上体现Prefill(预填充)-Decode(解码)分离思路[6] - 寒武纪强调训练与推理一体化的架构与生态,其第五代MLUarch微架构的7nm思元590芯片集群FP16算力达2.048 PFLOPS,支持Chiplet异构集成与8卡互联[6] - 寒武纪技术路线的关键支点包括自研指令集(已迭代至第四代,同一套指令集支持训练和推理)以及训推一体的软件平台Cambricon Neuware[6] - 思元590已在互联网大厂的千卡级集群中商用部署[6] 国产厂商的差异化布局与生态挑战 - 除华为和寒武纪外,摩尔线程等公司围绕通用GPU路线推进,在推理场景重点突破多卡互联和软件工具链技术瓶颈[7] - 曦望等AI芯片企业瞄准推荐系统、长上下文推理、端侧部署等细分场景,试图在巨头主导的通用市场外寻找机会[7] - 关键挑战在于生态,英伟达CUDA已构建完整体系,是其最深的护城河[7] - 华为宣布CANN编译器和Mind系列套件将于2025年底前完成开源,寒武纪持续开放NeuWare工具链,意图降低开发者迁移门槛[7]
Meet the Unstoppable BlackRock ETF Obliterating the S&P 500, the Nasdaq-100, and the Dow Jones Right Now
Yahoo Finance· 2026-04-24 04:21
市场表现与ETF概述 - iShares Expanded Tech Sector ETF在过去一年实现了62%的回报率 显著超越了标普500指数、道琼斯工业平均指数和纳斯达克100指数26%至45%的滚动年回报率 [1] - 该ETF由全球最大资产管理公司贝莱德旗下的iShares发行 旨在让投资者投资于开发硬件和软件产品与服务的美国科技及相关公司 因此对人工智能热潮有显著敞口 [2] - 该ETF投资组合包含288只股票 覆盖科技行业12个子板块 其中超过30%的资产价值投资于半导体股票 主要源于AI行业对数据中心芯片和组件的巨大需求 [4] 投资组合结构与关键持仓 - 该ETF前十大持仓占其投资组合价值的一半以上 是基金表现超越大盘的关键原因 [6] - 前十大持仓中 半导体及AI硬件相关公司占据重要地位 Broadcom权重为9.08% Nvidia权重为8.29% Micron Technology权重为2.86% Advanced Micro Devices权重为2.62% [5] - 前十大持仓还包括微软、苹果、Alphabet、Meta Platforms和Netflix等科技巨头 [5] - 前十大持仓在过去12个月的平均回报率达到126% [6] 行业驱动因素与公司角色 - AI硬件需求推动了Nvidia、Broadcom、Advanced Micro Devices和Micron Technology的总市值达到7.7万亿美元 [5] 1. Alphabet和微软是半导体行业的最大客户之一 它们使用AI数据中心芯片和网络设备开发自有AI软件 并通过其云平台向企业出租计算能力以获取收入 [7] 2. Meta Platforms使用AI基础设施进一步开发其Llama模型 并改进其Facebook和Instagram社交媒体平台的AI内容推荐算法 [7]
Alphabet: 4 Key Themes On Why This Earnings Report Is Critical
Seeking Alpha· 2026-04-24 03:14
公司财报与市场预期 - Alphabet (GOOGL) 的下一次财报发布日期为2026年4月29日,市场预期很高 [1] - 投资者关注的核心问题之一是如何评估该公司在特定时期内维持领导地位的成本 [1] 分析师背景与研究方法 - 分析师自2011年开始投资生涯,兼具投资顾问和活跃日内交易者角色 [1] - 分析方法结合经济学知识、基本面投资分析和技术交易,旨在最大化回报 [1] - 分析内容提供清晰、可操作的投资建议,旨在构建平衡的美国证券投资组合 [1] - 分析方法结合宏观经济分析和直接的现实交易经验 [1] - 分析师拥有金融和经济学双学位,但主要专业能力来自管理和交易的积极实践 [1] - 分析目标是在美国市场识别最具盈利能力和被低估的投资机会,以构建高收益的平衡投资组合 [1]
Alphabet Has a Massive Advantage in the AI Race -- and No, It's Not Gemini
Yahoo Finance· 2026-04-24 02:50
文章核心观点 - 在人工智能领域的长期竞争中,公司的财务实力和持续投资能力比模型本身的优劣更为关键 [1][2] - Alphabet凭借其核心业务产生的巨额现金流,在AI基础设施的长期、大规模投资上拥有行业最强的优势之一 [2][6] 行业竞争格局 - AI领域的竞争是一场资本密集型的长期竞赛,公司不仅比拼创新,更比拼其维持大规模投资的能力 [1][4][5] - 与需要不断寻求外部融资的初创公司不同,拥有强大现金流的公司能够持续投资而无需担心财务稳定 [6] Alphabet的财务与投资优势 - Alphabet的核心业务在2025年产生了高达1650亿美元的运营现金流,这为其AI投资提供了坚实基础 [6] - 公司预计2026年的资本支出约为1800亿美元,强大的现金流生成能力使其能够在不损害利润率或寻求外部认可的情况下持续积极投资 [7] - 这种财务实力使公司能够投资于定制芯片、扩展全球数据中心网络以及资助长期研究 [7] AI投资的长期性 - AI不同于传统软件,它需要持续的再投资,包括建设数据中心、获取先进芯片、进行海量计算以及不断训练和优化模型,这个过程永无止境 [4] - 在AI等新兴技术领域,持久力比速度更能决定最终结果,能够承受早期低效并长期投入的公司更可能获胜 [8]
Alphabet (NasdaqGS:GOOG) 2026 Conference Transcript
2026-04-24 02:30
Alphabet (NasdaqGS:GOOG) 2026 Conference April 23, 2026 01:30 PM ET Speaker2 All right. Good morning. Welcome to the Developer Keynote. We have an exciting show for you today. Yesterday, we introduced the Gemini Enterprise Agent Platform. It allows you to build autonomous agents that proactively help users and complete tasks independently. Today, we show you how to use our agent platform to build production-ready agents. Our agent platform is powered by the state-of-the-art Gemini models, which include both ...
Will 8th-Generation TPUs Move the Needle for Google Stock?
Yahoo Finance· 2026-04-24 02:01
核心观点 - 围绕谷歌生态系统的AI建设正在加速 公司通过深化与博通的芯片合作、为Anthropic提供大规模算力以及大力投入资本支出 来巩固其在AI和云计算领域的地位[1][2] - 公司推出了新一代自研TPU芯片 旨在满足内部及外部云客户不断增长的需求 同时其云计算业务收入保持强劲增长 为硬件投资提供了坚实的财务基础[3] - 尽管公司股价和估值已大幅上涨 且大部分现金被重新投入业务导致股息率较低 但其强劲的财务表现 特别是云业务的增长和庞大的资本支出计划 显示出市场对其AI和云战略增长前景的高度预期[4][6][7] 资本支出与投资 - 公司2026年的资本支出预计将达到1750亿至1850亿美元 其中很大一部分将投向专注于AI的数据中心建设 这将同时影响芯片供应商和云业务[2] - 管理层已明确表示 大部分增加的资本支出将用于AI算力和云容量投资 最新的第八代TPU等新硬件将在此投入中体现[3] - 随着支出增加 2025年第四季度的自由现金流利润率下滑至21.6% 而运营利润率保持在31.6%[7] 硬件与芯片战略 - 公司正在深化与博通在先进芯片制造方面的长期合作伙伴关系 包括与谷歌TPU相关的硬件[1] - AI公司Anthropic已获得了约3.5吉瓦与谷歌处理器绑定的计算容量[1] - 公司刚刚发布了两款第八代TPU芯片 以应对来自谷歌DeepMind和付费云客户日益增长的需求[3] 财务表现与估值 - 公司股价在过去12个月内上涨了118.64% 今年以来上涨了8.51%[4] - 公司远期市盈率为28.81倍 是行业平均13.79倍的两倍多 表明市场对其增长抱有高预期[6] - 2025年第四季度收入达到1138亿美元 超出预期 每股收益为2.82美元 也超出预期[7] - 谷歌云业务是主要亮点 收入以强劲的两位数速度增长 且积压订单量在增加[3] 股息与现金流 - 公司股息收益率目前为0.25% 最近一次派息为2026年3月9日的每股0.210美元 远期派息率为7.60% 股息增长记录仅一年[6] - 公司大部分现金被重新投入业务 而非用于派息[6]
America's First Commercial Nuclear-Power Projects in a Decade Just Broke Ground
WSJ· 2026-04-24 02:00
文章核心观点 - 由比尔·盖茨支持的TerraPower公司与谷歌合作方Kairos公司,正在美国怀俄明州和田纳西州分别建设核电站 [1] 公司与项目动态 - TerraPower公司正在怀俄明州建设核电站项目 [1] - Kairos公司正在田纳西州建设核电站项目 [1] - 两家公司的项目均获得了比尔·盖茨的支持 [1]
Brazil regulator approves deeper probe into Google's news content use
Reuters· 2026-04-24 01:57
监管调查进展 - 巴西反垄断监管机构CADE于4月23日批准了一项建议,将深化对Alphabet旗下谷歌使用新闻内容行为的调查 [1] - 调查旨在评估谷歌是否滥用了其市场主导地位 [1] - CADE成员支持了其临时负责人Diogo Thomson de Andrade的提案,将案件退回至其总监察长办公室以启动正式行政程序 [2] 案件背景与演变 - 此案始于2019年,当时CADE决定审查搜索和新闻市场的竞争状况 [3] - 最初的调查聚焦于谷歌自动抓取新闻内容并在搜索结果中展示的行为 [3] - CADE总监察长办公室此前曾因缺乏足够违规证据而建议搁置此案 [3] - 新的分析指出,谷歌的行为已随着生成式AI功能的发展而演变,这些功能可在搜索界面直接合成信息 [4] 调查核心关切 - 分析强调了新闻出版商在获取受众方面可能对谷歌的搜索机制形成了结构性依赖 [4] - 监管方指出,这可能构成剥削性滥用,即从第三方内容中提取价值而未给予相称的补偿 [4]
Google Brings All Enterprise AI Agent Tools Under One Roof
PYMNTS.com· 2026-04-24 01:44
谷歌发布企业AI智能体平台 - 谷歌在Google Cloud Next 2026上发布了Gemini Enterprise Agent Platform,这是一个旨在统一处理智能体构建、部署、数据集成、安全和优化的单一系统[3] - 该平台取代Vertex AI成为公司主要的企业AI开发环境,所有未来的Vertex AI服务和路线图更新都将通过该平台交付[3] - 此次发布是公司对亚马逊Bedrock AgentCore和微软Foundry的直接回应,标志着企业AI竞争的重点已从模型性能转向哪个平台能最便捷、大规模地构建、部署和信任智能体[4] 智能体构建与规模化能力 - 平台按受众区分构建工具:技术团队使用代码优先的Agent Development Kit,支持基于图的多智能体网络;业务用户使用低代码可视化界面Agent Studio[5] - ADK每月在Gemini模型上处理超过6万亿个tokens[5] - 平台通过改进的Agent Runtime和Memory Bank支持长时间运行的智能体,可保持状态数天,解决了智能体从概念验证转向生产时因无法维持跨多步骤工作流或长时间上下文而崩溃的常见故障点[6] 数据集成与连接能力 - 企业AI部署的主要障碍通常不是模型错误,而是智能体无法连接到持有相关信息的系统[8] - ADK支持原生生态系统集成,无需构建自定义管道即可将智能体连接到内部数据,并允许用户在BigQuery和Pub/Sub等平台中通过批处理和事件驱动型智能体激活数据[9] - 平台通过Model Garden连接超过200个模型,包括谷歌自家的Gemini 3.1 Pro以及Anthropic的Claude Opus、Sonnet和Haiku等第三方模型[9] 平台治理与安全特性 - 平台通过治理层与单点解决方案明确区分,解决了大规模部署智能体时可能出现的无迹可寻身份、越界操作或敏感数据暴露等特定风险[11] - 平台通过Agent Identity为每个智能体分配唯一的加密ID,创建可审计的行动轨迹;Agent Registry索引每个内部智能体、工具和批准技能;Agent Gateway在整个智能体群中强制执行一致的安全策略[12] - Agent Anomaly Detection使用统计模型和LLM-as-a-judge框架实时标记异常推理[12] 客户应用案例与成效 - 费用管理平台Payhawk表示,其财务控制智能体使用Memory Bank后,费用提交时间减少了超过50%[7] - PayPal使用Agent Development Kit和可视化工具管理多智能体工作流并检查智能体交互,谷歌的Agent Payment Protocol为其基于智能体的可信商业提供了基础[7] - 欧莱雅正在谷歌云上使用ADK构建专有的智能体平台,通过Model Context Protocol将智能体连接到其数据平台和核心运营应用程序,该公司将此方法描述为从工作流自动化向自主、以结果为导向的智能体编排的转变[10] 平台定位与目标用户 - 鉴于智能体技术对企业而言较新且存在真实的安全担忧,谷歌将该平台主要定位于IT和技术团队,而业务用户则被引导至单独的Gemini Enterprise应用程序以处理任务级用例[13]