TPU8
搜索文档
Everything Announced at Google Cloud Next in Under 15 Minutes
Youtube· 2026-04-23 06:41
公司产品发布:Gemini Enterprise与智能体平台 - 谷歌云推出Gemini Enterprise,定位为智能体时代的端到端系统,集成了智能与自动化,旨在从企业数据中获取智能并通过智能体驱动自动化 [1] - 系统包含智能体平台(供技术团队构建和管理智能体)和Gemini企业应用(企业核心业务运营环境),形成一个完整的集成系统以解决规模化问题 [2] - 通过智能体图库,企业可使用经批准的智能体(包括谷歌内置和自建,如价格与利润优化智能体),实现跨智能体、工具和数据源的自主编排 [3] - 演示案例显示,一个智能体可分析室内设计趋势、识别仓库滞销库存并协调重新上市活动,将原本耗时数小时的多项行动在几分钟内完成 [4] 人工智能与数据分析应用案例 - 与Google DeepMind合作开发模型,可将二维视频转换为三维空间姿态追踪,用于运动分析(如追踪飞行动力学、旋转速度和抱膝压缩度)[5] - 该技术允许运动员对比新旧录像数据(如空中停留时间),以分析动作成功与失败的关键差异,辅助训练进步 [6] - 在食品行业案例中,智能体通过结合知识图谱与PDF数据,发现跨多个文档的隐藏关联,成功识别出“午夜漩涡”冻酸奶配方中含有大豆过敏原,而传统搜索会遗漏此信息 [12][13] - 知识图谱通过Gemini对供应商手册和配方PDF进行推理,提取实体(如配方成分、过敏原)并映射其间不可见的联系,自动生成数据模式和引用 [14] 硬件基础设施更新:TPU与计算实例 - 发布第八代TPU,首次推出两个专为训练和服务需求定制的平台,其中TPU8是针对训练优化的强大平台 [7] - TPU8通过将块规模乘法直接移至MXU、采用原生INT8量化消除VPU开销,使每个Pod的计算性能比前代提升近3倍,大幅缩短前沿模型的训练时间 [8] - 采用突破性的芯片互连技术,带宽相比Ironwood提升2倍,通过3D Taurus拓扑连接多达9,600个TPU,每个Pod提供121 exaflops的FP4计算能力,性能较Ironwood提升2.8倍 [9] - 推出Google Cloud Axion N48计算实例,采用定制设计的ARM CPU,与同类x86实例相比,性价比提升高达2倍,每瓦性能提升80% [10] 安全与治理解决方案 - 推出安全产品“Whiz”,可自动从代码和云环境中无智能体介入地构建动态资产清单,提供对AI构建环境的全面可见性,并据此构建安全图谱 [14] - 安全图谱是一个动态地图,能解析任何AI应用的架构与逻辑,例如自动识别出暴露于互联网且能访问敏感客户数据的智能体,实现与AI同速的安全防护 [15] - 系统能在几分钟内自动完成:识别新智能体及其架构、自动进行安全审查以发现和验证风险、自动建议修复方案并推送至开发团队的本地工具中 [16] 客户部署与行业合作 - YouTube TV客户支持已上线语音智能体,处理NFL Sunday Ticket和YouTube TV套餐订阅问题,目前100%的用户均由该智能体服务 [17] - 演示显示,该语音智能体能够理解用户查询(如寻找仅包含体育频道的套餐),推荐具体的YouTube TV体育套餐(每月比基础套餐便宜18美元),并通过短信发送链接,还能应要求用西班牙语总结套餐信息 [18][19][20][21] - 谷歌云与埃森哲、波士顿咨询集团、德勤和麦肯锡等合作伙伴共同扩展前向部署工程师网络,这些合作伙伴已宣布大幅扩展其Gemini AI业务 [27] - 公司正通过Gemini企业智能体平台帮助独立软件供应商和SaaS公司转型其解决方案,并助力中小型企业采用Gemini Enterprise及Workspace中的AI功能 [28] 工作空间智能与协作 - 推出Workspace Intelligence,利用Gemini的高级推理能力和先进的嵌入模型,消除Workspace套件中的上下文碎片化问题 [21] - 在Google Chat中,智能体(如区域运营智能体)可主动提醒团队关键业务动态(如新展示套件提前到货),而“询问Gemini”功能可将Chat变为指挥中心,直接呈现紧急任务、相关文件(如需要本地化的演示文稿)和截止日期 [22][23] - Workspace Intelligence能理解会议上下文和文件内容,进行智能检索(如根据描述“包含上季度区域销售图表”找到具体文件),而非简单关键词匹配,从而终结“上下文税”,将碎片化信息转化为清晰路径 [24][25] 生态系统战略与开放性 - 公司强调AI未来必须是开放的,反对将用户锁定在拥有其模型、数据和智能体的“围墙花园”中,而是提供集成技术栈的同时,赋予用户选择全球最佳芯片和模型的自由 [26] - 战略核心包括:让AI能在数据所在的任何地方运行、通过深度治理功能掌控自身命运,并通过广泛的合作伙伴网络进行规模化推广 [27]