Google Cloud Axion
搜索文档
Everything Announced at Google Cloud Next in Under 15 Minutes
Youtube· 2026-04-23 06:41
公司产品发布:Gemini Enterprise与智能体平台 - 谷歌云推出Gemini Enterprise,定位为智能体时代的端到端系统,集成了智能与自动化,旨在从企业数据中获取智能并通过智能体驱动自动化 [1] - 系统包含智能体平台(供技术团队构建和管理智能体)和Gemini企业应用(企业核心业务运营环境),形成一个完整的集成系统以解决规模化问题 [2] - 通过智能体图库,企业可使用经批准的智能体(包括谷歌内置和自建,如价格与利润优化智能体),实现跨智能体、工具和数据源的自主编排 [3] - 演示案例显示,一个智能体可分析室内设计趋势、识别仓库滞销库存并协调重新上市活动,将原本耗时数小时的多项行动在几分钟内完成 [4] 人工智能与数据分析应用案例 - 与Google DeepMind合作开发模型,可将二维视频转换为三维空间姿态追踪,用于运动分析(如追踪飞行动力学、旋转速度和抱膝压缩度)[5] - 该技术允许运动员对比新旧录像数据(如空中停留时间),以分析动作成功与失败的关键差异,辅助训练进步 [6] - 在食品行业案例中,智能体通过结合知识图谱与PDF数据,发现跨多个文档的隐藏关联,成功识别出“午夜漩涡”冻酸奶配方中含有大豆过敏原,而传统搜索会遗漏此信息 [12][13] - 知识图谱通过Gemini对供应商手册和配方PDF进行推理,提取实体(如配方成分、过敏原)并映射其间不可见的联系,自动生成数据模式和引用 [14] 硬件基础设施更新:TPU与计算实例 - 发布第八代TPU,首次推出两个专为训练和服务需求定制的平台,其中TPU8是针对训练优化的强大平台 [7] - TPU8通过将块规模乘法直接移至MXU、采用原生INT8量化消除VPU开销,使每个Pod的计算性能比前代提升近3倍,大幅缩短前沿模型的训练时间 [8] - 采用突破性的芯片互连技术,带宽相比Ironwood提升2倍,通过3D Taurus拓扑连接多达9,600个TPU,每个Pod提供121 exaflops的FP4计算能力,性能较Ironwood提升2.8倍 [9] - 推出Google Cloud Axion N48计算实例,采用定制设计的ARM CPU,与同类x86实例相比,性价比提升高达2倍,每瓦性能提升80% [10] 安全与治理解决方案 - 推出安全产品“Whiz”,可自动从代码和云环境中无智能体介入地构建动态资产清单,提供对AI构建环境的全面可见性,并据此构建安全图谱 [14] - 安全图谱是一个动态地图,能解析任何AI应用的架构与逻辑,例如自动识别出暴露于互联网且能访问敏感客户数据的智能体,实现与AI同速的安全防护 [15] - 系统能在几分钟内自动完成:识别新智能体及其架构、自动进行安全审查以发现和验证风险、自动建议修复方案并推送至开发团队的本地工具中 [16] 客户部署与行业合作 - YouTube TV客户支持已上线语音智能体,处理NFL Sunday Ticket和YouTube TV套餐订阅问题,目前100%的用户均由该智能体服务 [17] - 演示显示,该语音智能体能够理解用户查询(如寻找仅包含体育频道的套餐),推荐具体的YouTube TV体育套餐(每月比基础套餐便宜18美元),并通过短信发送链接,还能应要求用西班牙语总结套餐信息 [18][19][20][21] - 谷歌云与埃森哲、波士顿咨询集团、德勤和麦肯锡等合作伙伴共同扩展前向部署工程师网络,这些合作伙伴已宣布大幅扩展其Gemini AI业务 [27] - 公司正通过Gemini企业智能体平台帮助独立软件供应商和SaaS公司转型其解决方案,并助力中小型企业采用Gemini Enterprise及Workspace中的AI功能 [28] 工作空间智能与协作 - 推出Workspace Intelligence,利用Gemini的高级推理能力和先进的嵌入模型,消除Workspace套件中的上下文碎片化问题 [21] - 在Google Chat中,智能体(如区域运营智能体)可主动提醒团队关键业务动态(如新展示套件提前到货),而“询问Gemini”功能可将Chat变为指挥中心,直接呈现紧急任务、相关文件(如需要本地化的演示文稿)和截止日期 [22][23] - Workspace Intelligence能理解会议上下文和文件内容,进行智能检索(如根据描述“包含上季度区域销售图表”找到具体文件),而非简单关键词匹配,从而终结“上下文税”,将碎片化信息转化为清晰路径 [24][25] 生态系统战略与开放性 - 公司强调AI未来必须是开放的,反对将用户锁定在拥有其模型、数据和智能体的“围墙花园”中,而是提供集成技术栈的同时,赋予用户选择全球最佳芯片和模型的自由 [26] - 战略核心包括:让AI能在数据所在的任何地方运行、通过深度治理功能掌控自身命运,并通过广泛的合作伙伴网络进行规模化推广 [27]
Arm发布《芯片新思维:人工智能时代的新根基》行业报告
半导体芯闻· 2025-04-24 18:39
半导体产业变革 - 半导体产业正经历前所未有的变革,摩尔定律渐趋极限,AI爆发式增长对计算架构带来全新机遇与挑战 [1] - 行业转向创新替代方案如定制芯片、计算子系统(CSS)和芯粒(chiplets),以持续提升性能与能效 [2] - AI工作负载需求增加使能效成为首要考量,芯片设计整合优化内存层次结构、先进封装技术和电源管理技术 [2] AI计算底层逻辑 - AI计算底层逻辑发生质变,从超大规模集成电路(VLSI)到移动SoC,再到AI优化定制芯片 [1][5] - 当前芯片技术发展集中在三个方向:高效计算优化、定制芯片广泛采用、CSS和芯粒技术崛起 [5] - 芯片设计从晶体管级优化到系统级封装异构设计,再到生态层级软件协同,重塑AI计算底层逻辑 [5] 定制芯片趋势 - 定制芯片成为满足多样化AI场景需求的重要解法,全球云服务提供商积极投资定制芯片 [5] - 2024年全球云服务器采购支出中定制芯片占近半数份额 [6] - 微软Azure Cobalt和Google Cloud Axion基于Arm Neoverse平台打造,应对数据中心复杂工作负载 [6] Chiplet技术 - Chiplet成为推动定制芯片普及的关键技术,通过模块化设计提升灵活性、良率和复用潜力 [7] - 系统拆分为芯粒并通过3D堆叠集成,带来设计灵活性、功能优化、良率提升和产品复用等机遇 [7] - Arm推动芯粒系统架构(CSA)标准化,确保不同供应商芯粒互操作性 [7] 算力与能效优化 - AI工作负载计算需求极大,能耗主要来自计算和数据传输,需全栈式优化路径 [7][10] - 从晶体管层到架构层、SoC设计、封装及数据中心软件层实现智能负载均衡 [10] - 行业需摆脱依赖算力堆砌的"蛮力式"发展路径,转向更高能效的芯片解决方案 [10] 芯片设计成功要素 - 芯片设计成功依赖IP提供商、晶圆代工厂与系统集成商紧密合作 [12] - 需实现计算、内存与电源传输的系统级优化,以及接口标准化支持模块化设计 [12] - 针对特定工作负载的专用架构和强大安全框架是关键 [12] Arm的行业角色 - Arm以SoC设计能力、标准化生态和开放式合作策略,为行业打造AI计算新根基 [13] - 从移动芯片到数据中心,Arm引领下一代AI计算架构演进 [14]