核心观点 - 文章通过对比英伟达GTC 2026与谷歌Google Cloud Next 2026大会,揭示了两家公司在AI算力领域竞争的本质差异:英伟达是提供通用生产资料的“卖铲子”者,而谷歌是构建并输出完整运行体系的“造工厂”者[1][2][4] - 谷歌通过将TPU芯片专用于训练与推理、凭借自身巨大内部需求优化成本、以及获取Anthropic等头部客户,正在开辟一条不同于英伟达CUDA生态的竞争路径,动摇了英伟达的垄断地位[12][16][25] - 竞争焦点从“有无算力”转向“如何使用算力”,AI入口从模型变为系统,谷歌凭借其基础设施能力,正将AI竞争拉入其擅长的维度[23][24][26] 行业格局与竞争态势 - 英伟达在全球AI加速器市场占据约80%的份额,其数据中心业务在2025财年收入超过1150亿美元,同比增长超过200%,毛利率在75%以上[7][8] - 谷歌云业务年收入已接近600亿美元,过去一年增长接近50%,AI相关需求是核心驱动力[9] - 行业正从“训练模型”的上半场,进入“管理智能体”的下半场,最终可能走向“控制系统”[26] 英伟达的战略与定位 - 英伟达定位为AI算力生产资料提供商,其GPU和CUDA生态是AI时代的算力底层标准件,CUDA生态汇聚超600万全球开发者、900余个加速库[6] - 公司判断到2027年,数据中心(Token工厂)市场需求规模至少1万亿美元,其中60%来自全球前五大云厂商,40%分散于其他场景[1][22] - 其商业逻辑是将设备(铲子)卖给所有人,并围绕供给侧(Token生产)构建体系,甚至设计了Token的定价体系[10][20] 谷歌的战略与定位 - 谷歌提供从自研TPU芯片、训练Gemini模型到云服务的一整套AI运行体系,模式类似于自建工厂并对外输出产能[9][10] - 公司策略是通过自身作为全球最大Token消费者的规模优势(每分钟处理160亿个token,上季度为100亿/分钟)来驱动成本优化,并将优化后的TPU算力通过云平台对外销售[1][19][21] - 谷歌正将竞争维度从提供算力芯片,转向提供能管理大量智能体(Agent)的系统解决方案[23] 技术路径与产品演进 - 谷歌第八代TPU实现重大战略转向:首次将训练与推理任务拆分为两颗独立专用芯片(TPU 8t和TPU 8i),以应对Agent时代不同的负载特征[12][13] - TPU 8t(训练芯片)采用台积电2nm工艺,单个超级Pod峰值算力达121 EFLOPS(FP4精度),是上一代的2.8倍[13] - TPU 8i(推理芯片)性价比比上代提升80%,集合操作延迟降低最高5倍[13] - 英伟达持续优化单颗芯片性能,而谷歌更关注集群效率与整体成本[14] 市场需求与成本经济 - Token处理量激增:谷歌每分钟处理的token从100亿个跃升至160亿个,单季度增长超过60%,据此估算其日处理量已达万亿级[1][19] - 推理成本成为关键:当token消耗规模巨大时,推理端效率直接决定成本结构[14] - 谷歌TPU凭借成本优势挑战英伟达:其Ironwood TPU相比英伟达B200在总拥有成本(TCO)上具有约30%~41%的优势[17] - 当推理成本被压到对手的一半以下,经济驱动开始改变客户选择,软件生态壁垒可能被削弱[17][18] 客户动态与生态竞争 - Anthropic与谷歌签署多年期协议,最多使用100万颗Ironwood TPU,价值数百亿美元,这是AI历史上最大的单笔算力交易[15][16] - Meta正考虑从2027年起部署谷歌TPU,此消息曾导致英伟达股价大跌[16] - 苹果新一代Siri将基于谷歌Gemini构建,合作每年价值约10亿美元[23] - 谷歌云已获得包括GE(运行超800个智能体)、毕马威(首月部署超100个智能体)、默克(10亿美元合同)等企业客户,展示其系统级解决方案的吸引力[23]
谷歌讲了一个英伟达不擅长的故事