Nvidia-谷歌讲了一个英伟达不擅长的故事

核心观点 - 文章通过对比英伟达GTC 2026与谷歌Google Cloud Next 2026大会，揭示了两家公司在AI算力领域竞争的本质差异：英伟达是提供通用生产资料的“卖铲子”者，而谷歌是构建并输出完整运行体系的“造工厂”者[1][2][4] - 谷歌通过将TPU芯片专用于训练与推理、凭借自身巨大内部需求优化成本、以及获取Anthropic等头部客户，正在开辟一条不同于英伟达CUDA生态的竞争路径，动摇了英伟达的垄断地位[12][16][25] - 竞争焦点从“有无算力”转向“如何使用算力”，AI入口从模型变为系统，谷歌凭借其基础设施能力，正将AI竞争拉入其擅长的维度[23][24][26] 行业格局与竞争态势 - 英伟达在全球AI加速器市场占据约80%的份额，其数据中心业务在2025财年收入超过1150亿美元，同比增长超过200%，毛利率在75%以上[7][8] - 谷歌云业务年收入已接近600亿美元，过去一年增长接近50%，AI相关需求是核心驱动力[9] - 行业正从“训练模型”的上半场，进入“管理智能体”的下半场，最终可能走向“控制系统”[26] 英伟达的战略与定位 - 英伟达定位为AI算力生产资料提供商，其GPU和CUDA生态是AI时代的算力底层标准件，CUDA生态汇聚超600万全球开发者、900余个加速库[6] - 公司判断到2027年，数据中心（Token工厂）市场需求规模至少1万亿美元，其中60%来自全球前五大云厂商，40%分散于其他场景[1][22] - 其商业逻辑是将设备（铲子）卖给所有人，并围绕供给侧（Token生产）构建体系，甚至设计了Token的定价体系[10][20] 谷歌的战略与定位 - 谷歌提供从自研TPU芯片、训练Gemini模型到云服务的一整套AI运行体系，模式类似于自建工厂并对外输出产能[9][10] - 公司策略是通过自身作为全球最大Token消费者的规模优势（每分钟处理160亿个token，上季度为100亿/分钟）来驱动成本优化，并将优化后的TPU算力通过云平台对外销售[1][19][21] - 谷歌正将竞争维度从提供算力芯片，转向提供能管理大量智能体（Agent）的系统解决方案[23] 技术路径与产品演进 - 谷歌第八代TPU实现重大战略转向：首次将训练与推理任务拆分为两颗独立专用芯片（TPU 8t和TPU 8i），以应对Agent时代不同的负载特征[12][13] - TPU 8t（训练芯片）采用台积电2nm工艺，单个超级Pod峰值算力达121 EFLOPS（FP4精度），是上一代的2.8倍[13] - TPU 8i（推理芯片）性价比比上代提升80%，集合操作延迟降低最高5倍[13] - 英伟达持续优化单颗芯片性能，而谷歌更关注集群效率与整体成本[14] 市场需求与成本经济 - Token处理量激增：谷歌每分钟处理的token从100亿个跃升至160亿个，单季度增长超过60%，据此估算其日处理量已达万亿级[1][19] - 推理成本成为关键：当token消耗规模巨大时，推理端效率直接决定成本结构[14] - 谷歌TPU凭借成本优势挑战英伟达：其Ironwood TPU相比英伟达B200在总拥有成本（TCO）上具有约30%～41%的优势[17] - 当推理成本被压到对手的一半以下，经济驱动开始改变客户选择，软件生态壁垒可能被削弱[17][18] 客户动态与生态竞争 - Anthropic与谷歌签署多年期协议，最多使用100万颗Ironwood TPU，价值数百亿美元，这是AI历史上最大的单笔算力交易[15][16] - Meta正考虑从2027年起部署谷歌TPU，此消息曾导致英伟达股价大跌[16] - 苹果新一代Siri将基于谷歌Gemini构建，合作每年价值约10亿美元[23] - 谷歌云已获得包括GE（运行超800个智能体）、毕马威（首月部署超100个智能体）、默克（10亿美元合同）等企业客户，展示其系统级解决方案的吸引力[23]