英伟达:三十年未有之大变局
新财富·2026-01-05 16:33

谷歌TPU的战略布局与商业化进程 - 谷歌正积极接触依赖英伟达芯片的小型云服务商,劝说其在数据中心托管谷歌TPU处理器,并与Fluidstack达成协议在纽约数据中心部署TPU [2] - 谷歌的触角伸向了为OpenAI建造数据中心的Crusoe,以及英伟达的紧密合作伙伴CoreWeave,意图抢夺英伟达客户并切入其核心AI算力供应链 [2] - 谷歌TPU的发展始于2015年,第一代TPU v1在AlphaGo的演进中展现了巨大效率优势:击败樊麾的版本使用了1202个CPU和176个GPU,而击败李世石的版本仅需48个TPU,击败柯洁的版本仅需4个TPU [5][6] - TPU的设计哲学是为神经网络推理任务做极致优化,使用8位整数INT8进行计算,追求极致的性能功耗比 [6] - TPU v2/v3首次支持训练任务,并提出了“TPU Pod”概念,通过高速互联将成千上万个芯片连接成超级计算机 [7] - TPU v4开始通过谷歌云对外提供服务 [8] - TPU v5p在一些基准测试中与英伟达H100相当,而v5e版本侧重高性价比推理 [11] - 最新的TPU v6 (Trillium) 在理论算力上已非常接近英伟达H200,v7 (Ironwood) 首次支持FP8格式,单芯片FP8算力与英伟达B200非常接近,其超级集群总算力也与英伟达Blackwell系统相当 [11] - 谷歌策略清晰,从满足内部需求出发,逐步将TPU打造成可对外销售的云计算核心服务 [12] - 2025年谷歌TPU全年出货量预计为250万颗(v5系列190万颗,v6系列60万颗),2026年预计出货量将高达400万颗(v7 Ironwood超200万颗) [12] - 作为对比,英伟达数据中心GPU在2026年出货量约600万颗,TPU的追赶势头不容小觑 [12] 谷歌TPU的产能扩张与商业模式挑战 - 谷歌TPU的战略正发生根本转变:从自产自用的封闭生态转向直面市场的芯片供应商 [13] - 2023-2026四年间,谷歌TPU总产量预计为800万颗,而仅2027和2028两年,其新规划的总产量就高达1200万颗,扩张速度在半导体行业罕见 [14] - 如此庞大的产能规划远超谷歌自身云服务Google Cloud的预期需求,将TPU推向了与一线AI芯片厂商比肩的层级 [15] - 若谷歌在2027年实现100万颗TPU的对外销售(约占其当年规划产量500万颗的20%),即可创造约260亿美元的新增营收,这相当于谷歌云2024年全年营收的相当大一部分 [15] - 若2027年500万颗、2028年700万颗TPU的预测成真,到2028年谷歌TPU年产量将直逼英伟达GPU的预计出货规模 [15] - 将TPU转化为对外销售的商品意味着谷歌需直面标准化、软件生态、客户支持、市场价格竞争等截然不同的商业规则 [15] - 谷歌的突破口在于提供“AI解决方案”而非“AI通用芯片”,可将TPU与自家AI软件栈(如TensorFlow、JAX)、云服务和预训练模型打包,以降低客户整体拥有成本TCO [16] - 该策略面临严峻挑战:需要构建一个堪比英伟达CUDA的开放繁荣的开发者生态;需说服第三方客户将AI未来押注在谷歌芯片上;必须在性能或成本上提供显著优势以说服客户迁移 [16] - 头部AI公司的动向显示TPU吸引力真实:AI独角兽Anthropic被发现在招聘TPU内核工程师;马斯克的xAI也对采购TPU表现出浓厚兴趣 [16] - 2025下半年,围绕谷歌TPU的开发者活跃度激增了近100% [16] - 前方的核心悬念是商业模式的抉择:谷歌能否成功将其技术优势转化为市场认可的开放生态和客户信任 [17] 英伟达的竞争策略与行业整合 - 面对谷歌的竞争,英伟达并未坐以待毙,其反击策略是开放生态,以退为进 [17] - 英伟达正式发布NVLink Fusion技术,允许数据中心将英伟达GPU与第三方CPU或定制化AI加速器混合使用,实则以GPU为核心构建更包容的“英伟达中心化”生态系统 [17] - 英伟达真正的核心壁垒在于其软件生态CUDA,主流AI框架如TensorFlow和PyTorch都通过调用CUDA的API在GPU上执行计算 [17] - 英伟达以200亿美元现金收购初创公司Groq的核心资产,刷新了其自身历史收购纪录(远超2019年以70亿美元收购Mellanox的规模) [2][19] - 此次收购并非简单的资产收购,而是一项“非独家技术许可协议”,英伟达获得Groq推理技术的授权,同时Groq核心团队整体迁移加入英伟达 [19] - 这种操作模式类似于2024年微软以6.5亿美元挖走Inflection AI的创始人与核心团队,能快速获取顶尖人才和核心技术,并规避传统并购的反垄断审查和整合难题 [19] - Groq团队中汇聚了大量前谷歌TPU工程师,堪称谷歌TPU核心班底的二次创业 [22] - Groq旨在打造超越GPU和TPU的专用AI推理芯片,其解决方案成本可低至同等性能GPU的十分之一,精准击中AI推理阶段的核心痛点,对英伟达在推理市场的统治地位构成直接威胁 [22] - 此次收购是英伟达面对复杂竞争格局的深谋远虑:训练市场英伟达已近乎垄断,但推理市场格局未定,收购Groq是一次昂贵的防御性收购,旨在将最具颠覆性的技术路线收入囊中 [22] - 对于AMD、博通及其他AI芯片初创公司,竞争环境更加恶劣,需在技术、资本和生态上应对英伟达的“GPU+LPU(TPU)”组合拳进攻 [22]