文章核心观点 - 英伟达正从芯片提供商向AI基础设施系统提供商深化转型,其核心战略是通过对算力进行多层“封装”,最终将AI服务以“Token”(代币)这一标准化商品形式交付给用户 [2][4] - 公司通过推出分层Token定价体系,将算力服务精细化,以匹配工商业场景中差异化的需求(如准确率、微秒级延迟、稳定吞吐),并抓住了从人机交互到Agent-to-Agent交互带来的指数级算力需求增长 [5][6][7][8] - 为巩固其“帝国”,英伟达不仅强化了在训练侧以CUDA为核心的护城河,更通过整合Groq LPU、发布专用CPU等方式,强势切入并定义推理市场,构建比CUDA更大的、软硬一体化的AI基础设施生态 [9][10][13][14] - 尽管英伟达优势显著,但创业公司及中国芯片公司在边缘计算、中等定制化场景以及可重构计算领域仍存在差异化机会,尤其是在推理市场爆发初期,关键在于能否放弃对训练芯片的路径依赖,基于具体应用场景重新定义产品 [16][17][18] 英伟达的战略转型与“封装”逻辑 - 公司正在AI算力基础设施领域进行高度“封装”,将复杂的芯片、系统、调度软件等底层组件打包,让用户像搭积木一样使用,最终感知到的唯一接口是“Token” [2][6] - “封装”的目的是将复杂技术抽象化,其结果是Token正在变成一种新的大宗商品,黄仁勋明确提出了“Tokens are the new commodity”的观点 [5][6] - 这种封装战略意味着深度绑定,每封装一层,外部替代成本就提高一个量级,使得客户对英伟达的依赖越来越强 [10] Token分层定价体系与算力精细化 - 在GTC 2026上,英伟达推出了五层Token定价体系:免费层、中级层、高级层、高速层和超高速层,对应不同的Token量 [6] - 分层定价的背后是算力需求的精细化趋势,不同工商业场景对算力指标要求完全不同,例如量化交易需要微秒级反应,自动驾驶需要毫秒级以内的反馈 [6][7] - 需求侧正发生根本变化:从人机交互转向Agent-to-Agent交互,机器在工作流中消耗的Token量是人的倍数,这导致了算力需求的指数级增长,今年春节前后国内大模型流量异常暴涨即与此相关 [8] 构建比CUDA更大的帝国:进军推理市场 - 在训练侧,CUDA凭借二十年的生态积累(数亿装机量、数十万开源项目)构筑了深厚护城河 [2][11] - 但在推理侧,CUDA优势不明显,因为推理需要低延时、快响应和灵活的任务调度,而非纯粹的并行计算 [11] - 英伟达将今年定义为“推理年”,通过整合Groq的LPU(基于SRAM,专为低延时、大容量快速存储的推理场景设计)和发布为算力中心优化的专用CPU,强势布局推理硬件市场 [13][14] - 公司首席科学家Bill Dally预判,未来硬件将至少分化为三类:针对训练和预填充的、针对解码的,而解码类硬件内部还会进一步细分 [13] - 英伟达正在成为算力时代的“苹果”,实现芯片、操作系统、硬件和应用的垂直整合,但耦合关系比苹果更复杂 [14] 创业公司与行业的机会窗口 - 英伟达的强项在于面向数据中心的系统级、规模化交付,但在边缘场景和中等定制化场景(如工厂质检、自动驾驶车载芯片、手术机器人感知模块)存在机会,这些场景需求高度定制化和异构 [16] - 可重构计算是解决通用芯片效率低、专用芯片太死板矛盾的关键方向,它允许芯片根据任务动态重构,以专业芯片的效率适应多变的AI任务,这也是中国半导体与国际差距相对较小的方向之一 [16][17] - 对于国内芯片公司,推理市场的爆发是重要机会,但挑战在于必须放弃为上市而跟随英伟达做训练芯片的路径依赖,快速将重点转向推理,并基于中国丰富的应用场景重新建立产品定义和客户关系 [18] - 总体而言,行业领先者的优势(资金、技术、客户绑定)越来越明显,剩余的机会窗口正在收窄 [19]
英伟达正在封装世界