AI 五层蛋糕理论
搜索文档
英伟达不想只卖 GPU
36氪· 2026-03-19 07:49
公司战略定位 - 公司重新定义自身为一家垂直整合、横向开放的计算公司,这与外界对其作为专注GPU芯片公司的固有印象截然不同 [1][2] - 公司战略从专注于高性能GPU和CUDA生态,转向在硬件上进行垂直整合,在软件上走向合作开放 [2] - 公司CEO提出“AI五层蛋糕”理论,认为AI产业从下到上依次为能源、芯片、数据中心、模型、应用,公司正在每一层进行押注,以推动整个AI产业链流动并做大市场 [14][16] 新一代硬件平台:Vera Rubin - 下一代计算平台Vera Rubin从单颗芯片进化为由7款定制芯片和5种不同机架组成的芯片系统 [3] - 通过NVLink 6网络,将72颗Rubin GPU和36颗Vera CPU在微秒级延迟下连接成一个超级芯片 [3] - 其中Vera CPU集成了256颗液冷处理器,计算效率是传统CPU的两倍,并首次作为独立CPU产品向市场出售 [3] - 与上一代Blackwell芯片整合后,Vera Rubin平台单卡推理能力最高提升5倍,大模型生成Token成本降低90% [3] - 阿里巴巴、字节跳动和Cloudflare等云服务商已宣布将部署,预计今年下半年向首批客户交付 [3] 关键硬件收购与整合:Groq 3 LPU - 公司斥资200亿美元收购初创公司Groq,获取其低延迟推理核心技术 [4] - 在Vera Rubin平台中整合了Groq 3 LPU(语言处理单元),用于AI推理任务加速 [4] - Groq 3 LPU将数据留在芯片内处理,无需外置高宽带内存,因此在问答和内容生成时延迟更低、更稳定,弥补了公司原有架构在推理速度上的不足 [4] - 公司通过专门的“Groq 3 LPX推理托盘”,将低延迟技术变为可拔插模块,既弥补短板也消除了潜在竞争风险 [4] 消费级SoC产品:N1X芯片 - 公司与联发科共同研发基于Arm架构的N1X SoC,主要面向高端AI PC和笔记本电脑市场 [5] - N1X效仿苹果M系列芯片,将CPU、GPU和AI加速单元集成在同一物理内存池上,以优化延迟和能耗 [6] - 此举是公司继移动端“丹佛计划”和数据中心Grace CPU后,再次冲击消费级SoC市场,意图在个人PC处理器市场分一杯羹 [6] 软件生态战略:开放与合作 - 公司与开源项目OpenClaw合作,推出面向企业市场的开源AI智能体平台NemoClaw,帮助企业部署、运行和管理AI Agent [9] - NemoClaw不限制硬件,可运行在英伟达、Intel和AMD的芯片上,标志着公司主动解绑了其核心软件生态与自家硬件的绑定 [10] - 公司判断,企业级应用的核心基础是处理结构化数据(如SQL、Spark),因此致力于让企业在处理数据和构建Agent工作流时习惯调用NemoClaw的API和微服务 [13] - 公司近期发布了自身的大语言模型Nemotron 3,以完善软件生态闭环 [13] - 公司CEO认为,用谁的软件比软件在谁家芯片上运行更重要,开源NemoClaw旨在降低企业使用门槛,做大整个AI市场需求,从而带动对高端算力的需求 [14] 市场前景与竞争格局 - 公司CEO预计,到2027年,以Blackwell和下一代Vera Rubin为主的AI加速芯片累积营收将达到一万亿美元 [2] - 云厂商自研芯片(如微软Maia、谷歌TPU)已获得市场近40%的份额 [12] - 公司通过垂直整合硬件(CPU、GPU、交换机、网络协议、低延迟模块)和开放软件生态,显著提升了竞争者的替代门槛 [7] - 公司在AI基础设施硬件上采取全面覆盖策略,意图赚取产业链上的每一块利润 [8]