Nvidia-从GPU到LPU：英伟达大举进攻推理芯片，黄仁勋再落关键一子

行业趋势：AI算力需求从训练转向推理 - AI产业风向转变，从过去几年专注于“训练模型”转向“推理”成为主流，智能体（如Manus、OpenClaw）涌向市场，模型厂商和云服务商开始靠卖token赚钱 [1] - 业界意识到，随着AI能力从基础大模型训练向构建工作流的智能体演进，AI算力需求重心已从训练转向推理，智能体核心场景更侧重于推理 [5][6] - 竞争轴心发生偏移，模型参数比拼进入边际效应递减瓶颈期，大模型训练在狂奔两年后慢下来，2025年开始智能体与上下文工程站上核心位置 [5] 公司战略：英伟达推出LPU并升级生态 - 英伟达在GTC 2026上正式推出新武器Groq 3 LPU（语言处理单元），大举进攻AI推理芯片市场 [1] - 推出LPU是应对AI算力需求从“训练”转向“推理”的战略性布局，旨在补齐短板，用更精细化的产品布局回应市场变化和竞争对手挑战 [3] - 公司进行整个生态层面的升级，不仅推出LPU，还联合OpenClaw创始人等团队推出NeMoClaw参考架构，并推出Vera Rubin DSX AI工厂参考设计，教客户如何设计、建设和运营整个AI工厂基础设施堆栈 [6] 产品与技术：Vera Rubin平台与性能提升 - 英伟达正式推出Vera Rubin平台，共搭载7款芯片，包括Rubin GPU、Vera CPU及新集成的Groq 3 LPU等 [2] - Rubin GPU结合Groq LPU，计划将AI模型token吞吐量从当下每秒100个推向每秒1500个甚至更多，以完美支撑AI智能体交互场景 [2] - 推出专用于容纳新型Groq加速器的完整机架Groq LPX，据称将提升“每个令牌上AI模型每一层”的解码性能，并使平台能够服务于需要推理数万亿参数模型的多智能体系统 [2] 市场与竞争：市场格局变化与对手 - 根据高盛全球投资研究部模型预测，在AI服务器的AI芯片中，非GPGPU芯片（如ASIC）的出货占比将从2024年的36%增长至2027年的45%，而GPGPU芯片占比将从2024年的64%下降至2027年的55% [3] - GPU在基座大模型训练、通用性要求更高的场景（如公有云）和并行计算场景更有竞争力，而ASIC（包括TPU、DPU、NPU、LPU等）在模型部署和推理场景下，因对能效比、响应延迟要求更高而相对更有优势 [3] - 在ASIC市场，英伟达的对手包括国外的Cerebras，以及中国的寒武纪、华为、燧原科技等，英伟达进军推理芯片领域对国内厂商而言既是挑战也是催化剂，可能加速行业洗牌和技术升级 [7] 财务与业务：收入预测与市场进展 - 英伟达CEO黄仁勋在GTC 2026上表示，到2027年底，Blackwell和Rubin两条产品线的年收入将达1万亿美元，比半年前的预测翻了一倍 [1] - 英伟达为应对推理需求所做的计划已带来回报，OpenAI上月表示已与英伟达达成协议，将采购具有“专用推理能力”的芯片 [4] - 英伟达在2025年12月以约200亿美元的价格收购了Groq的核心技术资产，Groq 3 LPU是收购后首个公开成果 [3] 专家观点与未来展望 - 专家认为，英伟达进军推理芯片市场，并不意味着其GPU业务会因此受损，反而会在与LPU的协同中迎来更广阔的市场空间 [7] - 专家指出，短期内GPU凭借强大的场景适应性和生态壁垒主导市场（尤其在AI训练场景），长远看GPU与专用芯片将走向融合与市场分层，硬件上GPU会集成更强的专用核心，专用芯片也会增加可编程性 [7] - 预计市场将形成GPU主导创新与通用平台、专用芯片深耕规模化推理的分层格局 [7]