AI 工厂 - 财报，业绩电话会，研报，新闻

AI 工厂

搜索文档

英伟达GTC2026分析总结

2026-03-18 10:31

行业与公司 * 本次会议纪要主要涉及**英伟达**公司及其在**人工智能**领域的芯片、平台、技术路线和产业布局[1][2] * 同时，会议也深入分析了由英伟达技术路线所驱动的**AI基础设施**产业链，包括**光通信**（特别是CPO技术）和**液冷**等关键环节[5][6] 核心观点与论据 1. 人工智能发展趋势：从训练到推理与“AI工厂”概念 * 人工智能正经历从训练阶段向推理阶段的重大转变[2] * **AI工厂**成为核心产业模式，将AI产业划分为架构、芯片、系统、软件模型和应用五个部分[2] * AI工厂以电力、GPU、内存和数据为输入，产出AI模型和推理服务[2] * 未来大型科技公司需具备从算力基础设施到应用软件的全栈能力[2] * 英伟达自身也在积极向上游的应用层、软件层和模型层拓展，尤其在具身智能领域展现布局意图[2] 2. 关键芯片产品发布与技术参数 * **Vera Rubin平台**：计划于2026年下半年量产，样品已交付Adobe、微软和DeepMind等客户[2]；单卡算力突破50 PFLOPS，HBM4带宽达1.2T，标配全液冷和CPU[2] * **LPU芯片**：专注于低延迟推理，首token延迟低于0.1秒，配备230MB SRAM和80T带宽[3]；计划于2026年第三季度出货[1][5] * **Feiman架构芯片**：预计2028年面世，将采用1.6纳米工艺，集成3D堆叠和硅光子互联技术，主要为应对物理AI和世界模型需求设计[2][5] 3. LPU的创新工作模式与应用场景 * 英伟达通过名为**Dynamic**的软件方案，将推理的Decode阶段进一步拆分为注意力机制和Token解码两部分[4] * 高并发、高吞吐的Prefill阶段和注意力机制部分仍在Vera Rubin GPU上运行[4] * 对实时性要求极高的Token解码部分交由LPU处理[4] * 可实现**混合部署**，例如在一个数据中心内配置75%的Vera Rubin GPU和25%的LPU[1][4] * LPU适合实时智能体、实时翻译、云游戏等轻量化、实时性应用场景[3][4]；但处理海量数据的大规模推理任务仍需依赖Vera Rubin系列芯片[4] 4. 其他重要产品与平台布局 * **CPU**：推出专为集群和Agent调度设计的新CPU，性能远超现有产品，旨在满足Agent控制与调度中日益增长的算力需求[5] * **具身智能**：持续推广Omniverse平台，作为机器人训练和数据生成的数字孪生环境[5] * **智能体开发**：推出Nemo Cloud智能体平台，集成主流开源生态和框架，旨在降低创建各类Agent的门槛，推动其在智能家居、制造业、办公和汽车等场景落地[5] 5. 产品路线图与技术演进的影响 * **量产节奏**：Vera Rubin平台2026年下半年量产，LPU 2026年第三季度出货，Rubin Ultra（NVL576）预计2027年出货，Feiman架构定于2028年推出[5] * **机柜设计演进**：Rubin Ultra机柜计算托盘由横向改为垂直布置，以提高密度并降低延迟[5] * **功率密度与液冷**：单机柜功率密度从上一代的120千瓦增至Rubin的270千瓦，未来将达到600千瓦[1][6]；新机架的**液冷渗透率将达到100%**[1][6] * **光互联技术**：Rubin Ultra机柜同时支持铜缆和CPO，机架内短距用铜缆，机架间长距用CPO[5]；首款CPO交换机已进入量产，预计产量将从2026年的1-2万台在2027年逐步爬坡[6]；预计到2028年Feiman架构阶段，CPO将迎来**大规模放量**[1][6] 6. AI基础设施需求前景与产业链启示 * **需求大幅上调**：预计到2027年，全球对GPU等计算设备的总订单需求有望**超过1万亿美元**，较此前Blackwell和Rubin合计5000亿美元的预期大幅上调[1][6] * **效率显著提升**：一个吉瓦（GW）数据中心的Token生成能力在过去两年内从每秒200万跃升至7亿，提升了**350倍**[6] * **光通信产业链**：Scale-up场景扩展将大幅提升GPU与互联带宽的配比，推动铜互联和光互联需求增长[6]；CPO量产进度清晰，尽管大规模放量预计在2028年，但目前相关龙头公司估值已具备吸引力，考虑到2027年的业绩确定性，向上空间较大[6] * **液冷产业链**：英伟达新平台100%的液冷渗透率将直接拉动需求[6]；**ASIC芯片配套液冷供应链**出现新进展，国内厂商已在2026年第一季度获得谷歌等新客户订单，预计在第二、三季度开始加速，第四季度将成为**ASIC配套液冷需求放量的拐点**[1][6]；到2027年，液冷赛道的业绩确定性将显著增强，有望获得更高估值溢价[1][7] 其他重要内容 * Vera Rubin平台配套的HBM4良率爬坡顺利[5] * AI工厂的中心负责模型训练，然后将推理服务部署到各个边缘场景[2]

英伟达（小会）：2026 年目标相对谨慎，2030 年市场达到 3-4 万亿

新浪财经· 2025-09-01 12:49

财务与经营数据 - 毛利率目标为75%以上不受中国市场情况影响[1] - H20产品毛利率约在公司平均毛利率水平附近[1] - 运营支出率预计全年保持在35-40%区间反映收入快速增长[1] - 库存结构偏向Blackwell Ultra 反映对第三季度及以后强劲前景的信心[2] - 当前需求超过供应能力库存水平与生产爬坡及未来需求信心一致[2] 市场规模与增长预期 - 2030年数据中心基础设施年度支出目标3-4万亿美元上调原因包括AI工厂建设支出[2] - AI工厂建设与云服务提供商重叠有限市场驱动力来自企业、国家安全中心、新云及主权云[2] - 每1吉瓦AI工厂建设支出对应约500亿美元AI基础设施总支出[5] - 公司产品可覆盖约350亿美元占总市场的60-70%[5] - 对2026年市场目标持谨慎态度但对2030年实现3-4万亿美元规模充满信心预计复合增长50%[5] 产品与技术 - GB200产能积极爬坡需求极其旺盛性能提升显著 token数量增加50%[5] - H100/H200仍有强劲需求部分客户选择因其更易认证和更快上市时间[5] - Rubin芯片已完成设计和流片能见度延伸至明年计划明年量产出货[1][5] - 训练和推理市场均巨大大量下一代基础模型使用Blackwell甚至Hopper进行训练[5] - NVLink产能爬坡与机架规模系统相关计算和网络组件分开出货[5] - 机架产出将在第三季度加速 NVLink发展势头乐观预计近期和中期存在巨大机会[5] 供应链与产能 - 需求持续超过供应预计明年全年持续供不应求尚不清楚供需平衡时间[3] - 需要更多供应将继续推动供应链产能爬坡数据中心准备就绪情况包括土地和电力因素[5] - 对进展感到满意但鉴于增长需求必须积极与供应链合作[5] 中国市场 - 已获得向中国部分客户出口H20的许可证存在市场需求[4] - 认为地缘政治紧张局势缓和后第三季度可出货20亿至50亿美元产品需求增加还可提升出货量[4] - H20产品无后门需要地缘政治问题消退才能正常发货[1][6] - 关于15%隐含水平尚无成文规定可能影响收入分成或销售成本公司暂按影响销售成本假设[1][6]