NVIDIA (NasdaqGS:NVDA) 2026 Conference Transcript
英伟达英伟达(US:NVDA)2026-06-01 12:02

NVIDIA 2026年GTC台湾主题演讲纪要分析 一、 涉及的行业与公司 核心公司:NVIDIA (NVDA) * 公司定位已从GPU公司演变为系统公司,并进一步转型为AI基础设施公司[17][18][26][107] * 正在成为全球最大的网络公司之一[42] 生态系统与合作伙伴: * 供应链与制造:台湾拥有全球最丰富、最优秀的供应链生态系统,是NVIDIA生态系统的重要上游[1][2][37] * AI云服务商:CoreWeave (估值500-700亿美元)、Nebius、Nscale、NAVER Cloud、Yotta、Together AI Singapore、Indosat、GMI (台湾)等[24][25] * 企业软件与工具合作伙伴:Cadence (芯片设计)、CrowdStrike、Dassault、Palantir、SAP、ServiceNow、Adobe、Microsoft、Red Hat、Canonical等[61][69][82] * PC OEM/ODM合作伙伴:全球几乎整个PC产业,包括MSI等[57][83][88] * 半导体制造与元件:TSMC (3纳米制程、CoWoS封装)、Micron、SK hynix、Samsung (HBM4内存)、MediaTek (CPU合作)[34][75] * 系统集成与制造:Foxconn、Quanta、Dell等[36] 相关行业: * 人工智能 (AI):特别是代理式AI (Agentic AI)物理AI (Physical AI) * 计算基础设施:AI工厂、数据中心、云计算 * 半导体与硬件:GPU、CPU、DPU、网络芯片、存储系统 * 软件与开发生态:CUDA、AI模型、代理工具包 * 个人计算 (PC):正在经历40年来的重新发明 * 机器人技术与自动驾驶:人形机器人、自动驾驶汽车 * 电信:未来的基站将具备代理能力[89] 二、 核心观点与论据 1. AI范式转变:有用AI与代理式AI时代已到来 * 核心观点:AI已从生成式AI进入代理式AI (Agentic AI) 时代,AI现在可以完成有用工作,成为利润和GDP的创造者[3][5][32] * 关键证据: * GitHub提交量激增:2023年3亿次提交,2024年4亿次,2025年5亿次,而2026年头几个月几乎增长了两倍[3] * 生产力飞跃:全球3000-4000万软件开发者,创造约3万亿美元GDP(薪资)。AI使其产出提升近3倍,相当于用3万亿美元薪资产生9万亿美元的生产力[3] * AI创造就业:AI不仅未减少工作岗位,反而因生产力提升导致更多软件工程师被雇佣[3][4] * 计算即收入:AI公司现在将计算 (Compute) 视为收入和利润,计算需求成为约束条件[5][26][29][32] 2. 新的计算模式:代理 (Agent) 作为基本单元 * 核心观点:计算的基本单元从“应用程序”转变为“代理”,这是一种全新的、解耦且分布式的计算模型[5][6][11][16] * 代理的构成: * 模型:大型语言模型负责思考、推理、规划。 * 工具:代理可使用的软件工具(如电子表格、浏览器、数据库)。 * 技能:工具的使用方法。 * 运行时:运行代理的环境。 * 安全线束:管理安全性。 * 内存系统:处理短期工作记忆和长期记忆。[6][7][11][15] * 影响:这种模式要求革命性的存储系统完全不同的硬件架构[15][16] 3. 产品发布:Vera Rubin——为代理时代打造的全栈系统 * 核心观点Vera Rubin不是单一的GPU芯片,而是首个为处理代理式AI设计的多机架、Pod级超级计算机系统,现已全面投产[16][33][38][107] * 关键特性: * 规模与复杂性:公司史上最雄心勃勃的项目,40,000名工程师参与[17] * 全栈集成:包含GPU (Vera Rubin NVL72)、CPU、DPU (BlueField-4)、网络 (Spectrum-X)、存储系统,实现极端协同设计[16][28][34][37] * 生产效率:组装一个Grace Blackwell机架过去需要2小时,现在仅需5分钟[32] * 供应链规模:Vera Rubin的供应链是Grace Blackwell的两倍[32] * 无电缆设计:提高可靠性和弹性,简化组装[40] * 性能宣称:NVIDIA的令牌成本全球最低,优势不是10%,而是数量级 (orders of magnitude) 的领先[40] 4. 产品发布:Vera CPU——为代理而非人类设计的CPU * 核心观点:传统CPU为人类(用户/租户)设计,而Vera CPU是为AI代理时代从头构建的全新CPU架构,满足代理对低延迟和高带宽的苛刻需求[42][43][45][46] * 设计原理: * 代理缺乏耐心:生活在纳秒世界,等待成本高[43][48] * CPU是瓶颈:在代理循环中,CPU可能成为GPU利用率的瓶颈,直接影响令牌吞吐量、延迟和用户体验[50] * 四大关键特性与优势: 1. 单线程性能 (IPC):每时钟周期获取、解码和执行10条指令,世界领先[46][49] 2. 每核带宽:世界级水平[46] 3. 总带宽:芯片内和芯片外总带宽世界级。采用LPDDR5X内存,带宽达1.2TB/s,是外部最高性能CPU的2-3倍。采用PCIe Gen 6。核心间通过网状结构连接,速度达3.6TB/s,无小芯片税[47][48][51] 4. 能效:高能效以在工厂中部署更多CPU,同时不占用令牌生成(收入来源)的电力[49] * 性能宣称: * SQL处理速度快3倍[54] * 实时流处理 (纽约证券交易所) 快6倍[55] * 代理沙箱性能是x86 CPU的1.8倍[51] * 峰值内存延迟比x86低40%[51] * 市场前景:这是一个全新的市场(代理CPU),市场规模将超过传统CPU市场,因为代理数量将远超人类数量[48][57][58][107] 5. 战略转型:从GPU公司到AI基础设施与生态系统赋能者 * 核心观点:NVIDIA致力于帮助客户构建AI工厂,这是人类历史上最大的基础设施建设项目,公司已成为AI基础设施公司[18][19][26][107] * AI工厂蓝图 (DSX): * DSX Sim:基于Omniverse的数字孪生,在物理建设前设计、验证AI工厂[19] * DSX OS:供应、操作、监控和修复基础设施[19] * 效率提升: * 当前AI工厂过度配置电力高达40%,DSX MaxLPS可在相同电力预算内安全部署更多GPU,增加数十亿美元年收入[20] * 45摄氏度突破性热液冷却,使用更少水和能源[20] * 动态电力分配、机架内电力平滑[20] * AI工厂可作为灵活的能源资产与电网协同运作[21] * 赋能区域AI云:通过全栈能力(硬件、软件、库),使CoreWeave等小型公司能够成为世界级的AI云提供商[24][25] * 客户选择NVIDIA的核心原因: 1. 快速上线:首次推理/训练时间更短[27] 2. 每瓦吞吐量 (令牌/瓦):世界领先,因为全栈集成和极端协同设计[28][29] 3. 可靠性:大规模运营经验丰富,平均中断间隔时间有保障[30] 4. 系统寿命与灵活性:丰富的CUDA生态系统确保软件持续优化,系统使用寿命更长,总体拥有成本 (TCO) 更低[30][31] 6. 软件与开发生态:NVIDIA代理工具包与企业AI * 核心观点:为企业提供构建和运行代理所需的全套工具包,这是现代企业的操作系统[58][59][106] * 工具包四大组件: 1. 模型:大型语言模型,如NVIDIA的开放模型。 2. 线束:协调代理的组件,如OpenShell(开源、安全的企业级沙箱)[60] 3. 工具与技能:如CUDA-X库,现可作为代理的工具[10][14] 4. 运行时:将一切整合在一起的操作系统。[59] * 开放模型战略: * Nemotron 3 Ultra:新发布的开放模型,采用SSM与MoE混合架构。 * 速度快5倍[68] * 运行成本低30% (总FLOPS和推理时间)[69] * 提供模型、训练脚本和数据[67][68] * Cosmos 3物理AI的前沿开放基础模型,用于机器人等物理世界理解与交互[91][93][94] * Llama Mio 2:用于自动驾驶汽车的开放模型[97] 7. 重新发明个人计算:RTX Spark与40年来的PC革命 * 核心观点:与微软合作,40年来首次彻底重新发明PC,以迎接代理时代[71][75][83][108] * RTX Spark: * 芯片:Blackwell RTX GPU (6144 CUDA核心,1 Petaflop AI性能) + 定制20核Grace CPU (与MediaTek合作),通过NVLink融合。700亿晶体管,TSMC 3纳米工艺[75][77] * 内存:128GB统一内存[75] * 兼容性100% Windows兼容,100% CUDA兼容,可运行所有现有应用和代理[78][83] * 新PC产品线:涵盖笔记本电脑、台式机、工作站,是一个全新的产品家族,拥有未来路线图[83][87][88] * 未来愿景:PC将演变为家庭AI超级计算机,持续运行个人代理助手,就像家庭影院一样普及[84][86][87] 8. 扩展前沿:物理AI、机器人技术与自动驾驶 * 核心观点:代理式AI模式将复制到所有设备,包括机器人、自动驾驶汽车、卫星、基站等[88][89][108] * 机器人技术: * Isaac GR00T:人形机器人开放开发平台,包含模型、仿真库、数据生成器[101][103] * GR00T参考设计机器人:发布完整参考设计人形机器人(31自由度,6英尺高,150磅),供大学和研究机构使用[102][103] * 自动驾驶: * Hyperion平台:与约占全球汽车产量80% 的制造商合作[97] * 移动服务连接:与全球约97% 的移动服务连接[97] * Llama Mio:具备推理能力的自动驾驶模型[101] 三、 其他重要信息 * 台湾经济影响:有人告知,台湾年度GDP预计将增长近10%,部分归因于AI相关业务增长[2] * AI工厂成本1吉瓦 (GW) 级别的AI工厂,成本从200-300亿美元起步,现已达500-600亿美元,很快将达800-1000亿美元[22] * 市场规模预测100吉瓦的AI工厂将在本十年末前上线[21] * Grace Blackwell的成功:已成为行业标准,软件和安全性态均已针对其优化,为Vera的采用铺平道路[53][54] * Vera CPU的订单势头:订单情况将使其成为公司历史上最快、最成功的产品发布[108] * 对软件公司的积极影响:代理将使用比以往更多的工具,因此是成为软件公司的绝佳时机,而非颠覆[9][10][69] * 数据挑战:物理AI的最大问题是数据,因为大多数世界视频数据是第三人称而非第一人称视角[90] * 计算即数据:对于物理AI,计算本身可以生成数据,Cosmos模型就是例证[93][95]

Nvidia-NVIDIA (NasdaqGS:NVDA) 2026 Conference Transcript - Reportify