黄仁勋对未来十年的完整判断,今天都讲明白了
英伟达英伟达(US:NVDA) 虎嗅APP·2026-06-01 21:57

文章核心观点 - 英伟达在GTC 2026大会上系统性地阐述了其对未来十年计算模式的完整判断,核心是AI PC、为Agent时代设计的超级计算机Vera Rubin、开源大模型Nemotron以及物理AI Cosmos,旨在将计算能力转化为可盈利的收入,其战略已从GPU公司演进为提供完整AI基础设施的系统公司[4][7][8][44][45][46] 重新定义AI PC - 英伟达与微软合作推出AI PC RTX Spark,旨在重新定义个人电脑,核心是能在本地安全、私密地运行能理解指令、操作软件、完成复杂任务的AI Agent[9][10][13][17] - RTX Spark搭载英伟达与联发科合作的N1X芯片,内含Blackwell RTX GPU(6144个CUDA核心,第五代Tensor Core)和定制的20核Grace CPU,通过NVLink-C2C互联,配128GB统一内存,采用台积电3nm工艺,拥有700亿个晶体管[11] - 微软为RTX Spark进行了深度平台优化,包括工作负载调度、电源热管理、提高GPU可访问内存上限至128GB,并增强了统一内存管理,以支持运行更大的本地AI模型[15][16] - 新的Windows安全原语与英伟达OpenShell运行时确保了Agent在用户完全掌控下安全运行,开源Agent项目(如Hermes Agent、OpenClaw)已集成此安全层,可执行跨应用任务、生成内容、语义搜索本地文件等[17][18] - 现场演示了Agent在RTX Spark上本地运行,完成从读取设计需求、使用Rhino建模、Blender渲染到生成多视角图像的全流程建筑设计,展示了“对话即操作”的新PC交互范式[18][19][20][21] - RTX Spark同时是一台完整的创作和游戏电脑,支持渲染90GB 3D场景、编辑12K视频、运行1200亿参数的大语言模型,以及高帧率AAA游戏,并将支持DLSS 4.5等新RTX能力[22][23] - 英伟达同时宣布了桌面工作站版本DGX Spark,拥有768GB内存、20 petaflops算力,可在本地训练万亿参数模型,主要PC厂商将于今年秋季起推出相关产品[24][26] Vera Rubin和AI工厂 - Vera Rubin是一套五机架规模的AI超级计算机系统,专门为运行复杂的Agent工作负载设计,已全面投入生产[27][28] - 系统包含五种专用机架:负责推理规划的NVL72“大脑”、协调模型的Vera CPU机架、提供超低延迟Token生成的Groq 3 LPU机架、负责存储记忆的BlueField-4 STX机架,以及采用共封装光学技术的Spectrum-X以太网网络机架[30] - Vera Rubin采用台积电3nm制程和CoWoS-L封装,由七颗新芯片组成,单块计算板有万亿级晶体管和超过18000个元件,整个机架含130万个元件,采用全液冷和模块化设计,组装时间从上一代的2小时缩短至5分钟[30][31][34] - 在处理Agent任务时,Vera Rubin的吞吐量相比上一代Grace Blackwell提升了10倍,其供应链规模也是后者的两倍[32][33] - 平台集成了英伟达Spectrum-X以太网光子学,这是全球首个基于共封装光学技术的交换机,将光学模块封装在交换机芯片上,能效提升5倍,AI正常运行时间延长5倍,部署时间缩短三分之一[36][37] - 平台集成了BlueField-4 DPU和DOCA软件平台,提供硬件级机密计算、多租户网络隔离、零信任策略执行和高速加密,为处理专有数据的AI工厂提供全栈安全[40][41] - 英伟达推出DSX平台作为AI工厂的蓝图和运营系统,包含设计验证的DSX Sim、运营管理的DSX OS和提升能效的DSX Max-Q,旨在优化token成本,预计到本十年末将有100GW的AI工厂上线[42][43] 1. 黄仁勋表示,每个千兆瓦级AI工厂的资本投入从200-300亿美元开始,很快将达到每千兆瓦800-1000亿美元,高资本成本和复杂度要求系统必须一次成功,因此需先在Omniverse数字孪生中完成验证[47] 各种大模型 - 英伟达发布开源大模型Nemotron 3 Ultra,专门为Agent工作负载设计,其特点是不仅开源模型,还开源训练脚本和数据[52][53][54] - Nemotron 3 Ultra基于混合架构(状态空间模型SSM与专家混合MoE),速度比同类模型快近5倍,运行成本降低约30%[55][56] - 该模型应用于实际工作流,例如英伟达与Cadence合作构建的“芯片设计AI助手团队”,该团队由多个Agent组成,能自动完成读规格、写/改RTL代码、生成测试、仿真验证、调试Bug的循环,旨在将芯片验证周期从数周压缩到数小时[57][58][59][64] - 英伟达推出物理AI Cosmos 3,这是一个世界模型,旨在解决机器人训练数据稀缺的问题,它能理解视频并生成符合物理规律的新视频数据,从而通过计算模拟来生成训练材料[65][67][72] - 基于Cosmos等技术,英伟达发布了人形机器人参考平台Isaac GR00T,提供包括机器人本体、Jetson Thor计算平台、AI模型、仿真工具Isaac Lab、数据生成工具等在内的完整套件,以加速机器人研发[74][75][76]

黄仁勋对未来十年的完整判断,今天都讲明白了 - Reportify