黄仁勋对未来十年的完整判断，今天都讲明白了

文章核心观点 - 英伟达在GTC 2026大会上系统性地阐述了其对未来十年计算模式的完整判断，核心是AI PC、为Agent时代设计的超级计算机Vera Rubin、开源大模型Nemotron以及物理AI Cosmos，旨在将计算能力转化为可盈利的收入，其战略已从GPU公司演进为提供完整AI基础设施的系统公司[4][7][8][44][45][46] 重新定义AI PC - 英伟达与微软合作推出AI PC RTX Spark，旨在重新定义个人电脑，核心是能在本地安全、私密地运行能理解指令、操作软件、完成复杂任务的AI Agent[9][10][13][17] - RTX Spark搭载英伟达与联发科合作的N1X芯片，内含Blackwell RTX GPU（6144个CUDA核心，第五代Tensor Core）和定制的20核Grace CPU，通过NVLink-C2C互联，配128GB统一内存，采用台积电3nm工艺，拥有700亿个晶体管[11] - 微软为RTX Spark进行了深度平台优化，包括工作负载调度、电源热管理、提高GPU可访问内存上限至128GB，并增强了统一内存管理，以支持运行更大的本地AI模型[15][16] - 新的Windows安全原语与英伟达OpenShell运行时确保了Agent在用户完全掌控下安全运行，开源Agent项目（如Hermes Agent、OpenClaw）已集成此安全层，可执行跨应用任务、生成内容、语义搜索本地文件等[17][18] - 现场演示了Agent在RTX Spark上本地运行，完成从读取设计需求、使用Rhino建模、Blender渲染到生成多视角图像的全流程建筑设计，展示了“对话即操作”的新PC交互范式[18][19][20][21] - RTX Spark同时是一台完整的创作和游戏电脑，支持渲染90GB 3D场景、编辑12K视频、运行1200亿参数的大语言模型，以及高帧率AAA游戏，并将支持DLSS 4.5等新RTX能力[22][23] - 英伟达同时宣布了桌面工作站版本DGX Spark，拥有768GB内存、20 petaflops算力，可在本地训练万亿参数模型，主要PC厂商将于今年秋季起推出相关产品[24][26] Vera Rubin和AI工厂 - Vera Rubin是一套五机架规模的AI超级计算机系统，专门为运行复杂的Agent工作负载设计，已全面投入生产[27][28] - 系统包含五种专用机架：负责推理规划的NVL72“大脑”、协调模型的Vera CPU机架、提供超低延迟Token生成的Groq 3 LPU机架、负责存储记忆的BlueField-4 STX机架，以及采用共封装光学技术的Spectrum-X以太网网络机架[30] - Vera Rubin采用台积电3nm制程和CoWoS-L封装，由七颗新芯片组成，单块计算板有万亿级晶体管和超过18000个元件，整个机架含130万个元件，采用全液冷和模块化设计，组装时间从上一代的2小时缩短至5分钟[30][31][34] - 在处理Agent任务时，Vera Rubin的吞吐量相比上一代Grace Blackwell提升了10倍，其供应链规模也是后者的两倍[32][33] - 平台集成了英伟达Spectrum-X以太网光子学，这是全球首个基于共封装光学技术的交换机，将光学模块封装在交换机芯片上，能效提升5倍，AI正常运行时间延长5倍，部署时间缩短三分之一[36][37] - 平台集成了BlueField-4 DPU和DOCA软件平台，提供硬件级机密计算、多租户网络隔离、零信任策略执行和高速加密，为处理专有数据的AI工厂提供全栈安全[40][41] - 英伟达推出DSX平台作为AI工厂的蓝图和运营系统，包含设计验证的DSX Sim、运营管理的DSX OS和提升能效的DSX Max-Q，旨在优化token成本，预计到本十年末将有100GW的AI工厂上线[42][43] 1. 黄仁勋表示，每个千兆瓦级AI工厂的资本投入从200-300亿美元开始，很快将达到每千兆瓦800-1000亿美元，高资本成本和复杂度要求系统必须一次成功，因此需先在Omniverse数字孪生中完成验证[47] 各种大模型 - 英伟达发布开源大模型Nemotron 3 Ultra，专门为Agent工作负载设计，其特点是不仅开源模型，还开源训练脚本和数据[52][53][54] - Nemotron 3 Ultra基于混合架构（状态空间模型SSM与专家混合MoE），速度比同类模型快近5倍，运行成本降低约30%[55][56] - 该模型应用于实际工作流，例如英伟达与Cadence合作构建的“芯片设计AI助手团队”，该团队由多个Agent组成，能自动完成读规格、写/改RTL代码、生成测试、仿真验证、调试Bug的循环，旨在将芯片验证周期从数周压缩到数小时[57][58][59][64] - 英伟达推出物理AI Cosmos 3，这是一个世界模型，旨在解决机器人训练数据稀缺的问题，它能理解视频并生成符合物理规律的新视频数据，从而通过计算模拟来生成训练材料[65][67][72] - 基于Cosmos等技术，英伟达发布了人形机器人参考平台Isaac GR00T，提供包括机器人本体、Jetson Thor计算平台、AI模型、仿真工具Isaac Lab、数据生成工具等在内的完整套件，以加速机器人研发[74][75][76]