英伟达正式发布Arm PC芯片,黄仁勋台北演讲:计算产业变天了!

文章核心观点 - 智能体AI(Agentic AI)已真正到来并进入实用化阶段,其将重塑计算模式、应用形态和整个计算机产业,算力需求成为唯一的限制 [1] - NVIDIA的角色已从GPU芯片公司演变为AI时代计算基础设施的定义者,其产品战略围绕支持Agentic AI的全栈系统展开 [6][100] 行业根本性变革与新模式 - 过去六个月计算机产业发生根本变化,Agent与前沿模型融合使AI能完成真正有用的工作,未来十年Agentic AI将成为新的应用和计算模式 [3] - 新的计算模式是:模型负责思考,harness负责编排,工具和skills负责执行,runtime负责承载系统,这种模式将在云端、本地、PC、机器人、汽车等各个场景重复 [3] - AI现在是利润和GDP生成器,Token已成为能够直接盈利的收入单元,驱动算力需求暴涨 [7] 生产力提升与市场影响 - Agentic AI对生产力有巨大拉动效应:全球代码提交量从2023年的3亿次,增长至2024年的4亿次、2025年的5亿次,2026年前几个月已接近2025年全年的三倍 [5] - 全球约3000万至4000万名专业软件工程师正接受AI智能体辅助,在Agentic AI加持下,全球约3万亿美元的软件工程师薪酬成本,正在创造出接近3倍的产出,相当于实现价值9万亿美元的生产力提升 [5] - AI不会减少工作岗位,反而促使企业雇用更多软件工程师,因为借助AI能创造巨大生产力 [7] Agentic AI 技术架构 - Agent是一种新的应用形态,由一个或多个大语言模型组成,运行在编排框架(harness)中,由框架调度其完成生产性工作 [7] - Agent会处理短期记忆和长期记忆,记忆管理系统变得非常重要,大语言模型负责思考,harness像操作系统一样连接所有部分 [8] - 现场演示显示,用户只需用自然语言解释意图,AI智能体就能瞬间调用工具生成复杂代码、GIF动图或3D打印工程文件 [9] - 未来计算机运行方式将彻底改变,不再需要复杂点击和键入,而是向AI阐述意图,由AI智能体生成代码或操作工具 [12] 全新硬件系统:Vera Rubin - Vera Rubin不是一颗芯片或GPU,而是一个为运行Agent打造的、端到端解耦、分布式且异构的超大规模系统 [3][20][21] - Vera Rubin是NVIDIA历史上最具雄心的工程之一,有6万亿个晶体管,采用台积电3nm工艺与CoWoS封装,超过4万名工程师参与 [23] - 从Grace Blackwell到Vera Rubin,系统尺度扩大,Vera Rubin被定位为面向Agentic AI的多机架、POD级系统 [23] - Vera Rubin NVL72是无线缆、无软管、无风扇的液冷系统,装配时间从过去约2小时缩短至5分钟,提升了制造吞吐、系统可靠性和韧性 [23] 1. 系统构成包括:Vera Rubin NVLink 72、Groq LPX、Vera CPU Rack、Vera BlueField存储处理系统及Mellanox网络系统,共同构成面向AI Agent的超级计算机 [24] - Vera Rubin已全面量产,微软和戴尔已率先部署工程样机 [27] 面向Agent的CPU:Vera CPU - 过去的CPU是为人类设计的,而未来的CPU要为没有耐心、需要低延迟、高带宽、高能效的Agent设计 [3][39] - NVIDIA提出新比喻:CPU是指挥家,GPU是管弦乐队,并为此打造了专为智能体定制的Vera CPU [39] - Vera CPU彻底抛弃传统设计惯例,关注低延迟、单线程性能、每核心带宽、总体带宽和能效 [41] - Vera CPU使用NVIDIA Olympus Core,通过第二代可扩展一致性互连fabric连接88个核心,核心间通信速度比传统CPU更快,支持PCIe Gen 6,内存带宽达每秒1.2TB,内部fabric带宽达每秒3.6TB [43] - 性能表现:相比x86 CPU,峰值内存延迟降低40%,核心到核心通信快50%,Agentic Sandbox性能达x86 CPU的1.8倍,SQL数据库运行速度提升3倍,处理纽约证券交易所金融遥测数据时吞吐量达传统架构的6倍 [45][47][48] - Vera CPU正在打开为Agent构建CPU的全新市场,未来Agent数量将远超人类,该市场规模将比上一个更大 [52][53] - 随着数以百万计的Vera芯片铺向全球,NVIDIA已演变成全球最大的CPU制造商之一 [53] AI工厂与基础设施平台DSX - 世界正在竞相建设AI工厂,这是人类历史上最大规模的基础设施建设,吉瓦级AI工厂建造成本已从200亿300亿美元暴涨至800亿1000亿美元 [29] - NVIDIA推出基础设施级蓝图DSX,用于帮助客户设计、仿真、建设和运营AI工厂,通过Omniverse和DSX可在动工前完成布局、电力、冷却等验证 [29] - 在AI工厂中,Token就是收入,算力就是利润,关键指标是“每瓦特产生的代币数量”和“每瓦特带来的营收” [34] - NVIDIA凭借全栈集成与协同设计,帮助客户缩短“首次推理时间”与“首字延迟”,并帮助众多区域型、全球型AI云服务商实现增长,例如估值达500~700亿美元的CoreWeave [36][37] 软件生态与开发工具 - Agentic AI时代是成为软件公司的绝佳时代,NVIDIA的CUDA-X函数库可直接交付给AI智能体调用,效率甚至比人类高 [14] - NVIDIA推出面向企业AI的Agent Toolkit,包括开放模型、可运行Agent的harness、CUDA-X工具库及OpenShell runtime [57] - 每家公司未来都会运行Agent并成为Agent公司,需要一整套安全、可控、可扩展的Agentic AI技术栈 [59] - 与EDA巨头Cadence联合打造的芯片设计超级智能体,可将需要数周的芯片验证与Debug流程缩短至数小时,验证效率暴增40倍 [60][62] 开源模型Nemotron 3 Ultra - 现场首发Nemotron 3 Ultra开源大模型,是全球首款采用SSM与MoE混合架构的前沿大模型 [63] - 该模型运行速度比同级别前沿开源模型快5倍,总体推理成本便宜30%,并向全球开发者开放全部训练脚本及长周期工具调用数据集 [63] - NVIDIA的开放模型策略是让企业可以拿走模型,加入自己的数据和知识,将其变成自己的专有Agent [68] 重塑PC:RTX Spark与全新产品线 - Microsoft和NVIDIA正在重新发明PC,旨在彻底颠覆Windows 40年软件形态 [71][84] - 推出NVIDIA RTX Spark PC生态芯片,由NVIDIA与MediaTek合作打造,拥有RTX GPU、1 PFLOP AI性能、20核NVIDIA Grace CPU、128GB统一内存,采用台积电3纳米制程,共700亿晶体管 [74] - 该芯片让PC首次具备全天候在本地运行“主权智能体沙盒”的能力,现场演示了本地智能体驱动设计工具自动完成工作并修正错误 [77][78] - Adobe针对RTX Spark重新设计Photoshop和Premiere核心架构,速度提升2倍,并通过MCP Server让应用可与笔记本上的Agent交互 [80] - 除笔记本电脑外,还联合微星等推出桌面级Desktop及面向开发者的DGX Station for Windows工作站,后者具备768GB统一内存、20 Petaflops算力和高达8 TB/s的内存带宽 [83] - Microsoft和NVIDIA正在推出一整条100%兼容Windows、CUDA和NVIDIA AI Tensor Core的新PC产品线,覆盖桌面电脑、笔记本电脑和工作站 [84] 物理AI与具身智能 - Agentic AI正从数字世界走向物理世界,本质上是一种数字机器人,未来将有数百亿甚至数千亿个Agentic System运行在世界各地 [85] - Physical AI的核心难题是如何获取、生成和转换物理世界数据,NVIDIA的路径是从人类遥操作示范开始,再进入Omniverse仿真,最终获得能从任意视角理解物理世界的World Foundation Model [88] - 发布Cosmos 3,定位为Physical AI的前沿开放模型,基于Mixture of Transformers架构,能处理像素、动作、声音和语言 [88] - 作为Cosmos 3技术的延伸,发布全球首款具备原生“推理/长考能力”的第二代自动驾驶大模型Alpamayo 2 [92] - 基于NVIDIA Hyperion算力平台与Kalos车载操作系统构建汽车的车企,已占全球汽车总产量的80%;全球97%的智能移动出行服务商已完成与英伟达端到端智能车生态的深度锚定 [94] - 发布专为人形机器人打造的通用基座大模型与全栈参考平台NVIDIA Isaac GR00T,覆盖模型、数据生成、仿真、runtime和操作系统 [96] - Isaac GR00T参考机器人平台面向高校和研究机构,机器人双手每只手有25个自由度,整机有31个自由度,身高约6英尺,体重约150磅,运行Thor计算平台 [98]

英伟达正式发布Arm PC芯片,黄仁勋台北演讲:计算产业变天了! - Reportify