Workflow
AI工厂
icon
搜索文档
COMPUTEX上的黄仁勋:Vera Rubin,下一代AI PC,Nemotron 3与Cosmos 3
硬AI· 2026-06-01 18:29
公司新产品与架构发布 - 英伟达创始人兼CEO黄仁勋在GTC台北2026主题演讲中发布了Vera Rubin架构、面向AI智能体的CPU Vera、AI模型Nemotron 3 Ultra以及AI工厂平台DSX等多项新产品与新平台[2] - Vera Rubin架构已全面进入量产阶段,OpenAI、Anthropic和SpaceX成为其首批客户[7][8] - 公司推出面向AI智能体的CPU Vera,并强调其BlueField-4 STX带来具备芯片级安全的代理型AI存储处理能力[10][11] - 公司宣布推出全新AI模型Nemotron 3 Ultra,该模型基于5500亿参数,在多项基准测试中表现优异,例如Agent Productivity为91%,Long-Horizon Planning为33%,Coding为54%,Instruction Following为82%[21][22] - 公司推出NVIDIA DSX平台,为基础设施构建者提供创建AI工厂的完整行动指南,可在不花一分钱的情况下对整个工厂进行模拟和验证性能[23] 下一代AI PC战略 - 英伟达公布面向WINDOWS系统个人电脑的新款处理器,挑战英特尔,剑指下一代AI PC入口[1][14] - 英伟达将与联发科合作开发RTX SPARK个人电脑芯片,并由台积电生产,该芯片将于今年秋季面市,适用于笔记本和台式机[15] - 公司意图将CPU、GPU与AI单元整合为单颗SoC,直接向戴尔、联想等整机厂商输出完整的核心计算平台,目标为整个Windows阵营[18] - 公司宣布与微软合作,彻底重塑PC的运行方式,推出全新的PC产品线,包括三款革命性的Windows设备,覆盖台式机、笔记本和工作站,且100%兼容Windows系统并支持CUDA和AI张量核心[79][82][83] 自动驾驶与机器人生态 - 英伟达在发布会透露,包括比亚迪、吉利、极氪、小米以及小马智行等在内的中国主流车企和自动驾驶公司,均已采用或正在基于NVIDIA Hyperion平台开发智驾[3][25] - 英伟达DRIVE Hyperion成为全球自动驾驶出租车平台,并推出用于自动驾驶出租车的Alpamayo 2超级开放推理模型[24][26] - 公司计划与宇树科技等全球人形机器人制造商合作开发机器人[6][19][20] - 公司推出面向学术研究的NVIDIA Isaac GR00T人形机器人参考平台及大型开源智能体工具与技能套件,选择宇树科技的H2 Plus作为参考机型[28][29] - 公司宣布推出NVIDIA Isaac Groot,一款全集成的人形机器人参考设计,拥有31个自由度,搭载全新的Thor芯片和完整的软件栈[91] 智能体AI与计算模式变革 - 黄仁勋表示,下一波AI是智能体AI,实用型AI已经到来,AI如今是利润和GDP生成器[32][35] - 智能体AI的计算模式由大型语言模型组成的智能代理运行在一个协调框架内,能够观察、推理、规划和使用工具[35][36] - 公司认为智能体将使用大量工具,CUDA X库作为智能体的工具将迎来黄金时期[37][38] - 智能体系统是解耦、分布式、异构的计算模型,公司开发的下一代Vera Rubin系统正是为此设计[40][41] - 为智能体设计的CPU Vera与为人类设计的传统CPU有根本区别,其需求包括极低延迟、高单线程性能、高带宽和高能效[61][62][64] AI工厂与基础设施战略 - 全球正竞相建设AI工厂,这是人类历史上规模最大的基础设施建设浪潮,AI工厂极为复杂,需端到端协同设计[43] - NVIDIA DSX是构建和运营AI工厂的蓝图与参考设计,DSX SIM可在服务器机架落地前设计并验证AI工厂,DSX OS负责基础设施的配置、运行、监控与修复[44] - 当前AI工厂的电源超额配置比例高达40%,而DSX Max LPS可让运营商在相同功率预算内安全部署更多GPU,带来数十亿美元的年营收增量[44] - 公司正从GPU公司转型为系统公司,并进一步成为AI基础设施公司,帮助客户打造AI工厂,其复杂性和资本成本极高[42][46][49] - AI工厂的核心经济指标是token(代币),算力即营收,每瓦性能即营收,公司系统的每瓦吞吐量处于世界顶尖水平[50][51] 市场影响与合作伙伴 - 英伟达美股夜盘股价上涨2.7%[4] - 公司生态系统庞大,在台湾拥有150家供应链合作伙伴,数百万平方英尺的工厂空间,Vera Rubin供应链规模是Grace Blackwell的两倍[31][53][57] - 公司合作伙伴包括CoreWeave(估值达500亿至700亿美元)、Nebius、n scale等AI云平台,服务于各行业客户[47][48] - 在AI模型领域,公司推出开源的Nemotron 3 Ultra模型,速度提升5倍,成本低30%,并开放所有训练数据[76][77] - 在物理AI领域,公司发布Cosmos 3,这是物理AI领域的前沿成果和基础模型[87][88]
英伟达(NVDA.US)再燃AI算力产业链牛市! 从Vera到RTX Spark再到DSX 黄仁勋抛出“全栈AI帝国”超级蓝图
智通财经网· 2026-06-01 16:56
智通财经APP获悉,6月1日,英伟达(NVDA.US)创始人兼CEO黄仁勋在中国台北Computex大会揭幕之 前重磅发表AI主题演讲,在这场位于台北的英伟达GTC活动上,全球市值最高公司英伟达可谓加速把自 己从"AI GPU供应商"扩向"AI数据中心全栈算力平台+个人电脑AI芯片 +CPU处理器集成厂商+机器人 AI基础设施+以CUDA为核心的AI软件运维系统"的综合型超大规模AI算力人工智能基础设施供应巨 头。 在这场全球投资者们一致聚焦的GTC活动上,黄仁勋AI主题演讲覆盖下一代AI算力架构Vera Rubin最新 产能推进动态,同时也覆盖最新推出的Vera CPU系列产品、新一代 AI PC、AI Agent、聚焦AI超级工厂 建设的平台DSX以及人形机器人开发者最新动态,甚至英伟达自研的AI大模型——即全新AI模型 Nemotron 3 Ultra,凸显出英伟达正在竭力把人工智能算力集群从"AI GPU/ASIC 人工智能加速器时代" 推进至"AI工厂主导的全栈NVIDIA操作系统时代"。 对全球AI算力产业链牛市轨迹而言,黄仁勋最新演讲释放的信号非常清晰:AI算力基础设施需求并未 出现从高位退潮的 ...
英伟达正式发布Arm PC芯片,黄仁勋台北演讲:计算产业变天了!
半导体芯闻· 2026-06-01 16:32
2026 年6月1日的台北,再次因为人工智能的巨浪而沸腾。 在今日举行的 NVIDIA GTC 台北 2026 主题演讲上,身着标志性皮衣的 NVIDIA 创始人兼 CEO 黄仁勋登台。黄仁勋表示:"两年前我在台北开始谈论生成式 AI 以及即将到来的 AI 浪潮。而今天 我们可以宣告:智能体 AI(Agentic AI)已经真正到来,实用化 AI 已经真正到来。而算力需求 将是唯一的限制。" 本次两小时的大会中,黄仁勋的发布要点总结如下: 1.过去六个月,计算机产业已经发生根本变化。Agent 与前沿模型融合,使 AI 终于能够完成真正 有用的工作。未来十年,Agentic AI 将成为新的应用模式和计算模式。无论是在云端、本地、 PC、机器人、汽车、卫星、基站,还是工厂,这种模式都会不断重复:模型负责思考,harness 负 责编排,工具和 skills 负责执行,runtime 负责承载系统。 2.从底层硬件来看,芯片的进化轨迹已经完全被这套模式重塑。黄仁勋解释道,过去的 Grace Blackwell 是为了处理 AI,尤其是推理而打造的;而本次首发的 Vera Rubin 则是为了运行 Agent 而 ...
黄仁勋一句话,撕下AI遮羞布
Wind万得· 2026-06-01 14:26
英伟达GTC 2026战略方向解析 - 英伟达在GTC 2026主题演讲中阐述了AI发展的新阶段:AI正从“会回答问题”转向“能执行任务”[2] - 公司战略重点从单一的GPU或数据中心,转向同时推进两条主线:面向云端/企业的“AI工厂”和面向个人用户的“Windows AI PC”[2] - 两条主线共同指向核心商业问题:AI投入能否转化为真实收入[2] 主线一:AI工厂 - AI工厂的核心是规模化生产Token(AI生成的内容/服务单元),其成本、稳定性和规模决定AI应用的商业化前景[5] - 英伟达推出的DSX平台、Vera CPU和Vera Rubin平台均服务于AI工厂的设计、部署和运营,强调系统而非单点硬件[5] - 公司的竞争目标已超越芯片本身,旨在争夺AI时代的基础设施入口[6] 主线二:AI PC - AI PC被定义为“新一代AI-native personal computing”,旨在让AI代理从云端走向本地设备,进入办公、编程、设计等多种场景[8] - 此举对微软至关重要,有助于强化Windows on Arm和Copilot的端侧能力,通过降低延迟、增强隐私来开启新的换机周期[8] - AI PC的关键在于重新分配PC产业链的话语权,而不仅仅是增加一个硬件概念[10] 对产业链的影响 - **受益环节**:AI PC放量将驱动硬件规格升级,提升SoC/主芯片、内存、存储、PCB、散热及电源管理等环节的价值量[9] - **面临压力的公司**:英特尔需守住x86基本盘,高通在Windows on Arm阵营面临更强竞争,AMD需应对Arm架构对传统PC CPU份额的长期侵蚀[9] 市场与资本关注点 - 当前市场关注点从AI基础设施资本开支,转向AI投入能否穿透至终端应用、企业效率和用户付费,形成收入闭环[12][13] - 对于近期寻求IPO的AI及硬科技公司,二级市场将重点关注其高估值背后是否有清晰的收入路径[12] - AI行情的核心问题已从“算力是否足够”转变为“收入能否接上”[14] 英伟达的战略意图 - 英伟达的目标是从GPU供应商进一步演变为PC平台供应商,推动AI能力从数据中心向端侧设备扩散[2] - 公司的长期战略是覆盖从AI基础设施到终端入口的整条价值链[15]
英伟达推出NVIDIA DSX平台 为基建构建者提供AI工厂创建指南
新浪财经· 2026-06-01 12:15
公司产品发布 - 英伟达于6月1日宣布推出NVIDIA DSX平台 [1] - 该平台旨在为基础设施构建者提供创建AI工厂的完整行动指南 [1] 产品功能与定位 - NVIDIA DSX平台允许基础设施构建者在投入成本前模拟整个AI工厂的运作 [1] - 该平台可在机架安装前验证性能,并以生产AI所需的可靠性运行工厂 [1] - 平台相关的参考设计与蓝图可与英伟达Vera Rubin平台兼容,为AI工厂提供基础架构支持 [1]
ComputeX 前瞻、如何评价英伟达Windows 处理器
傅里叶的猫· 2026-05-31 23:33
AI基础设施进入系统设计新阶段 - AI基础设施的评判标准正从单一组件转向交付完整AI系统的能力,包括机架、供电、散热、网络、PCB/基板、先进封装、测试和制造规模 [3] - 行业叙事发生重大转变,关注点从GPU、HBM、CoWoS产能等具体部件,扩展到更广泛的系统级组件,如CPU、网络、内存、CPO、液冷和高压供电架构 [6] - 核心信息是AI基础设施演变为完整的“AI工厂”,采用可组合的模型,包含多种专门功能的机架类型,如GPU机架、CPU机架、网络机架和电源机架 [7] 英伟达N1处理器与消费级市场策略 - 英伟达发布面向Windows PC市场的ARM架构N1处理器,集成20个CPU核心和相当于RTX 5070级别的GPU,支持完整CUDA软件栈,最高配128GB LPDDR5X内存 [4] - N1的核心规格与英伟达此前发布的DGX Spark“最小的AI超级计算机”几乎一致,后者售价3000-4000美元,但市场表现远低于预期 [4] - 多家PC厂商将推出搭载N1的产品,但其成功关键在于能否推动软件生态发展,将英伟达的CUDA资源与Windows生态结合,促进AI应用在PC端的部署 [5] Vera CPU在AI数据中心的作用演进 - Vera CPU是英伟达针对AI数据中心编排层设计的专用CPU,其定位与传统追求通用性的服务器CPU不同 [8] - 随着AI应用从训练转向推理,CPU的角色转变为AI工厂的“交通控制器”,负责请求调度、Agent工作流控制、工具调用协调、内存索引、检索管理、模拟、网络控制和系统遥测 [8] - 英伟达CEO认为CPU市场规模约2000亿美元,公司为Vera CPU准备了约200万台的年产能 [9] - AI服务器中CPU与GPU的配比可能从过去的1:8走向1:1甚至更高,反映出CPU重要性提升,两大海外CPU厂商的交货周期已从3-4周延长至8-10周 [9] 网络与CPO(共封装光学)技术发展 - 随着AI系统规模扩大至Pod级别,瓶颈从芯片计算转向数据搬运,网络成为焦点 [10] - 英伟达推动以太网成为专门的AI网络结构,其Spectrum-X路线图包含Ethernet Photonics和Quantum-X Photonics [10] - CPO对Rubin Ultra平台至关重要,因为其NVL576配置(组合8个72-GPU机架成576-GPU域)的物理规模超出了铜缆的有效处理范围,需使用直接光学连接 [10] - CPO的采用将提升对光引擎、硅光子PIC、光纤阵列单元(FAU)、主动对准设备、光学连接器、光纤管理及液冷兼容光子封装等组件的需求 [11] 冷却与供电架构面临挑战与转型 - 冷却和供电可能成为Rubin平台部署的实际瓶颈 [12] - 功率密度急剧上升:Rubin NVL8服务器TDP约24kW,2U系统级超过32kW;Rubin NVL72机架TDP估计在180-220kW之间 [13] - 高功率带来供电挑战:在54V电压下,216kW机架意味着约4000A电流,对铜缆、母线、连接器和热管理造成困难 [13] - 英伟达推动供电架构向800V直流供电、110kW电源货架和电池备份单元(BBU)支持的方向发展 [16] - 冷却方案演进:Hopper机架功率40-60kW,采用风冷或混合冷却;Blackwell NVL72机架功率120-180kW,直接液冷成为标准;Rubin NVL72机架功率180-220kW;Rubin Ultra可能达到数百千瓦 [15] - 未来机架演变为需要协调电源转换、备用能源、液体流动、遥测和安全系统的电热机器 [17]