VERA RUBIN平台
搜索文档
英伟达计算的炼金术:一个历史时刻:两场平台变革同时发生
英伟达· 2026-01-14 09:30
报告行业投资评级 * 报告未明确给出行业投资评级 报告的核心观点 * 计算行业正同时经历**加速计算**与**生成式AI**两大平台变革,整个技术栈将被彻底重塑 [7][8][9][11][14] * **物理AI**(理解物理定律并与世界交互的AI)是下一个前沿,其发展依赖于模拟、合成数据和新的计算架构 [26][118][127][129] * 英伟达通过构建从芯片、系统到软件的全栈平台,并推动开源模型与广泛的生态合作,旨在成为全球AI工厂的引擎和物理AI时代的基石 [33][84][161][319][409] 根据相关目录分别进行总结 行业变革与趋势 * 计算行业正同时经历**加速计算**与**生成式AI**两大平台变革,整个技术栈将被彻底重塑 [7][8][9][11][14] * 软件开发范式从“编写代码”转向“训练模型”,应用运行从CPU转向GPU,应用构建从“应用优先”转向“AI优先” [14] * 内容生成从“预编译”转向“实时生成每个像素与Token” [18] * 行业研发预算正大规模从传统方法转向AI方法,规模达**10万亿美元** [21][22] * **2025年**被视为关键发展年份,标志性趋势包括:代理系统(具备推理、规划与工具使用能力)、开源崛起以及测试时扩展(实时思考) [25][28][29][30] 英伟达的AI战略与模型布局 * 英伟达致力于建造自己的AI超算,目标是锻造世界顶级的开源模型 [33] * 公司构建了**NVIDIA开源模型矩阵**,包括Nemo Tron(混合SSM架构,实现极速推理)、OpenFold(理解蛋白质结构与生成)、ForecastNet(革新天气预测方式)等 [36][37][41][42] * 未来的核心原子单元是**AI代理**,其特点是超越记忆,走向推理,并能使用工具、进行研究与执行 [43][45][46][47] * 单一模型不够,未来将是**专家混合模型**的组合,并通过**智能体路由**技术进行调度 [49][51] * 英伟达提供蓝图,帮助企业利用其平台(NVIDIA NEMO)、工具/API、世界级开源与专有模型以及智能体路由技术,结合企业专属数据,构建专属AI [63][64][66][67][70][72][73][75][76] 物理AI(Physical AI)的挑战与突破 * 当前AI缺乏对物理世界的基本常识,而收集真实世界训练数据缓慢、昂贵且永不满足,存在巨大的**数据鸿沟** [99][104][107][109][110] * **模拟**是物理AI几乎所有工作的基础,没有模拟就无法感知物理反馈和评估效果 [118] * 英伟达推出**COSMOS:世界基础模型**,旨在成为物理AI的“ChatGPT”时刻 [123] * COSMOS通过**计算炼成数据**,生成基于物理规律、具有无限多样性的**合成数据**,以填补数据鸿沟 [127][129][130] * COSMOS具备生成式物理AI技能、对齐多模态信息、生成物理连贯视频、进行交互式闭环模拟以及推理、分析与预测等核心能力 [132] * 通过“**模拟中学习,现实中适应**”的范式,COSMOS能生成海量模拟里程,教会机器人适应每一种场景 [135][136][139][141] 生态合作与平台定位 * 英伟达定位为**世界领先平台的AI引擎**,其合作伙伴生态覆盖几乎所有主流科技与云服务公司,包括微软、亚马逊AWS、谷歌云、甲骨文、Adobe、Salesforce、ServiceNow等 [84][85][86][87][88][89] * 报告以个人AI助手“RICCI”为案例,展示了基于英伟达全栈技术(本地DGX、云API、开源模型)构建的智能体应用 [78][79] * 未来的交互界面将发生根本变化,**系统本身就是交互界面** [90] 物理AI的应用落地:以自动驾驶为例 * 进入物理世界标志着**一场新工业革命的开端** [158][159] * 英伟达的**DRIVE THOR**芯片是专为机器人系统设计的地基,具备双处理器冗余、最高功能安全等级和代码级安全认证 [161][163][164][167][168] * **Alpha Mayo**系统采用端到端训练,从摄像头输入直接推理行动输出,旨在解决传统方法难以应对的长尾场景难题 [171][175][176][177] * 英伟达与**梅赛德斯-奔驰达成战略合作**,计划于**2026年第一季度**实现全球上路,并通过OTA持续更新Alpha Mayo [179][180] * 自动驾驶技术可适用于所有机器人系统,预示着机器人产业的黄金时代 [197][198] * **NVIDIA OMNIVERSE**作为机器人的创世引擎,提供物理级精准仿真,用于在元宇宙中训练机器人并生成海量合成数据 [201][203][204][205][209] * 英伟达与**西门子达成战略合作**,将AI全栈技术集成到工业软件中,贯穿设计、生产、运营全生命周期,共同定义“未来工厂 = 巨型机器人”的新工业革命 [217][223][231] 下一代计算平台:VERA RUBIN * 面对AI需求的指数级增长和传统晶体管缩放定律的放缓,行业需要**激进的极端协同设计** [239][247][248] * **VERA RUBIN平台**已全面投产,其设计哲学是极致协同设计,累计投入**15,000工程师年** [252][254][256] * 单个VERA RUBIN计算模块集成2颗VERA CPU、4颗RUBIN GPU、4颗BLUEFIELD-4 DPU和8颗CONNECTX-9 NIC,采用零线缆、零风扇设计 [260][261][262][263][264] * **RUBIN GPU**采用MVF P4张量引擎,实现硬件级自适应精度,其晶体管数量和浮点性能相比Blackwell有显著提升 [269][270][271][274] * **VERA CPU**拥有88核,采用时空多线程技术,并具备强大的I/O性能,专为AI超算定制 [276][279][280] * 平台网络架构分为两部分:机架内采用**NVLINK 6 SWITCH**;AI工厂互联采用**SPECTRUM-X AI以太网**,可提升25%网络吞吐,显著降低网络成本 [285][287] * **BLUEFIELD-4 DPU**作为每个计算节点的标准配置,通过卸载虚拟化、安全等任务,让CPU和GPU专注于纯粹的AI计算 [291][293][294][296] * 平台采用直接液冷技术,使用**45℃温水进水**,能效高且无需数据中心冷水机组 [304][308][368] * VERA RUBIN平台在峰值推理性能、峰值训练性能上实现碾压式飞跃,是全球AI工厂的关键基础设施 [311][312][314][319] 全栈架构重构与性能经济学 * 为应对万亿参数模型和超长上下文带来的内存与带宽挑战,VERA RUBIN平台进行了全栈重构 [327][328][331][332][335] * 突破一:采用**硅光子连接**技术,通过台积电Co-op工艺将光模块直连芯片,实现高速互联 [343][344] * 突破二:发起**上下文内存革命**,抛弃传统南北向存储架构,在机架内由BLUEFIELD DPU驱动构建高速东西向流量,单个节点可提供**150 TB上下文内存**和**200 Gb/s节点内东西向带宽** [350][351][355][358][359] * 新架构使数据中心能效翻倍,预计节省约**6%** 的总电力消耗,并实现全系统可信计算安全 [371][373][375] * 相比上一代Blackwell,训练一个10万亿参数模型所需的系统数量大幅减少,极大缩短了抵达未来的时间 [387][388][391] * **每瓦性能等同于数据中心营收**,VERA RUBIN相比Hopper实现了显著的每瓦性能提升 [394][395][396] * 平台通过规模效应降低Token成本,其推理成本相比上一代大幅下降,体现了“买得越多,省得越多”的经济学 [400][401][403] 总结:全栈生态与未来 * 英伟达的布局贯穿**芯片、基础设施、模型、应用**全栈,并与英特尔、AMD、三星、联想、戴尔等硬件伙伴,以及汽车(通用、蔚来、小鹏)、工业(西门子)等垂直行业巨头建立了广泛生态 [409][414][415][416][420] * 其核心是驱动一场由**物理AI**定义的**新工业革命** [215][231]
戴尔(DELL.N):计划支持英伟达(NVDA.O)VERA CPU,新款戴尔PowerEdge XE服务器支持英伟达VERA RUBIN平台,与英伟达推出下一代企业人工智能解决方案。
快讯· 2025-05-20 00:47
公司与英伟达合作 - 戴尔计划支持英伟达VERA CPU [1] - 新款戴尔PowerEdge XE服务器将支持英伟达VERA RUBIN平台 [1] - 公司与英伟达合作推出下一代企业人工智能解决方案 [1]