Omniverse仿真平台
搜索文档
英伟达,重磅发布!黄仁勋:重要时刻要来了
第一财经· 2026-01-06 11:17
行业与计算范式变革 - 计算机行业正经历由AI驱动的双重平台变革,AI既是应用又是新平台,将催生新的应用生态[6] - 软件开发范式被彻底颠覆,从编写代码转向训练模型,从预编译执行转向实时生成,整个技术栈正在重构[6] - 加速计算和人工智能正在重塑计算领域的每个层面,过去十年价值约10万亿美元的计算基础设施正在进行现代化改造[7] - 每年有数千亿美元的风投资金涌入AI领域,同时全球100万亿美元的产业正在将研发预算从传统方法转向人工智能[7] - 去年行业最重要的改变之一是开源模型真正起飞,中国的DeepSeek R1等模型激活了全球开源运动,性能逼近前沿模型[7][8] 物理AI与核心战略 - 公司认为AI发展的下一站是进入物理世界,并已为此工作8年,核心挑战是让AI获得对物理世界的“常识”[10] - 仿真技术是公司几乎所有物理AI工作的核心,通过多层次技术栈推动AI从对话者转变为现实世界的行动者[12] - 公司建立了一个由三台计算机组成的系统来训练AI学习物理常识,并利用基于物理定律的合成数据进行训练[10] - 物理AI将赋能芯片设计、生产线自动化乃至整个数字孪生系统,实现“在计算机中设计、在计算机中制造”[16] 自动驾驶汽车发展 - 公司认为从非自动驾驶汽车到自动驾驶汽车的转折点可能正在发生,未来十年很大一部分汽车将是自动驾驶或高度自动驾驶的[14] - 公司推出的开源推理VLA模型Alpamayo,可加速基于推理的、安全的自动驾驶车辆开发,是公司AV团队数千人的工作成果[16] - 公司DRIVE AV软件将在梅赛德斯奔驰车辆上使用,第一辆AV自动驾驶汽车将在2026年第一季度在美国上路,第二季度进入欧洲,第三或第四季度进入亚洲[16] - 公司将继续更新版本,合作建造L4 Robotaxi的生态系统还在扩大[16] 工业制造与机器人应用 - 公司宣布与西门子深化合作,将物理AI模型、Omniverse仿真平台集成至西门子的工业软件组合,覆盖从芯片设计到生产运营的全生命周期[16] - 公司认为正站在一场新工业革命的开端[16] - 机器人系统的下一段征程是发展不同尺寸的机器人,公司推出了包括Cosmos Transfer 2.5和Cosmos Predict 2.5世界模型在内的多个开源模型及开发框架[17] Rubin芯片平台性能 - Rubin平台包含六款新芯片:Vera CPU、Rubin GPU、NVLink 6交换机芯片、ConnectX-9 Spectrum-X超级网卡芯片、BlueField-4 DPU、Spectrum-6以太网交换机芯片[19] - Rubin GPU的NVFP4推理算力为50 PFLOPS,是Blackwell的5倍;NVFP4训练算力是35 PFLOPS,是Blackwell的3.5倍[21] - Rubin GPU的HBM4内存带宽22 TB/s,是Blackwell的2.8倍,晶体管数量3360亿个,是Blackwell的1.6倍[21] - 与Blackwell平台相比,Rubin平台通过软硬件协同设计,将推理token成本降低10倍,将训练MoE模型所需的GPU数量减少4倍[21] 其他新芯片与系统性能 - ConnectX-9 Spectrum-X超级网卡芯片有230亿个晶体管,支持800 GB/s以太网[22] - BlueField-4 DPU有1260亿个晶体管,其网络能力、计算能力和内存带宽是上一代BlueField-3的2倍、6倍、3倍[22] - Spectrum-X以太网共封装光学器件有3520亿个晶体管,可支持102.4 Tb/s横向扩展交换基础设施[22] - 公司推出了由BlueField-4 DPU支持的推理上下文内存存储平台,作为一种新型的AI存储基础设施[23] 超节点与产品规划 - Vera Rubin NVL72的NVFP4推理和训练算力分别是3.6 EFLOPS、2.5 EFLOPS,分别是Blackwell的5倍和3.5倍[24] - Vera Rubin NVL72的HBM4内存带宽1.6 PB/s,是Blackwell的2.8倍,晶体管数量220万亿个,是Blackwell的1.7倍[24] - 使用Rubin NVLink72训练模型,所需GPU数量是使用Blackwell NVL72的1/4,思考输出的token数量则是10倍[24] - DGX SuperPOD由一个超节点整合8个Rubin NVL72机架中的576颗GPU,产品将于2026年下半年上市[24] - Rubin平台产品已全面投入生产,基于该平台的产品将于2026年下半年由合作伙伴推出,首批云服务提供商包括AWS、谷歌云、微软等,Anthropic、OpenAI、xAI等AI实验室也将使用[24]
阿里云栖大会聚焦(4):Omniverse+Cosmos驱动的PhysicalAI数据飞轮
海通国际证券· 2025-09-26 14:00
行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][3][13][14][15][16][17] 核心观点 - NVIDIA与阿里云共同明确了Physical AI“云端训练+虚拟仿真+边缘部署”的三位一体落地路线 该方案以Omniverse仿真平台与Cosmos世界模型为核心 扩展数据与能力边界 依托阿里云PAI的云上超算与异构调度完成模型训练与评测 最终通过Jetson等边缘平台部署至机器人与智能车辆 实现从虚拟到物理世界的高效规模化 [1][13] - 该技术框架已应用于机器人抓取、自动驾驶等典型场景 通过仿真生成、世界模型增强与闭环回采 显著降低对真实数据的依赖 有望推动制造业、物流业等千万级场景的自动化升级 [1][13] - “三台电脑”架构与样板管线方向正确且具备可复制性 大会所明确的系统路线图为行业提供了清晰的技术实施路径 [2][14] - 数据飞轮的校准与可追责是落地过程中的决定性变量 Cosmos/仿真技术能高效生成长尾场景数据 但其有效性高度依赖于多层级校准与完善的数据谱系管理 [2][14] - 工程化落地需采用严谨的试点节奏以规避“Demo成功、上线困难”的风险 核心是建立“仿真→影子运行→受限实机→放量上线”的四闸门递进流程 [2][15] - 优化推理经济学与明确架构分工是规模化应用的关键 多步规划会显著增加计算开销 需在系统层面落地多级缓存、请求合并与服务等级协定等关键技术以控制成本 [3][16] - 治理、组织与供应链是保障技术稳健落地的核心支柱 安全与合规须作为前置条件 组织层面应组建融合AI、机器人与控制仿真的复合型团队 供应链需着力提升韧性 [3][17] - 长期发展需重点关注世界模型通用化、多智能体协同与端云协同三大技术路线 这将决定方案的场景扩展能力与成本下降曲线 [3][17] 技术实施路径 - 必须建立传感器级、动力学级与任务级的三层校准机制 并严格记录数据的来源、版本及生成参数 否则Sim2Real误差将侵蚀技术收益 [2][14] - 建议在每轮模型训练前后固化仿真与实机的对齐评测流程 形成标准化回归测试套件 以系统化控制虚实差异 [2][14] - 推进过程需由分层的KPI体系予以约束 具体包括算法层的碰撞率与仿真真实性差距、系统层的时延与可靠性、以及业务层的效率与成本指标 [2][15] - 场景选型应优先考虑封闭半封闭、弱交互且价值密度高的应用 如仓内搬运与标准产线 通过小步快跑积累可复用的工程方法 [2][15] - 架构上应实现端云协同 由云端负责复杂策略的重规划与迭代 边缘侧专注于实时控制与安全守护 [3][16] - 配套的数字孪生、数据治理及集中监控等“参考架构六件套”是支撑上述技术闭环、缩短量产周期的必要基础设施 [3][16] 风险管控与组织保障 - 每一道闸门均应绑定明确的停机条件与回滚方案 以严格控制风险 [2][15] - 通过构建安全论证案例、失效模式库及双通道冗余控制体系 并完善安全日志与重放能力 为审计复盘奠定基础 [3][17] - 组织层面以周为节拍实现高效迭代 [3][17] - 供应链通过接口标准化与资产自有化规避锁定风险 并对关键环节进行双源验证 [3][17]