Workflow
NVIDIA Alpamayo模型家族
icon
搜索文档
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
具身智能之心· 2026-01-07 11:33
文章核心观点 - 英伟达在CES 2026上发布了一系列面向物理AI和Agentic AI的新产品与平台,标志着其战略重心从游戏显卡全面转向AI,并将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具)[1][2][6][9] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,其六大核心组件包括Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - Rubin GPU在NVFP4数据格式下,推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6用于规模内扩展网络,单GPU互连带宽达3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,其与GPU的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出基于Spectrum-6芯片的共封装光学以太网交换机,用于机架扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU,构建推理上下文内存存储平台,旨在高效共享与复用键值缓存数据,提升系统响应与吞吐[32][34] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,Vera Rubin训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] - 用于构建该机架的六类芯片已全部从晶圆厂交付,预计2026年下半年启动规模化量产[38] 自动驾驶开源模型与生态 - 发布全新开源模型系列Alpamayo,面向安全推理的自动驾驶,其中Alpamayo 1是全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型,参数为100亿[39][41] - 模型接收车辆运动历史、多摄像头实时视频和用户指令,输出驾驶决策、因果推理结果和行驶轨迹[42] - 配套发布开源仿真框架AlpacaSim,以及一个包含1700小时驾驶数据的开源数据集,数据涵盖全球广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送更多自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖软件开发商、整车厂/出行平台、硬件供应商全产业链[47] AI智能体与多模态模型 - NVIDIA Nemotron模型家族推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,支持实时低延迟场景如实时字幕生成,速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型,能精准处理多语言、多模态数据以提升文档搜索效率[53] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度,包括内容安全模型和检测敏感数据的PII模型[53] 物理AI与机器人平台 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2(视觉-语言推理模型)、Cosmos Transfer 2.5与Cosmos Predict 2.5(合成视频生成模型)[56][60] - 发布Isaac GR00T N1.6,一款专为类人机器人打造的开源视觉-语言-行动推理模型,支持全身控制并集成Cosmos Reason模型[61] - 发布NVIDIA AI Blueprint for Video Search and Summarization,提供参考工作流以构建能分析大量录播及直播视频的视觉AI智能体[61] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,旨在降低行业成本、加速治疗方案落地[62][63] - 该系列包含多款专项模型:La-Proteina(设计大型蛋白质)、ReaSyn v2(药物生产考虑)、KERMT(预测药物人体反应)、RNAPro(预测RNA 3D结构)[64][69] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[66] 开源与生态建设 - 宣布持续向社区开源训练框架以及多模态数据集,数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[5] - 演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen,体现了对全球开源生态的关注[11][12]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
创业邦· 2026-01-06 12:28
公司战略与核心主题 - 公司五年来首次在CES展会未发布游戏显卡,明确将全力投入AI领域[2] - 本次发布的核心主题直指物理AI,旨在将护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动GPU与基础设施投入并增强用户与生态锁定[8][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能为35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[17] - 引入NVLink 6用于规模内扩展网络,单GPU互连带宽提升至3.6 TB/s(双向),每个Vera Rubin NVL72机架配备9颗交换芯片,总规模内带宽达260 TB/s[17] - Vera CPU集成88个定制Olympus Arm核心,采用空间多线程设计,最多可同时运行176个线程[17] - 用于机架扩展的Spectrum-X以太网交换机基于Spectrum-6芯片构建,采用共封装光学技术,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[20] - 推出BlueField-4 DPU,构建新的推理上下文内存存储平台,旨在高效共享与复用键值缓存数据,提升系统响应与吞吐[22][24] - 与Blackwell相比,Vera Rubin在训练MoE模型时所需GPU数量仅为四分之一;在MoE推理场景下,每token成本最高可降低10倍[24] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[25] - 构建机架所需的六类芯片已全部从晶圆厂交付,预计2026年下半年启动规模化量产[24] 自动驾驶开源模型与生态 - 推出全新开源模型系列Alpamayo,面向安全推理的自动驾驶[26][27] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能让车辆理解环境并解释自身决策[29] - 配套推出开源仿真框架AlpacaSim,支持在不同环境与边缘场景中进行闭环训练与评估[31] - 发布包含1700小时驾驶数据的开源数据集,数据采集自全球广泛区域,涵盖复杂真实边缘场景[32] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级逐步推送高速脱手驾驶、城市全场景自动驾驶等功能[32] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,连接软件开发商、整车厂/出行平台、硬件供应商,覆盖全产业链[34] AI智能体与专项模型 - NVIDIA Nemotron在AI智能体领域推出针对语音、RAG以及安全三大场景的专项模型[37] - Nemotron Speech包含新的自动语音识别模型,支持实时低延迟场景,速度比同类模型快10倍,已被博世采用[39] - Nemotron RAG搭载新的视觉语言模型,能精准处理多语言、多模态数据,提升文档搜索效率[39] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度,包括内容安全模型和检测敏感数据的PII模型[39] 物理AI与机器人平台 - 为机器人推出的推理大脑Cosmos平台升级,主要用于生成符合现实世界物理规律的合成数据,已被Figure、Agility Robotics、通用汽车等公司采用[40][41] - 发布Cosmos Reason 2视觉-语言推理模型,帮助机器人与AI智能体更精准地感知、理解并与物理世界交互[45] - 发布Cosmos Transfer 2.5与Cosmos Predict 2.5模型,可在不同环境与条件下生成大规模的合成视频[45] - Salesforce、Milestone、Hitachi等企业正采用Cosmos Reason模型开发AI智能体;Franka Robotics等利用Isaac GR00T模型对机器人行为进行仿真、训练与验证[46] - 面向机器人领域推出NVIDIA Isaac GR00T[11] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,旨在降低行业成本、加速治疗方案落地[48] - La-Proteina模型能设计原子级精度的大型蛋白质[48] - ReaSyn v2模型在药物发现阶段即考虑生产问题[48] - KERMT模型可以预测潜在药物进入人体后的反应,提前排查安全问题[50] - RNAPro模型用来预测RNA分子复杂的3D结构,推进个性化医疗[50] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[49] 开源与社区贡献 - 公司宣布持续向社区开源训练框架以及多模态数据集[8] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[8] 对中国开源模型的提及 - 公司在演讲开篇提及了DeepSeek,Kimi K2、Qwen也出现在PPT展示页上[12]