老黄All in物理AI！最新GPU性能5倍提升，还砸掉了智驾门槛

文章核心观点 - 英伟达在CES 2026上发布了一系列面向物理AI和Agentic AI的新产品与平台，标志着其战略重心从游戏显卡全面转向AI，并将技术护城河从芯片层拓展至全栈平台层（模型+数据+工具）[1][2][6][9] 下一代数据中心架构：Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72，其六大核心组件包括Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - Rubin GPU在NVFP4数据格式下，推理性能达50 PFLOPS，是Blackwell GB200的5倍；训练性能达35 PFLOPS，是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存，提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6用于规模内扩展网络，单GPU互连带宽达3.6 TB/s（双向），每个机架配备9颗交换芯片，总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心，最多可同时运行176个线程，其与GPU的NVLink C2C互连带宽达1.8 TB/s，可寻址最多1.5 TB的LPDDR5X内存[22] - 推出基于Spectrum-6芯片的共封装光学以太网交换机，用于机架扩展，其中SN688提供409.6 Tb/s总带宽，SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU，构建推理上下文内存存储平台，旨在高效共享与复用键值缓存数据，提升系统响应与吞吐[32][34] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比，Vera Rubin训练MoE模型所需GPU数量仅为四分之一，在MoE推理场景下每token成本最高可降低10倍[36] - 用于构建该机架的六类芯片已全部从晶圆厂交付，预计2026年下半年启动规模化量产[38] 自动驾驶开源模型与生态 - 发布全新开源模型系列Alpamayo，面向安全推理的自动驾驶，其中Alpamayo 1是全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型，参数为100亿[39][41] - 模型接收车辆运动历史、多摄像头实时视频和用户指令，输出驾驶决策、因果推理结果和行驶轨迹[42] - 配套发布开源仿真框架AlpacaSim，以及一个包含1700小时驾驶数据的开源数据集，数据涵盖全球广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型，后续通过OTA升级推送更多自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景，覆盖软件开发商、整车厂/出行平台、硬件供应商全产业链[47] AI智能体与多模态模型 - NVIDIA Nemotron模型家族推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型，支持实时低延迟场景如实时字幕生成，速度比同类模型快10倍，已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型，能精准处理多语言、多模态数据以提升文档搜索效率[53] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度，包括内容安全模型和检测敏感数据的PII模型[53] 物理AI与机器人平台 - 为机器人推出的“大脑”Cosmos平台升级，全新发布Cosmos Reason 2（视觉-语言推理模型）、Cosmos Transfer 2.5与Cosmos Predict 2.5（合成视频生成模型）[56][60] - 发布Isaac GR00T N1.6，一款专为类人机器人打造的开源视觉-语言-行动推理模型，支持全身控制并集成Cosmos Reason模型[61] - 发布NVIDIA AI Blueprint for Video Search and Summarization，提供参考工作流以构建能分析大量录播及直播视频的视觉AI智能体[61] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用，其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具，旨在降低行业成本、加速治疗方案落地[62][63] - 该系列包含多款专项模型：La-Proteina（设计大型蛋白质）、ReaSyn v2（药物生产考虑）、KERMT（预测药物人体反应）、RNAPro（预测RNA 3D结构）[64][69] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[66] 开源与生态建设 - 宣布持续向社区开源训练框架以及多模态数据集，数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[5] - 演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen，体现了对全球开源生态的关注[11][12]