Workflow
NVIDIA Isaac GR00T
icon
搜索文档
黄仁勋一句话,又掀起了一个热潮
投中网· 2026-01-11 15:12
文章核心观点 - 具身智能行业正从依赖“单一任务编程和真实数据”的低效阶段,迈入以“物理AI”为核心的通用化爆发期,其发展范式正升级为“数据×模型×本体” [4] - 行业竞争的核心已演变为一场围绕“持续获取高质量交互数据以驱动模型迭代”的基础设施之争 [3][5] - 高质量交互数据是机器人规模化落地的关键,行业正致力于通过仿真与真实数据结合等方式打破数据瓶颈 [9][20] 英伟达的入局与战略 - 英伟达CEO黄仁勋在CES上发布专为机器人打造的新一代具身智能基础模型NVIDIA Isaac GR00T及开发平台NVIDIA Cosmos,旨在为机器人通用化落地搭建核心技术底座 [7] - 英伟达通过物理仿真平台帮助机器人在虚拟环境中学习复杂交互(如演示机器人“瓦力”完成摔倒爬起动作),以缩小数字孪生与现实世界的差距,规模化构建具有物理可信度的训练场 [8] - 英伟达已与Apptronik、Agility Robotics、Figure、Boston Dynamics、Sanctuary AI等多家美国机器人公司合作,试图在具身智能领域再造一个类似CUDA的生态体系 [9][10] 中国玩家的差异化发展路径 - 与英伟达押注“高保真仿真+通用模型”不同,中国玩家更倾向于“真实场景驱动+垂直闭环”的务实路径 [12] - 智元机器人发布大语言模型驱动的开源仿真平台GenieSim3.0,涵盖200余项任务、上万小时仿真数据集,但强调真机数据的核心地位,仿真数据用于早期测试和工程迭代 [12] - 银河通用提出“三层级大模型系统”,采用合成数据与真实数据协同的研发路径,形成“仿真预训练→真实数据微调→模型优化”的闭环 [12] - 它石智航聚焦通过大规模人类行为视频数据拓展语义覆盖 [13] 数据采集方案与基础设施价值 - 鹿明机器人作为“具身智能数据四小龙”之一,选择“轻量化手持夹爪”方式进行数据采集,以解决真实世界灰尘、油污等仿真难以复现的问题 [14] - 传统遥操作数据采集存在高成本、低效率(一小时仅30-35条数据)、低适配(数据无法跨品牌互通)的困境 [14] - 鹿明自研FastUMI Pro系统,通过统一接口实现不同品牌机械臂数据的直接复用,使训练模型可跨场景(如从汽车焊装线微调至3C装配)快速适配,效率提升5倍,成本降至五分之一,精度达1-3mm [14] - 该方案的核心价值在于摆脱对特定硬件的依赖,打破数据孤岛,其目标是成为具身智能的“USB接口”,即行业基础设施,价值将取决于在其数据生态上运行和迭代的机器人数量,而非硬件销量 [15][16] 行业融资与市场前景 - 2025年具身智能成为国内最火融资赛道,年内融资事件达298笔,同比增长144%;融资总规模达329亿元,同比增长291% [17] - 产业资本成为活跃投资力量:京东一天内投资千寻智能、逐际动力、众擎机器人三家公司,并后续投资RoboScience和帕西尼,以构建生态并推动物流、仓储等场景应用 [17];宁德时代通过投资渗透产业链,提供动力解决方案 [17];美团自2020年起投资超10家机器人与具身智能公司,探索本地生活服务等场景 [18] - 2025年投资趋势向“投早投小”(种子、天使及A轮合计占74%)与“投强投优”(B轮及以后占15%)两端靠拢,投资人将“数据获取能力”和“场景落地验证”列为尽调核心指标 [19] - 市场前景广阔:2025年全球市场规模预计达63.39亿元,中国占比超50%;预计到2030年,全球人形机器人市场销量将接近34万台,市场规模有望突破640亿元 [19] 商业化落地与投资逻辑 - 行业玩家的胜率在于聚焦工业场景中客户付费意愿强、任务边界清晰、ROI可量化的领域,如3C电子、物流仓储、质量检测等 [15] - 鹿明机器人与三菱产线合作实现节拍压缩60%,证明了其技术已通过真实商业验证,提供了基础的胜率保障 [15] - 投资的赔率想象空间在于:一旦某家公司的数据采集方案被行业广泛采用,其价值将取决于生态内运行和迭代的机器人数量,而非硬件销量,即从卖硬件转向运营数据和生态 [15]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
具身智能之心· 2026-01-07 11:33
文章核心观点 - 英伟达在CES 2026上发布了一系列面向物理AI和Agentic AI的新产品与平台,标志着其战略重心从游戏显卡全面转向AI,并将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具)[1][2][6][9] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,其六大核心组件包括Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - Rubin GPU在NVFP4数据格式下,推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6用于规模内扩展网络,单GPU互连带宽达3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,其与GPU的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出基于Spectrum-6芯片的共封装光学以太网交换机,用于机架扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU,构建推理上下文内存存储平台,旨在高效共享与复用键值缓存数据,提升系统响应与吞吐[32][34] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,Vera Rubin训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] - 用于构建该机架的六类芯片已全部从晶圆厂交付,预计2026年下半年启动规模化量产[38] 自动驾驶开源模型与生态 - 发布全新开源模型系列Alpamayo,面向安全推理的自动驾驶,其中Alpamayo 1是全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型,参数为100亿[39][41] - 模型接收车辆运动历史、多摄像头实时视频和用户指令,输出驾驶决策、因果推理结果和行驶轨迹[42] - 配套发布开源仿真框架AlpacaSim,以及一个包含1700小时驾驶数据的开源数据集,数据涵盖全球广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送更多自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖软件开发商、整车厂/出行平台、硬件供应商全产业链[47] AI智能体与多模态模型 - NVIDIA Nemotron模型家族推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,支持实时低延迟场景如实时字幕生成,速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型,能精准处理多语言、多模态数据以提升文档搜索效率[53] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度,包括内容安全模型和检测敏感数据的PII模型[53] 物理AI与机器人平台 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2(视觉-语言推理模型)、Cosmos Transfer 2.5与Cosmos Predict 2.5(合成视频生成模型)[56][60] - 发布Isaac GR00T N1.6,一款专为类人机器人打造的开源视觉-语言-行动推理模型,支持全身控制并集成Cosmos Reason模型[61] - 发布NVIDIA AI Blueprint for Video Search and Summarization,提供参考工作流以构建能分析大量录播及直播视频的视觉AI智能体[61] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,旨在降低行业成本、加速治疗方案落地[62][63] - 该系列包含多款专项模型:La-Proteina(设计大型蛋白质)、ReaSyn v2(药物生产考虑)、KERMT(预测药物人体反应)、RNAPro(预测RNA 3D结构)[64][69] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[66] 开源与生态建设 - 宣布持续向社区开源训练框架以及多模态数据集,数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[5] - 演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen,体现了对全球开源生态的关注[11][12]