NVIDIA Isaac GR00T
搜索文档
NVIDIA and Global Robotics Leaders Take Physical AI to the Real World
Globenewswire· 2026-03-17 04:41
核心观点 - 英伟达宣布与全球机器人生态系统合作,推动生产级物理AI的发展,并发布了新的仿真框架和开放模型,旨在成为机器人行业的基础平台,使每个工业企业都成为机器人公司 [2][4] 行业合作与生态系统 - 行业领导者ABB Robotics、AGIBOT、Agility、FANUC、Figure、KUKA、Universal Robots、YASKAWA等正在基于英伟达平台构建解决方案 [3] - 全球安装基数超过200万台的工业机器人巨头FANUC、ABB Robotics、YASKAWA和KUKA正在将英伟达Omniverse库和Isaac仿真框架集成到其虚拟调试解决方案中,并通过数字孪生进行验证 [5] - 这些公司还在其控制器中集成英伟达Jetson模块,以实现生产线边缘的实时AI推理 [5] - 战略生态系统合作正在将平台集成转化为实际工业影响,例如Skild AI与ABB Robotics和Universal Robots合作,将通用机器人智能部署到不同行业和任务中 [18] - 英伟达通过其拥有超过40,000名成员的初创企业孵化计划NVIDIA Inception,为机器人先驱提供技术指导、高性能计算资源以及生态系统内的关键合作伙伴联系 [29] 技术平台与产品发布 - 公司发布了新的NVIDIA Isaac仿真框架、新的NVIDIA Cosmos和NVIDIA Isaac GR00T开放模型,供行业开发、训练和部署下一代智能机器人 [2] - 发布了Cosmos 3,这是首个统一合成世界生成、视觉推理和动作模拟的世界基础模型,旨在加速复杂环境下通用机器人智能的开发 [8] - 推出了Isaac Lab 3.0早期访问版,基于新的Newton物理引擎1.0和PhysX SDK构建,增加了多物理场仿真并改进了对复杂灵巧操作的支持,可在DGX级基础设施上实现更快的大规模机器人学习 [11] - 宣布GR00T N1.7模型现已提供早期商业许可访问,为生产就绪的机器人部署带来包括先进灵巧控制在内的通用机器人技能 [12] - 预览了下一代机器人基础模型GR00T N2,该模型基于新的世界动作模型架构,帮助机器人在新环境中成功完成新任务的频率是领先的视觉语言动作模型的两倍多,目前在MolmoSpaces和RoboArena的通用机器人策略排名中位列第一 [13] - 这些系统由NVIDIA Jetson Thor机器人计算平台驱动,使开发者能够以更快的速度、更高的智能和可靠性从仿真训练转向现实世界部署 [14] 人形机器人发展 - 包括1X、AGIBOT、Agility、Boston Dynamics、Figure、NEURA Robotics在内的领导者正在使用Cosmos世界模型、Isaac Sim和Isaac Lab来加速其下一代人形机器人的开发和验证 [10] - AGIBOT、Humanoid、NEURA Robotics等公司也采用NVIDIA Isaac GR00T N模型以加速其人形机器人的工业部署 [12] 医疗保健机器人应用 - 医疗保健是物理AI的关键机遇,CMR Surgical正在使用Cosmos-H仿真为其Versius手术系统在临床部署前训练和验证机器人智能 [16] - Johnson & Johnson MedTech使用基于Isaac Sim和Cosmos的后期训练工作流程,为其泌尿外科Monarch平台训练和验证系统 [16] - Medtronic正在探索使用NVIDIA IGX Thor,以在外科机器人系统中实现关键任务的精度和功能安全 [16] 具体应用案例与合作伙伴 - Skild AI与富士康合作,为英伟达Blackwell生产线进行高精度装配,使富士康的AI驱动双臂机械手能够掌握行业最复杂的制造任务 [22] - Lightwheel与三星合作开发和校准Newton物理引擎,使三星的装配机器人在仿真中掌握复杂的线缆处理,实现更高的精度和更快的装配线 [22] - PTC宣布推出从Onshape CAD平台到NVIDIA Isaac Sim的新机器人设计到仿真工作流程,为FANUC America等工程团队创建无缝的CAD到OpenUSD桥梁 [23] - WORKR将其AI平台与ABB Robotics工业机器人集成,使用Omniverse库作为其WorkrCore的一部分,训练可由中小型制造商在几分钟内部署的机器人劳动力,无需编程知识 [24] - KION集团与英伟达和埃森哲合作推进自主仓库解决方案,使用Omniverse和物理AI驱动的数字孪生为全球最大的纯合同物流提供商GXO训练和测试基于Jetson的自主叉车车队 [25] - 微软Azure和Nebius集成了英伟达物理AI数据工厂蓝图,为其开发者实现可扩展的、智能体驱动的合成数据生成 [26] - CoreWeave集成Isaac Lab以构建机器人学习管道,而阿里巴巴云将英伟达的整个物理AI堆栈集成到其PAI平台,以加速端到端机器人开发 [26] - 迪士尼基于英伟达Warp框架构建并集成到Newton中的GPU加速物理模拟器Kamino,用于训练其Olaf和BDX机器人的策略 [27] 开发者社区与开源 - 英伟达与Hugging Face合作,将Isaac和GR00T集成到LeRobot开源框架中,连接英伟达的200万机器人开发者与Hugging Face全球1300万AI构建者,以加速开源机器人开发 [30]
NVIDIA Expands Open Model Families to Power the Next Wave of Agentic, Physical and Healthcare AI
Globenewswire· 2026-03-17 04:15
文章核心观点 英伟达宣布扩展其开源模型家族,以推动下一代智能体、物理世界及医疗保健AI的发展 公司推出了多个新模型,旨在赋能开发者和科学家构建能够在数字和现实世界中推理与行动的智能系统[2][13] 开源模型组合与战略意义 - 开源AI已成为全球创新驱动力 英伟达扩展的开源模型组合,包括用于智能体系统的Nemotron、用于物理AI的Cosmos、用于自动驾驶汽车的Alpamayo、用于机器人的Isaac GR00T以及用于生物医学研究的BioNeMo,为各行业解锁新能力提供了先进的模型和框架[3] - 公司认为,开源模型对于在全球范围内推进创新至关重要 其模型家族将智能扩展到语言之外,使全球开发者能够构建智能体,并推动数字和物理行业的突破[4] 智能体AI模型:Nemotron系列 - **Nemotron 3全能理解多模态模型**:为AI智能体提供支持,实现自然对话、复杂推理和先进的视觉能力[5][16] - **Nemotron 3 Ultra模型**:在NVIDIA Blackwell平台上使用NVFP4格式,提供前沿智能,吞吐效率提升5倍,适用于代码助手、搜索和复杂工作流自动化等AI原生应用[17] - **Nemotron 3 Omni模型**:集成音频、视觉和语言理解,使AI智能体能高效、准确地从视频和文档中提取见解[17] - **Nemotron 3 VoiceChat模型**:支持实时对话,AI可同时聆听和响应,在一个系统中结合了自动语音识别、大语言模型处理和文本转语音功能[17] - **Nemotron安全模型与检索流程**:通过检测文本和图像中的不安全内容来增强可信的多模态系统,智能体检索流程则提高输出的相关性和准确性[17] - **Nemotron-Personas数据集**:发布了基于本地人口普查和人口数据的、保护隐私的完全合成数据集 法国数据集现已推出,加入了美国、日本、印度、巴西和新加坡的现有数据集[9] 物理AI模型:机器人及自动驾驶 - **Isaac GR00T N1.7模型**:专为人形机器人打造的开放式推理视觉语言行动模型,现已具备商业可行性,可用于实际部署[16][18] - **GR00T N2模型预览**:基于DreamZero研究的下一代机器人基础模型,采用新的世界行动模型架构,帮助机器人在新环境中完成新任务的成功率是领先VLA模型的两倍以上 该模型目前在MolmoSpaces和RoboArena的通用机器人策略排名中位列第一[10] - **Cosmos 3模型**:首个统一合成世界生成、物理AI推理和行动模拟的世界基础模型,预计即将推出,将帮助物理AI在复杂环境中运行[18] - **Alpamayo 1.5模型**:一个推理VLA模型,通过导航引导、提示条件、灵活的多摄像头支持和可配置的摄像头参数,增强了自动驾驶汽车的推理能力[18] 医疗保健与生命科学AI模型 - **BioNeMo平台扩展**:作为一个开放的医疗保健和生命科学AI开发平台,使研究人员能够大规模建模、设计和模拟生物系统[19] - **Proteina-Complexa模型**:用于蛋白质结合剂设计的生成模型,加速基于结构的药物发现和治疗开发[16][19] - **AlphaFold数据库扩展**:公司与EMBL欧洲生物信息学研究所、Google DeepMind和首尔国立大学合作,大规模扩展了AlphaFold蛋白质结构数据库,计算了约3000万个蛋白质复合物预测,并向AlphaFold数据库新增了170万个高置信度预测,以加速新药物靶点和疾病生物学的发现[20] - **nvQSP模拟引擎**:一种GPU加速的模拟引擎,使药物研究人员能够在临床试验开始前在计算机模型中探索更多的治疗方案 基准测试显示,与传统的单线程CPU模拟相比,nvQSP性能提升高达77倍,使科学家能在以前仅能模拟几个场景的时间内,分析数百个剂量水平和患者亚群[21] 合作伙伴与客户应用案例 - **智能体AI应用**:包括Automation Anywhere、CodeRabbit、CrowdStrike、Cursor、Factory、Distyl、Genspark、Perplexity和ServiceNow在内的领先公司正在部署Nemotron模型以支持高级智能体应用[7] Edison Scientific将Nemotron作为Kosmos的核心组件,该自主AI科学家被超过50,000名研究人员使用,可并行执行数百项研究任务,将数月的研究压缩至一天[7] - **全球开发者应用**:全球AI开发者正在使用Nemotron模型的数据和框架构建主权模型,以母语服务数十亿人,并符合当地文化和价值观 这些开发者包括AI Singapore、Bielik.ai、Indosat Ooredoo Hutchison、LINAGORA、SOOFI、Stockmark、Trillion Labs、Viettel和YTL AI Labs[8] - **物理AI应用**:HCLTech、Johnson & Johnson MedTech、Milestone Systems、mimic robotics、Skild AI、Tulip和丰田研究所正在使用NVIDIA Cosmos加速物理AI训练和视频分析[11] Humanoid、LG Electronics、NEURA和Noble Machines正在采用NVIDIA Isaac GR00T N1.7来扩展人形机器人的部署[11] - **医疗AI应用**:Novo Nordisk、Viva Biotech和Manifold Bio正在使用Proteina-Complexa模型设计能与靶蛋白结合的蛋白质,并对生成的设计进行了实验测试[16][19] - **平台集成**:LangChain已将NVIDIA Nemotron模型和其他NVIDIA Agent Toolkit软件集成到其智能体开发平台中,使企业能够构建、部署和监控智能AI助手,以企业级规模自动化复杂任务[6] 产品发布与获取渠道 - 公司宣布了新的开源模型,包括Nemotron 3 Ultra、Omni和VoiceChat、Cosmos 3、Isaac GR00T N1.7、Alpamayo 1.5和Proteina Complexa,以推进智能体、物理和医疗AI[14][15] - 部分NVIDIA开源模型、数据和框架可在GitHub、Hugging Face、一系列云、推理和AI基础设施平台以及build.nvidia.com上获取[22] - 许多模型也作为NVIDIA NIM微服务提供,可在从边缘到云的任何NVIDIA加速基础设施上进行安全、可扩展的部署[22]
黄仁勋一句话,又掀起了一个热潮
投中网· 2026-01-11 15:12
文章核心观点 - 具身智能行业正从依赖“单一任务编程和真实数据”的低效阶段,迈入以“物理AI”为核心的通用化爆发期,其发展范式正升级为“数据×模型×本体” [4] - 行业竞争的核心已演变为一场围绕“持续获取高质量交互数据以驱动模型迭代”的基础设施之争 [3][5] - 高质量交互数据是机器人规模化落地的关键,行业正致力于通过仿真与真实数据结合等方式打破数据瓶颈 [9][20] 英伟达的入局与战略 - 英伟达CEO黄仁勋在CES上发布专为机器人打造的新一代具身智能基础模型NVIDIA Isaac GR00T及开发平台NVIDIA Cosmos,旨在为机器人通用化落地搭建核心技术底座 [7] - 英伟达通过物理仿真平台帮助机器人在虚拟环境中学习复杂交互(如演示机器人“瓦力”完成摔倒爬起动作),以缩小数字孪生与现实世界的差距,规模化构建具有物理可信度的训练场 [8] - 英伟达已与Apptronik、Agility Robotics、Figure、Boston Dynamics、Sanctuary AI等多家美国机器人公司合作,试图在具身智能领域再造一个类似CUDA的生态体系 [9][10] 中国玩家的差异化发展路径 - 与英伟达押注“高保真仿真+通用模型”不同,中国玩家更倾向于“真实场景驱动+垂直闭环”的务实路径 [12] - 智元机器人发布大语言模型驱动的开源仿真平台GenieSim3.0,涵盖200余项任务、上万小时仿真数据集,但强调真机数据的核心地位,仿真数据用于早期测试和工程迭代 [12] - 银河通用提出“三层级大模型系统”,采用合成数据与真实数据协同的研发路径,形成“仿真预训练→真实数据微调→模型优化”的闭环 [12] - 它石智航聚焦通过大规模人类行为视频数据拓展语义覆盖 [13] 数据采集方案与基础设施价值 - 鹿明机器人作为“具身智能数据四小龙”之一,选择“轻量化手持夹爪”方式进行数据采集,以解决真实世界灰尘、油污等仿真难以复现的问题 [14] - 传统遥操作数据采集存在高成本、低效率(一小时仅30-35条数据)、低适配(数据无法跨品牌互通)的困境 [14] - 鹿明自研FastUMI Pro系统,通过统一接口实现不同品牌机械臂数据的直接复用,使训练模型可跨场景(如从汽车焊装线微调至3C装配)快速适配,效率提升5倍,成本降至五分之一,精度达1-3mm [14] - 该方案的核心价值在于摆脱对特定硬件的依赖,打破数据孤岛,其目标是成为具身智能的“USB接口”,即行业基础设施,价值将取决于在其数据生态上运行和迭代的机器人数量,而非硬件销量 [15][16] 行业融资与市场前景 - 2025年具身智能成为国内最火融资赛道,年内融资事件达298笔,同比增长144%;融资总规模达329亿元,同比增长291% [17] - 产业资本成为活跃投资力量:京东一天内投资千寻智能、逐际动力、众擎机器人三家公司,并后续投资RoboScience和帕西尼,以构建生态并推动物流、仓储等场景应用 [17];宁德时代通过投资渗透产业链,提供动力解决方案 [17];美团自2020年起投资超10家机器人与具身智能公司,探索本地生活服务等场景 [18] - 2025年投资趋势向“投早投小”(种子、天使及A轮合计占74%)与“投强投优”(B轮及以后占15%)两端靠拢,投资人将“数据获取能力”和“场景落地验证”列为尽调核心指标 [19] - 市场前景广阔:2025年全球市场规模预计达63.39亿元,中国占比超50%;预计到2030年,全球人形机器人市场销量将接近34万台,市场规模有望突破640亿元 [19] 商业化落地与投资逻辑 - 行业玩家的胜率在于聚焦工业场景中客户付费意愿强、任务边界清晰、ROI可量化的领域,如3C电子、物流仓储、质量检测等 [15] - 鹿明机器人与三菱产线合作实现节拍压缩60%,证明了其技术已通过真实商业验证,提供了基础的胜率保障 [15] - 投资的赔率想象空间在于:一旦某家公司的数据采集方案被行业广泛采用,其价值将取决于生态内运行和迭代的机器人数量,而非硬件销量,即从卖硬件转向运营数据和生态 [15]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
具身智能之心· 2026-01-07 11:33
文章核心观点 - 英伟达在CES 2026上发布了一系列面向物理AI和Agentic AI的新产品与平台,标志着其战略重心从游戏显卡全面转向AI,并将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具)[1][2][6][9] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,其六大核心组件包括Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[14][15] - Rubin GPU在NVFP4数据格式下,推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6用于规模内扩展网络,单GPU互连带宽达3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,其与GPU的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出基于Spectrum-6芯片的共封装光学以太网交换机,用于机架扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU,构建推理上下文内存存储平台,旨在高效共享与复用键值缓存数据,提升系统响应与吞吐[32][34] - 每个Vera Rubin NVL72机架可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,Vera Rubin训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] - 用于构建该机架的六类芯片已全部从晶圆厂交付,预计2026年下半年启动规模化量产[38] 自动驾驶开源模型与生态 - 发布全新开源模型系列Alpamayo,面向安全推理的自动驾驶,其中Alpamayo 1是全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型,参数为100亿[39][41] - 模型接收车辆运动历史、多摄像头实时视频和用户指令,输出驾驶决策、因果推理结果和行驶轨迹[42] - 配套发布开源仿真框架AlpacaSim,以及一个包含1700小时驾驶数据的开源数据集,数据涵盖全球广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送更多自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖软件开发商、整车厂/出行平台、硬件供应商全产业链[47] AI智能体与多模态模型 - NVIDIA Nemotron模型家族推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,支持实时低延迟场景如实时字幕生成,速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型,能精准处理多语言、多模态数据以提升文档搜索效率[53] - Nemotron Safety系列模型专注于增强AI应用安全性与可信度,包括内容安全模型和检测敏感数据的PII模型[53] 物理AI与机器人平台 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2(视觉-语言推理模型)、Cosmos Transfer 2.5与Cosmos Predict 2.5(合成视频生成模型)[56][60] - 发布Isaac GR00T N1.6,一款专为类人机器人打造的开源视觉-语言-行动推理模型,支持全身控制并集成Cosmos Reason模型[61] - 发布NVIDIA AI Blueprint for Video Search and Summarization,提供参考工作流以构建能分析大量录播及直播视频的视觉AI智能体[61] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 医疗健康与生命科学AI - NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,旨在降低行业成本、加速治疗方案落地[62][63] - 该系列包含多款专项模型:La-Proteina(设计大型蛋白质)、ReaSyn v2(药物生产考虑)、KERMT(预测药物人体反应)、RNAPro(预测RNA 3D结构)[64][69] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[66] 开源与生态建设 - 宣布持续向社区开源训练框架以及多模态数据集,数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[5] - 演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen,体现了对全球开源生态的关注[11][12]