Workflow
物理AI解答“把大象放进冰箱需要几步?”
英伟达英伟达(US:NVDA) 36氪·2025-10-27 18:14

文章核心观点 - 英伟达通过其Omniverse、Cosmos、DGX和AGX等技术平台,构建了一个从虚拟仿真、模型推理训练到现实部署的完整物理AI技术闭环,旨在打破信息世界与物理世界的边界,为复杂工程任务的解决提供新路径 [1][12][13] 虚拟仿真平台技术 - 英伟达Omniverse是一个基于OpenUSD标准的实时协作与仿真平台,能对物理世界进行毫米级复刻,其物理引擎可精准计算物体的物理属性,如大象的体重、肌肉运动惯性以及冰箱门体开合的铰链力学等 [2] - Omniverse支持多工具协同与实时渲染,设计师可在Maya、Blender等工具中工作,修改实时同步至平台,避免了文件格式不兼容和版本混乱问题,大幅提升虚拟场景搭建效率 [3] - NVIDIA Cosmos作为生成式世界基础模型平台,可通过文本或图像输入自动生成符合物理规律的虚拟场景,例如输入“一只成年非洲象、一台高2.5米的双开门冰箱”即可生成场景,大幅降低了物理AI的开发门槛 [3][4] 模型推理与训练能力 - Cosmos Reason是一款70亿参数的推理视觉语言模型,专为物理AI设计,具备物理理解、先验知识与常识推理能力,能将复杂任务分解为可执行的动作脚本 [5][6] - 该模型能处理突发情况,例如当虚拟场景中出现“冰箱门卡住”时,Cosmos Reason会先检测卡顿位置再调整开门角度,而非重复发力,这基于其机械故障处理的先验知识 [7] - 训练物理AI需要海量虚拟场景数据,英伟达DGX系统凭借超强算力能快速迭代Cosmos Reason模型,并通过强化学习让机器人在失败场景中调整策略,提升鲁棒性 [9] 现实部署与技术闭环 - 训练好的模型通过英伟达Jetson AGX系列边缘计算平台部署到现实机器人上,该平台能实时接收传感器数据,并在0.1秒内规划出移动路径,确保机器人动作不延迟 [10] - Omniverse+Cosmos作为仿真与合成数据生成平台,能模拟上千种极端场景以获取大量训练数据,解决了现实世界测试成本高、危险且难以规模化的问题 [11][12] - 物理AI技术将计算的影响力从5万亿美元的信息产业拓展至100万亿美元的物理世界市场,并正渗透到工业、物流、医疗等千行百业 [12][13]