NVIDIA Announces Open Physical AI Data Factory Blueprint to Accelerate Robotics, Vision AI Agents and Autonomous Vehicle Development

文章核心观点 - 英伟达发布了一项名为“物理人工智能数据工厂蓝图”的开源参考架构,旨在统一并自动化大规模训练物理人工智能系统所需数据的生成、增强和评估过程,从而降低其成本、时间和复杂性 [1][13] 产品与服务 - 该蓝图使开发者能够利用英伟达Cosmos开放世界基础模型和领先的编码智能体,将有限的训练数据转化为大规模、多样化的数据集,包括那些在现实世界中难以获取的罕见边缘案例和长尾场景 [2] - 蓝图集成了英伟达OSMO开源编排框架,该框架可跨计算环境统一管理工作流,减少手动任务,使开发者能专注于模型构建 [5] - OSMO现已与Claude Code、OpenAI Codex和Cursor等领先编码智能体集成,实现由智能体主动管理资源、解决瓶颈并加速大规模模型交付的AI原生操作 [6] - 蓝图包含三大核心功能模块:1)整理与搜索:通过Cosmos Curator处理、提炼和标注大规模真实世界与合成数据集;2)增强与倍增:通过Cosmos Transfer指数级扩展和多样化已整理的数据,倍增真实和模拟输入以更好地捕捉不同环境和光照条件下的罕见及长尾场景;3)评估与验证:通过基于Cosmos Reason的Cosmos Evaluator自动评分、验证和过滤生成的数据,确保物理准确性和训练就绪度 [16] 合作伙伴与生态系统 - 英伟达正与微软Azure和Nebius合作,将这一开放蓝图与它们的云基础设施和服务集成,使开发者能够将加速计算能力转化为海量训练数据 [3] - 微软Azure正将物理人工智能数据工厂蓝图集成到一个开放的物理人工智能工具链中,并提供与Azure IoT Operations、Microsoft Fabric、Real-Time Intelligence、Microsoft Foundry和GitHub Copilot等服务的集成,以提供企业级、智能体驱动的工作流,用于快速、大规模地训练和验证物理人工智能系统 [8] - Nebius已将OSMO集成到其AI Cloud中,其基础设施融合了英伟达RTX PRO 6000 Blackwell服务器版GPU、超高速对象存储、原生数据管理与标注、无服务器执行和内置托管推理,为物理人工智能堆栈提供端到端的支持 [10] 应用与客户 - 领先的物理人工智能开发商FieldAI、Hexagon Robotics、Linker Vision、Milestone Systems、RoboForce、Skild AI、Teradyne Robotics和Uber正在使用该蓝图加速机器人、视觉AI智能体和自动驾驶汽车的开发 [3][15] - 英伟达自身正使用该蓝图训练和评估Alpamayo,这是世界上首个基于推理的、面向长尾自动驾驶场景的开放视觉语言动作模型 [4] - 早期用户Milestone Systems、Voxel51和RoboForce正在利用Nebius基础设施上的蓝图,加速视频分析AI智能体、自动驾驶汽车和工业人形机器人的模型开发 [11] - FieldAI、Hexagon Robotics、Linker Vision和Teradyne Robotics是首批测试Azure物理人工智能工具链以加速和扩展其感知、移动和强化学习流程中数据生成、增强和评估的公司 [9] 行业趋势与战略 - 物理人工智能被视为人工智能革命的下一前沿,其成功取决于生成海量数据的能力,公司高管提出“计算即数据”的新时代理念 [4] - 物理人工智能遵循扩展定律:随着数据、计算和模型能力的增长,其性能会得到提升 [4] - 云服务提供商在提供加速人工智能基础设施、机器学习运营和编排服务方面扮演关键角色,使开发者能够大规模构建和部署物理人工智能 [7] - 该蓝图预计将于四月在GitHub上提供 [11]

Nvidia-NVIDIA Announces Open Physical AI Data Factory Blueprint to Accelerate Robotics, Vision AI Agents and Autonomous Vehicle Development - Reportify