英伟达发布物理AI新基础设施与模型 - 公司宣布了新的基础设施和AI模型 旨在构建物理AI的骨干技术 物理AI包括能够感知并与现实世界交互的机器人和自动驾驶汽车 [1] - 这些发布表明公司正全力推进物理AI 将其作为其先进AI GPU的新增长途径 [7] 自动驾驶视觉语言动作模型Alpamayo-R1 - 公司在NeurIPS AI会议上发布了Alpamayo-R1 这是一个用于自动驾驶研究的开放式推理视觉语言模型 [2] - 公司声称这是首个专注于自动驾驶的视觉语言动作模型 视觉语言模型可以同时处理文本和图像 使车辆能够“看见”周围环境并根据感知做出决策 [2] - 该模型基于公司的Cosmos Reason模型构建 Cosmos Reason是一种在响应前会进行决策推理的模型 [3] - 公司表示 像Alpamayo-R1这样的技术对于寻求实现L4级自动驾驶的公司至关重要 L4级意味着在限定区域和特定条件下实现完全自动驾驶 [3] - 公司希望此类推理模型能为自动驾驶汽车赋予“常识” 使其能像人类一样更好地处理微妙的驾驶决策 [4] - 该新模型已在GitHub和Hugging Face平台上发布 [4] 开发者资源与工具更新 - 公司同步上传了新的分步指南、推理资源和训练后工作流程至GitHub 统称为Cosmos Cookbook 以帮助开发者更好地为其特定用例使用和训练Cosmos模型 [5] - 该指南涵盖了数据整理、合成数据生成和模型评估等内容 [5] 公司战略方向与高层观点 - 公司联合创始人兼首席执行官黄仁勋多次表示 AI的下一波浪潮是物理AI [7] - 公司首席科学家Bill Dally在夏季与TechCrunch的对话中呼应了这一观点 强调了机器人领域的物理AI [7] - Bill Dally表示 公司认为机器人最终将成为世界的重要组成部分 并希望成为所有机器人的“大脑”制造商 为此需要开始开发关键技术 [8]
Nvidia announces new open AI models and tools for autonomous driving research