Workflow
视觉 - 语言 - 行动(VLA)
icon
搜索文档
全球首个自动驾驶VLA综述重磅发布:VLA自驾模型全面拆解(麦吉尔&清华等)
自动驾驶之心· 2025-07-02 21:54
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 今天自动驾驶之心为大家分享 麦吉尔大学、清华大学、小米公司 和威斯康辛麦迪 逊的研究团队 最新的工作! 面向自动驾驶的视觉-语言-动作模型综述! 如果您有 相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一 步咨询 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Sicong Jiang等 编辑 | 自动驾驶之心 "自动驾驶未来已来?" 当视觉(Vision)、语言(Language)和行动(Action)三大能力在一个模型中融合,自动驾驶的未来将走 向何方? 近日,来自麦吉尔大学、清华大学、小米公司和威斯康辛麦迪逊的研究团队联合发布了全球首篇针对自动 驾驶领域的视觉-语言-行动(Vision-Language-Action, VLA)模型的全面综述。这篇题为《A Survey on Vision-Language-Action Models for Autonomous Driving 》 的 论 文 , 系 统 性 地 ...
速递|2025年Figure将人形机器人用于家庭场景,进行“alpha 测试”
Z Potentials· 2025-02-28 14:37
人形机器人行业发展 - Figure计划2025年晚些时候在家居环境中对Figure 02机器人进行alpha测试 时间表比预期提前[1] - 加速时间表得益于公司开发的通用型视觉-语言-行动模型Helix 该模型能处理视觉数据和自然语言输入以加速系统学习[1] - 公司终止了与OpenAI的合作 转而采用自有AI模型如Helix[2] - 实验室测试场景已展示机器人执行食物准备等家务任务 Helix设计用于协调多台机器人协同工作[2] 市场应用策略 - 公司优先考虑工业部署 2024年初已在宝马工厂试点人形系统 工厂环境比家庭更结构化和安全[3] - 工业客户如汽车制造商更愿意为测试投入资金[3] - 除Figure外 Apptronik和特斯拉等公司也表达了对家庭应用的兴趣[3] - 挪威初创公司1X是少数将家庭场景作为优先考虑的企业[3] 家庭应用挑战 - 家庭环境存在诸多挑战 包括杂乱物品 不均匀照明 多样地面材质 楼梯 以及宠物和儿童活动[3] - 定价问题也是家庭应用面临的主要障碍[3] - 2025年家用计划仍处于早期阶段 alpha测试将在今年剩余时间持续进行[4] 技术发展 - Helix模型专门设计用于协调两台机器人协同完成单一任务[2] - 公司展示了机器人执行包括食物准备在内的各种家务任务[2]