Workflow
智元机器人发布并开源世界模型EVAC与评测基准EWMBench,助力具身世界模型加速进化!
AI科技大本营·2025-05-22 10:47

核心观点 - 智元机器人发布全球首个基于机器人动作序列驱动的具身世界模型EVAC和具身世界模型评测基准EWMBench,构建"低成本模拟-标准化评测-高效迭代"的全新开发范式[1] - 两项成果全面开源,旨在解决行业面临的测试成本高、数据利用效率低等瓶颈问题,加速具身智能技术落地与产业发展[1][3] 行业瓶颈与解决方案 - 当前具身智能面临两大制约:真机验证代价高风险大,仿真系统存在虚实偏差;海量真机数据缺乏高效利用机制[3] - EVAC通过动作序列驱动实现从传统仿真到生成式模拟的跃迁,EWMBench填补行业评测标准空白,形成技术闭环[3][11] EVAC技术突破 - 实现"物理动作-视觉动态"端到端生成,创新多级动作条件注入机制[7] - 核心能力包括物理执行到像素空间的精准映射,支持动态复现机器人与环境复杂交互[5][7] EVAC双重价值 - 生成式仿真评测:与策略模型交替推理,评测结果与真机成功率高度一致,筛选效率大幅提升[9] - 数据增广引擎:基于少量专家轨迹数据实现大规模增广,策略模型任务成功率提升29%[10] EWMBench评测基准 - 全球首个具身世界模型评测标准,包含三维度评估体系:场景一致性、动作合理性、语义对齐与多样性[15] - 采用权威数据集AgiBot World,涵盖10类机器人操作任务和300+测试样本,含30%挑战性场景[20] 技术协同效应 - EnerVerse架构为EVAC提供基础框架,EVAC生成数据反哺EnerVerse优化,形成"训练-验证"闭环[18] - 组合方案入选IROS 2025官方基线系统,提供全球研究者实践验证平台[19] 开源与行业影响 - 同步开源全流程评测工具,支持一键生成标准化报告,降低评估门槛[20] - 推动具身智能进入"算法-评测"协同进化时代,引领技术向高效普适方向发展[21]