Wan 2.2扩散Transformer(DiT)模型
搜索文档
远超基线模型!X-Humanoid:推动机器人从 “真实数据” 向 “虚拟合成 + 互联网数据” 转型
具身智能之心· 2025-12-08 09:11
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Pei Yang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在 embodied AI 领域,视觉 - 语言 - 动作(VLA)模型与世界模型的发展虽展现出通用自主能力的巨大潜力,却始终受限于核心瓶颈——大规模、多样化机器人训 练数据的稀缺。现有解决方案要么依赖成本高昂的真实机器人数据采集,要么通过简单叠加机器人部件编辑第一视角人类视频,均无法应对第三人称视频中的全身 复杂动作、动态背景与严重遮挡问题。 新加坡国立大学 Show Lab 提出的 X-Humanoid 框架 ,以 "数据合成 - 模型适配 - 大规模生成" 为核心逻辑,首次实现第三人称人类视频到类人机器人视频的高质量 转化,为机器人训练提供了全新的数据生成范式。 论文题目:X-Humanoid: Robotize Human Videos to Generate Humanoid Videos at Scale 项 ...