具身智能行业发展现状 - 2023年世界人工智能大会(WAIC)上具身智能成为焦点 参展公司数量多且产品形态多样 其中宇树科技的铁甲拳王机器人展示出敏捷动作和强稳定性 [1] - 移动操作类机器人应用场景丰富 涵盖服务机器人和工业机器人 但在人工干涉情况下(如关门或物品移动)仍存在认知困难 鲁棒性有待提升 [3] - 灵巧手技术取得进展 灵心巧手和傲意科技等公司产品出货情况良好 触觉和力控方案已成为行业标配 [7] - 自主决策技术尚不成熟 现场多数人形机器人仍依赖遥控操作 从指令到自主导航/决策的稳定性不足 医疗领域产品功能仍较简单 替代护工还需时日 [8] 技术发展趋势 - 行业从demo展示转向产业闭环 功能模块逐步融合 形成以大模型为核心的统一技术范式 [8] - 多家公司推进全栈进程 涵盖数据采集、策略制定到系统部署 加速商业化落地 [8] - 视觉-语言-动作(VLA)模型取得突破 SafeVLA成为首个安全架构 BridgeVLA实现32%真机性能提升 [11] - 3D视觉定位技术TSP3D效率显著提升 多传感器融合框架RDP整合视触/力觉模仿学习 [12] - 具身4D世界模型EnerVerse和空间智能方案推动可泛化发展 [12] - 强化学习框架Reason-RFT面向具身推理 双臂机器人扩散大模型规模全球领先 [14] 行业生态建设 - 具身智能之心社区汇聚近200家企业和机构 包括斯坦福、清华等高校和优必选、小米等企业 [21] - 建立40+开源项目库 60+数据集 覆盖感知、交互、强化学习等30+技术路线 [21][22] - 汇总国内外40+高校实验室和机器人公司 涉及教育、医疗、工业等多领域 [25][27] - 整理行业研报、技术书籍、零部件品牌等10大类资源 包括30家头部企业分析 [29][32][34] - 构建仿真平台矩阵 涵盖通用场景和真实场景仿真工具 [42] - 建立岗位内推机制 连接企业招聘需求与人才资源 [13][19] 技术创新方向 - 感知技术:发展3D视觉定位、触觉感知、视觉语言导航等方向 形成完整学习路线 [46][50][52] - 交互技术:整合抓取检测、视觉语言模型、具身问答等模块 [48] - 多模态融合:推进图像/视频/音频/3D数据与文本的相互理解和生成 [54][56] - 模型优化:聚焦大模型微调、量化推理和轻量化部署 [58][65] - 硬件集成:完善双足/四足机器人、移动机械臂等系统设计方案 [70][72] - Sim2Real技术:开发视觉导航与运动控制的真实-仿真统一框架 [14][66]
从今年的WAIC25看具身智能的发展方向!
具身智能之心·2025-07-28 15:14