Workflow
机器人学习
icon
搜索文档
机器人顶会RSS 2025奖项公布!大牛Pieter Abbeel领衔研究获杰出Demo奖
机器之心· 2025-06-25 14:50
RSS 2024获奖论文概览 杰出Demo论文奖 - 提出MuJoCo Playground开源机器人学习框架,支持单GPU分钟级策略训练,简化仿真环境搭建到现实迁移全流程[5] - 框架兼容四足机器人、人形机器人、灵巧手及机械臂等多平台,支持零样本迁移[6] - 技术栈集成物理引擎、批量渲染器与训练环境,由UC伯克利、Google DeepMind等机构联合开发[7][8] 杰出系统论文奖 - 开发SBA公式与XM优化引擎,通过凸半有限规划松弛实现三维重建全局最优解,速度显著提升[13] - XM引擎1小时内处理10,155帧数据达到全局最小值,重建质量优于现有SfM流程[15] - 哈佛大学团队成果,应用于运动结构重建领域[17] 杰出学生论文奖 - 提出Def-MARL算法解决多机器人系统协作安全问题,定义"零约束违反"标准[19][20] - 在8项模拟任务中性能最优,并通过四旋翼飞行器实体实验验证安全性[22] - MIT团队采用集中训练-分散执行架构,提升复杂任务协调能力[24] 杰出论文奖 - 开发FEAST进餐辅助系统,模块化设计支持进食、饮水、擦嘴功能切换[31] - 结合网页界面、头部姿势识别等多模态交互,适应残障用户个性化需求[31] - 康奈尔大学团队成果,参数化行为树架构支持LLM驱动的安全调整[29][32] 时间检验奖 - 2009年论文《Cooperative Manipulation with Aerial Robots》获奖,开创空中机器人协作运输研究[36] - 论文由宾夕法尼亚大学团队发表,奠定多无人机协同操作理论基础[39]
10%训练数据超越100%表现,机器人学习领域迎来重要突破
机器之心· 2025-06-11 11:54
研究团队与背景 - 第一作者陈昌和是美国密歇根大学研究生,研究方向为基础模型、机器人学习与具身人工智能,专注于机器人操控、物理交互与控制优化[1] - 第二作者徐晓豪是密歇根大学机器人学院博士生,研究涵盖3D感知、视觉语言模型驱动的多模态异常检测及鲁棒三维重建[2] - 共同第一作者Quantao Yang是瑞典皇家理工学院博士后,研究聚焦于利用视觉语言模型与大型语言模型提升自主系统在动态环境中的感知与导航能力[3] ViSA-Flow框架创新 - 提出革命性的机器人技能学习方法ViSA-Flow,能够从大规模人类视频中提取语义动作流,显著提升数据稀缺情况下的学习效率[4] - 在CALVIN基准测试中表现卓越,仅使用10%训练数据就超越使用100%数据的现有最佳方法[4] - 引入语义动作流作为中间表示,捕捉操作器-物体交互的本质时空特征,不受表面视觉差异影响[10] - 包含三个关键组件:语义实体定位、手-物体交互跟踪、流条件特征编码[11][12][13] 技术实现与评估 - 采用两阶段学习框架:预训练阶段学习ViSA-Flow动态先验,微调阶段进行策略适应[16] - 在CALVIN基准测试中,ViSA-Flow仅使用10%数据(1,768个)就超越所有基线方法,包括使用100%数据的方法[18][19] - 在5个连续任务完成方面达到31.4%成功率,是使用10%数据的次佳方法GR-MG(16.2%)的近两倍,甚至超过使用100%数据训练的SuSIE(26.0%)[19] - 平均序列长度达到2.96,证明其在处理长时程操作任务方面的有效性[20] 技术优势与局限性 - 技术优势包括数据效率高、跨域泛化能力强、长时程稳定性好、语义一致性佳[40] - 当前局限性包括缺乏显式3D几何和接触动力学建模、依赖预训练VLM组件、在精细物理交互任务中可能存在限制[40] - 未来发展方向包括增强物理建模、减少对预训练组件的依赖、与强化学习算法结合、扩展到网络规模视频语料库进行预训练[40] 研究意义与展望 - 为机器人学习领域带来重要突破,证明从大规模人类视频中提取语义表示进行机器人技能学习的可行性[36] - 成功桥接人类演示视频观察与机器人执行之间的差距,为构建更智能、高效的机器人学习系统开辟新方向[37] - 有望在工业自动化、家庭服务机器人、医疗辅助等多个领域发挥重要作用,推动机器人技术向更加智能化和普适化方向发展[38]
马斯克:Optimus人形机器人2027年将在火星表面行走;阿里云发布通义灵码AI IDE,可调用3000多款工具丨AIGC日报
创业邦· 2025-05-31 08:57
人形机器人 - 马斯克表示SpaceX将于2024年底发射携带特斯拉Optimus人形机器人的星舰前往火星,预计2027年抵达并在火星表面行走,后续可能尝试送人类前往火星 [1] - Figure公司进行史上最大规模重组,将三个独立团队并入AI团队"Helix",以加速机器人学习和市场扩展,公司定位为AI公司 [3] AI开发工具 - 阿里云发布首个AI原生开发环境工具通义灵码AI IDE,支持千问3开源模型,代码能力达业界领先水平,支持MCP协议涵盖3000多个服务 [2] - 通义灵码AI IDE提供长期记忆、行间建议预测、行间会话等能力,插件下载量已超1500万,一汽集团、蔚来汽车等上万家企业已接入 [2] 超级计算机 - 美国能源部与戴尔签订合同,由英伟达芯片驱动开发下一代旗舰超级计算机,命名为"道德纳",预计2026年投入使用 [4] - 新超算将安置在劳伦斯伯克利国家实验室,用于国家能源研究科学计算中心 [4]
人形机器产业链调研汇报:关节技术的演进
2025-05-25 23:31
纪要涉及的行业和公司 - **行业**:人形机器人行业 - **公司**:特斯拉、飞鸽AI、宇树智源、优必选、众情科技、天宫机器人、h公司、小米、小鹏、赛力斯、日发精机、秦川机床、龙溪轴承、国际工控、长盛轴承、恒立液压、振德科技、双林股份、浙江荣泰、绿谐波、双环传动、风力智能、中大力德、蓝黛传动、蓝思科技、杭能、小型科技、中电科技 [1][6][7][14][15][19] 纪要提到的核心观点和论据 - **特斯拉人形机器人进展**:战略地位凸显超电动汽车业务,计划年内量产5000台以上,已下达两三千台核心零部件订单未来两三月交付;产业链上周小范围上涨,马斯克回归后研发推进节奏加快,官方发布机器人视频解锁复杂家务操作 [1][2][4] - **应用场景拓展**:产品从B端向C端拓展,初期用于工厂汽车制造替代人力,未来进入家庭服务、医疗护理等消费级市场消化产量,量产推进成本降低形成正向推动 [1][5] - **关键模组重要性**:是实现精细手部控制、视觉传感和算法决策的关键,决定机器人操作精度和适应交互能力,集成驱动等功能实现精准运动控制 [8][9] - **关节模组指标及类型**:重要指标有扭矩密度、响应速度、能效比和精度;旋转关节用于手腕和膝关节等,有高减速比和准直驱方案;直线关节采用无框力电机加反向式行星滚柱丝杠,制造难度大 [10][11][13] - **国内外差异及潜力领域**:国内关键模组制造在高端设备和材料上与海外有差距,但新型材料和国产设备改进有望缩小差距;各种类型轴承是较大增量领域,新型材料发展有潜力 [3][14][15] - **关节模组发展趋势**:准直组件应用增多、磁性齿轮传动,轻量化材料和3D打印技术应用降低成本,向智能仿生单元蜕变 [3][16][17] - **加工技术创新**:执行器领域采用以车代磨方案提高效率,企业采购磨削和车加磨设备,国内准备推车加磨一体机提高精度 [18] 其他重要但可能被忽略的内容 - 下半年第三、四季度可能有新公司进入特斯拉供应链,份额或有变化,并非所有企业都能切入产业链,需有技术实力和量产能力 [4] - 海外飞鸽AI的FIGO03已在宝马X3生产线连续完成20小时轮班,国内宇树智源等企业按部就班进行工厂实训或工作,下半年国内车企布局加快人形机器人B端应用 [6][7] - 推荐饲料领域恒立液压等公司,减速器领域绿谐波等公司,代工及其他领域蓝黛传动等公司 [19]