Robotics

搜索文档
公布最新研究!这次1XWorldModel如何颠覆人形机器人领域?
机器人大讲堂· 2025-06-29 11:53
1X World Model技术突破 - 1X Technologies发布全球首个人形机器人世界模型1X World Model,该模型基于视频生成技术(Sora)和自动驾驶世界模型(E2EAD)构建,能通过输入图像状态与动作指令模拟未来场景,解决具身机器人评估难题[1][2] - 模型在动作可控性方面取得突破,能根据不同动作命令生成多样化结果,精准模拟物体间交互如抓取箱子、保持其他箱子静止等效果[3][5] - 与主流文本转视频模型不同,1X World Model需由精确机器人轨迹控制,能精准模拟执行精确动作的后果,如开门、擦拭台面等复杂操作[7][8] - 模型预测与现实执行结果对比验证表现出色,能准确复现开门动态过程,严格遵循指令轨迹完成空抓动作,具有可靠评估不同策略执行质量差异的能力[10] 模型表现评估方法 - 传统基于物理的模拟器(如Bullet、Mujoco等)难以精准模拟现实复杂交互,需大量手工建模且仿真精度有限[14] - 1X World Model通过采集超3000小时真实操作数据,利用多模态数据融合技术,直接从海量真实传感器数据中学习世界动态,准确预测未来场景演变[16] - 模型能准确预测未来状态和任务成功率,预测结果与现实表现保持高度一致统计分布特性,为模型架构优化和检查点选择提供数据支撑[18] - 实证表明在1X World Model评估中表现突出的检查点实际评估中通常更优,当两个检查点存在15%的真实成功率差距时,具备70%对齐度的世界模型能以90%准确率预测更优策略[20] 扩展定律验证与多任务迁移 - 研究表明1X World Model策略评估准确性随数据规模提升而改善,在Airfryer、Arcade和Shelf三个任务上验证了数据规模的影响[25] - 定量分析显示随着数据量增加,模型预测准确率持续提升,例如增加交互数据后能准确建模托盘分离运动及底座限制等细微物理交互[32] - 多任务迁移实验表明,在仅有2.16亿token的Shelf数据上模型对齐度为63.06%,结合14.6亿token的Arcade数据后提升至71.17%,验证了通过任务经验积累实现泛化的可行性[35] - 机器人自主策略rollout数据(特别是失败案例)对提升对齐度至关重要,缺乏失败数据会使模型过度乐观,出现错误估计抓取半径等问题[38] 行业影响与未来展望 - 1X World Model解决了机器人领域高质量数据稀缺问题,提供了精准评估任务表现的统一框架,使通用智能机器人发展迈入新阶段[41] - 模型进展可能让机器人技术经历类似"GPT时刻",加速家庭服务机器人商业化落地,并重塑整个AI产业竞争格局[42] - 随着训练算力提升和真实世界数据积累,模型预测准确率持续攀升,预示着机器人技术可能即将迎来关键的"数据奇点"[41]
IJRR发表!浙大控制学院熊蓉团队提出驱动器空间最优控制框架,改善连续体机器人路径跟踪精度!
机器人大讲堂· 2025-06-29 11:53
连续体机器人路径跟踪技术突破 - 连续体机器人凭借高柔顺性、灵活运动能力及轻量化结构,在医疗、工业检测等领域展现应用潜力,但精准路径跟踪仍是关键技术难题[1] - 主流路径跟踪方法依赖逆运动学求解,但连续体机器人采用分段等曲率模型,缺乏逆运动学求解理论,传统数值方法依赖初值且难找多解[1] - 模型预测控制(MPC)通过在线优化调整策略,但无法保证全局最优性[1] 浙江大学创新研究框架 - 研究团队提出驱动器空间最优路径跟踪框架,基于四元数理论建立分段常曲率运动学紧凑参数化模型[6] - 通过数学推导提出降维解析条件,将三段式逆运动学问题转化为等效一维问题,构建高效逆运动学求解器,计算效率提升3.2倍,成功率提高28%[6][7] - 建立配置空间与执行器空间的线性驱动模型,实现距离最优规划和时间最优分配,路径跟踪精度相比反馈控制提升42%[7] 四元数理论应用创新 - 引入四元数工具简化三维空间旋转描述,单段机器人末端位置方向信息仅需四元数三个元素描述[12][14] - 多段机器人通过为每段分配四元数,精确计算整体末端位置方向,实现复杂形变分析[16] - 基于四元数推导出两段机器人线性方程约束条件,将逆运动学问题简化为寻找满足方程的四元数[17] 逆运动学求解器设计 - 通过理论推导降维处理原问题,证明降维前后等价性,采用近似估计简化低维问题[20] - 对低维近似问题解空间全局搜索遍历,通过少量迭代修正消除误差,获取多解[20] - 求解器平均求解时间缩短80%,具备分辨率完备优势,在含障碍物复杂环境中表现优异[21] 轨迹规划与跟踪控制 - 构建状态与驱动量双向线性映射模型,运用动态规划搜索最短执行距离路径[24] - 采用抛物线混合线性多项式插值,实现包含加速、匀速、减速三阶段的时间最优梯形轨迹[26] - 融合离线最优轨迹规划和在线前馈-反馈控制,前馈控制预知动作,反馈控制实时纠偏[31] 三段式肌腱驱动样机验证 - 样机由三段镍钛合金骨架构成,九根独立控制不锈钢丝绳驱动,OptiTrack系统实时捕捉位置姿态[33] - 逆运动学求解器在含障碍物空间快速找到无碰撞解,避免陷入局部极小值[36] - 跟踪复杂IJRR形路径时平均位置和方向误差显著降低,较传统反馈控制器误差减少50%-80%[42][44]
IJRR发表!中山大学研究团队提出Koopman-ILC系统,实现对连续体机器人数据驱动建模与迭代学习控制!
机器人大讲堂· 2025-06-29 11:53
目前 已有的基于 Koopman算子的方法难以补偿不确定性和干扰,导致训练与现实之间的差距,从而造成性 能不佳。由于连续机器人天生的易受干扰性,这一差距很容易在实际场景中削弱其任务空间性能。 连续机器人控制中的鲁棒性与泛化能力 同时, 机器人可能需要在训练过程中未覆盖的区域进行操作,而且连续机器人的结构多样性进一步增加了控 制的复杂性。此外,现有基于 Koopman算子的控制方法的收敛性和鲁棒性尚未从理论或实验角度得到验证。 因此, 开发一种具有显著增强的鲁棒性、高计算效率、强泛化能力和严谨理论分析的数据驱动控制算法,对 于连续机器人而言至关重要 。 连续体机器人在近几十年受到了越来越多的关注。它们的柔顺性和灵活性使其在医疗、工业、农业和航空航天 等诸多领域具有重要应用价值。充分发挥其能力需要设计有效、高效且可靠的控制系统,而由于其结构复杂 性,这一任务仍然具有很大的挑战。 传统的连续体机器人控制方法通常依赖于对机器人物理模型的精确建模。然而,由于其柔性结构和不规则形 态,连续体机器人的建模极其困难,且容易受到环境影响,导致模型难以准确反映机器人的实际动态行为。因 此,研究人员转向了数据驱动的控制方法,尤其是 ...
又一家融到D轮的明星机器人要IPO了
投中网· 2025-06-29 11:07
机器人行业IPO动态 - 2025年以来多家机器人公司冲刺港交所IPO,包括斯坦德机器人、卧安机器人、仙工智能、乐动机器人、云迹科技及极智嘉等[4][5][25][27] - 斯坦德机器人2025年6月递交招股书,按销量计为全球第五大工业智能移动机器人解决方案提供商(2024年数据)[4] - 行业上市潮源于企业寻求"对的时间点"抢占资本市场机会,创业者称"都想成为上市公司"[6] 斯坦德机器人公司概况 - 成立于2016年,创始人王永锟为哈工大硕士,曾获ROBOCON机器人竞赛亚军,受李泽湘启发创业[11][12] - 核心技术为SLAM导航技术,定位精度达±2毫米,动态场景保持±5毫米精度,应用于3C电子、汽车零部件等行业[13][14][15] - 客户包括华为、富士康、中兴等头部企业,机器人产品可提升客户生产效率并降低成本[15] 18C特专科技上市路径 - 斯坦德选择18C特专科技上市通道,该板块面向五大高科技领域未盈利高增长企业[7][8] - 需满足"2-5名资深投资者12个月前投资"要求,公司获小米智造等3家机构投资(合计持股29.95%)[22][23][24] - 此前晶泰科技(首日涨10%)、越疆机器人(市值超200亿港元)已通过该板块上市[9][10] 融资与估值发展 - 天使轮估值2000万元(2016年),2024年D轮后估值达21亿元[19][23] - 融资历程:Pre-A轮8024万元→A轮1.5亿元→B轮3.5亿元→C轮小米智造领投1.5亿元→D轮3亿元[20][21] - 创始人王永锟直接持股12.8%,通过激励平台控制35.46%投票权[24] 行业商业化进展 - 斯坦德营收从2022年0.963亿元增至2024年2.505亿元,年复合增长率61.3%[30] - 头部人形机器人公司计划2025年量产400台(200台进工厂、200台进商超)[29] - 乐聚机器人预测人形机器人市场规模达10-20万台,多家企业订单饱和[28] 资本市场热度 - 2025年6月银河通用获11亿元融资,投资方含宁德时代、腾讯等[30] - 宇树科技C轮获中移动、阿里等投资,显示资本持续加注赛道[31] - 港股流动性改善为机器人公司IPO创造有利环境[31]
“小块头”大能量中小企业秀创新
四川日报· 2025-06-29 04:55
四川中小企业创新成果 - 四川50家中小企业携"明星产品"和"高精尖"技术亮相第二十届中国国际中小企业博览会 [3] - 四川已培育10810户创新型中小企业、4521户专精特新中小企业、486户国家级专精特新"小巨人"企业 [3] - 国家级专精特新"小巨人"企业数量居全国第10位 [3] - 培育国家级中小企业特色产业集群15个,总产值超3771亿元 [3] - 省级中小企业特色产业集群43个,总产值超4488亿元 [3] 智能眼镜技术 - 四川影目科技展示自主研发的AI眼镜和AR眼镜 [3] - AI眼镜搭载DeepSeek、豆包等国产大模型,支持40种语言实时翻译 [3] - AR眼镜可将操作系统投影至镜片,通过戒指实现拍照、聊天、看剧等功能 [3] 脑机接口医疗设备 - 成都芯脑科技展示无线干电极脑功能评估与孤独症辅助诊断仪 [3] - 设备5分钟内可分析脑电信号判断孤独症风险,准确率超90% [3] - 公司是四川省脑机接口与人机交互装备链主企业 [3] - 公司承接"中国脑计划"国家2035重大项目 [3] 机器人技术展示 - 深圳安诺机器人展示AI机器人冰淇淋亭,50秒内完成点单制作 [3] - 迷你格斗机器人采用体感操控技术,动作同步延迟达毫秒级 [3] - 福建华隆机械展示七轴机器人,专为3D石雕工艺设计 [3][4] 虚拟现实技术 - 深圳位形空间科技展示《丝绸幻旅》沉浸式VR体验项目 [4] - 项目采用5G+VR技术实现虚拟世界交互体验 [4] - 公司在全国开设40多家门店,包括成都 [4] - 元宇宙主题项目吸引大量观众排队体验 [4]
2025年,找工作有些迷茫。。。
自动驾驶之心· 2025-06-28 21:34
行业发展趋势 - 自动驾驶和具身智能成为AI技术发展的主线 支撑了近一半的技术路线和融资金额 [2] - L2~L4自动驾驶功能逐步实现量产 人形机器人和四足机械狗等具身智能产品完成复杂动作演示 [2] 求职社区概况 - AutoRobo知识星球定位为自动驾驶、具身智能、机器人方向的求职交流平台 成员规模近1000人 [2] - 社区成员覆盖地平线、理想汽车、华为、小米汽车等头部企业社招人员及2024-2025届校招生 [2] 核心服务内容 求职资源 - 提供面试题库、面经、行业研报、谈薪技巧、内推机会及简历优化服务 [3] - 实时更新算法、开发、产品等岗位的校招/社招/实习信息 [4] 专业知识库 自动驾驶领域 - 包含毫米波视觉融合、3D/4D雷达量产、车道线检测、规划控制、BEV感知等10个专项题库 [7] - 覆盖传感器标定、多模态目标检测、CUDA部署等关键技术节点 [7] 具身智能领域 - 提供轨迹预测、Occupancy感知、端到端自动驾驶等前沿技术题库 [11] - 包含视觉语言导航、Diffusion Policy等交叉学科内容 [11] 行业洞察 - 汇总世界机器人报告、中国人形机器人蓝皮书等深度研报 [15] - 分析技术路线、市场机遇、产业链上下游等关键要素 [12][15] 实战经验沉淀 - 收录滴滴、英伟达、美团等20+企业真实面经 涵盖算法岗、SLAM、产品经理等职位 [16] - 整理面试各环节经验 包括代码题、项目答辩、HR面等全流程复盘 [16][19] 附加价值 - 提供机器人/自动驾驶/AI领域专业书籍推荐 [17] - 分享转行心得、面试官视角建议等非技术类指导 [19]
爆火的人形机器人,离“实用”还要多久?
钛媒体APP· 2025-06-28 18:09
人形机器人行业现状 - 京东618全周期战报显示,2025年5月13日至6月18日,智能机器人自营销售额同比增长3倍,具身智能机器人销售额同比增长17倍 [1] - 宇树科技、乐聚机器人等企业订单激增,乐聚一季度订单量增长200%,松延动力半马赛后订单突破2500台 [2] - 2025年全球人形机器人投资金额达186.51亿元,国内达61.06亿元,均超过2024年全年水平 [3] - 国内人形机器人行业2025年至少发生27起融资事件,融资轮次集中在B轮之前 [3] 市场需求驱动因素 - 人形机器人价格持续下探,松延动力N2双足机器人售价低至3.99万元起,大幅降低采购门槛 [7] - 政策支持力度加大,政府工作报告首次提及"具身智能"和"智能机器人",多地出台专项计划推动场景落地 [8] - 市场前景广阔,预计2035年中国人形机器人市场规模达3000亿元,年复合增长率62.6% [8] - 华为、字节、特斯拉等巨头加码布局,推动资本热情攀升 [9] 技术挑战与发展瓶颈 - 当前人形机器人行为多为预先编程的"炫技",缺乏真正的智能决策能力 [13] - 算法未突破,大语言模型无法解决"大脑"问题;具身智能缺乏物理世界交互数据 [13][15] - 技术复杂度远超自动驾驶,需解决与物理世界的安全交互问题 [17] - 实用性不足,进入工厂或家庭服务仍需5-10年甚至更长时间 [16][17] 行业融资动态 - 银河通用完成11亿元新一轮融资,两年累计融资超24亿元 [5] - 加速进化完成超亿元A轮融资,深创投领投 [5] - 地平线机器人完成1亿美元A轮融资,高瓴资本等十余家机构参与 [5] - 松廷动力连续完成过亿元A轮及A+轮融资 [5]
清华90后博士厨房机器人融资数千万,获北京首张具身智能餐饮许可证
具身智能之心· 2025-06-28 15:48
公司融资与背景 - 享刻智能完成数千万元Pre-A轮系列融资,投资方包括世纪长河科技集团、启迪之星、网龙天映创投、广华创投等[2] - 公司累计已完成亿元级规模融资,天使轮投资方包括真格基金、中关村智友科学家基金、九阳股份、振邦智能等[16] - 创始人陈震为连续创业者,拥有北航计算机学士、清华计算机硕士学位,目前是清华大学未来实验室博士生[3] - 陈震此前创办的速感科技被九阳母公司JS环球生活全资收购[4] 产品与技术 - LAVA机器人已获得北京市首张具身智能机器人食品经营许可证,成为全国首个"持证上岗"的AI厨师[6] - 机器人能2分钟炸好一盘薯条、做汉堡,未来还将学会做冰淇淋和调饮品[7] - 通过视觉识别食材并自主判断烹饪时间,能学习掌握新菜品制作方法[8] - 已实现连续190天无间断运行,单日处理订单峰值达1,732单,累计完成超10万次无故障炸制任务[8] - 平均40秒/单的制作效率,能耗较传统设备降低62%,管理效率提升40%以上[8] 商业化进展 - 已与海外知名连锁品牌签订千台级量产订单,将于下半年启动海外部署交付[10] - 专注西式快餐领域,因其标准化程度高更易实现自动化[12] - 采用"三机一体"架构升级:强化机器感官、机器认知和机器关节[12] 产业合作 - 与清华珠三角研究院签署合作协议,共建机器人核心技术联合研发平台[15] - 九阳股份在并购陈震的速感科技后,又作为天使投资方参与新项目[17] - 核心团队来自原速感科技、Shark Ninja及九阳团队,拥有10年以上研发管理经验[18] 创始人理念 - 强调"在真实场景中创造价值"的理念,深入理解厨房、餐饮等商业化服务场景[20] - 提出"在无数次试错中进化"的创业方法论[20] - 团队从2013年研究vSLAM技术到2018年实现百万台级量产销售,积累了12年技术产业化经验[19]
北航×新国立×上交发布RoboCerebra:长时序机器人操作推理的全新评测基准
具身智能之心· 2025-06-28 15:48
核心观点 - 视觉-语言模型(VLM)为机器人带来"看图执行指令"的新范式,但现有系统仅依赖"小脑"模型难以胜任家庭级复合操作,需要"大脑"VLM进行长期规划、记忆管理与自我反思 [7] - 现有基准平均任务长度不足500步,缺乏对大小脑协作闭环能力的考察,模型难以应对遮挡、跌落或目标迁移等场景 [8] - 提出RoboCerebra基准,面向长时序、多扰动、强记忆约束的任务,配套发布Hierarchical Planning & Execution (HPE)框架 [8][10] RoboCerebra数据集 - 包含1,000条人工标注轨迹,覆盖100个任务变体,平均每条轨迹由9.1个原子动作构成,总步数达2,972步 [17][18] - 任务平均长度2,972.4步,是现有长时序数据集的6倍,最长超3,500步 [13][18] - 涵盖饮品准备、物品归置、餐具整理等家庭场景,定义12种离散动作类别,10%任务包含五类以上动作 [17][18] - 引入六类子任务:Ideal、Memory Exploration、Memory Execution、Random Disturbance、Observation Mismatching、Mix [16] 数据生成流程 - 采用GPT自动生成高层任务并递归拆分子目标,经符号与视觉双重闭环验证 [13][17] - 符号推理器检查前置与后置条件,GPT-4o检查场景合理性,失败则重新生成 [17] - 人类专家录制400小时标准操作轨迹,独立标注团队进行200小时人工质检 [17] 评测协议 - 设计四维核心指标:任务成功率、计划匹配精度、计划效率、动作完成一致性 [21] - 预设"锚点"同步机制确保不同方法在子计划执行时序对齐 [21][26] - 成功率基于自动化谓词检测,计划匹配精度评估高层符号计划一致性 [21] Hierarchical Planning & Execution框架 - 高层VLM-Planner低频率处理环境观测生成子目标序列,低层VLA-Controller高频率执行动作指令 [22][26] - 通过Memory Bank共享任务状态与中间子目标,实现自适应replanning [22][26] - 在Memory Execution场景中任务成功率提升幅度超过70% [27] 实验结果 - GPT-4o在规划准确率、任务成功率和计划效率上全面领先,平均成功率16.04% [28][29][30] - 在Memory Exploration阶段,GPT-4o探索成功率80%,探索效率0.32,显著优于Qwen2.5-VL [31] - 在Memory Execution阶段,GPT-4o决策准确率30%,优于Qwen2.5-VL的10% [31]
具身的秋招马上要开始了,去哪里抱团呀?
具身智能之心· 2025-06-28 15:48
行业发展趋势 - 自动驾驶和具身智能成为AI技术发展的主线 支撑了近一半的技术路线和融资金额 [1] - L2~L4自动驾驶功能逐步实现量产 人形机器人和四足机械狗等具身智能产品完成复杂动作演示 [1] - 行业对技术和人才需求旺盛 尤其在自动驾驶、具身智能、3D视觉和机器人领域 [1] 求职社区概况 - AutoRobo知识星球专注于自动驾驶、具身智能和机器人方向的求职交流 成员近1000名 [2] - 成员包括地平线、理想汽车、华为、小米汽车等公司的社招人员以及2024-2025届秋招学生 [2] - 社区提供面试题目、面经、行业研报、谈薪技巧、内推资源和简历优化等服务 [2] 招聘信息 - 日常分享算法、开发、产品等岗位信息 涵盖校招、社招和实习机会 [3] - 寒武纪持续招聘2026届实习生 包括C++开发、PyTorch框架研发和软件测试开发等岗位 [4] 面试资源 - 汇总自动驾驶和具身智能方向的"一百问"系列 涵盖毫米波视觉融合、BEV感知、多传感器标定等核心技术 [6][7] - 具身智能领域包含Occupancy感知、相机标定、端到端自动驾驶等专项问题 [8][12] - 整理社招/校招全流程面经 包括代码题、项目细节和面试复盘 [15][19] 行业研究 - 提供领域研报帮助理解行业发展状态、前景和产业链 如世界机器人报告、中国具身智能创投报告等 [13][14] - 深度分析具身智能技术路线、市场机遇和人形机器人量产硬件等专题 [14] 职业发展支持 - 汇总机器人、自动驾驶和AI类专业书籍 构建知识体系 [18] - 分享谈薪技巧、HR面常见问题和岗位薪资谈判策略 [17][20] - 提供转行经验、面试官建议和岗位技能树等职业指导 [20]