机器人大讲堂
搜索文档
快慢双系统成为具身智能主流技术路线?10家企业的差异、特性都在哪?
机器人大讲堂· 2025-10-02 08:34
机器人快慢双系统架构核心观点 - 机器人领域借鉴人类认知的"双系统理论",采用快慢双系统架构以解决高频精准控制与复杂高层任务规划难以在单一系统中兼顾的核心矛盾[1] - 快慢系统解耦实现独立升级AI算法而不改动底层稳定控制框架,降低系统开发复杂性[1] - 该架构将长链条端到端模型拆分为视觉语言模型和动作执行两个模型,实现功能解耦与真异步并行,避免机器人因思考而卡顿[4] - 机器人快慢双系统架构已成为实现高级别机器人智能的主流范式,但在具体实现上呈现百花齐放局面[5] 代表性企业技术方案 - **Figure AI Helix**:采用系统1(快思考)和系统2(慢思考)双系统架构,系统1为8000万参数Transformer模型以200Hz频率执行闭环控制,系统2为70亿参数预训练视觉语言模型以7-9 Hz频率传递潜在向量[6][7] - **PI Hi Robot**:分层交互式机器人学习系统通过协同训练技术融合多机器人知识源,慢系统视觉语言模型理解复杂指令全局意图并分解子步骤,生成可解读中间指令[9][10] - **智平方 GOVLA**:由空间交互基础模型、慢系统和快系统组成,慢系统基于大规模参数视觉语言模型负责高层次语义理解,快系统实时生成可执行动作,首次实现机器人全身协同控制和移动轨迹端到端输出[12][13] - **星海图 G0**:构建全球首个开放场景高质量真机数据集涵盖500小时时长、150个任务、50个场景,采用三阶段渐进式课程学习策略,仅需不到100条特定任务演示数据即可快速掌握复杂新技能[15][16] - **擎朗智能 KOM2.0**:慢系统基于视觉语言模型通过K-Infinity数据集实现服务场景环境感知,快系统采用动作专家模型利用大量真机数据训练,开创性提出岗位化垂域模型KEENON ProS实现快速落地[18][19] - **星动纪元 ERA-42**:采用高层次规划与低层次控制双系统架构,慢思考世界模型使用70亿参数视觉语言模型进行任务预演生成未来动作预测,快思考高频执行系统使用4000万参数Transformer模型实现抗干扰能力[21][22] - **节卡 JAKA EVO**:慢系统实现快速任务解析与规划,通过轻量模仿学习机制在交付后能通过少量示教快速迁移适配新场景,打破传统机器人需要数周调试困境[25][26] - **微亿智造**:通过云、边、端三层技术架构实现快慢思考,基于超过15TB、包含超过10亿条精标数据点的真实工业场景数据库,实现开箱即用[28] - **魔法原子 原子万象**:快系统基于高效动作专家模型处理毫秒级实时控制,慢系统由参数规模更大
革命性的机器人丝杠冷镦工艺是什么?
机器人大讲堂· 2025-10-02 08:34
人形机器人丝杠技术挑战与现状 - 人形机器人腿部线性执行器和灵巧手是丝杠主要应用部位,分别采用反向行星滚柱丝杠和微型滚珠丝杠 [1] - 传统磨床制造的微型滚珠丝杠生产时间达数十分钟,产品运行寿命普遍仅20万次,对于每天工作12小时、每分钟抓放10次工件的机器人而言,最晚1个月就会报废更换,导致落地成本过高 [1] - 反向行星滚珠丝杠设计难度在于需紧凑适配关节、制造公差小、可传大载荷扭矩,且球轴承存在磨损精度衰减和动态响应滞后问题 [2] - 人形机器人多需P5级精度,对应ISO标准的C5级,即300毫米行程误差在±0.01毫米内 [2] - 部分企业考虑放弃线性执行器方案改用旋转式,或将滚珠丝杠替换为寿命更长的行星滚柱丝杠,但后者面临加工难度高、效率低和成本高的问题 [4] 冷镦工艺解决方案 - 冷镦工艺被视为解决微型行星滚柱丝杠成本问题的重要方案 [4] - 冷镦成形锻造是通过锻压机械对金属坯料施加压力使其产生塑性变形的加工工艺,主要有分序冷精锻、多工位冷精锻和单工位多动作冷精锻三种模式 [6] - 冷精锻技术优势在于能快速成型螺母和丝杠轴,减少切削加工形成的金属废屑,节约原材料成本,且工件形状尺寸易控,表面质量和精度较高 [8] - 该工艺兼具加工效率高、材料损耗率低、绿色环保等优点,在汽车零部件加工中渗透率逐步提升 [8] 新坐标公司技术突破与优势 - 新坐标发布冷镦工艺微型行星滚柱丝杠,精度可达C3,丝杠齿形一次成形精度达IT4级,效率为5分钟/根,高于市面平均效率5-10倍 [5] - 公司手部微型丝杠加工已成熟并送样,正在研发冷镦工艺腿部大丝杠,丝杠滚压工艺取得突破,预计十月底推出0.5mm及7.5mm导程丝杠 [5] - 公司自研自制内螺纹滚压设备及热成型设备,结合引进的多工位冷镦机和"平板卷制"工艺,材料利用率达91%,远高于行业平均的65%,成本直降42% [10] - 内螺纹可3~5分钟成型C3精度,设备成本仅几十万元 [10] - 为三花智控提供的汽车热管理项目阀芯阀柱采用类似工艺,10月底月产能达2万套,明年3月底达3万套,12月底达4万套 [10] 新坐标业务拓展与财务表现 - 公司从汽车零部件制造拓展至汽车用驻车丝杠和机器人用丝杠研发制造,有望打造第二成长曲线 [11] - 2025年4月联合浙江陀曼智能成立杭州九月八精密传动,持股77%,聚焦滚柱丝杠、滚珠丝杠生产 [11] - 公司在欧洲(捷克)和北美(墨西哥)设立制造基地,海外工厂陆续投产业绩持续增长 [11] - 2020-2024年收入复合年增长率为16.0%,2024年海外收入同比增长47%,海外收入占比从2020年的17%迅速提升至2024年的43% [11] - 客户方面绑定欧洲大众、通用等高端客户 [11]
Nature正刊:西湖大学研发了飞行工具箱的空中协同操作系统
机器人大讲堂· 2025-10-02 08:34
技术突破核心 - 西湖大学赵世钰实验室研发的FlyingToolbox系统在国际上首次实现多架旋翼无人机的空中工具交换,解决了近距离飞行与高精度操作不可兼得的关键技术难题[3] - 该研究成果发表于Nature期刊,是中国在多旋翼无人机领域的研究成果首次登上Nature[3] - 技术突破点在于实现了"叠式"飞行状态下的高精度协同作业,使无人机从"单兵作战"迈向"群体协作"[3] 技术挑战与解决方案 - 核心技术挑战是两架无人机垂直距离接近至0.6米时会产生达13.18米/秒的下洗气流,相当于6级强风,严重干扰稳定性[6] - 研究团队设计了三个核心模块:柔性电磁对接机构实现自动吸附对接,气流扰动估计与补偿方法通过神经网络实时预测并抵消气流影响,高精度对接与操作控制技术确保亚厘米级精度[10][11][13] - 对接精度要求机械臂底部与工具顶部之间的水平位移必须小于1.5厘米[10] 系统性能与实验验证 - 实验显示FlyingToolbox能成功实现不少于20次连续对接,平均误差为0.80厘米,相较于无机械臂补偿系统6-8厘米的精度有接近一个数量级的提升[15] - 系统展示了双机协作完成空中剪彩、抓取、放置等动作,以及更复杂的三机协作任务,全部基于机载算法自主完成[16][17] - 系统具备运动中对接能力,即使工具箱无人机处于移动状态,操作无人机仍能顺利完成工具抓取,拓展了应用范围[18] 行业应用前景 - 空中作业机器人将多旋翼无人机和高自由度机械臂结合,能代替人类在难以抵达区域进行危险物品抓取、高空建筑清洁、接触式检修等作业[5] - 该技术处于低空经济和具身智能两大领域的交汇处,具有广阔的产业化前景,FlyingToolbox被视为一个"空中乐高平台",通过模块化设计使无人机能完成更复杂任务[19] - 技术发展将使空中作业机器人帮助人类在更高更远的地方完成复杂危险任务,推动行业向更高水平发展[19]
祝机器人圈的朋友们,国庆快乐!
机器人大讲堂· 2025-10-01 08:21
行业愿景与贡献 - 机器人行业从业者正通过代码和机器人技术为国家发展贡献力量 [4] - 行业创新被寄望如国庆烟花般璀璨夺目 [4] - 行业项目被寄望如“中国红”一样稳步推进且势不可挡 [4] 行业精神与祝福 - 机器人从业者以科技之名向祖国献上硬核贺礼 [4] - 祝愿机器人从业者与家人国庆快乐 [4] - 祝愿国家与家庭共同安宁,事业与梦想共同进步 [4]
智元机器人合伙人王闯:机器人流量经济从概念走向规模化变现
机器人大讲堂· 2025-09-30 20:30
核心观点 - 机器人正从功能工具转变为承载万亿级流量的新入口,其本质是连接人与服务的节点,所沉淀的流量成为比硬件利润更具价值的“数字石油”[1][4] - 智元机器人在无锡开设的全球首个面向C端的具身智能体验中心,是机器人流量经济在消费场景的全新探索,旨在打通“技术-场景-流量-变现”的闭环,定义下一代商业生态[1][13][19] - 行业竞争正从硬件竞赛转向生态竞争,机器人流量经济有望打开一个尚未被充分挖掘的千亿级市场蓝海[4][16] 商业模式与流量运营 - 体验中心采用亲民票价策略:参观票59.9元/人,通票工作日128元/人、节假日148元/人(开业首月享6折优惠),旨在降低体验门槛,收集真实用户反馈以指导产品迭代[3][13] - 通过八大主题空间构建流量沉淀场景,包括炫技舞台(机器人完成后空翻、精准避障等)、互动项目(拳击擂台、棋牌对弈、冰壶竞技)、时空走廊(裸眼3D、VR体验)及机器人剧场等,让消费者在趣味互动中感知技术[6] - 机器人剧场创新“日场+夜场”双运营模式,日场聚焦家庭亲子,夜场转型为“科技风Livehouse”吸引年轻消费群体打卡,利用其自发分享行为实现品牌流量的穿透式传播[6][7] - 流量经济的核心是让消费者在玩中产生持续交互,其变现收益有望超越硬件利润,成为新的增长引擎,并通过数据分析反哺技术迭代,形成“数据-服务-流量-数据”的正向循环[6][16] 技术部署与运营能力 - 公司展现出强大的批量部署能力,在三天内完成了40台机器人的部署,体现了产品的一致性、易用性和安全性,这得益于2024年人形机器人量产已突破千台的基础[9] - 通过高自主性设计(如开箱后自主站立、待机、充电)和远程技能OTA支持,实现了高效的人机管理,仅用约20人即可运营40台机器人(传统模式需40人以上),显著降低了运营成本[11] - 安全性是C端运营的重中之重,机器人搭载多传感器融合避障算法,并对易接触部位进行软质包裹处理,同时开业初期控制人流量以观察机器人在复杂环境中的稳定性[11] 商业化路径与战略布局 - 公司已梳理出八大商业化路径,涵盖远程讲解接待、文娱商演、药箱搬运、物流分拣、科研教育等,当前重点聚焦于流量吸引力强的文娱商演和长期布局的数据采集训练[16] - 采用“政企合作”的轻资产模式,与无锡当地产发集团、文旅集团共同投资体验中心,公司负责提供设备、技术与初期培训,计划培养本地团队甚至搭建本地供应链,以实现模式的快速规模化复制[17] - 体验中心不仅是C端流量入口,也作为B端商业合作的窗口,方便周边企业客户低成本考察机器人功能,从而为打开B端市场创造机会[14] - 公司计划在无锡落地创新中心,进一步完善从数据采集到应用落地的闭环,并计划在体验中心增加机器人组装体验区等,以增强互动性与趣味性[16][19]
从“被动执行”到“主动协作”,复旦大学Ask-to-Clarify框架重塑人机交互范式
机器人大讲堂· 2025-09-30 18:09
人机交互的当前局限 - 当前智能系统难以理解模糊指令,例如当桌上有多个杯子时,设备无法准确响应“把杯子给我”这样的指令[1] - 人类交流依赖语境与默契,常使用不完整表达如“一会儿提醒我”、“把空调开大点”,而传统自动化系统只能响应明确、结构化的指令[1] 智能体的角色转变 - 智能体正从“被动执行者”向“主动协作者”转变,目标是成为人类在物理世界中的合作伙伴[3] - 与虚拟AI不同,具身智能体需应对现实场景的开放性与不确定性,实现高效、自然、双向的协同作业[3] - 目前大多数视觉-语言-动作模型(VLA)仍以单向模式运行:接收指令后立即执行,缺乏反馈或澄清机制[3] Ask-to-Clarify框架的创新 - 复旦大学研究团队提出“询问澄清”框架,通过多轮对话澄清歧义后,端到端生成低级动作[4] - 该框架运作模式类似人际协作:智能体在接收模糊指令后通过对话明确任务要求,再执行相应动作[4] - 框架由视觉-语言模型(VLM)和扩散模型组成,VLM负责理解场景与指令并生成澄清问题,扩散模型生成连续、流畅的低级动作[5][7] - 通过连接模块集成两个组件,确保智能体的思考与行动保持一致[7] 独特的训练策略 - 采用两阶段“知识隔离”训练策略:第一阶段训练智能体的沟通能力,使其学会识别模糊点并生成澄清问题[8] - 第二阶段专注于动作生成能力培养,同时“冻结”协作组件以保留对话能力,防止遗忘已有技能[10] - 该策略确保智能体先通过多轮对话澄清指令歧义,再以端到端方式生成精确低级动作[10] 框架性能测试结果 - 在8项实际任务测试中,Ask-to-Clarify框架显著优于当前最先进的VLA模型[12] - 具体成功率:放置水果任务达95%,倒水任务达98.3%,堆叠积木任务达90%[12] - 框架在接收模糊指令(需主动澄清)条件下表现卓越,而基线模型直接接收明确指令,凸显其主动协作机制的价值[12] - 在非理想条件下(如低光照或视觉干扰),框架鲁棒性突出:低光照下成功率从90%降至80%,而传统模型性能大幅下降;存在相似物体干扰时成功率维持80%,高于传统模型的65%[13][14] 行业应用前景 - 该框架重新定义了人机协作的可能性,推动具身智能体从单向执行到双向协作的转变[15] - 未来具备协作能力的智能体将在家庭助手、工业机器人、医疗护理、教育培训等领域发挥重要作用[15]
快讯|智元机器人全国首家具身智能体验中心无锡开业,灵猴机器人完成超亿元A轮融资,宁德时代入股银河通用机器人
机器人大讲堂· 2025-09-30 18:09
智元机器人无锡体验中心开业 - 全国首家开放式具身智能体验中心于9月30日在无锡惠山古镇开业 [3] - 中心聚焦人形机器人,设计了八大主题空间,包括炫技舞台和机器人剧场每日融合演出 [3] - 机器人店长“梁元”上岗,旨在打造传统文脉与未来科技对话的消费场景,探索具身智能文旅商业化新路径 [3] 灵猴机器人融资与战略 - 公司成功完成超亿元A轮融资,由金鼎资本、博原资本、TCL创投共同领投,苏创投、东运创投等跟投 [6] - 融资资金将主要用于工业自动化及通用机器人领域核心零部件研发、实验室建设和产能扩充 [6] - 此次融资彰显资本市场对公司自研实力与未来规划的高度认可 [6] 特斯拉人形机器人量产计划 - 特斯拉计划于2025年底推出第三代人形机器人,并预计在2026年正式开启量产 [9] - 公司CEO马斯克展望,到2030年前,特斯拉人形机器人的年产量将达到100万台 [9] - TeslaAI透露公司正积极扩大人形机器人生产规模 [9] 世界机器人大赛绵阳锦标赛 - 2025世界机器人大赛绵阳锦标赛于9月29日开幕,吸引全国1600余支赛队、近3000名精英赛手参赛 [12] - 大赛首次在绵阳举办,2025年计划在全球范围内举办500余场竞赛,预计全年参赛人数将首次突破35万人次 [12] - 大赛竞赛体系不断完善,规模持续扩大,参赛人群覆盖全年龄段 [12] 宁德时代投资银河通用机器人 - 北京银河通用机器人有限公司完成工商变更,新增宁德时代全资子公司及北京机器人产业发展投资基金等为股东 [15] - 公司注册资本增至42.26万元,专注于具身多模态大模型通用机器人的研发 [15] - 此次工商变更及增资将为公司在通用机器人领域的研发与市场拓展提供有力支持 [15] 机器人行业企业生态 - 行业企业生态覆盖工业机器人、服务与特种机器人、医疗机器人、人形机器人、具身智能企业、核心零部件及教育机器人等多个细分领域 [21][22][23][24][25][26]
让机器“看懂”物体如何摆放:单视图3D生成新框架,解决机器人空间感知核心难题
机器人大讲堂· 2025-09-30 18:09
技术核心:OnePoseViaGen框架 - 创新性地结合单视图3D生成与生成式领域随机化,为解决“单参考图像估计未知物体6D位姿”难题提供全新思路 [2] - 提出“单视图3D生成→尺度-位姿联合优化→生成式领域增强”的端到端解决方案,目标仅需一张参考图即可高精度估计6D位姿 [5] 技术实现原理 - 从单张锚点图像出发,通过背景噪声抑制、提取法线信息辅助建模、归一化3D模型输出三个步骤构建初始物体模型 [7][8] - 采用“粗对齐→精对齐”两步优化策略解决尺度模糊问题,通过多视角渲染和PnP算法估算初始位姿,并迭代优化至结果收敛 [9] - 运用文本引导的生成式领域随机化技术,为同一物体生成多种纹理变体,通过合成数据集微调位姿估计网络,弥合生成模型与真实图像的域差距 [11] 性能表现与验证 - 在YCBInEOAT数据集测试中,ADD指标平均精度达81.27%,远超基线方法的45.6%,在低纹理、高遮挡物体上优势明显 [12] - 在真实机器人实验中,面对15类不同物体进行每类30次测试,均表现出高成功率和亚厘米级精度,在动态遮挡场景中也能稳定工作 [15][17] 行业应用与影响 - 技术突破将深远影响工业自动化、物流、家庭服务机器人及文化遗产保护等多个领域 [18] - 极大降低机器感知世界门槛,传统方法需精密传感器和复杂校准,而该技术仅需一张普通照片,具备大规模应用前景 [18]
从地面到垂直墙无缝切换!密歇根大学×上海交大联合研发SPARC,突破软体机器人天花板!
机器人大讲堂· 2025-09-30 18:09
文章核心观点 - 密歇根大学与上海交通大学的研究团队开发出名为SPARC的软体机器人,该机器人采用独特的折纸结构设计,能够在水平和垂直表面之间无缝过渡并实现精确轨迹跟踪,是首个具备此能力的软体机器人[2][6] 机器人技术特点与设计 - SPARC是一款柔软、本体感受、敏捷的3D攀爬机器人,其攀爬动作依赖于三个基于Kresling折纸图案设计的气动执行器[3] - 机器人集成了三个并行排列的3D打印Kresling折纸执行器与吸盘结构,可在多种表面上实现三维驱动与吸附[5] - 核心驱动单元在-80kPa负压条件下可实现60%的收缩率,驱动力达3千克,使用寿命超过20000次循环[7] - 配备四个硅胶吸盘作为足部,每个足部采用双吸盘配置以降低变形风险,确保真空粘附时位置与方向稳定[9] - 采用软硬材料组合的3D打印工艺,软质部分选用TPE材料,刚性部件采用PLA材料,真空吸盘由硅橡胶制成[9] 运动控制与感知系统 - 创新性地利用了Kresling折纸固有的收缩-扭转耦合特性,让SPARC实现了实时本体感知和状态重建,无需依赖外部传感器[3][5] - 在步态控制器中采用了双闭环控制系统,通过角度编码器实现精确姿态管理,同时结合运动捕捉技术调整全局定位[5] - 采用在多段连续体机器人领域广泛应用的分段恒定曲率模型进行运动学建模,其最大前向步长为30毫米[12] - 爬行步态设计灵感来源于蚯蚓的运动模式,一个完整的向前步态周期包含四个阶段,两个步骤构成一个完整循环[12] 性能测试结果 - SPARC展现了在地面与垂直表面之间平稳过渡的能力,并能在垂直平面上承载超过自身重量两倍的有效载荷(自重210克,负载500克)[5] - 在三维空间中实现了60%高幅度收缩、50度弯曲性能,以及较高的负载能力[5] - 在水平地面运动时相对跟踪误差约为0.5%;在垂直墙壁曲线路径跟踪实验中,轨迹偏差控制在3%以内[17] - 通过将两个SPARC模块串联,构建了串行配置机器人,该配置可使机器人最大弯曲角度提升至100度,同时最大步长达到单模块的两倍[17] 行业应用潜力 - 多模块组合方案的提出进一步拓展了软体机器人在实际工程中的应用潜力,使其能够实现从地面到正交(90度)墙壁的平稳过渡[17][19] - 这项将三维驱动、创新本体感知、运动学建模、鲁棒控制和高效规划策略相结合的工作,为后续在更复杂场景中的应用奠定了基础[6][17]
2025世界机器人大赛绵阳锦标赛盛大启幕
机器人大讲堂· 2025-09-30 18:09
大赛概况 - 2025世界机器人大赛绵阳锦标赛于9月29日开幕,是第十三届中国(绵阳)科技城国际科技博览会的重要同期活动 [1] - 大赛首次落地绵阳,旨在为城市注入青春活力,为绵阳建设国家科技创新先行示范区储备人才后备力量 [1] - 大赛开幕式有中国电子学会理事会党委书记、绵阳市人民政府副市长等领导出席 [3] 参赛规模与赛程 - 绵阳锦标赛共有来自全国的1600余支赛队,近3000名精英赛手参赛 [8] - 2025年世界机器人大赛全年将举办超过500场各级竞赛活动,包括300余场城市选拔赛、100余场省级选拔赛、近50场国际锦标赛等 [12] - 大赛参赛人群覆盖全年龄段,全年参赛人数将首次突破35万人次 [12] 机器人行业企业图谱 - 工业机器人领域企业包括埃斯顿自动化、埃夫特机器人、非夕科技、节卡机器人、优傲机器人、极智嘉等 [18] - 服务与特种机器人领域企业包括亿嘉和、晶品特装、七腾机器人、史河机器人、九号机器人、普渡机器人等 [18] - 医疗机器人领域企业包括元化智能、天智航、思哲睿智能医疗、精锋医疗、佗道医疗、术锐机器人等 [18] - 人形机器人领域企业包括优必选科技、宇树、云深处、星动纪元、傅利叶智能、开普勒人形机器人等 [18] - 具身智能企业包括跨维智能、银河通用、科大讯飞、北京人形机器人创新中心、视比特机器人等 [21] - 核心零部件企业包括绿的谐波、因时机器人、坤维科技、思岚科技、凌云光等 [22] - 教育机器人企业包括硅步机器人、史河科教机器人、大然机器人 [22]