机器人大讲堂
搜索文档
透视2026马年春节档:从舞台氛围组到产线实干家,机器人迎战新命题
机器人大讲堂· 2026-02-14 15:39
文章核心观点 - 2026年央视春晚预热活动标志着机器人行业叙事从“表演炫技”转向“解决实际问题”,聚焦机器人技术的实际应用与落地能力 [1][6] - 中科灵犀公司作为典型案例,其技术路线获得国家级媒体认可,体现了“实干型机器人”成为行业新焦点 [9][11][25] - 机器人技术的核心竞争力在于真实场景的落地能力,特别是在工业、高危环境等复杂工况中替代人工、创造价值 [21][22] 机器人行业展示逻辑的转向 - 央视春节档活动呈现重要转向:从关注“机器人能表演什么”转向关注“机器人能解决什么” [9][11] - 全球机器人产业站在分水岭,头部玩家如特斯拉Optimus、Figure 01、1X Technologies均将“落地”作为第一优先级 [11] - 在“智慧大集”活动中,机器人展示去表演化,关注写福字、咖啡拉花、导盲、理疗等实际服务功能 [12] - 中科灵犀的机器人因技术可复用(同一只“手”既能写福字也能拧螺丝)而受关注,体现了从表演者到劳动者的本质转变 [14] 中科灵犀的技术与产品实力 - 公司形成了绳驱与连杆双技术路线并行的灵巧手产品矩阵 [16] - SQ-1503绳驱灵巧手:21个自由度,采用轴向磁通电机驱动与仿生结构,胜任精密装配、科研操作等任务 [16] - LG-601连杆灵巧手:18个运动自由度,采用空心杯电机驱动,结合行星丝杠与连杆系统,适用于高精度、高负载场景 [16] - 轮式人形机器人LSRobot-001可融合多种灵巧手,具备轮式移动与越障能力,执行抓取、搬运、巡检等一体化作业 [16] - 核心技术支柱包括:全/欠驱动复合传动技术、高精度多维感知技术、灵犀智能泛化抓取算法 [18][20] 技术在实际工业场景的落地案例 - 在六安某小微电机生产工厂,灵巧手自动化装配设备已规模化投用,单台电机装配仅需9至10秒,兼容十余种型号,装配合格率稳定在99%以上 [19] - 在湖北某大型化工厂,公司研制出极限环境人机协同具身智能作业机器人,搭载灵巧手实现剧毒腐蚀品氟化氢取样的全流程无人化操作,可自主完成抓取取样瓶、运输等环节,每次精准取样30至50毫升,设备已稳定运行超一个月 [21] - 从电机装配到化工取样,实践路径印证了机器人技术的核心竞争力最终体现在落地能力上 [21] 行业启示与未来展望 - 春晚的科技展示正从“仰望星空的成果汇报”转向“脚踏实地的能力呈现”,公众期待看到技术如何解决问题、服务生活 [22] - 技术最好的舞台不在聚光灯下的完美表演,而在解决问题的每一个真实场景中 [25] - 中国机器人产业的未来图景在精准抓取、安全替代、文化传承等应用中变得日渐清晰 [24]
乐聚展厅战略的“进与守”
机器人大讲堂· 2026-02-13 14:04
公司战略与产品演进 - 公司对展厅场景的战略定位坚定,将其视为一场按照自身节奏推进的商业化长跑,并通过持续迭代产品来深耕该场景[2] - 公司产品“夸父”展厅版从1.0演进至3.0,历时两年多,经历了超过二十个省份的真实场景落地和大量一线反馈,实现了持续进化[2] - 公司专注于将展厅场景“做细”,而非急于证明能处理更复杂任务,体现了务实的产品发展路径[2] 产品核心能力:社交智能 - 展厅版3.0的产品定义围绕“社交智能”展开,旨在解决机器人在人群中的得体交互问题,与只需精确响应的工业机器人形成鲜明对比[4] - 产品通过毫秒级人脸识别与VIP欢迎策略,将“被记住感”产品化,为重点客户提供个性化问候,创造了屏幕交互无法替代的体验落差[6] - 产品具备1米距离的自动跟随功能,将参观节奏交还给访客,使机器人角色从“领队”转变为“同伴”,降低了人机共处的心理负担[6] - 产品拥有41个自由度、1.0m/s步速和抗扰平衡算法,能够在被碰撞后实时调整姿态、自主绕障,并表演手势舞等,塑造了可自然共处的智能伙伴形象[8] 部署与运维创新 - 公司致力于降低使用门槛,通过开箱即用、单人拆箱、APP可视化编排、VR动作复刻等功能,将机器人的运维从研发人员转移至运营人员[8] - 产品的技术指标(如41个自由度、1.0m/s步速)在产线场景中不突出,但恰好构成了展厅场景的体验闭环[8] 市场规模与增长逻辑 - 市场规模评估需基于存量设施的实际承载力,可分为核心存量市场、泛商业增量市场和产业溢出价值三层逻辑[10] - **核心存量市场**包括追求新技术首发的博物馆、科技馆,政策驱动型的城市规划馆、国家级与省级高新区展厅,以及看重品牌调性的头部企业品牌体验中心(如汽车品牌馆、科技企业总部展厅)[10] - **泛商业增量市场**是展厅场景的战略价值所在,可作为泛商业服务的预演场,远期可渗透至国内高端零售门店、汽车4S店、4A级以上景区游客中心等[12] - 硬件成本从目前的60万-80万元下探后,单场景投资回报模型将发生质变,从品牌营销预算向运营人力预算迁移[12] - **产业溢出价值**体现在公司通过在全国23个省份落地标杆案例,积累的合作经验、公众认知度和媒体曝光资产,反哺了其在工业与科研赛道的资源获取能力[14] 公司竞争壁垒 - **标杆案例的信任迁移**:公司产品经历了十五运会全球直播零失误、亚冬会极寒环境验证、MWC国际政要互动等高规格事件背书,为采购方提供了低决策风险的信任资产,难以被短期复制[15] - **场景数据的先发优势**:机器人在乔家大院、荣耀阿尔法全球旗舰店、江苏银行等真实场景的每一次交互,都在产生多模态数据,用于迭代算法与对话策略,形成了“落地-采集-迭代-更好落地”的数据正循环[15] - **“人形机器人+”生态布局**:公司在技术研发上与哈尔滨工业大学、山东大学、苏州大学、北京通用人工智能研究院、华为等单位合作;在产业应用上与中国一汽、江淮汽车、中国移动、润泽集团等行业领军企业携手,推动在工业智造、商业服务、家庭康养等场景的落地;在产业链上深化与东方精工、和而泰等伙伴合作,并联合中国移动攻克了5G-A网络下的多机协同技术难题[17][18] 当前挑战与应对 - **灵活性挑战**:目前大多展厅人形机器人步态僵硬、动作依赖预设脚本,在复杂环境中容易陷入僵局[19] - 公司通过展厅版3.0的1.0米每秒抗扰步态、实时姿态调整算法、指令到动作逻辑的底层切换,使机器人步态更拟人、动作更自然,能基于对话情绪理解配合手势,让动作成为表达的一部分[19] - **对话能力代际差**:当前基于大模型的知识库问答仅能满足“展厅讲解”的及格线,距离深度互动仍有差距,不能让访客觉得回答像百度百科[21] - 公司与阿里云千问大模型合作,基于RAG增强检索解决知识库准确性问题,并通过持续的真实交互迭代模型对中文语境、展厅场景、访客情绪的理解深度[21] 战略定位与未来展望 - 公司的展厅战略是用场景确定性对冲技术不确定性的务实选择,在边界清晰、需求明确、支付意愿存在的场景中率先实现商业化[22] - 该策略已取得阶段性成果,包括在二十三个省份落地覆盖、获得国家级赛事零失误背书、与50多家行业领军企业共建“人形机器人+”生态[22] - 展厅是一个有限场景,路面条件、对话需求、人流密度与交互强度均低于工厂、家庭或真正的商业公共空间,因此它只是技术商业化落地的温和着陆场,而非舒适区[22] - 未来的关键分野在于,公司能否将在展厅“温室”中积累的交互理解能力、场景数据资产、政企信任资源,迁移至更广阔、更非标的商业服务疆域[24] - 这条路径需要持续的产品迭代、务实的场景拓展以及对商业化节奏的清醒认知,公司已经完成了最初的一公里[24][26]
墙面秒变艺术馆!一群机器人让你的家每天换新皮肤
机器人大讲堂· 2026-02-13 14:04
文章核心观点 - 机器人领域顶级期刊《Science Robotics》发表突破性研究 首次提出“建筑群体智能”概念 普林斯顿大学等机构成功开发出名为“群体花园”的模块化机器人立面系统 该系统能追踪阳光、智能遮阳 并能与舞者即兴互动 将室内空间变为动态艺术舞台 [2] 灵感来源与技术理念 - 研究灵感源于自然界群体智能 如植物调整枝叶 蜜蜂分配蜂巢 行军蚁搭建活桥 这些行为依靠个体局部互动实现整体智能 而非中央指挥 [3] - 传统建筑图纸固定 无法响应用户需求及环境变化 研究团队旨在让建筑“活”起来 使建筑立面由众多小单元互相配合 自我组织并随时调整 [3] - 团队将“群体智能”从算法和地面机器人领域 迁移至建筑外立面 开发了“群体花园”系统 该系统由一墙可动的机器人花组成 每个机器人模块通过局部通信协调 感知光线、人体动作及邻居状态 集体决定开合以透光或遮阳 [3][4] 机器人模块设计与功能 - 单个机器人模块称为SGbot 其核心动作是类似花朵的“绽放” 驱动方式极其精简 仅用一根螺纹杆牵拉中心固定的圆形薄塑料片 使其屈曲形成花瓣状截锥体 [6] - 该基于屈曲的单自由度驱动 避免了复杂折纸结构的卡滞问题 以最少的机械复杂度实现了柔和、有机的三维形态变化 从完全展平到完全“绽放”约需10秒 背部LED灯条可变换颜色以增强艺术表达 [6] - 研究团队首先将16个SGbot部署在办公室窗户上测试自适应遮阳能力 [7] 系统算法演进与性能 - 初始版本中 每个机器人仅根据自身背后的光传感器独立调整绽放程度 其开合与光照强度高度相关 相关系数达0.98 但此模式无法应对个体故障及考虑屋内整体光照偏好 [8] - 升级版采用了基于意见动力学的群体智能算法 该算法让每个机器人决策时参考三个意见:自身感知的阳光、邻居的意见、房间中央传感器测得的实际照度与用户设定理想值的比较 权重根据故障和光照条件动态调整 [9] - 在模拟测试中 系统能承受通信中断、自身传感器失灵、房间传感器故障等情况 整体行为几乎不受影响 [9] 人机交互与艺术应用 - 在公开展览中 由36个SGbot组成的阵列面对超过100名参观者 运行流畅稳定 展示了多种交互模式 包括自主呈现光与形态波浪的被动观察模式 以及参观者用手势控制单个机器人开合的主动触碰模式 [9][11] - 高潮部分是与专业舞者AJ的即兴表演 舞者佩戴内置传感器的腕带 其手臂动作被映射为不同的LED光色指令 触发机器人群体产生特定的颜色传播模式 [13] - 舞者AJ描述此体验创造了一种新的伙伴关系 她无法完全控制群体 但能与之实时互动、互相影响 形成一种独有的秘密语言 展览收获约95.8%观众的积极评价 “酷”、“互动”、“迷人”为高频词 [13][15][16] 未来应用前景与行业影响 - “群体花园”是一个强有力的概念验证 预示建筑立面将成为巨大的分布式机器人群体 能够像皮肤一样集体适应环境 调节光照、温度、通风 并响应人类需求 满足不同居住者的舒适偏好 [17] - 该系统还能通过动态美学提升空间体验 成为艺术表达的新媒介 激发创意与幸福 未来应用场景包括办公玻璃幕墙自动柔化阳光 家庭客厅墙面随心情变换动态艺术图案等 [17] - 研究团队下一步计划包括与建筑师合作进行长期实地部署测试、探索更可持续的材料、开发更多样的人机交互界面如语音控制 这项研究为自适应建筑打开了新思路 也为人与机器群体的互动开辟了新场景 [17]
《控制理论与应用》“具身智能与人形机器人”专刊征文通知
机器人大讲堂· 2026-02-13 14:04
行业技术范式转变 - 人工智能正经历从“互联网AI”向“具身智能”的范式转变 [2] - 视觉-语言-动作模型与世界模型的突破是这一转变的关键驱动力 [2] - 人形机器人被视为具身智能的最佳物理载体,正从“预编程执行”向“自主认知与决策”跨越 [2] 核心技术挑战与机遇 - 人形机器人的高维度、强非线性及欠驱动特性,使得“感知-决策-控制”闭环的实现极具挑战 [2] - 学术界致力于构建“大脑(认知规划)+小脑(运动控制)”的协同架构以应对挑战 [2] - 当前面临的关键问题包括Sim-to-Real虚实迁移鸿沟、灵巧操作的泛化性以及人机共融的安全性 [2] 前沿研究方向 - 人形机器人动力学建模与控制是核心基础研究方向 [5] - 基于视觉-语言-动作模型的端到端控制以及基于世界模型的预测与规划是前沿方向 [5] - 研究涵盖从多模态感知、灵巧操作学习到系统集成与评估的全技术栈 [5] 学术活动与时间节点 - 行业正通过专刊征稿推动控制科学、人工智能与机器人学的交叉融合 [3] - 征稿旨在深入探讨具身智能大模型如何赋能人形机器人的运动控制与交互能力 [3] - 最新研究成果的稿件提交截止日期为2026年9月30日,拟刊登日期为2026年12月 [9]
当机器人握住“固态心脏”:欣界能源量产突破,释放机器人进化新可能
机器人大讲堂· 2026-02-13 14:04
公司动态与产品发布 - 2026年2月10日,欣界能源宣布其位于杭州的2GWh固态锂金属电池量产线顺利直通,同时欣界能源科技(浙江)有限公司正式投入运营,标志着公司实现了从技术验证到大规模生产交付的关键跨越 [1] - 公司在直通仪式现场展示了为“众擎”具身机器人配套的最新固态电池包与电芯 [1] - 应用于具身机器人的固态电池单体能量密度已达400Wh/kg以上,容量为传统电池的两倍以上,续航能力较原有方案提升约100% [1] - 公司采用的固态电解质技术消除了液态电解液泄漏、燃烧等风险,并通过定制化设计让电池适应机器人 [1] - 公司具身机器人固态电池已通过针刺、挤压等测试,电池包采用多层次安全监控设计,为高可靠性应用奠定基础 [6] - 公司展示的系列方形、圆柱电芯及电池包体现了“深度定制”能力,包括高倍率放电模组、超薄设计、紧凑型电源及支持瞬时高功率输出的特种电芯方案 [7] 技术优势与行业定位 - 公司自创立起便深耕氧化物固态电解质体系,致力于攻克传统锂电池的能量与安全难题 [1] - 公司为具身机器人、eVTOL、高端消费电子、动力等领域提供高效能固态电池解决方案 [1] - 固态电池的先天安全优势为人机共融场景提供了至关重要的保障 [6] - “400Wh/kg以上”的能量密度参数在行业人士眼中是一个关键转折点,能解决具身机器人因“仿生体积约束”与“高频放电需求”导致的续航与安全双重困局 [3] - 公司早在2023年便已完成具身机器人电池的验证,随着华南中试线扩建,同年即实现了该电池的批量交付 [4] - 固态电池的技术特性正解锁机器人形态创新的更多可能 [7] 量产规划与产业影响 - 量产的核心价值在于将前沿技术转化为稳定、可预期的供应链能力,使机器人企业可基于确定的电池参数进行系统设计并获得稳定货源 [10] - 随着产能爬坡与工艺优化,固态电池的成本曲线将逐步下行 [10] - 公司公布的产能规划显示,目前正在筹备8GWh产线的建设,规模化效应有望进一步降低制造成本,加速固态电池在具身机器人领域的普及 [10] - 欣界能源的量产突破为机器人产业提供了一种重新定义机器人能力边界的基础可能 [12] 相关产业链企业列举 - 文章列举了工业机器人、服务与特种机器人、人形机器人、具身智能企业、医疗机器人企业及上游产业链企业等多个细分领域的众多公司名称 [14][15][16][17]
从家电巨头到全球机器人前四,美的八年布局终破局
机器人大讲堂· 2026-02-13 08:00
公司机器人业务的核心地位与转型 - 公司已从家电企业转型为科技集团,机器人业务是其科技集团转型的核心基因,而不仅仅是家电业务的附属品[3] - 公司是全球前四的工业机器人制造企业,拥有全国最大的机器人生产基地[3][4] - 公司机器人业务2024年全年营收突破300亿元,已成为ToB板块的核心增长极[3][15] 技术与产能实力 - 公司拥有全球前四的工业机器人制造地位,顺德园区是全国最大的工业机器人生产基地,2025年交付量突破3万台[4][5] - 公司拥有机器人领域唯一依托企业的高端重载机器人全国重点实验室(蓝橙实验室),聚焦核心零部件等四大核心领域[5] - 公司研发了行业首款六臂轮足式超人形机器人“美罗U”,采用“六臂+轮足”设计,作业效率堪比3名工人,移动速度是传统双足机器人的2倍[7] - “美罗U”在无锡工厂应用,使生产线换线效率提升30%,每年可节约成本超800万元,投资回收期仅18个月[7] - 近三年公司累计研发投入超430亿元,2025年上半年研发投入达88亿元,同比增长14.4%[8] - 公司核心零部件自研比例超70%,自主研发的谐波减速器精度超越日本同类产品15%,空心杯电机能耗降低27%[8] - 公司已实现从核心零部件到整机设计的机器人全产业链技术自主[10] 战略发展路径与整合 - 公司机器人发展采取“先工业、后商业/家庭”的稳健务实路线,不追求短期效应[11] - 2017年收购库卡后,经历了长达八年的磨合期,最终通过尊重其独立性并组建联合研发团队实现技术与市场的融合[11][12] - 截至2025年,库卡中国业务收入占比已提升至30%,双方协同进入深水区[12] - 借助库卡经验,公司工业机器人在中国市场占有率升至9.4%,并实现技术出海[12] - 公司以自身家电工厂作为工业机器人的“试验田”(如荆州、无锡工厂),完成技术迭代和场景验证后,再向商业和家庭场景延伸[14] - 面向商业与家庭的“美拉”系列服务机器人计划于2026年进驻重点城市线下体验店,是公司向消费级机器人跨越的关键一步[14] 业务表现与增长驱动 - 2025年前三季度,公司机器人与自动化业务营收达226亿元,同比增长9%[15] - 公司ToB业务占比从2020年的18.5%提升至2025年上半年的25.7%,机器人是其中的核心[15] - 公司为机器人业务打造了“技术+场景+生态”三重支撑,其中“场景协同优势”显著,可利用自身庞大的制造业场景进行技术验证和成本优化[15][16] - 公司通过美的库卡智能制造科技园打造产业生态集群,园区供应链配套率达85%以上,并作为广东省机器人重点产业链“链主”推动形成全产业链生态圈[16] - 公司机器人应用已从家电制造拓展至汽车、航空航天、电子、医疗、物流等多个行业[17] 生态协同与未来布局 - 机器人是连接公司所有业务的核心纽带,实现“家电机器人化”与“机器人家电化”的协同[18] - 公司机器人业务与新能源、医疗、智能建筑等ToB业务深度融合,例如在零碳园区与光伏、储能系统协同[20] - 公司正从“技术应用者”向“标准制定者”转变,机器人是其技术标准输出的重要载体[20] - 在全球化方面,公司计划在2026年将海外本地制造率提升至70%以上,并借助库卡的全球渠道推动机器人业务全球落地[20]
国地中心×北理工“龙驭”小脑模型发布:驾驭身外化身!实现人形机器人零样本全身高动态动作追踪!
机器人大讲堂· 2026-02-12 22:00
技术发布与核心特点 - 国家地方共建人形机器人创新中心与北京理工大学联合研发的人形机器人“身外化身”小脑模型“龙驭”已正式发布 [1] - “龙驭”旨在让机器人实时复刻人体全身高动态动作,需在控制更多自由度的基础上兼顾本体运动平衡,对运控算法要求极高 [1] - 该模型仅需前期少量动作数据训练,即可零样本泛化至真实场景的实时动捕、视频衍生动作及全身遥操作等多样输入 [1] - 模型具备三大核心特点:“胃口小”(仅需少量动作数据)、“动作精”(精准复现快速剧烈运动)、“响应快”(可抗扰动并自动恢复) [2] 应用前景与目标 - 基于“龙驭”模型,致力于实现远程全身操控,应用于工厂作业、远程会议、养老看护、火灾救援、危险排爆乃至月球基地建设等场景 [3] - 该模型可协助采集人体与机体同步的高质量全身动作数据集,助力机器人智慧积累 [4] - 目标是为机器人构建身体协调与控制的基础能力,打造全能“机器人小脑”,为未来实现高度自主行动奠定基础 [5] 技术方法与架构 - “龙驭”小脑模型的核心方法由高质量数据集构建与创新的策略架构两部分组成 [14] - 高质量数据集基于约3.5小时的精炼运动数据,数据源选自LAFAN1与AMASS两大动捕数据库的精选子集,并经过严格的质量控制流程 [15] - 模型采用基于动态条件命令聚合的创新控制框架,其核心是一个由因果历史编码器与多头交叉注意力命令编码器组成的策略网络 [18][19] - 策略网络观察输入包含本体感觉和参考运动命令,输出为残差关节位置命令,通过PD控制器生成最终关节扭矩 [20] - 动态条件命令聚合机制使策略能根据当前物理状态,自适应地选择可靠命令片段并抑制异常,从而用少量数据训练出强大的策略网络 [22] 性能评估与优势 - 在基线对比实验中,“龙驭”框架在动捕数据、视频衍生运动及地面交互运动三种运动源上,均取得最高任务成功率与最低平均关节位置误差 [23][24] - 具体性能数据:在动捕数据上任务成功率达98.3%,平均关节位置误差为41.12 ± 0.12;在视频衍生运动上成功率达94.6%,误差为46.56 ± 0.28;在地面交互运动上成功率达90.1%,误差为54.92 ± 0.93 [23] - 架构消融实验验证了因果历史编码器与交叉注意力命令编码器的关键作用,替换为CNN或自注意力变体会导致性能下降 [25] - 该框架能实现高动态运动(如奔跑、跳跃、武术、舞蹈)的精准稳定跟踪,并具备强大的零样本泛化能力 [26] - 框架集成了自动倒地恢复能力,通过随机恢复环境初始化与渐进式辅助力设计,使机器人能自主应对失衡并快速恢复 [27][28] 系统兼容性与集成 - 框架具备多源输入兼容性,能灵活处理从高精度动捕、VR设备遥操作、动捕服遥操作到手柄控制等多种类型的参考命令 [29] - 支持基于消费级VR设备(如PICO)和专业动作捕捉服的双模式遥操作,为采集多样化、高质量的机器人示范数据提供灵活方案 [30] - 该框架可作为底层运动模型(“小脑”),与上层的全身视觉语言动作模型集成,共同实现解析自然语言指令并完成复杂具身任务(如物流搬运) [31][32] 行业生态 - 文章末尾列出了广泛的行业生态企业名单,涵盖工业机器人、服务与特种机器人、人形机器人、具身智能企业、医疗机器人及上游产业链企业 [35][36][37][38][39][40][41]
Science Robotics最新成果:模块“死了”也能跑,EPFL让机器人集体“共享续命”
机器人大讲堂· 2026-02-12 17:15
模块化机器人可靠性研究突破 - 瑞士洛桑联邦理工学院(EPFL)的研究彻底反转了模块化机器人领域“模块越多,故障概率越大”的传统矛盾曲线,提出了一套统一的本地资源共享方法论,使得系统可靠性随模块数量增加而上升[1] - 在实验中,一个完全“死掉”(无电池、无传感器、无无线通信)的模块,仅凭邻居模块的资源“接济”就能恢复全部功能,并与其他模块共同完成复杂运动任务[1][13] - 该研究成果以“Scalable robot collective resilience by sharing resources”为题,于2026年2月11日发表在顶级期刊《Science Robotics》上[1] 研究灵感与核心逻辑 - 研究灵感来源于生物界的本地资源共享机制,如细胞间共享营养、菌根网络共享资源、鸟类集群共享感知信息等,其核心逻辑是通过本地交互互相弥补不足,使整体比个体更强韧[5][6] - 研究团队将此思路应用于模块化机器人,瞄准了电力、通信和感知三种最关键的资源,提出了一套涵盖所有三种资源的本地共享方法论[6] - 通过严格的概率模型证明,仅共享一两种资源时,系统可靠性仍会随模块数增加而下降;只有当三种关键资源全部实现共享时,曲线才会反转,模块越多系统越可靠[6] 统一的资源共享模型与实现 - 研究提出了一个统一的共享模型,将电力、通信和感知三种不同物理域的资源纳入同一框架进行设计和分析,关注传输机制、振荡抑制、瓶颈控制和传播方式四个共性维度[8] - **电力共享**:开发了一种新型电路,可通过模块间用于数据传输的电气触点同时传输电力,无需改动机械结构,电流大小与电压差成正比(实测比例系数为1.440ΔV),电流被限制在0.5A以内[8] - **通信共享**:设计了混合通信算法,默认通过Wi-Fi下发指令,当模块无线通信失效时,自动切换至本地有线网络逐跳转发消息,关闭一个模块的Wi-Fi可降低约36mA电流消耗,与其实测功耗37mA高度吻合[9] - **感知共享**:提出分布式传感器融合算法,利用重力方向等公共因子传播状态估计信息,计算复杂度不随模块数量增长,可在74MHz嵌入式处理器上实时运行,即使模块所有传感器被禁用,也能凭邻居的估计值维持精确感知[9][10] 系统级演示与效果验证 - 在系统演示中,团队将四个Mori3模块连接成三脚架结构执行复杂运动任务,其中中心模块被设定为完全“死亡”状态[13] - **无资源共享对照实验**:中心模块“死亡”后,三脚架结构失去行走能力,存活模块只能以轮子滑行,更耗电且运动缓慢,在运行809秒后因模块电量耗尽不断重启,任务失败[13] - **启用资源共享后**:通过本地电力共享、混合通信和传感器融合,中心模块被邻居“复活”恢复全部功能,四模块三脚架成功完成行走、压低身体通过低矮桥梁、恢复行走并到达目标位置,整个任务在444秒(7分24秒)内顺利完成[13][14] 方法适用性与扩展前景 - 该方法适用于模块未被物理摧毁、仍保有一定子系统自主性的场景,要求模块间存在电气连接、本地通信能力以及某种公共感知因子(如重力、气压、太阳辐射、磁场方向或时间)[16] - 所建立的资源共享和容错原理同样适用于大规模机器人集体,并可延伸至能够对接实现能量和信息传输的机器人蜂群[16] - 该研究证明,通过本地资源共享,模块化机器人的适应性和可靠性可以同时获得,解决了其走向实际应用的核心障碍[16] 相关机器人产业链企业列举 - 文章末尾列举了工业机器人、服务与特种机器人、人形机器人、具身智能企业、医疗机器人企业及上游产业链等多个领域的众多相关公司,显示了该技术可能应用的广泛生态[18][19][20][21][22]
中科第五纪联合中科院自动化所团队推出 BridgeV2W,让机器人学会"预演未来"
机器人大讲堂· 2026-02-12 17:15
文章核心观点 - 具身智能公司中科第五纪联合中科院自动化所团队推出BridgeV2W模型 通过引入“具身掩码”这一中间表征 成功将机器人坐标空间的动作映射到视频生成模型的像素空间 从而打通了预训练视频生成模型与具身世界模型之间的桥梁 使机器人获得可靠的“预演未来”能力 [1][5][20] - BridgeV2W的设计一举解决了当前具身世界模型面临的三大核心挑战:动作与画面“语言不通”、视角变化导致预测质量骤降 以及难以构建跨机器人平台的统一模型 [3][4][5][9] - 该技术路线展现出巨大潜力 其训练时可利用海量无标注人类视频扩展规模 推理时依赖轻量几何信息保证精度 为构建可扩展的通用机器人世界模型开辟了新路径 [15][16][17][18] 技术挑战与解决方案 - **核心挑战**:当前具身世界模型面临三大难题 1) 机器人动作语言(关节角、位姿坐标)与视频生成模型语言(像素)不匹配 2) 模型预测对相机视角敏感 换视角后预测质量骤降 3) 机器人结构差异大 难以构建统一的世界模型 需为每种机器人定制架构 [3][4] - **核心创新**:BridgeV2W提出“具身掩码”概念 利用机器人的URDF模型和相机参数 将动作序列实时渲染为每帧图像上的二值“动作剪影” 从而将坐标空间的动作直接“画”进像素画面中 [5] - **技术实现**:采用ControlNet式的旁路注入 将具身掩码作为条件信号融入预训练视频生成模型 同时引入光流驱动的运动损失 引导模型聚焦于任务相关的动态区域 [6] 模型性能验证 - **在DROID数据集上的表现**:DROID是目前最大规模的真实世界机器人操作数据集之一 BridgeV2W在PSNR、SSIM、LPIPS等核心指标上超越SOTA方法 在“未见视角”测试中 BridgeV2W生成物理合理、视觉连贯的未来视频 验证了其视角鲁棒性 在“未见场景”下泛化能力同样出色 [8][10] - **具体数据对比**:在DROID数据集“未见视角”测试中 BridgeV2W的PSNR为20.87 SSIM为0.833 LPIPS为0.127 FVD为191.3 Mask-IoU为55.3 均优于对比方法IRASim、Cosmos和EVAC [10] - **在AgiBot-G1数据集上的表现**:AgiBot-G1是一个双臂人形机器人平台 自由度与运动模式与DROID单臂平台截然不同 BridgeV2W无需修改模型架构 仅替换URDF并重新渲染掩码 就能无缝适配并取得媲美单臂的预测质量 [13] 技术优势与应用潜力 - **三大难题的破解**:1) 动作-像素对齐:掩码是天然的像素级信号 与视频模型输入空间完全匹配 2) 视角自适应:掩码随当前相机视角动态生成 动作与画面始终对齐 3) 跨具身通用:只要提供URDF 单臂、双臂机器人都能用同一套框架生成对应掩码 无需修改模型结构 [9] - **下游任务应用**:1) 策略评估:在世界模型中“试跑”不同策略 其评估结果与真实成功率高度相关 大幅降低策略迭代成本 2) 目标图像操作规划:给定一张目标图像 能在“想象空间”中搜索出可行动作序列 实现从视觉目标到物理动作的闭环规划 [14] - **数据利用的创新**:训练时无需URDF或相机标定 只需用分割模型(如SAM)提取的“分割掩码”即可提供有效监督 研究团队将AgiBot-G1机器人数据与无标定的Ego4D FHO人类手部操作视频混合训练 仅用SAM提取的手部掩码就实现了惊人效果 说明人类视频蕴含丰富的动作先验 [15][17] 行业意义与未来展望 - **技术路线优势**:BridgeV2W揭示了“视频生成模型 + 具身掩码 = 可扩展的机器人世界模型”这一前景路线 其优势在于:1) 能利用互联网上海量的人类视频数据 规模远超机器人数据数个数量级 2) 架构能自然受益于Sora、Wan等视频生成底座模型的升级 3) 展现出的跨平台、跨场景、跨视角泛化能力 是迈向通用具身智能的重要里程碑 [17][18][19] - **规模化训练新路径**:该技术为世界模型的规模化训练开辟了全新路径 训练无需URDF或相机标定 可直接利用海量无标注人类视频 [20] - **未来潜力**:当视频生成底座参数从十亿迈向千亿 训练数据从数千小时机器人视频扩展到百万小时人类操作视频 具身掩码从机械臂延伸至全身人形乃至多机协作时 机器人的“预演能力”将迎来巨大飞跃 [21]
冠军团队将斩获十公斤价值1000万元的纯金腰带 全球首个人形机器人格斗联赛URKL启动!
机器人大讲堂· 2026-02-12 17:15
文章核心观点 - 全球首个商业化人形机器人自由格斗联赛(URKL)于2026年2月在深圳启动,旨在通过高对抗性竞技平台,全面检验和推动人形机器人运动控制、智能决策、动态平衡与抗冲击等核心技术的实战化发展,并计划全球化扩张 [1][6][15] - 赛事以众擎机器人T800人形机器人为标准竞技载体,其体能超过90%成年男性,峰值扭矩达450N·m,峰值功率14000W,且赛事秉持开源理念,将公开T800源代码 [8][12] - 赛事不仅是一场“科技+体育”的创新融合,更致力于打造人形机器人产业生态超级平台,推动技术从实验室走向实战,并承载中国文化通过“中国机器人功夫模式”走向世界 [18][20][22] 赛事概况与规划 - 赛事全称为“全球人形机器人自由格斗联赛(URKL)”,由深圳众擎机器人发起,是全球首个专注人形机器人领域的商业化自由格斗赛事 [1] - 首届联赛贯穿2026全年,冠军团队将获得重达十公斤、价值约1000万元的纯金腰带 [2] - 赛制包含海选、小组循环赛和淘汰赛,最终16支正赛队伍角逐冠亚季军 [4] - 未来规划实现一年两届,首届在深圳,下一届有望选址香港,并计划登陆美国纽约、英国伦敦等国际城市 [6] 技术载体:T800人形机器人 - T800是本届联赛的标准竞技载体,于2025年12月发布,市场定价18万元起,是一款全尺寸通用人形机器人 [8] - 机器人搭载自研关节模组,协同输出可实现450N·m峰值扭矩,瞬间关节峰值功率达14000W,综合体能表现超过90%的成年男性 [8] - 为适配赛事开源理念,众擎机器人将公开T800的源代码,邀请全球俱乐部共同研发优化 [12] 赛事的技术检验目标 - 选择格斗形式是为了对人形机器人硬件可靠性进行最严酷的实战考验,并将抽象的电机性能、传动效率等技术参数转化为大众可感知的力量与速度比拼 [13] - 赛事核心目标直指检验人形机器人四大核心技术:运动控制、智能决策、动态平衡与抗冲击能力 [15] - 参赛机器人需与成人等高,模拟人类完成击打、闪避等高难度动作,这对协调数十个自由度关节、毫秒级智能决策、实时动态平衡及承受数倍体重冲击力提出了极致挑战 [17] 产业生态与全球化愿景 - 参赛队伍面向全球高校、企业、科研机构开放,旨在共同锤炼运动控制、平衡算法、感知决策等核心能力,推动技术从实验室走向实战 [18] - 赛事得到深圳龙岗区支持,常规比赛用地将落地于龙岗FRL机器人俱乐部 [18] - 赛事打造了“中国机器人功夫模式”,将中国“功夫”文化与体育竞技结合,让中国具身智能创新通过赛事走向世界 [20] - 众擎机器人位于深圳南山区的1万平方米工厂即将投产,河南郑州高新区200亩生产基地将于2026年启动建设,未来年产能有望突破10万台 [22]