遥操作
搜索文档
原腾讯Robotics X算法研究员创业,4个月获3轮融资,要在3-5年将人形机器人送进家庭
36氪· 2025-11-20 07:34
文|富充 编辑|苏建勋 "95后"朱庆旭是前腾讯Robotics X实验室研究员,2025年6月,他从Robotics X离开并创立了具身智能算法公司灵启万物。 《智能涌现》独家获悉,灵启万物成立4个月,已完成3轮融资,总融资额近亿元。第一轮由元禾原点独投;第二轮由和玉资本领投,英诺天使,元生创 投,锦秋基金跟投,老股东元禾原点超额跟投;第三轮由锦秋基金领投,梅花创投,卓源亚洲跟投,老股东英诺天使超额跟投,和玉资本跟投。 近日,灵启万物采用自己的算法结合宇树机器人本体,推出一组Demo。 从趴在床上除螨,到踩着板凳给花棚架高处的植物浇水等,在未经加速的视频中,机器人以接近真人的流畅度执行一系列家务。 △视频demo,图片:采访人提供 访谈中,朱庆旭提出了不少"反共识"的观点。 "我认为真正胜任家务场景的机器人构型,还是双足人形,而且应该在3-5年之内就可以达到,"朱庆旭说。 家庭场景以多样的非标任务、环境构成,这增加了具身智能在学习和泛化上的难度。加之双足构型本身在运动控制、平衡性和工程复杂度上存在挑战,因 此业内更倾向认为,双足人形机器人进家干活是5至10年后才会实现的"终极场景"。 朱庆旭坚信,双足人形机 ...
星尘智能CEO来杰:当AI开始操作世界,具身智能的“Windows时刻”何时到来?|「锦秋会」分享
锦秋集· 2025-11-04 20:51
行业核心观点与问题 - 语言智能改变了信息世界,而具身智能将重新定义物理世界 [4] - 尽管算法和算力在进步,但机器人产业的落地速度依然缓慢,行业在探讨为何尚未真正进入应用周期 [5] - 当前具身行业的核心瓶颈在于“交互层缺失”,类比于1970年代的计算机缺少“Windows时刻”,导致其难以从科研展示走向普及应用 [6] 具身智能的三层架构 - 公司将具身智能重新划分为三层结构:终端(本体硬件)、交互层RUI(遥操作系统)和驱动层(AI模型,软件),三者缺一不可才能让机器人真正可用 [6] - 该架构类比于个人电脑的“硬件-操作系统-应用生态”模式,旨在构建一个完整的产业框架 [15][21] 公司背景与产品进展 - 公司成立于2022年,是从腾讯机器人实验室走出的团队,专注于人形机器人的研发与落地 [13] - 公司的人形机器人已实现量产,并在多个场景中投入应用,例如在去年8月推出了能完整弹奏扬琴的机器人 [13] - 公司计划在年底推出新一代更具成本优势的机器人版本 [13] - 公司的机器人性能设定为成年男性能力的115%,在负载、加速度和速度上略高于人类 [40] - 公司目前的机器人性能已超过北美热门的1X机器人,且已有产品在北美被用户使用 [41] 技术路径与创新:绳驱与力觉 - 公司率先量产绳驱机器人,其技术起点源于对移动类和操作类机器人的研究积累 [28] - 技术创新的核心思路是突破行业对视觉感知的依赖,转向以“力”为中心的“力觉智能”,让机器人能像盲人一样依靠感觉工作 [31][33] - 通过两个极端实验(开门、拉门)验证了“力引导”方式在解决复杂物理交互问题上的有效性 [32] - 绳驱结构允许电机和关节分布式布局,类似人体肌肉分布,并能提高传动效率3~5% [39] - 准直驱系统(QDD)具有结构简单、成本低、高透明度和反驱性能、惯性小、高力控带宽等优势 [34][35][36][37] 交互层:遥操作的战略价值 - 遥操作(RUI)被视为具身智能落地的核心加速器,是弥补当前AI自主能力不足的关键过渡形态 [15][42] - 遥操作不是技术倒退,而是在现实世界中训练具身智能的“人机共演系统”,能确保系统可靠性 [47][48][49] - 公司已完成北京到深圳的远程高动态控制实验,以及跨国跨洲的远程控制验证,并采用低成本芯片方案实现实时传输 [51][52][53] - 遥操作在劳动力空缺、危险作业(如化学生物实验、深山老林勘探)等场景有强烈的商业需求 [55] AI模型与未来发展方向 - 公司认为VLA(视觉语言动作模型)与世界模型不是取代关系,而是互补,最终智能闭环需要“VLA + 世界模型 + 身体智能”共同构成 [15][61][62] - 未来发展的两个重点方向是“身体智能”(强调全身力学协同,如腰部发力)和“安全与力觉系统”(引入“E-sense”概念让机器人具备感受力的能力) [64] - 行业下一阶段需提供统一的平台以及上下游工具和资源支持(如数据集、接口工具) [63] 商业化与合作 - 公司在科研、商业服务、文娱展演、工业智造领域均有落地项目,例如工厂的上下料搬运、零售服务、以及在大剧院和机场的正式演出 [69] - 公司与清华、港大、MIT等研究机构有合作项目,研究团队常驻公司办公室共同开发 [69]
80后清华教授,与投资人联手创业,打造机器人界的Model 3
创业邦· 2025-10-24 11:34
公司核心技术与产品 - 公司选择以高质量遥操作技术为核心,推出万元级、低延迟、高精度、高易用性的遥操作机器人系统,旨在打造机器人界的“Model 3” [4][5] - 公司构建了一套完整的“机侧-人侧-控制平台”三大核心模块的遥操作具身智能系统,机侧TeleAvatar机器人主打轻量化与实用性,人侧CyberBraceletVR设备价格据称仅为外骨骼和动作捕捉设备的1/10甚至更低 [19][20] - 系统操作延迟仅30毫秒,达到“人类实操无明显延迟感知”的水平,轮式双臂遥操作机器人本体售价不到10万元人民币 [22] - 技术路径选择渐进式发展:从遥操作切入,通过数据飞轮迭代,逐步实现从L0到L2级人机混驾,最终走向AGI通用人工智能机器人 [23] - 产品采用减法逻辑:采用轮式底盘、省略灵巧手与腰颈自由度,以毫米级精度换取成本与可靠性的平衡,通过软件能力弥补硬件精度 [23] 公司团队与创立背景 - 公司由两位相识二十余年的80后清华校友联手创立,创始人兼首席科学家莫一林拥有卡内基梅隆大学博士、加州理工学院博士后背景,师从美国工程院院士 [7] - 公司CEO金戈出身清华自动化系,曾担任远镜创投管理合伙人、奥量光子副总裁,兼具高科技创业投资与企业管理双重经验,曾带领奥量光子实现2000万销售额 [9] - 两位创始人的友谊始于清华BBS,技术背景与商业管理能力高度互补,最终决定联手创业 [13][14] 融资历程与市场热度 - 公司于2025年2月正式成立,但首笔融资在公司注册前就已敲定,从首次技术演示到签署投资条款协议速度极快 [16][17][18] - 2025年5月公司完成千万元级种子轮融资,英诺天使基金领投,水木校友种子基金、远镜创投跟投;三个月后的2025年8月再获千万元级种子+轮融资,华映资本领投,老股东跟投 [18] - 公司成立7个月正在进行第三轮融资,每周见十几位投资人,CEO金戈用“前所未有”形容当下的融资节奏,表示干了十几年投资从未见过像今天具身智能市场这样的热度 [45] 商业化策略与市场应用 - 公司商业化策略聚焦现有型号持续优化而非频繁推出新品,以确保数据有效性为核心考量 [29] - 公司制定了清晰的五级金字塔商业化策略:科研与数据采集场景为基石,随后是特种行业、非流水线工商业场景、流水线工业,家庭场景为终极挑战 [33] - 应用场景分为两大类:第一类是改善工作环境、降低安全风险,例如隧道爆破作业中填装炸药;第二类是效率提升,例如夜间零售方案可使5家门店人力成本降低约80%,美国物流客户案例预计成本下降超过80% [35][36] - 公司已开始向科研院所和数据采集中心发货,潜在需求达一两百台,已签约近10台,今年目标产出100台,明年计划提升至1000台 [37][39] 行业定位与数据战略 - 公司直面机器人行业“数据荒”的难题,通过易用系统和低成本方案,让数据采集从投入变为可持续闭环 [26] - 遥操作系统极致易用,新手一两分钟即可上手,熟练操作员半小时就能完成叠衣服等复杂任务,机器人在端盘子、送物品的同时就在采集数据,使数据采集从纯投入转变为可持续闭环 [26][27] - 公司参考自动驾驶分级标准,将具身智能划分为L0到L4五个阶段,L2级别现在就能实现,例如夜间药店场景一人可同时操控5台机器人,从遥操作到L2自主估计仅需三个月数据积累 [30][32]
具身性在移动操作机器人直观全身遥操作中的作用与性能评估
具身智能之心· 2025-09-08 08:03
研究核心观点 - 研究聚焦移动操纵机器人遥操作界面设计 探索控制范式与视觉反馈模态对长期任务性能的影响 旨在平衡具身感 认知负荷与任务效率[3] - 研究发现解耦具身控制器(SBC)比耦合具身控制器(WBC)任务完成时间短169秒(p=0.025) 操作更灵活[19] - 带VR视觉反馈使任务完成时间增加142秒(p=0.026) 并显著降低操作者可用性(SEQ p=0.003, UMUX p=0.006) 增加认知与体力负荷[19][22][23] - 耦合具身控制器(WBC)收集的数据更适合模仿学习 训练的策略成功率80% 而SBC数据训练的策略成功率为0%[32] 研究背景与目标 - 移动操纵机器人数据集稀缺 核心瓶颈在于移动性扩大操作空间的同时增加控制与反馈复杂度[3] - 研究针对长期移动操纵任务 需全身协调 误差恢复及长时间操作稳定性 是此前研究忽视的复杂场景[3] - 核心目标是探索控制范式(耦合具身/解耦具身)与视觉反馈模态(VR/传统屏幕)对操作者体验的协同影响[3] 遥操作系统设计 - 系统以PAL Tiago++全向底座机器人为控制对象 搭配HTC Vive Pro VR设备 测试4种界面组合[5] - 解耦具身控制器(SBC)将底座运动与臂运动独立控制 臂控制采用逆运动学求解器以30Hz运行 底座控制采用3D方向舵[6] - 耦合具身控制器(WBC)以15Hz频率运行 通过任务空间逆动力学实现全身控制 支持末端执行器模式与全身操纵模式切换[6] - 视觉反馈模态差异在于操作者获取机器人视野的方式:带VR模态可切换3个立体相机视角 无VR模态通过外部屏幕查看视频流[12] 实验设计与评估 - 采用混合设计方案:控制器为被试间变量(WBC/SBC) 反馈模态与尝试次数为被试内变量(带VR/无VR, Trial 1-3)[9][10] - 20名被试按VR经验 电子游戏经验等多维度分层 确保两组控制器被试特征均衡[13] - 评估指标涵盖行为指标(任务完成时间 成功率 工效学数据)与态度指标(可用性问卷 工作负荷问卷 模拟眩晕问卷)[15][18] - 单名被试实验时长约2小时 包含仿真训练 真实场景训练与任务测试环节[14] 关键研究发现 - 任务完成时间受反馈模态与控制器显著影响:带VR模态增加142秒 SBC比WBC缩短169秒 Trial次数存在边际学习效应(减少31.64秒/次,p=0.12)[19] - 所有条件下任务成功率均较高(平均得分9.4/10) 控制器类型 反馈模态与Trial次数均无显著影响[19] - 带VR模态显著降低可用性(SEQ p=0.003, UMUX p=0.006) 操作者认为VR模式下任务更难[22] - 带VR模态下认知需求 体力需求更高 性能感知更低 整体负荷显著上升 NASA TLX问卷显示负荷得分落入"高负荷"区间[23] - 控制器对负荷维度影响不同:SBC引发更高物理需求(p=0.02) WBC引发更高挫折感(p=0.009)[23] - 工效学评估显示长期操作存在中等肌肉骨骼风险(RULA平均得分4.12±0.27) 风险主要来自上臂与手腕[26] - WBC的质心偏差波动显著大于SBC 因底座运动需通过控制器位姿差异激活 导致身体姿态调整更频繁[26] 专项分析 - SBC用户在带VR模态下使用机器人头部相机比例60.4±38% 显著高于WBC用户36.8±39%(p<0.0001) 表明具身感更强[32] - 真实场景中VR引发的眩晕感接近显著水平 优化视频流延迟与分辨率可降低眩晕[32] - 仿真训练有效性获认可(OATS评分4.8±1.2/7分) 但任务难度感知显著高于真实场景(带VR p=0.015 无VR p<0.0001)[32] - 模仿学习实验中WBC数据训练的策略成功率80% SBC数据训练策略成功率0% 因SBC数据缺乏臂-底座耦合信息[29][32]
数据困局下的具身智能,谁能率先破局?
机器之心· 2025-08-10 09:30
数据困局下的具身智能 - 具身智能面临真实数据严重不足的挑战,目前多数机器人基础模型仅依赖不足1%的真实操作数据,导致物理常识缺失和泛化能力受限[5] - 行业对数据类型选择存在分歧:真实数据能反映物理交互但采集成本高,合成数据成本低且易扩展但存在"domain gap"问题[6][7] - 真实数据派代表Levine指出,模型能力提升会放大仿真与现实的差异,削弱泛化能力,认为只有真实数据才能实现通用具身智能[7] - 合成数据派代表王鹤提出需要上万亿token规模数据,但当前最大数据集仅百万级别,认为具身智能爆发必须依赖合成数据先行[8] - 合成数据应用案例:GraspVLA模型通过十亿级合成数据预训练+少量真实数据微调,已在零售、导航场景实现商业部署[8] 技术路线之争 - 遥操作成为真实数据主要采集方式,依赖人类示范支持模仿学习,但面临控制效率与扩展能力的平衡问题[9] - Sim2Real技术路径依赖合成仿真数据,优势在于可控性强、成本低,适合大规模预训练与策略泛化[9] - 多模态遥操作系统探索语言+手势+触觉融合,可能降低人类操控门槛[1] 商业模式创新 - OpenAI董事会主席Bret Taylor批判"按token计费"模式,认为市场终将选择"按成果付费"[2] - 提出"应用AI"是创业方向,"长尾Agent公司"可能取代传统SaaS[2] - Sierra公司正在实践结果导向的商业模式,探索AI编程新范式[2] 行业动态 - Skild AI最新进展聚焦解决真实数据不足问题,倡导融合多样化数据尤其是大规模视频数据[5] - 本期通讯包含30项AI&Robotics要事,其中国内8项、国外9项、技术13项[2]
具身数采方案一览!遥操作和动捕的方式、难点和挑战(2w字干货分享)
自动驾驶之心· 2025-07-10 20:40
遥操作概念与历史 - 遥操作起源于太空探索和军事领域,已有几十年历史,早期应用于手术机器人和远程挖掘机等场景[8][10] - 传统定义为通过设备远距离操控机器人,需具备空间隔离特性[10] - 具身智能兴起使遥操作重要性提升,因数据驱动范式需要真机采集实际场景数据[15][17] 当前遥操作技术方案 - 主流方案包括同构臂控制、VR操控和纯视觉IK解算[21][28] - 纯视觉IK方案因操作自由度高而受青睐,但存在遮挡问题[23][30] - 动捕系统面临精度挑战,需解决不同体型操作者与标准机器人的映射问题[73][78] 技术挑战与创新 - 系统延迟是关键瓶颈,整体需控制在40毫秒以内以避免眩晕[33][117] - 异构手部控制是难点,需设计新型映射算法解决结构差异[82] - 移动平台与机械臂协同控制尚未形成稳定技术路径[96][97] 行业应用与案例 - ALOHA系统创新性地整合移动操作最小配置与端到端算法框架[102] - 手术机器人采用主从臂设计实现精准控制,但存在视野遮挡问题[8][106] - 挖掘机遥操作通过1:1驾驶舱复刻实现85%现场操作效率[123] 未来发展方向 - 可能演进路径包括纯虚(无穿戴)和纯实(力反馈外骨骼)两种方案[37][45] - 需建立智能辅助系统,类似汽车ESP提供自动补偿功能[124][125] - 终极解决方案可能是脑机接口,直接传递运动意图[36][144] 人机交互设计 - 优秀系统应充分调动人手眼协调能力,建立自然操作直觉[53] - 3D显示技术(VR/裸眼)可提升操作沉浸感但面临眩晕挑战[113][114] - 语言、手势等多模态输入将共同构成未来交互方式[142][143] 机器人操作系统 - 当前ROS系统以功能模块为核心,未来需转向以人为中心设计[145][146] - 可能出现类似安卓的标准化平台,统一硬件接口和开发工具[146] - 行业存在封闭化趋势,各厂商开发私有中间件导致生态碎片化[154][155]
具身数采方案一览!遥操作和动捕的方式、难点和挑战(2w字干货分享)
具身智能之心· 2025-07-09 22:38
遥操作技术发展现状 - 遥操作概念起源于太空探索和军事领域,已有数十年历史,早期应用于手术机器人和远程挖掘机等场景[6][10] - 具身智能的兴起使遥操作技术重要性显著提升,主要因其在数据采集方面的关键作用[15][17] - 当前主流遥操作方案包括同构臂控制、VR操控和视觉动捕技术,其中纯视觉IK方案因操作自由度优势获得专家认可[21][29][31] 技术挑战与解决方案 - 系统延迟是核心瓶颈,整体延迟需控制在40毫秒以内以避免眩晕,远程操作普遍面临100毫秒延迟难题[34][118] - 异构映射问题突出,特别是手部操作环节,需设计新型reward函数优化人手到机械手的转换[83] - 动捕系统面临精度与自由度平衡难题,光学方案精度高但设备复杂,纯视觉方案便捷但存在遮挡问题[74][94][96] 行业应用场景 - 医疗领域已实现四手手术机器人系统,医生通过同构操作台完成精密手术[6] - 工程机械领域出现远程遥控挖掘机,操作员可在空调房内完成作业[6] - 人形机器人控制提出驾驶舱概念,通过多功能按钮集成实现移动与关节协同操作[68][71] 技术演进方向 - 未来可能形成纯虚(纯视觉)与纯实(力反馈外骨骼)两种互补方案[38][45] - 智能辅助系统将成为关键,类似汽车ESP的自动补偿机制可提升操作效率[125][126] - 脑机接口被视为终极解决方案,可绕过当前感知-动作转换链条的直接控制[37][144] 行业生态建设 - 标准化缺失制约发展,ALOHA系统首次提供完整硬件算法套件但尚未形成行业标准[103][109] - 机器人操作系统需从功能模块导向转向以人为中心,类似Windows的交互范式变革[146][147] - 封闭生态趋势显现,各厂商自定义中间件导致底层适配工作量大,亟需统一平台[159][160] 商业价值展望 - 遥操作将长期存在,即使实现AGI仍需要保留人类参与感和控制权[134][136] - 分身应用场景潜力巨大,可实现跨空间实体存在,但受限于图传等技术瓶颈[61][122] - 设计理念转向"Teleoperation First",将遥操作作为产品核心而非过渡方案[161][162]
【万字长文】独家圆桌对话:具身下一站,我们究竟需要怎样的本体?
具身智能之心· 2025-06-24 22:09
圆桌背景 - 圆桌讨论聚焦具身智能领域机械臂构型设计问题 由格灵深瞳算法总监赵仲夏发起 [1][3] - 嘉宾来自智元机器人 清华大学等机构 涵盖算法 控制 硬件等多领域专家 [1][8] - 讨论内容包括机械臂自由度选择 末端执行器设计 双臂协同等核心议题 [4] 机械臂自由度争议 - 六轴机械臂是完成通用任务的最小解 但存在奇点和解空间不连续问题 [27][29] - 七轴机械臂更接近人体构型 能更好解决奇点问题 适合遥操作场景 [31][33] - 行业存在技术路线分歧:极简六轴方案利于算法收敛 仿人七轴方案可利用人类数据先验 [34][42] 构型设计关键因素 - 工作空间需匹配人类操作范围 避免遮挡和奇异点频繁出现 [38][47] - 减速器选择影响性能:谐波减速器精度高但力控差 行星减速器响应快但存在背隙 [56] - 具身机械臂需平衡力量 速度 灵巧性等参数 当前市场缺乏理想解决方案 [50][52] 末端执行器选择 - 灵巧手硬件成本高昂(单只6-7万元) 算法控制难度大 实际效用存疑 [60][63] - 夹具方案性价比突出 可完成90%灵巧手演示任务 [62][68] - 未来可能发展模块化末端 通过快装机构切换不同功能执行器 [64][66] 双臂协同价值 - 双臂在家庭服务等场景具有优势 但大幅增加系统复杂度 [73][76] - 单臂方案在物流等特定场景更高效 韩国已有移动单臂物流机器人落地 [72] - 遥操作双臂面临力控协调难题 当前技术难以实现精确双边力反馈 [76] 行业终局展望 - 短期聚焦L2级人机共驾 遥操作仍是核心技术保障 [79][89] - 数据采集方式可能变革 低成本摄像头方案或突破机器人数据瓶颈 [81] - 具身智能可能演进为人机交互平台 而非纯自动化设备 [82][84] - 语言交互存在局限性 动作交互蕴含更高信息量 需探索混合交互范式 [84][86]
【圆桌正当时】机器人不能没有方向盘,你的遥操够丝滑吗?
具身智能之心· 2025-06-20 08:44
行业趋势与概念发展 - 具身智能概念诞生于1950年 但当前热潮本质是Robot Learning学科从规则驱动范式转向数据驱动范式的变革 类似AI 1.0时代人脸识别领域的技术跃迁 [3] - 基于遥操作采集数据训练的模型已能完成叠衣服、系鞋带等传统规则驱动难以实现的任务 标志着技术路径的根本转变 [3] - 人形机器人热潮推动中国机器人供应链快速成熟 本体构型呈现百花齐放态势 遥操作技术从辅助工具升级为行业核心要素 [3] 技术发展阶段类比 - 当前机器人行业处于马车向汽车过渡的早期阶段 如同手机行业在功能机时代的多样化探索 缺乏标准化操作硬件和软件架构 [4] - 机器人领域尚未形成类似汽车方向盘或手机安卓系统的统一交互标准 操作系统的工程化水平仍处于初级阶段 [4] - 即使模型驱动算法短期难突破 开发人类友好型机器人操作系统仍可成为推动行业发展的第二引擎 [4] 商业化路径与生态建设 - 行业需要并行推进全无人方案与渐进式辅助驾驶方案 类似自动驾驶领域的技术落地策略 [5] - 亟需构建ROS3.0级别的具身机器人操作系统 形成类似柳树街车库的开发者生态 联合工程师、研究机构与工业企业共同推进 [4][5] - 大模型技术加速机器人行业进步 催生多元化供应链体系 为新产品品类诞生创造条件 [4] 技术研讨方向 - 重点关注遥操作技术的标准化进程 其可能成为机器人领域的"方向盘"或"安卓系统" [5] - 探索具身智能渐进式落地方案 平衡技术理想与商业化可行性 [5] - 优化遥操作硬件/软件交互设计 提升人机协同效率 [5]