力觉智能
搜索文档
星尘智能CEO来杰:当AI开始操作世界,具身智能的“Windows时刻”何时到来?|「锦秋会」分享
锦秋集· 2025-11-04 20:51
行业核心观点与问题 - 语言智能改变了信息世界,而具身智能将重新定义物理世界 [4] - 尽管算法和算力在进步,但机器人产业的落地速度依然缓慢,行业在探讨为何尚未真正进入应用周期 [5] - 当前具身行业的核心瓶颈在于“交互层缺失”,类比于1970年代的计算机缺少“Windows时刻”,导致其难以从科研展示走向普及应用 [6] 具身智能的三层架构 - 公司将具身智能重新划分为三层结构:终端(本体硬件)、交互层RUI(遥操作系统)和驱动层(AI模型,软件),三者缺一不可才能让机器人真正可用 [6] - 该架构类比于个人电脑的“硬件-操作系统-应用生态”模式,旨在构建一个完整的产业框架 [15][21] 公司背景与产品进展 - 公司成立于2022年,是从腾讯机器人实验室走出的团队,专注于人形机器人的研发与落地 [13] - 公司的人形机器人已实现量产,并在多个场景中投入应用,例如在去年8月推出了能完整弹奏扬琴的机器人 [13] - 公司计划在年底推出新一代更具成本优势的机器人版本 [13] - 公司的机器人性能设定为成年男性能力的115%,在负载、加速度和速度上略高于人类 [40] - 公司目前的机器人性能已超过北美热门的1X机器人,且已有产品在北美被用户使用 [41] 技术路径与创新:绳驱与力觉 - 公司率先量产绳驱机器人,其技术起点源于对移动类和操作类机器人的研究积累 [28] - 技术创新的核心思路是突破行业对视觉感知的依赖,转向以“力”为中心的“力觉智能”,让机器人能像盲人一样依靠感觉工作 [31][33] - 通过两个极端实验(开门、拉门)验证了“力引导”方式在解决复杂物理交互问题上的有效性 [32] - 绳驱结构允许电机和关节分布式布局,类似人体肌肉分布,并能提高传动效率3~5% [39] - 准直驱系统(QDD)具有结构简单、成本低、高透明度和反驱性能、惯性小、高力控带宽等优势 [34][35][36][37] 交互层:遥操作的战略价值 - 遥操作(RUI)被视为具身智能落地的核心加速器,是弥补当前AI自主能力不足的关键过渡形态 [15][42] - 遥操作不是技术倒退,而是在现实世界中训练具身智能的“人机共演系统”,能确保系统可靠性 [47][48][49] - 公司已完成北京到深圳的远程高动态控制实验,以及跨国跨洲的远程控制验证,并采用低成本芯片方案实现实时传输 [51][52][53] - 遥操作在劳动力空缺、危险作业(如化学生物实验、深山老林勘探)等场景有强烈的商业需求 [55] AI模型与未来发展方向 - 公司认为VLA(视觉语言动作模型)与世界模型不是取代关系,而是互补,最终智能闭环需要“VLA + 世界模型 + 身体智能”共同构成 [15][61][62] - 未来发展的两个重点方向是“身体智能”(强调全身力学协同,如腰部发力)和“安全与力觉系统”(引入“E-sense”概念让机器人具备感受力的能力) [64] - 行业下一阶段需提供统一的平台以及上下游工具和资源支持(如数据集、接口工具) [63] 商业化与合作 - 公司在科研、商业服务、文娱展演、工业智造领域均有落地项目,例如工厂的上下料搬运、零售服务、以及在大剧院和机场的正式演出 [69] - 公司与清华、港大、MIT等研究机构有合作项目,研究团队常驻公司办公室共同开发 [69]