Workflow
著名机器人专家:人型机器人的未来是不像人
36氪·2025-09-30 16:43

人形机器人发展现状与核心理念 - 人形机器人的设计理念是采用与人类相同的身体结构,在人类环境中像人类一样工作,旨在打造一种通用机器人以替代数百万种执行特定任务的不同类型机器人 [5] - 行业参与者对人形机器人的经济潜力抱有极高预期,例如特斯拉首席执行官预测其Optimus机器人可能创造30万亿美元的收入,并将其称为"或许是全球最大的产品" [6] - 尽管存在狂热宣传,但人形机器人目前仍处于发展初期,远未达到宣传热度的峰值,其核心价值主张的实现依赖于达到人类水平的灵巧操控能力 [3][6][7] 灵巧性挑战与技术瓶颈 - 机器人灵巧操控的研究已持续65年以上,但至今尚无任何一款多关节手指机器人手部能达到足够的耐用性、力度和使用寿命以满足实际工业应用需求 [2][13][16] - 工业环境中主流的机器人末端执行器仍是平行夹爪抓取器和吸盘式抓取器,而非模仿人类手部的复杂设计 [13][16] - 当前主流的研究方法是通过让机器人"观看"人类完成任务的第一视角视频来进行端到端学习,但这种方法完全忽略了触觉和力反馈等对人类灵巧性至关重要的数据 [22][25][26] 端到端学习的成功案例与局限性 - 端到端学习在语音转文字、图像标注和大型语言模型三个领域取得革命性突破的关键,不仅依赖于大规模数据集,更依赖于针对特定领域精心设计的前端数据预处理工程 [27][31][34][39] - 这些成功案例的前端预处理技术最初都是为了实现人类感官信息的远程或异步传输而研发的,例如语音压缩技术是为了电话通信,图像序列化是为了图像传输 [32][34][38] - 在触觉领域,目前尚无类似的技术积累来捕捉、存储和回放触觉信号,这使得单纯依靠视觉数据来训练灵巧性面临根本性挑战 [43] 实现灵巧性的关键要素 - 人类的灵巧性极度依赖于丰富复杂的触觉感知系统,例如人类手部无毛皮肤中约有1.7万个低阈值机械感受器,仅每个指尖就有约1000个,目前已发现15种不同类型的神经元参与人类手部的触觉感知 [45][48][49] - 学术界的探索性研究显示,更先进的数据收集方法需将人类的手指动作与人类在控制机器人手时所感知的触觉信号关联起来,这超越了仅收集视觉数据的局限 [52][55] - 实现真正的灵巧性不仅需要学习动作策略,更需要学习如何根据触觉层面的感知来调整任务目标规划,这仍需要大量研究 [56] 人形机器人行走的安全性问题 - 当前与人类等大的双足行走人形机器人对人类而言并不安全,其行走主要依靠基于零力矩点算法和大功率电机来维持平衡,一旦摔倒,其刚性结构和高能量腿部会对附近人类造成严重伤害 [57][59][61] - 物理系统的缩放定律使得安全性问题随尺寸放大而急剧恶化,将机器人放大到人类尺寸(比例系数2)时,其能量需求会变为8倍,潜在伤害级别完全不同 [62][63] - 要实现与人类安全共享空间的大规模部署,必须研发出更安全、可近距离接触的双足行走机器人,但目前尚未解决此问题 [57][63] 人形机器人未来形态演变 - "人形机器人"的定义将随时间演变,未来其"脚"可能被轮子取代,出现"单臂、双臂、三臂"等不同版本,并配备非被动摄像头传感器,但仍会被称为"人形机器人" [64][65] - 未来将出现大量为特定人类任务设计的专用机器人,形态各异,但都会被称为"人形机器人",而当前为榨取现有设计性能投入的巨额资金可能付诸东流 [66] - 行业预测在未来15年,虽然会拥有大量人形机器人,但它们的外观既不会像如今的人形机器人,也不会像人类 [2][66]