Workflow
AWE(AI World Engine)
icon
搜索文档
陈亦伦和李震宇创立的具身公司它石智航,不做 VLA、不仿真,不走主流路线
晚点LatePost· 2026-02-02 10:06
公司核心观点与战略 - 公司(它石智航)由华为车BU前首席科学家陈亦伦与百度前自动驾驶事业群负责人李震宇等联合创立,成立不足半年即完成1.2亿美元和1.22亿美元的天使轮与天使+轮融资,创下中国具身智能领域天使轮融资纪录[4] - 公司的核心战略是摒弃行业主流的VLA(视觉-语言-动作)模型和遥操作数据采集路径,转而开发名为AWE(AI World Engine)的模型,并自研可穿戴设备来低成本、大规模采集真实世界的人类行为数据[4][5] - 公司认为具身智能是一个独立的行业,其基础模型不应是LLM或VLM的下游分支,而应有自己独立的模型体系[4][39] - 公司已通过自研的可穿戴设备采集了约10万小时数据,并预计明年数据量将“再翻数倍”,其数据采集成本相比遥操作方法“至少低两个数量级(即1/100)”[31][32] 创始人背景与技术理念 - 创始人陈亦伦拥有物理竞赛保送清华、美国机器学习博士的背景,职业生涯早期在机电系统公司学习电机、伺服控制和液压系统,其职业信念是“做出理想中的机器人”[7][8] - 在华为领导自动驾驶研发期间,陈亦伦团队在2020-2021年成功尝试了端到端系统,用3万行代码训练的神经网络替代了原有200万行规则的规控代码,并在极端场景测试成功,这被他称为“GPT时刻”,使其看到了AI做规划(Planning)的潜力[9][10][11] - 陈亦伦认为,AI解决大型复杂问题需跨越三道墙:数据墙、算力墙和后训练墙。当前具身智能的核心卡点(瓶颈)在第一道“数据墙”,即如何低成本、大规模获取高质量数据[14][15] - 其技术理念强调“重剑无锋、大巧不工”,认为面对越复杂的任务和海量的数据,神经网络结构应越简单,模型成功的关键在于定义正确的训练目标(如大语言模型的“预测下一个词”),而非复杂的架构本身[16][17][18] 行业机遇与挑战 - 通用机器人发展迎来“三道曙光”:1)运动控制(Locomotion)因强化学习和高并发仿真器的应用而解锁;2)大语言模型(如GPT)提供了强大的任务规划能力;3)端到端方法被验证有效[12][13] - 具身智能行业目前的核心痛点是数据获取,其所需的数据基础规模约为“1000万小时或更多”,比自动驾驶(约100万小时)高一个数量级[27] - 行业主流的数据采集方法(如遥操作)存在成本高、速度慢、难以进入真实场景、动作不够真实等缺陷,限制了数据规模[5][28][29] - 行业尚未在模型性能上明显展现出“Scaling Law”,但已处于数据规模快速增长的scaling状态,预计到2026或2027年会在解决垂直领域具体问题上显现效果[40] 技术路径与模型创新 - 公司反对当前主流的VLA技术路线(即在VLM上增加动作输出头),认为这会使机器人行业沦为LLM的下游分支[4][39] - 公司开发的AWE(AI世界引擎)模型追求对物理世界的“深度表达”,核心是记录时间、空间、力等“世界信息”以及机器人如何与物体交互,并能根据机器人的动作预测世界状态、推荐下一步操作[38] - 对于具身智能,两个重要的训练目标是:1)空间重建(如自动驾驶中的BEV鸟瞰视角),这是物理AI独有的需求;2)与世界的交互,特别是对柔性物体施加力的操作[18][19] - 当前AI的“智能涌现”本质是“内插”和数据的拟合,并非真正的理解。要实现像人一样快速学习新任务,需要解决“先验判断”和“想象反馈”的机制,这是未来的重大挑战[21][22][23] 数据采集方案与优势 - 公司自研了名为“SenseHub”的数据采集套件,核心是一对轻量化、无线的手套(有五指和两指版本)和第一视角摄像机,让劳动者在真实场景中佩戴工作以采集数据[24][26] - 该方案旨在采集“全信息地刻画手的动作”的数据,包括手在空间中的位姿(位置和姿态)、每个手指的位姿以及施加给对象的力[34] - 相比从互联网视频或仿真获取数据,该方案能建立“指令-动作”的准确映射,且数据更真实。仿真数据对精细操作用处不大,仅对运动控制(Locomotion)有效[27] - 该方案效率高、易于规模化、不干扰生产,但对AI能力要求更高。公司为此自研硬件,因为现有VR手柄或动捕手套等设备在精度、深度信息或昏暗环境工作能力上无法满足要求[30][35][36] 市场竞争与落地场景 - 创始人认为,在具身智能时代,中国创业者凭借强大的工业制造能力、AI人才和工程师资源,能够更好地整合硬件、数据和算法,实现协同优化,美国创业者将不是对手[37] - 公司首波重点落地场景是工业制造领域,例如汽车、家电、服务器中的线束(Wire Harness)装配。这类任务因线束具有立体、柔性特点,对传统机器人极难,高技术门槛正是公司的机会[41] - 判断具身智能公司是否靠谱的关键在于其是否“想清楚自己要成为谁”,有明确的目标和坚持正确路径的执行力[43]
对话它石智航陈亦伦:不做 VLA,不仿真,一家具身智能公司的非主流判断
晚点Auto· 2026-01-29 22:51
公司概况与融资 - 它石智航由华为车BU前首席科学家陈亦伦与百度前自动驾驶事业部负责人李震宇等联合创立,于2024年底开始筹备 [4] - 公司成立不足半年,先后完成1.2亿美元和1.22亿美元的天使轮与天使+轮融资,创下中国具身智能领域天使轮融资纪录 [4] - 投资方包括蓝驰、美团、启明、线性、高瓴、联想创投等 [4] 核心技术与路线 - 公司不采用当前主流的VLA模型路线,认为具身智能应有自己的独立模型,而非在VLM上长出一个动作“头” [4][39] - 开发了名为AWE的模型,全称为AI World Engine,其核心是追求对物理世界的深度表达,记录时间、空间、力等“世界信息”,而非“视网膜信息” [4][38] - AWE模型强调动态演化,能根据机器人的动作预测世界状态并推荐下一步操作 [38] - 公司认为具身智能的核心卡点是数据,因此自研了用于采集数据的可穿戴设备,而非采用当时Optimus、PI等美国公司选择的遥操作方式 [5][24] 数据采集策略与规模 - 公司通过自研的可穿戴设备采集数据,设备由轻量化手套和第一视角摄像机构成,让劳动者佩戴后在工作场景中自然采集真实任务数据 [24][26] - 该方法旨在低成本、大规模获得高质量数据,其成本比遥操作方式“至少低两个数量级” [32] - 公司从2025年8、9月开始大规模采集,目前已积累约10万小时数据,并预计明年数据量会“再翻数倍” [31] - 公司认为具身智能要达到持续可用,需要“1000万小时或更多”的数据基础规模 [27] 创始人背景与技术认知 - 创始人陈亦伦拥有物理竞赛保送清华、美国机器学习博士的背景,职业生涯早期在机电系统公司学习过电机、伺服控制和液压系统 [7][8] - 在华为期间,其团队最早尝试端到端自动驾驶,用3万行代码的神经网络替代了原有的200万行规控代码,并在极端测试场景中取得成功,这被其称为“GPT Moment” [9][11] - 基于在自动驾驶领域验证端到端方法的成功,创始人看到了机器人加速发展的时机,并因此离开华为投身具身智能创业 [11] 行业机遇与挑战 - 通用机器人发展迎来“三道曙光”:运动控制的解锁、大语言模型提供的任务规划能力、以及端到端方法的验证 [12][13] - AI解决大型复杂问题需跨越“三道墙”:数据墙、算力墙、后训练墙;目前具身智能尚处在第一道“数据墙”阶段 [14][15] - 行业普遍认为具身智能尚未找到自己的“Scaling Law”,但公司认为行业已在scaling状态,预计到2026或2027年会在模型性能上显现效果 [40] - 行业早期信号将从刷视频demo转向解决垂直领域的具体问题,并出现真实客户采购 [40] 产品落地与市场判断 - 公司第一波重点落地场景是工业制造,例如线束装配这类对传统机器人而言难度高、技术门槛高的领域 [41] - 创始人判断,在具身智能时代,凭借中国强大的工业制造能力、AI人才和工程师,中国创业者将更具优势 [37] - 公司明确自身发展路径,将按照既定方式持续推进 [43]