赵何娟对话王晓刚:什么将是机器人的ChatGPT时刻|2025 T-EDGE全球对话
钛媒体APP·2026-01-06 02:12

行业与市场发展态势 - 2025年全球人形机器人领域投资交易额达到约70亿美元(约合500亿人民币),相比去年同期增长250% [1] - 行业当前面临技术发展瓶颈,产品形态大多停留在演示阶段,如跳舞拳击、走路摔跤 [1] - 行业被视为一个巨大的赛道,其规模可能达到几十万亿,机器人数量可能超过手机,单价可能与汽车处于同一水平 [46] 具身智能与AI研究范式的演进 - 当前AI发展面临核心局限:过去依赖的互联网图文、语言等多模态数据的价值已被榨干,边际效应越来越低 [3][17] - 具身智能被视为下一代智能(AI 3.0)的关键,其核心是通过与世界模型交互,从物理世界中产生新的智能 [4][17] - 当前主流的具身智能研究范式VLA(Vision-Language-Action)是以机器为中心的,存在根本性缺陷,无法实现通用性 [18][19] - 商汤科技联合创始人王晓刚提出,研究范式需要从以机器为中心转变为以人为中心 [3][20] - 以人为中心的新范式(ACE)通过环境式数据采集人类真实行为,学习物理规律,用以训练具身智能的世界模型 [3][20] 新研究范式(ACE)的核心内涵 - ACE范式构建了“环境式数据采集—开悟世界模型3.0—具身交互”的技术体系 [3] - “开悟世界模型3.0”旨在形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作 [3] - 该世界模型具备三部分能力:多模态融合理解、生成各种行为、预测机器人操作过程 [37] - 新范式的优势在于能深刻理解物理世界的动静态目标,实现精准可控的环境编辑,从而将有限的人体数据泛化到成千上万的不同环境中 [37] - 新范式打开了跨学科融合的大门,能将工程力学、人体工程学等传统领域的研究成果纳入人工智能体系 [29][40] 数据、传感器与硬件发展 - 新范式的数据来源于以人为中心的环境式采集,使用穿戴式设备、第一视角摄像头及各类传感器记录人类行为 [20][21] - 仅靠视觉数据不足,与物理世界的交互还需力、触觉、人体工学等多维度信息 [21][31] - 人工智能传感器将成为未来重要产业,其发展需结合计算芯片与AI模型,构成“环境计算”的基础 [31][32] - 可穿戴设备与智能传感器产业预计将在新的AI浪潮中迎来重大发展机会 [30][32] 算力、芯片与生态挑战 - 中国国产芯片在算力指标上追赶迅速,但当前面临的最大挑战是软件生态和模型适配问题 [35] - 开源生态对于推动国产AI芯片发展至关重要,社区使用和模型适配将决定芯片的易用性 [35] - 模型与芯片的适配需要芯片团队与算法团队共同努力,根据硬件特点重新设计算法以实现高效计算 [35] 公司战略与产品路径(大晓机器人/商汤科技) - 公司提出了以人为中心的ACE具身研发范式,作为其核心技术路线 [36] - 公司在环境式数据采集方面布局较早,其团队在2025年初发布了记录人类常识行为300小时的EgoLife数据集,已被国际同行用于构建世界模型 [36] - 公司通过开源“开悟世界模型3.0”来提升社区影响力,并计划与各种国产芯片进行适配 [35] - 在产品化路径上,公司将采取软硬一体、垂直整合的策略,最终输出整体产品而非单纯软件 [46] - 公司初期将更多聚焦于ToB(商用和工业)场景,利用其过去十年对行业客户痛点的深度理解 [47] - 公司坚持原创与创新理念,并将其视为企业的生命力 [50] - 公司高度重视人才培养,历史上通过大量实习生计划培养了超过3000名AI人才,形成了持续的人才输送体系 [44][50] 对通用机器人发展的展望 - 通用机器人进入家庭成为生活一部分尚需较长时间,核心挑战包括安全性等众多未清晰考虑的因素 [47] - 影响通用机器人“ChatGPT时刻”到来的最关键突破点在于研究范式的确立 [48] - 一旦正确的以人为中心的研究范式被验证成功,产业发展和数据积累速度将远超以往 [48]

赵何娟对话王晓刚:什么将是机器人的ChatGPT时刻|2025 T-EDGE全球对话 - Reportify