具身智能奇点时刻来临?业内专家:技术尚未收敛,后端场景有先发优势
证券时报网·2025-08-05 18:05

具身智能发展现状 - 具身智能处于技术突破与产业培育的关键阶段 过去两年发展速度超越此前多年积累 进入越跑越快阶段 [2] - 技术虽未完全收敛但处于快速发展阶段 业内对端到端技术信心倍增 操作领域实验室样机能力显著提升 [1][2] - 多模态大模型发展潜力十足 视觉 语言等模态进步尚未触顶 数据驱动能力持续增强 [2] - 硬件成熟度加速提升 高自由度终端如灵巧手和接近量产的形态加速落地 [2] 技术驱动因素 - 发展动力主要来自大模型在链式推理CoT与智能体Agent上的能力达到临界值 [2] - 机器人通用化需满足两个必要条件:对物理世界的高精度多模态感知能力 以及对复杂任务的规划和推理能力 [1][3] - Agent与CoT进展正推动技术朝可行方向发展 [3] - 构建模型—本体—场景数据的闭环飞轮 驱动模型能力迭代 [1] 技术路线特点 - 宏观层面形成高度共识:数据被视为核心驱动力 模型部署形态大概率采用端到端架构 [5] - 微观实践存在明显差异 呈现宏观共识 微观多元的行业现状 [5] - 数据获取存在分歧:大规模部署真机采集与高比例仿真生成两种主张并存 [6] - 算法层面网络架构仍存分歧:包括是否采用单一大网络 是否加入隐变量层 强化学习选择及世界模型必要性等 [6] - 硬件形态多元:通用机器人分为双足与轮式两大类 双足方案又存在直驱关节与复杂传动机构等不同设计 [6] 技术挑战与创新空间 - 终极模型架构尚无定论 现有VLA多为单帧模型 缺乏原生记忆机制 难以完成需要状态累积的任务 [4] - 大小脑模型将高频执行与低频决策人为拆分 虽为当下工程实践但并非终极形态 [4] - 需探索单一模型如何以动态 柔性的频率进行实时思考与决策 [4] - 技术框架仍面临大量未解问题 开放的不确定性成为推动行业持续创新的关键动力 [4] 商业化应用路径 - 规模化部署将率先在拣选 搬运 组装等工业物流后端场景实现 [1][7] - 后端场景因规模大 劳动力密集能产生更大价值 之后逐步向商用场景拓展 最终走向民用 [7] - 落地关键取决于两点:真正解决问题能用好用 以及经济模型成立 [7] - 遵循高价值 有规模 有难度的黄金三角逻辑筛选应用场景 [7] 跨领域协同效应 - 无人驾驶和机器人共享感知—决策—执行技术栈与产业链资源 有望形成车—机共生生态 [8] - 具身智能和自动驾驶在任务场景和底层技术上同宗同源 模型技术可以复用 工程能力可以迁移 [8] - 自动驾驶行业经验与认知能帮助具身智能领域的探索与落地 [8]