Workflow
写给小白的“具身智能”入门科普
36氪·2025-08-21 14:22

具身智能定义与核心特征 - 具身智能是一种基于物理身体进行感知和行动的智能系统 通过实体智能体与环境的交互获取信息并实现行动 [4] - 核心三要素包括本体、智能和环境 强调与环境交互的整体需求和功能 [4] - 必须同时具备AI大脑及感知与行动能力 并能与外部环境实时互动 [8] 发展历程与行业驱动 - 概念起源于1950年图灵提出的两种智能发展途径 [9][10] - 1986年罗德尼·布鲁克斯提出通过物理交互产生智能行为的理论 被誉为"具身智能之父" [14][15] - 21世纪后因信息技术、传感器技术及AI大模型发展而爆发 [17] - 2023年英伟达CEO黄仁勋称其为AI下一浪潮 2024-2025年中国政策明确支持产业发展 [19] 主要类别与形态 - 人形机器人具有人类身体结构 适用于家庭服务、医疗护理和工业生产等场景 [22][24][26] - 轮式机器人移动速度快 适用于仓储物流和巡检安防领域 [28][30] - 多足机器人如机器狗具备强地形适应性 用于勘探和救援任务 [31][33] - 智能汽车、无人机等通过传感器实现自动驾驶 也属于具身智能范畴 [34] 技术体系构成 - 本体包含机械结构、传感器和执行器等 决定机械强度与运动能力 [37][39] - 大脑负责感知与决策 依赖大语言模型和视觉语言动作模型进行多模态数据融合 [42] - 小脑专责运动控制与动作生成 采用模型预测控制和力控等技术 [43] 市场规模与增长 - 2023年全球AI机器人市场规模达143亿美元 预计2032年增长至824.7亿美元 [54] - 期间复合年增长率为21.50% 显示行业处于高速发展期 [54] 技术挑战与瓶颈 - 传感器在复杂环境中感知准确性不足 运动控制算法设计存在稳定性问题 [46] - 真实环境数据获取成本高昂 业界采用仿真世界进行替代训练 [48] - 安全方面存在被恶意利用及隐私泄露风险 需建立可靠保障机制 [50] - 技术研发需要长期资金投入和高水平人才团队支持 [52]