文章核心观点 - 具身智能作为AI前沿热点,其核心在于将智能能力与实体设备深度融合,通过感知-决策-执行-反馈闭环主动改造物理世界,行业正从提升能力上限向筑牢可靠性底线过渡,并面临数据标准化等挑战 [1][8] 技术特征与架构 - 具身智能核心特征是物理闭环与主动交互,通过执行器产生物理改变并依据环境反馈优化决策,区别于单纯的信息处理类AI [3] - 行业需求多样化:工业场景要求可靠性与精度,消费场景注重功耗与成本平衡,商用场景追求灵活适配与快速响应 [3] - 单一硬件架构难以覆盖所有需求,异构计算(CPU、GPU、NPU、AI ASIC协同)成为技术基石,以实现能效比与性能的最优平衡 [3] - 应用架构正从预编程模式转向多智能体自主协作模式,系统需根据需求、业务和场景动态自主构建业务流并生成专用智能体 [4] - 智能体由扩散模型、大语言模型(LLM)、视觉语言模型(VLM)等多种AI组件构成,计算内核、数据量级与并行度差异显著 [4] - 英特尔提出混合编排层架构,通过统一系统基础设施隔离硬件多样性,向上提供稳定软件接口,以降低上层业务编程成本并支持多厂商、多架构的灵活组合 [4] 机器人技术路径与硬件支撑 - 针对具身机器人,行业尚未形成统一最优技术路径,当前主流是混合异构框架,融合前沿AI模型与传统运动控制技术 [5] - 英特尔提出三级架构:系统2(慢系统)通过VLM等大模型实现视觉理解与任务规划;系统1(Action Expert)将规划映射为控制指令,兼顾实时性与设备适配性;系统0通过传统模型预测控制(MPC)技术将控制频率提升至1000Hz级别,确保运动平滑精准 [5] - 三级架构分别对应GPU、NPU、CPU的异构计算优势,形成协同体系 [5] - 硬件关键支撑是英特尔第三代酷睿Ultra For Edge处理器,专为工业级应用与物理AI设计,具备180 TOPS的AI算力,采用Intel 18A制程工艺,能效比显著提升 [6] - 该处理器核心优势在于工业级可靠性,包括宽温工作范围、10年稳定供货周期,以及针对机器人场景优化的高实时性与确定性 [6] - 配合英特尔机器人AI套件与具身智能SDK形成完整解决方案,前者提供模块化参考设计与优化软件包,支持传统视觉模型与大模型高效运行;后者新增LLM任务规划、EtherCAT实时通信等关键能力,复用工业机器人领域成熟技术积累,大幅降低厂商开发成本 [6] 可信赖性与安全保障 - 可信赖性是具身智能从实验室走向产业落地的核心瓶颈 [7] - 英特尔从决策、执行、故障应对三个维度构建保障体系:决策层面采用神经符号AI混合控制模式,将领域知识与规则嵌入系统以校验神经网络决策,避免幻觉导致灾难性后果 [7] - 执行安全层面借鉴汽车行业思路,构建“主控系统-安全系统-备用系统”三级硬件架构,安全系统持续监控传感器与执行器状态以预判风险,备用系统在故障时能将机器人引导至最小风险状态而非简单停机 [7] - 英特尔联合学界与产业界发布《具身智能机器人安全子系统白皮书》,提出PMDF(监控-决策-故障处理-恢复)框架,为行业提供标准化安全设计参考 [7] 产业落地前景与挑战 - 具身智能正处于“提升能力上限”向“筑牢可靠性底线”的关键过渡阶段 [8] - 物流分拣、工厂备料搬运、标准化产品组装等半结构化场景将率先商用落地,因其任务明确、领域知识清晰,能在现有技术条件下可靠运行 [8] - 预计一两年内,部分厂商将在实际工厂中部署具身智能机器人,但要实现百万台级别的工业规模应用,仍需突破量产一致性、成本控制、数据标准化等多重挑战 [8] - 数据问题是重要制约因素,由于场景多样性、机器人本体差异、精度要求不统一,数据孤岛现象突出,行业尚未形成统一的数据采集与训练标准 [8] - 当前阶段可通过构建开放生态、推动数据交易等方式缓解数据荒问题,数据标准化需在实践中逐步推进 [8] - 随着产业规模扩大,依托成熟工业体系(如车企)提升零部件量产能力,将有效降低硬件成本,推动具身智能向更广泛的商用场景渗透 [8]
【环球问策】英特尔宋继强:具身智能正在从预编程模式转向多智能体自主协作模式