Workflow
倪光南:发展“AI+机器人”,向新质生产力加速跃迁

文章核心观点 - 人工智能是推动科技和产业发展的强大引擎,中国正通过“人工智能+”行动推动机器人产业向新质生产力跃迁,目标是构建“AI+机器人产业”以创造更大的经济和社会效益 [1] - 机器人产业发展的核心是提升机器人智能等级,实现从自动化工具到“AI+机器人”的范式转变,关键在于“脑、眼、行动”三大核心智能的协同 [4][5] - 机器人是拓展人类能力以提升生产力的工具,其发展应聚焦于人机协同和工作任务的重构,而非简单替代人类 [2][3] - 构建基于RISC-V架构的开源生态系统对“AI+机器人”的未来发展至关重要,行业需共同努力构建人机共融的世界 [8] 机器人产业定位与发展方向 - 行业处于从传统工业化向新型工业化发展阶段,企业将从自动化向智能化过渡,生产模式从刚性标准化发展为柔性定制化兼备 [4] - 机器人将从自动化工具过渡为“AI+机器人”,具体表现为:控制者从实时操作系统发展为智能系统,交互方式增加语音,依赖大模型而非人工编程,实现多工位自主移动、即插即用以及人机协同 [4] - “AI+机器人”是行业未来发展方向,机器人形状将多样化,并根据场景需求以最经济合理的方式完成任务 [4] 机器人智能系统的三大核心能力 - 机器人智能系统由环境感知能力(“眼”)、运动控制能力(“行动”)和交互决策能力(“脑”)三大核心能力协同构成 [5] - 目前行业对运动控制的投入较大,而对环境感知和交互决策的投入不足,迫切需要提升 [5] 机器人之脑:大语言模型的作用 - 大语言模型构成了“机器人之脑”,推动了从“机器人操作系统”到“机器人智能系统”的技术架构性变革 [5] - 在大模型加持下,机器人能自主实施知识积累、接受指令、动作实施和人机交互,大模型将提供工作流程引导机器人完成任务 [6] - 一个典型的大语言模型在约10的14次方字节信息量基础上训练,几乎是互联网所有公开文本的总和 [3] 机器人之眼:AI与空间计算 - AI+空间计算作为“机器人之眼”,开启机器人认识世界的新范式,其采用普通单目摄像头加神经网络学习,以“类人眼”方式预先对环境进行学习训练 [6] - 该技术能提升对物理世界的感知和理解,具有自适应和持续学习能力,实现机器人“睁开眼睛看世界”,具备好用、易用、实用特点 [6] - 空间计算是面向三维世界的计算模式,正重塑人、机器和世界的交互方式,是推动机器人落地的关键核心技术,它是对物理世界的“重构”,生成式AI并不能替代 [6] - AI+空间计算的融合创新有望打破物理世界和数字世界的界限,是支撑低空经济、机器人等产业发展的关键技术 [7] 机器人之行动:开源操作系统与生态 - 开源AGIROS操作系统支撑“机器人行动”,由中国科学院软件所支持并拟定为标准,其开源社区旨在凝聚产学研用力量,推进智能机器人领域的开源开放与协同创新 [7] - 已有大批产学研用单位和开发者加入AGIROS社区,借助开源力量将增强“脑、眼、行动”协同系统的竞争力,成为传统机器人跃升为AI+机器人的主要推动力量 [7] 未来生态系统构建 - 未来面向“AI+机器人”可能形成类似“Wintel”的庞大生态系统,例如“基于RISC-V架构的AI+机器人”生态系统(即RV芯片+脑、眼、行动智能系统) [8] - 行业希望中国机器人业界为构建“基于RISC-V架构的AI+机器人”生态系统作出更大贡献,共同构建人机共融的世界 [8]