Workflow
虚拟空间
icon
搜索文档
专访|让AI智能体真正“看懂”世界——访德国弗劳恩霍夫研究所数据专家
新华社· 2025-06-11 10:53
文章核心观点 - AI智能体通过构建通用能力体系,可在虚拟环境中模拟演练并迁移能力至现实世界,从而提升系统可靠性并降低自动化应用门槛 [1] AI智能体的核心技术与能力 - AI智能体基于与大语言模型同源的核心算法,其在虚拟空间获得的经验和能力可顺畅迁移至现实环境 [1] - AI智能体可通过自然语言与人类交互,并将复杂任务自动拆解为一系列子任务 [1] - 对于每个子任务,系统能自动生成Python代码,用于调用其他智能体或直接控制机器人等自动化设备 [2] - 任务执行采用分步推进与评估机制,主智能体在子任务完成后评估结果并决定下一步操作 [2] AI智能体在自动化领域的优势 - 与传统自动化系统相比,AI智能体具备更高的“性价比” [2] - 基于大型基础模型的AI智能体系统拥有广泛通用知识,无需特定行业经验即可理解并执行任务,例如理解“将苹果和梨分别放入不同的盒子”这类指令并控制机械臂完成 [2] - 该系统能缓解中小企业引入自动化时面临的高成本、高技术门槛和环境复杂多变等难题 [2] 当前技术发展的前沿与挑战 - 实现更高自主能力的关键是让基础模型具备接收并理解环境的能力,即真正“看懂”世界 [3] - 前沿研究方向之一是将高精度三维场景数据与多路传感器数据输入模型,使其能在空间中进行推理和判断 [3] - 当前挑战在于大语言模型本质为处理文字设计,而现实感知数据(如三维点云)是无序坐标集合,缺乏语义结构 [3] - 需开发新的数据表示方式和训练机制,将“非语言”信息转化为模型可识别和处理的形式 [3] AI智能体应用中的信任构建 - AI智能体获得用户信任的关键在于其决策路径具有高透明性和可审查性 [3] - 系统将复杂问题拆解为多个逻辑清晰的子任务,每一步都有明确的执行过程,易于被理解和验证 [3] - 用户可清楚看到智能体逐步推进任务和规划解决方案的过程,这有助于增强对结果的信心 [4] - 在进入现实世界前,智能体在高度还原真实的虚拟世界中先完成验证,能进一步加深信任感 [4]