Workflow
AI智能体安全治理
icon
搜索文档
中国电信:2025年AI智能体安全治理白皮书
搜狐财经· 2025-11-27 16:27
AI智能体技术演进 - AI智能体正从“对话智能”迈向“决策智能”,成为具备环境感知、自主规划与任务执行能力的“数字协作伙伴”[1] - 基于大语言模型的智能体具备语言理解、任务分解、规划和工具调用能力,能够通过多智能体协作提升整体任务效率[29] AI智能体安全风险框架 - 白皮书首次系统性提出基于“感知—决策—记忆—执行”四层架构的安全风险识别与治理框架[1] - 风险具有层级传导与放大效应,单一漏洞即可引发全局性安全事故[1] - 感知层面临多模态输入欺骗与协议滥用风险,攻击者可通过对抗性样本输入导致感知失效[35][50] - 决策层易因幻觉与语义歧义导致连锁错误,逻辑推理偏差可能引发系统性事故[35] - 记忆层存在持久化投毒与跨会话越权隐患,对话记忆污染可能导致后续任务出现越权操作[36] - 执行层可能因权限失控转化为攻击跳板,缺乏有效隔离与权限控制可能导致恶意操作[37] 具体安全威胁案例 - 攻击者可通过网页隐藏指令诱导智能体下载木马,或利用超长消息触发隐私窃取[1] - 研究人员发现某公司智能体存在安全隐患,攻击者仅需常规自然语言指令即可诱导智能体程序下载并执行后门[20] - 新型提示词注入攻击可嵌入即时通讯工具,诱导用户执行特定操作导致系统错误[21] 安全治理体系与对策 - 白皮书提出覆盖全生命周期的动态防御体系,强调“安全、可控、可信”三大治理目标[2] - 技术对策包括工具调用沙箱隔离、决策双重验证、记忆内容加密与访问控制、执行行为实时阻断等[2] - 安全治理需要构建动态检测与防护于一体的闭环防护机制,确保智能体上线前安全性并实现攻击溯源[41] 行业实践与应用 - 报告结合星辰智能体平台、MCP协议安全扫描工具及端侧智能体自动化评测三大实践案例,展示了从理论到落地的可行路径[2] - AI智能体在金融、医疗、制造等关键领域深度渗透,正重塑生产模式与服务形态[19] - 国际组织如联合国世界数字技术科学院和国际电联已开始制定AI智能体安全测试标准与评估方法[38][39]