Workflow
深知风控框架
icon
搜索文档
AI安全破局:深知发布智能体专用安全模型,实现对话风险近100%防御,破解AGI应用合规难题
36氪· 2025-11-24 16:21
随着大模型应用越来越多的深入到日常工作生活场景:从AI教育、客户服务、商机互动、文旅推荐、医疗导办到保险咨询,也随着智能体交互日益成为社 会经济生活的重要环节,一场隐蔽的安全危机正悄然而来;生成式人工智能对话互动时普遍面临着恶意诱导、隐藏条件等各类风险,对话风险正成为行业 AI落地中的"致命暗礁"。 2025年8月27日,公安部第三研究所数据安全技术研发中心依据GB/T45654-2025《网络安全技术 生成式人工智能服务安全基本要求》对国内主流大模型商业 化版本开展安全测试,并发布了测试结果[1]。如图一结果显示8类安全维度的不合规率整体分布在28%至51%之间,其中涉黑灰产、谣言和诈骗类均超过 40%。不难看出,智能体所"仰仗"的各通用大模型本身的安全防护能力普遍不足。 | 模型名称 | 国家安全类 | 涉暴恐炎 | | --- | --- | --- | | DeepSeek-R1 | 28.08% | 29.73% | | Doubao-1.5-Pro-256K | 22.60% | 29.73% | | Doubao-Seed-1.6-Thinking | 32.19% | 24.32% | | E ...