360重磅发布《大模型安全白皮书》 推动AI应用“安全、向善、可信、可控”
白皮书核心内容 - 系统性归纳威胁大模型安全的五大关键风险:基础设施安全风险、内容安全风险、数据与知识库安全风险、智能体安全风险、用户端安全风险 [1] - 提出"外挂式安全+平台原生安全"双轨治理策略,形成全链路防护网 [1] - 核心理念为"外筑'以模治模'动态屏障,内固'平台原生'安全底座",旨在推动人工智能行业向安全、向善、可信、可控方向发展 [3] 大模型安全风险分类 - 基础设施安全风险包括设备控制、供应链漏洞、拒绝服务攻击及算力资源滥用 [1] - 内容安全风险涉及不符合核心价值观、虚假或违规内容、大模型幻觉及提示注入攻击 [1] - 数据与知识库安全风险表现为数据泄露、越权访问、隐私滥用和知识产权问题 [1] - 智能体安全风险源于其自主性增强,导致插件调用、算力调度等环节安全边界模糊 [1] - 用户端安全风险涵盖权限控制、API调用监控、恶意脚本执行及MCP执行安全 [1] 公司安全战略与产品 - 公司产品基于"平台原生安全"理念开发,将安全深度植入平台底层,满足国家与行业合规要求 [2] - 企业级知识库守护数据与知识安全,智能体构建和运营平台确保行为可控,智能体客户端筑牢用户端安全防线 [2] - 公司已将安全能力落地政务、金融、制造等行业,使大模型安全成为可落地的实战方案 [2] 行业影响与未来展望 - 白皮书在世界互联网大会乌镇峰会发布,为大模型应用拉起全链路安全防线 [3] - 未来将联合产学研各界,共同推动安全标准建设与技术共享,共建安全可信的AI生态 [2]