Workflow
360重磅发布《大模型安全白皮书》 推动AI应用“安全、向善、可信、可控”

据了解,白皮书以2025年国内外多起典型大模型安全事件为切入点,系统性归纳了威胁大模型安全的五 大关键风险:第一类是基础设施安全风险,包括设备控制、供应链漏洞、拒绝服务攻击以及算力资源滥 用等问题;第二类是内容安全风险,涉及不符合核心价值观、虚假或违规内容、大模型幻觉,以及提示 注入攻击等;第三类是数据与知识库安全风险,数据泄露、越权访问、隐私滥用和知识产权问题日益突 出;第四类是智能体安全风险,随着智能体自主性增强,插件调用、算力调度、数据流转等环节的安全 边界更加模糊;第五类是用户端安全风险,包括权限控制、API调用监控、恶意脚本执行以及MCP执行 安全等。 这些风险相互交织,形成传统安全方案难以应对的复杂威胁矩阵,严重威胁个人权益、企业发展乃至国 家安全。 面对上述复杂挑战,白皮书基于实战经验,给出了"外挂式安全+平台原生安全"双轨治理策略——前者 像AI的"外部保镖",灵活应对实时风险;后者像AI的"内置铠甲",从根源筑牢安全基础,两者配合形成 全链路防护网。 据悉,目前,360已将这一能力落地政务、金融、制造等各行业,真正让大模型安全从理论变成能落 地、能管用的实战方案。 未来,还将联合产学研各界, ...