文章核心观点 - 生成式AI的加速发展在带来效率与模式革新的同时,也叠加放大了模型滥用、数据泄露等安全风险,对AI研发、部署及风险管理提出了更高要求[2] - 《2026年度AI安全十大趋势》白皮书系统预测了2026年AI安全关键方向,为行业发展与监管实践提供重要参考,其内容围绕政策合规、风险与治理、趋势研判三大板块展开[2] 政策合规趋势 - 全球AI合规框架加速协同与落地:中国、美国、欧盟已形成差异化但同向的核心治理框架,推动AI监管从“软性建议”转为“准入前置”,均以“可审计、可问责”为核心要求,未来该能力将成为AI系统进入金融、政务等关键行业的核心门槛[3] - 开源模型监管博弈加剧:2025年AI开源模型生态爆发式增长,其自由下载、微调及部署的特性为恶意利用提供了可乘之机,未来开源模型治理将长期处于“鼓励创新”与“防范风险”的动态博弈中[3] 风险演化趋势 - 对抗攻防进入高维博弈阶段:攻击者利用多模态、多轮次系统化手段,通过文本、图像植入扰动诱导模型出错,经诗歌等形式改写的恶意指令在多个主流模型上攻击成功率超过90%[4] - AI智能体安全风险引发监管与责任新考量:在金融、企业内部等场景中,身份认证与权限边界趋于模糊,责任归属尚不明确,而国际社会对其缺乏统一定义与监管标准[4] - AI武器化拓展网络攻击新战场:深度伪造与生成式AI结合使其成为新型网络武器,2024年全球约67.4%的网络钓鱼攻击采用AI技术,具身智能更推动攻击从数字域延伸至物理世界[4] 安全治理与应对趋势 - AI安全治理走向全生命周期可信化:国际社会正通过NIST风险管理框架、ISO/IEC42001认证及欧盟《人工智能法案》等,将治理覆盖从设计到部署的全过程,实现从“局部防护”转向全生命周期可信化[5] - AIGC原生安全架构成为基础设施标配:为应对模型幻觉、隐私泄露等显性风险,安全能力需深度嵌入模型输入、推理与输出各阶段,实现从“外部加固”到“内生自控”的转变,未来AIGC安全将与网络安全、数据安全并列成为核心基础能力[5] - AI对齐研究与实践提速:AI对齐研究是破解安全核心难题的关键,正从学术探索加速转向工程实践,直接影响AI系统的安全性与社会接受度[6] - 内容真实性治理成为数字社会基础秩序:为应对深度伪造的冲击,各国正通过立法与技术溯源双轨并进,推动治理迈向基础设施级建设[6] - 算力扩张推动“AI-能源耦合”成为国家安全议题:发展“绿色算力”、推动AI与能源系统双向赋能已成为各国共识,但电力扩容滞后、碳中和张力等风险仍存[6]
政策、风向与风险,AI安全十大趋势发布
南方都市报·2026-01-06 17:07