AI水印
搜索文档
AI生成内容需“表明身份”,虚假信息将套上紧箍咒
36氪· 2025-09-02 19:35
行业监管动态 - 国家网信办等四部门联合发布《人工智能生成合成内容标识办法》,规定自2024年9月1日起,所有AI生成的文字、图片、视频等内容需添加显式和隐式两种标识 [3] - 新规明确内容发布者为AI内容的第一责任人,需对AI虚假内容负主要责任,此举旨在从源头遏制AI虚假内容的传播 [3][14] - 将责任传导至创作者被视为当前技术条件下遏制AI虚假内容的有效手段,对潜在的黑灰产行为形成震慑 [14] AI技术滥用与安全挑战 - 以ChatGPT为代表的AI大模型技术显著降低了深度伪造等技术的使用门槛,使AI成为互联网上主要的谣言制造机 [5][6] - 黑产利用多模态AI大模型生成的内容可以假乱真,例如“AI马斯克”骗走老人退休金、“Yahoo Boys”使用AI视频进行“杀猪盘”等案例已不鲜见 [5] - 谷歌发布的Nano-banana等工具能够遵循自然语言进行复杂修图,使得人工编写内容与AI创作内容之间的差异日益模糊 [6] 行业安全技术发展 - OpenAI、谷歌、字节跳动、阿里巴巴等大型科技公司致力于通过“AI安全护栏”机制,利用动态意图分析、对抗性样本训练、跨模态验证等方式防止AI生成有害内容 [7][9] - “AI安全护栏”存在固有缺陷,过于严密的安全设置会限制AI的自主决策能力和主观能动性,导致模型性能下降,因此科技巨头难以完全杜绝有害内容生成 [9][10] - 行业尝试通过水印技术实现AI内容的可追溯和可辨别,例如微软、Adobe、索尼、OpenAI、Meta等公司组建了内容来源和真实性联盟(C2PA) [12] 平台内容管理困境 - 微信、抖音、快手、知乎等内容平台要求创作者主动添加“内容由AI生成”的声明,以帮助用户区分虚拟与真实 [12] - 大量创作者因担心内容被限流而未主动声明AI生成内容,反映出平台在鼓励AI赋能创作与防止低质量AI内容污染社区氛围之间的复杂态度 [12] - 研究发现AI水印技术并不牢固,通过调整亮度、对比度或添加高斯模糊等简单技术手段即可轻松去除预设水印 [12]
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
量子位· 2025-05-31 11:34
技术突破 - 提出全新局部鲁棒图像水印方法MaskMark,支持多水印嵌入、精准定位篡改区域和灵活提取局部水印[3][6][7] - 核心创新在于引入掩码机制,训练时明确标注水印位置,实现精准嵌入和提取[5][11] - 支持32/64/128比特自适应水印长度,而竞品WAM仅支持32位[7][20] 性能表现 - 全局水印任务中保持PSNR>39.5和SSIM>0.98的高视觉保真度,比特准确率近乎100%[13] - 局部水印任务中在不同大小区域均保持近乎100%提取准确率,显著优于WAM等基线模型[14] - 水印定位性能(IoU衡量)全面优于EditGuard和WAM,其中MaskMark-ED在小区域定位更具优势[16][17] 效率优势 - 训练成本仅为WAM的1/15,在单个A6000 GPU上训练20小时即可完成[4][22] - 计算效率达7.74×10^14 TFLOPs,较WAM的1.13×10^16 TFLOPs提升15倍[20][22] - 推理时间仅需0.031秒,内存占用2.21GB,与WAM相当但功能更全面[20] 应用特性 - 支持单图像嵌入多达5个不同水印,且保持强大提取和定位性能[18][19] - 可通过简单调整失真层或少量微调(仅需20k训练步数)适应新兴威胁[21][23] - 同时适用于整体图像保护版权声明和局部敏感内容保护隐私感知场景[8]