AI版权侵权
搜索文档
郑友德:AI记忆引发的版权危机及其化解
36氪· 2026-02-04 08:41
文章核心观点 - 斯坦福与耶鲁大学2026年初的研究证实,主流生成式AI模型对训练数据中的版权内容存在深度“记忆”与高保真“反刍”能力,个别模型对特定书籍的复现率超过95%,这揭示了AI“逻辑泛化”背后的“参数化复制”技术本质 [1][3][4] - 该技术事实与司法界关于“记忆是否构成复制”的定性分歧(如英德法院的相反判决)相结合,动摇了AI行业依赖“合理使用”的法律基础,可能引发建立在脆弱版权基础上的万亿级AI债务链条的系统性风险 [1][9] - 文章主张,此研究不应被视为产业创新的阻碍,而应成为推动AI产业向版权友好、负责任、透明和可持续发展转型的警示与行动路线图,并提出了涵盖技术、法律与治理的多层次危机化解对策 [1][40][47] 技术真相:模型深度记忆与反刍现象 - **实证研究结论**:斯坦福与耶鲁大学2026年1月的研究证实,所有受测的四款主流生产级大语言模型(LLM)均能提取出长篇受版权保护的文本,普遍存在复现版权内容的现象 [3][4] - **模型表现差异**:在特定攻击下,Claude 3.7 Sonnet对《哈利·波特与魔法石》的提取率高达95.8%;Gemini 2.5 Pro和Grok 3在无越狱情况下,仅通过简单指令即可分别复现76.8%和70.3%的书籍内容;而GPT-4.1防护最严密,提取率仅约4% [4][5] - **技术本质**:LLM的“记忆”是其工作方式下不可分割的固有特征,模型在预训练阶段将版权作品以参数化副本形式深埋于权重之中,现有的对齐与过滤护栏在防止“反刍”方面存在根本缺陷 [6][7] - **行业长期否认**:以OpenAI、谷歌为代表的AI公司曾向美国版权局声明,模型不会存储训练数据的副本,但上述研究提供了直接的技术证据反驳了这一说法 [8] 产业与金融风险 - **债务互锁风险**:AI行业通过“信贷套娃”模式深度捆绑,云基础设施供应商在2025年筹集了1210亿美元新债务,未来几年科技行业为基建所需的新债务规模可能高达1.5万亿美元 [9] - **系统性崩塌隐患**:整个万亿级资本帝国建立在“合理使用”这一脆弱的法理基础上,一旦核心公司因版权侵权被判巨额赔偿或强制下架,可能引发全链条信用违约 [9] 司法冲突与法律定性 - **英德判决对立**:英国高等法院在Getty Images诉Stability AI案中判决模型权重是“模式与特征的产物”,不构成侵权副本;一周后,德国慕尼黑法院在GEMA诉OpenAI案中做出相反判决,认定模型通过“有损压缩”实现了对作品的物理留存,“记忆即复制” [10][11] - **美国合理使用抗辩**:美国司法界在初步裁决中(如Bartz v. Anthropic, Kadrey v. Meta)倾向于认定将受版权书籍用于模型训练属于“高度转换性”的合理使用,但为使用盗版数据库和模型输出端造成“市场替代”划定了红线 [13][14] - **欧盟TDM豁免界限**:欧盟的文本与数据挖掘(TDM)法定豁免不涵盖LLM的“记忆化”行为,慕尼黑法院判定LLM构建永久性“数字档案”并成为原作“功能性替代品”,已超出豁免范畴 [15] 技术本质解构与证据 - **“学习隐喻”的瓦解**:研究证明AI底层是对信息的参数化存储与检索,而非人类式的抽象认知,高达95.8%的复现率表明所谓的“有损压缩”实质是高精度参数化复制 [17][18] - **图像领域的佐证**:Stable Diffusion创始人承认将10万GB图像“压缩”进2GB文件并可重新创建;研究显示,通过特定描述性提示词,模型能近乎精确地复现训练集中的原始图像 [19][21] - **文本复现的广泛性**:研究显示Meta的Llama3.1-70B模型能近乎逐字生成《哈利·波特与魔法石》等多部名著全文;平均8–15%的LLM生成文本与网上现有内容完全相同 [27][28][29] 监管安全与司法后果 - **过滤护栏失效**:现有防护极易被规避,例如通过拼写变体(如“crossing aminal”)即可让OpenAI的Sora 2模型复现《动物森友会》版权画面,证明防护措施脆弱 [30][31] - **模型本体侵权风险**:若法院像慕尼黑判决一样,认定模型内部存储了作品的参数化表达,原告可要求销毁侵权副本,AI公司可能面临强制报废模型并从头训练的风险 [34] - **企业误导与司法滞后**:AI企业将复现行为称为“边缘异常”和“技术漏洞”,但研究证实抄袭是模型内在特性;部分早期司法裁决因技术认知局限,低估了模型长篇幅复现的能力 [36][37][38] 危机化解与治理对策 - **技术内生合规体系**:建议构建全生命周期防护,包括输入数据净化、算法层引入差分隐私和反记忆正则化、输出端部署语义相似度监控与“高惊奇度”实时熔断机制 [41] - **版权许可与报酬制度**:提议建立法定强制许可机制,并借鉴“学习权”报酬制度,要求AI企业向创作者分享营收,通过公共基金补偿以维持创意生态 [42] - **司法责任边界**:主张依比例原则确立责任,若AI开发者已履行合理注意义务,应避免其承担严格责任;救济手段应优先采用功能禁令或合理赔偿,而非轻易判令销毁模型 [43] - **企业行动与行业现状**:研究披露后,除Anthropic停用Claude 3.7 Sonnet外,其他如xAI等公司未作回应;英伟达等公司被指控在训练中故意使用盗版资源,暴露出行业对侵权风险的消极回避 [44][45]
OpenAI等六大AI巨头遭作家起诉,若蓄意侵权每部作品最高获赔15万美元
新浪财经· 2025-12-23 10:07
最新集体诉讼案件 - 当地时间12月22日,由两届普利策新闻奖得主约翰·卡雷鲁牵头的作家群体向美国加州北区地方法院提起集体诉讼,将OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家AI巨头列为共同被告,指控其通过盗版书籍训练模型构成“蓄意侵权” [1][6] - 原告核心指控集中于“双重侵权链条”,即六家公司从LibGen、Z-Library等“非法影子图书馆”批量下载数百万册盗版书籍,再将这些著作用于大语言模型训练与产品优化,形成“盗版获取-模型训练-商业变现”的非法闭环 [1][6] - 原告方强调,作家的智力成果支撑起“价值数十亿美元的AI生态”,却未获分文补偿 [1][6] - 若陪审团认定侵权属故意行为,每部侵权作品最高可获赔15万美元 [2][7] 行业诉讼背景与现状 - 此次诉讼并非AI公司首次卷入文字作品侵权纠纷,据南都数字经济治理研究中心报告,OpenAI是行业“被诉大户”,已面临至少14起版权诉讼 [2][7] - 早在2023年底,《纽约时报》就侵犯版权起诉微软和OpenAI,称报纸发表的数百万篇文章被用于训练智能聊天机器人,并要求被告为非法复制和使用其作品相关的数十亿美元的损失负责,同时要求销毁使用其版权材料的任何AI模型和训练数据 [2][7] - 今年6月,OpenAI对《纽约时报》要求无限期保留消费者ChatGPT和API客户数据的诉讼请求提起上诉,认为该请求违背了其对用户的隐私承诺 [4][9] - 该案审理地加州北区法院已受理25起AI版权案件,占全美同类案件半数以上,其判决结果或将成为界定AI训练数据合法性的关键标尺 [4][9] 主要涉诉公司情况 - **OpenAI**:除面临《纽约时报》的诉讼外,去年10月,《纽约时报》还向生成式AI初创公司Perplexity发出“停止并终止”通知,要求其停止访问和使用其内容 [4][9] - **谷歌**:在12月初收到迪士尼的停止侵权函,被指“未经授权复制海量版权作品用于AI开发” [4][9] - **Meta**:同样因模型训练数据问题,多次收到好莱坞大厂的侵权警告 [4][9] - **Anthropic**:该公司因使用盗版书籍训练Claude模型被告,2025年6月被美国加州法院裁定“盗版数据不适用合理使用”,最终支付15亿美元和解并销毁侵权数据 [4][9] - **xAI与Perplexity AI**:虽成立时间较短,但此次被指控的侵权模式与行业巨头高度一致,暴露出AI公司对盗版数据的依赖 [4][9]
Minimax惹上全球最强法务部
观察者网· 2025-09-24 16:45
诉讼核心指控 - 迪士尼、环球影业、华纳兄弟探索联合起诉稀宇科技及其新加坡子公司,指控其产品“海螺AI”存在大规模知识产权侵权 [1] - 起诉书长达119页,包含58项证据,指控公司在训练和生成过程中未经授权复制、发行、创作衍生作品,违反《美国版权法》 [1] - 除直接侵权外,公司还被指控存在协助侵权,应承担连带责任 [1] - 此前在2025年1月,爱奇艺也已起诉公司未经授权使用其视频素材进行模型训练,并索赔10万元 [1] 具体侵权行为 - 训练阶段:被指控未经授权通过网络爬虫从互联网(含潜在盗版渠道)下载版权作品,用于模型训练,使作品核心元素被嵌入模型 [9] - 生成环节:用户输入简单文本提示即可生成包含版权角色细节的高清图片或视频,例如生成属于迪士尼版权的荷马·辛普森形象 [9][11],或生成包含达斯·维达角色、场景细节的内容 [12] - 推广展示:公司在官网“探索”页面及YouTube、Instagram、TikTok、微信等社交媒体公开展示侵权内容,并使用版权角色形象进行广告引流,在生成内容上加注自身品牌水印 [12] - 主观意图:起诉方强调公司已具备过滤暴力、裸露内容的技术能力,却未对版权内容采取类似保护,主观侵权意图明显 [12] - 明知故犯:2025年8月27日,原告律师曾发函列出约50个侵权IP角色,但公司未作实质回应也未下架内容 [12] 原告诉求与行业背景 - 原告明确诉求:一是索要公司的侵权所得利润,或按每部侵权作品最高15万美元主张法定损害赔偿;二是申请永久禁令,禁止公司继续使用原告作品训练AI及生成相似IP内容 [13] - 本次诉讼并非专门针对中国公司,同一律师团队近期也代理了针对Midjourney的类似诉讼 [13] - 公司目前进行到C轮投资,估值约40亿美元且有IPO计划,侵权行为被认为带来了利润并直接侵蚀正版授权市场 [13] 公司概况与市场地位 - 稀宇科技由商汤科技前副总裁闫俊杰于2021年在上海创立,是AI创业“六小龙”之一 [1] - 公司自研多模态模型及AI原生应用已覆盖超过200个国家及地区,拥有1.57亿名个人用户 [1] 法律认定与行业趋势 - 法律层面认定侵权需满足四大要件:作品受保护、未经授权使用、接触原作、生成内容与原作实质性相似 [15][16] - 不同国家对训练期间使用版权素材是否构成侵权的认定存在分歧,存在认定为合理使用的司法判例 [17] - 此类诉讼的目的更倾向于防止侵权和利益分配,而非单纯寻求赔偿 [18] - 行业趋势从无序抓取素材过渡到有序付费合作,例如OpenAI与新闻集团达成价值或超过2.5亿美元的内容授权协议,Meta也与环球音乐集团达成合作 [21][22] - 市场普遍预计AI企业将迎来版权方集中诉讼维权,行业“还债时刻”到来 [2][22]
迪士尼等好莱坞巨头起诉MiniMax侵权,涉及超50个IP
21世纪经济报道· 2025-09-17 14:14
诉讼核心事件 - 迪士尼、环球影业、华纳兄弟三大好莱坞影视巨头于9月16日在美国加州联邦法院联合起诉国内AI公司MiniMax及其新加坡国际运营公司Nanonoble Pte Ltd [2] - 诉讼指控MiniMax旗下AI产品“海螺AI”在训练和生成过程中大规模复制和再现影视、漫画作品,构成未经授权的复制、发行、衍生作品创作等行为,违反《美国版权法》 [2] - MiniMax除被指控直接侵权外,还被指存在协助侵权,应承担连带责任 [2] 原告与被告背景 - 原告方阵容强大,几乎覆盖好莱坞半壁江山,包括漫威、迪士尼、二十世纪福克斯、DC漫画、梦工厂等知名IP持有者 [2] - 被告MiniMax是国内AI创业“六小龙”之一,2021年由商汤科技前副总裁闫俊杰在上海创立,公司以“出海”为关键战略 [4] - MiniMax的自研多模态模型及AI原生应用已覆盖超过200个国家及地区,拥有1.57亿名个人用户 [4] 涉事产品与具体侵权指控 - 涉事产品“海螺AI”主要功能为文生图、文生视频、图生视频,于去年4月上线,2024年上半年进入美国AI应用市场下载量前十 [4] - 产品在推广中自称为“口袋里的好莱坞工厂”,起诉书提供了具体侵权案例,例如用户输入“荷马·辛普森正在工作的卡通形象”提示词后,模型会生成高清、可下载的属于迪士尼版权的辛普森形象 [4] - MiniMax被指控有能力通过技术手段(如已用于拦截暴力和裸露内容的过滤系统)阻止侵权但选择不作为 [6] - 2025年8月27日,原告律师曾向MiniMax发函列出约50个侵权IP角色(包括钢铁侠、死侍、蜘蛛侠等),但公司未作实质回应或下架内容 [6] - MiniMax在YouTube、Instagram、TikTok、微信等社交媒体上使用版权角色形象生成的视频进行宣传,相关帖文与链接被列为证据 [7] 诉讼诉求与潜在影响 - 原告要求法院判决MiniMax赔偿实际损失,或选择法定赔偿,每部被侵权作品最高赔偿15万美元,按诉讼提及的50部作品计算,总计可能达750万美元 [7] - 原告还要求法院发布禁令,禁止MiniMax继续侵犯版权,并为海螺AI加入版权保护机制 [7] - 诉讼书指出,MiniMax目前估值约40亿美元且有IPO计划,其侵权行为带来了利润并直接侵蚀正版授权市场 [7] 行业背景与先例 - 此次诉讼并非好莱坞巨头首次与AI平台交锋,今年6月迪士尼和环球已联手起诉Midjourney,本月早些时候华纳兄弟也单独提起诉讼,三起案件由同一律师团队代理,起诉思路类似 [8] - 类似争议在国内已有司法先例,2024年初广州互联网法院在“奥特曼”系列相关案件中裁定,AI平台有防范与提示义务,应通过关键词过滤等方式避免生成与IP高度相似的作品 [8] - 目前大多数国内AI平台已禁止生成奥特曼形象,但未全面覆盖蝙蝠侠、魔童降世哪吒、Labubu等其他热门IP [8]
日经、朝日加入读卖行列:Perplexity AI 现遭日本三大媒体起诉
搜狐财经· 2025-08-26 16:23
诉讼背景 - 日本新闻巨头《日经新闻》和《朝日新闻》对AI搜索企业Perplexity AI发起版权诉讼 [1][3] 核心指控内容 - Perplexity被指控通过技术手段绕过媒体内容保护措施 从服务器收集文章并创建违反日本版权法规的作品摘要 [3] - AI摘要被指未能忠实反映原始文章内容 损害媒体声誉并侵犯商业利益 [3] - 公司行为涉嫌违反日本《反不正当竞争法》 [3] 诉讼诉求 - 要求东京地方法院勒令Perplexity停止使用两家媒体作品资源并删除摘要 [3] - 寻求合计22亿日元(约1.07亿元人民币)的经济补偿 [3]