Workflow
合理使用原则
icon
搜索文档
OpenAI成“被诉大户”,但版权人未必都选择“死磕”
南方都市报· 2025-12-18 19:01
迪士尼的IP授权策略与诉讼行动 - 迪士尼与OpenAI达成10亿美元股权投资协议 并将旗下200多个动漫角色授权给OpenAI的Sora模型使用 授权费以股票认股权证形式支付而非现金 [1] - 迪士尼向谷歌发出停止侵权函 指控其未经授权复制海量迪士尼版权作品用于训练和开发生成式AI模型并进行商业开发 [1] - 迪士尼此前已向Meta和Character.AI发出类似停止侵权函 并联合其他好莱坞大厂对Midjourney和MiniMax提起版权侵权诉讼 [1] 美国AI版权诉讼概况 - 截至2025年11月18日 美国已至少发生56起AI版权诉争 其中超过50起案件涉及AI模型输入端和输出端版权侵权 [3] - 诉讼集中于加州北区法院(25件)和纽约南区法院(20件) 这两个司法辖区合计占统计案件总数的80% 原因在于前者是科技公司聚集地 后者是媒体出版业中心 [4] - 发起诉讼的权利人包括个人创作者及新闻机构、出版商、好莱坞巨头等企业 被诉方则几乎全是全球顶尖AI公司 [5] - OpenAI是被起诉最多的公司 面临至少14起诉讼 [5] AI版权案件的核心争议焦点 - 在56起案件中 仅有2起纠纷涉及AI生成内容是否受版权法保护的认定问题 [5] - 其余50余起案件主要争议点集中在两方面:一是仅指控AI公司未经允许使用版权材料 二是在此基础上同时指控AI生成内容构成版权侵权 [5] - 模型输入端侵权是案件“风暴眼” 被告普遍以版权法上的“合理使用”原则进行抗辩 而原告则强调AI生成内容会对版权内容的既有市场造成冲击 不能构成合理使用 [5] - 关于输入端侵权 美国法院的裁决观点存在冲突 有法官认为使用特定图书副本训练大模型属于合理使用(前提是不使用盗版数据库) 另有法官则认为未经许可复制作品训练AI模型是违法的 [6] 版权纠纷的解决趋势:诉讼与和解 - 截至2025年11月28日 在56起案件中 有5起最终达成和解 [7] - 近期案例显示 版权方转向“以诉促和” 例如华纳音乐、环球音乐等音乐厂牌结束与AI音乐平台Suno和Udio的诉争 前提是签订授权许可协议 [7] - 在诉讼压力下 头部AI公司与版权方签署内容授权协议已成为趋势 例如OpenAI自2023年以来已与Axel Springer、金融时报、新闻集团等多家新闻出版机构达成合作协议 [7] - 报告指出 这种个案式和解主要惠及有能力迫使AI公司谈判的知名机构 而缺乏影响力的版权人可能仍需诉诸诉讼 [8] 中美AI版权治理路径差异 - 中国的AI版权纠纷已宣判案件更集中于AI生成内容是否具有版权 暂未大规模涉及AI公司能否免费使用受版权保护材料的问题 [3] - 中国目前至少有两起AI训练数据版权案件在北京互联网法院审理 其中一起已延宕两年 案件结果能否在2026年“出炉”备受关注 [3] - 中国就模型输入端版权纠纷的制度化探索尚未见端倪 但有最高人民法院法官建议采取“宽进严出”思路:在训练数据“输入端”构建数据合理使用制度 在“输出端”采取较严格设计 [8] - 2024年6月 四位插画师指控某大模型运营方未经授权使用美术作品的案件在北京互联网法院开庭 但截至2025年12月中旬仍未宣判 [8][9]
苹果被 2 名作家指控利用盗版书籍训练 AI 模型
搜狐财经· 2025-09-06 12:41
法律诉讼指控 - 两名作家向加州北区联邦法院提起集体诉讼 指控苹果公司非法使用盗版数据集Books3训练AI模型[1] - 涉事AI模型包括开源模型OpenELM和基础语言模型 数据集包含大量受版权保护的盗版书籍[1] 原告核心诉求 - 要求法院确认集体诉讼资格 主张经济赔偿包括补偿性赔偿与不当得利返还[4] - 要求永久禁止苹果继续侵权行为 依据《美国法典》第17卷第503条销毁所有涉及侵权作品的AI模型与训练集[4] - 主张由苹果承担诉讼成本及律师费用 为版权方提供全面法律保护[4] 行业背景与争议焦点 - 案件发生于AI训练版权争议关键时期 Anthropic刚以15亿美元达成类似案件和解[4] - Meta在近期诉讼中因"合理使用"抗辩胜诉 争议核心在于"合理使用"原则的适用边界[4] - 作家群体坚持认为未经许可的使用构成侵权 与科技公司立场形成直接对立[4]
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
量子位· 2025-06-26 11:43
核心观点 - 美国法院首次裁定AI公司可在未经作者许可情况下使用合法购买的已出版书籍训练AI 依据合理使用原则认定AI训练属于转化性使用 未取代原作市场且有利于技术创新[2][3][17] - 法院明确区分数据来源合法性 盗版书籍训练不构成合理使用 需承担侵权责任 但合法采购书籍的扫描副本可用于训练[15][16][33] - 裁决显著降低AI行业训练数据的版权风险 为LLMs发展提供法律支持 可能影响OpenAI和Meta等同类案件审理[3][32][34] 案件背景 - Anthropic被指控在2021-2022年通过盗版网站LibGen等非法下载超700万份受版权保护书籍建立数字图书馆 2023年使用子集训练Claude模型[7][8][10] - 2024年转向合法采购 雇佣前Google图书扫描项目负责人Turvey采购数百万本纸质书 但未持续跟进出版商授权沟通[11][12] - 2024年8月三位作家起诉其非法复制作品训练AI 法院最终支持合法来源数据的使用权[6][13] 法律依据 - 援引美国版权法"合理使用"原则 认定AI训练具有高度转化性 输出内容未侵犯原作且未形成市场替代[2][14] - 参考历史判例:2015年Google Books案确立数字化检索属合理使用 2022年GitHub Copilot案确认代码训练转化性[24][25][29] - 法院强调技术中立性 类比人类阅读学习过程 认为AI消化书籍信息应获同等权利[4][18] 行业影响 - 加速AI公司数据获取合规化进程 Anthropic等企业需建立正版采购渠道 避免盗版资源[11][15] - 技术解决方案受推动 GitHub Copilot已部署代码来源标注功能 防范许可证冲突[29][30] - 创作者权益保护机制待完善 需探索新型授权模式应对AI训练需求[19] 争议焦点 - 法律界对"转化性使用"标准存在分歧 部分观点认为AI大规模复制不同于人类学习[19] - 开源社区担忧商业公司滥用合理使用条款 将免费资源转化为付费服务[28][29] - 出版商面临正版采购与盗版监控的双重成本压力[12][31]