Workflow
Google Books
icon
搜索文档
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
量子位· 2025-06-26 11:43
核心观点 - 美国法院首次裁定AI公司可在未经作者许可情况下使用合法购买的已出版书籍训练AI 依据合理使用原则认定AI训练属于转化性使用 未取代原作市场且有利于技术创新[2][3][17] - 法院明确区分数据来源合法性 盗版书籍训练不构成合理使用 需承担侵权责任 但合法采购书籍的扫描副本可用于训练[15][16][33] - 裁决显著降低AI行业训练数据的版权风险 为LLMs发展提供法律支持 可能影响OpenAI和Meta等同类案件审理[3][32][34] 案件背景 - Anthropic被指控在2021-2022年通过盗版网站LibGen等非法下载超700万份受版权保护书籍建立数字图书馆 2023年使用子集训练Claude模型[7][8][10] - 2024年转向合法采购 雇佣前Google图书扫描项目负责人Turvey采购数百万本纸质书 但未持续跟进出版商授权沟通[11][12] - 2024年8月三位作家起诉其非法复制作品训练AI 法院最终支持合法来源数据的使用权[6][13] 法律依据 - 援引美国版权法"合理使用"原则 认定AI训练具有高度转化性 输出内容未侵犯原作且未形成市场替代[2][14] - 参考历史判例:2015年Google Books案确立数字化检索属合理使用 2022年GitHub Copilot案确认代码训练转化性[24][25][29] - 法院强调技术中立性 类比人类阅读学习过程 认为AI消化书籍信息应获同等权利[4][18] 行业影响 - 加速AI公司数据获取合规化进程 Anthropic等企业需建立正版采购渠道 避免盗版资源[11][15] - 技术解决方案受推动 GitHub Copilot已部署代码来源标注功能 防范许可证冲突[29][30] - 创作者权益保护机制待完善 需探索新型授权模式应对AI训练需求[19] 争议焦点 - 法律界对"转化性使用"标准存在分歧 部分观点认为AI大规模复制不同于人类学习[19] - 开源社区担忧商业公司滥用合理使用条款 将免费资源转化为付费服务[28][29] - 出版商面临正版采购与盗版监控的双重成本压力[12][31]
AI版权风波再起,英美图书界重申捍卫版权的必要性
新京报· 2025-05-13 20:48
自ChatGPT等大型语言训练模型上线以来,AI(人工智能)在带来新体验和便利的同时,版权问题一直 悬而未决。 据英国《书商》杂志报道,英国下议院近日否决了《数据(使用与获取)法案》中的一项修正案之后, 英国创意工作者和行业领袖联名签署了一封公开信,敦促首相基尔·斯塔默执行版权法。 这项被否决的修正案原本规定,人工智能公司必须告知版权拥有者哪些具体被用于训练人工智能模型。 然而,该法案在未采纳该修正案的情况下获得通过,并将送返上议院,预计于当地时间5月12日进行关 键投票。 南加州大学古尔德法学院教授乔纳森·巴奈特(Jonathan Barnett)警告称,出版商及其他知识产权行业必 须从过去吸取教训,特别是在谷歌开发"Google Books"项目中,无偿抓取互联网上全部内容的行为,最 终被法院认定属于"合理使用"的范围。这一判决让谷歌的行为成为"美国历史上最大规模的侵权案",而 谷歌公司却未因此承担任何后果。他指出,人工智能公司如今正在试图复制这一商业模式,将内容收集 成本降至零。科技公司也希望如同谷歌当年一样,最终法院能够为其背书。 另一位主讲人、Kadrey诉Meta案临时首席律师马克斯韦尔·普里特( ...