Workflow
SlimLM
icon
搜索文档
Adobe hit with proposed class-action, accused of misusing authors' work in AI training
TechCrunch· 2025-12-18 08:44
核心观点 - 软件公司Adobe因涉嫌使用盗版书籍训练其AI模型SlimLM而面临集体诉讼 这可能对其全面拥抱AI技术的战略带来法律麻烦 [1][2] 诉讼指控详情 - 诉讼由俄勒冈州作家Elizabeth Lyon代表提出 指控Adobe使用盗版书籍训练其SlimLM程序 其中包含Lyon本人的作品 [2] - 诉讼称 Adobe使用的SlimPajama-627B数据集是对RedPajama数据集的复制和操纵 而RedPajama包含了名为Books3的数据集 Books3内含原告及集体诉讼成员的受版权保护作品 [4] - Books3是一个包含191,000本书籍的大型数据集 已被用于训练生成式AI系统 并成为科技界持续的法律纠纷源头 [4] 涉事AI产品与技术背景 - Adobe将SlimLM描述为一个小型语言模型系列 可针对移动设备上的文档辅助任务进行优化 [3] - 公司称SlimLM是基于Cerebras于2023年6月发布的开源数据集SlimPajama-627B进行预训练的 该数据集经过去重且包含多语料库 [3] - Lyon女士撰写了多本非虚构写作指南 她发现自己的部分作品被包含在Adobe所使用的预训练数据集中 [3] 行业法律环境与类似案例 - 针对AI训练数据使用版权材料的法律诉讼在科技行业已变得司空见惯 [5] - 2024年9月 Anthropic同意向起诉其使用盗版作品训练聊天机器人Claude的作家们支付15亿美元 此案被视为AI训练数据版权法律战的一个潜在转折点 [5] - RedPajama数据集已在多起诉讼案件中被引用 例如2024年9月针对苹果的诉讼指控其使用版权材料训练Apple Intelligence模型 以及2024年10月针对Salesforce的类似诉讼 [4]