Megatron 345M
搜索文档
英伟达否认用盗版书训练AI,要求法院驳回相关诉讼
搜狐财经· 2026-02-08 23:36
案件核心观点 - 英伟达向加州联邦法院提交动议,要求驳回作家团体的集体诉讼,坚决否认曾使用盗版书籍训练其AI模型 [1] - 英伟达认为原告未能提供任何实质性证据证明其作品被下载或用于模型训练,相关指控纯属推测 [1] 英伟达的法律辩护要点 - 英伟达指出,原告未能提出事实来证明公司复制了其具体作品,也未说明复制发生的时间、方式或涉及哪些模型,缺乏关键细节的主张被视为推测性指控 [2] - 针对原告援引的内部讨论,英伟达辩称员工讨论或询问访问盗版书库Anna's Archive的可能性,并不等同于公司实际下载或获取了原告作品 [1][2] - 英伟达强调,讨论或评估潜在数据来源本身不构成版权法意义上的复制行为,版权侵权诉讼要求原告在起诉阶段就必须提出足够的事实依据 [2] - 英伟达批评原告大量依赖“基于信息与信念”的表述,认为这是试图以取证程序替代起诉阶段应完成的事实陈述 [2] 原告的指控与案件范围 - 原告主张英伟达的AI工具与参考模型在训练过程中使用了来自“影子图书馆”(如Anna's Archive和Books3)的受版权保护书籍 [1] - 原告在修订版起诉书中加入了新的理论、数据集与模型指控,包括对Megatron 345M等内容的讨论 [1][3] - 原告还提出了“间接责任”路径,试图将英伟达的NeMo Megatron框架及其支持下载公共数据集(如The Pile)的能力纳入责任范围 [4] 英伟达对指控范围的抗辩 - 英伟达试图缩小案件范围,反对原告在修订起诉书中新增的多个数据集与模型指控 [3] - 英伟达认为原告将多个模型与工具进行“打包式”指控,却没有解释任何特定模型如何使用原告作品进行训练 [3] - 英伟达引用其公开文档,称原告对训练数据来源的推断与公开资料存在矛盾 [3] - 针对“间接责任”指控,英伟达回应称,起诉书并未指称任何第三方实施了直接侵权行为,而这是主张帮助侵权或替代责任所必需的前提条件 [4] - 英伟达强调,提供可选工具本身并不能自动构成侵权责任,除非原告能够提出具体事实证明用户确实利用这些工具实施了版权侵权 [4] 案件程序信息 - 案件名为Nazemian v Nvidia,由加州北区联邦法院法官Jon Tigar审理 [1] - 英伟达提交的驳回动议预计将于2026年4月2日举行听证 [4]