版权侵权

搜索文档
Meta 被曝用 2396 部成人片训练 AI,面临 3.5 亿刀赔偿
菜鸟教程· 2025-08-21 11:30
AI技术发展现状 - 人工智能技术近年突飞猛进 在多领域出现替代甚至超越人类能力的迹象 [1] - 编程领域出现显著变革 开发者从依赖Google/Stackoverflow转向基于ChatGPT等AI工具编程 [3] - AI技术发展经历三阶段:小规模数据阶段(如早期棋类AI)→海量网络数据阶段(如GPT-3使用数百GB文本训练)→多元化学习阶段(处理视频、音频等多模态数据) [5] Meta版权侵权诉讼案 - Meta被两家美国成人影视公司Strike 3 Holdings和Counterlife Media起诉 指控其侵犯版权 [3] - 诉讼核心为Meta未经许可下载并传播2396部版权影片用于AI模型训练 [4] - 案件由美国加州北区联邦法院旧金山分院受理 案由为"版权侵权"并要求陪审团审判 [7] 侵权技术细节 - Meta通过六组虚拟私有云(VPC)伪装成普通BT用户进行7×24小时做种和下载 [10] - 47个关联IP涵盖企业网段和员工住宅地址 部分影片持续做种数年 [15] - 采用"以种换速"的BitTorrent算法 节省数亿美元授权费并规避反爬机制 [15] 原告诉求与潜在影响 - 要求Meta删除所有侵权影片并从AI训练集中剔除相关内容 主张每部影片最高赔偿15万美元 总额可能达3.59亿美元 [8] - 要求法院强制Meta删除训练权重、销毁模型副本并公开算法审计报告 [16] - 原告警告若继续使用其影片训练 AI生成内容成本将低于传统拍摄1/10 对整个行业形成降维打击 [12] 行业影响与争议 - 事件引发对AI训练数据获取合法性、合规性及版权尊重问题的关注 [3] - 网友指出Strike 3为频繁发起诉讼的制片公司 本次诉讼对象为大型科技企业 [17] - 若按2396部影片每部15万美元计算 赔偿金额约3.6亿美元 可能成为史上最贵版权赔偿案例 [18]
检索增强生成(RAG)的版权新关注
36氪· 2025-08-14 18:11
AIGC技术演进 - AIGC进入2.0阶段,核心是从依赖模型训练生成内容转向整合第三方权威信息提升准确性、时效性和专业性[3] - 技术实现基于检索增强生成(RAG),结合语言生成模型与信息检索技术,2025年国内厂商普遍应用该功能[3] - 亚马逊2025年5月及7月与《纽约时报》、赫斯特、康泰纳仕等传媒集团达成合作,AI产品可实时展示新闻摘要和片段[2] - OpenAI于2025年4月与《华盛顿邮报》合作,ChatGPT输出内容嵌入文章摘要和原始链接,涉及20余家出版商[2] 检索增强生成崛起原因 - RAG由Facebook AI Research团队2020年提出,解决大模型"幻觉"和"时效断层"缺陷[4] - 大模型存在输出不可靠信息问题,例如2023年6月ChatGPT编造针对主持人Frederick Riehl的虚假信息导致诽谤诉讼[5] - 模型知识受训练数据时间限制,如ChatGPT训练语料截止2021年9月,Gemini 2.0截止2024年6月[5] - RAG无需重新训练模型参数,通过实时外部数据提供答案,类比"开卷考试"模式[6] 版权纠纷案例 - 2024年10月美国首例RAG版权诉讼:道琼斯和纽约邮报控股公司诉Perplexity AI,指控爬取数十万篇版权文章[8] - 2025年2月《大西洋月刊》《卫报》等14家出版商起诉Cohere,指控实时抓取内容并输出完整原文[8] - 2025年4月欧盟法院受理匈牙利新闻商Like诉谷歌Gemini案,涉及新闻出版商邻接权[9] - 2024年8月知网向国内AI检索平台发送侵权告知函,指控未经许可使用知网内容数据[9] 作品收集版权问题 - RAG数据检索阶段涉及长期复制和临时复制,长期复制如固定到硬盘或服务器可能构成侵权[11] - 道琼斯案中原告主张Perplexity AI在输入阶段大规模复制文章已构成侵权[11] - 欧盟知识产权局指出动态检索场景下临时保存内容可能适用文本与数据挖掘例外[11] - 若实时检索后内容被本地化存储,仍可能被认定为长期复制[11] 技术保护措施问题 - 规避技术措施如付费墙或登录验证可能违反著作权法,技术措施分为接触控制和利用控制[12] - 道琼斯案中《华尔街日报》付费墙属于接触控制措施,规避行为违反美国《数字千年版权法》[13] - 知网案中访问权限设置涉及技术措施,第三方绕过限制可能构成违法[12] 作品利用侵权类型 - 直接侵权包括侵犯复制权、改编权和信息网络传播权,如《纽约时报》诉OpenAI案中指控实时搜索引用内容[14] - 复制与改编区分参考北京高院指南:未形成新作品属复制,形成新作品属改编[14] - 间接侵权可能因标注盗版网站来源或用户后续传播行为,需结合模型厂商注意义务判定[15] 合理使用争议 - 使用盗版内容构建知识库不构成合理使用,如2025年6月Anthropic案中法院认定下载盗版书籍侵权[17] - 合法获取作品时市场替代性是关键,欧盟报告指出摘要内容若替代原作品访问可能侵权[17] - 日本文化厅规定输出内容若包含原作品独创性表达则不构成合理使用[17] - 规避技术措施与合理使用认定可能分离,但欧盟和日本法规将遵守技术措施作为前提[17] - 输出阶段合理使用取决于复制比例和注明来源,欧盟允许极短摘录引用[18] - 美国版权局认为输出节略版本而非超链接不太可能构成合理使用[19] - 微软允许网站通过robots元标签控制摘录长度,平衡许可费用和用户访问意愿[19]
腾讯新游戏涉嫌抄袭,索尼在美国发起版权诉讼
新浪财经· 2025-07-29 16:41
索尼起诉腾讯侵权 - 索尼公司指控腾讯《荒野起源》游戏"盲从式克隆"其《地平线》系列游戏 [1] - 诉讼指控涉及游戏玩法、故事主题和艺术元素的相似性 [1] - 视频游戏记者将《荒野起源》称为《地平线》仿制品 甚至戏称为"Horizon Zero Originality" [1] 法律行动细节 - 索尼向美国加州联邦法院提交诉讼 案件编号为3:25-cv-06275 [4] - 索尼要求法院判决腾讯支付赔偿金并颁发禁令阻止侵权行为 [4] - 索尼代理律师来自Orrick Herrington & Sutcliffe 腾讯律师信息未公布 [4] 诉讼背景 - 诉讼于上周五提交至加州北部联邦地区法院 [1][4] - 科技媒体WccfTech于7月28日报道该事件 IT之家7月29日转载 [1]
百元定制“AI孙燕姿” 豪赚360万流量
南方都市报· 2025-06-30 12:29
AI歌手技术发展 - AI歌手技术从二次元小圈层进入大众文化 通过"经典曲目+顶流声线+风格混搭"的组合成为破圈利器 如"AI方大同"翻唱《珠玉》播放量达120万次 "AI孙燕姿"单条视频最高播放量突破360万次 [1][2] - 技术迭代推动AI歌手发展 2020年Synthesizer V引擎通过神经网络技术实现"呼吸声、转音与真人无异"的演唱效果 2022年So-Vits-SVC模型降低真人声线克隆门槛 用户可用数小时干声素材训练专属AI歌手 [3] - 开源社区出现"声线破解教程" 指导用户通过"频谱图逆向工程"提取歌手声纹特征 AI翻唱账号可实现一天发布4-10条内容 通过"蹭热歌+克隆顶流"模式快速涨粉 [4][5] AI歌手产业现状 - AI音色克隆技术催生"AI声音黑市" 二手平台现"AI声音克隆"服务 完成一首AI翻唱歌曲价格在80-100元 技术门槛降至"百元级" 未经授权的声音克隆可批量生产 [6] - AI歌手内容创作呈现井喷态势 B站UP主"陈墨瞳1995"一周内发布10个"AI孙燕姿"视频 最火爆视频播放量超360万 跨语种、跨次元创作如打雷姐AI翻唱《大悲咒》引发裂变式传播 [3] - AI歌手技术实现依赖数据采集、模型训练、参数调校三个核心环节 专业调校者需花费数小时打磨细节 如调节"气息振动频率"参数避免高音段"虚声"问题 [4] 法律与监管 - AI翻唱涉及三重版权红线:歌手声音权、词曲作者版权、录音制作者邻接权 若单条百万播放量视频按版权费标准计算 侵权方可能面临数万元赔偿 [7] - 现行《著作权法》对使用未授权歌曲素材训练AI尚无明确界定 技术发展带来法律空白 如"AI方大同"未经授权使用歌手发声方式涉嫌侵犯表演者权 [7] - 国家四部门制定《人工智能生成合成内容标识办法》 明确AI合成音乐需添加显式或隐式标识 将于2025年9月1日起施行 AI歌手作品将被纳入监管 [8]