Workflow
AI版权
icon
搜索文档
Meta否认用相册图训练AI|南财合规周报(第196期)
21世纪经济报道· 2025-06-30 10:06
人工智能 - Meta表示目前未使用用户未发布的照片训练AI模型 但未明确未来是否会使用[2] - Meta推出"云端处理"功能 允许用户授权其访问相机胶卷内容用于AI创意生成 但强调当前未用于模型训练[3] - 美国法院连续两起判决认定AI公司未经授权使用书籍训练大模型属于"合理使用" 但强调数据采集方式需合法[4] - Anthropic案与Meta案对"影子图书馆"非法下载渠道的认定存在分歧 前者认为需区分偷书与学习行为 后者更倾向整体判断[4] 平台治理 - 《反不正当竞争法》修订通过 将于2025年10月15日施行 新增公平竞争审查制度[5] - 新法规禁止平台强制商家低价销售 限制利用数据算法妨碍竞争对手[6] - 专门规定禁止大型企业滥用优势地位拖欠中小企业账款[6] 数据安全 - 公安部通报45款APP违规收集个人信息 包括《哈啰》《蘑菇街》等12款短剧APP存在误导用户行为[7] - 上海网信办专项治理AIGC网站 下线未通过安全评估的AI服务 重点打击"AI换脸""AI造假"等滥用行为[8]
AI版权关键进展:美国连判两案,大模型“偷书”不算偷
21世纪经济报道· 2025-06-26 18:31
核心观点 - 美国两起司法判决为AI训练使用版权作品提供了"合理使用"的法律依据,但适用条件存在差异 [1] - 法院认为AI训练过程具有"高度转换性",不构成对原作品市场的直接替代 [2][3] - 数据获取渠道合法性成为争议焦点,两案对"影子图书馆"的认定出现分歧 [5][6] - 判决强调市场影响是关键考量因素,不同行业受AI冲击程度可能不同 [7] - 版权争议已从文本领域扩展至视觉创作领域,引发多起诉讼 [8] 判决内容 - Meta案判决认为Llama模型训练符合"合理使用"原则,因其使用目的具有高度转换性且未再现原文 [2] - Anthropic案同样认定训练过程合法,但区分了合法扫描与盗版来源的不同性质 [3][4] - Meta使用Books3等影子图书馆数据训练模型,累计尝试授权投入上亿美元但未果 [5] - Anthropic建立"永久中央图书库"储存700万本盗版书籍,被认定构成独立侵权行为 [6] 法律分析 - 法院采用四要素判断标准:使用目的、作品性质、使用比例与市场影响 [7] - "高度转换性"指AI训练改变了作品原始用途(如从阅读变为代码生成) [2][3] - 中间性技术行为(如缓存、索引)可能被纳入合理使用范畴 [3] - 市场替代效应是核心考量,新闻类作品可能比图书更易受AI冲击 [7] 行业影响 - 判决为AI公司使用版权材料训练模型提供了有限法律空间 [1][3] - 视觉创作领域出现新诉讼,迪士尼/环球起诉Midjourney,国内插画师起诉Trik AI [8] - 授权机制缺失导致企业转向影子图书馆,Meta曾计划投入上亿美元获取授权 [5] - 技术防护措施(如"去记忆"技术)可能影响法院对侵权程度的认定 [6] 数据细节 - Meta的Llama模型训练数据2/3来自Common Crawl,其余来自Books3等 [5] - Anthropic建立中央图书库储存超过700万本图书,部分来自影子图书馆 [6] - Llama模型仅在极端提示下能重现约50个词的原文内容 [6]
一场就得“数百万美金”?Getty CEO说:“AI版权战”太贵了!
搜狐财经· 2025-05-29 10:46
Getty Images在AI版权争议中的立场 - 公司自2022年起禁止用户上传AI生成图像,并在2023年推出"具有社会责任感"的图像生成器,强调尊重并回报艺术家[2] - 公司起诉Stability AI,指控其未经许可使用超过1200万张Getty图库图片及其元数据训练模型,打造"竞争平台"[2] - 公司CEO透露在与Stability AI的版权官司中已花费"数百万美元",认为诉讼成本过高难以追诉所有侵权案件[2] AI公司的立场与争议 - Stability AI等公司辩称通过网络抓取图像用于模型训练属于"合理使用",受版权法保护[3] - AI公司认为支付授权费用将减缓技术创新,"制约"产业发展,并敦促尽快制定标准以保障经济领先地位[5] - 前Meta高管Nick Clegg认为要求训练前征得艺术家同意会"扼杀"AI行业,建议采用"选择退出"机制[6] 行业观点交锋 - Getty CEO抨击AI公司"以创新之名窃取版权作品",认为这是"不公平竞争"而非正当竞争[5] - Fairly Trained CEO反驳Clegg,指出艺术家诉求可行,并将AI公司辩解与早期Napster案例类比[6][7] - 网友讽刺AI公司说辞,如"黑胡子海盗"和"榨取他人劳动成果"等比喻[7] Getty的法律与政策行动 - 公司向特朗普政府提交建议,反对AI公司推动的"学习权"豁免条款[7] - 强调美国版权法未阻碍AI进步,反而是可持续发展的路径,要求授权并非过度限制[8] - 公司担忧大规模逃避付费将打击创作积极性,创造"令人悲哀的世界"[8]
速递|用8000万授权数据挑战Midjourney,Freepik的生成式AI版权新解法
Z Potentials· 2025-04-30 12:25
Freepik发布新型AI图像模型F Lite - 公司推出基于商业授权数据训练的开放AI图像模型F Lite 包含约100亿个参数 与AI初创公司Fal ai合作开发 利用64台Nvidia H100 GPU耗时两个月完成训练[2] - F Lite加入基于授权数据训练的小型生成式AI模型行列 行业趋势显示这类模型数量正在增长[3] - 模型基于8000万张内部图像数据集训练 提供标准版和纹理版两种版本 标准版更具可预测性 纹理版能呈现更优纹理效果和创意构图[4] 模型技术特点 - 标准版严格遵循提示 艺术性较低 纹理版更为混乱易出错 但能呈现更佳纹理效果[4] - 运行F Lite需要至少24GB显存的GPU支持 技术门槛较高[7] - 公司未声称F Lite图像质量优于Midjourney V7等领先图像生成器 目标是公开模型供开发者定制改进[6] 行业背景 - 生成式AI正成为版权诉讼核心 多数公司主张合理使用原则 而创作者和知识产权持有者持反对意见[4] - 其他基于授权数据开发媒体生成模型的公司包括Adobe Bria Getty Images Moonvalley和Shutterstock[7] - 随着AI版权诉讼结果明朗化 基于授权数据的AI模型市场可能呈指数级增长[7]