Reddit sues Perplexity AI over ‘industrial-scale' data scraping
诉讼核心与指控 - 社交媒体巨头Reddit起诉Perplexity AI及其他三家公司,指控其进行“工业规模”的数据抓取,以窃取网站帖子内容[1] - Reddit指控被告方进行不公平竞争、不当得利以及违反美国版权法,并寻求未指明的损害赔偿[4] - Reddit的首席法律官表示,这些数据抓取工具“隐藏身份、隐匿位置并伪装其网络爬虫,以从谷歌搜索中窃取Reddit内容”[6] 被告方与商业模式 - 除Perplexity AI外,诉讼还针对其依赖的较小合作伙伴,包括Oxylabs UAB、AWMProxy和SerpApi[5] - Reddit称Perplexity是这些抓取工具的“自愿客户”,选择购买被盗数据而非与Reddit达成合法协议[8] - 作为对比,谷歌和OpenAI等公司已与Reddit及其他内容提供商签署了数据使用协议[2] 数据价值与侵权规模 - Reddit拥有超过10万个“子版块”社区,其用户生成内容被研究人员认为有助于训练AI聊天机器人产生更类人的回答[11] - 诉讼中指出,Reddit用户帖子是Perplexity生成的AI答案中最常引用的来源[11] - Reddit向Perplexity发出停止函后,该AI平台对Reddit内容的使用量反而激增了“四十倍”[12] 被告方的回应 - Perplexity否认指控,并反诉Reddit进行“敲诈勒索”[8][13] - SerpApi发言人否认诉讼中的说法,并坚决支持其商业模式和行为[10] - Oxylabs的首席治理与战略官表示将坚决捍卫自己,并自称是公共数据收集领域的先驱和行业领导者[10] - AWMProxy未能立即取得联系以置评[11]