人工智能训练
搜索文档
Reddit(RDDT.US)状告AI独角兽Perplexity:指控其非法抓取数据训练搜索引擎
智通财经· 2025-10-23 15:21
诉讼核心事件 - 社交媒体平台Reddit在纽约联邦法院对人工智能初创公司Perplexity及其他三家企业提起诉讼,指控其非法抓取数据用于训练AI搜索引擎 [1] - 诉状称数据抓取公司绕过了平台的数据保护措施,窃取驱动Perplexity“答案引擎”系统所需的数据 [1] - Reddit要求法院判决支付金额未指明的金钱损害赔偿,并颁布禁令禁止Perplexity使用其数据 [2] 被指控的侵权方与行为 - 被指控的三家数据抓取公司分别为立陶宛的Oxylabs、俄罗斯的AWMProxy和得克萨斯州的SerpApi,它们被指在未经许可的情况下从数十亿条搜索结果中抓取Reddit数据 [2] - Perplexity被指控与至少一家数据抓取公司合作获取了未获授权的Reddit材料 [2] - Reddit表示去年曾向Perplexity发出停止并终止函,但此后该公司对Reddit内容的引用量反而增加了四十倍 [2] 行业背景与公司立场 - 此次诉讼是内容所有者就涉嫌滥用受版权保护材料训练AI系统而对科技公司提起的众多诉讼之一,Reddit曾在6月对AI初创公司Anthropic提起类似诉讼 [1] - Reddit首席法务官指出,AI公司正陷入一场争夺优质人类内容的军备竞赛,催生了工业规模的“数据洗白”经济 [1] - Reddit拥有数千个基于兴趣的“子版块”网络社区,是AI生成用户问题答案时最常引用的来源,并已将其内容授权给谷歌、OpenAI等公司用于AI训练 [1] 被告方的回应 - Perplexity声明其通过精准的人工智能提供事实性答案,方法始终秉持原则且负责任,不会容忍对开放性和公共利益的威胁 [1] - SerpApi一位发言人表示强烈反对Reddit的指控,并准备在法庭上积极辩护 [2] - Oxylabs对消息感到震惊和失望,称Reddit未曾尝试与其直接沟通,并表示将对指控进行抗辩 [2]
Meta收购ScaleAI补强数据能力,引发客户流失与监管争议
海通国际证券· 2025-06-16 22:33
报告行业投资评级 未提及相关内容 报告的核心观点 - Meta收购Scale AI是补齐数据能力、强化AI竞争力的重大战略布局,但交易是否能带来长期实质性竞争优势仍有待验证 [4] 根据相关目录分别进行总结 事件 - 2025年6月Meta宣布以约148亿美元收购Scale AI 49%的非投票股份,Scale创始人Alexandr Wang将加入Meta负责“超智能”实验室建设,交易完成后Scale AI继续独立运营,但其与微软、谷歌等客户合作前景存疑 [1][6] 点评 - 补齐AI训练链条,强化数据闭环能力:Meta收购强化其在AI训练链条中的数据处理与评估环节,Scale AI的一体化平台能力补齐Meta在Llama模型之外的训练反馈与质量控制短板,有助于构建完整AI开发路径,为超智能实验室提供关键资源 [2][7] - 开源路线面临商业化挑战,Scale助力Meta布局To B能力:Meta坚持开源大模型策略但商业化进展缓慢,Scale拥有丰富政府及企业客户资源,产品成熟度高、服务能力广,有望成为Meta切入企业级AI服务市场的桥梁,Meta可望构建“开源 + 企业服务”混合模式增强To B市场盈利能力与竞争韧性 [2][8] 客户流失 - Meta收购Scale AI引发信任危机,谷歌、微软、xAI等AI巨头因担忧商业数据泄露终止与Scale的合作,谷歌撤回价值数亿美元的标注合同,Scale失去“中立平台”形象,市场信任体系重创,促使行业从“集中化数据平台”模式向“分布式数据协作”转变 [3][8] 监管争议 - 人才收购引发监管争议,少数股权投资虽通常不触发正式审查,但Meta收购Scale AI若被认为损害市场竞争,可能面临FTC或司法部调查,此前微软、谷歌类似交易已被关注,此次Meta交易是否通过资本手段整合资源巩固市场主导地位引发质疑,FTC和司法部的应对将反映特朗普政府对“人才收购”类交易的监管态度 [4][9]