Data scraping - 财报，业绩电话会，研报，新闻

Data scraping

搜索文档

Reddit CEO on data scraping lawsuit: Our duty is to protect our business and our users

Youtube· 2025-10-31 08:00

核心观点 - Reddit公司认为其数据具有重要价值并已与谷歌和OpenAI等大型科技公司建立了合作关系同时公司正通过法律手段应对Anthropic和Perplexity等公司涉嫌未经授权使用其数据的问题[1][2][3] 数据价值与合作关系 - Reddit数据被认识到具有很高价值过去几年公司与合作伙伴通过合作共同提升了产品和服务[3] - 公司与谷歌和OpenAI等重要行业参与者保持着良好的合作关系[3] - 公司期待持续推进并深化这些合作关系[3] 数据保护与法律行动 - 公司有责任保护其商业数据和用户数据[2] - 公司已对Anthropic和Perplexity等公司提出法律投诉指控其涉嫌剽窃和不当利用数据[1][2] - 公司认为这些法律投诉内容详实但拒绝对正在进行的法律程序发表进一步评论[2]

Reddit Sues Perplexity, Others Over Alleged Data Scraping

Insurance Journal· 2025-10-23 13:13

诉讼核心事件 - Reddit公司起诉Perplexity AI及其他三家公司涉嫌未经许可非法抓取数据[1] - 被指控的三家数据抓取公司Oxylabs UAB、AWMProxy和SerpApi通过谷歌搜索结果非法收集数据用于转售[2] - Perplexity AI被指控从至少一家上述公司购买该数据[2] - Reddit寻求金钱赔偿并申请法院禁令以停止数据抓取和使用行为[3] 市场背景与数据价值 - Reddit不断增长的数据存储库因AI模型的兴起已成为宝贵商品[4] - AI模型依赖海量信息进行训练和提供相关结果[4] - Reddit已与OpenAI和Alphabet旗下谷歌签署数据授权协议用于训练目的[4] - AI公司正陷入对优质人类内容的军备竞赛推动了工业规模的“数据洗钱”经济[5] - Reddit是主要目标因其拥有最大、最具活力的人类对话集合之一[5] 公司股价与法律行动 - 诉讼消息公布后Reddit股价在纽约市场下午1:45下跌6.5%[3] - Reddit今年早些时候已在旧金山法院对AI公司Anthropic提起类似的数据抓取诉讼[4] 涉事方回应 - Perplexity AI表示尚未收到诉讼但将坚决捍卫用户自由公平获取公共知识的权利[5] - Perplexity AI称其方法保持原则性和负责任不会容忍对开放性和公共利益的威胁[5] - SerpApi和Oxylabs未回应置评请求AWMProxy发言人未能联系到[6]

谷歌(US:GOOGL)

Data scraping

Artificial Intelligence

Data scraping

Artificial Intelligence

Web giant Cloudflare to block AI bots from scraping content by default

CNBC· 2025-07-01 18:07

公司行动 - Cloudflare将默认阻止AI爬虫未经许可抓取网站内容这一措施可能显著影响AI开发者的模型训练能力 [1] - 从周二开始所有新注册Cloudflare的网站域名将被询问是否允许AI爬虫从而赋予网站阻止数据抓取的权限 [2] - 该行动建立在2023年9月推出的工具基础上当时允许发布者一键阻止AI爬虫现在将此设为默认设置 [6] 行业背景 - Cloudflare作为内容分发网络(CDN) 通过缓存数据使用户更快获取在线内容在全球互联网流量中占比约16% [2][3] - AI爬虫是自动化程序专门从网站和数据库提取大量数据用于训练OpenAI和谷歌等公司的大型语言模型 [4] - 传统互联网模式通过引导用户访问原始网站奖励创作者而AI爬虫收集内容生成回答使用户无需访问原始来源 [5] 行业影响 - AI爬虫被指控过度抓取数据严重影响网站运营和用户体验可能耗尽发布商的流量和在线广告收入 [5][7] - 该措施若有效实施将阻碍AI聊天机器人收集训练和搜索数据短期内影响模型训练长期可能威胁模型可行性 [8] - OpenAI拒绝参与该计划认为Cloudflare在系统中增加了中间环节并强调其爬虫尊重发布者偏好 [6][7]

Cloudflare(US:NET)

Artificial Intelligence

Data scraping

Content Delivery Networks

Artificial Intelligence

Content Delivery Network (CDN)

AI crawlers

Artificial Intelligence

Data scraping

Content Delivery Networks

Artificial Intelligence

Content Delivery Network (CDN)

AI crawlers

Reddit sues AI firm Anthropic over alleged unlawful data scraping

Proactiveinvestors NA· 2025-06-05 22:50

关于作者Angela Harmantas - 拥有15年北美股市报道经验尤其专注于初级资源类股票 [1] - 曾为加拿大美国澳大利亚巴西加纳南非等国的领先行业出版物进行报道 [1] - 曾从事投资者关系工作并领导瑞典政府在加拿大的外国直接投资计划 [1] 关于出版商Proactive - 为全球投资受众提供快速可获取信息丰富且可操作的商业与金融新闻内容 [2] - 内容由经验丰富的新闻记者团队独立制作 [2] - 在全球主要金融和投资中心设有分社和工作室包括伦敦纽约多伦多温哥华悉尼和珀斯 [2] 内容覆盖领域 - 专注于中小市值市场同时覆盖蓝筹股公司大宗商品和更广泛的投资故事 [3] - 提供生物技术和制药采矿和自然资源电池金属石油和天然气加密货币以及新兴数字和电动汽车技术等领域的新闻和独特见解 [3] 技术应用 - 积极采用前瞻性技术内容创作者拥有数十年的宝贵专业知识和经验 [4] - 使用技术和软件工具辅助和增强工作流程 [4] - 偶尔使用自动化和生成式AI工具但所有发布内容均由人类编辑和撰写遵循内容制作和搜索引擎优化的最佳实践 [5]