Cloudflare(NET)
搜索文档
Cloudflare故障引发全球互联网混乱 AI时代集中式网络可靠性待考
中国经营报· 2025-11-24 17:47
但集中式网络基础设施在AI时代面临严峻挑战。随着数字化进程的加速,互联网对少数关键基础设施 的依赖程度日益加深。这种高度集中的架构虽然提高了效率,但也使得整个系统变得异常脆弱。一旦核 心节点出现问题,就可能引发连锁反应,导致大范围的服务中断。 近日,网络安全与基础设施服务商Cloudflare遭遇自2019年以来最严重的服务中断事件,故障持续近5小 时,导致ChatGPT、社交媒体平台X等多家网站部分用户无法正常访问。 值得注意的是,此次事件并非网络攻击所致,而是由配置文件异常引发系统崩溃。 Cloudflare在随后不 久发表声明:"Cloudflare已察觉并正在调查一个影响多个客户的问题:大范围500错误,Cloudflare仪表 板和API也出现故障。" 该事件再次引发业界对集中式网络基础设施可靠性的广泛讨论。 Akamai亚太地区及日本安全技术和战略总监Reuben Koh在接受《中国经营报》记者采访时表示,问题 的核心在于集中性风险,现代技术栈的复杂性意味着没有服务商能够完全避免故障。此次事件进一步证 明,当核心基础设施出现故障时,可能会拖累部分互联网生态系统。 实际上,集中式网络基础设施的崛起源 ...
英伟达称不保证与 OpenAI 达成千亿美元最终投资协议;徐洁云接任小米集团公关部总经理;谷歌回应苹果安卓世纪破冰|Q资讯
搜狐财经· 2025-11-23 14:42
TikTok与Meta人才变动 - TikTok主站视频推荐算法负责人宋洋(Adam Zhang)近日正式离职并加入Meta,将全面接管Instagram Reels的推荐业务,这是硅谷科技巨头首次直接从TikTok挖走推荐业务一号位高管[1] - 宋洋职业履历覆盖中美顶尖互联网领域,曾为CiteSeerX开发团队核心成员,并任职于微软雷蒙德研究院与谷歌,2020年以副总裁级别加入快手,2024年年中加入TikTok负责主站Feed流推荐业务[2] - Meta创始人扎克伯格亲自致电邀请宋洋加盟,并开出极具吸引力的薪酬条件,业内人士推测其年薪或达到数千万美元级别[2] - Meta迫切引进宋洋反映其在短视频领域的战略焦虑,TikTok在不到两年时间内美国用户消费总时长已超过Instagram[3] 小米人事调整 - 原小米集团公关部总经理王化转岗小米武汉总部,由徐洁云接任小米集团公关部总经理一职,徐洁云目前职位为小米集团董事长特别助理、战略市场部副总经理[4] - 王化的新职位为小米武汉区域总部综合管理部总经理[5] 英伟达对华芯片出口与投资动态 - 美国政府正考虑批准向中国出口英伟达H200人工智能芯片,美国商务部就改变对华出口限制一事进行审查[5] - H200芯片相比于前代产品H100拥有更多高带宽内存,处理数据更快速,性能估计是英伟达H20芯片的两倍[6] - 英伟达警告不保证与OpenAI达成1000亿美元最终投资协议,双方此前宣布自2026年起分多年投资但未披露具体时间表及成本[12] - 英伟达在10-Q文件中表示无法保证就OpenAI合作签署最终协议或投资按预期条款完成,同时强调第三季度对英特尔投资500亿美元及与Anthropic达成的最高1000亿美元投资协议[12] 吉利智驾团队整合 - 极氪智驾团队员工正陆续换签劳动合同至为新整合设立的合资公司,包括千里智驾及其子公司千里浩瀚,相关工作接近尾声[7] - 千里智驾为智驾方案供应商,千里浩瀚专门为吉利提供辅助驾驶服务,极氪辅助驾驶团队核心技术及预研能力与千里科技大模型能力均用于千里浩瀚团队[8] - 目前千里浩瀚团队负责H5、H7和H9承担主要量产任务,迈驰辅助驾驶团队负责技术预研,分工可能随融合进一步调整[8] Meta领导层变动 - Meta首席营收官John Hegeman宣布将离开公司投身创业,其职责由广告产品和战略团队负责人Andrew Bocking接手[9] - 此前有报道指出Meta首席人工智能科学家Yann LeCun也有意离开公司计划创业,公司近期成立超级智能实验室并聘请Scale AI前首席执行官领导AI工作[9] 谷歌与苹果跨平台互通 - 谷歌确认Pixel 10系列搭载的快速分享已与苹果AirDrop实现底层协议级互通,iPhone、iPad、Mac与安卓手机首次在系统层面完成点对点文件互传[10] - 互通采用蓝牙握手加Wi-Fi Direct直连组合,数据不经过云端中转,传输速率与苹果内部设备保持一致,安全流程沿用AirDrop实名对撞机制[10] - 业内判断协议兼容由谷歌单方面通过净室逆向完成,苹果处于沉默观察阶段,此次更新未出现在苹果官方日程[11] AI产品与市场动态 - 谷歌发布最新基础模型Gemini 3,该模型在基准测试中以37.4分创历史新高,超过GPT-5 Pro的31.64分,并在LMArena排行榜名列前茅[13][14] - Gemini应用目前拥有超过6.5亿月活跃用户,1300万软件开发人员已将模型作为工作流程一部分[14] - 德国Bitkom调查显示50%受访者有时通过AI聊天查找信息而非传统搜索引擎,25%主要使用传统搜索引擎,16-29岁人群中5%只用AI搜索、11%主要使用AI[15] - 约四分之三人群认为AI反馈结果有帮助,约三分之二对AI搜索运作方式感到满意[16] - 蚂蚁灵光App上线4天下载量突破100万次,冲上App Store中国区免费榜第六,首周下载量超过ChatGPT的60.6万次及Sora2的5天破百万记录[17][22] 行业数据与趋势 - 脉脉高聘人才智库调研显示中国AI工程师与美国同行薪资差距缩短至2倍,但美国AI从业者周工作时长高达80-100小时,三分之二中国AI从业者周工作时长低于60小时[24] - 中国与美国普通程序员薪酬差距约为7倍,但AI工程师岗位差距显著低于人民币兑美元汇率差,中国AI工程师工作性价比高于美国同行[25] - 今年9月中国AI相关新发岗位比去年同期激增超11倍,1000多家AI公司发布超过7.2万个高薪岗位,部分岗位年薪最高达140万元[25] - LayerX报告显示企业数据外泄主要源头是拷贝黏贴,77%员工将数据粘贴到AI提示框中,32%企业账户到非企业账户拷贝粘贴操作发生在GenAI中[26] - GenAI占企业应用使用量11%,45%员工经常使用AI工具,67%AI工具通过个人账户访问,ChatGPT使用量占所有使用量92%[26] 谷歌隐私争议 - 谷歌否认使用用户Gmail邮件内容训练Gemini AI模型,发言人称相关报道具有误导性,公司未更改任何用户设置且不会使用邮件内容训练模型[22][23] - 谷歌重申邮件内容属于用户隐私不会用于训练大模型,但部分用户反馈智能功能被默认重新开启,建议用户手动检查Gmail或Google账户设置[23]
After Cloudflare Outage, Palo Alto Networks Moves to Acquire Observability Platform for $3.35 Billion
PYMNTS.com· 2025-11-22 08:24
On Tuesday (Nov. 18) morning, a configuration error at Cloudflare knocked major services offline, including ChatGPT, X and Spotify for several hours, the latest reminder of how vulnerable digital infrastructure has become as cloud systems grow more complex. One day later, Palo Alto Networks announced plans to acquire Chronosphere, a platform designed to track system performance for $3.35 billion.By completing this form, you agree to receive marketing communications from PYMNTS and to the sharing of your inf ...
Cloudflare (NET) CEO’s “a Solid Guy,” Says Jim Cramer
Yahoo Finance· 2025-11-22 03:21
We recently published 13 Stocks That Crossed Jim Cramer’s Radar. Cloudflare, Inc. (NYSE:NET) is one of the stocks Jim Cramer discussed. The day this show was aired, Cloudflare, Inc. (NYSE:NET) was under fire for a global disruption that disrupted a host of well-known services, including ChatGPT and Spotify. The firm later explained that the outage was due to a file that was aimed to protect against security threats. Cramer has been increasingly optimistic about the cybersecurity sector in 2025. Even thoug ...
Cloudflare Just Broke the Internet, But It’s Still a Red-Hot Buy
Yahoo Finance· 2025-11-22 03:16
Finger pointing to Cloudflare logo in front of laptop computer. Key Points Shares of Cloudflare sold off on Tuesday, Nov. 18, after a global outage shook the internet. However, strong fundamentals and consistent analyst support still point to long-term upside. This week’s panic may actually be setting up a buy-the-dip opportunity. Interested in Cloudflare, Inc.? Here are five stocks we like better. Tech giant Cloudflare Inc. (NYSE: NET) found itself at the center of chaos on Tuesday, Nov. 18, when ...
Cloudflare宕机,互联网世界怎么又断网了?
搜狐财经· 2025-11-21 21:54
事件概述 - Cloudflare一次例行升级因数据库权限调整异常,导致生成的特征文件体积比平时大了一倍,引发全球性技术故障[1] - 故障导致包括X、ChatGPT、Spotify在内的多家海外互联网巨头服务在数小时内几乎瘫痪,用户遭遇"InternalServerError"报错页面[1] - 事故并非外部攻击导致的人为事故,而是由Cloudflare内部引发[1] 故障机制 - 异常特征文件被快速推送至全球数千台边缘节点,核心程序无法解析导致崩溃,形成多国多地区节点相近时刻故障的"全球同步掉线"场景[3] - 系统每隔几分钟自动检查更新,导致节点在旧文件下短暂恢复后,又被新错误文件覆盖再次宕机,出现"恢复—再报错—再恢复"的循环[3] - 工程师最终追踪到特征文件问题,暂停错误文件更新后情况逐渐稳定,并向全球节点重新推送正常版本,错误量在短时间内迅速下降[3] 市场影响与反应 - 事发当日Cloudflare盘前股价一度下跌超过2%[5] - Cloudflare首席技术官公开致歉,承认网络出现严重问题,"辜负了依赖我们的客户和整个互联网"[5] - 此次宕机的影响被记录为近期互联网基础设施事故中"规模最为罕见的之一"[3] 行业结构性问题 - Cloudflare承载着全球大约五分之一的互联网流量,其故障导致依赖其代理层的成千上万家服务在极短时间内同步受到冲击[7] - 此次事故与上个月前AWS的中断类似,当时共有超过两千家服务受影响,累计超过八百万条用户报错被记录[7] - 事件揭示了互联网命运过度依附于少数几家巨头的问题,在云计算领域,全球前三家巨头掌控了超过近七成的基础设施[7][8] - 基于当前行业集中度,类似的故障预计还会再度发生,且问题将越来越无法回避[10]
Cloudflare全球故障,搞瘫了半个互联网!
猿大侠· 2025-11-21 12:11
事件概述 - 全球网络基础设施服务商Cloudflare于北京时间2025年11月18日19:20至22:30发生重大故障,核心故障持续约3小时,完全恢复耗时约6小时 [1][8][9][10] - 故障根本原因非网络攻击,系内部数据库权限变更触发潜伏Bug,导致机器人管理配置文件体积异常膨胀,进而引发全球节点软件崩溃 [8] - 故障引发连锁反应,全球近半数互联网服务受到影响,大量网站出现访问错误或加载失败 [13] 故障时间线 - 19:05:工程师部署关于ClickHouse数据库访问控制的变更 [5] - 19:28:变更生效,故障开始 [6] - 19:32-21:05:Cloudflare团队介入调查 [8] - 21:05:实施第一阶段缓解措施,但核心问题仍存在 [8] - 21:37:团队找到故障根本原因 [8] - 22:24:停止生成异常配置文件,并强制节点回滚到旧版正常文件 [7] - 22:30:核心服务恢复 [8][9] - 次日01:06:所有系统完全恢复正常 [10] 影响范围与表现 - 影响范围为全球性,涉及社交媒体、人工智能平台、在线工具及游戏服务等多个领域 [13][14] - 具体受影响服务包括AI圈的ChatGPT、Claude、Perplexity,社交圈的X (Twitter)、Spotify、Discord、Grindr,以及游戏圈的英雄联盟、Minecraft服务器等 [14] - 用户访问时出现500错误、"Internal Server Error"提示,或卡在"正在验证您是否是人类"的验证页面 [15] - 由于故障发生在北京时间晚高峰时段,国内用户感知较为明显 [15] 公司业务与行业地位 - Cloudflare主要提供CDN服务,通过分布在全球各地的服务器缓存网站内容,使用户能从距离最近、延迟较低的节点获取数据 [17] - 公司在网络基础设施中扮演关键角色,其故障对全球互联网服务有重大影响,有网友调侃"CF一挂掉,全球科研水平下降1000倍" [17] 后续处理 - Cloudflare暂未公布赔付计划 [19] - 根据其官网SLA,对Business和Enterprise计划客户,如果可用性低于99.9%可获部分月费退款,本次约4.5小时中断预计可获得10-20%的信用补偿 [19]
Ramsey Theory Group CEO Dan Herbatschek Shares Six Ways to Prevent Latent Bugs from Crashing Bot Mitigation Systems Following Cloudflare's November 18 Incident
Globenewswire· 2025-11-20 20:50
事件概述 - 2025年11月18日,Cloudflare因一次配置更新激活了其核心机器人防护服务中的一个潜在缺陷,导致全球多个地区出现大范围服务性能下降 [1][2] - 此次事件由支持机器人防护能力的核心服务中的潜在缺陷被触发,影响了全球主要的数字平台及流行的消费者和企业服务 [1][2] 事件根本原因分析 - 事件说明了最被低估的操作风险形式之一:潜在缺陷与正常、预期的配置变更发生碰撞 [3] - 当机器人防护、Web应用防火墙、内容分发网络和API网关这一层出现内部配置推送导致的静默故障时,会拖垮其后的所有系统 [3] 企业防范潜在缺陷的六大措施 - 将机器人防护等视为零级基础设施:为其分配与服务等级目标、错误预算和等同于支付处理及认证层级的执行可见性 [4] - 要求所有配置变更进行分阶段发布:使用金丝雀区域、流量分片和渐进式发布自动化,并内置与错误率和异常检测挂钩的回滚触发器 [5] - 建立镜像生产环境的预生产环境:对配置更新进行负载测试、混沌测试和旨在暴露隐藏缺陷的负面流量场景测试 [6] - 增强围绕配置事件的可观测性:为遥测数据打上配置版本ID、部署时间戳和审计元数据标签,确保团队能在数秒内回答“最近10分钟发生了什么变化” [7] - 设计优雅降级架构:设计清晰的故障开放和故障关闭行为,实施保护边缘网络的断路器,并确保为面向客户的流量存在备用路径 [8] - 加强变更管理和事后学习:要求所有机器人防护和防火墙规则更新进行同行评审,进行无责事后分析,并基于经验教训持续完善测试和发布逻辑 [9] 企业应向第三方服务商提出的关键问题 - 服务商在全球发布前如何分阶段测试机器人防护配置更新 [10] - 哪些自动化保障措施可防止单一配置变更导致区域或租户级系统崩溃 [13] - 当潜在缺陷在负载下被激活时,服务商的回滚协议是什么 [13] - 服务商如何超越公共状态页面进行实时事件进展沟通 [13] 核心观点总结 - 即使基础设施可以外包,但韧性不能外包,客户不会区分是供应商的中断还是企业自身的中断 [11] - 主动的配置治理、可观测性和分阶段发布实践现在是企业必不可少的责任,而非可选的工程增强 [11]
一个网站的更新,让外国人集体断网6小时
虎嗅APP· 2025-11-20 18:18
文章核心观点 - Cloudflare的一次技术配置更新导致全球性服务中断,持续时间近6小时,影响了包括推特、ChatGPT、Canva、英雄联盟及瓦罗兰特等大量知名网站和在线服务[5][6][9][76] - 事件凸显了互联网基础设施高度集中化的脆弱性,少数核心服务商的故障可能引发连锁反应,对全球网络稳定性构成系统性风险[36][43][87][88] - 企业级用户因服务中断面临直接经济损失,但小公司缺乏资源实施多云部署等备用方案,暴露出行业资源分配不均的结构性问题[81][84] Cloudflare服务中断影响范围 - 服务中断导致用户无法访问推特、ChatGPT、Canva等平台,游戏服务如英雄联盟和瓦罗兰特出现服务器连接问题,甚至状态监测网站Down Detector也同时瘫痪[7][9][12] - 全球用户通过社交媒体表达不满,相关推文获得60万次阅读量,反映出事件引发的广泛社会关注[16][17][19][29] - 故障表现为间歇性服务恢复,用户体验出现"时好时坏"的波动状态,增加了问题定位的复杂性[64][68][70] 事故技术原因分析 - 直接原因为数据库权限调整导致Bot管理系统的特征文件生成机制异常:系统请求时多个数据库分片同时响应,使特征数据从正常60条激增至超200条上限,触发系统保护机制崩溃[51][56][58][61][62] - Cloudflare采用分片存储架构(ClickHouse数据库),将数据分布在全球330多个数据中心,但配置变更使查询请求被全部分片接收,造成数据重复[52][54][57] - 系统设计存在容错缺陷:特征文件上限设置为200条,未考虑极端情况下的数据冗余风险[59][60] Cloudflare业务模式与行业地位 - 公司主要提供CDN加速、DDoS防护、Web应用防火墙及DNS服务,全球部署330个数据中心,通过就近访问原则优化网站加载速度[36][38] - 商业模式类似"互联网物业",承担流量过滤、安全防护及缓存优化功能,服务中断时所有经其代理的网站访问均被阻断[36][39][41] - 作为行业龙头曾成功抵御7.3Tbps规模的DDoS攻击,但此次内部配置错误暴露其运维体系的单点故障风险[73][74] 行业系统性风险启示 - 基础设施服务商故障产生放大效应:对比上个月AWS宕机影响60个国家1700万用户、3500家企业,每小时损失超7500万美元,本次事件进一步印证集中化架构的脆弱性[81][82] - 企业用户缺乏有效避险手段,多云部署方案因成本与复杂度难以普及,尤其对中小型企业形成资源壁垒[84] - 行业需加强容错机制建设,但类似事故反复发生(AWS、Cloudflare连续宕机)表明技术保障承诺与实际稳定性之间存在差距[80][85]
Cloudflare outage rocks stock amid sell-off
Yahoo Finance· 2025-11-20 02:33
云服务行业集中度与中断影响 - 主要云服务提供商数量极少,却控制着互联网的大部分[1] - 近期AWS服务中断持续时间远超包括专家在内的普遍预期[1] - 服务中断影响范围广泛,波及Snapchat、Signal等应用以及智能床垫、自动猫砂盆等物联网设备[2] Cloudflare服务中断事件 - 公司在11月18日发生服务中断,导致依赖其服务的X和ChatGPT等主要互联网平台无法访问[3] - 中断原因为用于管理安全威胁的自动生成配置文件过大,导致处理流量的软件系统崩溃[4] - 服务中断已完全恢复[3] Cloudflare股价表现 - 11月18日服务中断导致公司股票当日收盘下跌2.83%,报收196.53美元[3][4] - 此次中断加剧了股票的持续抛售,当前收盘价较10月31日253.30美元的峰值收盘价下跌22.4%[4] - 10月31日的股价峰值出现在公司发布强劲季度财报之后[5] Cloudflare第三季度财务业绩 - 公司第三季度总营收为5.62亿美元,同比增长31%[8] - 毛利润为4.157亿美元,毛利率为74.0%,去年同期为3.341亿美元,毛利率为77.7%[8] - 净亏损为130万美元,去年同期净亏损为1530万美元[8] - 基本和稀释后每股净亏损为0.00美元,去年同期为0.04美元[8] 近期业务动态与市场环境 - 公司将收购AI平台Replicate,使开发者能通过一行代码访问全球任何AI模型[7] - 近期股价抛售并非源于业绩不佳,而是由于股票被纳入因市场对AI持怀疑态度而受冲击的板块[6] - 对AI的怀疑引发了更广泛的科技股抛售,市场认为该板块内多数公司估值过高[6]