Workflow
单点故障
icon
搜索文档
数据中心过热致芝商所中断交易超10小时
新华社· 2025-11-29 19:34
事件概述 - 美国芝加哥商品交易所集团一处关键数据中心因过热暂停服务超过10小时,导致美国股指期货和期权交易一度中断[1] - 事件发生在当地时间11月27日晚至28日晨,交易于格林尼治时间28日13时35分恢复[1] - 数据中心位于芝加哥西部郊区奥罗拉,因冷气设备故障导致温度升至近49摄氏度,超过美国行业规定的最高温度约48%[1] 受影响的市场与产品 - 芝商所的美国股指期货和期权交易一度中断[1] - 芝商所的债券与货币交易平台同样受到影响[1] - 马来西亚吉隆坡的证券交易商一度中断衍生品交易[1] 事件原因与处理 - 数据中心由赛勒斯万公司运营,故障原因为“一冷水机组故障影响多个冷却装置”[1] - 公司已派遣工程师连夜抢修并启动临时冷却设备[1] - 暂不清楚芝商所为何未启用纽约地区的备用数据中心,有推断认为可能因大型交易商在备用数据中心的技术基础设施不足[1] 芝商所的业务规模 - 芝商所日均处理与1.5万亿美元标的股指相关的期货和期权交易[2] - 日均处理名义金额9.6万亿美元的利率相关投机交易[2] - 10月的日均衍生品交易合同达2630万份[2] 行业影响与专家观点 - 此次事件凸显数字经济时代市场交易平台过度集中存在风险[1] - 芝商所成为“单点故障”,即一旦发生故障,可能让整个系统无法运转[2] - 此次事件可能是对市场结构重要性及相互关联性的“一次迟来提醒”[2]
【环球财经】数据中心过热致芝商所中断交易超10小时
新华社· 2025-11-29 19:03
事件概述 - 美国芝加哥商品交易所集团一处关键数据中心因过热暂停服务超过10小时 导致美国股指期货和期权交易一度中断 债券与货币交易平台同样受影响 [1] - 中断的数据中心位于芝加哥奥罗拉 因冷气设备故障导致温度升至近49摄氏度 超过美国行业规定最高温度约48% [1] - 数据中心由赛勒斯万公司运营 故障原因为一冷水机组故障影响多个冷却装置 公司已致歉并抢修 [1] 影响与规模 - 芝商所日均处理与1.5万亿美元标的股指相关的期货和期权交易 以及名义金额9.6万亿美元的利率相关投机交易 [2] - 10月芝商所的日均衍生品交易合同达2630万份 [2] - 事件导致马来西亚吉隆坡的证券交易商一度中断衍生品交易 [1] 暴露的问题与行业观点 - 此次事件凸显数字经济时代市场交易平台过度集中存在的风险 [1] - 芝商所成为“单点故障” 即一旦发生故障可能让整个系统无法运转 [2] - 有观点认为此次事件是对市场结构重要性及相互关联性的一次迟来提醒 [2] - 暂不清楚芝商所为何未启用纽约地区的备用数据中心 有推断认为可能因大型交易商在备用数据中心的技术基础设施不足 [1]
【特稿】数据中心过热致芝商所中断交易超10小时
新华社· 2025-11-29 15:55
事件概述 - 美国芝加哥商品交易所集团一处关键数据中心因冷却设备故障导致服务中断超过10小时,影响美国股指期货、期权、债券与货币交易平台,并波及马来西亚吉隆坡的证券交易商衍生品交易[1] - 数据中心位于芝加哥奥罗拉,故障导致内部温度升至近49摄氏度,超过美国行业规定最高温度约48%[1] - 数据中心运营商为赛勒斯万公司,故障原因为一冷水机组故障影响多个冷却装置,公司已进行抢修并启动临时冷却设备[1] 交易规模与市场影响 - 芝商所日均处理与1.5万亿美元标的股指相关的期货和期权交易,以及名义金额9.6万亿美元的利率相关投机交易[2] - 10月日均衍生品交易合同达2630万份[2] - 专家指出芝商所成为“单点故障”,一旦故障可能让整个系统无法运转,此次事件是对市场结构重要性及相互关联性的“一次迟来提醒”[2] 基础设施与应急响应 - 芝商所未启用纽约地区备用数据中心,可能原因是在备用数据中心的大型交易商技术基础设施不足,因而选择等待主数据中心故障修复[1] - 事件凸显数字经济时代市场交易平台过度集中存在的风险[1]
Cloudflare重大宕机引发全球网站大面积访问故障
国际金融报· 2025-11-19 15:47
事件概述 - 美东时间11月18日清晨,互联网基础设施服务商Cloudflare发生大规模宕机,导致其网络和安全服务出现故障 [1] - 大量全球知名互联网服务出现访问速度下降、页面报错或完全无法访问的状况,影响范围涵盖社交网络、人工智能服务、电商、云服务及部分公共交通系统 [1] 影响范围 - 监测数据显示,X、Spotify、OpenAI、亚马逊云服务AWS、Shopify、Truth Social等多项服务出现大面积故障 [1] - 甚至连网络状态监测网站DownDetector自身也因依赖Cloudflare服务而短暂无法访问 [1] - 后续确认OpenAI、Spotify、Shopify、Canva、Zoom以及部分公共交通服务均因"第三方服务问题"受到影响 [8] 故障时间线与处理 - 当天清晨5点20分左右,Cloudflare监测到网络中出现异常流量激增 [1] - 故障发生后不到两小时,公司表示已开始调查问题 [1] - 上午7点30分左右,部分服务开始恢复,但用户仍可能遇到访问延迟或错误 [1] - 进入8点,公司确认找到了故障源头并推进修复 [1] - 9点42分至9点57分,公司宣布核心问题已经解决,大量受影响网站陆续恢复 [1] 事故根本原因 - 事故根本原因来自公司内部一套用于识别和阻断恶意机器人流量的自动生成配置文件 [2] - 该配置文件在例行升级后规模意外变大,远超系统预期,最终触发负责整体流量处理的软件组件持续崩溃 [2] - Cloudflare首席技术官在社交媒体上公开致歉,承认公司辜负了客户和整个互联网 [2][4] 市场与行业影响 - 作为全球处理约20%互联网流量的重要基础设施提供方,此次故障导致公司股价在事件发生后短时间内下跌超过2% [5] - 网络连接监测组织认为,本次事件展示了Cloudflare基础设施在出现灾难性故障时对互联网带来的系统性冲击,使其成为互联网"最大的单点故障之一" [7] - 网络安全顾问指出,由于可选择的托管平台有限,大量企业严重依赖Cloudflare、AWS或微软等大型服务商,集中度过高意味着任何一次重大故障都可能引发连锁反应 [7] 近期行业类似事件 - 此次宕机是全球互联网基础服务近期发生的又一次大规模事故 [8] - 一个月前,亚马逊AWS出现持续故障,导致超过一千个网站和在线应用数小时瘫痪 [8] - 微软Azure及365服务也曾发生全球性宕机 [8] - 今年7月,美国网络安全服务提供商CrowdStrike的一次软件升级错误造成全球范围蓝屏事故,影响持续多日 [8]