计量表后供电
搜索文档
纳德拉亲口承认:微软 GPU 堆成山,却因缺电在仓库吃灰!
程序员的那些事· 2025-11-05 22:21
微软面临的运营瓶颈 - 微软首席执行官承认公司面临大量英伟达AI芯片因缺电和缺数据中心空间而闲置的尴尬局面[1] - 当前最大的问题并非算力过剩或芯片供应,而是供电能力以及能否快速建成靠近电源的数据中心[2] - 基础设施不足是导致芯片无法运行的核心原因,而非算力需求不足[4] 瓶颈的具体原因 - 瓶颈首要原因为电力缺乏[5] - 次要原因为缺少可立即投入使用的数据中心,即已建好并具备足够供电与冷却能力的机房外壳[6] - 微软首席执行官明确指出公司受到的是电力限制,而非芯片供应限制[8] 行业共性问题与前瞻布局 - 电力与基础设施匹配问题已成为大模型巨头们共同面临的挑战[10] - OpenAI首席执行官同期讨论也指出行业挑战超越算力,更多涉及能源和基础设施[11] - 为应对此挑战,OpenAI首席执行官已提前布局,投资了裂变能源公司Oklo、聚变能源公司Helion及太阳能创业公司Exowatt[12][13] - 但新型能源技术距大规模商用尚远,数据中心短期内仍需依赖燃气和可再生能源混合供电[14] 电力供需失衡的宏观背景 - 过去五年美国整体电力需求曲线因AI和云计算带动的数据中心建设而突然拉高[15] - 用电需求增速远超公用事业公司原本的新增发电规划[16] - 传统电厂从立项到并网需数年周期,与AI产业以季度计算的扩张节奏严重不匹配[17] - 为弥补供能缺口,越来越多数据中心开发商采用"计量表后"供电方式,直接将电力接入数据中心[17] 基础设施建设的滞后性 - 数据中心、电力与冷却系统的建设节奏远跟不上现实需求[18] - 光伏太阳能作为建设周期最短的能源形式,从选址、施工到并网仍需数月甚至一年,而AI需求变化可能仅需一次模型更新或产品发布[19][20] - 算力曲线每季度刷新纪录时,能源系统审批流程仍进展缓慢[21] 对未来的分歧与策略调整 - 部分业内人士担忧若AI需求增速放缓,为支撑算力而大规模投资的电厂和储能项目或出现闲置风险[22] - OpenAI首席执行官则认为AI用电需求不可能回落只会持续增长,更高效便宜的算力将激发出更多应用场景[23][24] - 此观点符合杰文斯悖论,即资源更高效利用将导致更大规模使用,从而增加整体需求[25][26] - 若算力成本下降100倍,用量增长将远超100倍[27] - OpenAI首席执行官呼吁美国政府每年增加100吉瓦发电能力,并将其视为AI战略资产[28] 企业运营策略的转变 - 算力端企业重新调整策略,微软明确表态不再囤积单一代GPU[29][30] - 理由在于昂贵的英伟达芯片若暂时无法使用,两三年后可能被新架构取代,在通常为六年的折旧周期内提前贬值,造成资源浪费和现金占用[31][32][33] 行业焦点转移与潜在方向 - AI产业算力增长的关键已从芯片产量转向能源与基础设施能否同步扩张[37] - 行业目光重新转向上游芯片厂商,过去比拼峰值性能的标准可能因电力短缺而改变[38][39] - 有观点指出,在电力限制下,每工作最节能的芯片将更具吸引力,例如速度提升1.2倍但能耗降低25%的芯片将非常有吸引力[40] 地理战略转移 - 微软已获批准向阿联酋运送英伟达芯片以建设AI数据中心[42] - 公司计划未来四年在海湾国家投资80亿美元用于数据中心、云计算和其他人工智能项目[43] - 此举标志着AI基础设施可能正从硅谷迁往资金丰厚、能源充足的新兴市场[44]