Workflow
DeepSeek真成救世主了
微软微软(US:MSFT) 虎嗅APP·2025-02-28 21:26

AI行业能源消耗与DeepSeek的技术革新 - 谷歌2019年以来温室气体排放量增长48%,微软二氧化碳排放量增加近30%,核心原因是AI模型、硬件和数据中心能耗大幅攀升[1] - 微软取消两个数据中心项目(威斯康星州Kenosha和乔治亚州亚特兰大),涉及数百兆瓦电力容量调整,并终止与私营数据中心运营商的租赁协议[2] - DeepSeek通过技术优化使训练成本仅为OpenAI的1/10,使用成本为OpenAI的1/30,显著降低能源消耗[7] DeepSeek降低能耗的四大技术路径 - 流水线并行优化(DualPipe):通过前向传播和反向传播交错执行,最大化GPU利用率,缩短训练等待时间[4] - 冗余专家策略负载均衡器(EPLB):在MoE架构下复制繁忙专家分担负载,避免GPU闲置[4] - FP8混合精度训练:采用8位浮点数训练,内存与计算资源消耗降低,间接减少电力成本[5] - 多令牌预测(MTP):一次生成多个token提高信息利用率,缩短训练时间[5] 能耗数据对比 - DeepSeek总能耗约1.9 GWh(预训练2.66百万GPU小时+强化学习0.5百万GPU小时,H800 GPU平均功耗600W)[5] - GPT-4 Moe总能耗约10.4 GWh(8000个H100 GPU训练90天),是DeepSeek的5倍[6] - Grok3单次训练碳排放相当于4.6万辆汽车年排放量,DeepSeek R1单位能耗效率比Grok3低67%[10] 行业影响与市场反应 - 微软转向支持DeepSeek,meta成立"作战室"研究其算法,AI行业从堆算力转向精细化运营[10] - 能源供应商Constellation Energy股价下跌21%,Vistra下跌28%,反映市场对AI能源需求预期的改变[11] - 中国石化测试显示DeepSeek-R1推理计算效率提升近一倍,可应用于油藏开发优化等领域[12] ESG多维价值体现 - 环境(E):甲醇精馏装置通过模型优化实现蒸汽消耗降低15%,设备综合效率提升12%[11] - 社会(S):广西玉林市兴业县用DeepSeek进行防返贫监测,分析效率提升50%[15] - 公司治理(G):政务系统与科技巨头接入DeepSeek推动国产化算力需求增长[14]