聊一聊液冷 - Reportify

芯片功耗增长趋势 - 英伟达B200芯片功耗达1200瓦，B300芯片提升至1400瓦，下一代Rubin芯片预计达1800瓦，2027年Rubin Ultra可能高达3600瓦，机柜总功率将是B300的14倍 [2] - AMD GPU功耗从MI300系列700-750瓦增至MI325系列1000瓦、MI355系列1400瓦，未来MI375系列预计达1600瓦 [2] - AMD和Intel的CPU功耗增长较温和，维持在400-600瓦之间 [3] 液冷系统核心部件升级 - GB200采用大冷板设计，含36个GPU冷板和9个CPU冷板共45块，单价600-700美元；GB300转向小冷板设计，总数增至117块（72个GPU冷板、36个CPU冷板、9个交换机冷板），单价降至200-300美元，总价值量提升 [4] - GB200使用OCP标准UQD04快接头，GB300升级为英伟达自研NVQD03，数量几乎翻倍且单价提高，总价值量约为GB200两倍 [4] - GB200管路使用PT/EPDM软管价值量1000-1500美元，GB300可能采用波纹管或不锈钢管价值量增至2000-3000美元 [4] - GB300液冷系统总价值量从GB200的78万美元增至90-100万美元，涨幅约20% [4] 冷却分配单元（CDU）市场差异 - 国内市场因电力成本低倾向高功耗CDU（1500-2000瓦），北美、欧洲和东南亚青睐分液器式CDU，主流规格70千瓦和150千瓦单台价值分别约3万美元和3.5-4万美元 [5] - 机柜式CDU最大容量达2000千瓦，可灵活适配高功耗机柜，如150千瓦CDU匹配120-130千瓦NBL72机柜 [5] - 国内GPU市场因单卡性能限制形成"密度堆量"策略，华为CloudMatrix384机柜功耗约为英伟达NVL72机柜4倍，推高液冷需求 [5] 华为与英伟达系统性能对比 - 华为Ascend 910C Cloud Matrix 384系统BF16密集计算性能300 PFLOPS，高于英伟达GB200 NVL72的180 PFLOPS，达1.7倍 [6] - 华为系统HBM容量49.2 TB，高于英伟达13.8 TB，达3.6倍；HBM带宽1229 TB/s，高于英伟达576 TB/s，达2.1倍 [6] - 华为系统总功耗559,378瓦，高于英伟达145,000瓦，达3.9倍；每TFLOPS功耗1.87瓦，高于英伟达0.81瓦，达2.3倍 [6] 国内液冷市场趋势 - 2024-2025年国内新建数据中心将大规模采用国产GPU卡，液冷系统几乎成为标配 [7] - 部分客户通过改造英伟达游戏卡堆叠算力构建高密度算力机群，进一步推高液冷需求 [7] - 冷板和快接头定制化需求突出，不同平台需不同设计；快接头标准受OCP UQD系列和英伟达NVQD标准影响，Intel正牵头兼容性测试推动行业标准化 [7] 台资与陆资厂商竞争格局 - 台资厂商（如酷冷大师、AVC、台达）凭先发优势在服务器和数据中心行业领先，液冷部件占机柜价值量20%-30%，客户因高风险维持高供应链粘性 [8] - 陆资厂商（如英维克）在成本和定制化具竞争力，CDU和柜内部件成本比台资低20%-30%，响应速度更快且愿接受高度定制化需求，核心设计能力不逊色 [8] 液冷技术挑战与创新 - 双向冷板处于试样阶段，存在压强增大、冷板变形和相变稳定性问题 [9] - 浸没式液冷氟化液成本高达其他冷却液3-4倍，年挥发量15%-20%，且存在环保和毒性问题，限制大规模应用 [9] - 市场正回归新型矿物油研究，通过优化配方提升流速和解热能力，平衡成本与性能 [9]