芯片功耗增长趋势 - 英伟达B200芯片功耗达1200瓦,B300芯片提升至1400瓦,下一代Rubin芯片预计达1800瓦,2027年Rubin Ultra可能高达3600瓦,机柜总功率将是B300的14倍 [2] - AMD GPU功耗从MI300系列700-750瓦增至MI325系列1000瓦、MI355系列1400瓦,未来MI375系列预计达1600瓦 [2] - AMD和Intel的CPU功耗增长较温和,维持在400-600瓦之间 [3] 液冷系统核心部件升级 - GB200采用大冷板设计,含36个GPU冷板和9个CPU冷板共45块,单价600-700美元;GB300转向小冷板设计,总数增至117块(72个GPU冷板、36个CPU冷板、9个交换机冷板),单价降至200-300美元,总价值量提升 [4] - GB200使用OCP标准UQD04快接头,GB300升级为英伟达自研NVQD03,数量几乎翻倍且单价提高,总价值量约为GB200两倍 [4] - GB200管路使用PT/EPDM软管价值量1000-1500美元,GB300可能采用波纹管或不锈钢管价值量增至2000-3000美元 [4] - GB300液冷系统总价值量从GB200的78万美元增至90-100万美元,涨幅约20% [4] 冷却分配单元(CDU)市场差异 - 国内市场因电力成本低倾向高功耗CDU(1500-2000瓦),北美、欧洲和东南亚青睐分液器式CDU,主流规格70千瓦和150千瓦单台价值分别约3万美元和3.5-4万美元 [5] - 机柜式CDU最大容量达2000千瓦,可灵活适配高功耗机柜,如150千瓦CDU匹配120-130千瓦NBL72机柜 [5] - 国内GPU市场因单卡性能限制形成"密度堆量"策略,华为CloudMatrix384机柜功耗约为英伟达NVL72机柜4倍,推高液冷需求 [5] 华为与英伟达系统性能对比 - 华为Ascend 910C Cloud Matrix 384系统BF16密集计算性能300 PFLOPS,高于英伟达GB200 NVL72的180 PFLOPS,达1.7倍 [6] - 华为系统HBM容量49.2 TB,高于英伟达13.8 TB,达3.6倍;HBM带宽1229 TB/s,高于英伟达576 TB/s,达2.1倍 [6] - 华为系统总功耗559,378瓦,高于英伟达145,000瓦,达3.9倍;每TFLOPS功耗1.87瓦,高于英伟达0.81瓦,达2.3倍 [6] 国内液冷市场趋势 - 2024-2025年国内新建数据中心将大规模采用国产GPU卡,液冷系统几乎成为标配 [7] - 部分客户通过改造英伟达游戏卡堆叠算力构建高密度算力机群,进一步推高液冷需求 [7] - 冷板和快接头定制化需求突出,不同平台需不同设计;快接头标准受OCP UQD系列和英伟达NVQD标准影响,Intel正牵头兼容性测试推动行业标准化 [7] 台资与陆资厂商竞争格局 - 台资厂商(如酷冷大师、AVC、台达)凭先发优势在服务器和数据中心行业领先,液冷部件占机柜价值量20%-30%,客户因高风险维持高供应链粘性 [8] - 陆资厂商(如英维克)在成本和定制化具竞争力,CDU和柜内部件成本比台资低20%-30%,响应速度更快且愿接受高度定制化需求,核心设计能力不逊色 [8] 液冷技术挑战与创新 - 双向冷板处于试样阶段,存在压强增大、冷板变形和相变稳定性问题 [9] - 浸没式液冷氟化液成本高达其他冷却液3-4倍,年挥发量15%-20%,且存在环保和毒性问题,限制大规模应用 [9] - 市场正回归新型矿物油研究,通过优化配方提升流速和解热能力,平衡成本与性能 [9]
聊一聊液冷