液冷行业专家电话会-Rubin平台冷却系统更新
英伟达英伟达(US:NVDA)2026-01-08 10:07

行业与公司 * 涉及的行业为数据中心液冷散热行业,核心讨论对象是英伟达及其即将推出的Rubin平台[1] * 纪要也提及了AMD、谷歌、寒武纪、华为等竞争对手,以及维谛、英维克等散热解决方案合作伙伴[1][9][18] 核心观点与论据:Rubin平台冷却系统更新 * 设计整合与材料突破:Rubin平台将GB300的三块小板合并为一块大板,这种反常操作可能表明在隔热或界面材料方面取得突破[1][2] * 高温水冷技术:采用一次侧进水温度45度的高温水冷技术,有望取代传统液液交换,无需冷水机,是重要的散热创新[1][2] * 技术路径与当前选择:英伟达散热方案发展路径为风冷 -> 风冷+单向冷板 -> 风冷+双向门板 -> 全液冷[1][6] * 此次Rubin发布未采用预期的双向门板和先进微通道技术,主要因为研发进度问题,例如微通道加工精度要求50微米,目前只能做到80微米[5] * 选择当前成熟方案是为了确保产品如期发布,满足市场对主要性能提升的需求,散热问题可在后续优化[5] * 量产时间表:尽管在CES上宣称提前量产,但大规模量产预计在2026年11月,目前仅能小批量生产,未来9个月内将持续调整优化[1][4] * 性能指标:新产品训练算力为35,推理算力为50,与AMD I455相似,但英伟达整体性能仍具优势,得益于生态系统支持[1][9] * 应对不成熟散热系统的策略:采用无风扇、无电缆设计;使用M9树脂、HVLP铜箔、含银/镓金属界面材料等组合降低热阻;为后续优化留有余地[1][10] * 配置妥协:未采用真正的144卡槽配置,而是通过文字游戏实现“伪144”配置,主要因为功率翻倍会导致过热,技术尚未完全成熟[9][16] 核心观点与论据:高温水冷技术的影响 * 降低能耗:高温水冷技术可使整个数据中心能耗下降6%[3][11] * 冲击传统制冷行业:该技术使得传统冷水机不再必要,给全球制冷剂及相关设备企业带来利空,其股价普遍下跌约20%[3][11] * 技术可行性:芯片工作温度在80至100度之间,45度进水与传统的15-25度进水相比,散热能力差异不显著,因为水的比热容大[14] * 简化系统:采用45度温水后,液冷系统更为简化,无需冷水机,只需优化冷却塔,降低了系统复杂性和维护成本[15] 核心观点与论据:液冷系统未来发展方向 * 全冷板式液冷系统:随功率增大愈发重要,可保持系统整洁,提高容错能力,减少干扰[3][24] * 微通道技术:是未来重要发展方向,可进一步优化性能,实现更高效散热[3][12][24] * 微通道中可能需要使用孵化液加乙二醇等非水基冷媒,以保证流动性和防止微生物滋生[3][25] * 在微通道时代,提高一次侧水温可以降低对氟化物和体外循环系统的压力[26] * 静默式液冷:被认为是最终解决方案,效果最好且上限最高,但由于实施复杂、业主抵制以及早期存在介质腐蚀等问题,目前未被广泛采用[17][21] * 英伟达及其合作伙伴仍在探索静默式液冷,例如维谛曾开发局部静默解决方案,但尚未大规模应用[18][19] * 如果未来费曼架构功率达到2,200W或2,400W时现有方案无法解决,静默式将成为必然选择[21] 其他重要内容:成本与用量分析 * 冷媒用量提升:Rubin平台采用全龙版设计,将GB300未覆盖的20%部分纳入,整体覆盖率达到100%[27] * 如果未来采用微通道设计,回路变细、管路变长,预计整体冷媒用量提升约25-30%[27] * 系统成本变化:200系列冷板系统成本约为4.8万美元,300系列时为5.8万美元,Rubin版本约为6万多美元[29] * 考虑到取消冷水机、减少快速接头等因素,以及可能采用成本是水10倍左右的氟化液,每个节点成本增加约500美元,总共18个节点,总额增加约3,600美元[29] * 降低运营支出:新版本取消冷水机,继续使用廉价的水和乙二醇,模块化设计减少了维护复杂性,有助于降低运营成本[28] 其他重要内容:行业挑战与竞争格局 * 散热问题的复杂性:散热涉及复杂的系统工程,芯片厂商(如英伟达)通常需要依赖第三方解决方案,常遇到算力提升与散热方案跟不上的协同问题[8] * 散热技术涉及物理过程,与快速迭代的芯片电气部分(如HBM、光模块)属于不同领域,导致沟通成本高、进展慢[20] * 竞争压力:面对AMD、谷歌、寒武纪和华为等公司的竞争,英伟达不得不保持快速发布节奏,即便某些技术细节尚未完全成熟[1][9] * 微通道技术竞争:该赛道竞争激烈,各家厂商展示了蚀刻、3D打印等不同工艺以实现50微米级别精度,需持续关注技术进展[30]