Workflow
NVIDIA GB300, Vera Rubin – 未来印刷电路板 - 覆铜板(PCB_CCL)及电源设计变革
英伟达英伟达(US:NVDA)2025-08-25 11:24

涉及的行业或公司 * 行业涉及人工智能计算、数据中心、半导体制造、PCB(印刷电路板)和CCL(铜箔基板)材料、电源管理[1][3][7][9][18][35] * 公司包括NVIDIA(NVDA US)及其供应链伙伴 如PCB供应商Unimicron(欣兴电子)、Victory Giant Technology(沪电股份)、WUS(沪士电子)、TTM CCL供应商Doosan(斗山)、Elite Material(台耀科技) 电源管理芯片供应商AOSL(Alpha & Omega Semiconductor)、MPS(Monolithic Power Systems)、Inneon(英飞凌)、Vishay、Renesas、TI、Innoscience(英诺赛科) 散热供应商AVC(奇鋐) PSU供应商Delta Electronics(台达电子)、Lite-On(光宝科技) PDU供应商Eaton(伊顿)、APC PTFE CCL供应商Rogers(罗杰斯)、AGC、Panasonic(松下)、Doosan、Elite Material、Shengyi Technology(生益科技)、Zhongying Technology(中英科技)[2][6][7][11][12][14][18][22][27][35] 核心观点和论据:GB300设计变更 * GB300计算托盘采用UBB+OAM设计替代GB200的双Bianca板设计 UBB为18层PTH板(14层M8材料+4层M4材料) ASP约750750–800 主要由WUS和TTM供应 OAM有两种版本 高端版(2 CPU + 4 GPU)为20层PTH板(16层M8+4层M4) 低端版(1 CPU + 4 GPU)为16层HDI板(12层M8+4层M4) ASP约$100 分别由WUS/TTM和Unimicron/Victory Giant供应[3][6] * 设计变更旨在规避美国政府垄断指控并提高下游ODM厂商生产良率 OAM通过插座连接GPU 可在组装出问题时单独拆卸以节省成本[3][4] * GB300计算托盘CCL由Doosan独家供应 NVSwitch托盘PCB/CCL设计与GB200相同 为22层M8U PTH板 PCB由WUS和TTM供应 CCL由Elite Material独家供应[7] 核心观点和论据:电源设计变更(VRM) * GB300为降低成本选用60A SPS产品替代GB200的90A产品 假设平均负载为12A(90A产品为18A)[9][10] * 单个GB300芯片功耗3100W(Grace CPU 300W + 2×B300 GPU 1400W) 在1V下需258个SPS单元 一个计算托盘(2芯片)需516个SPS单元 远超GB200的300个[9][10] * 成本仍下降因60A SPS单价仅~$0.3(AOSL供应) 远低于90A SPS的~$0.8(Inneon供应) 总成本516×0.3<300×0.3 < 300×0.8[11] * GB300 VRM模块有三家验证供应商 AOSL和MPS已通过验证 Inneon仍在验证中 AOSL预计成为主要供应商占60–70%份额 MPS占20–30%份额且利润率可能下降[12] * SPS数量大增导致散热问题 NVIDIA考虑增加4个散热片 若采用对AVC等散热供应商为利好[13][14] * NVIDIA暂无计划采用垂直VRM设计(背板供电) 因成本是传统方案3-4倍且良率低 目前仅AMD MI300和AWS Tranium 2使用该技术[15] 核心观点和论据:电源设计变更(PDB)与未来技术 * 下一代PDB模块考虑采用GaN MOSFET以缩小尺寸 正在评估TI、Inneon和Innoscience 要求提供5x5封装样品 首轮测试在2025年2月 最终验证预计2025年底[18] * GaN PDB模块无法赶及3Q25的GB300发布 可能用于1H26的第二批GB300或2H26的Vera Rubin系统 Innoscience胜算最高因其报价远低于欧美厂商(近乎硅基MOSFET两倍)且凭借政府补贴报价仅略高于原Renesas硅基设计[18] 核心观点和论据:Vera Rubin(VR200)架构升级 * VR200系统仍为NVL72系统 计划2026年推出 备受讨论的NVL288系统仍在开发中 初期不属于Vera Rubin系列[19] * Rubin GPU采用4个计算晶粒和8个HBM晶粒 使用CoWoS-L封装 中介层约5倍光罩大小 因每个GPU计算晶粒数翻倍 整机柜功耗翻倍至~260kW[21] * 计划将PSU从每单元5.5kW升级至12kW 使每个电源 shelf 提供12×6=72kW功率 每机柜6–8个电源 shelf Delta Electronics和Lite-On已送样12kW PSU 最终验证预计2025年底或2026年初[21][22] * 开发中的288 GPU密集机柜功耗预计达1MW 初始解决方案拟在旁边放置独立电源机柜 内含PDU、BBU、PSU(电源 shelf)和超级电容(削峰 shelf)[24][26] * 要求PSU厂商开发输出400V的30kW PSU产品 通过提升功率和电压保持电流不变 使PSU尺寸几乎不变 400V HVDC通过电源总线传输至NVL288机柜 再由两级PDB模块降压:第一级400V DC降至54V DC 第二级54V DC降至12V DC后进入计算托盘[26] * PDU由Eaton和APC供应 用于双电源系统间的分相切换以保障数据中心可靠性[27] 核心观点和论据:NVL288机柜设计与材料升级 * NVL288机柜含4个罐体 每个罐体含36个卡匣 每个卡匣为垂直放置的PCB(1 CPU + 2 GPU) 每个罐体含36 CPU和72 GPU 通过正交背板连接9个水平放置的NVSwitch托盘 整个机柜含144 CPU、288 GPU和36 NVSwitch托盘[30] * 机柜结构无overpasses因内部空间已最大化 信号传输完全依赖PCB连接[31] * 为应对下一代224Gbps传输速率(56GHz频率) 开始测试PTFE树脂材料替代传统PPO树脂 因PTFE具有更低介电常数(Dk)和耗散因子(Df) 更适合高频信号传输[32][33][34] * PTFE材料缺点包括加工流动性差(钻孔易留残渣需额外清洁)和材质软(薄板易变形) 目前主要用于5G基站通信的30-40层厚PCB[35] * 全球PTFE CCL生产商包括Rogers、AGC、Panasonic、Doosan、Elite Material、Shengyi Technology、Zhongying Technology[35] * Rogers(样品RO1200)和Shengyi Technology(样品SG9300H)已送样PTFE产品至NVIDIA验证 最终结果预计2H25 RO1200的Dk为3.05 Df为0.0017 SG9300H的Dk为2.96 Df为0.0005[35][36][37][39] 其他重要内容 * GB200计算托盘采用48V DC输入 经PDB模块转换为12V DC 再经VRM模块转换为1V/0.8V DC为芯片供电[9] * 垂直供电技术将MOSFET、电感等集成单一封装 节省空间并将VRM模块直接安装在GPGPU/ASIC芯片背面 缩短供电距离提高效率[15]