VR200
搜索文档
英伟达不满足于只卖GPU,谋划颠覆
半导体行业观察· 2025-11-15 09:42
英伟达供应链策略转变 - 公司计划在2025年推出面向人工智能和高性能计算的Vera Rubin平台,并向合作伙伴交付预装所有计算硬件、散热系统和接口的L10级VR200计算托架 [2] - 新的L10级集成方案将包括加速器、CPU、内存、网卡、供电硬件、中板接口和液冷冷板在内的整个托架组件作为预装测试模块进行销售,集成度远高于此前GB200平台上的L7-L8级别 [2] - 此举将使英伟达的合作伙伴从系统设计者转型为系统集成商和安装商,合作伙伴仅负责机架级集成、外壳组装、电源集成、散热单元安装及最终测试等工作 [3][5] 对行业价值链的影响 - 新的供应模式可能占据服务器成本的90%,将显著简化原始设备制造商的设计或集成工作,但会压缩其利润空间,使英伟达获利 [2][3] - 合作伙伴的核心工作将转向企业级功能、服务合同、固件生态系统以及部署物流,而服务器的“计算引擎”核心部分将由英伟达标准化和生产 [5] - 通过与EMS厂商(如富士康、广达和纬创)直接签约进行规模化生产,有望降低生产成本并缩短VR200的上市周期 [3] 产品技术规格与驱动因素 - Rubin GPU的功耗从Blackwell Ultra的1.4 kW增加到R200的1.8 kW,部分未发布的SKU功耗甚至达到2.3 kW,散热需求的增加是促使公司改为提供整机托架的原因之一 [4] - 黄仁勋展示的Vera Rubin Superchip电路板采用了复杂的设计、厚PCB板且全部使用固态元件,由英伟达直接生产更为经济高效 [3] - 公司未来可能进一步扩大在供应链中的份额,例如进军机架级集成领域,与支持兆瓦级功率机架的800V数据中心架构同步发展 [5]
TrendForce集邦咨询:预计2026年CSP合计资本支出增至6000亿美元以上
智通财经网· 2025-11-06 14:49
全球主要云端服务提供商资本支出预测 - TrendForce集邦咨询将2025年全球八大主要CSPs资本支出总额年增率预测从61%上修至65% [1] - 预期2026年CSPs合计资本支出将进一步推升至6,000亿美元以上,年增长率达40% [1] 主要CSPs具体资本支出计划 - Google上调2025年资本支出至910-930亿美元,以应对AI数据中心与云端运算需求激增 [3] - Meta上修2025年资本支出至700-720亿美元,并指出2026年还将显著成长 [3] - Amazon调升2025年资本支出预估至1,250亿美元 [3] - Microsoft预期2026财年资本支出将高于2025年 [3] - Meta计划2026年资本支出大幅增加65%,达到1,180亿美元 [5] AI基础设施投资对硬件生态链的影响 - 资本支出成长将激励AI服务器需求全面升温 [3] - 带动GPU/ASIC、存储器、封装材料等上游供应链同步扩张 [3] - 带动液冷散热模块、电源供应及ODM组装等下游系统同步扩张 [3] - 驱动AI硬件生态链迈入新一轮结构性成长周期 [3] 整柜式AI解决方案的市场展望 - CSPs提高资本支出将为NVIDIA整柜式方案助力更强成长动能 [4] - 2026年NVIDIA GB300和VR200的合计出货量有望优于先前预期,以北美五大CSPs为主要客户 [4] - Oracle将受惠于北美政府项目、云端AI数据库租赁服务等需求,成长力道最大 [4] - 2026年市场将更积极导入整柜式AI方案,除NVIDIA规划新一代VR200 Rack外,AMD也将推动Helios整柜式方案 [4] - Meta和Oracle将成为首批导入AMD Helios方案的业者 [4][5] - Meta同时将布局NVIDIA GB/VR Rack及自研ASIC方案 [5]
研报 | 预计2026年CSP合计资本支出增至6,000亿美元以上,AI硬件生态链迎新成长周期
TrendForce集邦· 2025-11-06 14:36
全球主要云端服务提供商资本支出预测 - TrendForce集邦咨询将2025年全球八大主要CSPs资本支出总额年增率从61%上修至65% [2] - 预期2026年CSPs合计资本支出将推升至6000亿美元以上,年增率达40% [2] - 八大CSPs包含美系的Google、AWS、Meta、Microsoft、Oracle以及中系的Tencent、Alibaba、Baidu [4] 主要CSPs资本支出调整详情 - Google上调2025年资本支出至910-930亿美元,以应对AI数据中心与云端运算需求激增 [4] - Meta上修2025年资本支出至700-720亿美元,并指出2026年还将显著成长 [4] - Amazon调升2025年资本支出预估至1250亿美元 [5] - Microsoft预期2026财年资本支出将高于2025年 [5] - Meta计划2026年资本支出大幅增加65%,达到1180亿美元 [6] 资本支出增长对AI硬件生态链的影响 - 资本支出成长将激励AI Server需求全面升温,并带动GPU/ASIC、存储器、封装材料等上游供应链扩张 [5] - 液冷散热模块、电源供应及ODM组装等下游系统也将同步扩张 [5] - 驱动AI硬件生态链迈入新一轮结构性成长周期 [5] 整柜式AI方案的市场展望 - 2026年市场将更积极导入整柜式AI方案,NVIDIA的GB300和VR200合计出货量有望优于先前预期 [5] - Oracle将受惠于北美政府项目、云端AI数据库租赁服务等需求,成长力道最大 [5] - AMD也将推动Helios整柜式方案,包含Venice CPU和MI400 GPU,Meta、Oracle将成为首批导入业者 [6] - Meta同时将布局NVIDIA GB/VR Rack及自研ASIC方案 [6]
NVIDIA GB300, Vera Rubin – 未来印刷电路板 - 覆铜板(PCB_CCL)及电源设计变革
2025-08-25 11:24
涉及的行业或公司 * 行业涉及人工智能计算、数据中心、半导体制造、PCB(印刷电路板)和CCL(铜箔基板)材料、电源管理[1][3][7][9][18][35] * 公司包括NVIDIA(NVDA US)及其供应链伙伴 如PCB供应商Unimicron(欣兴电子)、Victory Giant Technology(沪电股份)、WUS(沪士电子)、TTM CCL供应商Doosan(斗山)、Elite Material(台耀科技) 电源管理芯片供应商AOSL(Alpha & Omega Semiconductor)、MPS(Monolithic Power Systems)、Inneon(英飞凌)、Vishay、Renesas、TI、Innoscience(英诺赛科) 散热供应商AVC(奇鋐) PSU供应商Delta Electronics(台达电子)、Lite-On(光宝科技) PDU供应商Eaton(伊顿)、APC PTFE CCL供应商Rogers(罗杰斯)、AGC、Panasonic(松下)、Doosan、Elite Material、Shengyi Technology(生益科技)、Zhongying Technology(中英科技)[2][6][7][11][12][14][18][22][27][35] 核心观点和论据:GB300设计变更 * GB300计算托盘采用UBB+OAM设计替代GB200的双Bianca板设计 UBB为18层PTH板(14层M8材料+4层M4材料) ASP约$750–$800 主要由WUS和TTM供应 OAM有两种版本 高端版(2 CPU + 4 GPU)为20层PTH板(16层M8+4层M4) 低端版(1 CPU + 4 GPU)为16层HDI板(12层M8+4层M4) ASP约$100 分别由WUS/TTM和Unimicron/Victory Giant供应[3][6] * 设计变更旨在规避美国政府垄断指控并提高下游ODM厂商生产良率 OAM通过插座连接GPU 可在组装出问题时单独拆卸以节省成本[3][4] * GB300计算托盘CCL由Doosan独家供应 NVSwitch托盘PCB/CCL设计与GB200相同 为22层M8U PTH板 PCB由WUS和TTM供应 CCL由Elite Material独家供应[7] 核心观点和论据:电源设计变更(VRM) * GB300为降低成本选用60A SPS产品替代GB200的90A产品 假设平均负载为~12A(90A产品为~18A)[9][10] * 单个GB300芯片功耗3100W(Grace CPU 300W + 2×B300 GPU 1400W) 在1V下需258个SPS单元 一个计算托盘(2芯片)需516个SPS单元 远超GB200的300个[9][10] * 成本仍下降因60A SPS单价仅~$0.3(AOSL供应) 远低于90A SPS的~$0.8(Inneon供应) 总成本516×$0.3 < 300×$0.8[11] * GB300 VRM模块有三家验证供应商 AOSL和MPS已通过验证 Inneon仍在验证中 AOSL预计成为主要供应商占60–70%份额 MPS占20–30%份额且利润率可能下降[12] * SPS数量大增导致散热问题 NVIDIA考虑增加4个散热片 若采用对AVC等散热供应商为利好[13][14] * NVIDIA暂无计划采用垂直VRM设计(背板供电) 因成本是传统方案3-4倍且良率低 目前仅AMD MI300和AWS Tranium 2使用该技术[15] 核心观点和论据:电源设计变更(PDB)与未来技术 * 下一代PDB模块考虑采用GaN MOSFET以缩小尺寸 正在评估TI、Inneon和Innoscience 要求提供5x5封装样品 首轮测试在2025年2月 最终验证预计2025年底[18] * GaN PDB模块无法赶及3Q25的GB300发布 可能用于1H26的第二批GB300或2H26的Vera Rubin系统 Innoscience胜算最高因其报价远低于欧美厂商(近乎硅基MOSFET两倍)且凭借政府补贴报价仅略高于原Renesas硅基设计[18] 核心观点和论据:Vera Rubin(VR200)架构升级 * VR200系统仍为NVL72系统 计划2026年推出 备受讨论的NVL288系统仍在开发中 初期不属于Vera Rubin系列[19] * Rubin GPU采用4个计算晶粒和8个HBM晶粒 使用CoWoS-L封装 中介层约5倍光罩大小 因每个GPU计算晶粒数翻倍 整机柜功耗翻倍至~260kW[21] * 计划将PSU从每单元5.5kW升级至12kW 使每个电源 shelf 提供12×6=72kW功率 每机柜6–8个电源 shelf Delta Electronics和Lite-On已送样12kW PSU 最终验证预计2025年底或2026年初[21][22] * 开发中的288 GPU密集机柜功耗预计达1MW 初始解决方案拟在旁边放置独立电源机柜 内含PDU、BBU、PSU(电源 shelf)和超级电容(削峰 shelf)[24][26] * 要求PSU厂商开发输出400V的30kW PSU产品 通过提升功率和电压保持电流不变 使PSU尺寸几乎不变 400V HVDC通过电源总线传输至NVL288机柜 再由两级PDB模块降压:第一级400V DC降至54V DC 第二级54V DC降至12V DC后进入计算托盘[26] * PDU由Eaton和APC供应 用于双电源系统间的分相切换以保障数据中心可靠性[27] 核心观点和论据:NVL288机柜设计与材料升级 * NVL288机柜含4个罐体 每个罐体含36个卡匣 每个卡匣为垂直放置的PCB(1 CPU + 2 GPU) 每个罐体含36 CPU和72 GPU 通过正交背板连接9个水平放置的NVSwitch托盘 整个机柜含144 CPU、288 GPU和36 NVSwitch托盘[30] * 机柜结构无overpasses因内部空间已最大化 信号传输完全依赖PCB连接[31] * 为应对下一代224Gbps传输速率(56GHz频率) 开始测试PTFE树脂材料替代传统PPO树脂 因PTFE具有更低介电常数(Dk)和耗散因子(Df) 更适合高频信号传输[32][33][34] * PTFE材料缺点包括加工流动性差(钻孔易留残渣需额外清洁)和材质软(薄板易变形) 目前主要用于5G基站通信的30-40层厚PCB[35] * 全球PTFE CCL生产商包括Rogers、AGC、Panasonic、Doosan、Elite Material、Shengyi Technology、Zhongying Technology[35] * Rogers(样品RO1200)和Shengyi Technology(样品SG9300H)已送样PTFE产品至NVIDIA验证 最终结果预计2H25 RO1200的Dk为3.05 Df为0.0017 SG9300H的Dk为2.96 Df为0.0005[35][36][37][39] 其他重要内容 * GB200计算托盘采用48V DC输入 经PDB模块转换为12V DC 再经VRM模块转换为1V/0.8V DC为芯片供电[9] * 垂直供电技术将MOSFET、电感等集成单一封装 节省空间并将VRM模块直接安装在GPGPU/ASIC芯片背面 缩短供电距离提高效率[15]