Workflow
NVSwitch芯片
icon
搜索文档
共封装光学CPONVIDIA 的下一个大事2 --- 1 Co-Packaged Optics CPO The Next Big Thing for NVIDIA 2
2026-02-04 10:27
涉及的行业与公司 * **行业**:人工智能(AI)硬件、数据中心、光通信(共封装光学/CPO)、半导体制造与测试[1][4][5] * **核心公司**:英伟达(NVIDIA)[1][4][5] * **供应链/受益公司**:LOTES(3533 TT)、泰瑞达(Teradyne, TER US)、FiconTEC、Mipox(5381 JP)、精工技研(Seikoh Giken, 6834 JP)[26][36][55] 核心观点与论据 * **英伟达的CPO技术路线图**:公司的终极愿景是构建全光互连(OIO)的AI服务器机架,但采取渐进式路径[7][9] * 第一步:去年已为Scale-Out网络推出CPO交换机[9] * 第二步:在Scale-Up网络的NVSwitch托盘中采用CPO交换机(即本文重点)[9] * 第三步:在GPGPU芯片上采用CPO封装,最终实现OIO机架[9] * **Rubin Ultra机架的CPO设计方案**:采用NVL72 × 2配置,两个相邻机柜的NVSwitch托盘通过CPO和光纤互连,形成包含144块GPGPU卡(576个GPU die)的机架[13][14] * 每张Rubin Ultra GPU卡带宽为28.8 Tb/s(单向),整机架总带宽为4147.2 Tb/s[17] * CPO NVSwitch芯片是Quantum X800的修改版,每颗芯片与4.5个3.2T光引擎共封装,单芯片交换能力为14.4T[15][16] * NVSwitch托盘间通信采用2:1汇聚比,整个Rubin Ultra机架需要144颗CPO NVSwitch芯片、24个NVSwitch托盘和648个光引擎(仅Scale-Up部分)[17] * 后端Scale-Out网络也将采用CPO,每个计算托盘中的CX10网卡与一个3.2T光引擎共封装,整机架有144个此类CPO CX10 NIC[18][19] * CPO版Rubin Ultra机架中,光引擎与GPGPU的比率为5.5:1(648 + 144)/144[19][20] * **CPO方案的可选性与挑战**:正交背板方案和CPO方案均为2027年Rubin Ultra机架的可选方案,最终选择取决于供应链就绪度和生产良率[21][22] * 正交背板方案存在制造良率低、装配难度高的问题[21] * CPO方案装配难度较低,但存在生产良率低的挑战[21] * **CPO的可维护性创新**:为应对CPO光引擎故障需更换整个交换机芯片的挑战,英伟达在Quantum X800及未来的CPO NVSwitch芯片中采用了可拆卸的Chiplet设计[27][29][34] * 每个交换机芯片由6个可拆卸的Bantha小芯片组成,每个Bantha连接3个Sagitta光引擎[29][30] * 每个光引擎下方安装插座,故障时可快速更换,该插座由LOTES独家供应[34] 关键供应链受益方与市场影响 * **LOTES(插座供应商)**: * 独家供应CPO NVSwitch芯片中光引擎的可拆卸插座[34] * 假设插座ASP为5-10美元,Rubin Ultra在2027/2028年产量分别为200万/600万台,光引擎与GPU比例为5.5:1,则估算可带来: * 2027年额外营收8250万美元(占去年总营收8%)[35] * 2028年额外营收2.475亿美元(占去年总营收25%)[35] * **泰瑞达与FiconTEC(测试设备供应商)**: * 泰瑞达的Ultra FLEX Plus测试仪与FiconTEC的探针台组合是唯一通过英伟达CPO测试平台认证的解决方案[37][38] * FiconTEC提供目前市场唯一的双面晶圆测试解决方案,能同时对垂直堆叠的EIC和PIC进行电学和光学测试,并具备高精度对准(5纳米步进)、高重复性、PWB技术、激光微调与在线清洁等核心技术优势[42][44][45][46][47][48][49][50] * 台积电并未因FiconTEC被中资收购而将其剔除供应商名单,通过将关键测试算法交由泰瑞达设备执行来规避风险[40][41] * 组合系统ASP约500万美元(测试仪与探针台各占一半),单台年测试约5万个光引擎[51] * 基于同样假设,估算CPO Rubin Ultra机架可为泰瑞达带来: * 2027年额外营收11亿美元(占去年总营收35%)[51][52] * 2028年额外营收18亿美元(假设ASP降至400万美元,占去年总营收57%)[51][52] * 泰瑞达也是特斯拉AI5和AI6芯片的独家测试设备供应商,该业务可能成为其2027-2028年的另一增长引擎[53][54] * **Mipox与精工技研(光纤抛光材料与设备供应商)**: * CPO版Rubin Ultra在Scale-Up网络采用光纤连接,将创造高速光纤套管(MT Ferrule)及相关设备/材料的新增量市场[70][71] * **Mipox**:全球最大高速光纤套管抛光膜制造商,约占60%全球市场份额,其光纤产品收入过去三年保持稳定上升趋势[61][65] * **精工技研**:全球最大光纤套管抛光机及抛光后端面检测机制造商,两类设备各占约60%全球市场份额,其新订单金额过去三年保持快速上升趋势[61][63] * 光纤套管数量约为光模块数量的3倍[63] * Mipox其他业务(涂覆与分切服务)业绩已触底,预计未来不再对整体财务产生额外负面影响[67]
互联技术扛起大旗,国产化闭环近了?
半导体行业观察· 2025-09-26 09:11
文章核心观点 - 国产AI算力产业链正通过技术创新和生态合作实现闭环 重点突破互联技术瓶颈 推动算力自主化进程 [1][6][18] 行业政策与战略方向 - 国务院印发《关于深入实施"人工智能+"行动的意见》 明确要求强化8项基础支撑能力 包括提升模型基础能力 加强数据供给创新 强化智能算力统筹等 [6] - 工信部联合多部门发文 强调以新一代通信技术驱动 构建覆盖感知 传输 存储与计算的基础设施体系 并合理布局区域枢纽节点 逐步提高智能算力占比 [6] - 上海智能算力产业已形成基础夯实 创新活跃 场景丰富的良好态势 需强化技术创新协同 完善算力调度体系 深化场景融合应用 [3] 互联技术价值与突破 - 互联技术成为AI基础设施关键环节 高带宽低时延互联能力是提升模型性能 降低成本 实现普惠AI的重要路径 [6] - 英伟达NVLink 5.0为每个Blackwell GPU提供1.8TB/s双向带宽 NVSwitch芯片在GB200 NVL72系统中构建总带宽130TB/s的72 GPU NVLink域 [7] - 奇异摩尔提供覆盖Scale-out网间互联 Scale-up超节点GPU片间互联 Scale-inside芯片内互联的全栈互联解决方案 [8] - 奇异摩尔Kiwi G2G IO Die超节点互联芯粒支持TB级带宽 Kiwi SNIC AI原生超级网卡支持800Gbps传输带宽 μs级延时 [10] - 奇异摩尔片内互联方案基于UCIe的D2D IP及Central IO Die系列 可提升AI网络单卡算力 [12] 生态合作与标准建设 - 中国移动联合产业链企业启动智算开放互联OISA生态共建 发布OISA 2.0协议 支持1024张AI芯片 TB/s级带宽 数百纳秒时延 [14] - OISA协议打破Scale-up协议带宽与延迟瓶颈 明确OISA IP OISA IO芯粒等互联承载物设计方向 [15] - 沐曦形成完整产品线 涵盖芯片 板卡 服务器及多形态超节点 创新推出光互连超节点 耀龙3D Mesh超节点等 [17] - 新华三H3C UniPoD系列超节点支持以太网和PCIe双协议 实现单机柜最高64卡GPU高速互联 [17] 产业链协同与发展趋势 - AI算力需求从单体智能向群体智能发展 互联技术成为延续摩尔定律 提升算力密度的核心路径 [18] - 国内先进工艺受限背景下 互联技术可通过规模和成本换性能 实现算力自立 [18] - 产业链需上下游协同突破超节点互联协议性能瓶颈 打造媲美国际先进水平的产品 [17]