华为Cloud Matrix 384中需要多少光模块?
傅里叶的猫·2025-08-21 23:06
半导体行业研究 核心观点 - 文章基于华为Cloud Matrix 384论文和申万宏源分析内容,重点探讨了半导体行业中光模块与NPU的用量比例关系 [3][5] Cloud Matrix 384架构 - UB平面:作为超节点内部核心扩展网络,采用非阻塞全对全拓扑连接NPU和CPU,每个昇腾910C提供392GB/s单向带宽,用于TP/EP和大规模分布式内存池访问 [7] - RDMA平面:用于超节点间横向扩展通信,采用RoCE协议连接NPU,支持KV Cache传输和分布式训练 [7] - VPC平面:通过华为擎天DPU接入数据中心网络,处理管理、存储和外部服务通信 [7] 光互联与电互联 - CM384的Level 1和Level 2 UB Switch之间采用光互联,但节点内部仍使用电互联,因短距离光互联成本及功耗过高 [9] 光模块用量计算 - Scale Up场景: - 每台服务器中每个UB Switch芯片对应8个400G光模块,整台服务器需56个400G或28个800G双通道光模块 [12] - 两层UB Switch系统下,每台服务器8个NPU对应112个400G或56个800G光模块,NPU与400G/800G光模块比例分别为1:14和1:7 [12] - Scale Out场景: - 采用胖树架构扩容时,光模块需求比例约为1:4(NPU与400G光模块) [13][14] 其他信息 - 英伟达B200/B300系列已成为主力产品 [15] - 知识星球提供行业信息、外资投行数据及分析报告更新 [17]