Workflow
超节点
icon
搜索文档
周跟踪:英伟达computex强调边缘计算,超节点是国产算力重要元素
山西证券· 2025-05-30 11:19
报告行业投资评级 - 领先大市 - A(维持) [1] 报告的核心观点 - 英伟达在台北电脑展确认 Blackwell 系列量产顺利,推出 NVLINK Fusion,GB300 预计 2025 年 Q3 推出,推理性能和 HBM 容量达 GB200 的 1.5 倍,通信带宽翻倍,NVL72 超节点机柜高速线背板量产工艺成熟,对 2026 年光模块行业贝塔乐观,有望依托 NVLINK 开拓 ASIC 市场并提升超节点渗透率 [3][13] - 英伟达着重推介端侧产品,如 DGX Spark、RTX Pro 等即将量产,AI 基础设施增量需求从数据中心下沉到边缘计算,类似产品或有广阔市场需求 [4][14] - 昇腾开发者大会 2025 推出 384 超节点集群,海光“反向收购”曙光体现系统设计能力重要性,技术上可提升海光芯片竞争力,商业上可提升整体盈利能力,国内 2026 年有望多款超节点产品并驾齐驱 [5][15] 各目录总结 周观点和投资建议 周观点 - 英伟达在云端基础设施、端侧产品等方面有新进展,对光模块行业乐观,有望开拓 ASIC 市场和提升超节点渗透率,AI 基础设施需求下沉到边缘计算 [3][4][13] - 昇腾开发者大会推出超节点集群,海光“反向收购”曙光有技术和商业意义,国内超节点产品未来可期 [5][15] 建议关注 - 光通信板块关注中际旭创、新易盛等公司 [17] - 超节点板块关注盛科通信、沃尔核材等公司 [17] - AI 物联网板块关注广和通、移远通信等公司 [17] 行情回顾 市场整体行情 - 本周(2025.05.19 - 2025.05.23)市场整体下跌,沪深 300 -0.18%,深圳成指 -0.46%,上证综指 -0.57%,创业板指数 -0.88%,科创板指数 -1.47%,申万通信指数 -2.31%,细分板块中工业互联网(+9.7%)、运营商(+0.3%)、无线射频(-1.2%)排名前三 [7][17] 细分板块行情 - 涨跌幅方面,工业互联网、运营商、无线射频周表现领先,控制器、光模块、工业互联网月表现领先,工业互联网、无线射频、控制器年初至今表现领先 [20][24][27] - 估值方面,展示了各板块当前 P/E 与 P/B 与历史平均水平对比 [30] 个股公司行情 - 东土科技、海格通信等涨幅领先,剑桥科技、奥飞数据等跌幅居前 [7][32] 海外动向 - 英伟达将针对中国市场推出新 AI 芯片,成立供应商联盟,英特尔考虑出售业务部门,高通进军数据中心市场 [37] 新闻公告 重大事项 - 瑞芯微、新雷能等公司有拟增持、减持、回购、并购、定增等事项 [38] 行业新闻 - 英伟达 CEO 称美国出口管制失败,计划在中国台北建立新据点,Grace Blackwell 系统全面投入生产等 [40][41]
GPU集群怎么连?谈谈热门的超节点
半导体行业观察· 2025-05-19 09:27
超节点服务器概念与背景 - 超节点服务器是应对AI算力需求爆炸式增长的最优解,通过高效整合海量计算单元(CPU/GPU/TPU)实现前所未有的计算密度和效率[4][6] - AI模型参数从亿级跃升至万亿级,传统服务器显存和算力无法满足需求,模型并行成为必然选择但受限于服务器间网络带宽瓶颈[9] - 超节点三大核心特征:极致计算密度(单空间最大化算力)、强大内部互联(NVLink等技术)、AI负载深度优化(软硬件协同设计)[10] 技术演进历程 - 早期追求服务器密度的尝试(如1999年谷歌"软木板服务器")与超节点有本质区别,前者侧重资源池化而非算力整合[12] - GPU并行计算能力崛起成为关键转折点,Transformer等大模型推动NVLink等高速互联技术发展[13] - 英伟达DGX/HGX系列将8GPU+NVSwitch高度集成,形成典型超节点单元[14] 行业需求驱动因素 - AI大模型遵循规模定律(Scaling Law),模型规模与训练数据量增长直接带来算力需求指数级上升[16] - 长序列处理需求提升模型性能但显存需求急剧增加,2025年斯坦福报告显示训练算力年增长率达10倍[18][20] - 传统扩展方式面临三大瓶颈:内存墙(数据供给不足)、规模墙(集群扩展收益递减)、通信墙(并行计算通信开销)[21] 技术优势与解决方案 - 构建超大带宽域(HBD)实现纵向扩展(Scale-Up),8GPU服务器内通信带宽达130TB/s[22][37] - 集中式供电方案提升效率,液冷技术使PUE优于传统风冷,长期运营成本降低[24][26] - 模块化设计优化运维,大型风扇墙和集成电源组件比传统方案节能30%以上[26][29] 关键技术挑战 - 供电系统需应对100kW+机柜功耗,电压从48V向400/800V演进以减少线路损耗[31] - 冷却系统采用冷板式/浸没式液冷应对单芯片1000W+ TDP,散热效率提升5-10倍[32] - 网络系统需平衡铜缆/光缆成本与性能,InfiniBand和RoCE成为主流互联方案[32][37] 行业技术现状 - 英伟达GB200 NVL72集成72个Blackwell GPU,采用NVLink实现36CPU+72GPU逻辑统一,定义行业标准[35][37] - 华为CloudMatrix 384通过384颗昇腾芯片全光互联实现自主可控,但功耗较高[38][41] - 供电技术向48V直流母线槽演进,液冷采用直触式冷板技术,网络倾向RoCE以太网[33][34][37] 未来技术方向 - 数据中心供电向400V/800V高压直流(HVDC)转型,减少AC-DC转换损耗[40][43] - 下一代液冷技术包括微流控冷却(芯片表面蚀刻微通道)和相变液冷(利用潜热)[45] - 共封装光学(CPO)技术将光模块集成至芯片封装,提升I/O带宽密度并降低功耗[49] 行业影响与展望 - 超节点是AI算力基础设施的集大成者,融合芯片/互联/制冷/供电等尖端技术[46] - 技术演进将催生全新系统架构,如计算/内存/存储资源池化通过光路互联[49] - 行业正从单机柜级向跨机柜级超节点发展,推动AI集群算力规模突破现有上限[22][41]
910C的下一代
信息平权· 2025-04-20 17:33
华为昇腾CloudMatrix与UB-Mesh技术分析 核心观点 - 华为发布的CloudMatrix 384超节点与UB-Mesh论文描述的架构存在显著差异 表明两者属于不同代际或应用场景的技术方案 [1][8] - CloudMatrix已实现384颗NPU光互联商用 而UB-Mesh论文提出8000颗NPU超节点构想 显示技术路线存在分级演进可能 [8][9] - 华为在超节点网络架构积累可能超越英伟达 尤其在分布式交换和拓扑优化方面展现独特优势 [10][11] 技术架构差异 - **硬件形态**:UB-Mesh采用1U机箱 每机柜64NPU 而CloudMatrix单机柜32NPU(384/12) 物理结构完全不同 [1] - **互联协议**:CloudMatrix采用光互联实现384NPU商用 UB-Mesh提出电互联(机柜内)+光互联(机柜间)混合方案 [5][9] - **NPU设计**:UB-Mesh描述的NPU集成分布式交换功能 可能对应昇腾910C下一代设计 当前910C尚未具备此能力 [10] 性能与成本争议 - **功耗对比**:CloudMatrix单机柜约50KW 支持风冷 而英伟达NVL72达145KW 但整体能效需结合电力基础设施评估 [2][5] - **光模块优势**:华为垂直整合光模块产业链 可能通过规模效应将400G模块成本降至竞争对手1/3以下 [3][6] - **传输速率**:华为自研光模块可实现8x64G=512Gbps单模速率 远超行业标准400G(8x50G)设计 [4] 行业竞争格局 - **技术路线**:英伟达转向全电互联(NVL72) 华为坚持光电混合方案 在超大规模集群(8000NPU)领域形成差异化 [8][9] - **生态构建**:中国AI基础设施可能形成独立生态 DeepSeek等应用需求正反向推动国产硬件创新 [11] - **工程能力**:中国企业在1-10阶段工程化优势显著 光模块等核心部件成本压缩速度超国际预期 [6][12] 技术演进方向 - **代际划分**:CloudMatrix 384代表UB1.0商用方案 UB-Mesh论文预示UB2.0将支持8000NPU级超节点 [11] - **拓扑优化**:分级拓扑成为趋势 机柜内电互联+机柜间光互联方案平衡性能与成本 [9][10] - **延迟控制**:分布式交换架构使Mesh拓扑实现all2all通信 逻辑延迟可能低于Clos架构 [10]