超节点

搜索文档
计算机行业周报:超节点:从单卡突破到集群重构-20250709
申万宏源证券· 2025-07-09 15:44
报告行业投资评级 - 看好 [3] 报告的核心观点 - 大模型参数爆炸式增长驱动下,算力需求从单点转向系统级整合,超节点在机柜级互联与跨机柜组网技术上取得突破,单柜高密度与多机柜互联双向扩展,背后是通信协议与工程成本的平衡 [4] - 国产超节点方案以华为 CloudMatrix 384 为代表,实现算力规模突破,打破单卡性能瓶颈,验证了国产方案在大规模组网中的工程能力 [4] - 超节点产业化将重塑算力产业链分工,催生服务器整合、光通信增量及液冷渗透提升等投资机会,芯片厂商纵向整合趋势明显 [4] - 市场当前对超节点的认知存在两大预期差,一是低估国产方案在推理场景的性价比优势,二是忽视算力网络架构变革对产业链的重构 [4] - 建议关注光通信、网络设备与芯片、数据中心产业链、铜连接、AI 芯片与服务器供应商等领域相关标的 [4] 根据相关目录分别进行总结 超节点:AI 算力网络新趋势 - Scale up 和 Scale out 是算力系统扩容的两个重要维度,分别追求硬件紧密耦合和弹性扩展,二者在协议栈、硬件、容错机制上存在本质差异,通信效率不同 [15] - 英伟达在 Hopper GPU 一代尝试突破服务器架构、在机柜层级拓展 Scale up 系统,2024 年推出的 GB200 NVL72 是较为成熟的超节点产品,通过单层 NVSwitch 实现全互联,应对通信峰值能力显著提升 [27][32] - AMD 的 IF128 方案尝试融合以太网技术,打破 Scale-up 与 Scale-out 边界,预计将在 26H2 推出搭载 128 个 MI450X 的超节点产品 [38][43] - 特斯拉 Dojo 专为视频等视觉训练数据打造,采用 2D Mesh 拓扑结构,但进展不及预期,其封闭生态和 2D Mesh 拓扑结构为重要掣肘 [50][67] 超节点掣肘?华为的解答 - 超节点设计需考虑模型需求、IDC 实践和成本等因素,在模型角度 72 卡规模以上的 Scale up 节点是较优选择,未来更大规模的超节点预计是必然选择;在 IDC 实践角度,模块化布局利于交付和运维;在成本角度,光通信等组网成本、系统复杂度和维护制约了超节点 Scale up 的规模设计 [72][77][79] - 华为 CloudMatrix 384 超节点通过两层 UB Switch 实现全互联,形成无带宽收敛的 Clos 网络拓扑,实测数据显示其对性能影响较小,该超节点算力为 NVL72 的 1.7 倍,内存为 3.6 倍,更适合未来 AI 工作负载 [82][92][95] - 华为 CM384 机柜为推理而生,针对 Prefill 和 Decode 两大阶段进行了针对性优化;深度适配 DeepSeek,机柜内资源调度灵活性强,但多机柜灵活性差;在国产 AI 芯片方案中已经具备一定性价比,体现在单算力的吞吐 [100][107][119] 产业链影响:分工细化,各环节均有增量 - 服务器产业链分工细化,AI 芯片厂商纵向整合,提升自身通信、存储、软件等能力是确定趋势,代工产业链分工可能进一步分化为板卡设计代工供应商、以及机柜代工供应商,相关标的包括海光信息、中科曙光等 [123][128] - 光通信方面,国产超节点方案带来光模块增量,预计增加 400G 或 LPO 等成本优化方案的采购,同时加速向 800G 演进,整体光模块的需求比最高可达 1:18,相关标的包括华工科技、光迅科技等 [129][139] - 铜连接方面,华为 UB-Mesh 网络架构具备降低成本、增强可靠性等特性,更长时间维度看,光通信是 Scale up 网络需求的演进方向,光电混合是当前重要架构,相关标的包括意华股份、瑞可达等 [140][144] - IDC 产业链方面,以 Cloud Matrix 为代表的超节点方案预计将增加 AIDC 需求,液冷是必要选项,相关标的包括润泽科技、奥飞数据等 [149][151] 重要公司估值 - 报告给出了海光信息、中科曙光、浪潮信息等多家公司 2024A-2027E 的归母净利润及 PE 等估值数据 [153]
计算机行业周报:从CloudMatrix看超节点趋势!3D打印产业强趋势-20250621
申万宏源证券· 2025-06-21 22:26
报告行业投资评级 看好 —— 计算机行业 [2] 报告的核心观点 本周计算机行业呈现超节点趋势和3D打印消费级需求释放两大趋势,同时新国都、海光信息、北森控股等重点公司有重要进展,投资者可关注数字经济领军、AIGC应用等多领域标的 [2][3] 根据相关目录分别进行总结 从华为CloudMatrix384看AI服务器未来趋势 - GPU互联规模和效率决定AI服务器集群性能,其扩大有Scale - up和Scale - out两个方向,二者在协议栈、硬件拓扑、容错机制和通信效率上存在本质差异 [4] - Scale - up突破单服务器/机柜限制进入“超节点”时代,核心是实现节点内GPU全互联,华为CloudMatrix384和英伟达NVL72已验证该趋势 [2][6] - CloudMatrix384通过增大Scale - up规模弥补单卡性能短板,提升整体算力和MoE模型训推效率,其拓扑结构和产品形态与NVL72有差异 [17] - CloudMatrix384已规模上线,下游客户丰富,其方案将推动AI芯片以“超节点”形式出货、400G多模或LPO采购增加、AIDC需求增加和液冷渗透率提升等产业链新趋势 [24][25] - Scale - out方面,以太网性价比不输Infiniband,预计未来二者在AI服务器集群中二元共存局面将继续保持 [25] 3D打印:从工业级到消费级,需求有望快速释放 - 25年5月我国3D打印设备产量同比增长40%,消费级3D打印产品因价格下探和操作简化迎来快速增长阶段 [2][28] - 3D打印是增材制造技术,核心价值是突破模具限制,实现设计自由度与制造效率跃升,其实现对操作者有一定门槛,性价比及产品精度是厂商核心 [30][32][33] - 当前主流3D打印技术呈现差异化发展路径,FDM是消费级主流选择方案,3D打印核心竞争力体现在设计自由度、定制化能力、成本效率和可持续性四个维度,产业化应用跨领域拓展 [40][41][42] - 3D扫描仪可降低3D打印使用门槛,提升精度,3D打印核心产业链相关公司包括消费级3D打印机整机、3D打印核心部件和3D扫描仪企业 [45][50] 重点公司更新 新国都:AIGC与支付出海 - 公司海外本地收单在国内A股上市收单公司中领先,海外重点布局SoftPOS发展海外移动支付,获全球首张MPoC证书 [51] - 公司海外AIGC布局已产生正收益,海外参股公司Duality Intelligence Limited已推出多款AI应用,2023年公司从参股AI公司取得投资收益约3364万元 [52] - 国内收单行业出清,费率止跌回升,公司收单业务综合排名靠前,有望享受行业出清红利 [52] 海光信息:换股合并中科曙光,长期打造国产算力“航母” - 海光信息发布换股吸收合并中科曙光并募集配套资金暨关联交易预案,换股方案实际曙光价格溢价254亿元,海光拟定增配套换股 [53] - 本次整合有利于公司业务拓展,最终打造国产算力领军“航母” [53] 北森控股:一体化HR SaaS,深耕HR领域20余年 - 公司以人才招聘、测评为基础,打造一体化HR SaaS及人才管理解决方案iTalentX,助力企业提升组织效能 [56] - iTalentX 8.0升级2000 +功能和场景,扩大一体化产品领先能力 [56] - 公司核心能力来自心理学研究,独家语料形成核心壁垒,随着大模型能力增强,公司优势将被放大 [60] 风险偏好判断以及重点标的 - 数字经济领军:海康威视、金山办公等 [62] - AIGC应用:金山办公、新致软件等 [64] - AIGC算力:浪潮信息、海光信息等 [64] - 数据要素:税友股份、博思软件等 [64] - 信创弹性:海光信息、太极股份等 [64] - 港股核心:中国软件国际、金蝶国际等 [64] - 智联汽车:德赛西威、虹软科技等 [64] - 新型工业化:中控技术、赛意信息等 [64] - 医疗信息化:润达医疗、嘉和美康等 [64]
山西证券研究早观点-20250603
山西证券· 2025-06-03 09:30
报告核心观点 - 今日关注通信行业、江铃汽车、中集车辆和立方制药相关动态,通信行业英伟达强调边缘计算,超节点是国产算力重要元素;江铃汽车持续发力海外开拓市场,推进新能源与智能化转型;中集车辆业绩短期承压,推进提质增效与全球市场开拓;立方制药集采出清,哌甲酯三层芯片获批,业绩有望反转 [5] 市场走势 - 国内市场主要指数多数下跌,上证指数收盘 3347.49,跌 0.47%;深证成指收盘 10040.63,跌 0.85%;沪深 300 收盘 3840.23,跌 0.48%等 [4] 行业评论(通信) - 英伟达 computex 强调边缘计算,超节点是国产算力重要元素,其 Blackwell 系列量产顺利,推出 NVLINK Fusion,GB300 预计 2025 年 Q3 推出,推理性能和 HBM 容量达 GB200 的 1.5 倍,通信带宽翻倍,NVL72 超节点机柜高速线背板量产工艺成熟,有望带动配套产业链放量,还将开放 NVLINK 解决方案,开拓 ASIC 市场,提升超节点在非 NV 芯片中渗透率 [6] - 英伟达着重推介端侧产品,如 DGX Spark、RTX Pro 等即将量产,AI 基础设施增量需求从数据中心下沉到边缘计算,类似产品或有广阔市场需求 [6] - 昇腾开发者大会 2025 推出昇腾 384 超节点集群,海光“反向收购”曙光,体现系统设计能力在下一代 AI 芯片的重要性,国内有望 2026 年多款超节点产品并驾齐驱 [6][7] 公司评论(江铃汽车) - 2024 年营收 383.74 亿元,同比 +15.70%,归母净利润 15.37 亿元,同比 +4.17%;2025 年 Q1 营收 79.67 亿元,同比 -0.09%,归母净利润 3.06 亿元,同比 -36.56% [9] - 2024 年营收增长得益于产品布局和市场拓展,各业务板块均有增长,但受价格战影响,毛利率有所承压,净利率表现较稳健 [10] - 海外市场拓展成效显著,2024 年出口量升至 11.66 万辆,同比 +21.9%,与福特合作深化;新能源战略转型持续推进,新能源车销量达 1.09 万辆,完善商用车电动化布局;积极布局智能网联,与多家企业合作 [13] - 预计 2025 - 2027 年营收分别为 424.39、482.08、557.28 亿元,归母净利润分别为 16.00、18.49、21.87 亿元,首次覆盖,给予“增持 - A”评级 [13] 公司评论(中集车辆) - 2024 年营收 209.98 亿元,同比 -16.30%,归母净利润 10.85 亿元,同比 -55.80%;2025 年 Q1 营收 45.91 亿元,同比 -10.91%,归母净利润 1.79 亿元,同比 -32.59% [16] - 北美市场下滑,国内市场稳中有升,全球半挂车收入下降,但国内半挂车销量和营收上升,市占率提升;盈利能力承压,推进提质增效,投入新能源市场,新能源产品销售亮眼 [16] - 预计 2025 - 2027 年营收分别为 215.56、228.11、248.92 亿元,归母净利润分别为 11.51、12.94、15.07 亿元,首次覆盖,给予“增持 - A”评级 [22] 山证医药(立方制药) - 2024 年营收 15.18 亿元,同比下滑 20.11%,归母净利润 1.61 亿元,同比下滑 29.15%;2025 年 Q1 营收 3.60 亿元,同比增长 7.98%,归母净利润 0.38 亿元,同比增长 25.94% [23] - 工业业务增长 18.92%,集采出清,多个品种增长明显,如盐酸羟考酮缓释片、硝苯地平控释片等;独家首仿精 1 类药物哌甲酯三层芯片获批,市场空间大 [24] - 以渗透泵控释技术为核心,产业化优势明显,是定点生产企业,营销层面持续优化;上调评级为“买入 - B” [24]
通信周跟踪:英伟达computex强调边缘计算,超节点是国产算力重要元素
山西证券· 2025-05-30 11:23
报告行业投资评级 - 领先大市 - A(维持)[1] 报告的核心观点 - 英伟达在台北电脑展确认 Blackwell 系列量产顺利,推出 NVLINK Fusion,GB300 预计 2025 年 Q3 推出,推理性能和 HBM 容量提升,通信带宽翻倍,NVL72 超节点机柜高速线背板量产工艺成熟,有望带动配套产业链放量,对 2026 年光模块行业贝塔乐观,且有望依托 NVLINK 开拓 ASIC 市场,促进超节点渗透率提升[3] - 英伟达着重推介端侧产品,如 DGX Spark、RTX Pro 等即将量产,AI 基础设施增量需求从数据中心下沉到边缘计算,类似产品或有广阔市场需求[4] - 昇腾开发者大会 2025 推介 384 超节点集群,海光“反向收购”曙光,技术上可提升芯片竞争力,商业上可提升整体盈利能力,国内 2026 年有望多款超节点产品并驾齐驱[5][7] 各目录总结 周观点和投资建议 周观点 - 英伟达在台北电脑展相关进展及对产业链和市场的影响,包括产品推出、技术升级、市场开拓等[3][13] - 英伟达推介端侧产品,反映出 AI 基础设施需求下沉趋势[4][14] - 昇腾开发者大会和海光“反向收购”事件的意义及国内超节点产品发展前景[5][7][15] 建议关注 - 光通信板块:中际旭创、新易盛、仕佳光子、光库科技、剑桥科技、源杰科技、华工科技、光迅科技[17] - 超节点板块:盛科通信、沃尔核材、鼎通科技、华丰科技、海光信息、华勤技术[17] - AI 物联网板块:广和通、移远通信、恒玄科技、汉朔科技、乐鑫科技、泰凌微[17] 行情回顾 市场整体行情 - 2025.05.19 - 2025.05.23 市场整体下跌,沪深 300 -0.18%,深圳成指 -0.46%,上证综指 -0.57%,创业板指数 -0.88%,科创板指数 -1.47%,申万通信指数 -2.31%,细分板块中工业互联网(+9.7%)、运营商(+0.3%)、无线射频(-1.2%)排名前三[7][17] 细分板块行情 - 涨跌幅:工业互联网、运营商、无线射频周表现领先,控制器、光模块、工业互联网月表现领先,工业互联网、无线射频、控制器年初至今表现领先[20][24][27] - 估值:各板块当前 P/E 与 P/B 与历史平均水平对比[30] 个股公司行情 - 涨幅领先个股:东土科技(+14.45%)、海格通信(+12.84%)、映翰通(+5.02%)、中国电信(+1.28%)、瑞可达(+0.44%)[7][32] - 跌幅居前个股:剑桥科技(-8.93%)、奥飞数据(-8.52%)、博创科技(-8.37%)、源杰科技(-6.54%)、振邦智能(-6.36%)[7][32] 海外动向 - 英伟达:将针对中国市场推新 AI 芯片,成立供应商联盟提供 800V 高压直流供电[37] - 英特尔:考虑出售网络及边缘业务部门[37] - 高通:宣布进军数据中心市场[37] 新闻公告 重大事项 - 瑞芯微、新雷能、杭电股份、光库科技、矩子科技、震有科技等公司在 2025 年 5 月 19 - 23 日有拟增持、拟减持、拟回购、拟并购、拟定增等事项[38] 行业新闻 - 英伟达 CEO 黄仁勋称美国 AI 芯片出口管制失败,英伟达在中国市场份额下降,宣布在中国台北建立新据点等[40][41] - 美国商务部加强对全球 AI 芯片出口管制[41] - 黄仁勋回应英伟达 AI 芯片转运指控,宣布 Grace Blackwell 系统全面投入生产等[41]
周跟踪:英伟达computex强调边缘计算,超节点是国产算力重要元素
山西证券· 2025-05-30 11:19
报告行业投资评级 - 领先大市 - A(维持) [1] 报告的核心观点 - 英伟达在台北电脑展确认 Blackwell 系列量产顺利,推出 NVLINK Fusion,GB300 预计 2025 年 Q3 推出,推理性能和 HBM 容量达 GB200 的 1.5 倍,通信带宽翻倍,NVL72 超节点机柜高速线背板量产工艺成熟,对 2026 年光模块行业贝塔乐观,有望依托 NVLINK 开拓 ASIC 市场并提升超节点渗透率 [3][13] - 英伟达着重推介端侧产品,如 DGX Spark、RTX Pro 等即将量产,AI 基础设施增量需求从数据中心下沉到边缘计算,类似产品或有广阔市场需求 [4][14] - 昇腾开发者大会 2025 推出 384 超节点集群,海光“反向收购”曙光体现系统设计能力重要性,技术上可提升海光芯片竞争力,商业上可提升整体盈利能力,国内 2026 年有望多款超节点产品并驾齐驱 [5][15] 各目录总结 周观点和投资建议 周观点 - 英伟达在云端基础设施、端侧产品等方面有新进展,对光模块行业乐观,有望开拓 ASIC 市场和提升超节点渗透率,AI 基础设施需求下沉到边缘计算 [3][4][13] - 昇腾开发者大会推出超节点集群,海光“反向收购”曙光有技术和商业意义,国内超节点产品未来可期 [5][15] 建议关注 - 光通信板块关注中际旭创、新易盛等公司 [17] - 超节点板块关注盛科通信、沃尔核材等公司 [17] - AI 物联网板块关注广和通、移远通信等公司 [17] 行情回顾 市场整体行情 - 本周(2025.05.19 - 2025.05.23)市场整体下跌,沪深 300 -0.18%,深圳成指 -0.46%,上证综指 -0.57%,创业板指数 -0.88%,科创板指数 -1.47%,申万通信指数 -2.31%,细分板块中工业互联网(+9.7%)、运营商(+0.3%)、无线射频(-1.2%)排名前三 [7][17] 细分板块行情 - 涨跌幅方面,工业互联网、运营商、无线射频周表现领先,控制器、光模块、工业互联网月表现领先,工业互联网、无线射频、控制器年初至今表现领先 [20][24][27] - 估值方面,展示了各板块当前 P/E 与 P/B 与历史平均水平对比 [30] 个股公司行情 - 东土科技、海格通信等涨幅领先,剑桥科技、奥飞数据等跌幅居前 [7][32] 海外动向 - 英伟达将针对中国市场推出新 AI 芯片,成立供应商联盟,英特尔考虑出售业务部门,高通进军数据中心市场 [37] 新闻公告 重大事项 - 瑞芯微、新雷能等公司有拟增持、减持、回购、并购、定增等事项 [38] 行业新闻 - 英伟达 CEO 称美国出口管制失败,计划在中国台北建立新据点,Grace Blackwell 系统全面投入生产等 [40][41]
GPU集群怎么连?谈谈热门的超节点
半导体行业观察· 2025-05-19 09:27
超节点服务器概念与背景 - 超节点服务器是应对AI算力需求爆炸式增长的最优解,通过高效整合海量计算单元(CPU/GPU/TPU)实现前所未有的计算密度和效率[4][6] - AI模型参数从亿级跃升至万亿级,传统服务器显存和算力无法满足需求,模型并行成为必然选择但受限于服务器间网络带宽瓶颈[9] - 超节点三大核心特征:极致计算密度(单空间最大化算力)、强大内部互联(NVLink等技术)、AI负载深度优化(软硬件协同设计)[10] 技术演进历程 - 早期追求服务器密度的尝试(如1999年谷歌"软木板服务器")与超节点有本质区别,前者侧重资源池化而非算力整合[12] - GPU并行计算能力崛起成为关键转折点,Transformer等大模型推动NVLink等高速互联技术发展[13] - 英伟达DGX/HGX系列将8GPU+NVSwitch高度集成,形成典型超节点单元[14] 行业需求驱动因素 - AI大模型遵循规模定律(Scaling Law),模型规模与训练数据量增长直接带来算力需求指数级上升[16] - 长序列处理需求提升模型性能但显存需求急剧增加,2025年斯坦福报告显示训练算力年增长率达10倍[18][20] - 传统扩展方式面临三大瓶颈:内存墙(数据供给不足)、规模墙(集群扩展收益递减)、通信墙(并行计算通信开销)[21] 技术优势与解决方案 - 构建超大带宽域(HBD)实现纵向扩展(Scale-Up),8GPU服务器内通信带宽达130TB/s[22][37] - 集中式供电方案提升效率,液冷技术使PUE优于传统风冷,长期运营成本降低[24][26] - 模块化设计优化运维,大型风扇墙和集成电源组件比传统方案节能30%以上[26][29] 关键技术挑战 - 供电系统需应对100kW+机柜功耗,电压从48V向400/800V演进以减少线路损耗[31] - 冷却系统采用冷板式/浸没式液冷应对单芯片1000W+ TDP,散热效率提升5-10倍[32] - 网络系统需平衡铜缆/光缆成本与性能,InfiniBand和RoCE成为主流互联方案[32][37] 行业技术现状 - 英伟达GB200 NVL72集成72个Blackwell GPU,采用NVLink实现36CPU+72GPU逻辑统一,定义行业标准[35][37] - 华为CloudMatrix 384通过384颗昇腾芯片全光互联实现自主可控,但功耗较高[38][41] - 供电技术向48V直流母线槽演进,液冷采用直触式冷板技术,网络倾向RoCE以太网[33][34][37] 未来技术方向 - 数据中心供电向400V/800V高压直流(HVDC)转型,减少AC-DC转换损耗[40][43] - 下一代液冷技术包括微流控冷却(芯片表面蚀刻微通道)和相变液冷(利用潜热)[45] - 共封装光学(CPO)技术将光模块集成至芯片封装,提升I/O带宽密度并降低功耗[49] 行业影响与展望 - 超节点是AI算力基础设施的集大成者,融合芯片/互联/制冷/供电等尖端技术[46] - 技术演进将催生全新系统架构,如计算/内存/存储资源池化通过光路互联[49] - 行业正从单机柜级向跨机柜级超节点发展,推动AI集群算力规模突破现有上限[22][41]
910C的下一代
信息平权· 2025-04-20 17:33
华为昇腾CloudMatrix与UB-Mesh技术分析 核心观点 - 华为发布的CloudMatrix 384超节点与UB-Mesh论文描述的架构存在显著差异 表明两者属于不同代际或应用场景的技术方案 [1][8] - CloudMatrix已实现384颗NPU光互联商用 而UB-Mesh论文提出8000颗NPU超节点构想 显示技术路线存在分级演进可能 [8][9] - 华为在超节点网络架构积累可能超越英伟达 尤其在分布式交换和拓扑优化方面展现独特优势 [10][11] 技术架构差异 - **硬件形态**:UB-Mesh采用1U机箱 每机柜64NPU 而CloudMatrix单机柜32NPU(384/12) 物理结构完全不同 [1] - **互联协议**:CloudMatrix采用光互联实现384NPU商用 UB-Mesh提出电互联(机柜内)+光互联(机柜间)混合方案 [5][9] - **NPU设计**:UB-Mesh描述的NPU集成分布式交换功能 可能对应昇腾910C下一代设计 当前910C尚未具备此能力 [10] 性能与成本争议 - **功耗对比**:CloudMatrix单机柜约50KW 支持风冷 而英伟达NVL72达145KW 但整体能效需结合电力基础设施评估 [2][5] - **光模块优势**:华为垂直整合光模块产业链 可能通过规模效应将400G模块成本降至竞争对手1/3以下 [3][6] - **传输速率**:华为自研光模块可实现8x64G=512Gbps单模速率 远超行业标准400G(8x50G)设计 [4] 行业竞争格局 - **技术路线**:英伟达转向全电互联(NVL72) 华为坚持光电混合方案 在超大规模集群(8000NPU)领域形成差异化 [8][9] - **生态构建**:中国AI基础设施可能形成独立生态 DeepSeek等应用需求正反向推动国产硬件创新 [11] - **工程能力**:中国企业在1-10阶段工程化优势显著 光模块等核心部件成本压缩速度超国际预期 [6][12] 技术演进方向 - **代际划分**:CloudMatrix 384代表UB1.0商用方案 UB-Mesh论文预示UB2.0将支持8000NPU级超节点 [11] - **拓扑优化**:分级拓扑成为趋势 机柜内电互联+机柜间光互联方案平衡性能与成本 [9][10] - **延迟控制**:分布式交换架构使Mesh拓扑实现all2all通信 逻辑延迟可能低于Clos架构 [10]