Workflow
超节点
icon
搜索文档
计算机行业周报:稳定币加速进入主流领域!超节点实现从单卡突破到集群重构!-20250712
申万宏源证券· 2025-07-12 22:35
报告行业投资评级 - 看好计算机行业 [5] 报告的核心观点 - 上海国资委专题学习稳定币,稳定币加速进入主流领域,本周发布稳定币深度报告,明确稳定币是中长期主线,正进入主流支付领域,中国香港发展合规稳定币有战略意义 [4][5][6] - 本周发布超节点行业深度报告,华为 CloudMatrix 384 为国产范例,通过工程化设计弥补单卡性能不足,提升推理性价比,预计后续超节点将成国产算力主流出货形式 [5][6][33] 各部分总结 上海国资委专题学习稳定币,稳定币加速进入主流领域 - 2025 年 7 月 10 日,上海国资委专题学习稳定币,认可其对金融系统的补充作用,强调积极布局相关技术探索应用潜力,代表香港及全球稳定币合规化浪潮影响扩大 [5][7][8] - 稳定币是连接传统金融与加密世界的桥梁,有法币抵押型、加密资产抵押型、算法型等类型,当前多国立法推动合规稳定币发展,不同国家战略定位不同 [9][11][21] - 2025 年 5 月香港通过《稳定币条例草案》,预计 8 月 1 日生效,允许稳定币发行有强化金融中心地位等意义,头部发行方和交易所利润空间大 [24] - 稳定币相关受益标的包括证券 IT 服务商、稳定币持牌机构相关、跨境支付相关、Web3.0 技术服务商等 [29][30][31] 超节点:从单卡突破到集群重构 - 超节点是算力网络系统在单个或多个机柜层面的 Scale - up,与 Scale - out 本质不同,当前 Scale - up 进入“超节点”时代,芯片厂商预计在该领域深耕 [34][36][37] - 超节点设计对模型训练、推理性能提升显著,可平衡模型需求和工程成本,但受模型、IDC 实践、通信等因素制约 [38][41][45] - 华为 CloudMatrix 384 通过 UB 交换网络实现 384 个 NPU 全互联,弥补单卡性能短板,在模型推理上做了深度适配,预计后续国产算力将更多以超节点形式出货 [48][53][63] 风险偏好判断以及重点标的 - 包括数字经济领军、AIGC 应用、AIGC 算力、数据要素、信创弹性、港股核心、智联汽车、新型工业化、医疗信息化等不同类型的重点标的 [66] 计算机重点公司估值表 - 报告给出了金山办公、海康威视等多家公司 2024A - 2027E 的净利润和 PE 估值情况 [70]
超节点的光互联和光交换
傅里叶的猫· 2025-06-27 16:37
超节点技术概述 - 超节点通过高效互联架构显著提升大规模模型训练与推理效率,尤其在数千至上万张GPU协同场景下优势突出 [1] - 光学技术成为关键驱动力,其高效、低延迟和高可靠性特性突破传统互联方案瓶颈 [1] - 2025年起国内大模型推理需求激增,超节点通过优化token生成速度与单卡服务模型数量实现价值产出最大化 [2] 架构设计 - 单层架构为最优目标,可实现最低延迟(1微秒级)、最优成本与最高可靠性,但受交换机规模限制部分场景需采用两层架构 [4] - 国产GPU因7纳米制程限制,单卡算力仅为国际主流(如B200)的1/2至1/7,需数百个GPU通过高效互联对标NVL72超节点 [6] 发展路径 - 提高单机柜功耗:传统27千瓦机柜扩容至支持100个国产GPU,需多机柜协同实现数百GPU规模 [8] - 多机柜互联:谷歌案例显示数千GPU通过光互联组成超级系统,光缆传输距离达2000米(铜缆仅7米) [8][10] 光互联技术 - 光缆纤细特性解决铜缆堵塞风道问题,华为CloudMatrix384集群使用3000+光缆和6000+光模块 [12] - 共封装光学(CPO)将光电转换距离从几十厘米缩短至3-5厘米,博通51.2T CPO交换机集成度提升12倍 [14] - CPO节省1/3至2/3功耗,512卡全交换超节点中单位比特功耗从20pJ/bit降至7pJ/bit [16][17] 可靠性优化 - 分布式光交换(dOCS)支持故障节点动态替换,12服务器超节点可配置32卡+备份实现服务器级冗余 [18][19] - 光互联供应链更可控,光纤不依赖先进制程,国内技术差距较小 [19] 应用前景 - 超节点灵活配置4/6/8服务器规模,分散部署解决散热与土建限制 [19] - 国产GPU性能提升与光互联技术成熟将推动训练/推理场景突破,CPO与dOCS持续优化系统可靠性 [21]