Workflow
超节点架构
icon
搜索文档
超节点,凭何成为AI算力“新宠”?
21世纪经济报道· 2025-07-31 09:00
超节点技术发展背景 - AI大模型发展推动算力需求进入"万卡协同"时代,传统算力架构难以满足高效、低耗、大规模协同需求 [1] - 英伟达率先提出超节点(SuperPod)概念,作为Scale Up最优解,通过高速总线互连加速GPU参数交换和数据同步 [1] - 2025世界人工智能大会展示中国企业在超节点领域突破,如华为昇腾384超节点首秀和曦智科技光互连方案获奖 [1] 超节点技术优势 - 超节点采用Scale Up方案,相比传统Scale Out在性能、成本、组网、运维等方面更具优势 [2] - 通过深度整合GPU资源构建低延迟、高带宽的统一算力实体,提升算力密度和能源效率(PUE) [2] - 采用液冷等先进散热技术,解决高功耗GPU服务器散热和供电挑战,单机柜可整合数十至上百计算单元 [2] 超节点连接方案 - 铜连接成为主流方案,224G以太网SerDes技术实现短距离高性价比传输,GB200 NVL72服务器单机柜使用5000多条电缆总长近2英里 [3] - 超节点方案分为私有协议(英伟达、华为等)和开放标准(ODCC主导的ETH-X项目)两种技术路线 [3][4] - ETH-X架构分为Scale Up(负责HBD内部GPU互联)和Scale Out(扩展多HBD组成集群)两部分 [4] 中国企业布局 - 华为发布昇腾384超节点,实现384卡高速总线互联,具备超大带宽、超低时延优势 [5] - 曦智科技联合壁仞科技推出全球首个分布式光互连光交换GPU超节点方案LightSphereX [5] - 燧原科技云燧ESL超节点系统单节点支持64卡全带宽互联,采用液冷方案 [5] - 摩尔线程构建全栈AI智算产品线,自研KUAE计算集群实现上千节点高效协作 [6] - 沐曦发布曦云C600 GPU支持MetaXLink超节点扩展技术,内置安全防护模块 [5] 市场前景 - 中信建投研报指出超节点已成为下一代服务器方案趋势,铜连接市场空间将随字节、阿里、腾讯采用而扩大 [4] - 行业认为中国超节点技术正为全球AI发展铺设兼具性能与包容性的新赛道 [6]
华丰科技(688629):高速连接国产先锋,受益AI短距互联
华泰证券· 2025-07-04 20:41
报告公司投资评级 - 首次覆盖华丰科技并给予“增持”评级,目标价 59.86 元/股,基于 26E 75xPE 估值 [1][6] 报告的核心观点 - 华丰科技是国内高速连接器领军者,在国内 AI 持续投入叠加海外 GPU 供应受限背景下,国产算力放量或带来可观的集群内短距互联需求,公司为大客户开发的高速线模组产能逐步释放,有望持续兑现业绩增长;“十四五”收官,军费预算增长下公司防务订单有望向好,工业板块收入预计在新能源车高压趋势下实现稳健增长,CPU Socket、无人机系统连接方案等新产品远期或逐步导入市场 [1] 各部分总结 报告核心要点 - 华丰科技是国内领先的光电连接器及互连方案供应商,专注通讯、防务、工业三大领域,拳头产品“高速背板连接器”打破海外垄断;2024 年净亏损因高速线模组未形成产能规模,1Q25 业绩迎来拐点,未来看好高速线模组逐季兑现业绩增量 [15] - 通讯板块与大客户深度合作,受益于 AI 集群内部短距互联需求增长,2029 年国内高速背板连接器市场规模有望达 241 亿元,2025E - 2029E 市场空间 CAGR 为 45%,公司有望持续扩充产线、增加份额 [16] - 防务板块把握“十四五”强军计划收官机会,2025 年国家军费预算同比提升 7.2%,公司已建立系统互连产品优势,防务订单有望向好 [17] - 工业板块新能源高压连接线束深挖客户价值,系统级连接方案应用有望外拓,2026 年我国新能源高压连接器市场有望达 337 亿元,5 年 CAGR 为 42%,轨道交通板块收入有望稳健成长,其他应用场景未来或逐步兑现收入增长 [18] - 市场担忧超节点架构下铜连接使用量减少,但超节点架构创造短距互联场景,铜连接在短距场景相比光连接有稳定性高、成本低、功耗低的优势,使用量或提升 [19] - 截至 2025 年 7 月 3 日,公司股价相比上市日上涨 232%,同期科创 50 上涨 97%,上市 2 年间股价上涨主要受国产算力板块带动和业绩边际改善驱动 [21] 华丰科技:中国高速铜互联领军者,通讯、防务、工业三轮驱动 - 公司成立于 1958 年,是国内领先的光电连接器及互连方案供应商,客户覆盖国内外头部厂商,“高速背板连接器”实现 56Gbps/112Gbps 单通道速率批量生产和 224Gbps 产品开发预研,打破海外垄断 [25] - 公司发展历程分为三个阶段:1958 - 2003 年引进标准,追随苏美步伐;2004 - 2018 年自主创新,三轮驱动初显;2019 年至今突破封锁,引领国产高端连接器市场 [28] - 公司实控人为绵阳市国资委,下游核心客户华为、中兴间接持股,华为哈勃入股;高管管理和技术经验兼备,核心技术人员多为内生培养 [29][31] - 公司业务矩阵聚焦“一核”通讯连接器、“两翼”防务连接器/工业连接器,实现多速率覆盖,各板块产品技术指标先进,客户覆盖广泛 [33] - 2024 年公司收入稳健增长,研发资源投入前置/产能未充分释放致盈利承压;受益于高速线模组产能释放,1Q25 收入和利润边际改善;主营业务通讯板块营收占比有望持续提升;近三年综合毛利率先升后降,防务板块毛利贡献突出但远期毛利率或下行,通讯板块新品毛利率未达稳态;2024 年整体费用率波动不大,2025 年费用率有望优化,研发费用或持续提升 [34][35][41] 连接器行业 - 连接器是电子电路连接桥梁,按传输介质分为电、光、微波射频、流体连接器,华丰科技主要聚焦电/光连接器;产业链分为上游材料、中游制造和下游应用,公司处于中游制造核心环节;2024 年中国连接器市场规模达 280 亿美元,居全球第一,通信和汽车是应用最广的领域 [51][54][63] 通讯连接器 - 通讯连接器用以实现通信设备内部稳定信号传输,华丰主攻高速背板连接器,包括背板、I/O、近芯片连接等形式 [65] - 通讯连接器呈现高速化趋势,AI 服务器内 GPU 算力和带宽升级倒逼连接器单信号速率提升,如英伟达 NVLink 和华为 HCCS 技术的发展 [67][68] - 全球超节点架构兴起,高速铜连接在短距场景有优势,英伟达 GB200 NVL72 和华为 CM384 超节点架构有望拉动高速铜连接市场增长,预计 2029 年国内高速背板连接器市场规模达 241 亿元,2025E - 2029E 市场空间 CAGR 为 45% [74][77][87] - 过往海外公司在高速连接器领域构筑专利壁垒,占据大部分市场;华丰科技高速产品迭代速率追上海外龙头,已成长为华为核心供应商,国内厂商在 112Gbps 及以上产品研制中迎头赶上,有望受益国内算力建设 [90][95] 防务连接器 - 防务装备数量及智能化、集成化水平提升将带动防务连接器量价齐升,2025 年国防支出扩容或催生更多连接需求,2026 年我国军用连接器市场规模有望达 236 亿元 [103][104] - 公司防务板块业务包括系统互连产品、单一防务连接器以及组件等,部分系统互连产品达国际先进水平,单一连接器相关技术达国内同行业头部企业水平,公司具备丰富的重点装备型号定制开发和配套经验,未来有望受益我国防务连接器需求增长 [106][111][112] 工业连接器 - 轨道交通连接器方面,铁路固定资产投资回暖,2025 年我国铁路连接器市场规模有望达 47 亿元,华丰在铁路机车连接器领域份额领先,2023 年市场份额为 24% [114][118] - 新能源连接器方面,汽车连接器分为低压、高压、高频高速等形式,华丰主攻高压连接器;新能源汽车渗透率提升叠加 800V 高压化趋势,高压连接器有望量价齐升,预计 2026 年全国新能源汽车高压连接器市场规模达 337 亿元,5 年 CAGR 为 42%;公司跟进厂商高压化步伐,提供整体解决方案,未来希望开拓高频高速连接器市场 [121][123][133] 盈利预测与估值 - 预计公司 2025 - 2027 年营业收入分别为 24.06/32.10/39.48 亿元,同比增速分别为 +120.3%/+33.4%/+23.0%,归母净利润分别为 2.43/3.67/4.82 亿元,同比增速分别为扭亏/+51.1%/+31.3% [134] - 通讯板块未来业绩有望持续兑现,有客户拓展和品类拓展逻辑,预计 2025 - 2027 年收入为 17.36/24.16/30.21 亿元,同比增速分别为 +227.6%/+39.1%/+25.1%,毛利率分别为 25.35%/26.09%/26.26% [134][135][136] - 防务板块预计 2025 - 2027 年收入为 3.61/4.26/5.03 亿元,同比增速分别为 15.0%/18.0%/18.0%,毛利率分别为 41.0%/41.0%/41.0% [137] - 工业板块预计 2025 - 2027 年收入为 2.89/3.47/4.01 亿元,同比增速分别为 +25.6%/+20.0%/+15.6%,毛利率分别为 15.9%/15.7%/15.5% [138] - 预计 2025 - 2027 年销售费用率分别为 3.20%/3.00%/2.80%,管理费用率分别为 6.40%/6.00%/5.20%,研发费用率分别为 5.90%/5.00%/4.80% [139] - 采用分部估值法,通讯板块选取长芯博创、兆龙互连、软通动力为可比公司,给予 26 年 PE 87x,对应市值 247.99 亿元;其他板块选取瑞可达、鼎通科技、陕西华达为可比公司,给予 26 年 PE 34x,对应市值 27.96 亿元;给予公司 26 年目标市值 275.95 亿元,对应目标价 59.86 元/股,对应 26 年 PE 倍数为 75.13x,首次覆盖给予“增持”评级 [141][142][146]
从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?
AI前线· 2025-05-22 12:30
模型开发趋势 - 模型开发从算法层优化转向系统工程层面的深度创新 [1] - 行业从数字化时代的比特流量转向Token经济体系,国内Token日消耗量从千亿级跃升至十万亿级 [1] - 头部平台如DeepSeek日均处理6000亿Token,验证高吞吐、低时延系统的商业价值 [1] - 模型结构从单一架构探索发展为多模态融合创新,分布式集群部署成为新常态 [1] - ChatGPT和DeepSeek用户规模突破亿级的时间从1个月压缩至7天,系统处理能力实现数量级提升 [1] 华为对DeepSeek的优化 - 华为针对DeepSeek的优化包括预训练、算子层面、计算与通信优化、内存优化等方面 [3][6][7][10] - 预训练方面,华为复现并改进DualPipe技术,最终提出DualPipe-V方案,优化显存使用并集成至MindSeed [6] - 算子层面实现MRN的PO融合算子,提升执行效率 [7] - 计算与通信优化包括低时延通信优化和双链路通信掩盖 [7] - 内存优化方面,华为自研重计算技术,节省多个GB显存,适用于计算量小但激活值大的操作 [10] 推理优化与系统架构 - 华为提出PD(Prompt Decoder)分离部署,降低首token延迟并提升整体推理效率 [12] - 针对MOE架构,华为研发"超节点"架构,通过高速总线将上百张GPU卡互联,显著减少通信时延 [14] - 超节点架构采用统一内存编辑和语义通信,实现TB级带宽超高速互联 [14] - Atlas 900 A3 SuperCluster突破Scale up物理节点计算瓶颈,训练效率提升2.7倍 [15] - 在A3超节点集群上完成DeepSeek V3训练优化,达到每卡1,216 TPS吞吐率,MFU达44.57% [15] MOE架构与负载均衡 - MOE架构专家数量不断增加,DeepSeek V3/R1已有288个专家 [13] - 华为引入动态专家并行策略,取代传统张量并行,规避显存和计算浪费 [17] - 通过静态、分段及动态均衡负载算法,解决专家并行带来的负载均衡问题 [17] - 华为发布OmniPlacement算法,识别热/冷专家,优化计算均衡,理论上降低10%推理延迟并提升10%吞吐量 [19]
华为云黄瑾:传统计算架构难支撑AI代际跃迁,超节点架构是创新
贝壳财经· 2025-05-16 20:56
华为云AI技术突破 - 公司推出CloudMatrix 384超节点架构,解决传统计算架构难以支撑AI技术代际跃迁的问题 [1] - 该架构通过新型高速互联总线实现384张卡互联,提供300Pflops算力规模,比英伟达NVL72提升67% [1] - 超节点架构具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势 [1] 算力需求与瓶颈 - AI算力需求在过去8年增长1万倍,但单卡硬件算力仅增长40倍,节点内总线带宽增长9倍,跨节点网络带宽仅增长4倍 [1] - 集群网络通信成为当前大模型训练和推理的最大挑战 [1] 技术优势与创新 - 超节点架构通过高速互联总线实现一卡一专家高效分布式推理,单卡MoE计算和通信效率大幅提升 [2] - MatrixLink服务具有两层网络,超节点内384张卡互联时延低至微秒 [2] - EMS弹性内存存储通过内存池化技术实现显存和算力解绑,首Token时延最高降低80% [2] - 昇腾云脑运维"1-3-10"标准将硬件故障感知率从40%提升至90% [2]