报告行业投资评级 - 行业评级为推荐 [7] 报告的核心观点 - 昇腾超节点商用落地标志国产AI算力在实际应用场景渗透加快,国产算力迎来破局元年 [3] - CloudMatrix 384商用上线,在地方算力数据中心的商用突破有望为CSP厂商认证提供基础,华为云超节点加速规模化布局,部署增量有望持续释放 [4][5] - CloudMatrix 384在芯片、架构、软件生态多维提升,强化在全球AI基础设施竞争格局中的整体竞争力 [6][7][8] - CloudMatrix 384集群性能全面对标NVL72,能耗设计上的取舍换来了大规模训练及推理场景下显著的性能释放,未来系统能耗问题有望逐步得到优化与改善 [10] - CloudMatrix 384正式推出,相关供应链有望迎来新一轮放量 [11] - 随着超节点未来有望持续规模化部署,相关产业链的需求有望同步放大,建议关注算力芯片、电源、温控及其他供应链相关公司 [13] 根据相关目录分别进行总结 事件 - 全球首个商用智算昇腾超节点在中国电信粤港澳大湾区(韶关)算力集群正式上线,标志国产AI算力在实际应用场景中的渗透步伐进一步加快 [3] CloudMatrix 384商用上线 - 于今年4月10日在华为云生态大会上正式发布,已在芜湖地区规模部署,在70亿参数规模的DeepSeek - R1模型训练中,相较于H100集群,迭代速度提升1.8倍 [4] - 硅基流动基于CloudMatrix 384超节点等完成了DeepSeek - R1模型的推理上线,测试显示在用户保持20 TPS水平下,系统推理吞吐量达到1920 tokens/s,有效比肩H100,模型精度与DeepSeek官方保持一致 [5] - 4月26日在中国电信粤港澳大湾区(韶关)的商用落地,标志着华为云在超节点集群领域的重要突破 [5] 系统级创新的全面升级 芯片方面 - 基于384颗昇腾910C芯片构建,910C集成530亿晶体管,采用Davinci增强架构,集成64个AI Core,支持多单位混合精度计算 [6] - 应用3D Fabric封装技术,实现Die - to - Die带宽500GB/s,提升芯片间互联效率,强化并行处理能力 [6] - 通过三维堆叠散热设计与液冷冷却方案,实现2.5kW/片的热密度,单颗功耗仅310W,相较上一代下降约40%,强化高密度集群部署能力 [6] 架构方面 - 完整超节点由16个机柜组成,12个计算机柜每柜配置32颗GPU,中央4个机柜部署Scale - Up交换设备 [7] - 采用Scale Up网络通过单层架构实现GPU全互联,整体网络基于16800台模块化交换机,搭建扁平化拓扑以降低延迟 [7] - 每颗GPU配备7个400G光收发器,通过堆叠设计实现2800 Gbit/s的Scale Up带宽,总共搭配6912个400G光收发器用于Scale Up网络,额外1536个用于Scale Out网络 [7] 软件方面 - 系统全面升级至CANN 6.0,实现对CUDA生态的代码自动转换并兼容PyTorch等主流框架,降低开发者的代码迁移成本 [8] - 适配MindSpore 3.0,通过引入动态图优化与自动并行技术,模型训练效率提升30% [8] CloudMatrix 384集群性能对标NVL72 - BF16性能达到300 PFLOPS,约为GB200 NVL72的1.7倍;HBM总容量达49.2TB,是GB200的3.6倍;总内存带宽达1229 TB/s,为GB200的2.1倍 [10][11] - 总功率达到559.4kW,是GB200 NVL72的近四倍功耗,每FLOP计算功耗也高出2.3倍 [10][11] 相关供应链有望放量 - 液冷方面,英维克、申菱环境作为华为液冷系统核心供应商,有望受益份额提升 [11] - 电源方面,泰嘉股份、欧陆通等电源供应链企业预计将获得持续增量 [11] - 芯片领域,中芯国际等核心晶圆代工厂商需求有望增长 [11] - 高速连接器方面,华丰科技等核心供应商有望在需求增长中收益 [11] - PCB/CCL方面,深南电路、南亚新材、生益科技作为华为重点供应商,有望获得新一轮订单需求 [11] - 多相控制器领域,杰华特有望在新一轮高性能AI集群建设中实现价值量提升 [11] 投资建议 - 建议关注算力芯片中芯国际;电源泰嘉股份、欧陆通;温控申菱环境、英维克;其他供应链华丰科技、杰华特、深南电路、南亚新材、生益科技等 [13]
电子行业点评:384架构引领,910C蓄势待发
民生证券·2025-04-29 20:30