通信行业专题研究:华为领航,AI和国产算力产业持续蓬勃发展
国联证券·2024-09-22 17:30
- AI产业持续蓬勃发展 1.1 大模型参数持续增长,多DC协同训练将成主流 - 华为预测,模型Scaling Law仍将持续,顶级通用大模型参数规模将达到每2年8倍的增长速度,到2030年将出现百万亿—千万亿的通用大模型[9][10] - 百万亿参数级别的模型,训练将需要100万卡的训练集群,预计功耗达到3000MW以上,高能耗的集群将迫使模型训练从单计算中心训练,走向多DC协同训练,远距离异步协同训练将成为主流[9] - 千万亿通用大模型的落地,需突破超大规模复杂集群通信提高训练推理效率,卡间互联带宽将从当前主流的200-900GB/s提升到10TB/s以上[9] 1.2 跨DC协同训练给网络带来挑战 - AI训练步入十万卡时代,跨DC协同训练对网络带来挑战,包括对网络丢包的敏感度高、大象流导致负载分担方法失效、万卡集群中流量瞬时并发可达上千Tbps[11][12] - 目前十公里的跨机楼并行训练算效损失可低于5%,未来百公里级、千公里级的跨地域并行训练欲将损失控制在10%以下,除需建设长距离超宽DCI网络之外,还涉及模型切分策略、集合通信算法、无损网络技术等[12] 1.3 OXC光交换和CPO技术有望得到应用 - 芯片出光、OXC光交换技术的应用有望实现全光DCN,结合新型网络拓扑创新可减少50%以上光模块的成本和能耗[13][14] - 当前3D MEMS技术已成为端口光交换主流技术,可以扩展至千端口以上,支撑构建百万卡AI智算光电混合集群网络[14] - 集群网络的互连未来有机会切换为CPO解决方案,以降低DCN互连功耗[14] 1.4 新型光纤介质有望得到应用 - 新型光纤的应用将对数据中心光互联产生革命性的影响,其中空芯光纤和多芯光纤将进一步推动数据中心实现更低时延、更高密度、更低成本的光互联[15][16] - 空芯光纤具有低时延、低色散和低非线性等优点[15] - 多芯光纤可大幅提升光传输容量和频谱效率,节约布线成本和管道资源、降低能耗[16] 2. 投资建议:关注AI产业链投资机会 - 推荐光模块光器件龙头标的:中际旭创、新易盛、天孚通信[17] - 推荐DCI赛道稀缺标的:德科立[17] - 推荐空芯光纤领先厂商:长飞光纤[17] 3. 风险提示 - AI发展不及预期的风险[18] - 中美贸易摩擦加剧的风险[18] - DCI技术发展不及预期风险[18]