AI模型与应用
搜索文档
国海证券:总线互联促进AI模型与应用产业发展 维持计算机行业“推荐”评级
智通财经网· 2025-12-25 13:56
文章核心观点 - 在大模型时代,Scale-Up(纵向扩展)对高速互联协议产生了新需求,总线互联在超节点中扮演关键角色,国内外正积极发布新架构以促进AI产业发展,并形成从模型到算力的正向循环 [1] 高速互联协议的作用与需求 - 计算机总线用于连接系统与组件,具有数据传输、寻址和控制功能,服务器常见协议包括PCIe、Ethernet等,Switch设备负责Scale-Up中的主机通信与带宽扩展 [1] - 大模型时代的Scale-Up对高速互联协议产生新需求,主流协议包括NVLink、UALink、SUE、CXL、HSL、UB等 [1] 主要高速互联协议技术现状 - PCIe是传统扩展总线标准,但设备间通信速度存在瓶颈,因此CXL协议应运而生,众多厂商使用各自互联协议,其中NVLink处于领先地位 [2] - NVLink实现GPU间高速互联,NVSwitch提供多GPU互联硬件支持,具有延迟低、通道数多、带宽高、功耗大的特点,第五代NVLink单通道带宽为200Gbps,远超PCIe Gen5的32Gbps [2] - NVLink C2C实现CPU与CPU、CPU与GPU间的高速互联 [2] - 华为灵衢(UB)提供百纳秒级同步内存访问时延和2-5微秒异步内存访问时延,提供TB/s级带宽,其UB Processing Unit内嵌UB Switch支持多级扩展组网,并可通过UBoE与以太网融合组网 [2] - UALink利用以太网基础设施实现Scale-Up,UALink 1.0规范支持每通道最高200GT/s速率,每四条物理通道组合在TX和RX方向各提供最大800Gbps带宽 [3] - 博通SUE借助以太网实现网络总线化,以低延迟、高带宽方式实现高效部署,支持以高效面积和功耗实现多实例化 [3] - 海光信息发布海光系统互联总线协议(HSL) 1.0规范并公布未来三年开放路线图,旨在打破技术壁垒,促进国产计算产业生态协同创新 [3] 技术发展趋势与产业合作 - NVLink走向部分开源合作,首批合作厂商包括MediaTek、Marvell、Alchip Technologies、Astera Labs、Synopsys和Cadence,支持定制化芯片Scale-Up以满足模型训练和推理需求 [4] - 云服务商可以使用自定义ASIC、NVIDIA机架级系统和NVIDIA端到端网络平台 [4] - 算力需求演进对互联技术提出更高要求,需要实现高带宽和低时延,随着模型规模、数据集规模及训练计算量增加,语言建模性能平滑提升,三者需同步提升以获得最优性能 [4] - 当前大型语言模型存在显著训练不足的问题,这是近期在保持训练数据量不变的情况下过度追求模型规模扩张的结果 [4]