NVlink
搜索文档
开源证券:国产Scale-up/Scale-out硬件商业化提速 聚焦AI运力产业投资机遇
智通财经网· 2025-10-15 15:35
AI算力架构演进与硬件需求 - 传统算力架构难以满足高效、低耗、大规模协同的AI训练需求,超节点成为趋势[1] - 超节点通过提升单节点计算能力,大幅带动Scale up相关硬件需求[1] - 超大规模AI集群建设推动大量节点互联,带动Scale out硬件需求,单一地区电力资源成为瓶颈后,跨数据中心的Scale across方案将逐步采用[1][3] 算力、存力与运力的协同 - AI硬件能力由算力、存力、运力三位一体协同推动[1] - 算力由GPU性能和数量决定,存力当前主流方案是使用贴近GPU的超高带宽HBM缓存[1] - 运力分为Scale up、Scale out和Scale across三个场景,分别对应节点内、节点间与数据中心间的高速通信和数据传输能力[1] - 随GPU计算能力与HBM带宽提升,运力瓶颈将导致AI数据中心节点空置率高,GPU性能浪费,运力发展将成为提升AI数据中心运算能力的重点[2] 运力市场规模与增长 - Scale up交换芯片已成为数据中心主力交换需求并持续增长,预计到2030年全球市场规模接近180亿美元,2022-2030期间年复合增长率约为28%[3] 通信协议发展趋势 - 针对Scale up和Scale out有不同的通信协议,大厂自研私有协议与第三方及中小厂推动公有协议将成为未来发展趋势[1][4] - Scale up层面,英伟达NVlink、AMD Infinity Fabric和华为UB mesh是私有协议代表,博通推动的SUE与行业历史悠久的PCIe是公有协议代表[4] - Scale out层面,英伟达Infiniband为私有协议,博通致力于推动基于公有以太网的RoCE2,海外众多厂商还一起推动超级以太网联盟[4] 运力硬件国产化机遇 - 运力硬件主要涉及交换芯片与部分改善信号质量的数模混合芯片,国产自给率极低,博通、Marvell占据全球商用交换芯片90%以上市场份额[5] - 国产厂商已逐步完成产品量产并走向商业化,如数渡科技自主设计的PCIe 5.0交换芯片已实现量产并正导入客户应用,盛科通信面向大规模数据中心的Arctic系列已在2023年年底送样测试[5] - 运力硬件相关公司正走向从产品化至商业化的快车道,国产替代空间广阔,有望成为下一个高赔率的国产替代新方向[2][5] 投资建议 - PCIe硬件受益标的包括万通发展(数渡科技)、澜起科技等[6] - 以太网硬件受益标的包括盛科通信、中兴通讯、裕太微等[6]
一桩收购,成就4万亿英伟达(NVDA.US)
智通财经网· 2025-09-07 15:07
网络业务表现 - 网络业务收入环比飙升46% 同比几乎翻一番 第二季度达到72.5亿美元 [1] - 网络业务年运营额达250亿至300亿美元 对整体收入贡献远高于16.1% [1] - 通过收购Mellanox建立的业务单季度收入已超过69亿美元收购成本 [1][2] Mellanox收购价值 - Mellanox是InfiniBand互连技术先驱 产品应用于全球超半数最快超级计算机 [4] - 被收购前连续10年盈利 2018年GAAP净收入1.343亿美元创历史新高 [4] - 收购使英伟达在以色列建立5000人研发团队 开发CPU、SoC及自动驾驶算法 [17] 技术突破与产品优势 - Spectrum-XGS以太网将多数据中心连接为统一系统 通信性能提升近一倍 [3][4] - InfiniBand具备极低延迟特性 专为分布式计算设计 是横向扩展基础设施黄金标准 [7][11] - NVlink提供scale-out九倍带宽 结合SHARP协议使机架成为计算单元 [10] 行业需求与基础设施 - AI集群规模达数十万GPU 云厂商计划部署百万级GPU 网络成为关键瓶颈 [8][9] - 光纤网络功耗占计算能力近10% 10万GPU需60万个光收发器 [12] - 共封装光模块(CPO)技术可降低四倍功耗 使同网络容纳三倍以上GPU [13] 战略协同效应 - Mellanox技术使地理位置分散的数据中心能像单一系统运行 创建"AI工厂" [3] - 网络连接与处理器协同作用推动公司市值从930亿增至4万亿美元 [5] - InfiniBand技术被OpenAI采用 是ChatGPT实现高速数据处理的基础 [6] 技术演进方向 - 计划在单机架部署576个GPU 采用铜缆布线实现成本效益最大化 [11] - 需要将硅光子引擎集成到交换机 替代外部光收发器提升可靠性 [13] - 新一代数据中心每年更新 包含新GPU、交换机及基础设施 [9]