Nvlink

搜索文档
看多国产算力 - 人工智能:从大模型产业视角看AIDC行业发展
2025-09-01 10:01
**行业与公司** * 行业聚焦于人工智能数据中心(AIDC)、国产AI芯片、网络通信设备、数据中心供电与散热系统[1] * 涉及公司包括国产AI芯片制造商(如华为、阿里平头哥)、互联网巨头(字节跳动、阿里、腾讯)、网络设备商(中兴通讯、盛科通信、锐捷网络、新华三)、电源与散热企业(中恒电气、北京科士达、夸大数据、麦克米特、阳光电源、台达电子)、IDC运营商(润泽科技、万国数据、世纪互联、光环新网、奥飞数据、数据港)以及传统电力设备商(金盘科技、四方股份、正泰电器)[4][14][19][20][21][22] **核心观点与论据** * 国产AI芯片地位提升 因良率提升已能满足国央企及政府需求 对海外芯片态度更趋强硬 春节前国产大模型发布将缩短中美技术差距[2] * 2025年Q4国内云厂商将出现显著算力缺口 字节跳动单家需求预计达50万张HH20级别算力 阿里资本开支超预期增长超200% 其日均淘客消耗超10万亿次推动算力需求[3][21] * 国产AI芯片产业链投资潜力集中于能获互联网大订单的芯片公司、良率提升的制造企业、阿里平头哥相关业务公司以及散热电源配套企业 后者出海毛利率比国内高至少10个百分点[4][5] * 网络业务增长强劲 英伟达网络业务收入达73亿美元创历史新高 同比增长98% 环比增长46% Spectrum、以太坊、Infiniband及Nvlink表现强劲 机柜级scale up需求剧增[6][7] * GPU通信带宽提升驱动交换设备需求 单卡双向通信带宽已升至900GB 华为384节点方案中单卡需7个接口 设备比例大幅提升[8] * 超级计算互联标准分封闭(如Openlink、华为384)与开源路线 开放式互联标准组织于2025年4月发布首版标准 博通推出SUE协议及TH5芯片优化高速互联[9][10] * IDC行业处底部但前景乐观 2025年上半年中国新增交付机架规模达4.5GW超往年全年峰值 推荐润泽科技(部署384超节点及液冷AIDC)、万国数据、世纪互联及有三季度收入潜力的光环新网、奥飞数据等[13][14] * HVDC供电成主流趋势 供电效率达90%-95%以上 正向正负400伏或800伏方案转变 可节省铜材并支持单机柜功率达800千瓦 Meta和英伟达均提出高压方案[15][16] * 固态变压器(SST)技术受关注 英伟达探索13.8kV交流直转800V直流 可省配电变压器降低成本 中国西电和台达已推样机[17] * 储能成为数据中心主要供电影响者 Meta签300MW光伏配1,200MWh储能协议 阿联酋项目配套5.2GW光伏和19GWh储能 风光储组合度电成本低于煤电及天然气发电[18] * 阿里资本开支超预期带动国产算力链 其供应商中恒电气、北京科士达、夸大数据(进入电源供应链及液冷)受益[21] **其他重要内容** * 云计算收入与CAPEX增长关联性强 亚马逊2013-2022云收入增25倍CAPEX增18倍 阿里2014-2018云收入增18.5倍CAPEX增9.2倍 预示AI收入高增长将推动未来CAPEX[11][12] * 推荐关注Skup网络发展 其依赖switch芯片、网卡及交换设备 中兴通讯(基于12.8T芯片)和盛科通信(基于2T芯片)公开支持该协议[11] * 大陆HVDC主机企业积极布局 麦克米特成英伟达GB200服务器PSU供应商并推800V 570kW产品 科士达通过代工进入北美市场 科华数据在腾讯招标份额大并推液冷CDU[19] * 传统电力设备商如金盘科技(推2.4MW SCT样机)、阳光电源(组建团队进军HVDC、SST及PSU)纷纷涉足数据中心领域[20]
算力:从英伟达的视角看算力互连板块成长性 - Scale Up 网络的“Scaling Law”存在吗?
2025-08-21 23:05
行业与公司 * 行业聚焦于AI算力网络互连板块 特别是Scale Up网络技术及其带来的产业链机会[1] * 核心讨论围绕英伟达及其产品策略展开 同时涉及亚马逊、谷歌、Meta等公司的ASIC方案[5] * 产业链受益环节包括光纤、AEC(有源铜缆)、光模块(1.6T)、MPO、FU以及交换机厂商(如锐捷网络、博通、天弘、Arista等)[28][30] 核心观点与论据 * **Scale Up网络的定义与必要性**:Scale Up网络旨在实现跨机柜的大规模连接 将机柜当作积木连接 其核心驱动力是解决硬件内存墙问题并满足AI并行计算(尤其是专家并行和张量并行)的高通信需求[1][5][7][10] * **英伟达的推广策略**:通过两条路径推广 一是不断提高Nvlink带宽(每代产品单卡带宽基本翻倍) 二是扩大Up规模(如从H100升级到GH200时将MV8提升到MV256) 后因成本高和推理需求不足而推出更具性价比的NVO32方案[6] * **Scale Up相比Out网络的优势**:在超节点内能提供更高带宽 在英伟达系统中Up带宽是Out的九倍 未来随着规模扩大可能取代Out 实现AI网络统一连接[7][8] * **性能优势验证**:GB200使用FP4精度 在TPS(Token Per Second)为10时 其单卡性能比B200差三倍(两倍来自FP4 0.5倍来自Scale Up和Grace CPU);当TPS为20时 差距变为七倍(3.5倍来自Scale Up和Grace CPU) 表明网络通信压力增大时Scale Up优势更明显[4][14][15] * **更大规模网络的需求**:为满足单用户TPS增长和模型能力拓展(如多模态模型) 需要组建更大规模的Scale Up网络(如NVL576) 其规模扩大速度需快于性能指标增长速度[21][22] * **组网方式与技术选择**:更大规模网络需进行机柜间第二层连接 建议采用光纤和AEC(有源铜缆)而非PCB(柜内)和DAC(有效距离仅1米)[23][24] * **带来的增量需求**:在第二层网络中 一个GPU需要9个等效1.6T连接(传统IB架构仅需2-3个) 且每4个GPU需额外增加一台Nvlink交换机(传统IB架构每30-48颗GPU才需一台) 导致端口和交换机需求显著增长[4][25][26] 其他重要内容 * **内存墙概念**:分为模型内存墙和算力内存墙 指模型参数量和算力增速快于配套内存(如HBM)增速 需通过高速通信实现显存池化[1][10] * **并行计算范式**:包括数据并行、流水线并行、专家并行和张量并行 后两者对通信频率和数据大小要求更高[2][11][12][13] * **总拥有成本(TCO)分析**:GB200 NVL72方案的总硬件成本约为6.1万美金 比NVL576方案节省2万美金[18][19] * **技术路径排除**:CPO和OCS技术因故障率瓶颈和镇静频率问题 目前尚未能应用于Scale Up场景[27] * **市场认知差异**:市场普遍认为Scale Up仅限于柜内 但实际需要跨机柜连接以提升单卡性能有效利用率[29][30]
芯片巨头,暗斗SerDes
半导体芯闻· 2025-06-10 17:52
大芯片市场格局变化 - 大芯片市场过去由英特尔、AMD、IBM主导,近年因LLM崛起,英伟达凭借GPU优势实现反超,Arm也找到切入机会 [1] - 高通收购SerDes供应商Alphawave后,大芯片市场格局发生巨变 [1] SerDes技术的重要性 - SerDes是数据中心通信的重要方式,其核心功能是在串行与并行数据间高效转换,支撑数字通信标准 [3][6] - 20世纪90年代末至21世纪初,SerDes速率从OC-24(2.488Gbps)提升至10Gbps,并逐渐用于PCB和背板的芯片间通信 [3] - 在FinFET技术下,基于DSP的SerDes成为56Gbps以上数据速率翻倍的必要方案,采用PAM4调制可使吞吐量翻倍 [4][5] 芯片巨头在SerDes领域的布局 - 博通、Marvell、英伟达、英特尔、AMD、联发科均为SerDes高端玩家,Synopsys、Cadence、Alphawave是重要IP供应商 [8] - 英伟达的NvLink技术从第一代(160GB/s带宽)迭代至第五代,分化为短距离(NVLink C2C)和长距离(NVLink5)SerDes [9] - 英特尔2013年展示224G PAM4 SerDes,支持0.1米至0.25米连接距离,其收购的V Semiconductor与Alphawave创始人有关 [10][11] - AMD的Infinity Fabric依赖SerDes实现低延迟连接,分为封装内(IFOP)和封装间(IFIS)两种类型 [11] - 联发科推出224G SerDes,覆盖56G至112G ASIC解决方案 [12] 高通收购Alphawave的战略意义 - Alphawave是全球第四大IP公司,收入7年内从0增长至2.7亿美元,拥有224G PAM4 SerDes等产品 [8] - 收购补强高通在数据中心领域的连接能力,结合Oryon CPU和Hexagon NPU,瞄准AI推理和定制CPU需求 [12] - Alphawave的UCIe IP子系统(台积电N2工艺)为高通布局Chiplet未来提供支持 [13] 行业竞争趋势 - 高通通过收购切入数据中心市场,将与英伟达、英特尔、AMD等传统巨头直接竞争 [15] - Arm同样有意通过SerDes技术进入芯片市场,行业竞争加剧 [13][15] - 初创公司在大芯片领域的机会逐渐减少 [15]
大芯片,巨变!
半导体行业观察· 2025-06-10 09:18
大芯片市场格局变化 - 大芯片市场过去由英特尔、AMD和IBM主导,但近年来英伟达凭借GPU优势实现反超,Arm也找到切入机会 [1] - 高通收购SerDes供应商Alphawave后,大芯片市场格局发生重大变化 [1][7] SerDes技术的重要性 - SerDes是数据中心通信的关键技术,用于芯片间高速串行通信,取代并行链路 [3] - 20世纪90年代末至21世纪初,SerDes速率从OC-24(2488.32Mbps)发展到10Gbps,并广泛应用于PCB和背板通信 [3] - 现代FinFET技术中,基于DSP的SerDes架构成为主流,支持PAM4调制,使数据吞吐量翻倍 [4][5] - SerDes技术支撑数据中心和消费电子产品的数字通信标准,是异质芯片市场的关键需求 [6] 芯片巨头在SerDes领域的竞争 - 博通、Marvell、英伟达、英特尔、AMD和联发科均为SerDes市场的高端玩家 [8] - 英伟达的NvLink技术从第一代(160GB/s双向带宽)迭代至第五代,支持200G SerDes,并开放IP授权 [9][10] - 英特尔在2013年展示224G PAM4 SerDes,支持短距离和中距离连接,并曾收购与Alphawave创始人相关的公司 [10][11] - AMD的Infinity Fabric依赖高性能SerDes,支持封装内和封装间通信 [12] - 联发科展示224G SerDes,扩展其ASIC产品组合 [13] 高通收购Alphawave的战略意义 - Alphawave是全球第四大IP公司,收入从0增长至2.7亿美元,拥有224G PAM4 SerDes技术 [8] - 收购Alphawave补强高通在数据中心市场的连接能力,与Oryon CPU和Hexagon NPU形成协同 [13] - Alphawave的Chiplet和UCIe IP技术(支持36G die-to-die速率)为高通布局未来异构计算提供优势 [14] 行业竞争格局展望 - 高通通过收购切入数据中心市场,将成为英伟达、英特尔和AMD的有力竞争对手 [16] - Arm也在积极布局芯片领域,进一步加剧市场竞争 [14][16] - 大芯片市场对初创公司的机会逐渐减少 [16]