Workflow
超节点
icon
搜索文档
东兴证券晨报-20260206
东兴证券· 2026-02-06 17:09
报告核心观点 - 报告的核心观点围绕三个主要行业展开:铷铯行业、农林牧渔行业以及AI算力网络行业 [7][17][21] - 在铷铯行业,报告认为钙钛矿电池渗透率提升及太空光伏发展将推动铷盐市场进入结构性扩张新周期,原材料供应商的成长弹性有望与行业扩张共振 [7][16] - 在农林牧渔行业,报告解读2026年中央一号文件,认为政策强调提升农业综合生产能力,并强化生猪产能综合调控,这将加速产能去化,建议左侧布局 [17][18] - 在AI算力网络行业,报告分析了英伟达在超节点与Scale up网络中的领先优势,并指出全球竞争格局未定,中国厂商参与度高 [21][26] 经济与行业政策要闻总结 - 海南自由贸易港对岛内居民消费的进境商品实施“零关税”政策,免税额度为每人每年1万元,首批5家免税店于2月11日在海口、三亚、儋州开业 [1] - 工信部等八部门联合印发《中药工业高质量发展实施方案(2026—2030年)》,目标到2030年培育60个高标准中药原料生产基地,建设5个中药工业守正创新中心,新培育10个中成药大品种 [1] - 商务部数据显示,2025年我国服务进出口总额同比增长7.4%,知识密集型服务进出口30879.5亿元,同比增长6.6% [1] - 国家网信办等11部门发布《关于提升境外人员入境数字化服务便利性的实施意见》,目标到2030年入境数字化服务达到国际领先水平 [1][4] - 2026年1月份全球制造业PMI为51%,较上月上升1.5个百分点,结束连续10个月50%以下的运行趋势 [4] - 工信部发布通知,将组织开展国家算力互联互通节点建设,以提高公共算力资源使用效率 [4] - 中国光伏行业协会预计2026年中国光伏新增装机规模将回落至180GW至240GW,“十五五”期间年均光伏新增装机量为238GW至287GW [5] 重要公司动态总结 - 美团以约7.17亿美元(约合50亿元人民币)的初始对价,完成对叮咚买菜中国业务100%股权的收购 [5] - 国轩高科计划定增募资50亿元,用于扩大新能源电池产能,相关项目总投资额超140亿元,包括年产20GWh动力电池等项目 [5] - 南矿集团拟以3000万美元现金认购鹰谷黄金新发行的普通股,交易完成后将持有鹰谷黄金10%股权 [6] - 牧原股份2026年1月销售商品猪700.9万头,同比增长2.73%;商品猪销售均价12.57元/公斤,同比下降16.92%;商品猪销售收入105.66亿元,同比下降11.93% [6] - 百度宣布启动新一轮股票回购计划,拟动用不超过50亿美元资金回购公司普通股,有效期至2028年12月31日 [6] 铷铯行业深度研究总结 - 钙钛矿太阳能电池具有低成本、高效率、轻量化、可弯曲、高效的弱光特性等多重优势,相较传统晶硅电池优势明显 [7] - 稳定性是制约钙钛矿电池产业化的主要因素,其目前实际稳定寿命仅为3—5年,而晶硅电池可达20年以上 [8] - 铷铯盐作为钙钛矿电池A离子的添加材料,可显著提升电池性能与稳定性,或成为钙钛矿量产的关键因子 [8] - 预计2025年中国钙钛矿电池新增产能约为4GW,在光伏电池市场中的渗透率约为1.3% [9] - 在地面光伏场景中,钙钛矿电池渗透率或由2025年的1.3%升至2030年的30% [9][12] - 柔性钙钛矿电池可应用于建筑一体化、可穿戴设备、车载发电等领域,截至2025年其效率已可达25%以上,远高于其他主流柔性太阳能电池 [10] - 钙钛矿电池或成为光伏建筑一体化领域的主流选择,预计2026-2031年间全球BIPV市场规模或由166.6亿美元升至470.2亿美元,期间CAGR或达23.06% [11] - 预计2025-2030年间,中国钙钛矿电池新增产能或由4GW升至161GW,期间CAGR达109% [12] - 每GW钙钛矿电池消耗铷铯盐约为20—25吨,预计2025-2030年间,地面光伏应用场景中全球铷盐需求量或由37吨升至1696吨,期间CAGR或达115% [12] - 钙钛矿电池由于其理论效率更高、重量更轻、成本更低(砷化镓的1/10),被普遍认为是太空光伏的长期发展方向 [13] - SpaceX计划在2029年以后每年建设100GW太空光伏,用于支持其计划发射多达100万颗星链V3卫星以构建“轨道数据中心” [14] - 结合商业航天和太空算力规划,预计2026-2030年间全球铷盐需求或由146.7吨升至2065.7吨,期间CAGR或达94% [15][16] - 鉴于铷铯行业供给端的强刚性化特征,行业需求曲线的显著右移将推动商品定价重心的持续性上移 [16] - 报告推荐公司:金银河、中矿资源 [16] 农林牧渔行业政策点评总结 - 2026年中央一号文件提出要提升农业综合生产能力和质量效益,推动粮食品种培优和品质提升 [17][18] - 文件强调要强化生猪产能综合调控,促进供求平衡,政策调控呈现精细化和全面性 [18] - 报告判断,在政策调控趋严和2026年上半年行业亏损累积下,生猪产能去化有望加速,建议左侧布局生猪养殖板块,重点推荐牧原股份 [18] - 文件指出要深入实施种业振兴行动,推进生物育种产业化,预计2026年生物育种的商业化推广面积将进一步扩大,推荐隆平高科、大北农 [19] - 文件强调要促进人工智能与农业发展相结合,拓展无人机、物联网、机器人等应用场景,预计智慧农业落地步伐将持续加快 [19] AI算力网络(超节点)专题研究总结 - 大语言模型参数规模向万亿级演进,跨服务器张量并行和专家并行成为必然,对网络带宽与延迟要求严苛,推动Scale up网络成为主流技术路径 [21] - 英伟达已推出GH200NVL72、GB200/GB300NVL72、VR200NVL72三代超节点方案 [21][23] - GB200NVL72将Scale-up规模稳定在72个GPU/机柜,形成标准化方案 [22] - 2026年发布的Rubin架构VR200NVL72,其NVLink6 Switch实现单GPU互连带宽提升至3.6TB/s,上代为1.8TB/s [23] - 根据大摩预测,2025年英伟达GB200/300NVL72出货量约2800台 [23] - 英伟达计划推出VeraRubin NVL144和Rubin Ultra NVL576,互联GPU数将从72颗向576颗发展 [23] - 英伟达超节点的优势建立在NVLink和NVLink Switch技术上,NVLink5 Switch支持单GPU到GPU带宽1800GB/s,可构建72GPU的NVLink域,总带宽达130TB/s [24] - 报告认为,Scale up网络的发展空间可能限制英伟达的领先优势,实现Scale up网络和Scale out网络融合或将成为其新的发展趋势 [25] - 全球超节点竞争格局尚未确立,除英伟达、华为、AMD等芯片公司外,微软、Meta、亚马逊及中国的阿里巴巴、腾讯、中科曙光等厂商均已加入竞争 [26] - 投资策略建议关注英伟达超节点供应链(如PCB背板、高速铜缆、光模块等)、发布国产超节点的中国厂商以及国内交换机供应商和芯片研发商 [26]
东兴证券:全球超节点竞争格局尚未确立 建议关注发布国产超节点云厂商等
智通财经网· 2026-02-05 14:20
文章核心观点 - 自2025年开始,超节点成为AI算力网络重要的技术创新方向,AI芯片厂商的竞争从芯片算力性能延伸至芯片与Scale up网络的双战场 [1] - 全球超节点竞争格局尚未确立,英伟达目前处于领先地位,但越来越多厂商加入竞争 [1][5] - 基于交换机及芯片是Scale up网络互联的关键设备,建议关注国内交换机供应商以及交换机芯片研发商 [1][6] 英伟达超节点技术演进与方案 - **Hopper架构开启初步探索**:GH200通过NVLink和NVLink-C2C技术,实现GPU与CPU内存统一编址 [1] - **Blackwell架构推动标准化**:GB200 NVL72将Scale-up规模稳定在72个GPU/机柜,形成可复制标准化方案,由18个Compute Tray和9个Switch Tray构成,通过NVLink5私有协议与铜线缆实现满带宽全连接 [2] - **Rubin架构实现带宽倍增**:VR200 NVL72的NVLink 6 Switch将单GPU互连带宽提升至3.6 TB/s(上代为1.8TB/s),Spectrum-6交换机支持CPO技术,集成32个1.6Tb/s硅光光学引擎 [2] - **未来规划持续扩展**:2026-2027年计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数将从72颗向576颗发展,并在Kyber机架架构中引入NVLink Switch Blade替代传统5000+根有源铜缆 [3] 英伟达的市场地位与优势 - **推出成熟方案并领先**:2024-2025年陆续推出GH200 NVL72、GB200/GB300 NVL72等成熟超节点解决方案 [3] - **出货量预测**:根据大摩预测,2025年英伟达GB200/300 NVL72出货量约2800台 [3] - **技术优势基础**:优势建立在NVLink和NVLink Switch上,NVLink 5 Switch支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向) [4] - **面临潜在挑战**:Scale up网络的发展空间可能受降低TP与EP规模的技术方案影响,为保持领先,实现Scale up网络和Scale out网络融合或成为新的发展趋势 [4] 超节点领域的竞争格局与参与者 - **竞争延伸至双战场**:AI芯片厂商竞争从芯片算力性能延续至芯片+Scale up网络 [1][5] - **参与者广泛增加**:除英伟达、华为、AMD、谷歌外,更多厂商加入竞争,包括微软、Meta、Amazon、中国移动、阿里巴巴、腾讯、百度、中科曙光、中兴通讯、浪潮信息、紫光股份(新华三)、沐曦股份、恒为科技等 [5] - **格局未定与国内机会**:全球竞争格局尚未确立,中国厂商参与度高,或有国内厂商在超节点领域取得领先优势 [6] 投资关注方向 - **关注英伟达供应链**:包括PCB背板、高速铜缆、光模块、供电与液冷系统等 [6] - **关注国内领先厂商**:建议关注发布国产超节点的云厂商、通信设备厂商与芯片厂商 [6] - **关注关键网络设备**:基于交换机及芯片是Scale up网络互联的关键设备,建议关注国内交换机供应商以及交换机芯片研发商 [1][6]
超节点与Scaleup网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink3
东兴证券· 2026-02-05 10:28
报告行业投资评级 - 看好/维持 [2] 报告的核心观点 - 大语言模型参数规模向万亿级演进,驱动对超高带宽、超低延迟Scale up网络的需求,超节点成为AI算力网络重要的技术创新方向 [4][9] - 英伟达在超节点方案上处于领先优势,其优势建立在自研的NVLink和NVLink Switch技术上 [5][6] - 全球超节点竞争格局尚未确立,除传统芯片厂商外,更多云厂商、通信设备商等加入竞争,建议关注英伟达供应链及国内相关厂商 [9] 根据相关目录分别进行总结 1. LLM训练要求高带宽与延迟,驱动超节点成为AI算力网络创新方向 - 大语言模型参数规模从千亿级向万亿乃至十万亿级演进,跨服务器张量并行和混合专家模型中的专家并行成为必然,对网络带宽与延迟要求极为严苛 [4][18] - 为满足需求,构建超高带宽、超低延迟的Scale up网络成为业界主流技术路径 [4][18] - Scale up网络特点:算力规模为数十卡至千卡级、资源利用率80%以上、通信延迟百纳秒级、支持统一内存访问、但定制化程度高 [20][22] - 超节点主要由计算节点、交换节点和Scale-up网络互联构成,其互联方案直接影响系统关键指标,目前主流有铜缆和光纤两类方案 [23][26] 2. 英伟达:超节点领先优势建立在NVLink和NVLink Switch 2.1 Scale up网络核心技术:NVLink与NVLink交换机 - NVLink与NVLink交换机是英伟达构建单机柜Scale up网络的核心技术组合,二者协同演进 [33] - 截至2025年,NVLink 5 Switch支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向) [6][34] - 2026年发布的第六代NVLink交换机支持的GPU-to-GPU通信带宽提升至3.6TB/s,在VR NVL72系统中提供260TB/s聚合带宽 [33][34] - NVLink采用差分信号传输、SerDes模块、网状拓扑、流量调度信用机制、多Lane绑定、统一内存空间等一系列先进技术 [6][35] - NVSwitch作为专门交换芯片,采用多阶Clos网络架构,实现多GPU高速全互联,解决了点对点连接复杂度高的问题 [39] 2.2 GB200 NVL72超节点:铜缆互联,总交换容量129.6TB/s - GB200 NVL72将Scale-up规模稳定在72个GPU/机柜,形成可复制的标准化方案 [7][43] - 节点由18个计算托架和9个交换托架构成,通过“NVLink5私有协议+铜线缆”实现全连接 [7] - 提供180 PFLOPS的TF32 Tensor Core算力,总内存容量13.4TB,内存带宽576TB/s,Scale up带宽64800单向GB/s [47][48] - 单颗NVSwitch5芯片交换容量为7.2TB/s,18颗芯片总交换容量129.6TB/s [54] - 主要采用直连铜缆互联,共需约5184根铜缆,机柜功耗145KW [48][68] 2.3 VR200 NVL72超节点:延续GB200工程技艺,总交换容量翻倍 - 2026年发布的新一代VR200 NVL72属于连续性创新,计算节点仍为72 GPU与36 CPU [46][70] - 交换节点配置36颗第六代NVSwitch芯片,数量相比GB200 NVL72翻倍,单芯片交换容量保持7.2TB/s [72] - 总交换容量提升至259.2TB/s,相比GB200 NVL72翻倍 [75] - CPU-GPU互联带宽提升至1.8TB/s,相比上代900GB/s提升一倍 [75] - 延续铜缆互联方案,但用中板取代部分线缆,且因SerDes速率升级,单连接所需铜缆由4根减为2根 [81] 2.4 总结:处于领先优势,互联GPU数将从72颗进一步向576颗发展 - 英伟达已推出GH200 NVL72、GB200/GB300 NVL72、VR200 NVL72三代超节点,处于行业领先地位 [5][43] - 根据大摩预测,2025年英伟达GB200/300 NVL72出货量约2800台 [5] - 展望2026-2027年,计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数将从72颗向576颗发展 [5][85] - 未来将在Kyber机架中引入NVLink Switch Blade,通过PCB中板替代传统5000+根有源铜缆 [5][85] - 报告指出,AI产业在探索降低张量并行与专家并行规模的技术方案,这可能限制Scale up网络的发展空间及英伟达的领先优势,未来Scale up与Scale out网络融合或是发展趋势 [8][86] 3. 投资建议 - 自2025年开始,超节点成为AI算力网络重要的技术创新方向,竞争从芯片算力延伸至“芯片+Scale up网络” [9] - 全球参与厂商众多,包括英伟达、华为、AMD、谷歌、微软、Meta、Amazon及中国移动、阿里巴巴、腾讯、百度、中科曙光、中兴通讯、浪潮信息、紫光股份、沐曦股份、恒为科技等 [9] - 投资建议关注三个方向:1) 英伟达超节点供应链,包括PCB背板、高速铜缆、光模块、供电与液冷系统等;2) 发布国产超节点的国内云厂商、通信设备厂商与芯片厂商;3) 国内交换机供应商及交换机芯片研发商 [9][97]
海光信息-澜起科技-网宿科技
2026-02-02 10:22
涉及的行业与公司 * **行业**:AI算力产业链、云计算与CDN、半导体与芯片设计、服务器与数据中心 * **公司**:海光信息、澜起科技、网宿科技、鼎通科技、中科曙光、曙光数创、飞荣达、英维克、工业富联、税友股份、科大讯飞[1][2][13] 核心观点与论据 一、 市场趋势与资本开支 * **北美资本开支高增长**:北美五大云服务提供商(CSP)2026年资本开支预计接近**7,000亿美元**,较2025年的**4,000亿美元**增长**50%**,主要基于Meta和微软的超预期数据[1][4] * **国内资本开支先抑后扬**:受H20/H200影响,2025年国内互联网资本开支放缓,但预计2026年有望达到**5,700-6,000亿人民币**[1][4] * **2027年增长潜力**:预计2027年北美资本开支仍保持**40%左右**增长,而国内因AI推理应用深化,增速有望超越海外[1][4] 二、 AI需求侧变化 * **AI推理需求爆发**:MudBot等Agent应用推动多线程任务管理和人机交互,导致流量、数据及算力消耗**指数级增长**[1][5] * **流量结构转变**:流量从人为主转向机器人主导,实现**24小时不间断**使用,一次可使用数百款APP[1][5] 三、 AI供给侧技术进展 * **服务器架构演进**:未来超级节点(超节点)技术将内存池化、高速互联并统一协议与IP,显著提高集群效率[6] * **技术普及趋势**:随着超级点技术普及和对推理性能要求提高,该技术将成为时代主要趋势[6] 四、 海光信息 * **产品进展**:深算3号已量产,支持**FP8/FP4**精度;深算4号性能预计翻倍,有望成国内最强单卡AI芯片[3][7] * **CPU性能提升**:海光4号新版本核数突破**128核**甚至达到**160核**,多线程数量增加,大幅提升AI推理效率[7] * **供应链优势与估值**:基于国产供应链进行规模化量产,在国家级重大项目中具有优势[7];其CPU估值为**9,000亿人民币**,GPU估值为**1.3万亿人民币**[3][7] * **市值预期**:2026年市值目标为**1.2万亿**,2028年预计达到**2万亿以上**[8] 五、 澜起科技 * **业务布局**:内存互联芯片(占总收入**90%**)、PCIe CXL芯片(**5%**)、与CPU和服务器相关的产品(**5%**)[10] * **技术领先与增长点**:在CXL领域取得显著进展,2022年5月发布全球首款CXL MXC芯片[10];其CXL芯片有望被谷歌下一代TPU采用,带来巨大增量市场[1][10] * **产品单价提升潜力**:PCIe Retimer和Switch产品有望显著提高单价,特别是Switch单价可能从**50美元**提升至**1,200美元**,增幅接近**20倍**[10] 六、 网宿科技 * **市场地位**:中国最大的第三方中立CDN公司,CDN业务占收入约**60%至70%**[11] * **行业机遇**:受益于谷歌云CDN涨价(北美地区价格上涨近**一倍**),预示海外市场CDN和云计算价格战趋势反转,大厂战略调整将为传统CDN厂商带来市场份额和盈利机会[1][2] * **业绩与估值潜力**:预计2026年净利润达**10亿元**,若考虑涨价因素,利润弹性极大[3][12];目前市值接近**400亿元**,若估值达30倍PE或更高,估值空间至少有**50%以上**增长潜力[12] 其他重要内容 * **近期市场表现**:2026年第一季度,海光信息市值涨幅超过**900亿元**,成为1月市值绝对值涨幅领先的A股公司;澜起科技自2025年11月20日发布深度报告以来,涨幅超过**60%**[2] * **潜在涨价压力**:自2025年底以来英特尔与AMD不断提示涨价,随着需求回升,本土AI芯片可能面临涨价压力[7] * **产业链相关公司**:除核心三家公司外,还提及鼎通科技、中科曙光、曙光数创、飞荣达、英维克、工业富联,以及应用厂商税友股份和科大讯飞值得关注[13]
超节点:光、液冷、供电、芯片的全面升级
开源证券· 2026-01-28 19:15
行业投资评级 - 投资评级:看好(维持)[2] 报告核心观点 - 超节点(SuperPod)是AI算力基础设施发展的必然趋势,旨在通过网络互联将多个分离的算力芯片整合成逻辑上的“超大型GPU/ASIC”,以突破单一服务器在效率和可靠性上的瓶颈[4] - 超节点架构新增了Scale Up互联需求,将带动光通信、液冷、供电、芯片等多个环节的全面升级[5] - 超节点技术有助于弥补国产芯片在单卡算力上的差距,通过集群化方式提升整体性能,助力国产AI生态发展[6] - 伴随AI训练和推理算力需求持续增长,超节点产业链有望长期受益,报告看好“网络端+AIDC+计算端”三条核心方向,以及“光+液冷+供电+芯片”四大赛道[7] 模型发展与超节点时代背景 - AI模型加速迭代,参数量从千亿级迈向万亿级(例如Qwen3-Max超过1T,文心5.0达2.4T),训练数据量达EB级,对千卡、万卡算力集群需求迫切[14] - 模型训练算力需求已达到十万亿兆量级,且仍以每年4.1倍的速度快速增长[14] - Scaling Law从预训练泛化至后训练和逻辑推理全流程,模型性能随思考次数增长而提高,进一步推高算力需求[15] - 算力集群扩张方式主要为Scale Up(纵向扩展)和Scale Out(横向扩展)两个维度,超节点是集群的最小单元[17] - 基础设施从单卡、八卡模组迈入超节点服务器集群阶段,以应对万亿参数大模型(如GPT4 1.8T需超10TB显存)的训练需求[23] 超节点技术架构与互联协议 - 构造超节点的核心在于更大的节点内互联,硬件与软件协议需互相适配整合[39] - Scale Up组网架构主要包括:Fat-tree胖树拓扑、Mesh类拓扑、Torus拓扑等[41] - **胖树架构示例**:英伟达GB200 NVL72采用一层胖树架构,通过9个NVlink Switch tray连接72个GPU,形成总带宽130TB/s的全mesh网络[41] - **Mesh类架构示例**:AMD MI350采用Infinity Fabric实现8节点Fullmesh互联;华为柜内64个NPU采用2Dfullmesh互联[54] - **Torus拓扑示例**:谷歌TPU采用2D/3D Torus架构,TPU v7支持9216颗芯片集群[59] - Scale Up互联协议正从大厂私有走向开源开放,主要协议包括:[61] - **NVLink**:从P100的160GB/s迭代至B200的1.8TB/s,单卡带宽年复合增长率超60%,并于2025年推出开放生态策略[61][62] - **UAlink**:由AMD、AWS、谷歌等公司发起的开放式互连标准,UALink 1.0支持每通道最高200 GT/s[63] - **SUE(Scale Up Ethernet)**:博通发布的框架,旨在将以太网引入AI系统内部Scale Up领域,其Tomahawk Ultra芯片在51.2 Tbps吞吐量下实现250ns低交换延迟[67][68] - **UB(UnifiedBus)**:华为的灵衢协议,支持百ns~us级低时延,并可通过UBoE与以太网融合组网[72] - **HSL**:海光发布的系统总线互联协议1.0规范[77] - **OISA**:中国移动携手48家单位发布的协议,OISA 2.0支持1024张AI芯片,带宽突破TB/s级,时延缩短至数百纳秒[77] 超节点架构带来的产业链升级机会 - 超节点服务器Rack主要由计算节点、交换节点、TOR交换机、供电单元、供电母线、液冷散热配套等单元组成[80] - 随着渗透率增长,将持续拉动以下板块需求:[5][80] - **计算与交换**:算力卡、交换芯片、交换机 - **光通信**:光模块、光芯片 - **供电**:高功率电源、高压UPS/HVDC - **散热**:服务器液冷散热(液冷占比80%以上,未来向全液冷发展) - **其他**:铜缆、PCB - **以国产ETH-X超节点方案为例**:[84][90][94][96] - **计算节点(Computer tray)**:包含GPU、CPU、PCIe Switch等,采用风液混合散热 - **交换节点(Switch tray)**:提供柜内GPU全带宽Scale Up互连,交换芯片搭配液冷冷板 - **供电**:机柜最大功耗支持132KW,采用Busbar供电,支持N+2冗余 - **制冷**:以液冷为主,风冷为辅,需搭配冷板模组、快接头、CDU等 国产超节点发展案例与性能对比 - **华为Atlas 900 A3 SuperPoD(CloudMatrix 384)**:[98] - 由192颗鲲鹏CPU和384颗昇腾910C芯片通过UB网络互联而成 - 单个系统包含12个计算柜和4个互联柜 - 昇腾910C芯片采用双die共封装,片上互联带宽540 GB/s,内存带宽3.2 TB/s[100] - **性能对比**:尽管单颗昇腾910C芯片的BF16性能仅为英伟达GB200模组的1/3,但单个CloudMatrix 384集群的总体BF16性能是英伟达NVL72的1.7倍,总内存容量为后者3.6倍,总内存带宽为后者2.1倍[6][112] - **部署进展**:截至2025年9月,Atlas 900 A3 SuperPoD已累计部署超300套,服务超20位客户[6] - **规模扩大**:华为后续发布Atlas 950和Atlas 960 SuperCluster,算力规模分别超过50万卡和达到百万卡[113] - Atlas 950支持8192张昇腾950DT芯片,FP8算力达8EFlops,内存容量1152 TB,互联带宽16.3 PB/s - 相比英伟达计划中的NVL144,Atlas 950总算力是其6.7倍,内存容量是其15倍,互联带宽是其62倍[113] 投资建议与关注标的 - 报告看好“网络端+AIDC+计算端”三条核心方向,以及“光+液冷+供电+芯片”四大赛道[7] - **具体推荐标的包括**:[7][116][117] - **光模块&光芯片**:中际旭创、新易盛、华工科技、源杰科技 - **液冷**:英维克 - **服务器电源**:欧陆通 - **交换芯片**:盛科通信-U、中兴通讯、紫光股份 - **AIDC(数据中心)**:大位科技、光环新网、奥飞数据、新意网集团 - **部分公司业务介绍**: - **盛科通信**:产品覆盖100Gbps~25.6Tbps交换容量,是国内稀缺的商用交换机芯片龙头[121] - **中兴通讯**:推出搭配自研凌云AI交换芯片的超节点系统,并联合合作伙伴推出国内首个光互连光交换GPU超节点[124] - **锐捷网络**:已展示ETH128超节点产品,并与两家GPU厂商完成适配测试[125] - **紫光股份**:其UniPoD S80000超节点支持64卡柜内全互联,相比传统8卡服务器,卡间互联带宽提升8倍,单卡推理效率提升80%[127] - **浪潮信息**:发布“元脑SD200”超节点AI服务器,在单机内实现64路GPU高速互连,显存地址空间扩增8倍[130]
华勤技术:公司坚信合作共赢的力量
证券日报· 2026-01-16 18:47
公司研发投入与财务表现 - 公司2025年前三季度研发费用合计46.20亿元,同比增长23.7% [2] - 公司预计2025年全年研发投入将超过60亿元人民币 [2] 公司产品与技术布局 - 公司研发投入主要围绕“3+N+3”的产品布局以及支撑业务增长的需要 [2] - 公司通过X-lab研发实验室在声学、光学、热学、射频等领域进行前瞻性研发预研 [2] - 公司针对AI端侧、超节点、汽车电子等新技术和新产品方向持续增加研发资源 [2] 公司近期业务动态与合作 - 公司在CES展期间举办了智能产品技术展,向全球客户展示了在消费电子、汽车电子、PC、AIoT领域的核心技术突破 [2] - 公司在光学、射频、天线等领域展示了先进技术和解决方案 [2] - 公司与英伟达联合推进基于Drive Thor平台的高阶智驾合作方案 [2] - 公司始终与产业链上下游合作伙伴保持紧密合作,共同探索智能硬件解决方案 [2]
国产AI芯片:推理赛道起飞,谁能再破寒武纪神话?
南方都市报· 2026-01-08 07:14
文章核心观点 2025年,在DeepSeek模型引爆AI应用与算力需求的背景下,国产AI芯片行业迎来关键转折,国产替代进程显著加速,多家头部厂商成功登陆资本市场,但在市场份额、盈利能力、供应链安全及软件生态等方面仍面临挑战,行业未来将在推理侧、超节点技术及本土供应链发展中寻找突破机会 [2][3][15] 趋势1:DeepSeek引爆国产替代,推理赛道机遇显现 - **DeepSeek模型成为关键催化剂**:2025年年初DeepSeek的横空出世及其模型V3.1的发布,引爆了AI应用侧需求,推动算力需求从训练转向推理,并深度适配国产芯片(如支持“UE8M0 FP8”格式),显著提振了市场对国产芯片厂商的投资热情 [2][3] - **推理芯片市场进入爆发式增长**:随着开源大模型成熟与终端应用落地,AI推理芯片行业正进入爆发阶段,2024年中国AI推理芯片相关市场规模为1626亿元,预计2025年将增长至3106亿元,国内聚焦推理的代表厂商包括华为、寒武纪和沐曦股份 [3] - **国产替代率预期大幅提升**:壁仞科技预计,国内企业在**中国智能计算芯片市场**的份额将从2024年的约20%增加至2029年的约60%;天数智芯数据显示,**通用GPU市场**国产化率从2022年的2%提升至2024年的3.6%,并预计2029年将超50% [4] - **边缘AI推理被视为潜力方向**:在DeepSeek效应推动下,国内AI供应商正积极拓展云服务ChatBOT应用、与互联网业务整合以及边缘AI推理(如自动驾驶)等服务,其中各应用领域的边缘AI推理被认为较具发展潜力 [4] 趋势2:国产AI芯片厂商集体冲击上市,但市占率与盈利仍待突破 - **多家厂商成功登陆科创板**:2025年底,摩尔线程作为“国产GPU第一股”登陆科创板,上市首日高开468.78%,报650元/股,开盘市值超3000亿元;沐曦股份作为“第二股”紧随其后,上市首日高开568.83%,报700元/股,市值超2800亿元 [5] - **更多厂商筹备上市**:燧原科技(ASIC架构)于2025年初完成上市辅导,瀚博半导体在2025年底完成上市辅导;壁仞科技、天数智芯及百度旗下昆仑芯均计划于2026年在港交所上市 [5][6] - **当前市场份额高度集中且国产占比低**:2024年**中国AI加速器市场**中,英伟达市占率约66%,华为海思约23%,AMD约5%,而寒武纪、摩尔线程、沐曦股份均仅占约1%;天数智芯2024年在**中国通用GPU市场**份额为0.3%,壁仞科技预计2025年占约0.2% [6] - **未来市场份额格局或生变**:Bernstein Research预测,到2026年,英伟达在中国AI芯片市场的份额将显著萎缩至8%,华为将占据50%,AMD预计以12%列第二,寒武纪或将排第三 [7] - **多数厂商尚未实现盈利**:2022年至2025年前三季度,摩尔线程累计净亏损超59亿元,沐曦股份累计净亏损超34亿元;2022年至2025年上半年,壁仞科技累计净亏损超63亿元,天数智芯累计净亏损超28亿元;寒武纪于2024年第四季度才开始盈利,2025年前三季度盈利16.05亿元 [7] - **客户集中度风险高企**:多家GPU厂商前五大客户收入占比极高,摩尔线程2024年该占比高达98.16%,沐曦股份2025年一季度达88.35%,壁仞科技自2023年营收后该占比维持在九成以上,且前五大客户并不稳定 [8] 趋势3:英伟达开启“反击战”,H200获批带来新变数 - **英伟达在华遭遇多重挑战**:2025年受DeepSeek冲击股价下跌,其专为中国设计的H20芯片在4月被美列入限制出口名单,导致英伟达市值蒸发1600亿美元;7月因芯片安全问题被国家网信办约谈;9月其CEO黄仁勋称英伟达在中国的市场份额从95%降到0% [9] - **H200年底获批准对华出售**:2025年12月,特朗普政府突然批准英伟达向中国出售H200 AI芯片,其性能据称是H20的6倍以上,但较其最新的Blackwell芯片仍有差距;国内市场对此看法不一,目前国内尚未批准H200的采购订单 [10] - **CUDA生态构成长期竞争壁垒**:英伟达在全球拥有超过500万CUDA生态开发者,其软件生态是核心护城河;从CUDA迁移到国产平台需要较高的代码重写、调优和验证成本,是国产替代的最大障碍之一 [11] - **国产厂商采取不同生态策略**:为降低客户迁移成本,部分厂商选择兼容CUDA生态,如摩尔线程的MUSA架构和沐曦股份的MXMACA软件栈;华为则明确表示不兼容CUDA,致力于构建自主生态 [12] 趋势4:先进制程受限,超节点技术成突破口 - **先进制程受限影响性能**:国产GPU厂商主流采用7nm或14nm制程,而英伟达已进入4nm时代(如Blackwell芯片),7nm以下制程难产直接影响国产芯片的算力密度和能效比;2025年1月美国还采取了阻止14/16nm及以下先进制程芯片流入中国大陆的措施 [12] - **厂商切换国产供应链应对风险**:沐曦股份坦言在先进制程晶圆代工和HBM供应方面受到限制,并规划其曦云C600等后续产品采用国产供应链 [13] - **“超节点”技术成为重要发展方向**:通过集成大量芯片来绕开单芯片性能不足的问题,2025年4月华为发布基于昇腾910C的Cloud Matrix 384超节点,通过五倍数量的芯片抵消了单芯片性能仅为英伟达Blackwell三分之一的差距;随后曦智科技联合壁仞科技、中兴通讯推出光跃Light SphereX,阿里巴巴发布磐久128超节点,百度公布天池256和512超节点(后者支持512卡互联,可完成万亿参数模型训练) [13][14] 行业展望:2026年市场规模与机会方向 - **市场规模预期持续增长**:预计2026年国内AI芯片市场规模将突破3000亿元,国产芯片份额有望提升;在硬件参数差距日益缩减的背景下,软件生态和互联技术将随产业发展不断壮大 [15] - **高阶AI芯片国产化目标明确**:预期在政策推动下,2026年由本土领先业者带动,高阶AI芯片占比有机会向50%的目标迈进 [15] - **未来市场呈现两大发展方向**:一方面是云服务提供商自研ASIC芯片;另一方面是本土供应商(如华为、寒武纪、沐曦、摩尔线程等)提供解决方案;在本土上游供应链(晶圆、封装、HBM)供应相对有限的情况下,相对低阶规格的AI推理芯片将成为较大发展机会 [16]
液冷行业展望及新技术分享
2026-01-07 11:05
行业与公司 * 涉及的行业为数据中心液冷散热行业,核心讨论对象是英伟达(NVIDIA)及其发布的LoongArch系列产品(如N8 72、Ultra)的液冷方案,同时也涉及谷歌、Meta、AWS等海外云服务商以及中国液冷厂商、云服务商[1][2][6][8][10][11] * 纪要主要围绕高性能计算(尤其是AI计算)芯片的散热挑战展开,探讨了当前及未来的液冷技术方案、市场机遇与竞争格局[1][3][10] 核心观点与论据 **1 技术趋势与产品演进** * **全液冷与模块化成为明确趋势**:英伟达LoongArch N8 72版本实现了100%全液冷设计,完全取消机架风扇,并采用模块化设计(如“大人版模组”),简化了系统集成[2] * **功耗持续提升但热密度可控**:LoongArch N8 72功耗从传闻的1,800瓦提升至2,300瓦,但热密度仍维持在约100瓦/平方厘米,单相冷板目前足以应对[1][4] * **架构变革指向更高密度**:未来的LoongArch Ultra及配套机箱将从水平插拔改为竖直插拔,GPU密度将从72个大幅提升至576个,对系统布局和液冷方案提出全新挑战[1][6] * **新材料与新技术的应用与挑战**: * 软管材料从不锈钢波纹管替代传统的PDFE和EPDM橡胶软管,可能提高可靠性[2] * 微通道冷板(MLCP)等新技术通过缩短传导路径、增加换热面积来提升解热能力,但面临良率控制、堵塞风险和漏液防护等可靠性与可制造性问题,短期内难以大规模商用[1][5] **2 海内外市场与方案差异** * **海外市场以技术驱动**:海外ASIC芯片散热方案以液冷为主,通过增加物理超节点密度提升集群算力,例如Meta和AWS采用ALC方案,谷歌通过TensorFlow 10第五代CPU实现单机柜约80至100千瓦的功耗[1][8][9] * **国内市场以规模与需求驱动**: * 由于芯片制程受限,单卡性能不足,国内厂商倾向于通过规模化集群(超节点方案)来弥补算力差距,例如一个机柜可能需要3至4倍规模才能达到海外同类产品性能,这对液冷需求更为迫切[10] * 国内AI需求远超国产GPU供应能力,高端芯片短缺问题推动了超节点方向的发展[10] * 中国云服务商在东南亚部署数据中心,主要目的是为更方便获取高端硬件资源,并推进超节点形式的整体解决方案[3][11] **3 竞争关键与核心壁垒** * **系统化解决方案是竞争关键**:中国液冷厂商若要在海外市场取得突破,需提供从数据中心到机柜再到节点内的一体化、一站式解决方案,并通过收购或整合DPU模块、漏液检测等环节增强竞争力[3][13] * **核心壁垒在于系统设计与研发能力**: * CDU(中央分配单元)的核心壁垒在于系统设计能力,包括流量、压力、温度控制及各组件整合,未来趋势是液冷厂商自行研发关键组件以实现高度匹配[15][16] * 冷板模组的核心价值不仅在于生产能力,更在于前端研发能力,如流道设计需平衡流速和压降[14] 其他重要细节 **1 具体技术挑战与解决方案** * **高密度下的工程挑战**:为在尺寸变小下兼容更大流量,需优化管道布局(如改为水平布局)、确保焊接质量、并解决高流速下的均流性问题[7][18] * **散热技术储备**:各大液冷厂商在积累应对局部热点的技术,例如射流冷板[4] * **泵与材料的选择**:为规避漏液风险,大型云服务商(如谷歌)正从机械泵转向无需密封的磁力泵,电子泵应用尚不明确[20] * **材料可靠性考量**:需确保非金属材料在长期液体浸泡中不会老化,并防止高速冲刷导致变形、堵塞或产生死角[19][21] **2 供应链与生产** * 冷板模组生产包括机加工、焊接、热处理、测试等步骤,台厂常采购半成品进行后续集成,合作中检验标准与责任划分至关重要[14] **3 未来需求展望** * 未来单个机柜功耗可能达到180千瓦、200千瓦甚至300千瓦,需要在有限空间内进行系统优化,对解热能力提出更高要求[17] * 快接技术需应对更高密度堆积、确保均流性,并解决长期高速冲刷可能带来的死角、变形等问题[18][19]
国产AI芯片“觉醒”:推理赛道起飞,谁能再破寒武纪神话?
南方都市报· 2026-01-06 17:01
行业核心观点 - 2025年是国产AI芯片加速替代和寻求破局的关键一年,AI算力需求从训练转向推理,DeepSeek的崛起引爆了国产替代热情 [2] - 2026年,在本土领先业者带动下,高阶AI芯片占比有机会向50%的目标迈进,相对低阶规格的AI推理芯片将获得较大发展机会 [2][23] - 国产算力的突围路径不仅是“造芯”,更要“组局”,核心是构建跨厂商、跨技术的开放协同生态 [2][17] 市场趋势与需求变化 - **推理需求爆发**:随着AI应用侧大爆发和开源模型成熟,算力需求从训练转向推理,AI推理芯片行业进入爆发式增长阶段 [3][5] - **市场规模激增**:2024年中国AI推理芯片相关产品及服务市场规模为1626亿元,预计2025年将增长至3106亿元,增幅显著 [5] - **边缘AI潜力大**:在DeepSeek效应推动下,国内各应用领域的边缘AI推理(如自动驾驶)较具发展潜力 [5] - **国产替代预期强**:国内企业在中国智能计算芯片市场份额预计将从2024年的约20%增加至2029年的约60% [6] - **通用GPU国产化率提升**:国内通用GPU市场国产化率从2022年的2%提升至2024年的3.6%,预计2029年将超50% [6] - **2026年市场展望**:预计2026年国内AI芯片规模将突破3000亿元,国产芯片有望提升份额 [22] 主要厂商动态与资本市场表现 - **厂商集中上市**:2025年底,摩尔线程和沐曦股份先后登陆科创板,成为“国产GPU第一股”和“第二股” [2][7] - **上市首日表现**:摩尔线程上市首日高开468.78%,报650元/股,市值超3000亿元;沐曦股份上市首日高开568.83%,报700元/股,市值超2800亿元 [7] - **后续上市计划**:壁仞科技和天数智芯将于2026年初赴港上市;燧原科技、瀚博半导体完成上市辅导;百度昆仑芯以保密形式申请在港交所上市 [9] - **寒武纪股价表现**:在DeepSeek发布适配国产芯片的模型格式后,寒武纪应声大涨,股价一度超过贵州茅台,单月涨幅高达100% [3] 市场竞争格局与份额 - **当前市场高度集中**:2024年中国AI加速器市场中,英伟达市占率约66%,华为海思约23%,AMD约5%,寒武纪、摩尔线程、沐曦股份均约1% [9] - **其他厂商份额较低**:天数智芯2024年在中国通用GPU市场份额为0.3%;壁仞科技预计2025年占约0.2%的市场份额 [10] - **未来格局预测**:Bernstein Research预测,2026年英伟达在中国AI芯片市场份额将显著萎缩至8%,华为将占据50%,AMD预计以12%位列第二,寒武纪或将排名第三 [10] 公司财务与经营状况 - **普遍处于亏损状态**:多数国产AI芯片厂商尚未实现盈利,2022年至2025年期间净亏损持续 [12] - **具体亏损数据**: - 摩尔线程:2022年至2025年前三季度净亏损分别为18.94亿元、17.03亿元、16.18亿元及7.24亿元 [12] - 沐曦股份:同期净亏损分别为7.77亿元、8.71亿元、14.09亿元及3.46亿元 [12] - 壁仞科技:2022年至2025年上半年净亏损分别为14.74亿元、17.44亿元、15.38亿元及16.01亿元 [12] - 天数智芯:同期净亏损分别为5.54亿元、8.17亿元、8.92亿元及6.09亿元 [12] - **寒武纪开始盈利**:寒武纪在2024年第四季度才开始实现盈利,2025年前三季度已盈利16.05亿元 [12] - **客户集中度高**:主要厂商前五大客户收入占比普遍较高,是其经营风险 [13] - **具体客户集中度数据**: - 摩尔线程:2022年至2025年上半年,前五大客户收入占比维持在89%以上,2024年高达98.16% [13][15] - 沐曦股份:收入基本在七成以上,2025年一季度达88.35% [13][15] - 壁仞科技:自2023年营收后,前五大客户收入维持在九成以上 [14][15] - 天数智芯:2022年至2024年占比在70%以上,2025年上半年降至38.6% [14][15] 技术发展、生态与供应链挑战 - **软件生态兼容策略**:部分厂商选择兼容CUDA生态以降低客户迁移成本,如摩尔线程的MUSA架构和沐曦的MXMACA软件栈 [17] - **华为构建自主生态**:华为强调不兼容CUDA,致力于从长远构建自主生态 [17] - **先进制程受限**:国产GPU厂商主流采用7nm或14nm制程,而英伟达已进入4nm时代,7nm以下制程难产直接影响算力密度和能效比 [18] - **供应链切换**:为应对外部不确定性,沐曦股份规划其曦云C600等后续产品采用国产供应链 [18] - **超节点技术突破**:厂商通过“超节点”形式绕开单芯片性能不足的问题,成为重要技术路径 [19] - **超节点案例**: - 华为发布基于昇腾910C的Cloud Matrix 384超节点,通过五倍数量的芯片抵消单芯片性能差距 [19] - 曦智科技联合壁仞科技、中兴通讯推出光跃Light SphereX分布式光互连超节点解决方案 [21] - 阿里巴巴发布磐久128超节点;百度公布天池256和512超节点,后者最高支持512卡极速互联 [21] 外部环境与竞争变数 - **英伟达在华波折**:2025年,英伟达专为中国设计的H20芯片被列入限制出口名单,致其市值蒸发1600亿美元;H20芯片后被指出存在安全漏洞 [16] - **H200出口放行**:2025年12月,美国商务部宣布放行英伟达H200 AI芯片对华出口,但中国相关部门回应将继续严格审查并优先采用国产算力方案 [16]
港交所GPU第一股:壁仞科技今日挂牌,三年狂砸33亿研发筑牢技术底座
每日经济新闻· 2026-01-02 12:28
公司里程碑与市场地位 - 壁仞科技于1月2日正式登陆港交所,成为“港交所GPU第一股” [1] - 公司以“硬核”技术见长,是算力领域应用先进封装技术的先行者,在支持先进互连规格方面处于行业领先梯队 [1] - 公司致力于在万亿级的算力市场中构建中国自主的算力生态体系 [1] 核心技术优势:先进封装与互连 - 公司在国内率先将Chiplet技术应用于芯片设计,是应用先进封装的佼佼者 [1] - 公司联合合作伙伴实现了超节点(超级算力集群)Scale up路线的突破,而国内其他方案主要以Scale out为主 [2] - 2025年7月26日,公司联合曦智科技、中兴通讯申报的“分布式OCS全光互连芯片及超节点应用创新方案”斩获“SAIL”奖 [2] - OCS(光交换)技术相比机柜内部主流的铜缆互连,能缩短光电转换距离,降低信号延迟;相比机柜间连接的光模块,集成度更高,在稳定性和能耗方面更具优势 [2] - 基于GPGPU与光互连技术构建的南向超节点拥有开放性、易用性、先进性、性价比高、灵活性高等优势,能适应主流大模型需求并为未来训练开发提供支撑 [3] - 公司在应用OCS技术上已站在世界前沿 [4] 生态系统构建与产业合作 - 公司正加速构建自主可控的国产算力生态网 [4] - 硬件层面,已与浪潮、新华三、中兴通讯、联想、超聚变等国内主流服务器厂商完成产品适配,并实现对海光国产CPU的支持 [4] - 软件层面,产品已全面兼容PyTorch、DeepSpeed/vLLM、百度飞桨等主流AI框架,以及麒麟、统信等国产操作系统,实现了从底层硬件到上层应用的全栈打通 [4] - 公司积极推动“算力-模型-应用”的闭环落地 [4] - 在具身智能领域,2024年12月与大晓机器人签署战略协议,共建全栈国产化软硬一体基础设施 [5] - 在数据中心基建方面,2025年8月携手科华数据、神州数码,构建了“芯片-服务器-数据中心-算力服务”四位一体的产业生态闭环 [5] - 面对算力多元异构痛点,公司与中国移动、中国电信、中国联通三大运营商建立深度合作,致力于解决“算力孤岛”难题 [5] 研发投入与行业背景 - 2022年至2024年及2025年上半年,公司研发开支分别为10.18亿元、8.86亿元、8.27亿元及5.72亿元 [5] - 上述期间研发开支占总经营开支的比例分别为79.8%、76.4%、73.7%及79.1% [5] - 三年一期累计研发开支达到33.02亿元 [5] - 国内算力厂商在单卡性能上与国际厂商存在差距,为“弯道超车”,国内厂商纷纷推出超节点以实现集群算力优势 [1] - 算力厂商的竞赛已从单卡延伸至超节点(超级算力集群) [1]