磐久128超节点
搜索文档
国产AI芯片:推理赛道起飞,谁能再破寒武纪神话?
南方都市报· 2026-01-08 07:14
文章核心观点 2025年,在DeepSeek模型引爆AI应用与算力需求的背景下,国产AI芯片行业迎来关键转折,国产替代进程显著加速,多家头部厂商成功登陆资本市场,但在市场份额、盈利能力、供应链安全及软件生态等方面仍面临挑战,行业未来将在推理侧、超节点技术及本土供应链发展中寻找突破机会 [2][3][15] 趋势1:DeepSeek引爆国产替代,推理赛道机遇显现 - **DeepSeek模型成为关键催化剂**:2025年年初DeepSeek的横空出世及其模型V3.1的发布,引爆了AI应用侧需求,推动算力需求从训练转向推理,并深度适配国产芯片(如支持“UE8M0 FP8”格式),显著提振了市场对国产芯片厂商的投资热情 [2][3] - **推理芯片市场进入爆发式增长**:随着开源大模型成熟与终端应用落地,AI推理芯片行业正进入爆发阶段,2024年中国AI推理芯片相关市场规模为1626亿元,预计2025年将增长至3106亿元,国内聚焦推理的代表厂商包括华为、寒武纪和沐曦股份 [3] - **国产替代率预期大幅提升**:壁仞科技预计,国内企业在**中国智能计算芯片市场**的份额将从2024年的约20%增加至2029年的约60%;天数智芯数据显示,**通用GPU市场**国产化率从2022年的2%提升至2024年的3.6%,并预计2029年将超50% [4] - **边缘AI推理被视为潜力方向**:在DeepSeek效应推动下,国内AI供应商正积极拓展云服务ChatBOT应用、与互联网业务整合以及边缘AI推理(如自动驾驶)等服务,其中各应用领域的边缘AI推理被认为较具发展潜力 [4] 趋势2:国产AI芯片厂商集体冲击上市,但市占率与盈利仍待突破 - **多家厂商成功登陆科创板**:2025年底,摩尔线程作为“国产GPU第一股”登陆科创板,上市首日高开468.78%,报650元/股,开盘市值超3000亿元;沐曦股份作为“第二股”紧随其后,上市首日高开568.83%,报700元/股,市值超2800亿元 [5] - **更多厂商筹备上市**:燧原科技(ASIC架构)于2025年初完成上市辅导,瀚博半导体在2025年底完成上市辅导;壁仞科技、天数智芯及百度旗下昆仑芯均计划于2026年在港交所上市 [5][6] - **当前市场份额高度集中且国产占比低**:2024年**中国AI加速器市场**中,英伟达市占率约66%,华为海思约23%,AMD约5%,而寒武纪、摩尔线程、沐曦股份均仅占约1%;天数智芯2024年在**中国通用GPU市场**份额为0.3%,壁仞科技预计2025年占约0.2% [6] - **未来市场份额格局或生变**:Bernstein Research预测,到2026年,英伟达在中国AI芯片市场的份额将显著萎缩至8%,华为将占据50%,AMD预计以12%列第二,寒武纪或将排第三 [7] - **多数厂商尚未实现盈利**:2022年至2025年前三季度,摩尔线程累计净亏损超59亿元,沐曦股份累计净亏损超34亿元;2022年至2025年上半年,壁仞科技累计净亏损超63亿元,天数智芯累计净亏损超28亿元;寒武纪于2024年第四季度才开始盈利,2025年前三季度盈利16.05亿元 [7] - **客户集中度风险高企**:多家GPU厂商前五大客户收入占比极高,摩尔线程2024年该占比高达98.16%,沐曦股份2025年一季度达88.35%,壁仞科技自2023年营收后该占比维持在九成以上,且前五大客户并不稳定 [8] 趋势3:英伟达开启“反击战”,H200获批带来新变数 - **英伟达在华遭遇多重挑战**:2025年受DeepSeek冲击股价下跌,其专为中国设计的H20芯片在4月被美列入限制出口名单,导致英伟达市值蒸发1600亿美元;7月因芯片安全问题被国家网信办约谈;9月其CEO黄仁勋称英伟达在中国的市场份额从95%降到0% [9] - **H200年底获批准对华出售**:2025年12月,特朗普政府突然批准英伟达向中国出售H200 AI芯片,其性能据称是H20的6倍以上,但较其最新的Blackwell芯片仍有差距;国内市场对此看法不一,目前国内尚未批准H200的采购订单 [10] - **CUDA生态构成长期竞争壁垒**:英伟达在全球拥有超过500万CUDA生态开发者,其软件生态是核心护城河;从CUDA迁移到国产平台需要较高的代码重写、调优和验证成本,是国产替代的最大障碍之一 [11] - **国产厂商采取不同生态策略**:为降低客户迁移成本,部分厂商选择兼容CUDA生态,如摩尔线程的MUSA架构和沐曦股份的MXMACA软件栈;华为则明确表示不兼容CUDA,致力于构建自主生态 [12] 趋势4:先进制程受限,超节点技术成突破口 - **先进制程受限影响性能**:国产GPU厂商主流采用7nm或14nm制程,而英伟达已进入4nm时代(如Blackwell芯片),7nm以下制程难产直接影响国产芯片的算力密度和能效比;2025年1月美国还采取了阻止14/16nm及以下先进制程芯片流入中国大陆的措施 [12] - **厂商切换国产供应链应对风险**:沐曦股份坦言在先进制程晶圆代工和HBM供应方面受到限制,并规划其曦云C600等后续产品采用国产供应链 [13] - **“超节点”技术成为重要发展方向**:通过集成大量芯片来绕开单芯片性能不足的问题,2025年4月华为发布基于昇腾910C的Cloud Matrix 384超节点,通过五倍数量的芯片抵消了单芯片性能仅为英伟达Blackwell三分之一的差距;随后曦智科技联合壁仞科技、中兴通讯推出光跃Light SphereX,阿里巴巴发布磐久128超节点,百度公布天池256和512超节点(后者支持512卡互联,可完成万亿参数模型训练) [13][14] 行业展望:2026年市场规模与机会方向 - **市场规模预期持续增长**:预计2026年国内AI芯片市场规模将突破3000亿元,国产芯片份额有望提升;在硬件参数差距日益缩减的背景下,软件生态和互联技术将随产业发展不断壮大 [15] - **高阶AI芯片国产化目标明确**:预期在政策推动下,2026年由本土领先业者带动,高阶AI芯片占比有机会向50%的目标迈进 [15] - **未来市场呈现两大发展方向**:一方面是云服务提供商自研ASIC芯片;另一方面是本土供应商(如华为、寒武纪、沐曦、摩尔线程等)提供解决方案;在本土上游供应链(晶圆、封装、HBM)供应相对有限的情况下,相对低阶规格的AI推理芯片将成为较大发展机会 [16]
算力的突围:用“人海战术”对抗英伟达!
经济观察报· 2025-11-14 23:08
超节点概念与市场动态 - 英伟达是超节点概念最早的提出者,国内厂商在进入该赛道时常以对标或超越英伟达为主题[1][11] - 2025年下半年起,AI算力市场涌现超节点发布热潮,包括华为、中兴通讯、超聚变、新华三、浪潮信息、百度、阿里巴巴、中科曙光等公司均推出了相关产品[2] - 华为在2025年中国国际大数据产业博览会上宣称其384超节点服务器的集群算力是英伟达同类设备的1.67倍[3] 超节点的定义与技术背景 - 行业内对超节点有两种层级划分:单机柜内部高速互联和跨机柜组成的集群级互联[5] - 超节点的出现是为了解决AI大模型训练中的"通信墙"问题,即在超高参数级别训练中,计算单元约40%的时间处于"空等"通信状态[6] - 构建大规模GPU集群主要有Scale-Out和Scale-Up两种方式,超节点通过单机柜内集成大量芯片来提升性能[7] - 超节点产品名称中的数字通常表示单机柜或单系统内集成的AI训练芯片数量,例如华为昇腾384集成384颗芯片,中科曙光scaleX640可部署640张计算卡[7] 国内厂商的技术路径与竞争策略 - 国内厂商选择超节点路线是由于单芯片算力存在短板,需要通过系统级优势来弥补单点差距[9] - 厂商在单机柜集成度上展开激烈竞争,中科曙光scaleX640宣称是"全球首个单机柜级640卡"产品,单机柜算力密度提升20倍[12][13] - 超节点内部互联存在不同技术路径,英伟达采用高速铜缆,华为选择"去铜全光",而行业主流思路是柜体内用铜互联、柜间用光互联[13] - 国内厂商的核心策略是在1米左右的铜互联有效距离内尽可能塞进更多计算卡,以降低系统总成本和提升通信效率[14] 超节点面临的工程挑战 - 高集成度带来显著功耗和散热挑战,例如英伟达GB200NVL72单柜72卡功耗达120千瓦,迫使液冷技术成为必需品[15] - 互连工程复杂度随集成度提升而急剧增加,GB200NVL72机柜需要铺设5000多条总长近3200米的独立铜缆[15][16] - 在互联协议上出现分化,华为自研灵衢协议并计划开放生态,阿里和新华三等则选择支持UALink等国际开放标准[16] 市场需求与发展前景 - 未来两到三年AI服务器需求主导角色将是大型互联网企业和国家主导的主权云服务[20] - AI算力建设存在"一厢情愿"风险,需要避免在不需要算力的地方强行推进产业发展[21] - AIGC是当前AI算力主要落地场景,但机器人、高阶自动驾驶等与先进制造深度绑定的领域被看好具备长期潜力[21][22] - 金融、医疗等行业目前仍处于从单点验证走向规模化复制的早期阶段[22]
国产超节点扎堆发布背后
经济观察网· 2025-11-14 22:10
超节点市场动态 - 2025年下半年起,国内多家科技公司密集发布超节点产品,包括华为、中兴通讯、超聚变、紫光股份旗下新华三、浪潮信息、百度、阿里巴巴及中科曙光等[2] - 华为在2025年中国国际大数据产业博览会上宣称其384超节点服务器的集群算力达到英伟达同类设备的1.67倍[2] - 中科曙光于2025年11月6日发布scaleX640超节点,宣称是"全球首个单机柜级640卡"集成产品[11] 超节点技术定义与分类 - 超节点在行业内有至少两种层级划分:单机柜内部实现高速互联(SuperNode)和由跨机柜组成的集群级互联(SuperPod)[3] - 超节点是将几十张乃至上百张AI计算卡集成进一台大机柜,通过内部高速互连使其像一块超级芯片一样工作[6] - 产品名称中的数字(如384、640)通常代表该超节点单机柜或单系统内集成的AI训练芯片数量,是衡量其规模与算力密度的核心指标[7] 超节点发展的驱动因素 - AI大模型训练面临"通信墙"瓶颈,在超高参数级别模型训练中,计算单元约40%的时间处于"空等"通信状态[4] - AI应用需求从"一个模型回答一个问题"转向需要多个模型协同工作的智能体(AI Agent),导致Token生成规模远超传统方式,对通信时延要求更高[8] - 国内单芯片算力存在短板,厂商通过构建多卡超节点模式在系统级上寻求优势,以弥补单卡性能差距[9] 超节点技术路径与工程挑战 - 行业主要采用两种构建大规模GPU集群的方式:Scale-Up(纵向扩展)和Scale-Out(横向扩展),超节点设计同时包含这两种方式[5][7] - Scale-Out网络通信时延约10微秒,而Scale-Up网络(如英伟达NVLink)目标时延为百纳秒级别,性能差距显著[8] - 高集成度带来工程挑战:英伟达GB200NVL72单柜72卡功耗达120千瓦,需采用液冷散热;其机柜内部需要铺设5000多条、总长近3200米的独立铜缆[14] - 互联协议出现分化:华为自研灵衢互联协议并开放技术规范;阿里、新华三等选择支持UALink等国际开放标准[15] 超节点市场前景与挑战 - 未来两到三年AI服务器需求主力为大型互联网企业和国家主导的主权云服务,后者旨在为本地化中小企业提供AI算力租赁服务[19] - 软件生态是国产算力厂商面临的共同挑战,用户更关注应用能否有效落地而非硬件参数[18] - AI算力最大应用场景目前是AIGC,但在智能制造等"AI+"领域,算力预期与实际需求存在落差;机器人、高阶自动驾驶等先进制造领域被看好具备长期潜力[20][21] - 金融、医疗等行业AI应用仍处于从单点验证走向规模化复制的早期阶段[22]
瑞银:中国算力加速发展推动AI进程 看好阿里巴巴 及百度
智通财经· 2025-10-15 21:33
中国AI本土算力发展驱动力 - 国家政策支持和主要科技公司及本土供应商的研发投入推动本土算力不断发展 [1] - 本土算力发展可能将继续推动中国AI及大模型发展 [1] 技术层面进展与优化 - 中国互联网公司内部研发及本地GPU供应商持续投入下,芯片层面差距正迅速改善 [2] - 通过超节点规模扩展弥补单颗GPU性能落差,如阿里巴巴磐久128超节点及华为升腾384超节点大幅提升单机柜GPU数量,实现更高机柜级运算能力 [2] - AI模型开发者正针对国产GPU优化算法,例如DeepSeek的v3.2模型采用国产GPU程序语言TileLang以更好适应华为升腾及寒武纪等本土算法生态系统 [2] - 大部分互联网企业正在加速ASIC发展以优化内部工作量及提高性价比,百度已开发三代昆仑芯片,阿里巴巴亦开始部署自研芯片 [2] 国产AI芯片现状评估 - 目前国产前沿GPU运算能力已与英伟达Ampere匹敌,下一代产品瞄准Hopper,但整体仍较Blackwell系列落后一代 [3] - 部分国产芯片制造商已建立自己的软件堆栈或通过翻译工具添加CUDA兼容性以提高工程师迁移效率,但生态系统碎片化限制了规模 [3] - 中国在先进制程技术和高频宽存储器生产方面的能力仍处于早期阶段 [3] 瑞银看好的相关公司 - 看好阿里巴巴及百度,因相信其自主研发芯片将持续有进展以巩固AI价值链地位,且会持续投资AI [1] - 看好科大讯飞在将国产硬件与大模型发展相结合方面取得的领先进展 [3] - 偏好地平线机器人、北方华创和中微公司 [3]
瑞银:中国算力加速发展推动AI进程 看好阿里巴巴 (09988)及百度(09888)
智通财经网· 2025-10-15 21:12
中国AI本土算力发展驱动力 - 国家政策支援和主要科技公司及本土供应商的研发投入推动本土算力不断发展 [1] - 进口人工智能芯片存在不确定性,但本土发展可能继续推动中国AI及大模型发展 [1] 技术层面的积极进展 - 中国互联网公司内部研发及本地GPU供应商持续投入,芯片层面差距正迅速改善 [2] - 系统层面通过超节点规模扩展弥补差距,如阿里巴巴磐久128超节点及华为升腾384超节点,大幅提升单机柜GPU数量,部分弥补单颗国产GPU性能落差,实现更高机柜级运算能力,使国产芯片可支持更多复杂推理情境 [2] - AI模型开发者正针对国产GPU优化算法,例如DeepSeek最新的v3.2模型采用国产GPU程序语言TileLang,以更好适应华为升腾及寒武纪等本土算法生态系统 [2] - 大部分互联网企业加速ASIC发展以优化内部工作量及提高性价比,百度已开发三代昆仑芯片,阿里巴巴亦开始部署自研芯片 [2] 国产AI芯片现状评估 - 硬件表现方面,目前国产前沿GPU运算能力已与英伟达Ampere匹敌,下一代产品瞄准Hopper,但整体仍较Blackwell系列落后一代 [3] - 软件生态系统方面,一些国产芯片制造商已建立自己的软件堆栈或通过翻译工具添加CUDA兼容性,提高工程师迁移效率,但生态系统碎片化限制了规模 [3] - 供应链能力方面,除了芯片设计质量,中国在先进制程技术和高频宽存储器生产能力仍处于早期阶段 [3] 瑞银看好的相关公司 - 看好阿里巴巴及百度,因相信其自主研发芯片将持续有进展以巩固AI价值链地位,且会持续投资AI [1] - 看好科大讯飞的独特定位,因在将国产硬件与大模型发展结合方面取得领先进展 [3] - 偏好地平线机器人、北方华创和中微公司 [3]