Workflow
scaleX640超节点
icon
搜索文档
海光终止合并中科曙光 国产算力产业协作未歇
中国经营报· 2025-12-20 22:31
重组终止事件核心 - 海光信息与中科曙光筹划近半年的重大资产重组正式终止,原因是交易规模大、涉及方多、市场环境发生较大变化,实施条件不成熟 [1] - 重组原意在于推动产业链纵向整合,提升国产算力体系的协同效率与国际竞争力,但两家公司均为头部企业,资产体量庞大,方案论证复杂,最终未能达成 [1] - 双方表示长期产业协同与合作不受影响,海光信息将继续专注高端CPU与DCU芯片设计,中科曙光将持续完善“芯片—服务器—液冷—算力服务”全链条布局 [1] 重组方案与市场反应 - 重组方案于6月初出炉,海光信息拟以换股方式吸收合并中科曙光,海光信息换股价为143.46元/股,中科曙光换股价为79.26元/股,换股比例为0.5525:1,交易拟购买资产成交金额达1159.67亿元 [3] - 合并完成后中科曙光将终止上市,旨在打通“芯片设计—硬件制造—软件服务”全产业链 [3] - 市场对重组协同效应的预期推动股价走高,海光信息股价最高涨至277.98元/股,中科曙光最高触及128.12元/股,两家公司市值合计一度突破6500亿元 [4] 终止原因分析 - 分析师认为,超大规模市值企业间的整合涉及技术标准统一、人员协同、渠道整合等复杂问题,尽职调查与方案论证周期漫长,而算力行业技术迭代快,时间窗口易错失 [4] - 市场环境发生剧烈变动是关键变量之一,重组预案发布以来,国产算力行业迎来政策与竞争的双重变局 [4] - 政策层面,国家明确“促进多元异构算力融合发展”,鼓励差异化协作 [4] - 市场竞争加剧,华为昇腾、寒武纪等企业加速技术突破,行业呈现“开放协同”与“全栈生态”双轨并行格局,双方独立发展的优势日益凸显 [5] - 市场给头部企业的独立成长空间在扩大,合并带来的规模效应或许已不如快速响应市场的灵活度重要 [6] - 中科曙光官方表示,未来两家企业可作为国产算力“双核心”,避免因整合后的战略失误或技术瓶颈影响整个产业发展节奏,降低产业单一化风险 [6] 行业市场现状与趋势 - 在AI模型训练与推理需求爆发的背景下,国内算力产业链上下游仍有广阔的市场合作空间,产业协作趋势不会改变 [2] - IDC数据显示,2025年上半年,中国加速服务器市场规模已达约160亿美元,同比增幅超过100%,并预计到2029年将进一步放大至上千亿美元级别 [2][7] - 生成式AI的爆发式增长催生了“大模型+大算力+大数据”的全新范式,单一企业难以再覆盖全产业链环节 [7] - 我国算力总规模已位居全球第二,2025年上半年中国加速服务器市场规模约为160亿美元,同比增长超过一倍 [7] - 中国AI加速服务器市场正在经历规模扩张和本土替代的阶段,未来产业竞争焦点将从单芯片性能转向系统能效比、开放生态协同和绿色算力成本控制 [9] 产业协作模式展望 - 政策红利与市场需求成为协作的首要驱动力,“东数西算”工程要求到2025年年底,国家枢纽节点新增算力占全国60%以上 [7] - 巨大的市场空间为“芯片、整机”之间既竞争又合作的生态创造了空间,芯片厂希望与整机厂深度绑定快速放量,整机厂则希望保持对多家芯片方案的选择权 [8] - 国产算力产业整合协作呈现出两条并行逻辑:一是“联合向上整合”,通过垂直整合形成闭环能力;二是“平台化兼容”,构建开放的产品兼容层,使不同供应商的产品能够并行运作 [8] - 资本市场对算力企业的估值波动,推动了产业参与者更谨慎地选择合作路径,未来协作更可能以项目级、产品级与标准层面的联合为主,而非大规模股权整合 [8] - 生态构建的核心可能将转向更为细分的工程化协作,行业需避免低水平重复建设,通过技术协同与标准优化提升国际竞争力 [8][9]
昂瑞微登陆科创板 上市首日涨160%
新浪财经· 2025-12-16 21:11
科创板公司动态 - 海优新材拟在成都金堂县设立全资子公司并投建高分子特种胶膜生产项目 项目总投资预计3亿元 不涉及新增产能 属于存量产能结构调整 [1][4] - 海优新材拟以自有或自筹资金对全资子公司泰州海优威增资7000万元人民币 增资完成后其注册资本为15000万元 [4] - 赛微微电实际控制人葛伟国、蒋燕波、赵建华及一致行动人微合投资拟合计减持不超过86.14万股 不超过公司总股本的1.00% [3] - 德科立公司董事、副总经理、核心技术人员周建华计划减持不超过10万股 减持比例不超过0.0632% [1][5] - 中邮科技股东国华卫星及其一致行动人航天投资合计持股比例由8.87%减少至7.89% 权益变动触及1%刻度 [3] 科技产品与研发进展 - 中科曙光发布全球首个单机柜级640卡超节点scaleX640 可通过双超节点组成千卡级计算单元 相比业界同类产品单机柜算力密度提升20倍 在MoE万亿参数大模型训练推理场景可实现30%-40%的性能提升 [1][5] - 海光信息坚持基于x86指令集架构进行芯片研发 打造“CPU+DCU”双轮驱动产品体系 其DCU对标国际主流GPGPU 算子覆盖度超99% 兼容CUDA [1][5] - 海光光合组织已聚合6000余家合作伙伴 完成15000余项软硬件测试 在政务、金融、能源等领域的联合解决方案超15000个 [5] - 小鹏汽车在广州市获得L3级自动驾驶道路测试牌照 并启动常态化的L3道路测试 [2] 市场与行业事件 - 午后市场传闻涉及高科技公司税收认定趋严 恒生科技指数一度跌超2.5% 阿里巴巴、腾讯控股、京东、美团等股价跌幅加大 [2] - 有券商研究员表示 相关税收信息只是认定趋严而非一刀切 [2] 融资与上市动态 - 昆仑芯即将完成股改 加速冲刺上市 知情人士透露其2025年营收远超20亿元 若按30-40亿元收入及6万元芯片均价估算 对应芯片出货量为5-6.7万颗 [6] - 锂离子电池负极材料研发商江帆圭智完成近亿元Pre-A轮融资 资金用于推进硅碳负极材料产线建设及技术迭代 [6] - 光学元件企业贝耐特完成数千万元A++轮融资 该公司专注于硅基液晶光学器件与系统的研发生产 [7] - 生物医药公司奥赛瑞生物完成数千万元Pre-A轮融资 资金用于推进新型影像对比剂及诊疗一体化药物研发与临床转化 [9]
国产芯片的2025:从“能用”到“好用”的临界点
经济观察报· 2025-12-07 12:31
文章核心观点 - 2025年国产芯片行业呈现新气象,在消费电子、汽车、AI计算及半导体设备材料等多个领域实现显著突破,正从“能用”向“好用”迈进,并从追赶者向引领者跨越 [1][3][27] C端:消费电子与汽车市场突破 - **PC与游戏性能**:雷神科技发布首款面向消费级电竞市场的国产主机“黑武士·猎刃Pro”,搭载海光C86处理器,实测运行《黑神话:悟空》帧率接近300帧,《无畏契约》接近200帧,打破了“国产芯片玩不了游戏”的刻板印象 [2][3][5][7] - **技术路线与生态**:海光信息采用x86指令集实现“原生兼容”,可直接运行Windows系统和主流游戏,是国产高端算力从专用领域向通用消费市场跨出的一大步 [6] - **智能手机芯片**:小米发布首款自研3nm旗舰SoC芯片玄戒O1,采用第二代3nm工艺,集成190亿个晶体管,CPU为10核架构,已搭载于小米15S Pro等旗舰机型 [8] - **存储芯片进展**:长鑫存储发布国产DDR5产品系列,最高速率达8000Mbps,单颗容量24Gb,填补产业链在先进存储标准上的空白 [9][10];长江存储致态TiPlus7100s固态硬盘顺序读取速度达7400MB/s,写入速度达6900MB/s,参数已达国际竞争水平 [10][11] - **汽车电子渗透**:广汽昊铂GT“攀登版”实现芯片设计100%国产化,智能座舱由瑞芯微RK3588M芯片驱动,具备94K DMIPS通用算力和6TOPS AI算力;音频处理由集成NPU的RK2118M芯片负责 [3][12];欧冶半导体将于年底量产面向下一代汽车E/E架构的区域控制器主控芯片工布565系列,旨在减少ECU数量,降低整车成本 [13] B端:AI计算与产业链协同 - **市场格局变化**:受出口管制影响,英伟达在中国AI芯片市场份额从95%降至0%,为国产算力厂商留下市场真空 [15] - **厂商业绩反弹**:寒武纪2025年第三季度营收达17.27亿元,同比增长1332.52%,归母净利润5.67亿元,实现净利润转正 [16] - **技术路线转向**:国产厂商集体转向“超节点”技术路线,通过提高集成度以系统级优势弥补单卡算力差距;中科曙光发布scaleX640超节点服务器,单机柜集成640张AI加速卡,算力密度相比传统方案提升20倍 [3][16][17] - **降低算力成本**:铨兴科技推出超显存融合解决方案,使训练DeepSeek-671B大模型的硬件部署成本从约2000万元降至约200万元,降幅达90% [17] - **存储需求转变**:AI算力需求爆发使存储从“成本部件”变为“战略性物资”;机械硬盘交期长达52周,倒逼云端业者转向国产企业级固态硬盘替代 [18][19] - **产业链协同**:半导体产业正从“点状突破”向“链式协同”过渡,下游厂商主动开放供应链,为国产芯片提供量产验证机会 [20] - **研发投入与资金压力**:国产GPU厂商研发投入巨大,摩尔线程2022-2024年累计研发投入38.1亿元,同期累计归母净亏损约50亿元;沐曦股份2022年至2025年第一季度合计研发投入24.66亿元,同期累计归母净亏损32.90亿元;巨大资金压力推动2025年出现IPO冲刺潮 [21] 跋涉“深水区”:设备、材料与工具 - **光刻设备**:芯上微装发运350nm步进式光刻机AST6200,实现核心技术自主可控,服务于功率器件、射频芯片等领域,助力汽车芯片供应链安全 [23][24] - **半导体材料**:恒坤新材自产的SOC和BARC材料在2023年境内市场国产厂商中销售规模排名第一,打破了美日韩厂商的长期掌控 [24] - **测试仪器**:新凯来旗下万里眼公司推出带宽高达90GHz的超高速实时示波器,突破了西方在高端电子测试仪器上的封锁,满足7nm及更先进工艺AI芯片的测试需求 [25] - **EDA工具**:华大九天提出“EDA统一大平台”战略,其全定制设计工具覆盖率已近100%,数字流程主要工具覆盖率接近80% [26];启云方发布拥有完全自主知识产权的国产EDA软件,支持超大规模电路多人协同设计,已有超2万名工程师使用,能将硬件开发周期缩短40% [26] - **发展阶段判断**:行业专家指出,中国芯片产业策略应是“主动超前研发”,即“预研一代,研制一代,生产一代”,而非等待传统迭代循环 [26]
国产芯片新气象
经济观察网· 2025-12-06 21:57
文章核心观点 - 2025年国产芯片行业在消费电子、汽车、AI算力及半导体设备材料等多个领域取得显著突破,正从“能用”向“好用”迈进,并加速填补国际巨头退场留下的市场真空 [3][14][15][26] C端消费电子与汽车市场突破 - **PC处理器性能达标**:雷神科技发布首款面向消费级电竞市场的国产主机“黑武士·猎刃Pro”,搭载海光C86处理器,实测运行《黑神话:悟空》帧率接近300帧,远超流畅“及格线”60帧,满足职业电竞需求 [2][5] - **技术路线与生态兼容**:海光信息采用x86指令集实现“原生兼容”,可直接运行Windows和主流游戏,是国产高端算力从专用领域迈向通用消费市场的重要一步 [6] - **智能手机SoC自主化**:小米发布首款自研3nm旗舰SoC芯片玄戒O1,采用第二代3nm工艺,集成190亿个晶体管,搭载于小米15SPro等旗舰机型 [8] - **存储芯片性能跃升**:长鑫存储发布国产首款达到国际高端水准的DDR5产品,最高速率达8000Mbps,单颗容量24Gb;长江存储致态TiPlus7100s固态硬盘顺序读取速度达7400MB/s,写入速度达6900MB/s [8][9][10] - **汽车芯片国产化深入**:广汽昊铂GT“攀登版”实现芯片设计100%国产化,智能座舱由瑞芯微RK3588M芯片驱动,该芯片采用8nm车规工艺,具备94K DMIPS通用算力和6 TOPS AI算力 [3][11][12] - **汽车电子架构创新**:欧冶半导体将于年底量产工布565系列区域控制器主控芯片,面向下一代E/E架构,旨在整合功能、减少ECU数量以降低成本 [13] B端AI算力与产业链协同 - **市场格局剧变与需求承接**:英伟达在中国AI芯片市场份额从95%降至0%,国产算力厂商寒武纪2025年第三季度营收达17.27亿元,同比增长1332.52%,归母净利润5.67亿元,实现扭亏 [15] - **系统级创新弥补单点差距**:国产厂商转向“超节点”技术路线,中科曙光发布scaleX640超节点服务器,单机柜集成640张AI加速卡,算力密度相比传统方案提升20倍 [3][15][16] - **降低算力应用成本**:铨兴科技推出超显存融合解决方案,使训练DeepSeek-671B大模型的硬件部署成本从约2000万元降至200万元左右,降幅达90% [17] - **存储需求与角色转变**:AI算力需求爆发使存储从“成本部件”变为“战略性物资”,OpenAI“星际之门”计划可能消耗全球存储产能的40%,机械硬盘交期长达52周,倒逼云端业者转向国产企业级固态硬盘替代 [18][19] - **产业链协同加强**:下游厂商开始主动开放供应链,为国产芯片提供量产验证机会,推动产业从“点状突破”向“链式协同”过渡 [20] - **高昂的研发投入与资金压力**:GPU厂商研发投入巨大,摩尔线程2022至2024年累计研发投入38.1亿元,同期累计归母净亏损约50亿元;沐曦股份2022年至2025年第一季度累计研发投入24.66亿元,同期累计归母净亏损32.90亿元,企业通过冲刺IPO以维持高强度研发 [21][22] 半导体设备、材料与EDA工具进展 - **光刻设备国产化**:芯上微装发运AST6200型350nm步进式光刻机,实现核心技术自主可控,服务于功率器件、射频芯片等领域,保障汽车芯片供应链安全 [23] - **半导体材料突破**:恒坤新材自产的SOC和BARC材料在2023年境内市场国产厂商中销售规模排名第一,打破国外厂商在光刻环节材料的长期掌控 [24] - **高端测试仪器突破**:万里眼技术有限公司推出带宽高达90GHz的超高速实时示波器,满足7nm及更先进工艺AI芯片的高速接口测试需求,打破西方在高端测试仪器上的封锁 [25] - **EDA工具发展与挑战**:华大九天提出“EDA统一大平台”战略,其全定制设计工具覆盖率近100%,数字流程主要工具覆盖率接近80%,但与国际头部企业相比仍存在工具不全、对先进工艺支撑不足的差距;启云方发布的国产EDA软件支持超大规模电路多人协同设计,已超2万名工程师使用,能将硬件开发周期缩短40% [26]
单套1.35亿元!华为独家中标中移动超节点采购
观察者网· 2025-12-03 11:53
中国移动超节点采购项目 - 中国移动研究院2025年超节点试验装置采购项目由华为技术有限公司中标,投标报价为1.35亿元人民币,拟中标份额100% [1] - 招标内容包括超节点试验装置1套,内含超节点智算模块48套及超节点存储模块1套 [1] 华为超节点技术特点与优势 - 华为“Scale-up超大规模超节点算力平台”通过高速互联总线形成全对等互联架构,实现共享内存池,使数百、数千个AI处理器像一台计算机一样工作 [1] - 昇腾384超节点将384颗昇腾NPU和192颗鲲鹏CPU互联,算力总规模达300Pflops,为英伟达NVL72的1.7倍 [2] - 网络互联总带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量达2300 Tokens/s [2] - 华为董事杨超斌提出超节点应具备总线级互联、平等协同、全量池化等六大特征,旨在构建逻辑上统一的超级计算机 [11] 华为未来超节点发展计划 - 计划2026年四季度上市的Atlas 950超节点基于8192颗昇腾950DT芯片打造,FP8算力达8E FLOPS,FP4算力达16E FLOPS,互联带宽达16PB/s,超过全球互联网峰值带宽10倍 [12] - 相比英伟达NVL144,Atlas 950超节点卡规模是其56.8倍,总算力是其6.7倍,内存容量达1152TB为其15倍,互联带宽达16.3PB/s为其62倍 [14] - 计划构建由64个Atlas 950超节点组成的SuperCluster集群,FP8总算力达524 EFLOPS,规模为xAI Colossus的2.5倍,算力为其1.3倍 [14] - 2027年四季度计划推出基于Atlas 960的SuperCluster,规模达百万卡级,FP8总算力达2 ZFLOPS,FP4总算力达4 ZFLOPS [14] 国内其他厂商超节点进展 - 中科曙光发布全球首个单机柜级640卡超节点scaleX640,单机柜算力密度提升20倍,可实现MoE万亿参数大模型训练推理场景30%-40%的性能提升 [4] - 中科曙光通过30天以上长稳运行测试验证,scaleX640可保障10万卡级集群扩展部署 [5] - 百度昆仑芯超节点方案支持单机柜32至64张加速卡部署,在优化下实现单卡性能提升95%,单实例推理性能提升高达8倍,并已内部大规模部署 [7] - 上海仪电、曦智科技等联合发布国内首个光互连光交换GPU超节点光跃LightSphere X,采用光互连技术,计划实现2000卡部署 [9] 行业趋势与背景 - 大模型对算力需求爆炸式增长,传统计算架构面临资源利用率低等挑战,超节点正成为AI基础设施建设的新常态 [4] - 传统服务器集群的堆卡模式已无法实现算力线性增加,超节点通过创新互联技术应对更高算力集群要求 [4]
中科曙光:曙光AI超集群系统等产品深度适配DeepSeek-V3.2
证券时报网· 2025-12-02 18:28
公司产品发布 - DeepSeek于12月1日正式发布DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个新版本 [1] - 新版本大幅强化Agent能力并融入思考推理功能 [1] 技术架构与协同 - 产品基于中国首个AI计算开放架构开发 [1] - 硬件层、软件层、模型层实现"跨层协同" [1] 产品适配与部署 - 曙光AI超集群系统和scaleX640超节点等产品0day完成对DeepSeek新版本的深度适配与调优 [1] - 系统支持各行各业客户进行全量落地部署 [1]
海光信息(688041):首次授予激励对象 产业链合作深化
新浪财经· 2025-11-24 08:30
股权激励计划 - 公司于2025年11月21日向878名激励对象首次授予1653.54万股限制性股票,授予价格为90.25元/股,约占公司总股本的0.71% [1] - 激励对象占公司截至2025年6月30日员工总数2803人的比例超过30%,授予范围广泛,旨在深度绑定员工并巩固核心人才壁垒 [1] 产业链合作与技术发展 - 公司与信安世纪共建AI密算联合实验室,将密码技术深度嵌入算力芯片底层,为AI应用提供内生安全能力 [2] - 公司与星环科技、海量数据签署战略合作协议,推进海光产品与数据库等关键软件的深度联合适配,并针对特定领域定制解决方案 [2] - 中科曙光发布scaleX640超节点,采用算、存、网、电、冷一体化紧耦合设计,实现单机柜640卡超高速互连,可使MoE万亿参数大模型训练推理场景性能提升30%-40% [2] 财务业绩预测 - 预计公司2025年至2027年收入分别为142.1亿元、207.0亿元、291.5亿元,同比增速分别为55%、46%、41% [3] - 预计公司2025年至2027年归属母公司股东的净利润分别为29.8亿元、43.4亿元、64.1亿元,对应市盈率估值分别为161倍、111倍、75倍 [3]
研报掘金丨中信建投:维持中科曙光“买入”评级,40超节点构建国产智算新范式
格隆汇APP· 2025-11-20 16:08
公司业绩表现 - 2025年三季度报告业绩表现亮眼,收入稳健增长 [1] - 扣非净利润同比高增 [1] 产品与技术进展 - 发布scaleX640超节点,单机柜算力密度大幅提升 [1] - 产品支持多品牌加速卡及主流计算生态,有望构建国产智算新范式 [1] 战略合作与整合 - 与海光信息吸收合并事项积极推进中 [1] - 目标打造国产算力全产业链龙头,实现从芯片到服务的深度融合与协同 [1] - 协同效应有望显著提升公司核心竞争力 [1]
算力的突围:用“人海战术”对抗英伟达!
经济观察报· 2025-11-14 23:08
超节点概念与市场动态 - 英伟达是超节点概念最早的提出者,国内厂商在进入该赛道时常以对标或超越英伟达为主题[1][11] - 2025年下半年起,AI算力市场涌现超节点发布热潮,包括华为、中兴通讯、超聚变、新华三、浪潮信息、百度、阿里巴巴、中科曙光等公司均推出了相关产品[2] - 华为在2025年中国国际大数据产业博览会上宣称其384超节点服务器的集群算力是英伟达同类设备的1.67倍[3] 超节点的定义与技术背景 - 行业内对超节点有两种层级划分:单机柜内部高速互联和跨机柜组成的集群级互联[5] - 超节点的出现是为了解决AI大模型训练中的"通信墙"问题,即在超高参数级别训练中,计算单元约40%的时间处于"空等"通信状态[6] - 构建大规模GPU集群主要有Scale-Out和Scale-Up两种方式,超节点通过单机柜内集成大量芯片来提升性能[7] - 超节点产品名称中的数字通常表示单机柜或单系统内集成的AI训练芯片数量,例如华为昇腾384集成384颗芯片,中科曙光scaleX640可部署640张计算卡[7] 国内厂商的技术路径与竞争策略 - 国内厂商选择超节点路线是由于单芯片算力存在短板,需要通过系统级优势来弥补单点差距[9] - 厂商在单机柜集成度上展开激烈竞争,中科曙光scaleX640宣称是"全球首个单机柜级640卡"产品,单机柜算力密度提升20倍[12][13] - 超节点内部互联存在不同技术路径,英伟达采用高速铜缆,华为选择"去铜全光",而行业主流思路是柜体内用铜互联、柜间用光互联[13] - 国内厂商的核心策略是在1米左右的铜互联有效距离内尽可能塞进更多计算卡,以降低系统总成本和提升通信效率[14] 超节点面临的工程挑战 - 高集成度带来显著功耗和散热挑战,例如英伟达GB200NVL72单柜72卡功耗达120千瓦,迫使液冷技术成为必需品[15] - 互连工程复杂度随集成度提升而急剧增加,GB200NVL72机柜需要铺设5000多条总长近3200米的独立铜缆[15][16] - 在互联协议上出现分化,华为自研灵衢协议并计划开放生态,阿里和新华三等则选择支持UALink等国际开放标准[16] 市场需求与发展前景 - 未来两到三年AI服务器需求主导角色将是大型互联网企业和国家主导的主权云服务[20] - AI算力建设存在"一厢情愿"风险,需要避免在不需要算力的地方强行推进产业发展[21] - AIGC是当前AI算力主要落地场景,但机器人、高阶自动驾驶等与先进制造深度绑定的领域被看好具备长期潜力[21][22] - 金融、医疗等行业目前仍处于从单点验证走向规模化复制的早期阶段[22]
国产超节点扎堆发布背后
经济观察网· 2025-11-14 22:10
超节点市场动态 - 2025年下半年起,国内多家科技公司密集发布超节点产品,包括华为、中兴通讯、超聚变、紫光股份旗下新华三、浪潮信息、百度、阿里巴巴及中科曙光等[2] - 华为在2025年中国国际大数据产业博览会上宣称其384超节点服务器的集群算力达到英伟达同类设备的1.67倍[2] - 中科曙光于2025年11月6日发布scaleX640超节点,宣称是"全球首个单机柜级640卡"集成产品[11] 超节点技术定义与分类 - 超节点在行业内有至少两种层级划分:单机柜内部实现高速互联(SuperNode)和由跨机柜组成的集群级互联(SuperPod)[3] - 超节点是将几十张乃至上百张AI计算卡集成进一台大机柜,通过内部高速互连使其像一块超级芯片一样工作[6] - 产品名称中的数字(如384、640)通常代表该超节点单机柜或单系统内集成的AI训练芯片数量,是衡量其规模与算力密度的核心指标[7] 超节点发展的驱动因素 - AI大模型训练面临"通信墙"瓶颈,在超高参数级别模型训练中,计算单元约40%的时间处于"空等"通信状态[4] - AI应用需求从"一个模型回答一个问题"转向需要多个模型协同工作的智能体(AI Agent),导致Token生成规模远超传统方式,对通信时延要求更高[8] - 国内单芯片算力存在短板,厂商通过构建多卡超节点模式在系统级上寻求优势,以弥补单卡性能差距[9] 超节点技术路径与工程挑战 - 行业主要采用两种构建大规模GPU集群的方式:Scale-Up(纵向扩展)和Scale-Out(横向扩展),超节点设计同时包含这两种方式[5][7] - Scale-Out网络通信时延约10微秒,而Scale-Up网络(如英伟达NVLink)目标时延为百纳秒级别,性能差距显著[8] - 高集成度带来工程挑战:英伟达GB200NVL72单柜72卡功耗达120千瓦,需采用液冷散热;其机柜内部需要铺设5000多条、总长近3200米的独立铜缆[14] - 互联协议出现分化:华为自研灵衢互联协议并开放技术规范;阿里、新华三等选择支持UALink等国际开放标准[15] 超节点市场前景与挑战 - 未来两到三年AI服务器需求主力为大型互联网企业和国家主导的主权云服务,后者旨在为本地化中小企业提供AI算力租赁服务[19] - 软件生态是国产算力厂商面临的共同挑战,用户更关注应用能否有效落地而非硬件参数[18] - AI算力最大应用场景目前是AIGC,但在智能制造等"AI+"领域,算力预期与实际需求存在落差;机器人、高阶自动驾驶等先进制造领域被看好具备长期潜力[20][21] - 金融、医疗等行业AI应用仍处于从单点验证走向规模化复制的早期阶段[22]