超节点
搜索文档
国产AI芯片“觉醒”:推理赛道起飞,谁能再破寒武纪神话?
南方都市报· 2026-01-06 17:01
行业核心观点 - 2025年是国产AI芯片加速替代和寻求破局的关键一年,AI算力需求从训练转向推理,DeepSeek的崛起引爆了国产替代热情 [2] - 2026年,在本土领先业者带动下,高阶AI芯片占比有机会向50%的目标迈进,相对低阶规格的AI推理芯片将获得较大发展机会 [2][23] - 国产算力的突围路径不仅是“造芯”,更要“组局”,核心是构建跨厂商、跨技术的开放协同生态 [2][17] 市场趋势与需求变化 - **推理需求爆发**:随着AI应用侧大爆发和开源模型成熟,算力需求从训练转向推理,AI推理芯片行业进入爆发式增长阶段 [3][5] - **市场规模激增**:2024年中国AI推理芯片相关产品及服务市场规模为1626亿元,预计2025年将增长至3106亿元,增幅显著 [5] - **边缘AI潜力大**:在DeepSeek效应推动下,国内各应用领域的边缘AI推理(如自动驾驶)较具发展潜力 [5] - **国产替代预期强**:国内企业在中国智能计算芯片市场份额预计将从2024年的约20%增加至2029年的约60% [6] - **通用GPU国产化率提升**:国内通用GPU市场国产化率从2022年的2%提升至2024年的3.6%,预计2029年将超50% [6] - **2026年市场展望**:预计2026年国内AI芯片规模将突破3000亿元,国产芯片有望提升份额 [22] 主要厂商动态与资本市场表现 - **厂商集中上市**:2025年底,摩尔线程和沐曦股份先后登陆科创板,成为“国产GPU第一股”和“第二股” [2][7] - **上市首日表现**:摩尔线程上市首日高开468.78%,报650元/股,市值超3000亿元;沐曦股份上市首日高开568.83%,报700元/股,市值超2800亿元 [7] - **后续上市计划**:壁仞科技和天数智芯将于2026年初赴港上市;燧原科技、瀚博半导体完成上市辅导;百度昆仑芯以保密形式申请在港交所上市 [9] - **寒武纪股价表现**:在DeepSeek发布适配国产芯片的模型格式后,寒武纪应声大涨,股价一度超过贵州茅台,单月涨幅高达100% [3] 市场竞争格局与份额 - **当前市场高度集中**:2024年中国AI加速器市场中,英伟达市占率约66%,华为海思约23%,AMD约5%,寒武纪、摩尔线程、沐曦股份均约1% [9] - **其他厂商份额较低**:天数智芯2024年在中国通用GPU市场份额为0.3%;壁仞科技预计2025年占约0.2%的市场份额 [10] - **未来格局预测**:Bernstein Research预测,2026年英伟达在中国AI芯片市场份额将显著萎缩至8%,华为将占据50%,AMD预计以12%位列第二,寒武纪或将排名第三 [10] 公司财务与经营状况 - **普遍处于亏损状态**:多数国产AI芯片厂商尚未实现盈利,2022年至2025年期间净亏损持续 [12] - **具体亏损数据**: - 摩尔线程:2022年至2025年前三季度净亏损分别为18.94亿元、17.03亿元、16.18亿元及7.24亿元 [12] - 沐曦股份:同期净亏损分别为7.77亿元、8.71亿元、14.09亿元及3.46亿元 [12] - 壁仞科技:2022年至2025年上半年净亏损分别为14.74亿元、17.44亿元、15.38亿元及16.01亿元 [12] - 天数智芯:同期净亏损分别为5.54亿元、8.17亿元、8.92亿元及6.09亿元 [12] - **寒武纪开始盈利**:寒武纪在2024年第四季度才开始实现盈利,2025年前三季度已盈利16.05亿元 [12] - **客户集中度高**:主要厂商前五大客户收入占比普遍较高,是其经营风险 [13] - **具体客户集中度数据**: - 摩尔线程:2022年至2025年上半年,前五大客户收入占比维持在89%以上,2024年高达98.16% [13][15] - 沐曦股份:收入基本在七成以上,2025年一季度达88.35% [13][15] - 壁仞科技:自2023年营收后,前五大客户收入维持在九成以上 [14][15] - 天数智芯:2022年至2024年占比在70%以上,2025年上半年降至38.6% [14][15] 技术发展、生态与供应链挑战 - **软件生态兼容策略**:部分厂商选择兼容CUDA生态以降低客户迁移成本,如摩尔线程的MUSA架构和沐曦的MXMACA软件栈 [17] - **华为构建自主生态**:华为强调不兼容CUDA,致力于从长远构建自主生态 [17] - **先进制程受限**:国产GPU厂商主流采用7nm或14nm制程,而英伟达已进入4nm时代,7nm以下制程难产直接影响算力密度和能效比 [18] - **供应链切换**:为应对外部不确定性,沐曦股份规划其曦云C600等后续产品采用国产供应链 [18] - **超节点技术突破**:厂商通过“超节点”形式绕开单芯片性能不足的问题,成为重要技术路径 [19] - **超节点案例**: - 华为发布基于昇腾910C的Cloud Matrix 384超节点,通过五倍数量的芯片抵消单芯片性能差距 [19] - 曦智科技联合壁仞科技、中兴通讯推出光跃Light SphereX分布式光互连超节点解决方案 [21] - 阿里巴巴发布磐久128超节点;百度公布天池256和512超节点,后者最高支持512卡极速互联 [21] 外部环境与竞争变数 - **英伟达在华波折**:2025年,英伟达专为中国设计的H20芯片被列入限制出口名单,致其市值蒸发1600亿美元;H20芯片后被指出存在安全漏洞 [16] - **H200出口放行**:2025年12月,美国商务部宣布放行英伟达H200 AI芯片对华出口,但中国相关部门回应将继续严格审查并优先采用国产算力方案 [16]
港交所GPU第一股:壁仞科技今日挂牌,三年狂砸33亿研发筑牢技术底座
每日经济新闻· 2026-01-02 12:28
公司里程碑与市场地位 - 壁仞科技于1月2日正式登陆港交所,成为“港交所GPU第一股” [1] - 公司以“硬核”技术见长,是算力领域应用先进封装技术的先行者,在支持先进互连规格方面处于行业领先梯队 [1] - 公司致力于在万亿级的算力市场中构建中国自主的算力生态体系 [1] 核心技术优势:先进封装与互连 - 公司在国内率先将Chiplet技术应用于芯片设计,是应用先进封装的佼佼者 [1] - 公司联合合作伙伴实现了超节点(超级算力集群)Scale up路线的突破,而国内其他方案主要以Scale out为主 [2] - 2025年7月26日,公司联合曦智科技、中兴通讯申报的“分布式OCS全光互连芯片及超节点应用创新方案”斩获“SAIL”奖 [2] - OCS(光交换)技术相比机柜内部主流的铜缆互连,能缩短光电转换距离,降低信号延迟;相比机柜间连接的光模块,集成度更高,在稳定性和能耗方面更具优势 [2] - 基于GPGPU与光互连技术构建的南向超节点拥有开放性、易用性、先进性、性价比高、灵活性高等优势,能适应主流大模型需求并为未来训练开发提供支撑 [3] - 公司在应用OCS技术上已站在世界前沿 [4] 生态系统构建与产业合作 - 公司正加速构建自主可控的国产算力生态网 [4] - 硬件层面,已与浪潮、新华三、中兴通讯、联想、超聚变等国内主流服务器厂商完成产品适配,并实现对海光国产CPU的支持 [4] - 软件层面,产品已全面兼容PyTorch、DeepSpeed/vLLM、百度飞桨等主流AI框架,以及麒麟、统信等国产操作系统,实现了从底层硬件到上层应用的全栈打通 [4] - 公司积极推动“算力-模型-应用”的闭环落地 [4] - 在具身智能领域,2024年12月与大晓机器人签署战略协议,共建全栈国产化软硬一体基础设施 [5] - 在数据中心基建方面,2025年8月携手科华数据、神州数码,构建了“芯片-服务器-数据中心-算力服务”四位一体的产业生态闭环 [5] - 面对算力多元异构痛点,公司与中国移动、中国电信、中国联通三大运营商建立深度合作,致力于解决“算力孤岛”难题 [5] 研发投入与行业背景 - 2022年至2024年及2025年上半年,公司研发开支分别为10.18亿元、8.86亿元、8.27亿元及5.72亿元 [5] - 上述期间研发开支占总经营开支的比例分别为79.8%、76.4%、73.7%及79.1% [5] - 三年一期累计研发开支达到33.02亿元 [5] - 国内算力厂商在单卡性能上与国际厂商存在差距,为“弯道超车”,国内厂商纷纷推出超节点以实现集群算力优势 [1] - 算力厂商的竞赛已从单卡延伸至超节点(超级算力集群) [1]
华尔街见闻早餐FM-Radio|2025年12月29日
搜狐财经· 2025-12-29 07:54
市场表现 - 美股三大指数在圣诞节后首个交易日微跌,标普500跌0.03%报6929.94点,道指跌0.04%报48710.97点,纳指跌0.09%报23593.097点,全周则分别累计上涨1.40%、1.20%和1.22% [1][8] - 贵金属价格表现疯狂,COMEX黄金期货涨1.33%报4563.00美元/盎司创历史新高,全周累计上涨4.06%;COMEX白银期货飙升10.84%报79.455美元/盎司;现货铂金上涨8%至每盎司2,413.62美元创新高;COMEX铜期货涨5.01%报5.8545美元/磅刷新历史高位 [2][9] - 亚洲时间周一早盘,现货白银继续大涨5%报83.31美元/盎司 [3] - 加密货币冲高转跌,比特币日内一度涨破8.9万美元,随后较日高下挫3.2%;以太坊逼近3000美元后转跌 [2] - 因俄乌冲突迎来和平曙光,WTI原油期货较日高下挫3.7%,收跌2.76%报56.74美元/桶 [2][9] - 美国10年期国债收益率跌0.38个基点报4.1297%,全周累计下跌1.74个基点 [9] 宏观经济与政策 - 中国财政部表示2026年将继续实施更加积极的财政政策,扩大财政支出盘子,并继续支持消费品以旧换新 [4][13] - 中国11月规模以上工业企业利润同比下降13.1%,前11个月同比微增;1-11月高技术制造业利润同比增长10.0%,增速较1-10月加快2.0个百分点 [4][13] - 香港财政司司长陈茂波表示将从三方面助力人民币国际化,并计划吸引全球优质公司来港上市,开拓国际黄金交易新机遇 [4][14] - 国盛证券复盘指出,历史上5轮PPI回升期间A股多呈上行趋势,预计2026年PPI有望迎来第六轮上升,股市成长可能仍是主线 [20] 公司动态 - 小米集团联合创始人林斌计划自2026年12月开始,每12个月出售不超过5亿美元的公司B类普通股,累计出售总金额不超过20亿美元,所得款项主要用于成立投资基金公司 [7][17] - 茅台新任董事长表示明年将不再使用分销方式,在2026年投放计划中会适当减少高附加值产品的量,并推进价格市场化改革 [6][17] - 甲骨文股价四季度或创互联网泡沫以来最大跌幅,尽管获得OpenAI超3000亿美元订单,但激进扩张计划引发分析师对其履约能力和投资级评级的担忧 [23] - 英伟达正引领数据中心转向800V直流电架构,以支撑2027年单机柜功率达1MW的AI算力需求,高盛称此举将重构资本开支重心并引发产业链洗牌 [24] 行业与产业 - 磷酸铁锂行业四家主要企业(湖南裕能、万润新能、德方纳米、安达科技)计划在2026年1月集体检修减产,这四家企业覆盖约50%市场份额,其中三家披露的1月减产幅度约35%-50% [21] - 风电制造业已率先走出“内卷”,自2024年11月至今中国风机中标价格(不含塔筒)未再低于1400元/千瓦的成本线 [21] - 国信证券将当前AI浪潮类比1998年初互联网泡沫后期,认为处于“1→N”阶段尾声,预计2026年中迎来温和回调,随后进入更泡沫化的“N→N+”加速期 [22] - 人形机器人领域2025年吸金约50亿美元,但多家美国初创公司高管警告市场炒作过头,当前技术尚不足以支持复杂应用,且部署成本高昂 [24] - 数据中心因接入电网等待时间过长,科技巨头转向抢购航空发动机和柴油发电机“应急”供电,GE Vernova订单激增三分之一,但这种现场发电成本是工业发电均价的两倍 [25] 投资主题与展望 - 国金证券认为2026年新的投资主线已体现,建议关注AI投资与全球制造业复苏共振的工业资源品、具备全球比较优势的中国设备出口链以及国内制造业底部反转品种 [19] - Ed Yardeni展望2026年,认为美国经济不衰退,标普500指数看齐7700点,美债收益率稳于4%以上,金价长期有望看齐6000美元 [18] - 申万宏源认为中证A500ETF年底冲量担忧不改春季行情有利条件,春季科技和顺周期有Alpha机会,主题活跃,对应小盘成长占优 [20] 新兴技术与概念 - 商业航天:上交所发布指引细化商业火箭企业适用科创板第五套上市标准,旨在加快推进商业航天创新发展 [26] - 人工智能:国家金融监督管理总局发布《银行业保险业数字金融高质量发展实施方案》,提出33项工作任务;金融行业2023年科技投入总规模达3598亿元,2024-2028年预计复合增长率约13.3% [26][27] - 机器人:工业和信息化部人形机器人与具身智能标准化技术委员会成立,将推动行业标准制修订工作 [27] - 超节点技术:昇思MindSpore聚焦超节点技术创新,打造昇思HyperParallel架构,引领AI框架迈入“超节点时代” [28] - 核医疗:我国首个核医疗示范基地在苏州正式启用,中国核医疗市场预计到“十五五”末年产值有望达6000亿元左右 [29] - 华为产业链:华为宣布2026年在韩国市场推出AI芯片“昇腾950”及整体解决方案,挑战英伟达垄断地位;HarmonyOS全球生态设备已超3200万 [30]
昇思人工智能框架峰会于杭州召开,正式发布“超节点时代”AI框架新范式
环球网· 2025-12-28 15:13
昇思MindSpore技术架构发布 - 昇思MindSpore提出“超节点”概念,将多台深度互联的物理服务器视为一台“超级计算机”,以应对大模型向十万亿级参数等方向演进对算力、存储与调度效率的更高要求[2] - 昇思正式发布HyperParallel架构,包含三大核心技术:HyperOffload通过计算与状态分离突破HBM瓶颈,训练性能提升20%以上,推理序列长度提升70%;HyperMPMD实现异构并行,提升算力利用率15%以上;HyperShard引入声明式并行编程,使新算法并行改造时间缩短至1天内,并行调优效率从“天级”跃升至“小时级”[4] - HyperParallel架构正式版本及配套加速套件计划于2026年上半年发布[4] 昇思MindSpore社区发展与应用成果 - 自2020年3月开源以来,昇思MindSpore下载量超1300万,覆盖全球156个国家和地区,社区贡献者逾5.2万人,支撑3100余项行业应用,发表近2500篇学术论文,在全球AI框架中稳居中国第一、世界第二[4] - 在“AI for Science”领域,基于昇思框架开发的民机超临界翼型气动设计智能体“御风·智翼”,将传统需数周的气动设计流程压缩至实时交互级别[5] - 在金融领域,招商银行基于昇思构建金融专精大模型,通过多维混合并行策略实现百亿参数模型的稳定训练,已在安全合规、知识问答等上百个场景落地[7] 行业趋势与生态合作 - 行业观点认为大模型的能力密度正以每3.3个月翻倍的速度增长,未来AGI发展需通过高效架构、高质量数据等方法实现“小模型、大智能”[7] - 昇思已原生支持端边云全场景部署,并全面兼容Numpy、Scipy等科学计算接口,同时与vLLM、SGLang等推理引擎完成深度集成[8] - SGLang推理引擎已正式合入MindSpore后端,支持Qwen3、DeepSeek等模型,并完成W8A8量化等关键特性适配[8] - 在人才培养方面,昇思与高校共建的大模型创新人才培养体系已覆盖全国百余所高校、400余名教师[8] 公司战略与未来展望 - 公司表示将持续打造超节点亲和、全场景融合、架构开放、敏捷使能的AI框架,以助力千行万业智能化转型[9] - 随着AI进入“超节点时代”,昇思MindSpore正携手全球开发者与产业伙伴,共同定义下一代AI基础设施,加速通用人工智能时代的到来[10]
国产数据库加速创新,产学研用共建超节点数据库联盟
新浪财经· 2025-12-27 13:18
行业趋势与机遇 - 数据是信息时代的核心资产,数据库是管理和存储数据的核心基础技术,并在AI时代面临全新机遇和挑战 [1] - 当前正处在以大数据为核心、并逐步走向多模态的第三次人工智能发展繁荣周期 [1] - 中国数据库产业正处于高质量发展的关键阶段,面临技术路线协同、超大规模数据处理及AI融合等新课题 [2] 技术发展与创新 - 超节点是AI算力时代的一种创新技术,通过高速互联技术将成千上万个算力卡连接、整合为一个高效处理大规模任务的超级计算单元 [1] - 面对超节点这一行业趋势,新成立的联盟将推动超节点架构下国产数据库技术的突破与创新,加速成果转化与落地应用 [1] - 华为与openGauss社区伙伴共同推进数据库核心能力创新,增强了向量数据引擎DataVec能力,并发布了业界首个开源多写数据库oGRAC [2] - 顶尖国家级科研力量(如中国科学院软件研究所)与开源社区的深度融合,将极大强化基础软件领域的原始创新与前沿探索能力 [3] openGauss社区生态与市场地位 - openGauss社区联合运营商、数据库厂商、中国科学院及顶尖高校在内的13家产学研用单位,共同成立“超节点数据库产学研联盟” [1] - openGauss社区生态经过5年发展,已汇聚超880家产业链伙伴与8400余名全球开发者,社区版本在全球超过550万次下载 [2] - openGauss已在中国线下集中式关系型数据库市场份额达到35.02%,基于openGauss的商业版本数占比达到29.4% [2] - openGauss的技术路线已成长为国内最受欢迎的路径之一,在金融、政务、运营商等关键行业实现规模化商用 [1][2] 发展共识与路径 - 坚持长期主义、构筑坚实的算力与数据底座至关重要 [1] - 面对深层次课题,需要产业界凝聚共识、形成合力,开源协作是凝聚产业智慧的关键路径 [2] - openGauss社区走出了中国开源基础软件立根铸魂的坚实一步 [1]
AI框架迈入超节点时代 国产技术加快产业落地
新浪财经· 2025-12-26 20:55
行业趋势:AI算力基础设施进入超节点时代 - AI大模型正向十万亿级参数、全模态融合、异构化训推方向演进,驱动算力基础设施从传统服务器集群迈入“超节点时代” [1] - 超节点通过高速互联技术深度整合多台物理机器,形成具备资源池化、规模扩展与长稳可靠特性的“超级计算机”,已成为支撑大模型训练推理的核心算力底座 [1] - 超节点已成为AI算力基础设施的新常态,带来了算力效能的指数级提升 [1] 技术挑战与框架创新 - 超节点架构对AI框架的并行调度、存储优化、编程易用性提出了前所未有的挑战 [1] - AI框架作为连接算力与应用的核心枢纽,其重要性愈发凸显 [1] - 昇思MindSpore针对超节点架构打造HyperParallel架构,将超节点视为一台“超级计算机”进行编程和调度,实现“复杂留给框架,简单交给用户”的设计理念 [1] 应用实践与产业落地 - 在航空工业领域,中国商飞基于昇思框架打造的“御风·智翼”智能体,借助超节点大规模并行计算能力,将民用飞机超临界翼型设计的仿真周期从数周压缩至分钟级 [2] - 在金融领域,招商银行基于昇思框架的多维混合并行策略,构建了百亿参数金融专精模型,应用于安全合规、客户投诉处理等场景,模型训练稳定运行周期可达1-2个月 [2] - 超节点适配的AI框架已在关键领域展现实践价值,正在加速产业落地 [1][2] 生态发展与社区规模 - 生态协同是超节点时代AI框架发展的核心支撑 [2] - 昇思MindSpore开源五年来,已聚集5.2万名核心贡献开发者,覆盖全球150多个国家和地区 [2] - 昇思MindSpore累计下载量超1300万次,支持25类主流大模型及3100多个行业应用 [2]
华勤技术:针对新技术和新产品方向如AI端侧、超节点、汽车电子等方向都持续增加研发资源
格隆汇· 2025-12-24 16:03
公司研发投入与财务表现 - 2025年前三季度研发费用合计46.20亿元人民币,同比增长23.7% [1] - 预计2025年全年研发投入将超过60亿元人民币 [1] 研发团队规模与投入方向 - 公司目前研发技术人员规模将近2万名 [1] - 研发投入主要围绕“3+N+3”的产品布局及满足业务增长需要 [1] - 前瞻性研发预研通过Xlab在声学、光学、热学、射频等领域展开 [1] - 针对AI端侧、超节点、汽车电子等新技术和新产品方向持续增加研发资源 [1] - 机器人是公司明确的研发投入方向之一 [1] 研发战略与核心竞争力 - 公司始终高度重视研发能力建设与技术创新,在研发端保持持续而稳健的投入 [1] - 研发是公司的核心竞争力,公司将持续加大研发投入以夯实技术护城河 [1] - 研发投入的目标是实现公司的可持续高质量发展 [1]
华勤技术(603296.SH):针对新技术和新产品方向如AI端侧、超节点、汽车电子等方向都持续增加研发资源
格隆汇· 2025-12-24 15:56
公司研发投入与财务表现 - 2025年前三季度研发费用合计46.20亿元人民币,同比增长23.7% [1] - 预计2025年全年研发投入将超过60亿元人民币 [1] 研发团队规模与投入方向 - 公司目前研发技术人员规模将近2万名 [1] - 研发投入主要围绕“3+N+3”的产品布局以及满足业务增长的需要 [1] - 公司投入前瞻性研发预研,例如Xlab在声学、光学、热学、射频等领域的研究 [1] - 针对AI端侧、超节点、汽车电子等新技术和新产品方向持续增加研发资源 [1] - 机器人是公司一个明确的研发投入方向 [1] 研发战略与核心竞争力 - 公司始终高度重视研发能力建设与技术创新,在研发端保持持续而稳健的投入 [1] - 研发是公司的核心竞争力,公司将持续加大研发投入以夯实技术护城河 [1] - 公司旨在通过研发投入实现可持续高质量发展 [1]
超节点互连技术落地 国产万卡超集群首次真机亮相
21世纪经济报道· 2025-12-19 21:32
行业趋势:算力需求与架构演进 - 主流大模型参数已从千亿级跃升至万亿级规模,驱动算力需求持续爆发式增长,EFLOPS算力级别、万卡级别高性能集群成为大模型标配 [2] - 为满足苛刻的算力要求,行业正从追求通用性和灵活性的解耦设计,转向通过牺牲部分通用性以换取性能极致优化的新架构 [3] - 构建大规模智算集群的主流架构思路是:先通过Scale-up策略将数百张加速卡集成为内部高速互联的超节点,再将这些超节点作为标准单元进行Scale-out横向扩展,最终构筑万卡规模集群 [6] - 行业目标持续升级,从千卡、万卡集群向未来的几十万卡甚至百万卡集群迈进,高速互连的重要性愈加凸显 [7] 产品创新:超节点与万卡集群 - 超节点因密度和性能优势,正成为新建万卡集群的首选架构之一,其将大量AI加速卡以超高密度集成在单个或少数几个机柜内,通过内部高速总线或专用互连网络,实现“物理多机、逻辑单机”的新型计算单元 [3] - 中科曙光于2025年11月发布全球首个单机柜级640卡超节点——scaleX640,这是全球已公开的在单个机柜内集成加速卡数量最多的超节点产品 [3] - scaleX640采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04 [1] - 中科曙光于2025年12月18日发布并展出了scaleX万卡超集群,由16个scaleX640超节点通过scaleFabric高速网络互连而成,实现10240块AI加速卡部署,总算力规模超5EFlops,这是国产万卡级AI集群系统首次以真机形式亮相 [4][5] - 华为昇腾384超节点真机也在2025年世界人工智能大会期间首秀,标志着国产算力“大基建”正从图纸走进现实 [1] 技术突破:高速互连与网络 - 在单机柜内把芯片互连规模做大,可以让芯片之间的互连更加可靠、高效,因为柜内互联采用高效低成本的电信号,而柜间则依赖高功耗、高成本的光模块 [3] - 在超节点间,曙光scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,并可将超集群规模扩展至10万卡以上 [7] - 相比传统IB网络,scaleFabric网络性能提升2.33倍,同时网络总体成本降低30% [7] - 自研原生RDMA高速网络至关重要,其角色类似于英伟达生态中基于Mellanox技术的InfiniBand网络,承担着节点间Scale-Out的重任 [7] 挑战与产业链影响 - 超节点面临海量芯片协同工作带来的系统散热压力、多芯片间光/铜混合互连方案引发的稳定性问题,以及多零部件长期运行下的可靠性隐患等复杂系统性挑战 [8] - 解决上述问题需要服务器厂商与上游各环节厂商深度协同,探索全局最优解决方案,这使得整机环节在产业链中的话语权显著提升 [8] - 当智算集群规模扩展至万卡乃至十万卡级别,集群设计与建设面临可扩展性、可靠性与能效三大核心挑战 [8] - 为保证可扩展性,必须构建具备高带宽、低延迟的强大互连网络,确保集群规模增长时计算效率不会出现断崖式下降,并实现大规模组网下的有效管理 [8] - 可靠性方面,海量设备数量累加会遵循“木桶效应”,即便单点可靠性极高,整体系统的无故障运行时间也会被指数级拉低 [8] - 最紧迫的是能耗与能效问题,随着单个算力中心体量从MW级向未来GW级演进,传统的供电技术已难以为继,必须实现供电技术的根本性突破,并辅以先进的软件管理调度 [8]
超节点互连技术落地,国产万卡超集群首次真机亮相
21世纪经济报道· 2025-12-19 21:24
行业趋势:AI算力需求爆发与集群规模演进 - 主流大模型参数从千亿级跃升至万亿级规模,算力需求持续爆发式增长,EFLOPS算力级别、万卡级别高性能集群成为大模型标配[1] - 超节点因密度和性能优势,正成为新建万卡集群的首选架构之一[1] - 行业构建大规模智算集群的主流架构思路是:先通过Scale-up策略将数百张加速卡集成为超节点,再将这些超节点作为标准单元进行Scale-out横向扩展,最终构筑万卡规模[5] - 集群规模持续扩大,从千卡、万卡发展到未来的几十万甚至百万卡,国际上Meta、微软、OpenAI等AI巨头已陆续宣布或完成10万卡集群建设[6][7] 技术突破:国产万卡级AI集群真机亮相 - 中科曙光在HAIC2025大会上发布并展出了scaleX万卡超集群,这是国产万卡级AI集群系统首次以真机形式亮相[1] - 此前国内万卡集群项目多以分散服务器、技术蓝图或在建工程形式存在,例如三大运营商已投产的万卡集群多为分散部署的标准服务器,物理形态并非一体化单元[1] - 同样在2025年,华为昇腾384超节点真机也在世界人工智能大会期间首秀,标志着国产算力“大基建”正从图纸走进现实[1] 产品核心:scaleX万卡超集群与scaleX640超节点 - scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超5EFlops[1][3] - scaleX640是全球首个单机柜级640卡超节点,采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04[1] - scaleX640是全球已公开的、在单个机柜内集成加速卡数量最多的超节点产品[2] 技术架构:超节点的设计逻辑与优势 - 超节点是一种Scale-up纵向扩展解决方案,将大量AI加速卡以超高密度集成在单个或少数几个机柜内,通过内部高速总线或专用互连网络,实现“物理多机、逻辑单机”的新型计算单元[2] - 当前算法对算力的苛刻要求,迫使业界牺牲部分通用性以换取性能的极致优化,超节点应此需求而生[2] - 在单机柜内把芯片互连规模做大,可以让芯片之间的互连更加可靠、高效,因为柜内互联采用高效低成本的电信号,而柜间依赖高功耗、高成本的光模块[2] - 中科曙光、华为Atlas超节点、英伟达NVL72等产品均已应用超节点架构[2] 关键挑战:大规模集群的系统性难题 - 当智算集群规模扩展至万卡乃至十万卡级别,集群设计与建设面临可扩展性、可靠性与能效三大核心挑战[8] - 可扩展性挑战:必须构建具备高带宽、低延迟的强大互连网络,确保集群规模增长时计算效率不会出现断崖式下降,并实现大规模组网下的有效管理[8] - 可靠性挑战:海量设备数量累加遵循“木桶效应”,即便单点可靠性极高,整体系统的无故障运行时间也会被指数级拉低[8] - 能耗与能效挑战:随着单个算力中心体量从MW级向未来GW级演进,传统供电技术已难以为继,必须实现供电技术的根本性突破,并辅以先进的软件管理调度[8] - 超节点面临复杂的系统性挑战,包括海量芯片协同带来的系统散热压力、光铜混合互连方案引发的稳定性问题、多零部件长期运行下的可靠性隐患,这类问题需要服务器厂商与上游各环节深度协同解决[7] 网络互连:高速互连技术的重要性与突破 - 随着集群规模从千卡、万卡向几十万卡发展,高速互连的重要性愈加凸显[7] - 在超节点间,曙光scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,并可将超集群规模扩展至10万卡以上[7] - scaleFabric网络相比传统IB网络性能提升2.33倍,同时网络总体成本降低30%[7] - 自研原生RDMA高速网络至关重要,英伟达生态体系中的“三驾马车”包括:核心GPU提供算力、NVLink负责节点内超高速互联、基于Mellanox技术的InfiniBand网络承担节点间Scale-Out重任[7]