Workflow
AI算力集群迈进“万卡”时代,超节点为什么火了?
第一财经·2025-07-30 15:59

超节点技术布局与趋势 - 华为、中兴通讯、新华三、超聚变等国内厂商在WAIC上集中展示超节点方案 超节点技术成为行业热点 [1][3] - 超节点通过整合算力芯片资源构建低延迟高带宽算力实体 提升集群算力利用效率 支撑千亿至万亿参数模型训练和推理 [3] - 英伟达较早布局超节点技术 其GB300 NVLink72方案可整合72个GPU和36个CPU到单一平台 [4] 超节点技术原理与价值 - 解决万卡集群时代芯片协同问题 通过scale up纵向拓展实现单节点内多GPU协同 避免传统横向拓展导致的算力性能损失 [5] - 在单颗芯片制程受限背景下 超节点成为提升集群性能的重要路径 国内厂商可通过大规模集群部署弥补单点性能不足 [9] - 光互连技术成为主流方向 光互连光交换方案实现纳秒级切换 保证高带宽低延迟通信 曦智科技、壁仞科技等厂商已推出相关方案 [6] 国产芯片市场竞争策略 - 国产AI芯片在服务器中占比提升 外购芯片份额从去年63%预计降至今年49% 英伟达仍计划推出针对中国市场的全新GPU [10] - 部分厂商采取差异化竞争策略:墨芯人工智能聚焦推理场景优化 云天励飞专注边缘计算和云端推理 后摩智能定位端边场景存算一体技术 [10][11][12] - 避开与海外巨头直接竞争 通过垂直行业定制化方案(如稀疏计算、边缘设备)实现特定场景下的性能优势 [11][13] 技术发展驱动因素 - 大模型参数量迈向万亿级 需1万张以上GPU构建具备容错能力的训练集群 推动超节点技术需求 [4] - 摩尔定律面临失效风险 芯片制程提升难度增大 促使行业通过集群互连技术突破算力瓶颈 [9] - 国内光通信技术全球领先 与海外先进水平无代差 为光互连方案提供技术基础 [9]