光跃LightSphereX

搜索文档
超节点,凭何成为AI算力“新宠”?
21世纪经济报道· 2025-07-31 09:00
超节点技术发展背景 - AI大模型发展推动算力需求进入"万卡协同"时代,传统算力架构难以满足高效、低耗、大规模协同需求 [1] - 英伟达率先提出超节点(SuperPod)概念,作为Scale Up最优解,通过高速总线互连加速GPU参数交换和数据同步 [1] - 2025世界人工智能大会展示中国企业在超节点领域突破,如华为昇腾384超节点首秀和曦智科技光互连方案获奖 [1] 超节点技术优势 - 超节点采用Scale Up方案,相比传统Scale Out在性能、成本、组网、运维等方面更具优势 [2] - 通过深度整合GPU资源构建低延迟、高带宽的统一算力实体,提升算力密度和能源效率(PUE) [2] - 采用液冷等先进散热技术,解决高功耗GPU服务器散热和供电挑战,单机柜可整合数十至上百计算单元 [2] 超节点连接方案 - 铜连接成为主流方案,224G以太网SerDes技术实现短距离高性价比传输,GB200 NVL72服务器单机柜使用5000多条电缆总长近2英里 [3] - 超节点方案分为私有协议(英伟达、华为等)和开放标准(ODCC主导的ETH-X项目)两种技术路线 [3][4] - ETH-X架构分为Scale Up(负责HBD内部GPU互联)和Scale Out(扩展多HBD组成集群)两部分 [4] 中国企业布局 - 华为发布昇腾384超节点,实现384卡高速总线互联,具备超大带宽、超低时延优势 [5] - 曦智科技联合壁仞科技推出全球首个分布式光互连光交换GPU超节点方案LightSphereX [5] - 燧原科技云燧ESL超节点系统单节点支持64卡全带宽互联,采用液冷方案 [5] - 摩尔线程构建全栈AI智算产品线,自研KUAE计算集群实现上千节点高效协作 [6] - 沐曦发布曦云C600 GPU支持MetaXLink超节点扩展技术,内置安全防护模块 [5] 市场前景 - 中信建投研报指出超节点已成为下一代服务器方案趋势,铜连接市场空间将随字节、阿里、腾讯采用而扩大 [4] - 行业认为中国超节点技术正为全球AI发展铺设兼具性能与包容性的新赛道 [6]