纪要涉及的行业与公司 * 行业:人工智能算力行业,特别是大模型推理算力、国产AI芯片及超节点解决方案领域[1] * 公司: * 芯片/解决方案厂商:华为(950PR, 950DT)、寒武纪(690)、海光(深算4号)、阿里云(PPU芯片)[1][4][5][8] * 产业链供应商:盛科通信(交换机芯片)、华丰科技、易华股份、航天电器(连接器)[1][5][6] 核心观点与论据 * 推理时代核心需求转变:从训练时代的规模与稳定性需求,转向推理时代的低延迟需求[2] * 实现低延迟推理的三大技术特征: 1. 高速光互联技术:采用CPO、OCS等新兴光通信技术加快数据传输[2] 2. 算力池化:将算力资源分为计算单元池和存储单元池,实现灵活调用,缩短数据路径[2] 3. 专用推理芯片:采用PD分离架构或集成LPU等针对推理场景的芯片[2] * 超节点的定义与价值: * 定义为由几十张甚至上百张卡组成的小型集群(如谷歌64卡TPU Pod)[3] * 是上述三大技术特征的综合落地表现形式[2] * 与MoE(混合专家模型)架构高度契合,通过将不同Expert部署于特定节点,实现精准调用,从而降低深度推理延迟与成本[1][4] * 2026年为国产超节点元年: * 核心原因:新一代国产芯片实现关键突破,能有效支持大模型深度推理[4] * 前代芯片局限:2025年及以前的老一代芯片(如寒武纪580/590、华为910B/910C)仅支持FP16格式,进行大模型深度推理效果不佳[4] * 新一代芯片关键突破: 1. 全面支持FP8甚至FP4数据格式[4][5] 2. 原生支持构建超节点[5] 3. 芯片自身算力性能显著提升[5] * 落地节奏:2026年上半年主要进行测试,下半年国产超节点落地将加速[4] 主要厂商产品与预期 * 华为950系列芯片: * 950PR:全球首款采用PD分离架构的AI芯片,已出货,专门用于推理[1][5];2026年出货量预期约50万颗[1][7] * 950DT:预计2026年第四季度推出,主要用于推理,也可支持训练[1][5] * 阿里云PPU芯片: * 2025年采用N+1工艺,2026年将升级至N+2工艺[1][8] * 2026年全年出货量预期**>=35万颗**,2027年有望翻倍至70万颗左右[1][8] * 其他国产芯片厂商:寒武纪(690芯片)、海光(深算4号)也将在2026年推出新一代芯片,并以超节点形式向字节、腾讯、阿里等客户交付[8] 产业链受益环节与市场空间 * 连接器:市场份额主要由华丰科技、易华股份、航天电器等公司占据[1][5] * 液冷板:相关供应商具备一定弹性[6] * 交换机芯片:以盛科通信为例,其交换机芯片与阿里PPU芯片的配比约为1:4[1][8];基于PPU芯片的出货量预期,可测算出盛科通信对应的市场空间[8]
再次强调今年要重视国产超节点