重视华为昇腾
2026-04-01 17:59

电话会议纪要分析:华为昇腾950系列AI芯片及行业趋势 一、 纪要涉及的行业与公司 * 行业:AI芯片行业,特别是AI推理芯片领域[1] * 公司: * 华为:核心讨论对象,发布昇腾950系列AI芯片[1][2] * 国产AI芯片厂商:寒武纪(690系列)、海光(神算4号)[7] * 产业链公司:连接器供应商(华丰科技、意华股份、航天电器)、电源管理芯片公司(杰华特)[1][8] * 国际对标公司:英伟达(Rubin CPX架构)、谷歌(TurboQuant技术)[1][5] 二、 核心观点与论据 1. 华为昇腾950系列芯片性能超预期,技术领先 * 昇腾950系列性能超出市场预期,在大型互联网公司的测试中反馈显著优于前代910B/910C系列[1][2] * 该系列是全球首款实现PD分离技术的AI芯片,领先于英伟达提出相同概念的Rubin CPX架构约一年进入市场[1] * 芯片支持FP4/FP8低精度运算,而前代产品仅支持FP16[2] * 支持超级节点和统一内存管理等新特性[2] 2. PD分离技术是应对AI推理需求的关键创新 * 技术定义:将大模型推理中的Prefill(提示处理)和Decode(解码生成)阶段解耦[3] * 技术意义:Prefill阶段需要高并行计算能力,Decode阶段对内存带宽要求极高(例如128K上下文窗口需300-500GB/s带宽,100万token上下文需2.5-3TB/s带宽),分离设计可针对性地优化资源配置,显著降低成本、节省存储并提高效率[4] * 华为实现:通过不同型号应用该技术,950P2针对Prefill阶段,计划于2026年第四季度推出的950DT针对Decode阶段[1][4] 3. 超级节点技术成为AI推理主流,国产芯片积极跟进 * 技术作用:将数十上百张AI加速卡高速互联,节省传输消耗,加快数据传输,非常适合当前流行的MoE(混合专家模型)架构推理场景,实现算力池化[6] * 华为策略:昇腾950系列支持超级节点,且华为将自制超级节点而非交由第三方[1][7] * 行业趋势2026年被视为国产超级节点落地的元年,除华为外,寒武纪690系列、海光神算4号等国产芯片也已支持该技术[6][7] 4. 内存带宽需求在技术优化与应用拓展中持续增长 * 谷歌TurboQuant技术:通过数据表示方式的转换,可将KV Cache压缩6倍,例如将128K上下文所需的300-500GB/s带宽降低至50-70GB/s[5][6] * 长期趋势:尽管单位带宽需求可能因技术优化而下降,但业界正将模型上下文窗口从目前的100万token(1M)向一亿token(100M) 甚至更高扩展,以支持更复杂任务,因此硬件带宽需求总量将持续增长[1][6] 5. 2026年市场预期乐观,产业链投资机会明确 * 市场预期:预计2026年昇腾950芯片订单量至少50万颗以上,乐观情况可达70万颗,大型企业已增加订单[8] * 投资逻辑转向:华为自制超级节点的模式削弱了传统第三方服务器厂商的弹性[1][8] * 受益环节: * 连接器:在华为超级节点供应链中份额占比较高,主要受益标的包括华丰科技、意华股份、航天电器[1][8] * 电源管理芯片:例如杰华特等公司预计将受益[1][8] 6. 2026年国产AI芯片行业整体迈上新台阶 * 发展趋势:2026年是国产AI芯片性能迈上新台阶的关键年份,新一代产品在性能参数上相比2025年产品(如寒武纪580/590、华为910B/910C)有显著提升[9] * 具体进步:普遍支持低精度运算和超级节点技术,技术架构实现创新(如PD分离),整体性能大幅优化,能更好地满足AI推理应用需求[9] * 行业前景:随着AI推理趋势增强及超级节点等技术普及,国产AI芯片产业链迎来良好发展机遇[9] 三、 其他重要内容 * 昇腾950系列通过算力池化高效适配MoE架构大模型推理[1] * 华为服务器的主要合作伙伴(华鲲振宇、超聚变)均未上市[8] * 昇腾950系列既能用于PD分离部署,也能用于训练任务[4]

重视华为昇腾 - Reportify