重视华为昇腾

电话会议纪要分析：华为昇腾950系列AI芯片及行业趋势一、纪要涉及的行业与公司 * 行业：AI芯片行业，特别是AI推理芯片领域[1] * 公司： * 华为：核心讨论对象，发布昇腾950系列AI芯片[1][2] * 国产AI芯片厂商：寒武纪（690系列）、海光（神算4号）[7] * 产业链公司：连接器供应商（华丰科技、意华股份、航天电器）、电源管理芯片公司（杰华特）[1][8] * 国际对标公司：英伟达（Rubin CPX架构）、谷歌（TurboQuant技术）[1][5] 二、核心观点与论据 1. 华为昇腾950系列芯片性能超预期，技术领先 * 昇腾950系列性能超出市场预期，在大型互联网公司的测试中反馈显著优于前代910B/910C系列[1][2] * 该系列是全球首款实现PD分离技术的AI芯片，领先于英伟达提出相同概念的Rubin CPX架构约一年进入市场[1] * 芯片支持FP4/FP8低精度运算，而前代产品仅支持FP16[2] * 支持超级节点和统一内存管理等新特性[2] 2. PD分离技术是应对AI推理需求的关键创新 * 技术定义：将大模型推理中的Prefill（提示处理）和Decode（解码生成）阶段解耦[3] * 技术意义：Prefill阶段需要高并行计算能力，Decode阶段对内存带宽要求极高（例如128K上下文窗口需300-500GB/s带宽，100万token上下文需2.5-3TB/s带宽），分离设计可针对性地优化资源配置，显著降低成本、节省存储并提高效率[4] * 华为实现：通过不同型号应用该技术，950P2针对Prefill阶段，计划于2026年第四季度推出的950DT针对Decode阶段[1][4] 3. 超级节点技术成为AI推理主流，国产芯片积极跟进 * 技术作用：将数十上百张AI加速卡高速互联，节省传输消耗，加快数据传输，非常适合当前流行的MoE（混合专家模型）架构推理场景，实现算力池化[6] * 华为策略：昇腾950系列支持超级节点，且华为将自制超级节点而非交由第三方[1][7] * 行业趋势：2026年被视为国产超级节点落地的元年，除华为外，寒武纪690系列、海光神算4号等国产芯片也已支持该技术[6][7] 4. 内存带宽需求在技术优化与应用拓展中持续增长 * 谷歌TurboQuant技术：通过数据表示方式的转换，可将KV Cache压缩6倍，例如将128K上下文所需的300-500GB/s带宽降低至50-70GB/s[5][6] * 长期趋势：尽管单位带宽需求可能因技术优化而下降，但业界正将模型上下文窗口从目前的100万token（1M）向一亿token（100M） 甚至更高扩展，以支持更复杂任务，因此硬件带宽需求总量将持续增长[1][6] 5. 2026年市场预期乐观，产业链投资机会明确 * 市场预期：预计2026年昇腾950芯片订单量至少50万颗以上，乐观情况可达70万颗，大型企业已增加订单[8] * 投资逻辑转向：华为自制超级节点的模式削弱了传统第三方服务器厂商的弹性[1][8] * 受益环节： * 连接器：在华为超级节点供应链中份额占比较高，主要受益标的包括华丰科技、意华股份、航天电器[1][8] * 电源管理芯片：例如杰华特等公司预计将受益[1][8] 6. 2026年国产AI芯片行业整体迈上新台阶 * 发展趋势：2026年是国产AI芯片性能迈上新台阶的关键年份，新一代产品在性能参数上相比2025年产品（如寒武纪580/590、华为910B/910C）有显著提升[9] * 具体进步：普遍支持低精度运算和超级节点技术，技术架构实现创新（如PD分离），整体性能大幅优化，能更好地满足AI推理应用需求[9] * 行业前景：随着AI推理趋势增强及超级节点等技术普及，国产AI芯片产业链迎来良好发展机遇[9] 三、其他重要内容 * 昇腾950系列通过算力池化高效适配MoE架构大模型推理[1] * 华为服务器的主要合作伙伴（华鲲振宇、超聚变）均未上市[8] * 昇腾950系列既能用于PD分离部署，也能用于训练任务[4]