PD 分离技术 - 财报，业绩电话会，研报，新闻

PD 分离技术

搜索文档

2026-04-01 17:59

电话会议纪要分析：华为昇腾950系列AI芯片及行业趋势一、纪要涉及的行业与公司 * **行业**：AI芯片行业，特别是AI推理芯片领域[1] * **公司**： * **华为**：核心讨论对象，发布昇腾950系列AI芯片[1][2] * **国产AI芯片厂商**：寒武纪（690系列）、海光（神算4号）[7] * **产业链公司**：连接器供应商（华丰科技、意华股份、航天电器）、电源管理芯片公司（杰华特）[1][8] * **国际对标公司**：英伟达（Rubin CPX架构）、谷歌（TurboQuant技术）[1][5] 二、核心观点与论据 1. 华为昇腾950系列芯片性能超预期，技术领先 * 昇腾950系列性能超出市场预期，在大型互联网公司的测试中反馈显著优于前代910B/910C系列[1][2] * 该系列是全球首款实现**PD分离**技术的AI芯片，领先于英伟达提出相同概念的Rubin CPX架构约一年进入市场[1] * 芯片支持**FP4/FP8低精度运算**，而前代产品仅支持FP16[2] * 支持**超级节点**和统一内存管理等新特性[2] 2. PD分离技术是应对AI推理需求的关键创新 * **技术定义**：将大模型推理中的Prefill（提示处理）和Decode（解码生成）阶段解耦[3] * **技术意义**：Prefill阶段需要高并行计算能力，Decode阶段对内存带宽要求极高（例如128K上下文窗口需300-500GB/s带宽，100万token上下文需2.5-3TB/s带宽），分离设计可针对性地优化资源配置，显著降低成本、节省存储并提高效率[4] * **华为实现**：通过不同型号应用该技术，**950P2**针对Prefill阶段，计划于**2026年第四季度**推出的**950DT**针对Decode阶段[1][4] 3. 超级节点技术成为AI推理主流，国产芯片积极跟进 * **技术作用**：将数十上百张AI加速卡高速互联，节省传输消耗，加快数据传输，非常适合当前流行的MoE（混合专家模型）架构推理场景，实现算力池化[6] * **华为策略**：昇腾950系列支持超级节点，且华为将**自制超级节点**而非交由第三方[1][7] * **行业趋势**：**2026年被视为国产超级节点落地的元年**，除华为外，寒武纪690系列、海光神算4号等国产芯片也已支持该技术[6][7] 4. 内存带宽需求在技术优化与应用拓展中持续增长 * **谷歌TurboQuant技术**：通过数据表示方式的转换，可将KV Cache压缩**6倍**，例如将128K上下文所需的300-500GB/s带宽降低至50-70GB/s[5][6] * **长期趋势**：尽管单位带宽需求可能因技术优化而下降，但业界正将模型上下文窗口从目前的100万token（1M）向**一亿token（100M）** 甚至更高扩展，以支持更复杂任务，因此硬件带宽需求总量将持续增长[1][6] 5. 2026年市场预期乐观，产业链投资机会明确 * **市场预期**：预计**2026年昇腾950芯片订单量至少50万颗以上，乐观情况可达70万颗**，大型企业已增加订单[8] * **投资逻辑转向**：华为自制超级节点的模式削弱了传统第三方服务器厂商的弹性[1][8] * **受益环节**： * **连接器**：在华为超级节点供应链中份额占比较高，主要受益标的包括华丰科技、意华股份、航天电器[1][8] * **电源管理芯片**：例如杰华特等公司预计将受益[1][8] 6. 2026年国产AI芯片行业整体迈上新台阶 * **发展趋势**：2026年是国产AI芯片性能迈上新台阶的关键年份，新一代产品在性能参数上相比2025年产品（如寒武纪580/590、华为910B/910C）有显著提升[9] * **具体进步**：普遍支持低精度运算和超级节点技术，技术架构实现创新（如PD分离），整体性能大幅优化，能更好地满足AI推理应用需求[9] * **行业前景**：随着AI推理趋势增强及超级节点等技术普及，国产AI芯片产业链迎来良好发展机遇[9] 三、其他重要内容 * 昇腾950系列通过算力池化高效适配MoE架构大模型推理[1] * 华为服务器的主要合作伙伴（华鲲振宇、超聚变）均未上市[8] * 昇腾950系列既能用于PD分离部署，也能用于训练任务[4]