Workflow
PD 分离技术
icon
搜索文档
重视华为昇腾
2026-04-01 17:59
电话会议纪要分析:华为昇腾950系列AI芯片及行业趋势 一、 纪要涉及的行业与公司 * **行业**:AI芯片行业,特别是AI推理芯片领域[1] * **公司**: * **华为**:核心讨论对象,发布昇腾950系列AI芯片[1][2] * **国产AI芯片厂商**:寒武纪(690系列)、海光(神算4号)[7] * **产业链公司**:连接器供应商(华丰科技、意华股份、航天电器)、电源管理芯片公司(杰华特)[1][8] * **国际对标公司**:英伟达(Rubin CPX架构)、谷歌(TurboQuant技术)[1][5] 二、 核心观点与论据 1. 华为昇腾950系列芯片性能超预期,技术领先 * 昇腾950系列性能超出市场预期,在大型互联网公司的测试中反馈显著优于前代910B/910C系列[1][2] * 该系列是全球首款实现**PD分离**技术的AI芯片,领先于英伟达提出相同概念的Rubin CPX架构约一年进入市场[1] * 芯片支持**FP4/FP8低精度运算**,而前代产品仅支持FP16[2] * 支持**超级节点**和统一内存管理等新特性[2] 2. PD分离技术是应对AI推理需求的关键创新 * **技术定义**:将大模型推理中的Prefill(提示处理)和Decode(解码生成)阶段解耦[3] * **技术意义**:Prefill阶段需要高并行计算能力,Decode阶段对内存带宽要求极高(例如128K上下文窗口需300-500GB/s带宽,100万token上下文需2.5-3TB/s带宽),分离设计可针对性地优化资源配置,显著降低成本、节省存储并提高效率[4] * **华为实现**:通过不同型号应用该技术,**950P2**针对Prefill阶段,计划于**2026年第四季度**推出的**950DT**针对Decode阶段[1][4] 3. 超级节点技术成为AI推理主流,国产芯片积极跟进 * **技术作用**:将数十上百张AI加速卡高速互联,节省传输消耗,加快数据传输,非常适合当前流行的MoE(混合专家模型)架构推理场景,实现算力池化[6] * **华为策略**:昇腾950系列支持超级节点,且华为将**自制超级节点**而非交由第三方[1][7] * **行业趋势**:**2026年被视为国产超级节点落地的元年**,除华为外,寒武纪690系列、海光神算4号等国产芯片也已支持该技术[6][7] 4. 内存带宽需求在技术优化与应用拓展中持续增长 * **谷歌TurboQuant技术**:通过数据表示方式的转换,可将KV Cache压缩**6倍**,例如将128K上下文所需的300-500GB/s带宽降低至50-70GB/s[5][6] * **长期趋势**:尽管单位带宽需求可能因技术优化而下降,但业界正将模型上下文窗口从目前的100万token(1M)向**一亿token(100M)** 甚至更高扩展,以支持更复杂任务,因此硬件带宽需求总量将持续增长[1][6] 5. 2026年市场预期乐观,产业链投资机会明确 * **市场预期**:预计**2026年昇腾950芯片订单量至少50万颗以上,乐观情况可达70万颗**,大型企业已增加订单[8] * **投资逻辑转向**:华为自制超级节点的模式削弱了传统第三方服务器厂商的弹性[1][8] * **受益环节**: * **连接器**:在华为超级节点供应链中份额占比较高,主要受益标的包括华丰科技、意华股份、航天电器[1][8] * **电源管理芯片**:例如杰华特等公司预计将受益[1][8] 6. 2026年国产AI芯片行业整体迈上新台阶 * **发展趋势**:2026年是国产AI芯片性能迈上新台阶的关键年份,新一代产品在性能参数上相比2025年产品(如寒武纪580/590、华为910B/910C)有显著提升[9] * **具体进步**:普遍支持低精度运算和超级节点技术,技术架构实现创新(如PD分离),整体性能大幅优化,能更好地满足AI推理应用需求[9] * **行业前景**:随着AI推理趋势增强及超级节点等技术普及,国产AI芯片产业链迎来良好发展机遇[9] 三、 其他重要内容 * 昇腾950系列通过算力池化高效适配MoE架构大模型推理[1] * 华为服务器的主要合作伙伴(华鲲振宇、超聚变)均未上市[8] * 昇腾950系列既能用于PD分离部署,也能用于训练任务[4]