国泰海通|电子:昇腾推理加速套件正式开源,昇腾芯片渗透加速
国泰海通证券研究·2025-12-30 22:28

昇腾多模态推理加速套件开源 - 华为昇腾多模态推理加速套件MindIE SD项目于2025年12月19日正式开源 [1][2] - 该套件包含四大关键加速特性:加速插件、以存代算、多卡并行、量化与稀疏Attention [2] - 加速插件可减少计算与内存访问开销,以存代算通过缓存算法提升运行时性能,多卡并行简化开发流程,量化与稀疏算法则针对昇腾硬件提升效率并降低资源消耗 [2] AI推理加速联合解决方案发布 - 华为数据存储与中科弘云于2025年12月23日联合发布AI推理加速解决方案 [1][3] - 方案具备三大功能:异构管理、算力调度、推理加速 [3] - 异构管理支持平台、计算与存储协同联动,兼容MindSpore/vLLM/SGLang等主流框架 [3] - 算力调度可对资源进行细粒度切分与池化,实现利用率最大化 [3] - 推理加速依托华为UCM技术,将KV Cache持久化至OceanStor A系列存储,实现推理记忆全量保存 [3] 方案性能提升效果 - 在智能问答推理场景中,该方案实现首Token时延降低57.5% [3] - 在长文档推理场景中,结合GSA稀疏加速算法,当序列长度为39K时,并发能力提升86%,推理吞吐提升36% [1][3] - 序列长度越长,优化效果越显著 [3] 行业催化剂 - 昇腾950PR芯片验证通过 [4] - 云厂商增加昇腾芯片订单 [4] 核心观点与投资建议 - 昇腾多模态推理加速套件正式开源及联合解决方案的发布,有望加速昇腾芯片渗透率增长 [1] - 伴随昇腾芯片性能迭代与昇思生态完善,昇腾产业链相关环节预计受益 [1]