寒武纪、华为昇腾适配DeepSeek最新模型
财联社·2025-09-30 08:59

模型发布与技术创新 - DeepSeek-V3.2-Exp模型于9月29日在Hugging Face平台正式发布并开源[1] - 模型引入稀疏Attention架构,能够降低计算资源消耗并提升模型推理效率[1] 昇腾适配与支持 - 昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持[1] - 面向开发者开源所有推理代码和算子实现[1] 寒武纪技术适配 - 寒武纪宣布同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码[1] - 依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本[1] 海光信息技术优势 - 海光信息DCU实现无缝适配加深度调优,做到大模型算力"零等待"部署[1] - DeepSeek-V3.2-Exp在海光DCU上展现出优异性能,验证海光DCU高通用性、高生态兼容度及自主可控的技术优势[1]