强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

DeepSeek-V3.2-Exp模型发布 - 深度求索公司于2025年9月29日发布新一代模型架构DeepSeek-V3.2,该版本为实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制DeepSeek Sparse Attention,针对长文本训练和推理效率进行探索性优化和验证[2] - 模型体量达到671GB,在带宽充足理想条件下仅完成下载就需要耗费约8-10个小时[3] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价[2] 寒武纪技术适配与合作 - 寒武纪同步官宣对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码[2][3] - 快速的适配响应表明寒武纪早在模型发布前就已启动适配研发,双方技术沟通与协作已悄然展开[3] - 芯片与大模型的适配涉及底层架构优化、算力资源匹配、兼容性调试等复杂工作,需要较长时间准备[3] 产业协同意义 - 此次合作体现中国顶尖科技企业深度协同的重要信号,是产业链上下游领军企业的深度协同[3][4] - 合作将大幅降低大模型用户在长序列场景下的训练和推理成本,助力AI应用涌现[4] - 头部企业间的深度协同合作对中国AI产业在国际舞台上站稳脚跟、占据优势地位至关重要[4]

强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码 - Reportify