Workflow
罕见!DeepSeek、寒武纪同步发布相关重要事项

DeepSeek-V3.2-Exp模型发布 - 公司于9月29日18:07正式发布DeepSeek-V3.2-Exp实验性模型,该模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [2] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型,同时API价格大幅降低,欢迎用户体验测试并提供反馈意见 [2] - 在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上,目前API模型版本为DeepSeek-V3.2-Exp,访问方式保持不变 [3] 寒武纪技术适配与生态支持 - 寒武纪于9月29日18:11同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码,开发者可在寒武纪软硬件平台第一时间体验新模型亮点 [3][4] - 公司高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型,借助长期活跃的生态建设和技术积累,实现对新模型架构的day 0适配和优化 [4][5] - 寒武纪通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化,基于计算与通信并行策略达成业界领先计算效率水平 [6] 产业链协同与性能优化 - 寒武纪对DeepSeek系列模型进行深入软硬件协同性能优化,达成业界领先算力利用率水平 [6] - 依托DeepSeek-V3.2-Exp的DeepSeek Sparse Attention机制叠加寒武纪极致计算效率,可大幅降低长序列场景下训推成本,共同为客户提供极具竞争力软硬件解决方案 [6] - 同步发布适配动作表明中国AI产业链头部公司进行深度协同,可能早在模型发布前寒武纪就在技术方面与DeepSeek沟通并启动相关适配研发工作 [6]