罕见！DeepSeek、寒武纪同步重磅发布

DeepSeek-V3.2-Exp模型发布 - 公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp 该模型在V3.1-Terminus基础上引入稀疏注意力机制针对长文本训练和推理效率进行探索性优化和验证 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价欢迎用户体验测试并提供反馈 [1] - 在新的价格政策下开发者调用DeepSeek API的成本将降低50%以上目前API的模型版本为DeepSeek-V3.2-Exp 访问方式保持不变 [2] 寒武纪生态适配与合作 - 寒武纪于同日宣布已同步实现对DeepSeek-V3.2-Exp模型的适配并开源大模型推理引擎vLLM-MLU源代码开发者可在寒武纪软硬件平台上体验新模型亮点 [2] - 公司高度重视大模型软件生态建设支持以DeepSeek为代表的所有主流开源大模型得以快速实现对新模型的day 0适配和优化 [4] - 通过Triton算子开发和BangC融合算子开发实现快速适配与极致性能优化基于计算与通信的并行策略再次达成业界领先的计算效率水平 [4] 产业链协同与竞争优势 - 依托DeepSeek-V3.2-Exp的新稀疏注意力机制叠加寒武纪的极致计算效率可大幅降低长序列场景下的训推成本共同为客户提供极具竞争力的软硬件解决方案 [4] - 同步发布适配动作表明中国AI产业链头部公司正在进行深度协同可能早在模型发布前寒武纪就在技术方面与DeepSeek进行沟通并启动相关适配研发工作 [5]