罕见!DeepSeek、寒武纪同步重磅发布
DeepSeek-V3.2-Exp模型发布 - 公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp 该模型在V3.1-Terminus基础上引入稀疏注意力机制 针对长文本训练和推理效率进行探索性优化和验证 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价 欢迎用户体验测试并提供反馈 [1] - 在新的价格政策下 开发者调用DeepSeek API的成本将降低50%以上 目前API的模型版本为DeepSeek-V3.2-Exp 访问方式保持不变 [2] 寒武纪生态适配与合作 - 寒武纪于同日宣布已同步实现对DeepSeek-V3.2-Exp模型的适配 并开源大模型推理引擎vLLM-MLU源代码 开发者可在寒武纪软硬件平台上体验新模型亮点 [2] - 公司高度重视大模型软件生态建设 支持以DeepSeek为代表的所有主流开源大模型 得以快速实现对新模型的day 0适配和优化 [4] - 通过Triton算子开发和BangC融合算子开发实现快速适配与极致性能优化 基于计算与通信的并行策略 再次达成业界领先的计算效率水平 [4] 产业链协同与竞争优势 - 依托DeepSeek-V3.2-Exp的新稀疏注意力机制 叠加寒武纪的极致计算效率 可大幅降低长序列场景下的训推成本 共同为客户提供极具竞争力的软硬件解决方案 [4] - 同步发布适配动作表明中国AI产业链头部公司正在进行深度协同 可能早在模型发布前 寒武纪就在技术方面与DeepSeek进行沟通并启动相关适配研发工作 [5]