Workflow
罕见!两大AI巨头DeepSeek、寒武纪同步重磅发布,有何影响

DeepSeek-V3 2-Exp模型发布 - DeepSeek于2025年9月29日正式发布DeepSeek-V3 2-Exp实验性模型[1] - 新模型在V3 1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制[1] - 模型针对长文本训练和推理效率进行探索性优化和验证[1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3 2-Exp版本[1] - API价格大幅降价,开发者调用成本降低50%以上[1][2] 寒武纪技术适配与生态支持 - 寒武纪在DeepSeek发布后4分钟即宣布完成对DeepSeek-V3 2-Exp的day 0适配[2][3] - 公司同步开源大模型推理引擎vLLM-MLU源代码[3][5] - 寒武纪高度重视大模型软件生态建设,支持所有主流开源大模型[5][6] - 通过长期生态建设和技术积累实现快速适配和优化[5][6] 技术优化与性能提升 - 寒武纪对DeepSeek系列模型进行深入软硬件协同性能优化[6] - 通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化[6] - 基于计算与通信的并行策略达成业界领先的计算效率水平[6] - DeepSeek Sparse Attention机制叠加寒武纪计算效率可大幅降低长序列场景训推成本[6] 产业链协同趋势 - 同步发布适配表明中国AI产业链头部公司进行深度协同[7] - 可能在DeepSeek-V3 2发布前寒武纪就与DeepSeek进行技术沟通并启动适配研发[7]