Workflow
DeepSeek与国产芯片的“双向奔赴”

模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型,实验性引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率 [1] - 新模型发布后,公司同步更新官方App、网页端及小程序,并全面下调API价格,降幅在50%到75%不等 [1] - V3.2-Exp版本在V3.1-Terminus基础上引入稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [7] 国产芯片生态协同 - 新模型发布后4分钟内,寒武纪率先宣布适配DeepSeek-V3.2-Exp,并开源大模型推理引擎vLLM-MLU源代码 [2] - 华为昇腾基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp的0day支持,并向开发者开源所有推理代码和算子实现 [2] - 海光信息表示其DCU已实现对DeepSeek-V3.2-Exp的无缝适配和深度调优,新模型在海光DCU上展现出优异性能 [2] 行业标准与生态建设 - 深度求索公司通过发布DeepSeek-V3.1版本,明确模型将适配下一代“UE8M0”浮点格式的国产芯片,为国产芯片发展指明方向 [6] - 业内高管认为,应由DeepSeek定义国产芯片标准,让芯片厂商跟进,而非让模型去适配芯片,DeepSeek已成为国产开源模型的标杆 [2][5] - 中国本土AI行业对DeepSeek模型的高度共识,使深度求索公司敢于先行先试,组建国产芯片生态 [7] 技术创新与工具链 - DeepSeek-V3.2-Exp采用的稀疏注意力机制,疑似基于深度求索公司今年2月发表论文中的原创机制,公司CEO梁文锋位列作者名单 [7] - 模型在兼容CUDA基础上,使用专为AI算子开发设计的编程语言TileLang进行快速原型开发,该语言由北京大学团队主导开发并于2025年1月开源 [7][8] 云计算厂商的生态参与 - 腾讯云于9月16日宣布已全面适配主流国产芯片,并积极参与开源社区建设 [8] - 阿里云在云栖大会表示推动“一云多芯”战略,验证并深度适配多家国产AI芯片,将其纳入自身算力底座 [8] - 相比英伟达用二十年建立生态,DeepSeek用了不到一年时间飞速完成初步生态追赶 [8]