国产AI软硬件生态协同 - 财报，业绩电话会，研报，新闻

国产AI软硬件生态协同

搜索文档

21世纪经济报道· 2025-09-30 20:13

模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型，实验性引入DeepSeek Sparse Attention稀疏注意力机制，显著降低计算资源消耗并提升推理效率 [1] - 得益于技术创新，公司官方App、网页端、小程序同步更新为新模型，并全面下调API价格，降幅在50%到75%不等 [1] - 新版本在V3.1-Terminus基础上引入稀疏注意力机制，针对长文本训练和推理效率进行探索性优化和验证，所采用机制疑似基于公司2025年2月发表论文中的原创机制 [5] 国产芯片生态协同 - V3.2-Exp版本发布后几乎零时差引发华为昇腾、寒武纪、海光等国产芯片厂商“认领”适配，标志着国产AI软硬件生态协同初具雏形 [1][2] - 寒武纪在模型发布后4分钟即宣布同步完成适配并开源大模型推理引擎vLLM-MLU源代码，华为昇腾表示基于vLLM/SGLang等框架完成0day支持并开源所有推理代码和算子实现，海光信息称其DCU实现无缝适配加深度调优 [2] - 深度求索已成为新的生态建设者，其模型获得国产推理模型大部分份额，成为国产开源模型标杆，由公司定义国产芯片标准或组建生态被视为更合适做法 [2][3] 技术路线与生态发展 - 公司模型在兼容CUDA基础上，使用专为AI算子开发设计的编程语言TileLang进行快速原型开发，该语言由北京大学团队主导开发并于2025年1月开源 [5][6] - 8月下旬发布的V3.1版本明确模型将适配下一代“UE8M0”浮点格式国产芯片，为国产芯片发展指明方向，尽管当时未有企业认领此格式 [4] - 中国本土AI行业对DeepSeek模型形成高度共识，腾讯云、阿里巴巴等云计算大厂积极适配国产芯片并参与开源社区建设，推动“一云多芯”战略 [6] - 相比英伟达用二十年建立生态，DeepSeek用了不到一年时间飞速完成初步生态追赶，业界认为2025年国产芯片发展迅速归功于DeepSeek的横空出世 [3][6]