Workflow
华为云大模型即服务平台MaaS
icon
搜索文档
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
智通财经网· 2025-09-29 18:53
模型发布与技术更新 - 深度求索公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp [1] - 新模型在V3.1-Terminus基础上引入稀疏注意力架构DeepSeek Sparse Attention (DSA),旨在优化长文本训练和推理效率 [1] - DSA首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下大幅提升长文本处理效率 [1] 模型性能与评估 - DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus严格对齐,在各领域公开评测集上表现基本持平 [2] - 稀疏注意力机制的引入经过严谨评估,确保了模型性能的稳定性 [2] 产品部署与可用性 - 官方App、网页端和小程序均已同步更新为DeepSeek-V3.2-Exp模型 [1] - 该模型已正式上架华为云大模型即服务平台MaaS [1] - 华为云采用大EP并行方案部署,基于稀疏注意力结构叠加实现长序列亲和的上下文并行策略 [1] 定价策略与成本优化 - 官方API价格大幅下调,新价格即刻生效 [2] - 得益于新模型服务成本降低,开发者调用DeepSeek API的成本将降低50%以上 [2]
DeepSeek新模型上线华为云
第一财经· 2025-09-29 18:51
9月29日,华为云表示,目前已完成对 DeepSeek-V3.2-Exp 模型的适配工作,最大可支持160K长序列上 下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS。 目前,该模型已正式上架华为云大模型即服务平台 MaaS。 ...