Workflow
Seek .(SKLTY)
icon
搜索文档
深度求索正式发布DeepSeek-V3.2-Exp模型
北京商报· 2025-09-29 20:58
公司产品发布 - 深度求索公司于9月29日正式发布DeepSeek-V3.2-Exp模型 [1] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 [1] - 该机制针对长文本的训练和推理效率进行了探索性优化和验证 [1] 产品部署与更新 - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型 [1] - API应用程序编程接口同步更新并实行大幅度降价 [1] 价格策略调整 - 在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上 [1]
DeepSeek,新版本
中国证券报· 2025-09-29 20:39
DeepSeek-V3.2-Exp模型发布 - 9月29日DeepSeek发布实验性版本DeepSeek-V3.2-Exp 在V3.1-Terminus基础上引入稀疏注意力机制以优化长文本训练和推理效率 [1] - 新模型服务成本大幅降低使API价格下调超过50% 所有终端平台同步更新 [1] - 华为昇腾实现0day支持并开源推理代码 在128K长序列下保持TTFT低于2秒和TPOT低于30毫秒的推理性能 [3] 寒武纪适配与优化进展 - 寒武纪同步适配DeepSeek-V3.2-Exp并开源vLLM-MLU推理引擎源代码 支持开发者在其软硬件平台体验新模型 [1] - 通过Triton算子开发和BangC融合算子实现快速适配与性能优化 达成业界领先计算效率水平 [2] - 长期支持主流开源大模型生态 此前对DeepSeek系列已实现业界领先算力利用率 [2] 华为昇腾技术部署 - 基于vLLM/SGLang推理框架完成适配部署 开源所有推理代码和算子实现 [3] - 在CANN平台完成BF16模型优化适配 采用大EP并行方案与CP并行策略兼顾时延和吞吐 [3] DeepSeek模型迭代历程 - 8月21日发布DeepSeek-V3.1 9月22日升级至Terminus版本 改进语言一致性问题并缓解中英文混杂及异常字符情况 [3]
DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调
36氪· 2025-09-29 20:12
模型发布与更新 - DeepSeek-V3.2-Exp模型于9月29日正式发布并在Huggingface与魔搭平台开源 官方App、网页端和小程序同步更新为V3.2-Exp版本 [1] - 新版本为实验性模型 引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行优化验证 [1] - 华为昇腾已基于vLLM/SGLang推理框架完成适配部署 实现DeepSeek-V3.2-Exp 0day支持 并向开发者开源所有推理代码和算子实现 [1] 技术架构创新 - 稀疏注意力机制首次实现细粒度稀疏化 在几乎不影响输出效果前提下大幅提升长文本训练和推理效率 [1] - 新模型研发使用TileLang高级语言进行快速原型开发 最终阶段以TileLang为精度基线改用底层语言实现高效版本 [2] - 开源算子包含TileLang与CUDA两种版本 官方建议研究性实验使用TileLang版本便于调试和快速迭代 [2] 性能评估与迭代历程 - V3.2-Exp训练设置与V3.1-Terminus严格对齐 在各领域公开评测集表现基本持平 [5] - 8月21日发布的V3.1版本采用混合推理架构 同时支持思考与非思考模式 相比DeepSeek-R1-0528思考效率更高 [4] - 9月22日更新至V3.1-Terminus版本 优化语言一致性缓解中英文混杂问题 并强化Code Agent与Search Agent能力 [4] 商业化进展 - 新模型服务成本大幅降低 API价格相应下调超过50% [4] - V3.1版本通过Post-Training优化显著提升工具使用与智能体任务表现 [4]
降价!DeepSeek,大消息!
证券时报网· 2025-09-29 20:07
模型发布与技术升级 - 公司于9月29日正式发布DeepSeek-V3.2-Exp模型 作为迈向新一代架构的中间步骤[1] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行探索性优化[1] - DeepSeek Sparse Attention首次实现细粒度稀疏注意力机制 在几乎不影响模型输出效果前提下大幅提升长文本训练和推理效率[3] 模型性能表现 - 公司严格对齐V3.2-Exp与V3.1-Terminus的训练设置进行严谨评估 在各领域公开评测集上表现基本持平[3] - 在多项基准测试中V3.2-Exp表现稳定 MMLU-Pro保持85.0分 GPQA-Diamond从80.7略降至79.9 Codeforces-Div1从2046提升至2121[4] - 新模型在Search Agent任务中表现提升 BrowseComp从38.5提升至40.1 BrowseComp-zh从45.0提升至47.9[4] 商业化与市场策略 - 官方App网页端小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价[4] - 新价格政策下开发者调用DeepSeek API成本将降低50%以上[4] 近期发展里程碑 - 公司近期动作频繁 9月22日将线上模型升级为DeepSeek-V3.1-Terminus 8月21日正式发布DeepSeek-V3.1[8] - V3.1采用混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强智能体能力[8] - 9月17日DeepSeek-R1推理模型研究论文登上Nature封面 这是中国大模型研究首次登上Nature封面[8] - 该论文首次公开仅靠强化学习就能激发大模型推理能力的重要研究成果 标志着中国AI技术在国际科学界获得最高认可[8] 行业影响与认可 - Nature社论评价几乎所有主流大模型都未经过独立同行评审 这一空白被DeepSeek打破[9] - DeepSeek-R1研究是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究[8]
“价格屠夫”DeepSeek上线,新模型成本下降超50%
第一财经· 2025-09-29 19:50
模型发布与定价策略 - 公司正式发布DeepSeek-V3.2-Exp模型,调用价格大幅降低,输出价格大降75%[1] - 在新价格政策下,开发者调用API的成本将降低50%以上[1] - 具体价格变动:输入价格在缓存命中时从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中时从4元/百万tokens降为2元/百万tokens;输出价格从12元/百万tokens直接降至3元/百万tokens[3] 技术优化与性能表现 - V3.2-Exp作为实验性版本引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证[3] - 通过细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下实现长文本训练和推理效率的大幅提升[3] - 在各领域公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平,其中MMLU-Pro得分85.0,GPQA-Diamond得分80.7,Humanity's Last Exam得分21.7[4][5] 模型部署与开源支持 - 模型已在Huggingface与魔搭平台开源,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp[5] - API模型版本已更新为DeepSeek-V3.2-Exp,访问方式保持不变[5] - 为支持社区研究,公司开源新模型研究中设计和实现的GPU算子,包括TileLang和CUDA两种版本,建议研究性实验优先使用基于TileLang的版本以便调试和快速迭代[6] 版本迭代与市场预期 - 此次发布距离9月22日发布的V3.1-Terminus模型仅一周时间,打破了业界对V3系列迎来终极版本的猜测[6] - 公司在年初出圈后每次更新都受业界瞩目,但近期几次更新均为小版本迭代,市场对V4和R2版本的呼声越来越高[6] - 结合此次发布情况,市场预期近期不会看到V4和R2版本的重大更新[6]
DeepSeek V3.2和智谱GLM-4.6即将发布
证券日报网· 2025-09-29 19:46
公司动态 - DeepSeek在Huggingface平台上架了其DeepSeek-V3.2-base模型 [1] - 智谱的新一代旗舰模型GLM-4-6即将发布 [1] - 在Zai官网上GLM-4-5已被标识为上一代旗舰模型 [1]
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
智通财经网· 2025-09-29 18:53
模型发布与技术更新 - 深度求索公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp [1] - 新模型在V3.1-Terminus基础上引入稀疏注意力架构DeepSeek Sparse Attention (DSA),旨在优化长文本训练和推理效率 [1] - DSA首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下大幅提升长文本处理效率 [1] 模型性能与评估 - DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus严格对齐,在各领域公开评测集上表现基本持平 [2] - 稀疏注意力机制的引入经过严谨评估,确保了模型性能的稳定性 [2] 产品部署与可用性 - 官方App、网页端和小程序均已同步更新为DeepSeek-V3.2-Exp模型 [1] - 该模型已正式上架华为云大模型即服务平台MaaS [1] - 华为云采用大EP并行方案部署,基于稀疏注意力结构叠加实现长序列亲和的上下文并行策略 [1] 定价策略与成本优化 - 官方API价格大幅下调,新价格即刻生效 [2] - 得益于新模型服务成本降低,开发者调用DeepSeek API的成本将降低50%以上 [2]
DeepSeek新模型上线华为云
第一财经· 2025-09-29 18:51
华为云平台动态 - 华为云已完成对DeepSeek-V3.2-Exp模型的适配工作 [1] - 该模型最大可支持160K长序列上下文长度 [1] - 模型已正式上架华为云大模型即服务平台MaaS [1]
DeepSeek-V3.2-Exp正式发布 API大幅降价
证券时报网· 2025-09-29 18:29
产品发布 - 公司正式发布DeepSeek-V3.2-Exp模型 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp [1] 定价策略 - API价格大幅下调 [1] - 新价格政策下开发者调用API成本降低50%以上 [1]
DeepSeek-V3.2-Exp 发布,训练推理提效,API成本降50%以上
新浪科技· 2025-09-29 18:27
模型发布与更新 - 公司发布DeepSeek-V3-2-Exp模型,这是一个实验性版本,作为迈向新一代架构的中间步骤 [1] - 新模型在V3-1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3-2-Exp模型 [1] 商业策略与定价 - API大幅度降价,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上 [1] - DeepSeek-V3-2-Exp模型现已在Huggingface与魔搭开源 [1] 模型性能表现 - 在各领域公开评测集上,DeepSeek-V3-2-Exp的表现与V3-1-Terminus基本持平 [1]