DeepSeek API
搜索文档
华为昇腾、寒武纪宣布适配DeepSeek最新模型
21世纪经济报道· 2025-09-30 18:19
模型发布与核心技术创新 - 公司于9月29日正式发布DeepSeek-V3.2-Exp模型,该模型是在V3.1-Terminus基础上的探索性版本 [1] - 新模型首次引入自研的DeepSeek Sparse Attention稀疏注意力机制,旨在优化长文本的训练和推理效率 [1] - DSA机制能够自适应选择关键注意力头与局部上下文窗口,相比传统稠密注意力机制,在处理长文本时计算量呈指数级增长的问题得到解决,方案更高效且成本更低 [7][1] 性能表现与成本优势 - 通过引入DSA机制,V3.2-Exp实现了长文本训练和推理效率的大幅提升,同时在各项核心能力上与V3.1-Terminus保持基本持平 [7] - 得益于新模型服务成本大幅降低,DeepSeek API价格下调50%以上,显著降低了开发者的调用成本 [2][10] 开源策略与生态协同 - 公司将DeepSeek-V3.2-Exp模型在Huggingface和ModelScope平台上全面开源,相关论文也已同步公开 [5] - 新模型发布后,华为昇腾、寒武纪和海光信息第一时间宣布完成适配,显示出国产AI软硬件生态的协同发展 [11] - 公司开源了TileLang版本算子,该国产编程语言由北京大学团队开发,能将FlashAttention算子代码量从超500行减少至80行并保持性能,显著提升AI算子开发效率 [11][3] 版本状态与行业影响 - DeepSeek-V3.2-Exp定位为实验版本,公司认识到新模型仍需在更广泛用户真实场景中进行大规模测试 [4] - 公司为方便用户对比测试,为V3.1-Terminus临时保留额外API访问接口至10月15日,调用价格与V3.2-Exp一致 [4] - 华为计算宣布昇腾已实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现,表明国产模型、编程语言与算力正深度协同共进 [12]
国庆前搞大事!DeepSeek 新模型速度翻 3 倍,API 直接半价!网友调侃:这假没法休了
程序员的那些事· 2025-09-30 16:45
模型发布与性能 - DeepSeek-V3.2-Exp模型于9月29日作为实验性版本发布,已在Huggingface与魔搭平台开源,官方App、网页端及小程序同步更新[3] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)技术,首次实现细粒度稀疏注意力机制,显著提升长文本训练和推理效率[5] - 与V3.1-Terminus相比,DeepSeek-V3.2-Exp的长文本推理速度提升2-3倍,内存使用量降低30%-40%,训练效率提升约50%[5] 技术性能基准测试 - 在MMLU-Pro通用基准测试中,DeepSeek-V3.2-Exp与V3.1-Terminus得分持平,均为85.0分[6] - 在AIME 2025数学测试中,DeepSeek-V3.2-Exp得分89.3分,比V3.1-Terminus的88.4分提高0.9分[6] - 在Agent工具使用性能测试中,BrowseComp得分从38.5提升至40.1,BrowseComp-zh得分从45.0提升至47.9,显示新模型在特定任务上的优势[6] - Codeforces-Div1编程测试得分从2046分提升至2121分,但部分代码基准如LiveCodeBench从74.9分略降至74.1分[6] 商业策略与定价 - 得益于新模型服务成本大幅降低,DeepSeek官方API价格下调超过50%[7] - 缓存命中时输入价格从0.5元/百万token降至0.2元/百万token,缓存未命中时输入价格从4元/百万token降至2元/百万token[7] - 输出价格从12元/百万token大幅降低至3元/百万token,降幅达75%[7]
DeepSeek-V3.2-Exp发布 API成本将降低50%以上
凤凰网· 2025-09-29 22:07
模型技术更新 - DeepSeek-V3.2-Exp模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 [1] - 新模型针对长文本的训练和推理效率进行了探索性优化和验证 [1] - 在各领域公开评测集上,DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平 [1] 产品与服务部署 - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型 [1] 商业策略调整 - DeepSeek API价格大幅下调,新价格政策下开发者调用成本将降低50%以上 [1]
DeepSeek-V3.2-Exp来了,API价格再度大幅下调
凤凰网· 2025-09-29 22:03
新产品发布与性能 - 公司于2025年9月29日发布DeepSeek-V3.2-Exp模型,该模型在V3.1-Terminus基础上引入了创新的DeepSeek Sparse Attention稀疏注意力机制 [2] - 新机制旨在优化长文本的训练和推理效率,且能在几乎不影响模型输出质量的前提下大幅提高长文本处理效率 [2] - 在各大公开评测集上,V3.2-Exp模型表现与V3.1-Terminus几乎持平,例如MMLU-Pro得分均为85.0,GPQA-Diamond得分分别为80.7和79.9 [3] - 部分基准测试显示性能提升,如Codeforces-Div1得分从2046提升至2121,AIME 2025得分从88.4提升至89.3 [3] 成本与可及性 - 公司宣布API价格大幅度下调,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上 [2][3] - V3.2-Exp版本已同步更新至官方App、网页端及小程序,提升了产品的可及性 [3] - 公司表示V3.2-Exp模型已在Huggingface与魔搭平台开源,用户可直接访问并进行二次开发 [5]
DeepSeek-V3.2-Exp发布,训练推理提效,API成本降50%以上
搜狐财经· 2025-09-29 21:18
新浪科技讯 9月29日晚间消息,DeepSeek发布DeepSeek-V3.2-Exp模型。据悉,这是一个实验性 (Experimental)的版本,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化 和验证。 目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价 格政策下,开发者调用DeepSeek API的成本将降低50%以上。DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源。 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不 对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担 全部责任。邮箱:news_center@staff.hexun.com 在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。(文猛) ...
深度求索正式发布DeepSeek-V3.2-Exp模型
北京商报· 2025-09-29 20:58
北京商报讯(记者 魏蔚)9月29日,深度求索正式发布 DeepSeek-V3.2-Exp 模型,在 V3.1-Terminus 的 基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行 了探索性的优化和验证。目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API (应用程序编程接口)大幅度降价。在新的价格政策下,开发者调用 DeepSeek API 的成本将降低 50% 以上。 ...
Deepseek API大降价,开发者成本可降超50%
21世纪经济报道· 2025-09-29 20:39
公司动态 - DeepSeek-V3.2-Exp模型于9月29日正式在Hugging Face平台发布并开源,官方App、网页端、小程序同步更新[1] - 模型引入稀疏Attention架构,可降低计算资源消耗并提升模型推理效率[1] - 寒武纪、华为云已完成对DeepSeek-V3.2-Exp模型的适配工作[1] - 得益于新模型服务成本大幅降低,官方API价格即刻下调,开发者调用成本将降低50%以上[1] - 9月22日DeepSeek-V3.1更新至Terminus版本,测试结果显示单项提升幅度最大超过36%[3] - V3.1版本API价格保持百万tokens输入0.5元、输出12元[3] - V3.2更新距V3.1发布仅一个月,8月21日DeepSeek发布V3.1版本[3] 行业影响 - DeepSeek概念板块在V3.1发布当日表现火热,带动不少国产芯片产业链企业股价大涨[3] - 在开源模型竞争白热化背景下,快速修复Bug、提升智能体能力成为留住开发者的关键[3] - DeepSeek具备高性能、低成本、蒸馏有效、开源等核心优势,提出多项算法创新[3] - 公司打破海外算力堆砌的传统大模型提升路径,展示中国AI领域具备全球顶尖水平竞争力[3] - 大模型训推带动AI算力需求增长,新一代算力架构GB300、Vera Rubin将推出[4] - AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等算力产业链环节有望持续受益[4]
Deepseek API大降价,开发者成本可降超50%
21世纪经济报道· 2025-09-29 20:35
记者丨刘雪莹 见习记者林健民 编辑丨江佩霞 叶映橙 据悉,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。 目前, 寒武纪、华为云 已完成对 DeepSeek-V3.2-Exp模型的适配工作。 DeepSeek介绍,得益于新模型服务成本的大幅降低, 官方API价格也相应下调,新价格即刻 生效。 在新的价格政策下, 开发者调用DeepSeek API的成本将降低50%以上。 9月29日, DeepSeek-V3.2-Exp 模型正式在Hugging Face平台发布并开源。DeepSeek宣布官 方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。 就在9月22日晚,DeepSeek宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官 方发布的测试结果显示,该版本模型单项提升幅度最大超过36%。官方API价格保持不变,百 万tokens输入(缓存命中)0.5元,输出12元。 而上述更新距V3.1发布仅一个月。8月21日,DeepSeek宣布发布DeepSeek-V3.1。当日, DeepSeek概念板块火热。随 ...
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
智通财经网· 2025-09-29 18:53
模型发布与技术更新 - 深度求索公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp [1] - 新模型在V3.1-Terminus基础上引入稀疏注意力架构DeepSeek Sparse Attention (DSA),旨在优化长文本训练和推理效率 [1] - DSA首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下大幅提升长文本处理效率 [1] 模型性能与评估 - DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus严格对齐,在各领域公开评测集上表现基本持平 [2] - 稀疏注意力机制的引入经过严谨评估,确保了模型性能的稳定性 [2] 产品部署与可用性 - 官方App、网页端和小程序均已同步更新为DeepSeek-V3.2-Exp模型 [1] - 该模型已正式上架华为云大模型即服务平台MaaS [1] - 华为云采用大EP并行方案部署,基于稀疏注意力结构叠加实现长序列亲和的上下文并行策略 [1] 定价策略与成本优化 - 官方API价格大幅下调,新价格即刻生效 [2] - 得益于新模型服务成本降低,开发者调用DeepSeek API的成本将降低50%以上 [2]
DeepSeek-V3.2-Exp正式发布 API大幅降价
证券时报网· 2025-09-29 18:29
产品发布 - 公司正式发布DeepSeek-V3.2-Exp模型 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp [1] 定价策略 - API价格大幅下调 [1] - 新价格政策下开发者调用API成本降低50%以上 [1]