Artificial Intelligence

搜索文档
DeepSeek-V3.2-Exp发布 API成本将降低50%以上
凤凰网· 2025-09-29 22:07
凤凰网科技讯 9月29日,DeepSeek-V3.2-Exp模型发布,V3.2-Exp在V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化 和验证。 在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。 目前,官方App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价 格政策下,开发者调用DeepSeek API的成本将降低50%以上。 ...
DeepSeek-V3.2-Exp来了,API价格再度大幅下调
凤凰网· 2025-09-29 22:03
新产品发布与性能 - 公司于2025年9月29日发布DeepSeek-V3.2-Exp模型,该模型在V3.1-Terminus基础上引入了创新的DeepSeek Sparse Attention稀疏注意力机制 [2] - 新机制旨在优化长文本的训练和推理效率,且能在几乎不影响模型输出质量的前提下大幅提高长文本处理效率 [2] - 在各大公开评测集上,V3.2-Exp模型表现与V3.1-Terminus几乎持平,例如MMLU-Pro得分均为85.0,GPQA-Diamond得分分别为80.7和79.9 [3] - 部分基准测试显示性能提升,如Codeforces-Div1得分从2046提升至2121,AIME 2025得分从88.4提升至89.3 [3] 成本与可及性 - 公司宣布API价格大幅度下调,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上 [2][3] - V3.2-Exp版本已同步更新至官方App、网页端及小程序,提升了产品的可及性 [3] - 公司表示V3.2-Exp模型已在Huggingface与魔搭平台开源,用户可直接访问并进行二次开发 [5]
DeepSeek大模型V3.2亮相!华为、寒武纪芯片同步适配开源,首次自研DSA注意力机制,API价格砍半
华尔街见闻· 2025-09-29 21:53
模型发布与核心特性 - DeepSeek-V3-2-Exp模型于9月29日在Hugging Face平台正式发布并开源[1] - 该版本引入了自研的DeepSeek Sparse Attention稀疏注意力机制,旨在优化长文本训练和推理效率[1] - 新架构能够降低计算资源消耗并提升模型推理效率,华为和寒武纪已完成适配,最大支持160K长序列上下文长度[1] 技术性能评估 - 模型训练设置与前代V3-1-Terminus严格对齐,在各大公开评测集上的表现与V3-1-Terminus基本持平[3] - 在多项基准测试中表现稳定:MMLU-Pro保持85.0分,GPQA-Diamond从80.7微降至79.9,Codeforces-Div1从2046提升至2121[4] - 在AIME 2025数学测试中从88.4提升至89.3,但在HMMT 2025中从86.1降至83.6[4] 商业化与成本优化 - 官方API价格大幅下调超过50%,新价格已即刻生效[4] - 官方App、网页端和小程序均已同步更新至DeepSeek-V3-2-Exp版本[4] - 为便于开发者对比,V3-1-Terminus版本的API访问接口将保留至2025年10月15日,调用价格与V3-2-Exp保持一致[6] 开源生态与产业合作 - 模型在Huggingface和ModelScope平台全面开源,相关论文同步公开[6] - 开源新模型研究中设计的GPU算子,包括TileLang和CUDA两种版本[6] - 寒武纪在模型发布同时宣布完成适配,并开源vLLM-MLU推理引擎源代码,表明双方技术协作早已展开[6][7]
Datavault AI's $150M Vault Just Opened to Expedite "Proof as an Asset" Market (NASDAQ:DVLT)
Accessnewswire· 2025-09-29 21:30
BEAVERTON, OR / ACCESS Newswire / September 29, 2025 / Every movement needs a first proving ground. For Datavault AI (NASDAQ: DVLT ), that ground is biotech. ...
Top catalysts for the Nasdaq 100 Index and ETFs like QQQ, JEPQ
Invezz· 2025-09-29 21:30
The Nasdaq 100 Index has rallied this year, helped by the ongoing tailwinds in the artificial intelligence industry. It ended the week at $24,500 after soaring by 50% from its lowest level this year. ...
Xiao-I Corporation Renews Strategic Partnership with Premier Automotive Manufacturer, Marking Decade-Long Collaboration in AI-Driven Customer Experience
Prnewswire· 2025-09-29 21:30
Forward-Looking Statements This press release contains forward-looking statements as defined by the Private Securities Litigation Reform Act of 1995. Forward-looking statements include statements concerning plans, objectives, goals, strategies, future events or performance, and underlying assumptions and other statements that are other than statements of historical facts. When the Company uses words such as "may," "will," "intend," "should," "believe," "expect," "anticipate," "project," "estimate" or simila ...
DeepSeek发布新模型V3.2-Exp并再度降价
新京报· 2025-09-29 21:28
DeepSeek方面表示,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2- Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训 练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价。 新京报贝壳财经讯(记者罗亦丹)9月29日,DeepSeek在官方公众号发文称,发布DeepSeek-V3.2-Exp模 型。 目前,该模型的API价格为每百万tokens输入0.2元(缓存命中),2元(缓存未命中),输出3元。相比此前, 开发者调用DeepSeek API的成本降低逾50%。 ...
C3.AI, INC. (NYSE: AI) DEADLINE ALERT: Bernstein Liebhard LLP Reminds C3.ai, Inc. Investors of Upcoming Deadline
Globenewswire· 2025-09-29 21:19
NEW YORK, Sept. 29, 2025 (GLOBE NEWSWIRE) -- Bernstein Liebhard LLP: Do you, or did you, own shares of C3.ai, Inc. (NYSE: AI)?Did you purchase your shares between February 26, 2025 and August 8, 2025, inclusive?Did you lose money in your investment in C3.ai, Inc.?Do you want to discuss your rights? Bernstein Liebhard LLP, a nationally acclaimed investor rights law firm, reminds C3.ai, Inc. (“C3” or the “Company”) (NYSE: AI) investors of an upcoming deadline involving a securities fraud class action lawsuit ...
DeepSeek-V3.2-Exp发布,训练推理提效,API成本降50%以上
搜狐财经· 2025-09-29 21:18
新浪科技讯 9月29日晚间消息,DeepSeek发布DeepSeek-V3.2-Exp模型。据悉,这是一个实验性 (Experimental)的版本,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化 和验证。 目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价 格政策下,开发者调用DeepSeek API的成本将降低50%以上。DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源。 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不 对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担 全部责任。邮箱:news_center@staff.hexun.com 在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。(文猛) ...
通义大模型霸榜全球开源前十,阿里云CTO:模型拼迭代速度
南方都市报· 2025-09-29 21:09
模型技术突破 - 阿里通义7款模型入选全球前十开源模型榜单 其中全模态大模型Qwen3-Omni实现登顶[1][4] - Qwen3-Omni可处理文本 图片 语音和视频四种数据类型 音视频能力狂揽32项开源最佳性能SOTA[6] - Qwen3-Max总参数超过万亿 预训练数据量达36T 在Chatbot Arena排行榜上位列第三[6] - Qwen3-Next模型架构实现计算效率突破 总参数80B仅激活3B即可媲美235B模型性能[6] 产品发布与迭代 - 阿里云在2025云栖大会发布7款大模型 覆盖语言 语音 视觉 多模态 代码等领域[2][4] - 发布模型包括Qwen3-VL视觉理解模型 Qwen-Image-Edit-2509图像编辑模型 Wan2.2-Animate动作生成模型及DeepResearch深度研究Agent模型[4] - 公司加快模型迭代节奏 从单模态向多模态演进成为行业必然趋势[7] 战略规划与投入 - 阿里巴巴积极推进三年3800亿AI基础设施建设计划 并持续追加更大投入[1][9] - 阿里云定位为全栈人工智能服务商 坚持通义千问开源开放路线 致力于打造AI时代的Android[8] - 公司计划构建超级AI云作为下一代计算机 为全球提供智能算力网络[8] 全球基础设施扩展 - 阿里云宣布在巴西 法国和荷兰首次设立云计算地域节点 并扩建墨西哥 日本 韩国 马来西亚和迪拜的数据中心[9] - 为迎接ASI时代 2032年阿里云全球数据中心能耗规模将较2022年提升10倍[9] - 阿里云成为全球少数在大模型和云计算领域实现全栈自研与联合创新的云计算公司[9] 技术演进路径 - 公司提出通往ASI的三阶段演进路线:智能涌现 自主行动和自我迭代阶段[8] - 当前行业处于AI掌握工具使用和编程能力的自主行动阶段[8] - 终极目标是发展出能自我迭代 全面超越人类的超级人工智能ASI[8]