Seek .(SKLTY)
搜索文档
DeepSeek,又有大动作!
北京日报客户端· 2025-12-01 21:32
转自:北京日报客户端 DeepSeek,又有大动作! 今日晚间,DeepSeek宣布同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。 据悉,DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任 务场景。DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,探索模型能力的边界。 DeepSeek表示,不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2是公司推出的首个 将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。 有券商研究机构表示,全球AI产业已经进入共振期,AI基建加速扩张与下游应用商业化落地同步推 进,AI产业有望持续繁荣。展望2026年,AI基建与应用仍是主线。 DeepSeek重磅发布 今日(12月1日),DeepSeek同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方 网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务 ...
DeepSeek又上新!模型硬刚谷歌,承认开源与闭源差距拉大
第一财经· 2025-12-01 21:31
"突破开源大模型边界"。 12月1日晚,DeepSeek又上新了两款新模型,DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上全球领先。 两款模型有着不同的定位。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。9月底DeepSeek发布了 实验版V3.2-Exp,此次是正式版更新。在公开推理测试中,V3.2达到了GPT-5的水平,仅略低于谷歌的Gemini3 Pro。 DeepSeek-V3.2-Speciale则是此次的重头戏,其目标是"将开源模型的推理能力推向极致,探索模型能力的边界"。据介绍,Speciale是V3.2的长思考增强版, 同时结合了DeepSeek-Math-V2的定理证明能力,该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力。 | Benchmark | GPT-5 | Gemini-3.0 | Kimi-K2 | DeepSee | | --- | --- | --- | --- | --- | | | High | Pro | Thinking | Think | | AIME 202 ...
AI进化速递 | DeepSeek发布新模型
第一财经· 2025-12-01 20:48
①DeepSeek V3.2正式版发布:强化Agent能力,融入思考推理; DeepSeek V3.2正式版发布;豆包手机助手发布技术预览版。 ■ 汇丰银行与Mistral Al达成战略合作 日本报 li l = ray 滴滴自动驾驶在广州试运行 全天候、全无人Robotaxi服务 ②豆包手机助手发布技术预览版; ③清华大学成立具身智能与机器人研究院; ④滴滴自动驾驶在广州试运行全天候、全无人Robotaxi服务; ⑤汇丰银行与Mistral AI达成战略合作,以增进银行业务中生成式AI的应用。 ■ 来源:一财快讯 ...
DeepSeek V3.2 正式版发布:性能比肩GPT-5 ,略低于 Gemini-3.0-Pro
新浪科技· 2025-12-01 19:23
新浪科技讯 12月1日晚间消息,继两个月前发布实验性的 DeepSeek-V3.2-Exp后,DeepSeek今日宣布同 时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高。目 前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项 优化。(文猛) 责任编辑:何俊熹 据悉,DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待 时间。 DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。V3.2- Speciale 是 DeepSeek-V3.2 的长思 ...
DeepSeek发布两个正式版模型
证券时报网· 2025-12-01 19:18
人民财讯12月1日电,DeepSeek发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网 页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供 社区评测与研究。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和 通用Agent任务场景。DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,探索模型能力 的边界。 ...
DeepSeekV3.2正式版发布 强化Agent能力 融入思考推理
华尔街见闻· 2025-12-01 19:11
模型发布策略 - 公司同时发布两个正式版模型DeepSeek-V3 2和DeepSeek-V3 2-Speciale [1] - DeepSeek-V3 2模型目标为平衡推理能力与输出长度 适合日常问答和通用Agent任务场景 [1] - DeepSeek-V3 2-Speciale模型目标为将开源模型推理能力推向极致 探索模型能力边界 [1]
AI周报 | DeepSeek开源奥数金牌水平模型;前OpenAI 联创称规模扩展时代已终结
第一财经· 2025-11-30 08:48
DeepSeek模型进展 - 开源首个达到国际奥林匹克数学竞赛金牌水平的数学模型DeepSeek-Math-V2 [1] - 模型部分性能优于谷歌旗下的Gemini DeepThink [1] - 行业头部厂商近期密集迭代模型,包括OpenAI发布GPT-5.1、xAI发布Grok 4.1、谷歌发布Gemini 3系列 [1] AI技术路线与行业观点 - 前OpenAI联合创始人伊利亚·苏茨克维认为AI规模扩展时代已终结,主流路线遇到瓶颈 [2] - 其观点指出算力规模已很大却不能持续带来更好的扩展,扩展与浪费算力界限模糊 [2] - 未来需要解决大模型泛化能力比人类差的问题,AI可能缺少人类情绪这种价值函数 [2] 百度组织架构调整 - 百度新设立基础模型研发部与应用模型研发部两大部门 [3] - 基础模型研发部由吴甜牵头专注通用人工智能大模型研发,应用模型研发部由贾磊负责聚焦业务场景专精模型调优 [3] - 新设部门均直接向百度CEO李彦宏汇报,体现推进干部年轻化决心 [3] 英伟达市场动态与回应 - 英伟达股价一度重挫逾7%,市值瞬间蒸发近3500亿美元,最终收跌2.59% [4] - 公司回应大空头迈克尔·伯里言论,称战略投资在营收中比例较小,投资组合公司主要从第三方客户获取收入 [4] - 投资者对AI算力真实需求和投入能否转化为足够收益产生怀疑 [4] 谷歌硬件与芯片动态 - 谷歌重启AI眼镜项目,硬件代工由富士康负责,参考设计由三星提供,芯片由高通提供 [5][6] - 项目已进入小批量试产阶段,预计最早2026年第四季度发布 [6] - 谷歌自研第七代TPU单芯片峰值算力可达4614TFLOPs,是目前性能最强大、能效最高的自研芯片 [10] AI产业链公司动态 - 工业富联澄清第四季度业绩目标下调传闻,称英伟达GB200、GB300等相关产品出货均按计划推进 [8] - 公司股价从10月30日到11月24日累计下跌30.77%,但11月25日至28日累计上涨8.54% [8] - 天孚通信辟谣获谷歌30亿美元订单,称信息不实 [9] AI行业资源消耗与挑战 - 汇丰银行分析指出OpenAI至2030年仍难盈利,即便用户规模覆盖全球成年人44%且营收可能突破2130亿美元 [7] - OpenAI目标在本年代末达到36GW算力,接近美国中型州用电量,预计自由现金流仍为负,整体缺口达2070亿美元 [7] - 摩根士丹利报告指出AI不仅是主要电力消费者,也是吃水大户,数据中心严重依赖水资源 [11][12]
大摩中国CIO调查:B端对千问和阿里云兴趣显著增加,预计三年内千问超越DeepSeek
华尔街见闻· 2025-11-29 10:06
中国企业级AI市场结构性变局 - 企业客户在生成式AI的部署上正迅速从独立模型开发商转向拥有全栈能力的超大规模云厂商 [1] - 企业客户在深水区更看重算力基础设施与模型的深度整合而非单一的模型算法优势 [2] - 40%的CIO计划在未来12个月内通过公有云部署GenAI远高于半年前的28% [3] 阿里巴巴的竞争优势与市场地位 - 阿里巴巴凭借“云基座+通义千问”的组合被确立为“中国最佳AI赋能者”其在B端的吸引力正快速逼近并有望在三年内超越DeepSeek [1] - 阿里云在2025年上半年占据35.8%的市场份额超过了第2至第4名竞争对手的总和 [8] - 通义千问的意向度从上半年的18%激增至30%增长势头最为迅猛而DeepSeek的兴趣度大幅下降20个百分点至45% [6] 阿里巴巴未来增长预期 - 预计阿里云营收增速将在2026财年下半年加速至35%以上并在2027财年进一步冲高至40% [9] - 管理层透露Token使用量每2-3个月翻一番三年3800亿元人民币的资本开支可能仍不足以满足当前指数级的需求 [9] - 大摩推演三年内阿里巴巴/通义千问有望以37%的份额占据榜首超越DeepSeek(28%)、华为(13%)和字节跳动(12%) [6]
DeepSeek上新:开源模型首达IMO金牌水平,AI推理告别“死记硬背”
观察者网· 2025-11-28 15:17
模型发布与核心性能 - 公司于本周三晚间低调发布专注于数学推理与定理证明的新模型DeepSeek-Math-V2,参数量为685B [1] - 在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中,模型均达到金牌水平 [1] - 在普特南(Putnam 2024)数学竞赛中,模型通过扩展测试计算取得118分(满分120分)的近乎满分成绩,远超人类选手约90分的历史最高分记录 [1] 具体竞赛成绩 - 在IMO 2025竞赛中,模型在P1至P5题上取得83.3%的成绩 [3] - 在CMO 2024竞赛中,模型在P1、P2、P4、P5、P6题上取得73.8%的成绩 [3] - 在Putnam 2024竞赛中,模型在A1至B4、B5、B6题上取得98.3%的成绩 [3] 基准测试对比 - 在IMO-ProofBench基准测试的基础集上,模型得分接近99%,大幅领先谷歌Gemini DeepThink (IMO Gold) 的89% [4] - 在难度更高的进阶集上,模型得分61.9%,略低于Gemini DeepThink的65.7%,但作为开源模型已无限接近闭源商用模型的顶尖水平 [4] - 在自主构建的91个CNML级别问题测试中,模型在代数、几何、数论、组合学和不等式等所有类别中,均超越了GPT-5-Thinking-High和Gemini 2.5-Pro的表现 [4] 核心技术革新 - 模型采取严苛的“死磕过程”策略,必须展示清晰、严谨的分步推导过程,只要中间步骤出现逻辑断裂,即便最终结果正确也不给予正向反馈,以解决“推理假象”问题 [5][6] - 公司独创多层级的“元验证”机制,通过类似“套娃”的监督架构(学生-老师-校长),将评分系统的置信度从0.85提升至0.96,极大保证训练数据质量 [9] - 模型展现出类似人类“三省吾身”的自我反思能力,在处理高难度定理证明时,能通过测试时间计算进行停顿和自省,一旦发现逻辑漏洞会自主推翻重写 [9] 行业影响与市场定位 - 模型发布在海外开发者社区引发强烈反响,被舆论称为“鲸鱼回归”,以10个百分点的优势在基础基准上击败谷歌获奖模型,打破顶级推理模型长期被闭源巨头垄断的局面 [11] - 行业推测公司极有可能将这一逻辑验证能力迁移至编程模型,届时将对现有代码辅助工具市场产生巨大冲击 [11] - 模型代码与权重已在Hugging Face及GitHub平台完全开源,为开源社区提供了通过构建严谨验证机制而非单纯堆砌算力来实现机器智能质变的技术演进路线 [11]
吊打谷歌!DeepSeek开源首个“奥数金牌”AI
格隆汇· 2025-11-28 15:09
产品发布与定位 - 公司于近期发布新模型DeepSeekMath-V2,这是一个专注于数学领域的模型 [1] - 该模型是行业首个达到国际奥林匹克数学竞赛金牌水平且开源的模型 [2] - 模型采用Apache 2.0开源许可证向全球开发者开放权重 [10] 性能表现与基准测试 - 在Basic基准测试中得分接近99%,显著高于谷歌Gemini Deep Think的89% [4] - 在Advanced子集上得分61.9%,略低于Gemini Deep Think的65.7% [4] - 在IMO 2025中破解5题,达到金牌水平 [4] - 在CMO 2024中达到金牌水平 [4] - 在Putnam 2024中得分118接近满分,超越人类参赛者最高分90分 [4] - IMO 2025解题率为83.3%,CMO 2024解题率为73.8%,Putnam 2024解题率为98.3% [7] 技术突破与创新 - 模型引入自验证数学推理的新训练范式 [2][10] - 技术核心是训练一个准确可靠的验证器专门负责检查定理证明的每一步 [10] - 生成器学会在生成证明过程中主动识别和修正自身问题 [11] - 通过扩展验证计算量自动标注难以验证的证明并持续训练验证器 [11] 行业影响与市场反应 - 发布时机精准卡位于头部厂商密集发布新模型的11月 [10] - 打破了闭源模型在顶级数学推理领域的垄断格局 [10] - 国外开发者评价为惊人的发布并以鲸鱼归来形容公司的回归 [8] - 以10个百分点优势超越谷歌的DeepThink令市场感到意外 [8] - 行业正密切关注公司下一代旗舰模型的发布计划 [11]