Workflow
Seek .(SKLTY)
icon
搜索文档
从开源最强到挑战全球最强:DeepSeek新模型给出了解法
观察者网· 2025-12-02 19:38
模型发布核心信息 - 12月1日,公司发布两个正式版模型:面向日常使用的DeepSeek-V3.2和面向极致探索的DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2是9月底实验版V3.2-Exp的正式版,平衡推理能力与输出长度,适合问答场景并强化了Agent能力,官方网页端、App和API均已更新 [1][4] - Speciale版本是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型推理能力推向极致,目前仅以临时API服务形式开放 [1] 模型性能表现 - 在公开推理测试中,V3.2已达到GPT-5水平,仅略低于Google Gemini 3 Pro,相比Kimi-K2-Thinking输出长度大幅降低,减少计算开销与用户等待时间 [6] - Speciale在多个推理基准测试中超越Gemini 3 Pro,包括美国数学邀请赛(96.0分)、哈佛MIT数学竞赛(99.2分)和IMO(84.5分) [7] - 在编程与理工科博士生测试中,Speciale仍略逊于Google顶级模型,如LiveCodeBench(88.7分)和GPQA Diamond(85.7分)低于Gemini 3 Pro的90.7分和91.9分 [7] 技术架构创新 - 公司设计了DSA(DeepSeek稀疏注意力)机制应对长文本计算量爆炸,该机制像图书管理员通过“闪电索引器”只检索关键信息,大幅降低计算复杂度 [8] - V3.2的核心亮点是“Thinking in Tool-Use”(思考型工具调用),这是AI Agent领域的“Interleaved Thinking”(交错思维链)技术的重要背书 [8][9] - 该技术将冗长、重度依赖工具的任务转化为稳定的“计划→行动→反思”循环,通过复用假设与部分结论减少多轮任务中的“状态漂移”与重复性错误 [9] 战略方向与行业定位 - 公司将“Agent能力”提升到与“推理能力”同等重要的战略位置,试图通过Agent能力将模型从“聊天机器人”进化为真正的“数字劳动力” [13] - 从经济维度看,企业真正愿意付费的是“降本增效的行动”而非“更优美的回答”,Agent使LLM从“对话式AI”进化为“动作式AI”以产生商业闭环 [13] - 公司思路已从工具转变为基础设施提供商,大模型正演变成调度工具的通用操作系统,模型是内核,Agent是用户态程序,插件则是工具 [14] 行业竞争格局 - 过去一年开源大模型生态集体爆发,阿里云Qwen系列、月之暗面Kimi、智谱GLM和MiniMax M系列均取得超越当时顶级闭源模型的成果 [1] - Google Gemini 3.0 Pro的发布重新定义了“全球最强”,其强劲性能让开源和闭源的差距瞬间又变成了一道新的天花板 [2] - 开源模型存在三个关键缺陷:对标准注意力机制的过度依赖、后训练阶段计算投入不足、Agent领域泛化能力和指令遵循能力存在明显差距 [15] 未来发展路径 - 公司计划通过增加预训练计算量填补知识空白,并优化模型推理链的“智能密度”提高效率,让模型学会“少说话、多办事” [16] - 研究员Zhibin Gou表示,训练后的瓶颈需通过优化方法和数据解决,而非仅等待更好的基础模型,持续扩大模型规模、数据量、上下文和强化学习 [17] - 公司用实打实的模型证明Scaling没死只是换了战场,当行业讨论Scaling Law是否撞墙时,公司想证明持续扩展的可能性 [19]
DeepSeek重磅上新,对标美国行业巨头,“所有群聊都炸锅了!”
新浪财经· 2025-12-02 18:24
新品发布与性能表现 - 公司于12月1日推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2定位“平衡实用”,在主流推理基准测试中达到GPT-5水平,仅略低于Gemini-3.0-Pro [1][4] - DeepSeek-V3.2-Speciale为“极致推理”版本,在推理基准测试中性能媲美谷歌Gemini 3.0 Pro [1][4] - V3.2-Speciale在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现,其中ICPC成绩达人类选手第二名,IOI成绩达人类选手第十名 [1][5] - 在具体基准测试中,V3.2-Speciale在AIME 2025得分为96.0(23k),HMMT Feb 2025得分为99.2(27k),CodeForces得分为2701(77k) [6] 技术特点与产品优势 - DeepSeek-V3.2在智能体评测中达到当前开源模型最高水平,大幅缩小开源模型与闭源模型的差距 [4] - V3.2是公司推出的首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用 [4] - V3.2相比Kimi-K2-Thinking输出长度大幅降低,显著减少计算开销与用户等待时间 [4] - V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力 [4] - 官方网页端、App和API均已更新为正式版V3.2,Speciale版本以临时API服务形式开放,相关模型已开源 [5] 行业影响与专家评价 - 新品发布恰逢2025年神经信息处理系统大会(NeurIPS)召开前夕,引发AI研究领域广泛热议 [1][2] - 专家表示DeepSeek发布新模型的消息使所有相关交流群“炸开了锅”,研究人员若现身NeurIPS会场将引发高度关注 [2] - 谷歌深度思维首席研究工程师苏珊·张称赞技术报告内容详尽,肯定公司在模型训练后稳定性优化及智能体能力提升方面的努力 [7] - 彭博社指出该成果表明中国开源AI系统至少在部分核心指标上已与硅谷顶尖专有模型具备同等竞争力 [7] - Hugging Face首席执行官盛赞用户可免费拥有“世界上最优秀数学家之一的大脑”,并强调AI和知识民主化的最佳体现 [7] 行业格局与战略对比 - 过去一年中国团队开发的开源AI模型下载量占比上升至17%,首次超越美国开发团队的15.8% [8] - 与美国OpenAI、谷歌等科技巨头的“封闭”策略不同,中国科技公司倾向于更加开放的策略,发布一系列开源模型 [9] - 德国智库分析师指出开源在中国更像是一种主流趋势,而美国公司不愿公开商业机密 [9] - MIT研究员表示中国科技公司正在改变AI模型发布范式,许多公司每周或每两周发布一次模型,而美国公司往往每六个月或一年才发布 [9] - 业内人士认为尽管有芯片出口管制,中国拥有大量优秀人才,在开发开源模型中展现出极强创造力 [10]
DeepSeek模型上新,关注人工智能ETF(159819)、科创人工智能ETF(588730)等产品布局机会
每日经济新闻· 2025-12-02 12:04
市场表现 - 今日早盘A股主要指数集体低开,人工智能产业链方向出现震荡 [1] - 截至10:50,上证科创板人工智能指数下跌1.1%,中证人工智能主题指数上涨0.1% [1] - 资金借道相关ETF逢低加仓,人工智能ETF(159819)盘中净申购达2200万份 [1] 行业动态 - DeepSeek新发布两个正式版模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2目标为平衡推理能力与输出长度,适合日常问答场景和通用Agent任务场景 [1] - DeepSeek-V3.2-Speciale目标为将开源模型推理能力推向极致,探索模型能力边界 [1] - 分析指出DeepSeek推动中国算力生态协同创新与演进,将模型、算法创新与编译语言、计算芯片协同 [1] 指数与投资工具 - 中证人工智能主题指数由50只为人工智能提供基础资源、技术及应用支持的股票组成,覆盖AI全产业链 [2] - 上证科创板人工智能指数从科创板选取30只市值较大、业务涉及人工智能领域的股票作为样本,基础芯片、AI应用环节占比较高 [2] - 人工智能ETF(159819)、科创人工智能ETF(588730)可助力投资者布局AI与算力生态成长机遇 [2]
和讯投顾李景峰:DeepSeek又有新动作!
搜狐财经· 2025-12-02 11:40
美股市场动态及其对A股的潜在影响 - 美股市场出现回调,该回调在之前已有预期,被视为可能为后续上涨打开空间的一种市场行为 [1] - 美股回调可能会给A股市场带来短期波动,但回调后市场可能迎来新的机会 [1] 美联储主席相关传闻的市场解读 - 市场出现关于美联储主席鲍威尔可能辞职的传闻,该传闻可能旨在向鲍威尔施压,以期在12月10日美联储议息会议前推动再次降息 [1] - 分析认为,若鲍威尔因压力辞职,其接任者可能被市场视为更鸽派,但这并非全然利好,因为美联储决策若被个人过度左右,可能影响美国主权信用 [1] DeepSeek发布新模型引发的市场反应 - DeepSeek公司发布两个新模型版本,此举已引发市场关注,并在A股尾盘带动相关标的走强 [2] - 市场将“板块有利好且对应板块能够上涨”的现象视为“确定性”,在确定性的前提下再寻找投资空间 [2] - 分析建议关注该方向的投资者可等待回调打开空间后再择时介入,而非盲目追高 [2] 当前A股市场操作策略观点 - 分析认为A股市场在当前点位最好先休息,若继续上涨将面临压力位,并可能冲高回落 [2] - 若市场能进行一个ABC回调,反而可能再次打开上行空间,并让投资者更好地把握买卖节奏 [2] - 成功的市场操作关键在于判断出手时机,在容易出手时出手,在不易出手时管住手,多数投资者知晓主线所在但不愿等待回调后的择时机会 [3]
DeepSeek闪亮登场引爆AI板块,高研发概念股获机构密集调研
环球网· 2025-12-02 11:38
技术发布与性能突破 - 人工智能公司DeepSeek发布DeepSeek-V3-2和DeepSeek-V3-2-Speciale两个版本,标志着国产开源模型在推理能力和智能体应用上取得里程碑进展 [1] - DeepSeek-V3-2在智能体评测中达到当前开源模型最高水平,大幅缩小与闭源模型的差距,在公开推理类基准测试中性能达GPT-5水平,略低于Gemini-3-0-Pro,同时输出长度大幅降低以减少计算开销和用户等待时间 [1] - DeepSeek-V3-2-Speciale版本结合长思考增强与数学定理证明能力,在主流推理基准测试上表现媲美Gemini-3-0-Pro,致力于将开源模型推理能力推向极致 [1] 机构评价与市场影响 - 券商机构积极评价技术突破,华泰证券认为DeepSeek-V3-2是重要且明显的开源模型更新,测评为开源最佳,模型更新有利于AI商业化 [2] - 中原证券指出新模型引入新注意力机制,在提升性能同时大幅降低训练推理成本,带来模型价格显著下降,成本下降意味着更好性价比和可推广性,将促进应用端功能落地 [2] - A股DeepSeek概念板块表现抢眼,涵盖242只相关个股,合计总市值约4.21万亿元,超八成概念股年内股价上涨,平均涨幅达30.67% [4] 概念股市场表现与业绩 - 开普云以288.38%涨幅领涨概念股,品高股份涨超2倍,和而泰、路桥信息等13股涨幅在100%至200%之间,共计9只概念股年内股价翻倍 [4] - 126只DeepSeek概念股今年前三季度净利润实现正增长,占比约52%,盛通股份、盛天网络净利润增幅均在10倍以上,容知日新、拓维信息净利同比均增逾8倍 [4] - 102家公司在第三季度实现业绩同比增长,显示板块整体强劲复苏势头 [4] 研发投入与机构关注 - 162只概念股前三季度研发费用超5000万元,紫光股份、大华股份投入均超30亿元,海光信息、传音控股等12股研发投入均超10亿元 [5] - 57只概念股前三季度研发费用超1亿元且研发费用占营收比例超10%,其中13只股票近一个月获机构密集调研 [5] - 中控技术获165家机构集中调研,作为流程工业智能制造龙头有望受益于设备更新政策和出海机遇,工业AI业务打开长期增长空间 [5] - 昆仑万维获26家机构调研,公司正深化AI在内容创作与推荐环节作用,短剧平台DramaWave已上线动漫频道,未来强化AI技术与内容生态融合 [5]
DeepSeek发布两个正式版模型,科创半导体ETF(588170)震荡回调
每日经济新闻· 2025-12-02 10:50
指数及ETF表现 - 截至2025年12月2日09点48分,上证科创板半导体材料设备主题指数下跌0.44% [1] - 成分股拓荆科技领涨1.19%,中微公司上涨0.98%,华海清科上涨0.09% [1] - 成分股华海诚科领跌3.88%,艾森股份下跌3.03%,神工股份下跌2.36% [1] - 科创半导体ETF(588170)下跌0.58%,最新报价1.38元 [1] - 科创半导体ETF(588170)盘中换手1.76%,成交5858.59万元 [1] - 截至12月1日,科创半导体ETF近1月日均成交4.19亿元,领先同类 [1] - 科创半导体ETF近1周规模增长6932.05万元,实现显著增长 [1] 行业背景与投资逻辑 - 国产替代政策支持、技术持续迭代及下游多元化需求推动AI产业蓬勃发展 [2] - AI产业从芯片、云端大模型向端侧智能、具身智能持续进步 [2] - 重点关注国产AI在算力性能、能效比方面的进展和国产替代情况 [2] - 关注端侧AI、具身智能的技术演进和场景落地情况 [2] - 建议关注AI产业链,包括芯片、服务器、液冷、电源以及下游AI应用 [2] 相关ETF产品构成 - 科创半导体ETF(588170)跟踪上证科创板半导体材料设备主题指数 [2] - 指数囊括科创板中半导体设备(61%)和半导体材料(23%)细分领域公司 [2] - 半导体设备和材料行业具备国产化率较低、国产替代天花板较高属性 [2] - 行业受益于人工智能革命下的半导体需求扩张、科技重组并购浪潮、光刻机技术进展 [2] - 半导体材料ETF(562590)指数中半导体设备(61%)、半导体材料(21%)占比靠前 [2]
DeepSeek,重大突发!AI产业有望持续繁荣
证券时报网· 2025-12-02 10:43
DeepSeek模型发布 - 同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1][2] - DeepSeek-V3.2目标为平衡推理能力与输出长度,适合日常问答和通用Agent任务场景 [1][2] - DeepSeek-V3.2-Speciale目标为将开源模型推理能力推向极致,探索模型能力边界 [1] - DeepSeek-V3.2是公司首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用 [1][4] - 官方网页端、App和API均已更新为正式版DeepSeek-V3.2,Speciale版本目前仅以临时API服务形式开放供社区评测与研究 [2] 模型性能表现 - 在公开推理类Benchmark测试中,DeepSeek-V3.2达到GPT-5水平,仅略低于Gemini-3.0-Pro [2] - 相比Kimi-K2-Thinking,V3.2输出长度大幅降低,显著减少计算开销与用户等待时间 [2] - DeepSeek-V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备出色指令跟随、严谨数学证明与逻辑验证能力 [3] - V3.2-Speciale在主流推理基准测试上性能表现媲美Gemini-3.0-Pro [3] - V3.2-Speciale成功斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025金牌,ICPC与IOI成绩分别达到人类选手第二名与第十名水平 [3] 技术突破与创新 - 公司提出大规模Agent训练数据合成方法,构造1800+环境、85000+复杂指令的"难解答,易验证"强化学习任务 [4] - 该方法大幅提高模型泛化能力,DeepSeek-V3.2模型在智能体评测中达到当前开源模型最高水平 [4] - V3.2大幅缩小开源模型与闭源模型的差距,且未针对测试集工具进行特殊训练,在真实应用场景中展现较强泛化性 [4] - 在高度复杂任务上,Speciale模型大幅优于标准版本,但消耗Tokens显著更多,成本更高 [3] AI行业市场表现 - 12月1日AI概念表现活跃,AI手机、AI穿戴设备、AIPC、AI算力等方向领涨 [5] - 中兴通讯、鹏鼎控股、天音控股、福蓉科技等纷纷涨停 [5] - AI玩具概念股集体异动,广和通20%涨停,博通集成、实丰文化10%涨停 [5] - 字节跳动豆包团队发布豆包手机助手技术预览版,正在与多家手机厂商洽谈助手合作 [5][6] - 华为首款AI情绪陪伴产品"智能憨憨"定价399元,开售即"卖断货",集成AI语音交互、情感识别等功能 [6] 行业前景与投资机会 - 全球AI产业已进入共振期,AI基建加速扩张与下游应用商业化落地同步推进 [1][6] - 计算机板块营收规模的"扩容天花板"持续上移,为PS估值提供强支撑 [6] - 展望2026年,AI基建与应用仍是主线 [1][7] - 投资机会包括:国产AI链加速创新与前沿科技领域、海外市场AI硬件高景气延续、国内端侧AI产业创新落地 [7] - AI应用端相关企业受益于算力扩容提质、模型能力快速进步等影响,有望享受突出估值弹性 [6]
早报 (12.02)| 惊魂一夜!白银新高、比特币超27万人爆仓;DeepSeek新模型炸场;大摩上调谷歌芯片预测:200万块
金融界· 2025-12-02 09:56
乌克兰总统泽连斯基当地时间12月1日表示,乌美谈判代表团日前举行了多轮会议,他说,"当前方案看 起来更具前景"。此外,他透露双方就领土问题进行了长达6.5小时的讨论。 美股方面,道指跌0.9%,纳指跌0.38%,标普500指数跌0.53%, 大型科技股多数下跌,博通跌超4%,谷歌、Meta、微软跌超1%,英伟达、苹果涨超1%。加密货币、 太阳能板块跌幅居前,白银股、货运、鞋服、油气涨幅居前。芯片设计软件公司新思科技涨超4%,英 伟达投资20亿美元购入该公司股票。 热门中概股涨跌不一,网易涨5%,阿里巴巴涨超4%,百度涨超2%,拼多多涨近2%;小鹏汽车、理想 汽车跌超2%,蔚来跌超5%。 白银价格创历史新高。今年以来,国际银价已上涨超90%,大幅跑赢黄金。分析指出,近期市场对美联 储降息预期升高,这为白银及整个贵金属市场提供了坚实支撑。中银证券指出,白银补涨弹性或优于黄 金,贵金属长牛逻辑依然坚固,白银的短期确定性更强。瑞银则持续看多白银,预计价格将在2026年达 到60美元/盎司。 全球资产表现上,贵金属价格走高,现货白银收涨2.85%,报57.987美元/盎司,继续刷新历史新高。 COMEX黄金期货涨0.2 ...
DeepSeek V3.2正式版发布:推理比肩GPT-5
凤凰网· 2025-12-02 09:52
公司产品发布 - 深度求索公司正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale 官方网页端 App及API已同步更新至V3.2版本 [1] - 新版本首次实现了思考模式与工具调用的融合 支持在思考过程中调用外部工具 [1] - 通过大规模Agent训练数据合成方法 模型在1800多个环境和超过8.5万条复杂指令上进行了强化学习训练 提升了泛化能力 [1] 产品性能表现 - 在公开的推理基准测试中 DeepSeek-V3.2的推理能力达到GPT-5水平 与Gemini-3.0-Pro接近 [1] - 输出长度较Kimi-K2-Thinking显著缩短 以降低计算开销 [1] - V3.2-Speciale版本融合了DeepSeek-Math-V2的定理证明能力 在IMO CMO ICPC及IOI等多项国际竞赛中取得金牌成绩 其中ICPC成绩达到人类选手第二名水平 [1] - 官方称其在智能体评测中达到当前开源模型最高水平 进一步缩小了与闭源模型的差距 [1] 技术细节与发布状态 - 此前的实验版本DeepSeek-V3.2-Exp于两个月前发布 经用户反馈测试 其采用的DSA稀疏注意力机制在各项场景中未出现显著性能下降 [2] - Speciale版本目前以临时API形式开放 供社区研究与评测 [2]
OpenAI危,DeepSeek放大招:追平谷歌最强,手撕GPT-5 High
36氪· 2025-12-02 08:56
模型发布与定位 - 公司正式发布DeepSeek-V3.2与DeepSeek-V3.2-Speciale两款模型,前者是V3.2-Exp的官方迭代版本,已登陆App、网页端及API,后者是专为智能体打造的推理优先模型,目前仅通过API提供服务 [2] - DeepSeek-V3.2定位为兼顾推理能力与文本长度、拥有GPT-5级别性能、适合日常驱动的模型,而V3.2-Speciale则追求极致推理能力,取得了4项金牌级成绩 [9] - 两款模型均已开源,代码托管在HuggingFace和ModelScope平台 [7] 核心性能表现 - 在多项国际顶级推理基准测试中,DeepSeek-V3.2-Speciale的性能表现全面超越GPT-5 High,并与谷歌Gemini-3.0 Pro难分伯仲 [1][4] - 具体来看,在AIME 2025测试中,V3.2-Speciale得分为96.0(消耗23k Tokens),高于GPT-5 High的94.6分(13k Tokens)和Gemini-3.0 Pro的95.0分(15k Tokens)[1][21] - 在HMMT Feb 2025竞赛中,V3.2-Speciale取得99.2分(27k Tokens),显著高于GPT-5 High的88.3分(16k Tokens)和Gemini-3.0 Pro的97.5分(16k Tokens)[1][21] - 在IMOAnswerBench测试中,V3.2-Speciale得分为84.5分(45k Tokens),优于GPT-5 High的76.0分(31k Tokens)和Gemini-3.0 Pro的83.3分(18k Tokens)[1][21] - V3.2-Speciale在ICPC与IOI竞赛中分别达到了人类选手第二名与第十名的水平 [5] 关键技术突破:DSA稀疏注意力架构 - 模型的核心技术是独创的DSA稀疏注意力架构,该技术被比喻为“闪电索引器”,能够以极低成本扫描索引,只对筛选出的1%关键内容进行深度阅读,从而将计算复杂度从指数级O(L^2)降低到近乎线性O(L) [16] - DSA技术的成功落地,打破了AI领域“速度、成本、智能”的不可能三角,使得处理长文本不再是“烧钱”的奢侈行为,速度也大幅提升 [17][20] - 算力的节省使得公司有底气推出Speciale版本,利用盈余资源进行更深度的“长思考”和逻辑推演,从而在硬核指标上实现突破 [20] 智能体与工具使用能力进化 - DeepSeek-V3.2是首个将思考直接整合到工具使用中的模型,同时支持在思考和非思考模式下使用工具 [6] - 相比于实验版V3.2-Exp,正式版引入了“思维上下文管理”机制,解决了思考与行动断裂的行业顽疾,使模型在调用工具后能无缝衔接后续操作 [11] - 公司为训练此能力,合成了1800多个虚拟的操作系统、代码库和浏览器环境,并生成了8.5万条刁钻指令,让模型在虚拟世界中高强度练习,从而从“做题家”进化为能熟练使用工具解决现实难题的“实干家” [13] - 在工具使用基准测试中,DeepSeek-V3.2在τ2-Bench ToolUse上得分为80.3,在MCP-Universe上得分为45.9,在Tool-Decathlon上得分为35.2,表现与主流模型竞争 [10] 公司战略与行业意义 - 此次发布标志着公司从展示“稀疏注意力”引擎潜力的“概念车”阶段,进入了完成内饰精修、装配顶级导航系统、可随时上路解决复杂问题的“量产超跑”阶段 [7] - 公司展示了在算力约束下,通过更聪明的架构、更精细的训练和更开放的生态来撬动推理极限的技术路线 [21] - 公司的策略被概括为拒绝无脑烧钱进行规模扩展,而是依靠更聪明的算法,在算力的缝隙中开辟通往顶峰的捷径 [22] - 2024年公司已累计发布7款模型,包括DeepSeek‑R1、DeepSeek‑V3系列等,巩固了其“开源之神”的行业地位 [1]