Workflow
Gemini 3系列
icon
搜索文档
AI周报 | DeepSeek开源奥数金牌水平模型;前OpenAI 联创称规模扩展时代已终结
第一财经· 2025-11-30 08:48
DeepSeek模型进展 - 开源首个达到国际奥林匹克数学竞赛金牌水平的数学模型DeepSeek-Math-V2 [1] - 模型部分性能优于谷歌旗下的Gemini DeepThink [1] - 行业头部厂商近期密集迭代模型,包括OpenAI发布GPT-5.1、xAI发布Grok 4.1、谷歌发布Gemini 3系列 [1] AI技术路线与行业观点 - 前OpenAI联合创始人伊利亚·苏茨克维认为AI规模扩展时代已终结,主流路线遇到瓶颈 [2] - 其观点指出算力规模已很大却不能持续带来更好的扩展,扩展与浪费算力界限模糊 [2] - 未来需要解决大模型泛化能力比人类差的问题,AI可能缺少人类情绪这种价值函数 [2] 百度组织架构调整 - 百度新设立基础模型研发部与应用模型研发部两大部门 [3] - 基础模型研发部由吴甜牵头专注通用人工智能大模型研发,应用模型研发部由贾磊负责聚焦业务场景专精模型调优 [3] - 新设部门均直接向百度CEO李彦宏汇报,体现推进干部年轻化决心 [3] 英伟达市场动态与回应 - 英伟达股价一度重挫逾7%,市值瞬间蒸发近3500亿美元,最终收跌2.59% [4] - 公司回应大空头迈克尔·伯里言论,称战略投资在营收中比例较小,投资组合公司主要从第三方客户获取收入 [4] - 投资者对AI算力真实需求和投入能否转化为足够收益产生怀疑 [4] 谷歌硬件与芯片动态 - 谷歌重启AI眼镜项目,硬件代工由富士康负责,参考设计由三星提供,芯片由高通提供 [5][6] - 项目已进入小批量试产阶段,预计最早2026年第四季度发布 [6] - 谷歌自研第七代TPU单芯片峰值算力可达4614TFLOPs,是目前性能最强大、能效最高的自研芯片 [10] AI产业链公司动态 - 工业富联澄清第四季度业绩目标下调传闻,称英伟达GB200、GB300等相关产品出货均按计划推进 [8] - 公司股价从10月30日到11月24日累计下跌30.77%,但11月25日至28日累计上涨8.54% [8] - 天孚通信辟谣获谷歌30亿美元订单,称信息不实 [9] AI行业资源消耗与挑战 - 汇丰银行分析指出OpenAI至2030年仍难盈利,即便用户规模覆盖全球成年人44%且营收可能突破2130亿美元 [7] - OpenAI目标在本年代末达到36GW算力,接近美国中型州用电量,预计自由现金流仍为负,整体缺口达2070亿美元 [7] - 摩根士丹利报告指出AI不仅是主要电力消费者,也是吃水大户,数据中心严重依赖水资源 [11][12]
DeepSeek上新:开源模型首达IMO金牌水平,AI推理告别“死记硬背”
观察者网· 2025-11-28 15:17
模型发布与核心性能 - 公司于本周三晚间低调发布专注于数学推理与定理证明的新模型DeepSeek-Math-V2,参数量为685B [1] - 在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中,模型均达到金牌水平 [1] - 在普特南(Putnam 2024)数学竞赛中,模型通过扩展测试计算取得118分(满分120分)的近乎满分成绩,远超人类选手约90分的历史最高分记录 [1] 具体竞赛成绩 - 在IMO 2025竞赛中,模型在P1至P5题上取得83.3%的成绩 [3] - 在CMO 2024竞赛中,模型在P1、P2、P4、P5、P6题上取得73.8%的成绩 [3] - 在Putnam 2024竞赛中,模型在A1至B4、B5、B6题上取得98.3%的成绩 [3] 基准测试对比 - 在IMO-ProofBench基准测试的基础集上,模型得分接近99%,大幅领先谷歌Gemini DeepThink (IMO Gold) 的89% [4] - 在难度更高的进阶集上,模型得分61.9%,略低于Gemini DeepThink的65.7%,但作为开源模型已无限接近闭源商用模型的顶尖水平 [4] - 在自主构建的91个CNML级别问题测试中,模型在代数、几何、数论、组合学和不等式等所有类别中,均超越了GPT-5-Thinking-High和Gemini 2.5-Pro的表现 [4] 核心技术革新 - 模型采取严苛的“死磕过程”策略,必须展示清晰、严谨的分步推导过程,只要中间步骤出现逻辑断裂,即便最终结果正确也不给予正向反馈,以解决“推理假象”问题 [5][6] - 公司独创多层级的“元验证”机制,通过类似“套娃”的监督架构(学生-老师-校长),将评分系统的置信度从0.85提升至0.96,极大保证训练数据质量 [9] - 模型展现出类似人类“三省吾身”的自我反思能力,在处理高难度定理证明时,能通过测试时间计算进行停顿和自省,一旦发现逻辑漏洞会自主推翻重写 [9] 行业影响与市场定位 - 模型发布在海外开发者社区引发强烈反响,被舆论称为“鲸鱼回归”,以10个百分点的优势在基础基准上击败谷歌获奖模型,打破顶级推理模型长期被闭源巨头垄断的局面 [11] - 行业推测公司极有可能将这一逻辑验证能力迁移至编程模型,届时将对现有代码辅助工具市场产生巨大冲击 [11] - 模型代码与权重已在Hugging Face及GitHub平台完全开源,为开源社区提供了通过构建严谨验证机制而非单纯堆砌算力来实现机器智能质变的技术演进路线 [11]
DeepSeek上新,“奥数金牌水平”
第一财经· 2025-11-28 08:40
模型发布与性能表现 - 公司于11月27日在Hugging Face上开源数学模型DeepSeek-Math-V2,该模型是行业首个达到国际奥林匹克数学竞赛金牌水平且开源的模型[3] - 在IMO-ProofBench基准测试中,模型在IMO 2025题目上取得83.3%的成绩,在CMO 2024上取得73.8%的成绩,在Putnam 2024上取得98.3%的成绩[4] - 在Basic基准上,模型取得近99%的高分,远高于第二名谷歌Gemini DeepThink的89%;在更难的Advanced子集上,模型得分为61.9%,略低于Gemini DeepThink的65.7%[5] 技术创新与研究方向 - 模型从结果导向转向过程导向,通过自我验证方法教会AI像数学家一样严谨审查证明过程,不依赖大量数学题答案数据[8] - 该技术突破当前AI数学推理的研究局限,即正确最终答案不能保证推理过程正确的问题,展示了强大的定理证明能力[8] - 公司在技术论文中指出,可自我验证的数学推理是可行研究方向,可能有助于开发更强大的数学AI系统[8] 行业影响与市场反应 - 海外市场反应积极,有评论称"鲸鱼终于回来了",并认为公司以10个百分点优势击败谷歌IMO Gold获奖模型超出预期[9] - 行业期待公司的下一步动作,特别是在头部厂商如OpenAI、xAI、谷歌相继发布新模型后,市场关注公司旗舰模型的更新计划[10]
DeepSeek上新,“奥数金牌水平”
第一财经· 2025-11-28 08:35
模型发布与性能表现 - 公司于2025年11月27日晚在Hugging Face上开源新模型DeepSeek-Math-V2,这是行业首个达到国际奥林匹克数学竞赛金牌水平且开源的模型[3] - 在Basic基准上,该模型取得近99%的高分,远高于第二名谷歌Gemini Deep Think的89%[5] - 在更难的Advanced子集上,该模型分数为61.9%,略逊于谷歌Gemini Deep Think的65.7%[5] 技术创新与突破 - 模型从结果导向转向过程导向,具备强大的定理证明能力,不依赖大量数学题答案数据,而是教会AI像数学家一样严谨地审查证明过程[8] - 该技术突破当前AI数学推理的研究局限,即正确的最终答案不能保证正确的推理,通过自我验证来扩展测试时间计算,特别是针对没有已知解决方案的开放问题[8] - 模型在IMO 2025和CMO 2024上取得金牌级成绩,在Putnam 2024上通过扩展测试计算实现接近满分的118/120分[8] 行业影响与市场反应 - 海外市场反应积极,有评论称“鲸鱼终于回来了”,并以10个百分点优势击败谷歌的IMO Gold获奖模型DeepThink[9] - 行业头部厂商模型近期密集迭代,包括OpenAI发布GPT-5.1、xAI发布Grok 4.1、谷歌发布Gemini 3系列,市场期待公司下一步动作[9] - 外界更关注公司旗舰模型的更新时间,行业期待“鲸鱼”的下一个动作[9]
DeepSeek上新!首个奥数金牌水平的模型来了
第一财经· 2025-11-28 08:22
模型发布与核心成就 - 公司于11月27日在Hugging Face上开源数学模型DeepSeek-Math-V2,该模型是行业首个达到国际奥林匹克数学竞赛金牌水平且开源的模型[1] - 模型在IMO-ProofBench基准及近期数学竞赛中表现出色,部分性能优于谷歌旗下的Gemini DeepThink模型[1] - 模型在Basic基准上取得近99%的高分,远高于第二名Gemini Deep Think (IMO Gold)的89%分数[5] 具体性能表现 - 在IMO 2025的P1至P5问题上取得83.3%的成绩[4] - 在CMO 2024的P1、P2、P4、P5、P6问题上取得73.8%的成绩[4] - 在Putnam 2024的A1至B4、B5、B6问题上取得98.3%的成绩[4] - 在更难的Advanced子集上得分为61.9%,略低于Gemini Deep Think (IMO Gold)的65.7%[5] - 在Putnam 2024上通过扩展测试计算实现118/120接近满分的成绩[8] 技术创新与研究方向 - 模型从结果导向转向过程导向,展示了强大的定理证明能力,不依赖大量数学题答案数据[8] - 核心创新在于教会AI像数学家一样严谨地审查证明过程,实现自我验证,从而在没有人类干预下提升解决高难度数学证明题的能力[8] - 公司提出自我验证对于扩展测试时间计算尤为重要,特别是针对没有已知解决方案的开放问题[8] - 可自我验证的数学推理被证明是可行的研究方向,可能有助于开发更强大的数学AI系统[8] 行业影响与市场反应 - 海外反应积极,有观点认为公司以10个百分点的优势击败谷歌的IMO Gold获奖模型DeepThink超出预期[9] - 行业期待公司的旗舰模型更新,市场关注"鲸鱼"的下一个动作[10] - 在OpenAI发布GPT-5.1、xAI发布Grok 4.1、谷歌发布Gemini 3系列后,行业关注公司的下一步动作[10]
谷歌产业链延续活跃,5G通信ETF、创业板人工智能ETF华夏涨超3%
每日经济新闻· 2025-11-27 10:41
AI大模型技术突破 - 谷歌发布新一代AI模型Gemini 3.0,其视觉、推理、编程、多模态等能力均显著提升,实际应用层面可用性及适用性大幅提升[1] - 新一代大模型在多项基准测试中实现断层式领先,展现出跨越式的性能提升,标志着大模型能力的关键跃迁[2] - Gemini的成功证明Scaling Law(规模法则)发展路径依然有效,AI模型能力随参数规模、数据量和计算资源增加而可预测地提升,反驳了性能到顶的悲观论调[2] 资本市场表现 - AI算力产业链强势反弹,光模块CPO概念股爆发,太辰光涨超11%,新易盛、光库科技、天孚通信、联特科技等纷纷走强[1] - 谷歌股价创出历史新高,公司最新市值仅次于英伟达、苹果,成为美股市值第三大公司[1] - 热门ETF创业板人工智能ETF华夏(159381)及5G通信ETF(515050)盘中涨超3%[1] AI光模块产业链 - AI光模块是专门为满足AI计算集群超高带宽与低延迟需求的光模块,是AI算力革命的“神经中枢”[3] - 技术迭代与市场需求共振下,中国厂商已占据全球竞争先机,2024年全球光模块厂商TOP10中多家中国厂商入围[3] - 行业正从800G向1.6T迈进,3.2T等更高速率技术也已突破,产业链迎来量价齐升的高景气阶段[3] 相关ETF产品概况 - 5G通信ETF(515050)跟踪中证5G通信主题指数,最新规模超80亿元,深度聚焦英伟达、苹果、华为、谷歌产业链[4] - 该指数通信与电子两大核心赛道合计占比79.4%,其中通信权重44%锁定5G网络基建,电子权重35%向上游半导体等延伸[4] - 创业板人工智能ETF华夏(159381)跟踪创业板人工智能指数,光模块CPO权重占比超54%,前三大权重股为中际旭创(24.78%)、新易盛(19.40%)、天孚通信(5.11%)[4]
1.6T光模块加单,通信ETF(515880)涨超3%,光模块占比近50%
搜狐财经· 2025-10-21 10:32
英伟达Rubin平台与1.6T光模块需求 - 2026年英伟达Rubin出货预期上调,头部企业将2025年1.6T光模块总需求上调至1500万,且仍有上修动能 [1] - 需求上修直接增厚头部厂商盈利预期,强化AI算力驱动下光模块高景气周期的持续性与确定性 [1] - 上游CW光源、EML光芯片及关键设备(如MOCVD、电子束)排产紧张,供给约束增强,价格与毛利率韧性提升,龙头受益度更高 [1] 云厂商资本开支与AI投入 - 北美云服务提供商计划2025财年资本开支超过3700亿美元,同比增长40% [2] - 甲骨文FY26Q1末剩余履约义务达4550亿美元,较上季度末增加3170亿美元,公司预计2026财年资本开支达350亿美元 [2] - OpenAI与AMD共同部署6GW的MI450 GPU集群 [2] - 中国云厂商预计2025年投入AI算力的支出超过4500亿元,国产超节点算力集群产业化进程加速 [2] 光模块市场规模与增长 - 光模块行业受计算芯片放量及技术升级驱动,处于量价齐升状态,2025年增速或高于2024年 [3] - 据测算,2025/2026/2027年数通100G以上光模块市场规模同比增长54%/69%/34%,规模分别达144亿/244亿/327亿美元 [3] - 市场份额格局总体稳定,中国头部大厂占据核心份额 [3] AI产业趋势与催化剂 - 谷歌Gemini 3系列预计于10月22日发布,新模型在延迟和成本控制方面优化,可能为AI板块带来催化 [1] - AI浪潮长坡厚雪,算力主线“卖铲人”逻辑清晰,龙头效应有望加强 [9] - 全球AI资本开支浪潮可能带来结构性机会,光模块作为核心环节受益显著 [4][9] 通信ETF与投资机会 - 通信ETF(515880)规模为87.64亿元,在同类15只产品中排名第一,截至9月30日,“光模块+服务器+铜连接+光纤”占比近79% [10] - 光模块在通信ETF中占比近50%,可关注相关布局机会 [4][10] - 海外AI基建投入与业绩共振,国内国产GPU放量加速,AI基础设施投入规模仍有较大空间 [10]