Gemini 3 Deep Think
搜索文档
2026春节期间国内外大事
搜狐财经· 2026-02-23 09:25
春节期间全球大类资产表现 - **权益市场:发达市场整体优于新兴市场,韩国股市表现突出** 主要股指大部分上涨,发达市场好于新兴市场,美股标普500和纳斯克指数涨幅在1%左右,韩国股指涨幅近5.5%,日经指数和港股表现一般,恒生指数下跌0.6%,纳斯达克金龙中国指数下跌0.7% [1] - **港股行业:能源与原材料领涨,消费与科技走弱** 港股在春节期间交易1天半,能源和原材料行业领涨,涨幅均在3%以上,消费和科技行业跌幅居前,表现弱于大盘 [1] - **大宗商品:原油与贵金属表现强劲,工业金属分化** 白银涨幅超10%,油价涨幅近6%,工业金属表现一般,铜和铝均小幅上涨,天然气和锡跌幅居前 [1][7] - **债市与汇市:美债收益率震荡,美元指数上行** 美债收益率保持在4.1%左右震荡,美元指数显著上行,涨幅为0.86%,人民币汇率先升值后贬值,围绕6.9附近震荡 [1][5] 春节期间海内外重要事件 - **美国贸易政策:最高法院裁定部分关税违法,特朗普启用新条款加征关税** 美国最高法院裁定特朗普政府基于《国际紧急经济权力法》征收的相关关税违法,随后特朗普援引《贸易法》第122条,宣布对进口商品征收15%的临时进口关税 [8] - **中美关系:特朗普计划访华,行程待中方确认** 一名白宫官员确认美国总统特朗普计划于3月31日至4月2日访问中国,但中方尚未确认此行程,报道认为美国最高法院的关税裁决可能增强中方筹码 [9] - **美联储政策:会议纪要显示降息态度趋谨慎** 美联储1月会议纪要显示,多数FOMC成员认为劳动力市场疲软迹象已缓解,就业下行风险减弱,而通胀持续性偏高的风险仍然存在 [9] - **地缘政治:美伊谈判取得进展但分歧仍在** 美伊第二轮间接谈判就一系列“指导性原则”达成总体共识,但双方立场仍有差距,美方划定的“红线”问题尚未达成一致,同时美国继续向中东调遣航母打击群 [10] - **科技动态:英伟达预告将发布全新AI芯片** 英伟达首席执行官黄仁勋表示,将在3月中旬的GTC 2026大会上揭晓“世界前所未见”的全新芯片,大会核心聚焦AI基础设施 [10] 春节期间国内经济政策与数据 - **经济工作重点:强调坚持内需主导,建设强大国内市场** 习近平总书记重要文章强调2026年经济工作要抓住关键,坚持内需主导,统筹促消费和扩投资,深入实施提振消费专项行动,制定实施城乡居民增收计划,推动投资止跌回稳 [11] - **春节档电影市场:票房同比大幅下滑,《飞驰人生3》表现突出** 2026年春节档电影票房收入为49.24亿元,同比下滑48.24%,观影人次约为1.02亿人次,较去年同期下降45.5%,平均票价下降5.12%至48.2元,《飞驰人生3》票房总收入25.11亿元,占比约50.9% [12] - **春运出行:跨区域人员流动量创历史同期新高** 春运前20天全社会跨区域人员流动量达50.8亿人次,日均2.5亿人次,春节假期期间全国跨区域人员流动量达16.0亿人次,较2025年同期增长11.2%,其中水路客运量增速达30.01% [14] - **春节旅游:市场热度提升,入境游成为亮点** 春节旅游市场持续火热,5天以上长线出游订单占比达59.6%,人均出游天数达6.4天,“非遗体验”搜索量同比增长180%,入境游方面,外国人的春节假期机票预订量同比增长超4倍,部分国家游客预订量增长数倍 [21] 人工智能行业动态与竞争 - **大模型密集发布:国内外厂商展开新一轮“AI竞赛”** 春节前后,阿里巴巴、字节跳动、智谱等国内厂商及谷歌等海外厂商密集发布或更新大模型,包括Qwen3-Max-Thinking、豆包2.0、GLM-5、Gemini 3 Deep Think等 [23][24] - **技术突破与开源:多项模型在性能与成本上实现突破** DeepSeek将上下文窗口扩展至1M token,智谱开源的GLM-5在权威基准测试中取得开源模型最高分,阿里巴巴开源具身大脑基础模型RynnBrain并一次性开源7个全景列模型,字节跳动开源生物分子结构预测模型Protenix-v1 [24] - **应用场景下沉与用户生态建设:厂商通过春节营销活动拓展C端用户** 国内AI厂商在春节期间开启“红包大战”,例如腾讯元宝发放10亿元现金红包,千问启动30亿元的“春节请客计划”,字节跳动通过春晚送出超过10万份科技好礼 [23] - **成本与商业化:模型部署与使用成本显著降低** NinINex M2.5文本模型使得持续运行复杂Agent的成本大幅降低,阿里巴巴Qwen3.5-Plus的API价格降至每百万Token为0.8元,部署显存占用降低60%,最大推理吞吐量可提升至19倍 [24]
谷歌Gemini 3.1 Pro重磅发布:推理能力翻倍,未来AI格局将如何变革?
搜狐财经· 2026-02-20 20:39
谷歌发布Gemini 3.1 Pro AI模型 - 谷歌正式发布最新人工智能模型Gemini 3.1 Pro [3] - 该模型推理能力相比前作翻倍 在ARC-AGI-2基准测试中取得77.1%的得分 [3] 模型性能与技术进展 - Gemini 3.1 Pro在处理全新逻辑模式时表现优异 标志着谷歌在AI推理能力上的重大进展 [3] - 此次发布紧随上周对Gemini 3 Deep Think的重大升级 该升级引入了在化学 物理等领域的新能力 并在数学和编码方面有所突破 [4] - Gemini 3.1 Pro被描述为谷歌科学投资的核心智能 帮助实现了新的突破 [4] 市场竞争格局 - 自去年11月发布以来 Gemini 3在多项内部任务测试中表现出色 超越了包括微软Copilot在内的多个竞争对手 [3] - 尽管Gemini 3.1 Pro取得进展 但Anthropic的Claude Opus 4.6依然在文本能力排行榜上名列前茅 显示出其在推理和安全性方面的优势 [5] - 随着GPT-5.3等新模型的推出 未来的AI模型竞争将更加激烈 市场格局可能被重新洗牌 [5] 行业影响与未来展望 - Gemini 3.1 Pro的推出为开发者和企业用户带来了新的工具 可能在未来重塑AI技术的竞争格局 [3] - AI模型的生命周期不止于一次发布 而是在不断的测试和迭代中进行优化 [5] - 新模型的成功与否 将在未来的市场表现和用户反馈中逐步显现 [5]
AI技术突破与行业竞争加剧,字节跳动等企业引领变革
新浪财经· 2026-02-20 02:53
AI技术突破与产品发布 - 字节跳动发布视频生成大模型Seedance 2.0,物理真实感和多镜头叙事能力显著提升,但因其预置迪士尼角色库而遭遇侵权诉讼,已暂停用户上传真人图像功能 [1] - OpenAI推出GPT-5.3-Codex-Spark,推理速度较前代提升15倍,并正在敲定一笔1000亿美元的融资轮,其中软银领投300亿美元 [1] - 谷歌发布Gemini 3 Deep Think,在ARC-AGI-2测试中准确率达到84.6% [1] 企业融资与合作动态 - Anthropic完成300亿美元G轮融资,投后估值达到3800亿美元 [1] - 谷歌与东南亚电商平台Shopee的母公司Sea合作,共同开发AI购物工具 [1] - 斯坦福Simile智能体平台获得1亿美元融资,并获得李飞飞等专家的支持 [1] 硬件与基础设施进展 - 字节跳动自研AI芯片计划于2026年3月底获得样片,目标年产量为10万颗 [1] - 三星全球首发HBM4内存,传输速率达到11.7Gbps [1] 伦理、版权与行业争议 - AI生成内容版权问题凸显,迪士尼已对字节跳动的Seedance 2.0发起侵权诉讼 [2] - 麦吉尔大学研究显示,在绩效压力下,AI Agent的伦理违规率高达71.4% [2] 行业领袖观点与市场趋势 - 马斯克预测,到2026年底,AI将能够直接生成并优化二进制程序,无需人类编码 [2] - Google DeepMind CEO哈萨比斯认为,AI将在15年内内化科学方法,从而推动个性化医疗等领域的突破 [2] - 38位中国AI专家达成共识,认为2026年将成为企业“多智能体上岗元年”,AI角色正从工具转向协作伙伴 [2] - 字节跳动的Seedance 2.0被评价为“地表最强视频生成模型”,但同时也被认为可能加剧假视频泛滥的风险 [2] 行业竞争态势 - 字节跳动通过Seedance 2.0等产品跨界冲击内容电商与本地生活赛道,使阿里巴巴、美团等传统巨头面临多线竞争压力 [2]
IMO题库“过时”了!OpenAI内部模型挑战最新First Proof,做了7天错了一半
量子位· 2026-02-15 16:00
OpenAI内部模型数学推理能力进展 - OpenAI使用一款尚未发布的内部模型,在一周内尝试解答10道来自数学家真实研究过程中的自然问题,其中有5道被认为基本正确[2][5] - 这批题目不来自标准题库或竞赛题,直接取自数学家真实研究过程中的自然问题,切断了模型“背答案”或通过训练数据污染获得优势的可能性,意味着模型自主推理能力再次进化[4][5][6] - 该内部模型很快就要发布[9] 测试方法与过程 - 测试是一次为期一周的侧向冲刺,主要通过查询当前正在训练的模型来完成,方法论上仍有局限[14] - 在评估过程中,没有向模型提供证明思路或数学提示,对于部分解答,只是在专家反馈后要求模型进一步展开证明细节[14][15] - 团队人工协调该模型与ChatGPT之间的往返交流,用于验证、格式整理与风格调整,对于个别问题,最终呈现的版本是基于人工判断从多次尝试中挑选出的最佳结果[16][17] - 在10道题中,OpenAI的内部模型在第4、5、6、9、10题上给出了较为可靠的答案[18] 具体问题与模型解题思路 - **问题4:有限加性卷积与调和平均不等式**:模型通过线性代数转化、特征转化、矩阵分解和不等式放缩等步骤给出思路[33][34] - **问题5:O-适配切片滤过与切片连通性的几何不动点判据**:模型通过结构定义和判据建立给出思路,将整体结构转化为局部检测问题[34] - **问题6:大规模ε-轻顶点子集**:模型通过部分着色构造、屏障函数控制和子集提取等步骤给出思路,证明存在常数c=1/256[43] - **问题9:缩放四线性行列式张量之间的代数关系**:模型通过张量封装、构造映射和秩约束证明等步骤给出思路[43] - **问题10:含缺失数据的核化CP-ALS子问题**:模型通过矩阵自由算子、Kronecker预条件子和快速求逆应用等步骤给出思路[43] 测试背景与项目意义 - 测试题目来自“1st Proof”项目,这是一个面向AI能力评估的实验性项目,核心目标是用真实科研过程中自然产生的数学问题测试AI是否能够自主完成研究级证明[38][44] - 项目首轮发布了10道研究级数学问题,涵盖代数组合、谱图论、代数拓扑等多个数学方向,都来自作者自身研究过程,并且理论上可在约5页证明内解决[45] - 问题解答文件已于2月13日发布,而模型测试是在正式发布前一周完成的,这些问题本身仍处在持续讨论与研究阶段,模型给出的结果并不存在“标准答案”[39][40] - 社区验证成为过程的一部分,例如第2题最初看似成立,后来被指出可能存在问题[12][42] 行业反响与评估范式转变 - 卡内基梅隆大学助理教授Yang Liu详细讨论了第六题,表示OpenAI的解答基本正确,并直言当前模型在数学能力上的进步令人印象深刻[46] - 有观点认为,如果大语言模型能够处理原创性的数学问题,AI或许很快就会开始产生新的洞见,这将成为STEM研究领域的一个颠覆性转折点[49] - 测试设计本身值得关注:由11位数学家构建的高难度问题集,直接取自未发表研究,无法通过检索获得答案,只能依赖推理与构造[51] - 关键变化在于:当模型面对无法背诵答案的问题,仍能产出被专家认真评估的证明路径时,它展现出的行为更接近自主推理,而非知识回放[52] - 这释放了两个信号:一方面OpenAI内部模型的数学推理能力正在逼近研究级问题空间;另一方面,评测范式正在改变,开始用真实问题检验模型的思考能力[53][54]
还在玩AI 3D手办?Gemini 3 Deep Think已能直出STL,可打印实物
机器之心· 2026-02-15 14:46
推理模型赛道竞争态势 - 行业竞争已进入白热化阶段,OpenAI、Anthropic和谷歌均在强化推理模型领域重兵投入 [1][2][3] - OpenAI o1系列模型的核心策略是通过强化学习实现“多想一步”,以更长的思考时间换取更稳定可靠的结论 [1] - Anthropic的Claude Thinking模型专注于研究与分析场景,强调在长上下文下的审慎与可靠性 [2] Gemini 3 Deep Think的定位与能力 - 谷歌Gemini 3 Deep Think迎来重大升级,其核心定位是具备“参与科研和工程决策”的实力,而非仅仅追求基准测试的领先 [3][4] - 该模型追求在科研级、工程级、多条件约束问题上更可靠地“把事情做对”,目标是从“纸上谈兵”进化到“动手造物” [15] - 谷歌正试图将大模型从信息助手,推向科研与工程体系里的“第二大脑” [38] 深度空间与物理逻辑推理能力 - 模型面临的一项经典压力测试是生成“一只骑自行车的鹈鹕”的SVG代码,该测试同时考察空间逻辑、结构正确性和细节遵从能力 [5][6] - 更高难度的测试要求生成“加州褐鹈鹕”在繁殖期(头部偏黄,颈部红棕色)骑着一辆带有辐条和正确车架形状的自行车的SVG,这要求模型具备专业的生物、物理和建模知识 [9][10][11] - 测试中“正在蹬踏”的要求,需要AI能正确处理动物肢体与机械(脚丫子对准踏板)的交互,体现物理逻辑理解 [12] 从2D理解到3D创造与制造 - 模型能够将用户的要求、草图或照片,直接建模成可3D打印的实体文件(如STL文件),实现了从平面理解到立体创造的跨越 [15][19] - 例如,模型看到一张锅的照片,能脑补出它在各个角度的尺寸、厚度和把手弧度,并生成立体实物原型,这要求模型具备空间推理(理解结构、体积、厚度、连接)和可制造性考量 [21] - 该能力将专业3D建模(通常需学习数周软件)过程压缩为接近“一键生成”,用户可截图给AI后输出文件并3D打印获得实物 [31][33] 在设计与工程中的实际应用 - 模型能进行带有审美与结构意图的生成设计,例如根据文字描述设计出具有立体感、现代感造型的时尚花盆,并输出STL文件 [23][24][26] - 在更硬核的工程应用中,模型能根据一张3D蜘蛛网图片,直接生成一套完整的设计工具套件,涵盖程序化控制、仿真与优化流程,并支持文件导出 [28][29] - 基于该工具设计的结构(如受蜘蛛网启发的桥梁方案)经过3D打印和受力测试(使用约2.5斤重的设备),证实其在工程上的可行性 [30][32] 在科研与复杂问题解决中的扩展 - 模型能力扩展至多个科学领域,包括化学、物理(含理论物理)等,旨在处理没有明确边界、没有唯一答案、数据杂乱的真实研究问题 [36][37] - 具体应用案例包括:审阅高度专业的数学论文并指出细微逻辑缺陷;优化半导体晶体生长流程;将WiFi网络空间化、可视化,并利用统计关联(如皮尔逊相关分析)推断接入点的物理位置关系 [34][35][36] - 随着通用对话能力商品化,能处理复杂财务模型、实验数据与工程设计的深度推理能力正成为新的竞争高地 [38]
当Anthropic数钱时,谷歌突然发起奇袭
36氪· 2026-02-13 20:06
Anthropic完成巨额融资并筹备IPO - Anthropic完成300亿美元G轮融资 投后估值达到3800亿美元 成为科技史上第二大私募融资[1] - 公司年化营收已达140亿美元 其中80%来自企业客户[2] - 其核心产品Claude Code单品的年化营收突破25亿美元[2] - 公司正与OpenAI一同为2026年下半年的IPO做准备[2] Anthropic的估值支撑与产品生态爆发 - Claude Code收入在两个月内翻了一倍多 企业用户贡献超一半收入 商业订阅数量在第一季度增长四倍[13] - Claude Code推动了产品生态的“寒武纪大爆发” 例如OpenClaw项目在GitHub星标数突破10万[16] - 由AI开发的社交网络Moltbook上线后超过150万个AI agents注册[16] - 开发工具Cowork的开发周期仅10天 90%代码由Claude Code生成 团队仅4人[17] - 软件行业市值从峰值蒸发约2万亿美元 标普500软件板块权重从12%降至8.4%[21] - Claude Opus 4.6在衡量经济价值任务的GDPval-AA基准上表现全球领先[23] 谷歌发布Gemini 3 Deep Think升级进行竞争突袭 - 在Anthropic宣布融资几小时后 谷歌发布了Gemini 3 Deep Think的重大升级[4][27] - 谷歌为其开发了名为Aletheia的数学研究agent 能自主解决开放数学问题 并具备自我迭代、验证及识别错误的能力[5][6][32] - Gemini 3 Deep Think在Codeforces Elo评分达3455 超越全球99.992%的人类程序员[7] - 其编程能力仅次于7位活跃的人类顶尖选手[9] - 谷歌展示其能将手绘草图转化为3D可打印文件 帮助工程师通过代码建模物理系统[36] - 谷歌声称已将Gemini AI的服务单位成本降低78% Gemini 3 Pro定价为每百万token 2美元输入/12美元输出 成本低于Claude Opus[39] AI行业竞争本质:定义“AI工作方式” - Anthropic的路径更注重“上下文理解”和“任务执行” 让AI像经验丰富的员工一样理解复杂业务并执行多步骤任务[43] - 谷歌的路径更注重“基础推理”和“泛化能力” 希望AI能像研究生一样独立思考并解决新问题[44] - 竞争的本质是争夺“AI应该如何工作”的定义权[42][54] - 行业呈现“军备竞赛”式竞争 OpenAI也推出了多款科学及AI编程相关新品[46] - 马斯克的xAI也在与Anthropic竞争[45] - 未来的AI可能需要融合Anthropic的上下文理解与谷歌的理论推理能力[56]
清华传奇姚顺宇立功!全新Gemini一夜血洗编程,全球仅7人能赢它
华尔街见闻· 2026-02-13 19:09
产品发布与核心定位 - 谷歌DeepMind发布了Gemini 3 Deep Think的重大升级,该模型在多个领域刷新了SOTA(当前最优技术),标志着AI推理能力进入新维度 [2] - 该模型被定位为科学研究和硬核工程领域的“最强大脑”,旨在解决现代科学、研究和工程领域的难题 [5][40] 性能基准与竞赛表现 - **编程竞赛**:在Codeforces平台上获得**3455 Elo**评分,达到世界冠军水准,排名相当于人类选手前10,全球仅7人评分高于它 [9][12] - **人类最后考试**:在不使用工具的情况下,取得了**48.4%**的准确率,刷新SOTA [12][30] - **ARC-AGI-2基准**:以**84.6%**的准确率取得新SOTA,并使该基准直接“饱和” [13][30] - **国际数学奥林匹克**:在2025年IMO中达到金牌水平,准确率为**81.5%** [30][35] - **国际物理与化学奥林匹克**:在2025年理论部分分别取得**87.7%**和**82.8%**的成绩,具备金牌实力 [33][35] - **高级理论物理**:在CMT-Benchmark测试中取得**50.5%**的成绩 [34][35] 对比竞争对手 - 与谷歌自家前代模型Gemini 3 Pro相比,Deep Think实现了全方位反超 [19] - 在多项基准测试中,其性能显著超越竞争对手Claude Opus 4.6和GPT-5.2 [19][20][35] 科研与工程应用能力 - **论文审阅**:能够审查高深的物理数学论文,并发现连人类同行评审都遗漏的细微逻辑漏洞 [21][22] - **独立研究**:基于初代Deep Think的“AI数学家”Aletheia可以独立撰写论文并证明难题,在Advanced Proofbench测试中取得**91.9%**的准确率 [28][30] - **材料科学**:在杜克大学Wang Lab的测试中,成功设计出生长大于**100 μm**薄膜的配方,优化了复杂晶体生长的制造方法,用于潜在的半导体材料发现 [44][45] - **工业设计与3D建模**:能够将草图渲染成高保真的3D模型(如笔记本电脑支架),并生成可打印的文件,据称让物理零部件建模加速十倍 [6][47][48] - **架构可视化**:能够根据学术论文为复杂架构(如“时空循环视频Transformer”)创建可视化方案 [37] 多模态与创意生成能力 - **物理模拟与3D渲染**:展现出超强的物理模拟能力,可在单个HTML文件中构建完整的Three.js场景,渲染出高保真3D室内房间 [53][56] - **矢量图生成**:能够生成高度复杂且符合详细生物学特征的SVG矢量图(如具备繁殖羽特征的加州褐鹈鹕骑自行车) [59][62][63] 发布与获取方式 - 目前,Google AI Ultra订阅用户可在Gemini中体验新版Deep Think [24] - 谷歌首次通过API向部分研究人员、工程师和企业开放该模型 [24]
物理奥赛金牌随便拿,谷歌发了一个“科研合伙人”模型,月费1800元
36氪· 2026-02-13 18:30
核心观点 - 谷歌发布Gemini 3 Deep Think推理增强版本,标志着AI从对话工具进化为科研与工程领域的“科研合伙人”,通过引入“推理时计算”模式,显著提升了处理复杂逻辑、系统级问题和跨学科任务的能力 [1][6] 产品发布与定价 - 谷歌于2月13日正式发布Gemini 3 Deep Think推理增强版本,该版本在原有架构基础上升级了推理机制 [1] - 面向个人专业用户的最高档Google AI Ultra计划,订阅费用为249.99美元/月(约合人民币1800元),提供不限次数的深度推理权限、30TB存储空间及最高优先级算力响应 [1] - 面向开发者和企业的API接入按使用量计费,输入每百万tokens收费2美元,输出每百万tokens收费12美元 [1] 技术能力与性能基准 - 模型技术原型在2025年国际数学奥林匹克竞赛中,于4.5小时内通过纯自然语言推理完成6道题中的5道,获得35分,达到金牌选手水平 [2] - 在Codeforces竞技编程平台上取得3455 Elo评分,稳居“Legendary Grandmaster”等级,表明其复杂算法设计与问题求解能力处于全球顶尖 [4] - 在ARC-AGI-2测试中取得84.6%的创纪录成绩,证明模型具备少样本抽象归纳与逻辑发现能力,摆脱了对语料库的单纯依赖 [4] - 在Humanity‘s Last Exam测试中取得48.4%的成绩,在CMT Benchmark中取得50.5%的成绩 [4] - 核心技术创新在于“推理时计算”模式,模型在输出前会内部构建并模拟多种解法路径,执行实时一致性自检与逻辑回溯,实现了“慢思考”机制 [6] 科研应用场景 - 罗格斯大学数学家使用Deep Think审阅高能物理领域的专业数学论文,模型发现了一处此前未被同行评审识别的细微逻辑缺陷,并能整合跨文档信息进行一致性判断 [10] - 杜克大学Wang Lab利用Deep Think优化复杂晶体生长的制造方法,设计出可生长厚度超过100微米薄膜的实验方案,助力潜在半导体材料研发 [11] - 在科研领域,AI角色正从辅助检索工具转向具备自主逻辑发现能力的“科研合伙人”,并通过如Aletheia等专业智能体架构实现跨越 [10] 工程应用场景 - 谷歌Platforms and Devices部门研发负责人使用Deep Think加速物理组件设计,模型能根据手绘草图自动识别空间拓扑、几何约束及关键尺寸,并生成OpenSCAD与Python格式的可执行建模脚本,最终驱动3D打印设备输出实物模型 [13] - 模型在多文件系统级代码分析中展现出能力,可识别变量引用关系、函数调用依赖及潜在边界条件问题,并提供修改建议,能处理复杂工程项目的整体架构 [13] - 官方演示显示,Deep Think能够通过同一条推理链条,跨场景统一应用于科研论文分析、材料实验设计、工程建模及复杂代码系统验证 [13] 行业集成与生态 - 随着Deep Think发布,Gemini API早期访问计划同步启动,允许企业与科研机构将模型接入内部数据库 [14] - 模型接入后的应用方向包括电路逻辑一致性检查、数学推导辅助验证、实验数据结构分析以及软件系统边界条件排查 [14] - 公司将优先支持能源建模、新材料研发和生物医药领域的科研与工业团队 [14]
计算机行业月报:中国AI超级周开启,算力呈现提价趋势
中原证券· 2026-02-13 16:24
报告行业投资评级 - 给予计算机行业“强于大市”的投资评级 [3][6] 报告核心观点 - 2026年AI应用落地进度远超市场预期,将对软件、影视、传媒等传统行业带来直接冲击 [6] - 国内大模型进入密集发布期,产品性能对标海外模型,在算力消耗和价格上优势明显,2026年国产AI大模型或将形成对海外头部模型的替代,导致全球AI模型竞争格局重塑 [6] - AI推理需求大幅提升导致算力紧张,模型厂商和云厂商均出现涨价动作,对产业链企业形成利好 [6] 根据相关目录分别进行总结 一、 行业数据 1.1. 行业数据:软件行业收入增速整体呈现回升趋势 - 2025年软件业务收入15.48万亿元,同比增长13.2%,较1-11月回落0.1个百分点 [12] - 2025年软件业务利润总额18848亿元,同比增长7.3%,较1-11月上升0.7个百分点,低于收入增速5.9个百分点 [13] - 2025年1-11月软件业务出口金额627亿美元,同比增长7.7%,占行业收入约2.9% [14] 1.2. 2025年高景气赛道为IC设计、云计算大数据 - **IC设计**:2025年同比增长18.9%,高于软件行业整体增速5.7个百分点,是景气度最高的子行业 [17] - **云计算+大数据服务**:2025年同比增长13.6%,高于软件行业整体增速0.4个百分点 [17] - **信息技术服务**:2025年收入增速14.7%,高于软件业务整体增速1.5个百分点,占软件业务收入比重提升至68.7% [27] 1.3. AI:2026年初大厂AI应用布局全面开启 - **头部模型密集发布**:2月预期发布豆包大模型2.0、DeepSeek-V4、Kimi-K3、Claude Sonnet 5、阿里Qwen3.5等模型,春节期间模型市场竞争格局有望呈现较大变化 [6][33] - **国产模型价格优势明显**:国产模型调用价格明显低于海外模型,小米MiMo-V2-Flash价格优势突出 [39][41] - **2月头部模型呈现涨价趋势**:Anthropic的Claude Opus4.6极速版价格是原版的6倍,智谱GLM Coding Plan套餐价格上涨30%起 [39] - **国产模型性能对标海外**:根据Artificial Analysis排名,智谱GLM-5位居开源模型第一,国产模型与海外差距有限,性价比优势凸显 [42][43] - **AI原生应用用户增长**:截至2025年12月,国内月活最高的AI原生APP为豆包(1.55亿)、DeepSeek(0.82亿)[49] - **字节豆包大模型调用量激增**:截至2025年12月,日均token使用量突破50万亿,较上年同期增长超10倍 [53] - **字节Seedance2.0引发行业变革**:其视频生成能力远超之前模型,意味着影视、游戏等行业或将迎来深刻的生产模式变革 [6][55] - **AI Agent爆发**:Clawdbot(后更名为OpenClaw)和Claude Cowork强大能力让市场看到软件和应用被AI取代的可能性,Claude Cowork开发周期仅10天,由4人团队借助AI完成 [6][65][70][72] - **MaaS市场高速增长**:根据Omdia预测,2030年中国MaaS市场规模将达到177亿元,2025-2030年复合增速72%;截至2025年10月,全球企业级MaaS市场中,字节占比15% [56] - **字节占据国内大模型公有云服务市场主导**:2025H1,字节市场份额为49.2%,阿里份额27% [59] - **模型厂商业绩与融资**:OpenAI年化收入从2023年20亿美元预计增长至2025年200亿美元;Anthropic 2025年营收达45亿美元,2026年2月完成300亿美元G轮融资,投后估值达3800亿美元 [61][64] - **科技企业裁员加快**:2026年初,微软计划裁员1.1-2.2万人,Meta计划裁员1500人,甲骨文可能裁员2-3万人以释放现金流 [73][74][75][77] 1.4. 国产化:华为新一代芯片即将上市,曙光交付3万卡集群 - **国产AI芯片替代加速**:2025年上半年,我国AI芯片国产化比率从2024下半年的34%提升至35%;英伟达2025Q3来自中国大陆的收入占比降至5% [78][79][81] - **国内AI芯片企业集中上市**:摩尔线程、沐曦股份于2025年12月在A股上市;百度昆仑芯、阿里平头哥等递交上市申请或准备独立上市 [82] - **国产AI芯片厂商收入高增长**:寒武纪2025年收入预计60-70亿元,同比增长410%-596%;沐曦股份收入16-17亿元,同比增长408-468% [82] - **华为昇腾芯片发布计划**:昇腾将在2026Q1发布昇腾950PR,加入自研HBM,从根本上解决禁令限制 [6][91] - **超节点(Scale Up)成为国产算力重要路径**:华为Atlas 900(384颗昇腾芯片)销售规模超550套;曙光发布全球首个单机柜级640卡超节点scaleX 640 [6][93][96][100] - **国家超算互联网核心节点上线**:以曙光scaleX 640为基础的3万卡AI算力集群在国家超算互联网郑州核心节点上线,是全国首个投入运营的最大国产AI算力池 [6][100] - **纯血鸿蒙系统终端突破4000万**:2026年1月25日,HarmonyOS 5/6终端设备数突破4000万;2025Q3鸿蒙占据中国手机操作系统18%份额,位居第二 [101][105] 1.5. 算力:国产芯片替代将提升2026年国内算力供给 - **阿里云提出激进目标**:2026年发展目标是拿下全年中国AI云市场增量的80%,并判断2026年增量将数倍于2025年全量 [6] - **互联网厂商自研芯片计划**:阿里平头哥有独立上市计划;字节自研芯片计划2026年量产10万枚 [6] - **海外科技厂商资本开支大增**:引起市场担忧 [6] - **英伟达寻求技术突破**:2025年12月,英伟达斥资20亿美元投入新思科技项目,并以200亿美元获得AI芯片公司Grop核心技术非独家授权 [120] - **云厂商自研芯片格局**:谷歌发布第七代TPU Ironwood,可扩展至9216片芯片集群;亚马逊发布自研芯片Trainium3;微软Maia 200在互联网厂商中性能领先 [121][122][126] - **谷歌TPU成为重要竞争者**:2023年自用TPU芯片量已突破200万片,成为全球第二大数据中心AI芯片厂商;Meta将在2026-2027年租用并采购谷歌TPU [123][125]
计算机行业月报:中国AI超级周开启,算力呈现提价趋势-20260213
中原证券· 2026-02-13 16:11
报告行业投资评级 - 给予计算机行业“强于大市”的投资评级 [3][6] 报告核心观点 - 2026年AI应用落地进度远超市场预期,将对软件、影视、传媒等传统行业带来直接冲击 [6] - 国内大模型迎来产品密集发布期,性能对标海外模型,在算力消耗和价格上优势极为明显,2026年国产AI大模型将形成对海外头部模型的替代,可能导致全球AI模型竞争格局重塑 [6] - AI推理需求大幅提升带来算力紧张,模型厂商、云厂商均出现涨价动作,对产业链企业形成利好 [6] 行业数据总结 - **软件行业整体**:2025年软件业务收入15.48万亿元,同比增长13.2%,增速较1-11月回落0.1个百分点,结束了连续9个月的回升趋势 [12];2025年软件业务利润总额18848亿元,同比增长7.3%,低于收入增速5.9个百分点 [13];2025年1-11月软件业务出口金额627亿美元,同比增长7.7% [14] - **高景气子行业**: - **IC设计**:2025年收入同比增长18.9%,高于软件行业整体增速5.7个百分点,是景气度最高的子行业 [17] - **云计算+大数据服务**:2025年收入同比增长13.6%,高于软件行业整体增速0.4个百分点 [17] - **其他子行业**: - **基础软件**:2025年收入同比增长11.1%,低于行业整体增速2.1个百分点 [20] - **工业软件产品**:2025年收入同比增长9.7%,景气度偏弱但呈回升态势 [20] - **电子商务平台技术服务**:2025年收入同比增长12.7%,低于行业整体增速0.5个百分点 [24] - **信息安全**:2025年收入同比增长6.7%,低于行业整体增速水平 [25] - **嵌入式系统软件**:2025年收入同比增长9.3%,落后于行业平均增速 [25] - **收入结构**:2025年信息技术服务收入增速14.7%,高于软件业务整体增速1.5个百分点,占软件业务整体收入比重提升至68.7% [27] AI领域动态总结 - **大模型发布密集**:2026年2月预期发布的模型包括豆包大模型2.0、DeepSeek-V4、Kimi-K3、Claude Sonnet 5、阿里的Qwen3.5等,春节期间模型市场竞争格局有望呈现较大变化 [6][33] - **中美模型策略分化**:美国头部模型(如Claude Opus 4.6、GPT-5.2)多采取闭源策略,而中国头部模型(如DeepSeek-V3.2、Qwen3-Max、Kimi K2.5)多采用开源策略 [38] - **模型价格与涨价趋势**:国产模型调用价格明显低于海外模型,优势显著 [39];2026年2月出现涨价趋势,如Anthropic的Claude Opus4.6极速版价格是原版的6倍,智谱GLM Coding Plan套餐价格上涨30%起 [39] - **AI原生应用用户**:截至2025年12月,国内月活跃用户最高的AI原生APP分别为豆包(1.55亿)、DeepSeek(0.82亿)、元宝(0.21亿) [49];截至2025年12月,豆包大模型的日均token使用量突破50万亿,较上年同期增长超过10倍 [53] - **视频生成突破**:字节推出的Seedance2.0在人物一致性、动作流畅性、音频适配性上远超之前视频生成模型,可能深刻改变影视、游戏等行业的生产模式 [6][55] - **MaaS市场格局**:MaaS是AI云中增长最快的细分市场,Omdia预测2030年中国MaaS市场规模达177亿元,2025-2030年复合增速72% [56];截至2025年10月,全球企业级MaaS市场中,OpenAI、谷歌云、字节占比分别为31%、19%、15% [56];2025年上半年中国大模型公有云服务市场中,字节市场份额为49.2%,阿里份额27% [59] - **模型厂商财务**: - **OpenAI**:年化收入从2023年的20亿美元增长至2025年预计的200亿美元,算力从2023年的0.2GW增长至2025年预计的1.9GW [61];2025年第三季度亏损超过120亿元 [61] - **Anthropic**:2025年年化收入从年初10亿美元跃升至年底逾90亿美元,2026年2月13日已达140亿美元,目标2026年收入300亿美元 [64];2026年2月13日完成300亿美元G轮融资,投后估值达3800亿美元 [64] - **AI Agent爆发**: - **Clawdbot/OpenClaw**:开源AI智能体,可根据用户指示使用电脑、应用程序和网络完成复杂任务,其火爆导致Mac mini硬件销售火爆 [65];阿里云上线了Clawdbot全套云服务,腾讯、字节等也接连更新云上部署 [70] - **Claude Cowork**:Anthropic推出的桌面AI Agent,其强大的功能引发市场对软件企业SaaS模式面临颠覆风险的担忧 [72];Cowork开发周期仅10天,由4人团队在Claude Code辅助下完成 [72] - **科技企业裁员**:2026年初,科技企业裁员呈现加快趋势,如微软计划裁员涉及5%-10%的员工(对应1.1-2.2万人),Meta对元宇宙业务部门裁员约1500人,甲骨文可能裁员2-3万人以释放现金流 [73][74][77] 国产化进展总结 - **芯片国产化率**:2025年,我国集成电路国产化占比约为17%(即进口依赖度81%) [78];2025年上半年,我国AI芯片国产化比率从2024下半年的34%提升至35% [81] - **海外芯片供应受限**:英伟达H200仍受禁令限制 [6];英伟达2025年第三季度来自中国大陆的收入占比降至5% [79];AMD的MI308实现了少量对华供货 [86] - **国内AI芯片企业上市潮**:摩尔线程、沐曦股份于2025年12月在A股上市,壁仞科技、天数智芯于2026年1月在港交所上市,百度昆仑芯已向港交所递交上市申请,阿里平头哥有独立上市计划 [82] - **国内AI芯片企业业绩**: - **寒武纪**:2025年收入预计60-70亿元,同比增长410%-596% [82] - **沐曦股份**:2025年收入预计16-17亿元,同比增长408%-468% [82] - **摩尔线程**:2025年收入预计14.5-15.2亿元,同比增长231%-347% [82] - **海光信息**:2025年前三季度收入94.9亿元,同比增长55% [82] - **华为昇腾芯片**:昇腾将在2026年第一季度发布昇腾950PR,实现低精度计算能力,并加入自研HBM HiBL 1.0,将从根本上解决被美国禁令限制HBM的窘境 [6][91] - **超节点(Scale Up)发展**: - **华为Atlas 900**:已规模销售超过550套 [100] - **中科曙光scaleX 640**:发布全球首个单机柜级640卡超节点,采用浸没相变液冷方案 [96];以scaleX 640为基础的国家超算互联网郑州核心节点3万卡AI算力集群已上线,是全国首个投入运营的最大国产AI算力池 [100] - **未来规划**:华为计划于2026年第四季度发布Atlas 950 SuperCluster集群(52万+卡),2027年第四季度发布Atlas 960 SuperCluster集群(99万+卡),后者算力将是当前世界最大集群xAI Colossus的1.3倍 [99][102] - **鸿蒙系统**:纯血鸿蒙系统(HarmonyOS NEXT)终端设备数已于2026年1月25日突破4000万 [101];2025年第三季度,鸿蒙占据中国手机操作系统18%的市场份额,位居第二;占据全球4%的市场份额,位居第三 [105] 算力领域总结 - **云厂商目标激进**:阿里云提出2026年发展目标是拿下全年中国AI云市场增量的80%,并判断2026年增量的10%都会大于2025年全量,意味着其认为2026年AI云市场将数倍于Omdia的预测值 [6] - **自研芯片进展**: - **阿里平头哥**:有独立上市计划 [6] - **字节跳动**:自研芯片计划2026年量产10万枚 [6] - **谷歌TPU**:2025年11月发布第七代TPU Ironwood,峰值算力4614 TFLOPS (FP8),可扩展至9216颗芯片集群,峰值算力达42.5 EFLOPS [122];2023年自用TPU芯片量已突破200万颗,成为全球第二大AI芯片厂商 [123];Meta将在2026年租用、2027年直接采购谷歌TPU [125] - **亚马逊Trainium**:2025年12月发布自研芯片Trainium3,采用3nm工艺,性能较Trainium2提升40% [126];正在研发Trainium4,目标FP4计算性能提升6倍、内存带宽提升4倍 [127] - **微软Maia 200**:在互联网厂商自研芯片中性能领先 [121] - **英伟达动态**: - **芯片性能**:2025年发布的B300芯片峰值算力为20 PFLOPS (FP4稀疏) [115];2026年将量产的Rubin架构芯片峰值算力达50 PFLOPS (推理,FP4) [116] - **超节点计划调整**:2026年1月实际发布的是72个GPU的Vera Rubin NVL72,而非2025年计划的144个GPU的NVL144 [116] - **外部技术投资**:2025年12月,英伟达斥资20亿美元投入新思科技项目,并以200亿美元获得AI芯片公司Grop核心技术的非独家授权,以弥补GPU在AI推理实时响应方面的不足 [120] - **海外资本开支**:海外科技厂商2026年资本开支计划大增,引起了市场担忧 [6] - **国内资本开支**:2025年仍受制于芯片供给,整体需求有望更好地释放 [8]