Workflow
谷歌(GOOGL)
icon
搜索文档
计算机行业月报:中国AI超级周开启,算力呈现提价趋势-20260213
中原证券· 2026-02-13 16:11
报告行业投资评级 - 给予计算机行业“强于大市”的投资评级 [3][6] 报告核心观点 - 2026年AI应用落地进度远超市场预期,将对软件、影视、传媒等传统行业带来直接冲击 [6] - 国内大模型迎来产品密集发布期,性能对标海外模型,在算力消耗和价格上优势极为明显,2026年国产AI大模型将形成对海外头部模型的替代,可能导致全球AI模型竞争格局重塑 [6] - AI推理需求大幅提升带来算力紧张,模型厂商、云厂商均出现涨价动作,对产业链企业形成利好 [6] 行业数据总结 - **软件行业整体**:2025年软件业务收入15.48万亿元,同比增长13.2%,增速较1-11月回落0.1个百分点,结束了连续9个月的回升趋势 [12];2025年软件业务利润总额18848亿元,同比增长7.3%,低于收入增速5.9个百分点 [13];2025年1-11月软件业务出口金额627亿美元,同比增长7.7% [14] - **高景气子行业**: - **IC设计**:2025年收入同比增长18.9%,高于软件行业整体增速5.7个百分点,是景气度最高的子行业 [17] - **云计算+大数据服务**:2025年收入同比增长13.6%,高于软件行业整体增速0.4个百分点 [17] - **其他子行业**: - **基础软件**:2025年收入同比增长11.1%,低于行业整体增速2.1个百分点 [20] - **工业软件产品**:2025年收入同比增长9.7%,景气度偏弱但呈回升态势 [20] - **电子商务平台技术服务**:2025年收入同比增长12.7%,低于行业整体增速0.5个百分点 [24] - **信息安全**:2025年收入同比增长6.7%,低于行业整体增速水平 [25] - **嵌入式系统软件**:2025年收入同比增长9.3%,落后于行业平均增速 [25] - **收入结构**:2025年信息技术服务收入增速14.7%,高于软件业务整体增速1.5个百分点,占软件业务整体收入比重提升至68.7% [27] AI领域动态总结 - **大模型发布密集**:2026年2月预期发布的模型包括豆包大模型2.0、DeepSeek-V4、Kimi-K3、Claude Sonnet 5、阿里的Qwen3.5等,春节期间模型市场竞争格局有望呈现较大变化 [6][33] - **中美模型策略分化**:美国头部模型(如Claude Opus 4.6、GPT-5.2)多采取闭源策略,而中国头部模型(如DeepSeek-V3.2、Qwen3-Max、Kimi K2.5)多采用开源策略 [38] - **模型价格与涨价趋势**:国产模型调用价格明显低于海外模型,优势显著 [39];2026年2月出现涨价趋势,如Anthropic的Claude Opus4.6极速版价格是原版的6倍,智谱GLM Coding Plan套餐价格上涨30%起 [39] - **AI原生应用用户**:截至2025年12月,国内月活跃用户最高的AI原生APP分别为豆包(1.55亿)、DeepSeek(0.82亿)、元宝(0.21亿) [49];截至2025年12月,豆包大模型的日均token使用量突破50万亿,较上年同期增长超过10倍 [53] - **视频生成突破**:字节推出的Seedance2.0在人物一致性、动作流畅性、音频适配性上远超之前视频生成模型,可能深刻改变影视、游戏等行业的生产模式 [6][55] - **MaaS市场格局**:MaaS是AI云中增长最快的细分市场,Omdia预测2030年中国MaaS市场规模达177亿元,2025-2030年复合增速72% [56];截至2025年10月,全球企业级MaaS市场中,OpenAI、谷歌云、字节占比分别为31%、19%、15% [56];2025年上半年中国大模型公有云服务市场中,字节市场份额为49.2%,阿里份额27% [59] - **模型厂商财务**: - **OpenAI**:年化收入从2023年的20亿美元增长至2025年预计的200亿美元,算力从2023年的0.2GW增长至2025年预计的1.9GW [61];2025年第三季度亏损超过120亿元 [61] - **Anthropic**:2025年年化收入从年初10亿美元跃升至年底逾90亿美元,2026年2月13日已达140亿美元,目标2026年收入300亿美元 [64];2026年2月13日完成300亿美元G轮融资,投后估值达3800亿美元 [64] - **AI Agent爆发**: - **Clawdbot/OpenClaw**:开源AI智能体,可根据用户指示使用电脑、应用程序和网络完成复杂任务,其火爆导致Mac mini硬件销售火爆 [65];阿里云上线了Clawdbot全套云服务,腾讯、字节等也接连更新云上部署 [70] - **Claude Cowork**:Anthropic推出的桌面AI Agent,其强大的功能引发市场对软件企业SaaS模式面临颠覆风险的担忧 [72];Cowork开发周期仅10天,由4人团队在Claude Code辅助下完成 [72] - **科技企业裁员**:2026年初,科技企业裁员呈现加快趋势,如微软计划裁员涉及5%-10%的员工(对应1.1-2.2万人),Meta对元宇宙业务部门裁员约1500人,甲骨文可能裁员2-3万人以释放现金流 [73][74][77] 国产化进展总结 - **芯片国产化率**:2025年,我国集成电路国产化占比约为17%(即进口依赖度81%) [78];2025年上半年,我国AI芯片国产化比率从2024下半年的34%提升至35% [81] - **海外芯片供应受限**:英伟达H200仍受禁令限制 [6];英伟达2025年第三季度来自中国大陆的收入占比降至5% [79];AMD的MI308实现了少量对华供货 [86] - **国内AI芯片企业上市潮**:摩尔线程、沐曦股份于2025年12月在A股上市,壁仞科技、天数智芯于2026年1月在港交所上市,百度昆仑芯已向港交所递交上市申请,阿里平头哥有独立上市计划 [82] - **国内AI芯片企业业绩**: - **寒武纪**:2025年收入预计60-70亿元,同比增长410%-596% [82] - **沐曦股份**:2025年收入预计16-17亿元,同比增长408%-468% [82] - **摩尔线程**:2025年收入预计14.5-15.2亿元,同比增长231%-347% [82] - **海光信息**:2025年前三季度收入94.9亿元,同比增长55% [82] - **华为昇腾芯片**:昇腾将在2026年第一季度发布昇腾950PR,实现低精度计算能力,并加入自研HBM HiBL 1.0,将从根本上解决被美国禁令限制HBM的窘境 [6][91] - **超节点(Scale Up)发展**: - **华为Atlas 900**:已规模销售超过550套 [100] - **中科曙光scaleX 640**:发布全球首个单机柜级640卡超节点,采用浸没相变液冷方案 [96];以scaleX 640为基础的国家超算互联网郑州核心节点3万卡AI算力集群已上线,是全国首个投入运营的最大国产AI算力池 [100] - **未来规划**:华为计划于2026年第四季度发布Atlas 950 SuperCluster集群(52万+卡),2027年第四季度发布Atlas 960 SuperCluster集群(99万+卡),后者算力将是当前世界最大集群xAI Colossus的1.3倍 [99][102] - **鸿蒙系统**:纯血鸿蒙系统(HarmonyOS NEXT)终端设备数已于2026年1月25日突破4000万 [101];2025年第三季度,鸿蒙占据中国手机操作系统18%的市场份额,位居第二;占据全球4%的市场份额,位居第三 [105] 算力领域总结 - **云厂商目标激进**:阿里云提出2026年发展目标是拿下全年中国AI云市场增量的80%,并判断2026年增量的10%都会大于2025年全量,意味着其认为2026年AI云市场将数倍于Omdia的预测值 [6] - **自研芯片进展**: - **阿里平头哥**:有独立上市计划 [6] - **字节跳动**:自研芯片计划2026年量产10万枚 [6] - **谷歌TPU**:2025年11月发布第七代TPU Ironwood,峰值算力4614 TFLOPS (FP8),可扩展至9216颗芯片集群,峰值算力达42.5 EFLOPS [122];2023年自用TPU芯片量已突破200万颗,成为全球第二大AI芯片厂商 [123];Meta将在2026年租用、2027年直接采购谷歌TPU [125] - **亚马逊Trainium**:2025年12月发布自研芯片Trainium3,采用3nm工艺,性能较Trainium2提升40% [126];正在研发Trainium4,目标FP4计算性能提升6倍、内存带宽提升4倍 [127] - **微软Maia 200**:在互联网厂商自研芯片中性能领先 [121] - **英伟达动态**: - **芯片性能**:2025年发布的B300芯片峰值算力为20 PFLOPS (FP4稀疏) [115];2026年将量产的Rubin架构芯片峰值算力达50 PFLOPS (推理,FP4) [116] - **超节点计划调整**:2026年1月实际发布的是72个GPU的Vera Rubin NVL72,而非2025年计划的144个GPU的NVL144 [116] - **外部技术投资**:2025年12月,英伟达斥资20亿美元投入新思科技项目,并以200亿美元获得AI芯片公司Grop核心技术的非独家授权,以弥补GPU在AI推理实时响应方面的不足 [120] - **海外资本开支**:海外科技厂商2026年资本开支计划大增,引起了市场担忧 [6] - **国内资本开支**:2025年仍受制于芯片供给,整体需求有望更好地释放 [8]
姚顺宇谷歌首秀,Gemini新模型刷爆SOTA:人类仅剩7人捍卫碳基编程
36氪· 2026-02-13 15:32
谷歌Gemini 3 Deep Think模型性能突破 - 在Codeforces竞技编程平台上取得3455 Elo分数,相当于全球排名第8位,全球仅有7人的编程水平排在其前[1][2] - 在公认测试AI推理能力的前沿基准ARC-AGI-2上取得史无前例的84.6%得分,该成绩已经ARC Prize基金会验证[3][4][15] - 在Humanity's Last Exam基准测试中刷新SOTA,取得48.4%的成绩[3][4] - 在2025年国际数学奥林匹克竞赛中达到金牌水平,取得81.5%的成绩[4][15][26] - 在2025年国际物理奥林匹克竞赛笔试部分取得87.7%的成绩,在2025年国际化学奥林匹克竞赛笔试部分取得82.8%的成绩,均达到金牌级别[4][24][26] - 在MMMU-Pro多模态理解与推理基准测试中取得81.5%的成绩[4][26] - 在凝聚态理论基准CMT-Benchmark中取得50.5%的成绩[4][24][26] - 相比去年12月发布的初代Deep Think在ARC-AGI-2上45.1%的得分,新版模型在不到三个月内性能大幅提升至84.6%[19] - 在ARC-AGI-1基准上取得了96%的成绩[19] - 模型推理成本大幅降低,从初代Deep Think每项任务77.16美元的成本降低了82%,降至每项任务仅需13.62美元[21] 行业竞争格局与基准测试进展 - 在关键基准测试中,Gemini 3 Deep Think性能显著超越主要竞争对手:在ARC-AGI-2上优于Claude Opus 4.6的68.8%和GPT-5.2的52.9%[3][4] - 在Humanity's Last Exam基准上,Gemini 3 Deep Think的48.4%成绩优于Claude Opus 4.6的40.0%和GPT-5.2的34.5%[4][26] - 在Codeforces Elo评分上,Gemini 3 Deep Think的3455分显著高于Gemini 3 Pro Preview的2512分和Claude Opus 4.6的2352分[4][26] - 由于模型在ARC-AGI-1和ARC-AGI-2上表现卓越,ARC Prize基金会已在构建更难的ARC-AGI-3基准[24] 模型在科研与工程领域的实际应用 - 模型能够分析草图,对复杂形状进行建模,并直接生成用于3D打印的实体文件,例如成功打印了一个笔记本电脑支架[7] - 罗格斯大学的数学家利用该模型审阅高度专业的数学论文,成功识别出一个此前人工同行评审均未发现的细微逻辑缺陷[9] - 杜克大学的王安实验室利用该技术优化了复杂晶体生长的制备方法,成功设计出一种能够生长厚度大于100微米薄膜的工艺,达到了以往方法难以企及的精确目标[10] - 模型擅长处理科学领域中的长尾任务,例如根据输入的复杂分子结构图片准确计算出分子式[11] - 官方表示,新版Deep Think是专门开发的推理模式,旨在推动智能前沿发展,并解决科学、研究和工程领域的现代挑战[4] 核心研发团队与人才背景 - 核心研发团队中有不少华人科学家,包括95后华人科学家Yi Tay,他在团队中从事强化学习和推理方向的研究工作[27] - Yi Tay曾在Google Brain共同领导早期大语言模型项目,包括PaLM-2、UL2和Flan-2,后作为联合创始人创办AI独角兽初创公司Reka,并于一年半后重返谷歌DeepMind担任高级资深研究科学家[28] - 另一位关键参与者是清华物理系传奇特奖得主姚顺宇,他于去年9月加入谷歌DeepMind,参与了Deep Think新模型的开发[5][28] - 姚顺宇本科期间已在《Physical Review Letters》发表高水平论文,首次在国际上给出了关于非厄米系统的拓扑能带理论,博士毕业于斯坦福大学,师从知名学者,在加入谷歌前曾于Anthropic参与Claude系列模型的研发[29][30]
自动驾驶难跨最后1厘米:估值千亿美元的Waymo竟需美版“外卖小哥”关车门
智通财经网· 2026-02-13 15:07
公司业务动态 - Waymo在亚特兰大启动试点项目 付费让DoorDash外卖骑手为其无人驾驶汽车关闭未关严的车门 以便车辆能迅速重新上路 [1] - 公司证实 未来的Waymo车型将具备自动关门功能 但未说明该功能何时上线 [1] - Waymo开始部署其下一代无人驾驶出租车 致力于扩大其在美国的领先地位 [2] - 目前Waymo在美国六个市场提供全自动无人驾驶出租车服务 并计划在今年扩展到更多城市 [2] 运营模式与成本 - Waymo的汽车在无人驾驶状态下行驶 但当离车乘客没关车门时 车辆在有人关上门之前将无法移动 [1] - 为解决车门未关问题 Waymo正求助于来自DoorDash等公司的零工经济从业者 [1] - 根据Reddit帖子信息 亚特兰大的一名DoorDash驾驶员被提供11.25美元的报酬去关闭附近一辆Waymo的车门 [1] - 除了DoorDash Waymo还在向独立道路救援公司Honk的用户支付报酬以关闭车门 在洛杉矶关一次车门最高可获得24美元的报酬 [2] - Waymo在简单任务上对人类的依赖 凸显了即使是最先进的自动驾驶技术 在某些基础操作上仍需要昂贵的人工干预 [2] 公司财务与估值 - 在最近的一轮融资中 Waymo的估值达到了1260亿美元 [2] - Waymo是Alphabet"其他赌注"板块的核心 该板块旨在利用技术尝试解决影响包括交通和健康技术在内的广泛行业的重大问题 [2] - 根据Alphabet的年度报告 "其他赌注"部门去年的营业亏损为75亿美元 其中包括Waymo产生的21亿美元股权激励费用 [2]
AI资本开支“踩刹车”反成利好?前小摩策略师:市场反弹需巨头表态“止损”
智通财经网· 2026-02-13 14:24
市场观点与反弹逻辑 - 人工智能交易正上演戏剧性反转 市场反弹的潜在触发因素是某家科技巨头收紧AI基础设施支出并转向利润与现金流导向 [1] - 若某家超大规模厂商或软件公司表态将停止AI投资 不再采购价格虚高的内存 并重归现金流导向 市场反而有望迎来反弹 [1] 当前市场状况与担忧 - 今年科技股主导的抛售潮中 软件板块首当其冲 [1] - 市场正在定价AI颠覆性冲击带来的不安 同时日益担忧超大规模厂商资本开支持续攀升或已触及不可持续水平 [1] - 资金向价值股的显著轮动正成为2026年市场主线之一 [1] 主要公司的AI投资计划 - 微软 谷歌 亚马逊及Meta Platforms均已公布今年AI投资计划 合计规模高达6500亿美元 [1]
姚顺宇谷歌首秀,Gemini新模型刷爆SOTA:人类仅剩7人捍卫碳基编程
量子位· 2026-02-13 13:42
谷歌Gemini 3 Deep Think模型重大升级 - 面对Claude Opus 4.6和GPT Codex 5.3的竞争,谷歌推出了Gemini 3 Deep Think的重大升级[1] 在多项基准测试中刷新纪录 - 在Codeforces竞技编程平台上取得3455 Elo分数,相当于世界第8名[2] - 在ARC-AGI-2基准测试中取得史无前例的84.6%得分,远超之前最强模型的60%-70%区间以及Claude Opus 4.6的68.8%[3] - 在人类最后考试上刷新SOTA,取得48.4%的成绩[4] - 在2025年国际数学奥林匹克竞赛中达到金牌水平,取得81.5%的成绩[5][22] - 在2025年国际物理奥林匹克竞赛笔试部分取得87.7%的成绩,达到金牌级别[5][33] - 在2025年国际化学奥林匹克竞赛笔试部分取得82.8%的成绩,达到金牌级别[5][33] - 在CMT-Benchmark凝聚态理论测试中取得50.5%的分数[5][34] - 在MMMU-Pro多模态理解与推理测试中取得81.5%的成绩[5] - 在学术推理测试中取得53.4%的成绩[5] - 在ARC-AGI-1测试中取得96%的成绩,直接顶到天花板[27] 性能与成本优势显著 - 推理成本大幅下降,从初代Deep Think每项任务77.16美元降至13.62美元,降幅达82%[29] - ARC-AGI-2测试得分在不到三个月内从初代的45.1%飙升至84.6%[26] - 由于ARC-AGI-1和2均被刷爆,ARC Prize已在构建ARC-AGI-3[32] 定位为科研与工程助手 - 新版Deep Think旨在推动智能前沿发展,并解决科学、研究和工程领域的现代挑战[5] - 其野心不止于赢得基准测试,而是要走进科研和工程领域,帮助工程师处理复杂任务[7] - 模型可以分析草图,对复杂形状进行建模,并直接生成用于3D打印的实体文件[8] - 罗格斯大学数学家利用其审阅高度专业的数学论文,并成功识别出一个此前人工评审均未发现的细微逻辑缺陷[10][11] - 杜克大学实验室利用其优化复杂晶体生长的制备方法,成功设计出能生长厚度大于100微米薄膜的工艺,达到了以往方法难以企及的精确目标[13][14] - DeepSeek研究员表示其非常擅长处理科学领域中的长尾任务,例如输入复杂分子结构图片后能准确计算出分子式[16][17] 研发团队背景 - 研发团队中有不少华人身影[36] - 核心成员包括95后华人科学家Yi Tay,他在Gemini团队从事强化学习和推理方向研究,曾共同领导Google Brain的早期大语言模型项目,并曾联合创办AI独角兽公司Reka AI,后重返谷歌DeepMind担任高级资深研究科学家[37][38] - 另一位关键参与者是清华物理系传奇特奖得主姚顺宇,他于去年9月从Anthropic跳槽加入谷歌DeepMind,参与了此次新模型的开发[6][39] - 姚顺宇本科期间已在《Physical Review Letters》发表高水平论文,博士毕业于斯坦福大学,师从知名学者,在Anthropic期间参与了Claude系列模型的强化学习理论工作,此次Deep Think新模型是他在谷歌的首秀之作[41][42]
谷歌DeepMind CEO:今年开启AI抗癌药物临床试验,未来18个月迎来机器人突破
华尔街见闻· 2026-02-13 13:38
核心观点 - 谷歌DeepMind首席执行官Demis Hassabis在达沃斯论坛上描绘了AI发展的宏伟蓝图,核心是解决智能问题并用其解决其他所有问题,包括药物研发、能源危机等,预言未来10到15年人类将迎来“发现的黄金时代”和“新文艺复兴” [2][8][58] AI在生物医药领域的颠覆性潜力 - 通过其创立的Isomorphic Labs,目标是在2026年初将首个AI设计的药物送入临床试验 [4] - Isomorphic Labs正在研究癌症、心血管疾病和免疫学等多个治疗领域,已有17个药物项目正在推进,并计划扩展到数百个 [4][28] - 公司与礼来公司(Eli Lilly)等全球顶级制药巨头建立了合作伙伴关系 [4][28] - 传统药物研发平均耗时10年,耗资数十亿美元,成功率仅为10%,而AI的目标是将效率提高“几十万倍”,通过在“硅基”层面完成大部分搜索和设计工作,将实验室仅作为验证步骤 [4][25][28] - 此技术基于AlphaFold的突破,该模型解决了长达50年的蛋白质结构预测难题,以惊人准确性预测了2亿个蛋白质结构,并免费提供给全球300万研究人员使用 [19][21][22] 谷歌大模型Gemini与AI整合进展 - Gemini 3模型已经跨越了“分水岭时刻”,变得非常有能力,可用于研究、总结和编码等日常工作 [5][52] - 谷歌已重建基础设施,以便将最新模型的能力快速投射到搜索、YouTube、Chrome等核心产品端 [5][44] - 公司正在重拾“黄金时代”的特质,包括承担风险、快速发布和创新 [5][38] - 谷歌在2023年将DeepMind和Google Brain两个AI团队合并,以集中人才和计算资源,推动下一代AI发展 [34][36] - 2025年,谷歌在AI开发方面取得进展,包括推出热门图像生成模型Nano Banana和Gemini 3,推动母公司Alphabet股价上涨约65%,创下自2009年以来的最佳表现 [41][42][43] AI代理(Agents)、机器人技术与未来产品形态 - AI代理和更自主的系统将在2025年年底真正开始显现,用户可以将整个任务委托给它们 [6][52] - 智能眼镜被认为是潜在的杀手级应用载体,AI技术是使其真正可行的关键拼图,公司内部有关于“通用助手”的概念,该助手将跨越手机、电脑和眼镜等所有设备 [6][53][55] - 预测在接下来的18个月左右,将会看到机器人技术的突破时刻 [7][53] 对未来的宏观展望 - 未来10到15年,如果发展得当,人类将迎来一个新的“发现黄金时代”和一场“新文艺复兴” [2][58] - 人类健康将被彻底改变,个性化医疗将成为现实 [7][58] - AI还将用于解决能源危机(如核聚变、太阳能、电池技术),最终将人类带入一个“极度丰富”的世界,并有能力去“探索银河系” [7][58] - AI领域的变革速度极快,感觉几乎每年都在发生巨大变化,2025年也不例外 [8][52] 公司背景与战略 - Demis Hassabis于2010年联合创立DeepMind,公司使命是“解决智能问题,然后用它来解决其他所有问题” [14][15] - 谷歌在2014年以约5亿美元收购了DeepMind,此次收购被视作商业史上最具变革性的时刻之一,为谷歌奠定了AI领域的基础 [14][15] - 谷歌创始人拉里·佩奇和谢尔盖·布林深度参与公司的AI战略和具体项目,如Gemini [39][40] - 公司管理强调将世界一流的跨学科团队(如生物学家、化学家、机器学习专家和工程师)聚集在一起,并倡导持续改进(Kaizen)的文化 [31][35][37]
跨越百年的AI豪赌!28岁的Google 百亿世纪债获10倍认购,策略师警示“颠覆者”地位难保百年
美股IPO· 2026-02-13 12:53
文章核心观点 - Alphabet通过发行1000亿美元的百年债券为其人工智能资本支出融资 这被视为对一项仅诞生三年的技术进行的巨大赌注 尽管债券获得10倍超额认购 但此举引发了市场对其长期风险及公司能否在百年时间跨度内维持颠覆性地位的深刻质疑 [1][3][6] Alphabet的债券发行与市场反应 - Alphabet决定发行1000亿美元的百年债券 旨在为人工智能资本支出筹集资金 [1] - 此次债券发行获得了10倍的超额认购 显示出强劲的投资者需求 [3] - 债券发行的惊人需求表明 投资者并未放弃大型科技公司 市场对其回报能力仍有持续信心 [4] 历史对比与潜在风险 - 此次发行与历史上发行百年债券的公司形成鲜明对比 后者多为历史更悠久、更稳固的老牌企业 而Alphabet公司历史仅28年 [3] - 历史上前车之鉴包括 杰西潘尼在20世纪90年代末发行百年债后于23年后破产 以及通用汽车在长期债务方面的痛苦经历 [3] - 核心问题在于Alphabet能否在长达100年的时间跨度内维持其统治地位并不断实现自我颠覆与重构 [3] - 债券的最终成功取决于Alphabet在未来几代人中能否保持其颠覆者的地位 [6] 对更广泛市场的影响 - 考虑到大型科技公司在主要指数中所占的巨大比例 此次债券发行对更广泛市场具有重要影响 [5] - 市场质疑 如果这些主要参与者(特别是在“软件股困境”中)无法反弹 市场是否还能继续推向历史新高 [6]
清华传奇姚顺宇立功,全新Gemini一夜血洗编程,全球仅7人能赢它
36氪· 2026-02-13 12:29
谷歌Gemini 3 Deep Think模型发布 - 谷歌DeepMind发布Gemini 3 Deep Think模型,在多个领域刷新了SOTA(State-of-the-Art)记录,标志着AI推理能力进入全新维度 [1] - 该模型在短短三个月内实现全方位性能突破 [1] 核心性能与基准测试结果 - **编程与算法**:在Codeforces竞赛中获得**3455 Elo**评分,达到世界冠军级水准,在全球人类排名中位列第7,击败了绝大多数人类选手 [7][8][10] - **抽象推理**:在ARC-AGI-2基准测试中获得**84.6%**的准确率,刷新SOTA,并获得ARC奖项基金会验证 [11][12][17] - **综合学术推理**:在“人类最后考试”(Humanity‘s Last Exam)基准测试中,在不使用工具的情况下获得**48.4%**的准确率 [10][21] - **多模态理解**:在MMMU-Pro基准测试中获得**81.5%**的准确率 [21][34] - **数学**:在2025年国际数学奥林匹克(IMO)基准测试中获得**81.5%**的准确率,达到金牌水平 [21][33][34] - **物理**:在2025年国际物理奥林匹克(理论)基准测试中获得**87.7%**的准确率 [21][34] - **化学**:在2025年国际化学奥林匹克(理论)基准测试中获得**82.8%**的准确率 [21][34] - **凝聚态物理理论**:在CMT-Benchmark测试中获得**50.5%**的准确率 [21][34] 与竞争对手的对比 - 在ARC-AGI-2基准测试中,Gemini 3 Deep Think(**84.6%**)的表现远超Gemini 3 Pro Preview(**31.1%**)、Claude Opus 4.6 Thinking Max(**68.8%**)和GPT-5.2 Thinking xhigh(**52.9%**) [17][21] - 在Codeforces Elo评分上,Gemini 3 Deep Think(**3455**)显著高于Gemini 3 Pro Preview(**2512**)和Claude Opus 4.6 Thinking Max(**2352**) [21][34] - 在高级数学证明(Advanced ProofBench)基准测试中,基于Deep Think的“AI数学家”Aletheia获得**91.9%**的准确率,远超GPT-5.2 Thinking high(**35.7%**)和Gemini 3 Pro(**30.0%**) [30] 科研与工程应用能力 - **科研辅助**:能够审查高深学术论文,并发现人类同行评审遗漏的细微逻辑漏洞 [23] - **工业设计**:可以根据草图渲染高保真、实用的3D模型(如笔记本电脑支架),并直接生成可3D打印的文件,将物理零部件建模速度提升十倍 [3][39] - **实验优化**:在杜克大学Wang Lab的测试中,成功设计出生长大于**100 μm**薄膜的配方,用于潜在的半导体材料发现 [39] - **物理模拟**:展现出强大的物理模拟能力,可以模拟光线追踪,并在单个HTML文件中构建完整的Three.js场景 [40][41][42] - **创意生成**:能够生成复杂且细节丰富的SVG矢量图像(如具有特定品种特征的鹈鹕骑自行车) [44][45][48] 技术进展与突破 - 基于初代Deep Think的“AI数学家”Aletheia已能独立撰写论文,证明了“Erdős猜想”中的多个难题,并一举攻克18大研究瓶颈 [29] - 模型在ARC-AGI-1基准测试上已达到接近饱和的**96.0%**准确率 [12][35] - 模型能够根据论文描述,为复杂的“时空循环视频Transformer”架构创建可视化方案 [36] 发布与可用性 - 目前,Google AI Ultra订阅用户可在Gemini中体验新版Deep Think [25] - 谷歌首次通过API向部分研究人员、工程师和企业开放该模型 [25] - 核心研发团队包括从Anthropic离职加入谷歌的华人学者姚顺宇 [3]
黄金白银深夜重挫!苹果等大跌!
搜狐财经· 2026-02-13 12:23
贵金属市场动态 - 当地时间12日,现货黄金价格重挫,跌幅超过3% [1] - 现货白银价格日内跌幅一度扩大至11% [1] - 截至发稿时,黄金白银价格有所回升,现货黄金最新报4979.69美元/盎司,现货白银最新报76.65美元/盎司 [4] 美股科技股表现 - 美股大型科技股普遍下跌,苹果公司股价跌幅达5% [3] - 博通公司股价下跌超过3% [3] - 亚马逊、Meta和特斯拉股价跌幅均超过2% [3] - 英伟达股价下跌超过1%,谷歌A类股微跌 [3] 人工智能对行业的影响 - 今年以来,随着一些AI工具的推出,部分板块遭受冲击,包括软件公司、出版商、金融服务企业等 [3] - 投资者担心,这些AI工具可能复制受影响公司的业务模式,或至少侵蚀其利润率 [3] 中概股市场表现 - 中概股普遍下挫,纳斯达克中国金龙指数下跌3% [3] - 虎牙、腾讯音乐股价跌幅超过10% [3] - 亿咖通股价跌幅超过8% [3] - 爱奇艺、贝壳股价跌幅超过5% [3] - 拼多多股价跌幅超过4% [3] - 阿里巴巴、哔哩哔哩、百度股价跌幅均超过4% [3]
跨越百年的AI豪赌!28岁的Alphabet千亿世纪债获10倍认购,策略师警示“颠覆者”地位难保百年
智通财经· 2026-02-13 12:11
文章核心观点 - Alphabet通过发行1000亿美元的百年债券为其人工智能资本支出筹集资金 这被视作对一项仅诞生三年的技术进行的“巨大赌注” [1] - 此次债券发行获得了10倍的超额认购 但引发了与历史上其他发行百年债公司的对比 那些公司最终大多面临巨大挑战或彻底失败 [1] - 核心问题在于Alphabet能否在长达100年的时间跨度内维持其统治地位并不断自我颠覆 债券的最终成功取决于此 [2][3] 债券发行详情与市场反应 - Alphabet决定发行1000亿美元的百年债券 以筹集人工智能资本支出所需资金 [1] - 此次债券发行获得了10倍的超额认购 显示出惊人的市场需求 [1][2] - 债券发行的强劲需求表明 投资者并未放弃大型科技公司 市场对其回报能力仍有持续信心 [2] 历史对比与潜在风险 - 历史上发行百年债券的通常是历史更悠久、更稳固的“老牌企业” 而Alphabet(谷歌)公司本身只有28年历史 [1] - 杰西潘尼在20世纪90年代末发行了100年期债券 结果在23年后便宣告破产 让债权人血本无归 [2] - 通用汽车在长期债务方面也有过痛苦的经历 [2] - 此类债券发行引发质疑:究竟是商业模式处于巅峰的标志 还是预示着其正蓄势增长 [2] 对Alphabet的长期考验 - 关键问题在于作为一家公司 能否在100年的漫长时间内不断颠覆自己所在的领域并实现自我重构 [2] - 对于长期债券持有者而言 此次债券发行的最终成功 完全取决于Alphabet在未来几代人中能否保持其颠覆者的地位 [3] 对更广泛市场的影响 - 考虑到大型科技公司在主要指数中所占的巨大比例 其动向对更广泛市场具有重要影响 [3] - 市场质疑 如果这些主要参与者(特别是在“软件股困境”中)无法反弹 市场是否还能继续推向历史新高 [3]