Gemini 2.5系列模型

搜索文档
2025年下半年计算机行业投资策略报告:聚焦AI智能化、国产化-20250703
上海证券· 2025-07-03 17:51
报告核心观点 - 2025年下半年计算机行业聚焦AI智能化与国产化,大模型持续创新、AI Agent商业化加快,政策与生态共振推动自主可控全面加速,建议关注算力、AIDC、AI应用等领域相关公司 [3][4] 模型端 - 国内外大模型加速迭代,OpenAI、谷歌、Anthropic等推出新模型,主流大模型在智能、效率和多模态能力方面持续进步 [3][6] - 展示SuperCLUE测评基准2025年5月部分模型总体表现,涵盖数学推理、科学推理等多维度测评结果 [6] 算力端 - 科技大厂持续加码AI算力资本开支,海外微软、亚马逊等,国内阿里、腾讯、百度等均有投入 [14] - 推理算力需求井喷,巴克莱报告预计其占通用人工智能总计算需求70%以上,行业或需增加近3000亿美元芯片资本支出,ASIC及国产芯片迎发展机遇 [14] 应用端 - 科技巨头在B端和C端加速布局AI Agent,推动商业化落地,C端多款Agent涌现 [19] - 巨头积极拥抱MCP协议,有望拓展AI应用和Agent边界,降低开发门槛 [19] - AI Agent市场发展潜力大,全球市场预计从2024年51亿美元增长到2030年471亿美元,年复合增长率44.8% [19] 信创 - 关税摩擦升级,政策强调推进关键核心技术攻关,内部政策或加速科技和供应链自主可控 [22] - 国资委要求2027年底前中央企业信息化系统安可信创替代,中科曙光与海光信息战略重组推动信创产业自主高端化 [22] - 华为推出CloudMatrix超节点集群,新一代昇腾AI云服务上线,为超1300家客户提供算力 [23] - 华为发布原生鸿蒙,市场份额提升,鸿蒙PC发布实现国产PC全栈自主可控,预计年底超2000个应用完成适配 [23] 投资建议 - 建议关注算力领域昇腾链、寒武纪等公司,AIDC领域科华数据等公司,AI应用领域金山办公等公司 [4][24]
刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统
机器之心· 2025-06-18 09:24
机器之心报道 编辑:Panda 刚刚,Gemini 系列模型迎来了一波更新: 谷歌 CEO Sundar Pichai 发推表示新推出的 Gemini 2.5 Flash-Lite 是目前性价比最高的 2.5 系列模型。 可以看到,谷歌对 2.5 Flash-Lite 的定位是适合用于「量大且注重成本效率的任务」。相较之下,2.5 Pro 适合编程和高复杂度任务,2.5 Flash 则居中,更适合需要 较快速度的日常任务。 Gemini 2.5 Pro 稳定版发布且已全面可用,其与 6 月 5 日的预览版相比无变化。 Gemini 2.5 Flash 稳定版发布且已全面可用,其与 5 月 20 日的预览版相比无变化,但价格有更新。 新推出了 Gemini 2.5 Flash-Lite 并已开启预览。 | | | 2.5 Flash-Lite | 2.5 Flash | 2.5 Pro | | --- | --- | --- | --- | --- | | | | THINKING OFF | THINKING | THINKING | | Best for | | High volume cost- | Fa ...
计算机行业双周报(2025、5、23-2025、6、5):海内外AI领域催化不断,关注AI应用及AI算力投资机遇-20250606
东莞证券· 2025-06-06 17:40
报告行业投资评级 - 超配(维持) [1] 报告的核心观点 - 5月海内外AI领域催化不断,人工智能领域蓬勃发展,建议关注AI应用及AI算力领域投资机遇 [3][29] 根据相关目录分别进行总结 计算机行业行情回顾 - 申万计算机板块近2周(2025/5/23 - 2025/6/5)累计上涨3.00%,跑赢沪深300指数3.93个百分点,在31个申万一级行业中排名第6名;6月累计上涨3.24%,跑赢沪深300指数2.27个百分点;今年累计上涨4.95%,跑赢沪深300指数6.41个百分点 [3][11] - 近两周申万计算机板块涨幅前三个股为雄帝科技、四方精创和御银股份,涨幅分别为69.32%、66.76%和63.87%;跌幅前三个股为慧博云通、*ST东通和纬德信息,跌幅分别为15.85%、9.78%和8.58% [16] 板块估值情况 - 截至2025年6月5日,SW计算机板块PE TTM(剔除负值)为51.28倍,处于近5年79.50%分位、近10年65.37%分位 [3][21] 产业新闻 - 5月30日《稳定币条例》正式成为法例,标志香港在数字资产领域迈出重要一步 [22] - 5月29日DeepSeek - R1模型完成小版本升级,当前版本为DeepSeek - R1 - 0528,提升了模型思维深度与推理能力 [22] - 工信部印发《算力互联互通行动计划》,到2026年建立相关体系,2028年基本实现全国公共算力标准化互联 [24] - 中国信通院等二十余家头部企业共同编制的《面向软件工程智能体的技术和应用要求 第1部分:开发智能体》发布 [24] - 5月22日Anthropic推出Claude 4大模型,Claude Opus 4可自动工作约7小时 [23][24] - 5月26日红杉中国推出全新AI基准测试xbench [24] - 5月23日豆包在App端上线实时视频通话功能 [24] 公司公告 - 6月5日城地香江子公司中标中国移动浙江公司项目,中标总价4.4亿元(不含税),4.92亿元(含税) [25] - 6月4日中国软件参与麒麟软件增资扩股项目,认购金额不超过20亿元,持股比例预计由40.25%提高至47.23% [25] - 6月4日达梦数据获中国软件不减持承诺,中国软件持有其18.91%股份 [27] - 5月30日易华录拟转让国富瑞数据31.7727%股权,转让对价5亿元 [27] - 5月26日神州数码拟在未来12个月内增持神州数码控股股票,增持后合计持股比例上限为29.90% [28] - 5月25日中科曙光与海光信息筹划换股吸收合并,中科曙光A股5月26日起停牌 [28] 本周观点 - AI大模型方面,DeepSeek - R1模型更新,Google公布Gemini 2.5系列更新,Anthropic发布Claude 4系列模型 [3][29] - AI应用方面,Agent领域竞争激烈,昆仑万维天工超级智能体APP上线,金蝶国际发布金蝶Agent平台2.0和五大智能体 [29] - 产业方面,海光信息与中科曙光战略重组,有望加快国产算力整合与国产替代进程 [29] 建议关注标的理由 - 广电运通金融科技主业稳健增长,数据要素、算力等领域布局有望成新增长曲线 [30][32] - 神州数码作为“鲲鹏 + 昇腾”产业链核心伙伴,有望受益国产算力需求上升 [32] - 浪潮信息聚焦智慧计算,人工智能服务器行业地位稳固 [32] - 税友股份有望受益于新一轮财税改革 [32] - 软通动力是华为核心合作伙伴,在鸿蒙生态建设中处于领先地位 [32]
AI动态汇总:Claude4系列发布,谷歌上线编程智能体Jules
中邮证券· 2025-05-27 21:43
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:Claude Opus 4** - **模型构建思路**:专为复杂推理与软件开发设计,扩展AI智能体能力边界[12] - **模型具体构建过程**: - 基于Anthropic的底层架构优化,增强跨文件代码理解能力 - 引入记忆文件机制,通过本地存储关键信息提升长期任务连贯性[16] - 采用轻量级思考摘要功能,在5%场景下精简推理链条[19] - **模型评价**:在SWE-bench测试中准确率72.5%,TerminalBench测试43.2%,展现顶尖编码能力[12][16] 2. **模型名称:Claude Sonnet 4** - **模型构建思路**:平衡性能与成本的通用模型,优化指令遵循能力[12] - **模型具体构建过程**: - 基于Sonnet 3.7改进编码和推理模块 - 通过行为控制技术降低系统漏洞利用概率65%[16] - **模型评价**:SWE-bench测试72.7%优于Opus 4,但综合性能稍逊[16] 3. **模型名称:Cosmos-Reason1** - **模型构建思路**:融合物理常识与具身推理,面向自动驾驶/机器人场景[29] - **模型具体构建过程**: - 采用混合Mamba-MLP-Transformer架构,结合ViT视觉编码器[30] - 四阶段训练流程: 1. 130M数据视觉预训练(跨模态对齐) 2. 8M通用监督微调(SFT) 3. 物理AI专项微调(16类知识注入) 4. GRPO算法强化学习优化决策[30] - 公式:奖励机制采用时空谜题自监督生成$$R=\sum_{t=1}^{T}\gamma^{t-1}r_t(s_t,a_t)$$ - **模型评价**:物理常识测试60.2%准确率,具身推理任务性能提升10%[34] 4. **模型名称:Gemini 2.5 Pro** - **模型构建思路**:旗舰级多模态推理模型,扩展上下文窗口至200万token[43] - **模型具体构建过程**: - 引入"Deep Think"并行推理架构,动态调整5%-100%思考强度 - 集成Model Context Protocol SDK降低开源工具链对接门槛[44] - **模型评价**:MMMU测试84.0%,长期记忆准确率83.1%显著优于竞品[44] 5. **模型名称:Devstral** - **模型构建思路**:开源编程专用模型,强化安全对齐与工程级任务处理[38] - **模型具体构建过程**: - 基于Mistral Small 3.1架构,采用Tekken Tokenizer(131,000词汇量) - 零样本训练策略避免SWE-bench过拟合[41] - **模型评价**:SWE-bench Verified得分46.8%,超越前代开源模型6%[39] --- 模型的回测效果 1. **Claude Opus 4** - SWE-bench准确率72.5%[12] - TerminalBench准确率43.2%[12] - 长期记忆准确率83.1%(MRCR 128K测试)[44] 2. **Cosmos-Reason1-7B** - 物理常识基准60.2%准确率[34] - 具身推理基准平均60.7%[34] - 8K视频流推理速度较GPT-4快11倍[34] 3. **Gemini 2.5 Pro** - MMMU得分84.0%[44] - WebDev Arena测试1499.95分(较前代+147)[44] 4. **Devstral** - SWE-bench Verified得分46.8%[39] - 单RTX 4090显卡可部署[39] --- 技术前沿发现 1. **思维链(CoT)对指令遵循的影响** - **构建思路**:通过IFEval/ComplexBench基准测试15种模型的CoT干扰效应[52] - **关键发现**: - CoT导致IFEval准确率平均下降12.3%[54] - 注意力机制显示约束token关注度下降18.7%[60] - **缓解方案**: - 分类器选择性推理提升IFEval准确率7.2%[65] - 自适应推理选择优化ComplexBench表现[64] (注:原文未涉及量化因子相关内容,故未总结该部分)
智通决策参考︱消费电子有利空 医药和黄金或持续活跃
智通财经· 2025-05-26 10:10
外围市场整体处于动荡阶段,但降息形成对冲,宁德时代(03750)上市受到热烈追捧,也提振了市场信 心。恒指上周继续收阳。 周末关税战再传利空,特朗普称6月1日起对欧盟征收50%关税,对不在美国生产的手机制造商征收25% 的关税。在6月底前对苹果和三星征收关税。特朗普称若苹果、三星在美国建厂,将免征关税。这个消 息利空消费电子。 【主编观市】 本周5月进入最后一周,月底多容易变盘,周一美联储主席鲍威尔在普林斯顿大学毕业典礼发表毕业致 辞。周四美联储公布5月货币政策会议纪要。如果偏鹰,美股压力会加剧。 考虑到美国6月国债压力,预计资金会提前避险。医药及黄金或持续活跃。 热点方向,近日召开的国常会审议通过《制造业绿色低碳发展行动方案(2025—2027年)》。 特朗普宣布核电新政,在2030年前启动10座大型核电站建设 ,并在2050年前将美国核电产能翻四倍。 这对核能、环保、光伏类会有一定提振。 据央视报道,鸿蒙折叠电脑,采用自主可控5nm麒麟X90芯片。利好芯片类个股。 国产科幻动画《灵笼》第二季在哔哩哔哩(09626)独家上线,该作由国内知名动画制作团队艺画开天与 哔哩哔哩联合出品。目前才出了2集,播放量已经 ...
每月1800+元的AI全家桶、一句话就让AI拍大片,这一夜,谷歌Gemini贯穿始终,网友:果然Android“靠边站”了
36氪· 2025-05-21 20:51
昨天,微软在 Build 大会上刚刚甩出"Windows 子系统"和"Copilot 开源"的重磅炸弹,整个开发者圈还没从热议中缓过劲来,转眼今天凌晨,谷歌就在 I/O 大会上掏出了自己的"王炸"牌——一场 AI 盛宴,正式上演! 从凌晨 1 点开始,这场持续了 2 小时的发布会彻底印证了网友的预测:曾经占据谷歌 I/O 大会中心的 Android 系统正在"靠边站",C 位已经留给了更具革 命性的 AI。 无论是 Gemini 2.5 模型的更新、谷歌搜索的全新 AI 模式、多模态模型全面升级,还是 AI 订阅服务 Google AI Ultra,如今的谷歌显然把"AI"写进了每一个 产品线的未来蓝图。那么,接下来让我们一起来看看,这场大会究竟带来了哪些值得关注的新动态? 一年发布了 10+ 个新模型、20+ 个重大 AI 产品与新功能 "我听说今天是双子座(Gemini)季节的开始,但我并不觉得这有什么特别的——毕竟在谷歌,每一天都是 Gemini 的季节。"谷歌 CEO Sundar Pichai 在开 场时笑说道。 回顾上一次 I/O 大会至今,Sundar Pichai 表示谷歌已发布了十多个新模型 ...
谷歌I/O 2025:Gemini 2.5系列更新,Veo 3支持生成有声视频,还有250刀的AI会员
Founder Park· 2025-05-21 11:40
本篇文章转载自「 新智元」 今天凌晨, 谷歌I/O 2025大会正式开启。 在发布会上,谷歌一口气发了多个AI模型、产品及相关服务。此次发布的重点是 Gemini 2.5系列模型的更新,包括: · Gemini 2.5 Pro(新) :再次刷榜LMArena,ELO拿下1448分,所有类别第一,碾压o3,原生文本到音频生成 · Gemini 2.5 Pro(Deep Think) :刷榜数学、编码、多模态榜单, · Gemini 2.5 Flash(新) :排名仅次Gemini 2.5 Pro,ELO得分1424,原生文本到音频生成 左右滑动查看 除了 Gemini 2.5系列模型的更新外,谷歌还推出了Imagen 4、Veo 3 两款多模态模型。其中,Imagen 4生图细节逼真,生 成速度比Imagen 3快10倍;Veo 3首次支持原生音频输出,能生成对白、背景音等,实现音视频融合。 同时,谷歌还推出了全新文本扩散模型Gemini Diffusion、AI搜索AI Mode、全新Flow创意平台等。 于此同时,谷歌推出了订阅服务——Google AI Ultra,订阅费用高达250美元(比ChatGPT ...