Workflow
Gemini 2.5系列
icon
搜索文档
2025年下半年计算机行业投资策略报告:聚焦AI智能化、国产化-20250703
上海证券· 2025-07-03 17:51
报告核心观点 - 2025年下半年计算机行业聚焦AI智能化与国产化,大模型持续创新、AI Agent商业化加快,政策与生态共振推动自主可控全面加速,建议关注算力、AIDC、AI应用等领域相关公司 [3][4] 模型端 - 国内外大模型加速迭代,OpenAI、谷歌、Anthropic等推出新模型,主流大模型在智能、效率和多模态能力方面持续进步 [3][6] - 展示SuperCLUE测评基准2025年5月部分模型总体表现,涵盖数学推理、科学推理等多维度测评结果 [6] 算力端 - 科技大厂持续加码AI算力资本开支,海外微软、亚马逊等,国内阿里、腾讯、百度等均有投入 [14] - 推理算力需求井喷,巴克莱报告预计其占通用人工智能总计算需求70%以上,行业或需增加近3000亿美元芯片资本支出,ASIC及国产芯片迎发展机遇 [14] 应用端 - 科技巨头在B端和C端加速布局AI Agent,推动商业化落地,C端多款Agent涌现 [19] - 巨头积极拥抱MCP协议,有望拓展AI应用和Agent边界,降低开发门槛 [19] - AI Agent市场发展潜力大,全球市场预计从2024年51亿美元增长到2030年471亿美元,年复合增长率44.8% [19] 信创 - 关税摩擦升级,政策强调推进关键核心技术攻关,内部政策或加速科技和供应链自主可控 [22] - 国资委要求2027年底前中央企业信息化系统安可信创替代,中科曙光与海光信息战略重组推动信创产业自主高端化 [22] - 华为推出CloudMatrix超节点集群,新一代昇腾AI云服务上线,为超1300家客户提供算力 [23] - 华为发布原生鸿蒙,市场份额提升,鸿蒙PC发布实现国产PC全栈自主可控,预计年底超2000个应用完成适配 [23] 投资建议 - 建议关注算力领域昇腾链、寒武纪等公司,AIDC领域科华数据等公司,AI应用领域金山办公等公司 [4][24]
AI玩宝可梦找出30年前代码Bug!谷歌论文介绍AI通关全过程,复杂任务都能解
量子位· 2025-06-18 12:58
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌Gemini 2.5系列大模型技术报告发布,一大重点居然是AI玩《宝可梦》? 没错,就是那个童年回忆里的游戏,谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行为,70页的论文,Pokemon关键词出 现59次。 其中特别报告了当AI控制的游戏角色濒临死亡时,Gemini 2.5 Pro会陷入"恐慌"状态,导致模型推理能力显著下降,甚至会忘记使用一些基本 功能,比如寻路工具。 这种恐慌行为出现过很多次,甚至观看直播的观众都已经能通过AI的行为模式,准确判断它什么时候在"恐慌"了。 事情开始于3月底,一位独立开发者Joel Zhang在Twitch上搭建了一个"Gemini玩宝可梦"的直播间,最初的目标只是直播播展示能玩完整游戏 的智能体工具的开发过程。 结果Gemini 2.5 Pro超出预期,测试期间直接把游戏打通关了,成为宝可梦联盟冠军,进入名人堂,走上AI生巅峰。 虽然整个过程用了831个小时,相比人类玩家平均只需要几十个小时差得很远。但在正式使用固定的智能体工具打第二次时,通关时间只用了 一半。 AI展现惊人游戏水平,复杂 ...
刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统
机器之心· 2025-06-18 09:24
机器之心报道 编辑:Panda 刚刚,Gemini 系列模型迎来了一波更新: 谷歌 CEO Sundar Pichai 发推表示新推出的 Gemini 2.5 Flash-Lite 是目前性价比最高的 2.5 系列模型。 可以看到,谷歌对 2.5 Flash-Lite 的定位是适合用于「量大且注重成本效率的任务」。相较之下,2.5 Pro 适合编程和高复杂度任务,2.5 Flash 则居中,更适合需要 较快速度的日常任务。 Gemini 2.5 Pro 稳定版发布且已全面可用,其与 6 月 5 日的预览版相比无变化。 Gemini 2.5 Flash 稳定版发布且已全面可用,其与 5 月 20 日的预览版相比无变化,但价格有更新。 新推出了 Gemini 2.5 Flash-Lite 并已开启预览。 | | | 2.5 Flash-Lite | 2.5 Flash | 2.5 Pro | | --- | --- | --- | --- | --- | | | | THINKING OFF | THINKING | THINKING | | Best for | | High volume cost- | Fa ...
计算机行业双周报(2025、5、23-2025、6、5):海内外AI领域催化不断,关注AI应用及AI算力投资机遇-20250606
东莞证券· 2025-06-06 17:40
报告行业投资评级 - 超配(维持) [1] 报告的核心观点 - 5月海内外AI领域催化不断,人工智能领域蓬勃发展,建议关注AI应用及AI算力领域投资机遇 [3][29] 根据相关目录分别进行总结 计算机行业行情回顾 - 申万计算机板块近2周(2025/5/23 - 2025/6/5)累计上涨3.00%,跑赢沪深300指数3.93个百分点,在31个申万一级行业中排名第6名;6月累计上涨3.24%,跑赢沪深300指数2.27个百分点;今年累计上涨4.95%,跑赢沪深300指数6.41个百分点 [3][11] - 近两周申万计算机板块涨幅前三个股为雄帝科技、四方精创和御银股份,涨幅分别为69.32%、66.76%和63.87%;跌幅前三个股为慧博云通、*ST东通和纬德信息,跌幅分别为15.85%、9.78%和8.58% [16] 板块估值情况 - 截至2025年6月5日,SW计算机板块PE TTM(剔除负值)为51.28倍,处于近5年79.50%分位、近10年65.37%分位 [3][21] 产业新闻 - 5月30日《稳定币条例》正式成为法例,标志香港在数字资产领域迈出重要一步 [22] - 5月29日DeepSeek - R1模型完成小版本升级,当前版本为DeepSeek - R1 - 0528,提升了模型思维深度与推理能力 [22] - 工信部印发《算力互联互通行动计划》,到2026年建立相关体系,2028年基本实现全国公共算力标准化互联 [24] - 中国信通院等二十余家头部企业共同编制的《面向软件工程智能体的技术和应用要求 第1部分:开发智能体》发布 [24] - 5月22日Anthropic推出Claude 4大模型,Claude Opus 4可自动工作约7小时 [23][24] - 5月26日红杉中国推出全新AI基准测试xbench [24] - 5月23日豆包在App端上线实时视频通话功能 [24] 公司公告 - 6月5日城地香江子公司中标中国移动浙江公司项目,中标总价4.4亿元(不含税),4.92亿元(含税) [25] - 6月4日中国软件参与麒麟软件增资扩股项目,认购金额不超过20亿元,持股比例预计由40.25%提高至47.23% [25] - 6月4日达梦数据获中国软件不减持承诺,中国软件持有其18.91%股份 [27] - 5月30日易华录拟转让国富瑞数据31.7727%股权,转让对价5亿元 [27] - 5月26日神州数码拟在未来12个月内增持神州数码控股股票,增持后合计持股比例上限为29.90% [28] - 5月25日中科曙光与海光信息筹划换股吸收合并,中科曙光A股5月26日起停牌 [28] 本周观点 - AI大模型方面,DeepSeek - R1模型更新,Google公布Gemini 2.5系列更新,Anthropic发布Claude 4系列模型 [3][29] - AI应用方面,Agent领域竞争激烈,昆仑万维天工超级智能体APP上线,金蝶国际发布金蝶Agent平台2.0和五大智能体 [29] - 产业方面,海光信息与中科曙光战略重组,有望加快国产算力整合与国产替代进程 [29] 建议关注标的理由 - 广电运通金融科技主业稳健增长,数据要素、算力等领域布局有望成新增长曲线 [30][32] - 神州数码作为“鲲鹏 + 昇腾”产业链核心伙伴,有望受益国产算力需求上升 [32] - 浪潮信息聚焦智慧计算,人工智能服务器行业地位稳固 [32] - 税友股份有望受益于新一轮财税改革 [32] - 软通动力是华为核心合作伙伴,在鸿蒙生态建设中处于领先地位 [32]
AI动态汇总:Claude4系列发布,谷歌上线编程智能体Jules
中邮证券· 2025-05-27 21:43
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:Claude Opus 4** - **模型构建思路**:专为复杂推理与软件开发设计,扩展AI智能体能力边界[12] - **模型具体构建过程**: - 基于Anthropic的底层架构优化,增强跨文件代码理解能力 - 引入记忆文件机制,通过本地存储关键信息提升长期任务连贯性[16] - 采用轻量级思考摘要功能,在5%场景下精简推理链条[19] - **模型评价**:在SWE-bench测试中准确率72.5%,TerminalBench测试43.2%,展现顶尖编码能力[12][16] 2. **模型名称:Claude Sonnet 4** - **模型构建思路**:平衡性能与成本的通用模型,优化指令遵循能力[12] - **模型具体构建过程**: - 基于Sonnet 3.7改进编码和推理模块 - 通过行为控制技术降低系统漏洞利用概率65%[16] - **模型评价**:SWE-bench测试72.7%优于Opus 4,但综合性能稍逊[16] 3. **模型名称:Cosmos-Reason1** - **模型构建思路**:融合物理常识与具身推理,面向自动驾驶/机器人场景[29] - **模型具体构建过程**: - 采用混合Mamba-MLP-Transformer架构,结合ViT视觉编码器[30] - 四阶段训练流程: 1. 130M数据视觉预训练(跨模态对齐) 2. 8M通用监督微调(SFT) 3. 物理AI专项微调(16类知识注入) 4. GRPO算法强化学习优化决策[30] - 公式:奖励机制采用时空谜题自监督生成$$R=\sum_{t=1}^{T}\gamma^{t-1}r_t(s_t,a_t)$$ - **模型评价**:物理常识测试60.2%准确率,具身推理任务性能提升10%[34] 4. **模型名称:Gemini 2.5 Pro** - **模型构建思路**:旗舰级多模态推理模型,扩展上下文窗口至200万token[43] - **模型具体构建过程**: - 引入"Deep Think"并行推理架构,动态调整5%-100%思考强度 - 集成Model Context Protocol SDK降低开源工具链对接门槛[44] - **模型评价**:MMMU测试84.0%,长期记忆准确率83.1%显著优于竞品[44] 5. **模型名称:Devstral** - **模型构建思路**:开源编程专用模型,强化安全对齐与工程级任务处理[38] - **模型具体构建过程**: - 基于Mistral Small 3.1架构,采用Tekken Tokenizer(131,000词汇量) - 零样本训练策略避免SWE-bench过拟合[41] - **模型评价**:SWE-bench Verified得分46.8%,超越前代开源模型6%[39] --- 模型的回测效果 1. **Claude Opus 4** - SWE-bench准确率72.5%[12] - TerminalBench准确率43.2%[12] - 长期记忆准确率83.1%(MRCR 128K测试)[44] 2. **Cosmos-Reason1-7B** - 物理常识基准60.2%准确率[34] - 具身推理基准平均60.7%[34] - 8K视频流推理速度较GPT-4快11倍[34] 3. **Gemini 2.5 Pro** - MMMU得分84.0%[44] - WebDev Arena测试1499.95分(较前代+147)[44] 4. **Devstral** - SWE-bench Verified得分46.8%[39] - 单RTX 4090显卡可部署[39] --- 技术前沿发现 1. **思维链(CoT)对指令遵循的影响** - **构建思路**:通过IFEval/ComplexBench基准测试15种模型的CoT干扰效应[52] - **关键发现**: - CoT导致IFEval准确率平均下降12.3%[54] - 注意力机制显示约束token关注度下降18.7%[60] - **缓解方案**: - 分类器选择性推理提升IFEval准确率7.2%[65] - 自适应推理选择优化ComplexBench表现[64] (注:原文未涉及量化因子相关内容,故未总结该部分)
智通决策参考︱消费电子有利空 医药和黄金或持续活跃
智通财经· 2025-05-26 10:10
外围市场整体处于动荡阶段,但降息形成对冲,宁德时代(03750)上市受到热烈追捧,也提振了市场信 心。恒指上周继续收阳。 周末关税战再传利空,特朗普称6月1日起对欧盟征收50%关税,对不在美国生产的手机制造商征收25% 的关税。在6月底前对苹果和三星征收关税。特朗普称若苹果、三星在美国建厂,将免征关税。这个消 息利空消费电子。 【主编观市】 本周5月进入最后一周,月底多容易变盘,周一美联储主席鲍威尔在普林斯顿大学毕业典礼发表毕业致 辞。周四美联储公布5月货币政策会议纪要。如果偏鹰,美股压力会加剧。 考虑到美国6月国债压力,预计资金会提前避险。医药及黄金或持续活跃。 热点方向,近日召开的国常会审议通过《制造业绿色低碳发展行动方案(2025—2027年)》。 特朗普宣布核电新政,在2030年前启动10座大型核电站建设 ,并在2050年前将美国核电产能翻四倍。 这对核能、环保、光伏类会有一定提振。 据央视报道,鸿蒙折叠电脑,采用自主可控5nm麒麟X90芯片。利好芯片类个股。 国产科幻动画《灵笼》第二季在哔哩哔哩(09626)独家上线,该作由国内知名动画制作团队艺画开天与 哔哩哔哩联合出品。目前才出了2集,播放量已经 ...
谷歌I/O的AI新叙事:从大模型到一站式服务,AI与XR会师
36氪· 2025-05-22 08:15
谷歌CEO Sundar Pichai表示,去年同期谷歌AI大模型和API每月处理9.7万亿个Token,现在这一数字增长到了480万亿个,谷歌搜索业务的AI综述功能月活用 户也达到了15亿人。 AI正逐渐融入我们的生活,成为不可或缺的一部分。无论是谷歌推出的全新大模型和AI应用,还是XR平台和手机系统,都无法脱离AI的影响。 5月21日凌晨,科技巨头谷歌召开了I/O 2025开发者大会,除了万众瞩目的AI功能,谷歌还公布了安卓XR平台和安卓16的新规划及部分新特性。 AI:从大模型变成一站式服务平台 作为谷歌I/O大会的绝对主角,AI可谓重头戏,发布的新品也最多。此前已多次曝光的Gemini 2.5系列,于本场大会确认6月上线,其中Gemini 2.5 Pro号称世 界上最智能的AI模型,新版本刷榜LMArena,在ELO基准测试中拿到了1448分。 Gemini 2.5 Pro新增深度思考版本,在USAMO 2025、LiveCodeBench、MMMU等多项测试中,Gemini 2.5 Pro深度思考版本表现均领先Gemini 2.5 Pro。 Gemini 2.5 Flash则属于轻量级模型,相较上一 ...
每月1800+元的AI全家桶、一句话就让AI拍大片,这一夜,谷歌Gemini贯穿始终,网友:果然Android“靠边站”了
36氪· 2025-05-21 20:51
谷歌AI战略与产品更新 - 公司CEO Sundar Pichai强调AI已成为核心战略,Gemini系列模型和AI产品线全面升级[1][2] - 过去一年发布10+新模型和20+重大AI产品,推进速度创历史新高[2] - Gemini 2.5 Pro模型在LMArena和WebArena等基准测试中刷新纪录,代码领域表现突出[4] - AI处理token量从9.7万亿/月飙升至480万亿/月,年增长50倍[4] - Gemini开发者用户突破700万,Vertex AI使用量增长40倍[4] - Gemini应用月活达4亿,2.5 Pro版本带动45%用户增长[4] Gemini模型技术突破 - Gemini 2.5 Pro被定位为全球最强基础模型,在WebDev Arena和LMArena领先[12] - 新增Deep Think模式,LiveCodeBench得分84%,竞赛级编程能力突出[12] - 支持原生音频情感识别和背景降噪,提升交互自然度[13] - 轻量级Gemini 2.5 Flash模型token效率提升20-30%,6月正式发布[15] - 模型价格体系优化,输入输出成本显著低于竞品(输入$0.15/M tokens)[16] - 在多模态推理MMMU测试达84%,长文本理解128k平均得分74%[16] AI产品化落地 - Project Starline进化为Google Beam,实现60fps 3D视频通话[6] - Project Astra落地为Gemini Live,支持环境感知的AI助手[8] - Project Mariner升级Agent Mode,支持"teach and repeat"多任务学习[9][10] - 个性化上下文功能将整合Gmail写作风格,夏季上线[11] - 开发者工具增强,支持MCP工具链和2.5 Pro推理预算扩展[10][15] 搜索业务革新 - AI概览功能月活超15亿,覆盖200+国家地区[17] - 推出"AI模式"搜索,整合深度搜索/实时交互/智能Agent[18] - 深度搜索采用"查询扇出"技术,可发起数百次并行搜索[18] - 视觉搜索结合Project Astra实时对话功能[18] - 智能购物支持虚拟试穿和自动下单,个性化推荐即将推出[19] 多模态创作工具 - 视频模型Veo 3实现音画同步生成,支持文本/图像提示[20] - Veo 2新增参考图驱动/精准运镜/画面扩展功能[20] - Imagen 4支持2K分辨率,文字准确性提升,速度比前代快10倍[22] - Lyria 2实时音乐生成接入YouTube Shorts和Vertex AI[24] - 推出AI电影工具Flow,整合Veo/Imagen/Gemini模型[24] 商业化与生态布局 - 推出Google AI Ultra订阅服务,月费$249.99含Veo 3/Gemini 2.5 Pro[25] - Google AI Pro月费$19.99,提供基础版Gemini 2.5 Pro[27] - 与Warby Parker/Gentle Monster合作开发Android XR智能眼镜[29] - 与三星合作Project Moohan头显,预计2025年发布[29]
谷歌I/O 2025:Gemini 2.5系列更新,Veo 3支持生成有声视频,还有250刀的AI会员
Founder Park· 2025-05-21 11:40
Gemini 2.5系列模型更新 - Gemini 2.5 Pro在LMArena排行榜中ELO得分1448分,所有类别排名第一,碾压其他模型,支持原生文本到音频生成 [1][10][11] - Gemini 2.5 Pro(Deep Think)在数学、编码、多模态榜单刷新SOTA,在2025 USAMO数学奥赛中取得40.4%高分,比2.5 Pro提升10%以上,LiveCodeBench竞赛级编程得分80.4%,多模态推理MMMU得分84.0% [34][37] - Gemini 2.5 Flash在LMArena得分1424分,仅次于2.5 Pro,生成速度更快、成本更低,评估中使用的token减少20%-30% [24][25][27] 多模态模型Imagen 4和Veo 3 - Imagen 4生图细节逼真,生成速度比Imagen 3快10倍,分辨率最高达2k,完美处理拼写和版式任务 [4][58][60][61][63] - Veo 3首次支持原生音频输出,可生成对白、背景音等,实现音视频融合,在文本/图像生成提示、物理模拟和口型同步等方面表现出色 [4][66][67][68][71] 新产品与服务 - 推出订阅服务Google AI Ultra,费用250美元/月(比ChatGPT Pro贵50美元),可无限访问最新模型,同时推出Pro版20美元/月,支持Gemini 2.5 Pro、Veo 2和NotebookLM [5][7] - 推出全新文本扩散模型Gemini Diffusion,每秒输出1000多个token,性能比Gemini 2.0 Flash-Lite快5倍,擅长编程和数学任务 [39][40][41][43] - 推出创意平台Flow,集成Veo、Imagen、Gemini模型,可无缝创建电影片段、场景和故事 [72][73][74] AI Mode搜索功能 - AI Mode将搜索与AI深度集成,采用专用于Search的Gemini 2.5模型,自动规划搜索结果展现形式(文本、视频、地图等),支持复杂问题解答 [76][77][81][83] - Google Lens支持框选页面信息自动弹出答案,智能购物功能可虚拟试衣并自动下单付款 [85][87][90][91][92] 硬件产品 - 推出Project Moohan头显和XR眼镜,由Gemini加持,对标苹果和Meta产品,预计年内发布 [7][102][104] 行业影响与愿景 - Gemini已成为最好的多模态基础模型,未来将扩展为"世界模型",Project Astra愿景是让AI助手真正帮助人类日常生活 [48][50][51][52][53] - 公司在AI加速科学发现方面取得成就,包括AlphaFold、AIME等,并与Ira公司合作帮助盲人提升独立性 [54][55]
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
量子位· 2025-05-21 04:33
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样? 谷歌最新版 Project Astra 展示了终极AI助手的能力: 实时观察周围环境,搜索资料指导小哥修自行车,零件不够还能自动电话询问周边商店有没有货。 在最新的I/O大会上,谷歌连续放大招,就好像大招不要钱。 Gemini 2.5 Pro和Gemini 2.5 Flash的预览版 已霸榜竞技场前两名。 视频生成模型Veo 3 ,实现视频与音频的原生集成,除音乐和音效,甚至是角色间的对话语音都能生成,画面上还能同步口型。 图像生成模型Imagen 4 ,图像更加丰富,色彩更加细腻,细节更加逼真。 现有AI模型全部更新一遍 原有的产品用AI重做一遍 实验性新产品也推出了一箩筐 …… 传统产品方面, 谷歌搜索 增加端到端AI搜索模式,整合推理和多模态分析能力,将问题分解为子问题,并同时发出多个查询,更深入地探索 网络。 视频会议Google Meet ,支持实时的双语翻译配音,并保留对话双方的音色,首批英语-西班牙语支持已上线,后续将添加更多语言。 Chrome浏览器,直接集 ...