Gemini API

搜索文档
海外AItoken/用户数激增,算力需求长坡厚雪
长江证券· 2025-06-22 07:30
报告行业投资评级 - 看好,维持 [9] 报告的核心观点 - 海外AI应用活跃用户数激增,推理侧Token爆发拉动算力需求,大模型公司ARR快速提升,AI大模型商业兑现进行时,高资本支出延续,为海外算力链提供有力支撑,25Q2光模块板块景气度高,光器件订单强劲,多家光器件厂商营收及业绩加速释放,继续看好海外AI算力供应链方向 [2][11] 根据相关目录分别进行总结 事件描述 - 海外AI需求爆发式增长,2025年第一季度微软处理的Token总量超100万亿,同比增5倍,谷歌月度Token处理量从9.7万亿飙升至480万亿,增幅约50倍,ChatGPT用户数近几个月爆发式增长 [6] 事件评论 - 用户侧增长迅猛,ChatGPT上线两月破1亿用户,17个月内月活达8亿,近几个月爆发式增长,付费订阅用户超2000万;推理侧Token使用量爆发式增长,谷歌过去一年每月处理Token数量从9.7万亿跃升至480万亿,增幅约50倍,旗下AI Studio和Gemini API自2025年初活跃度增长逾200%,微软Azure AI Foundry被超7万家企业开发者使用,2025年一季度处理Token超100万亿,同比增5倍 [11] - OpenAI年化经常性收入突破100亿美元,较去年12月的55亿美元增长近80%,付费商业用户达300万,2025 - 2027年预计服务器支出约900亿美元;Anthropic年化经常性收入达约30亿美元,2024年12月为近10亿美元,3月底左右突破20亿美元 [11] - 25Q2光模块板块景气度高,Meta和AWS等大厂800G产或继续上量;光器件侧MPO、AWG、FAU订单强劲,MPO光纤连接器受新建数据中心驱动,呈现订单外溢趋势,毛利率加速攀升,多家光器件厂商营收及业绩加速释放 [2][11] - 继续看好海外AI算力供应链方向,重点推荐光模块/光引擎厂商天孚通信、新易盛、中际旭创,铜连接厂商沃尔核材,重点关注光器件厂商仕佳光子、太辰光、源杰科技、长飞光纤 [11]
速递|OpenAI升级其Operator的底层模型,推理模型o3全面接棒GPT-4o
Z Potentials· 2025-05-25 12:37
OpenAI AI代理Operator模型升级 - OpenAI正在将Operator代理的AI模型从定制版GPT-4o升级为基于o3的新模型 o3是OpenAI最新o系列"推理"模型之一 升级后API版本仍保持基于4o不变 [1][2] - o3模型在数学和推理任务上表现显著优于GPT-4o 针对计算机使用场景进行了额外安全数据微调 包含专门教授模型决策边界的数据集 [2][3] - o3 Operator在安全评估中表现优异 相比GPT-4o更少拒绝执行"非法"活动或搜索敏感数据 对提示注入等攻击抵抗力更强 采用与4o相同的多层安全防护机制 [3] 行业竞争格局 - 各大AI公司竞相开发高度复杂的智能体工具 这些智能体可基本无需监督完成各种任务 [2] - 谷歌通过Gemini API提供"计算机使用"智能体和面向消费者的Mariner服务 Anthropic的模型也具备执行计算机任务的能力 [2] 技术细节 - o3 Operator继承了o3的编程能力 但不具备直接访问编程环境或终端的原生权限 [3] - 模型升级涉及云端托管的虚拟机使用特定软件 代理可自主浏览网页满足用户需求 [1]
AI全球速递:从谷歌FY25Q1财报看AI产业趋势变化
长江证券· 2025-05-08 19:11
报告行业投资评级 - 看好,维持 [8] 报告的核心观点 - 美东时间4月24日盘后谷歌发布2025财年Q1财报,营收和净利润均高于彭博一致预期,股价盘后涨5%,公司对二季度指引偏谨慎乐观 [1][4] - 云业务展现AI领域领先优势,全栈式AI方法是增长核心,AI整体进展顺利,需求有望爆发,推荐关注全年围绕AI Agent的投资机遇 [6] - 云业务增速超整体,搜索业务在各垂直领域表现强劲,AI Overviews功能提升满意度与使用率;利润超预期,预计FY25资本开支750亿美元不变,后续资本开支折旧可能加速;谷歌董事会批准季度股息上调5%,并授权700亿美元股票回购计划 [11] 根据相关目录分别进行总结 事件描述 - 美东时间4月24日盘后谷歌发布2025财年Q1财报,营收902.34亿美元,同比增12.0%;净利润345.4亿美元,同比增46.0%;每股摊薄收益2.81美元,同比增48.7%,均高于彭博一致预期;股价盘后涨5%,因一季度营收业绩超预期;公司对二季度指引偏谨慎乐观 [1][4] 事件评论 云业务优势 - 云业务因市场供需紧张,营收增速与新产能部署进度相关,预计2025年末产能部署较高 [6] - 基础设施方面,公司有超200万英里光纤与33条海底电缆,第七代TPU计算力较高性能DPU提升超10倍,能效近乎翻倍;与英伟达合作紧密,率先推出其B200和B200 Blackwell GPU,还将引入下一代GPU Vera Rubin [6] - 终端方面,年初至今AI studio和Gemini API活跃用户激增超200%,Imagen 3和Veo 2广泛应用,开放模型Gema 3性能出色,下载量超1.4亿次 [6] - 在机器人、医疗等新领域,开发Gemini机器人模型,推出AI co scientist多智能体系统,AlphaFold已服务超250万研究人员 [6] 业务营收情况 - FY25Q1谷歌营收902亿美元,同比增12.0%,高于彭博预期;净利润345.4亿美元,同比增46.0%,大幅高于彭博预期 [11] - 谷歌广告营收669亿美元,同比增8.5%,略好于彭博预期;搜索营收507亿美元,同比增9.85%,基本符合彭博预期 [11] - YouTube广告营收89亿美元,同比增10.35%,符合彭博预期 [11] - 谷歌云业务营收123亿美元,同比增28.1%,略低于市场预期,增速放缓至30%以下 [11] 利润及资本开支情况 - FY25Q1谷歌营业利润增长20%至310亿美元,营业利润率提升至33.9%;净利润增长46%至345亿美元,每股收益增长49%至2.81美元 [11] - FY25Q1谷歌CapEx为172亿美元,同比增长超43%,符合预期,主要投向技术基础设施,服务器投入最大,其次是数据中心 [11] - 谷歌FY25全年指引资本支出预计约750亿美元,季度间或因交付、建设进度波动;预计2025年折旧增速将加快;关键领域人员预计增长;第一季度股权激励费用低于年内其他季度 [11] 其他情况 - 谷歌董事会已批准季度股息上调5%,并授权700亿美元股票回购计划 [11]
碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
AI前线· 2025-05-07 11:31
谷歌Gemini 2.5 Pro Preview(I/O版)发布 - 谷歌在I/O大会前突发推出Gemini 2.5 Pro Preview(I/O版),作为旗舰AI模型的升级版本,宣称在多项主流基准测试中名列前茅 [2] - 该模型通过Gemini API、Vertex AI与AI Studio平台提供,价格与旧版一致,并集成至Gemini聊天机器人应用供Web及移动端使用 [2] - DeepMind CEO Demis Hassabis强调这是目前最佳编程模型,在LMArena编程类别和WebDev Arena排行榜均排名第一 [2] 模型性能提升 - 新版在编码和构建交互式Web应用方面实现显著提升,尤其在代码转换与编辑任务表现突出 [7] - 在WebDev Arena排行榜以1420分位列第一,较上一版本提高147个Elo积分,超越Claude 3.7 Sonnet(1357分)和GPT-4.1(1261分) [8][9] - 视频理解能力达一流水平,在VideoMME基准测试取得84.8%得分,结合编码功能实现全新流程 [10] 开发者功能优化 - 减少函数调用错误并提高触发率,默认保持良好可操控性,同时强化对Web开发的审美追求 [12] - 前端Web开发表现优异,可自动生成匹配现有风格的CSS代码,例如为应用添加视频播放器组件 [14] - 听写入门应用展示动态波长动画、响应式布局等细节设计,能智能生成麦克风UI动画代码 [15] 行业竞争与社区反馈 - 发布正值谷歌I/O大会前夕,公司计划推出更多AI工具以应对与OpenAI、xAI的激烈竞争 [4] - Cursor CEO称赞模型编程能力进步,工具调用失败率显著降低,提升开发效率 [17] - Hacker News用户认为Gemini 2.5系列可靠性优于其他模型,但仍无法替代人类开发者在抽象思维和系统架构上的能力 [17][18] 基准测试对比 - 科学(GPQA diamond)得分83.0%略低于旧版84.0%,数学(AIME 2025)83.0%低于旧版86.7% [19] - 代码生成(LiveCodeBench v5)75.6%优于旧版70.4%,代码编辑(Aider Polyglot)76.5%整体得分提升 [19] - 长上下文处理(MRCR 128k)93.0%稍逊于旧版94.5%,多模态性能(Global MMLU Lite)88.6%略有下降 [19]