Gemini API
搜索文档
大模型商业化-海外模型定价重构
2026-04-13 14:13
大模型商业化与行业动态分析 一、 行业与公司 * 涉及的行业为**大模型/人工智能**行业,具体包括大模型开发、API服务、Agent(智能体)应用及算力基础设施[1] * 涉及的**公司**包括: * **海外公司**:Anthropic、谷歌(Google)、OpenAI[2][7] * **国内公司**:阿里巴巴(通义千问)、Kimi、DeepSeek[1][4][7] 二、 核心观点与论据 **1. 海外厂商调整计费模式,旨在缓解算力压力并构建生态闭环** * Anthropic与谷歌限制订阅账户授权第三方框架,强制切换至按量付费API[1][2] * 核心原因是**算力资源紧张**,需优先保障官方产品及正规API用户的服务质量,遏制通过订阅模式变相“白嫖”算力[2] * 旨在**收拢和强化官方生态**,将用户引导至自家产品(如Claude Code、Claude CoWork、NotebookLM),加强生态闭环[2] * 存在**门户之争的竞争因素**,OpenClaw创始人加入OpenAI后,谷歌与Anthropic相继跟进限制[2] **2. 计费模式向精细化、多样化演进** * 谷歌推出**Gemini API分层定价**,包含Flex(半价)、Priority(溢价75%-100%)、Standard、Batch和Caching共5档模式[1][3] * Flex模式适用于后台思考、批量处理等非实时任务,价格为标准价的一半[3] * Priority模式适用于聊天机器人、金融风控等低延迟任务,价格溢价75%-100%[3] * 这标志着**算力计费进入精细化阶段**,为开发者提供根据任务特性选择不同成本和性能组合的灵活性[1][3] **3. 国内厂商采取开放生态策略,与海外形成差异化** * 国内厂商普遍采取**开放和积极的态度**,全面拥抱OpenAI Cloud等第三方生态[7] * 例如,Kimi的KimiChat 2.5主动支持LangChain,并被OpenAI Cloud纳入官方推荐[7] * 阿里巴巴的Qwen 3.6 Plus**全面适配OpenClaw等第三方框架**,与海外闭源生态形成差异化[1][4] * 国内厂商更接近于**MaaS(Model as a Service)服务模式**,力图融入用户实际工作流,与海外构建封闭产品生态的路径形成对比[7] **4. 阿里巴巴发布多款新模型,强化多模态与Agent能力** * **Qwen 3.6 Plus**:定位为原生支持多模态与Agentic Coding的基座模型[1][4] * 支持**100万Token**超长上下文窗口,引入“preserve_thinking”功能以保留思维内容,特别适用于构建智能体任务[4] * 编程能力接近Claude 4,综合水平据评估在Claude 4之上[1][5] * 定价为每百万Token 4元,现提供五折优惠至2元,相较于3.5版本0.8元的定价有显著提升[1][5] * 发布当日在OpenRouter平台的日调用量突破**1.4万亿Token**,刷新该平台单日单模型调用记录[4] * **Qwen 3.5 Omni**:定位为端到端的全模态理解模型[5] * 参数量为32B,采用MoE架构,单次推理可激活4.2B参数[5] * 在多项评测中表现已超越Gemini 3.1 Pro[5] * 核心优势在于原生音频理解能力和极具竞争力的API成本,输入定价为每百万Token **0.4元**[5] * **Qwen-Vision 2.7-Image**:专注于多模态生成能力,与千问系列形成互补[5] * 提升了对生成图像的精细化控制力,注重面部多样性与人物真实感,推出“调色盘”功能[5] * 改善超长文本渲染能力,支持局部图像编辑、多图生成和多主体一致性[5][6] * 支持作为Skills接入OpenAI Cloud生态,对标产品是Midjourney[6] **5. 行业影响:成本压力推动架构进化与开源模型接受度提升** * **成本压力倒逼Agent框架向精细化进化**:用户成本上升将推动框架开发者改进上下文管理、最大化Prompt缓存命中率与复用率,削减无效Token消耗[3] * **推动开源模型接受度提升**:付费闭源模型在Agent场景下成本增加,使得独立部署开源模型的性价比优势凸显[3] * Web-based Coding降低开发门槛,可能带动对**NAS服务器、C端推理算力租赁**等灵活、专业推理算力需求的增长[3] * DeepSeek V4等**高性能开源模型**备受期待[3] **6. 国内推出“Coding Plan”套餐,短期冲量中长期利好算力** * “Coding Plan”是国内厂商针对LangChain应用推出的一种**Token使用套餐**,通过订阅形式支持用户调用API[1][8] * 与海外多样化的计费模式不同,海外尚未出现专门针对LangChain或Agent应用的此类套餐[8] * **短期影响**:通过低价订阅套餐,可以迅速增加模型的Token调用量[1][8] * **中长期影响**:Agent框架尚不成熟,存在大量Token浪费,消耗巨大。这种模式会极大地消耗算力资源,从而对**云厂商及上游算力提供商形成利好**[1][8] 三、 其他重要内容 * 国内模型的升级方向普遍围绕**Agent能力**进行迭代,其低廉的价格和为Agent使用场景优化的设计,使其在LangChain框架下具备较强适用性[7] * 国内厂商积极融入第三方生态的策略,反过来也**加速了国产大模型在Agent方向的迭代速度**[7] * 阿里方面透露,近期还将发布性能更强的**Qwen 3.6 MAX**版本以及其他小尺寸的开源版本[5] * 需要密切关注在Agent盛行的趋势下,**国内大模型的订阅体系将如何演变**[8]
Alphabet Stock Edges Higher Tuesday: What's Going On?
Benzinga· 2026-04-07 22:46
AI工具与开发者生态 - 公司推出成本更低的AI视频模型Veo 3.1 Lite 其运行速度与Veo 3.1 Fast相同 但成本降低超过一半 支持文本到视频和图像到视频 分辨率包括720p和1080p 视频片段长度有4秒、6秒或8秒 定价根据时长调整 该模型已通过Gemini API和Google AI Studio的付费层级提供 [2][3] - 公司计划于4月7日降低Veo 3.1 Fast的价格 这是其降低AI工具成本 以吸引更多开发者进入其生态系统的广泛举措的一部分 [4] - 公司此前还推出了可在设备端离线运行的Gemma 4模型 支持超过140种语言 旨在通过直接在设备上运行来增强开发者在整个技术栈中的粘性 [2] 财务表现与估值 - 公司核心收入仍由谷歌服务驱动 其近90%的收入来自谷歌服务 主要是广告业务 [6] - 市场对公司的下一财季业绩预期为:营收1007.6亿美元 同比增长 上年同期为902.3亿美元 每股收益预期为2.67美元 同比下降 上年同期为2.81美元 [8] - 公司股票市盈率为27.5倍 表明其估值相对于同行存在溢价 [8] - 分析师对股票的平均目标价为274.71美元 评级为“买入” 近期多家机构上调目标价 包括UBS上调至348美元 Scotiabank上调至400美元 JP Morgan上调至395美元 [8] 近期市场表现与催化剂 - 公司股票周二收盘上涨0.28% 报298.50美元 [8] - 公司下一个重要的股价催化剂是预计于4月23日发布的财报 [7] - 尽管公司层面有积极动态 但整体市场表现疲软 标普500指数下跌0.69% 纳斯达克指数下跌0.92% [5]
腾讯研究院AI速递 20260402
腾讯研究院· 2026-04-02 00:05
OpenAI完成大规模融资并调整战略 - OpenAI完成1220亿美元融资,亚马逊出资500亿美元、英伟达和软银各出资300亿美元,融资后估值达到8520亿美元,被视为IPO前的最后一次大规模私募 [1] - Sora因每日消耗100万美元且用户从100万暴跌至不足50万而下线,公司将算力集中到文本模型、代码生成等有稳定现金流的业务方向 [1] - OpenAI正从技术展示转向基础设施定位,计划整合ChatGPT、Codex等为统一入口,其企业服务已占总营收的40%以上 [1] Anthropic发生源码泄露事件 - Anthropic因发布npm包时未剔除source map文件,导致Claude Code的完整TypeScript源码泄露,51万行代码被迅速下载和传播 [2] - 泄露源码揭示了多项核心设计,包括反蒸馏机制、精细化Prompt缓存管理、2592行Bash安全防护以及跨会话记忆整合机制 [2] - 韩国开发者用AI将核心架构移植为Python版本claw-code,该项目在2小时内获得超过5万Star,打破了GitHub历史纪录,并催生了多个改写与改进项目 [2] 谷歌发布成本更低的视频生成模型 - 谷歌DeepMind发布Veo3.1Lite视频生成模型,通过模型蒸馏与架构优化将成本降低超过一半,720p视频生成成本低至0.05美元/秒,1080p为0.08美元/秒 [3] - 此次发布恰逢OpenAI关停Sora,谷歌以成本优势作为差异化竞争策略,并同步下调了Veo3.1Fast模型的价格,4K视频生成成本降至0.30美元/秒 [3] - 该模型已集成至Gemini API与Google AI Studio,支持生成4至8秒的视频,并具备文本转视频和图像转视频的能力 [3] Claude Code上线宠物系统并出现漏洞 - Claude Code v2.1.89版本上线了Buddy宠物系统,用户输入/buddy即可孵化包含18种物种、稀有度机制和五大属性系统的专属虚拟宠物 [4] - 该系统采用Bones+Soul双层架构,骨架层用账户ID哈希确定不可更改的外观属性,灵魂层在本地存储并可重新生成宠物的性格和名字 [4] - 社区发现通过修改环境变量中的userID可以绕过accountUuid绑定,从而重新抽取宠物,暴力枚举脚本甚至可被用于定向获取指定稀有宠物 [4] OpenClaw新版本实现QQ原生接入 - OpenClaw发布v2026.3.31版本,内置了由腾讯轻量云协同QQ团队贡献代码的QQ Bot官方插件 [5] - 该插件支持QQ私聊及多媒体消息交互、多账号凭证管理、Slash命令、提醒和媒体消息收发,实现了嵌入式AI能力 [5] - 部署仅需三步,无需额外注册新平台,兼容常见消息类型,用户可在QQ中直接使用AI助手功能 [6] 可灵AI生成短片获得广泛传播 - 由可灵AI生成的清明主题短片《纸手机》全网播放量超过4000万次,并获得了央视新闻和人民日报的转发 [7] - 全片除一个纸板道具为实拍融合外,其余画面全部由可灵3.0 Omni生成,两位98年出生的创作者仅用三天时间完成制作 [7] - 创作者认为AI创作的核心在于真实生活观察与情感表达,并指出可灵AI在提示词理解和电影质感光影呈现方面已接近实拍需求 [7] 阿里通义发布新一代图像生成模型 - 通义发布Wan2.7-Image模型,采用生成与理解统一架构,支持虚拟形象捏脸定制、调色盘精准色彩迁移和最高3K token的超长文本渲染,并支持12种语言 [8] - 模型原生支持交互式编辑、多主体一致性(最高支持9张参考图)和组图生成(最多12张),适用于分镜脚本、电商套图等场景 [8] - 该模型在人类偏好盲测中评分优秀,基于更大规模数据训练的pro版本已同步上线 [8] Rokid展示AI驱动的全新交互模式 - Rokid创始人发布的AIUI演示视频引发业内关注,该模式允许用户通过纯自然语言与AI眼镜交互,AI可直接生成动态股价曲线、天气图像等可视化结果 [9] - AIUI以大模型Agent为中枢调用各类API,打破了传统App边界,将交互模式从“人找App”转变为“AI找人”,大幅缩短了交互路径 [9] - Rokid基于自研YodaOS操作系统和衍射光波导等技术,将于近期推送基于AIUI架构的OTA更新,行业预计2025年全球AI眼镜出货量将达到870万台 [9] 斯坦福团队提出自动化模型框架优化方法 - 斯坦福团队提出了名为Meta-Harness的方法,该方法能让Coding Agent自主迭代优化Harness框架,通过保留完整执行轨迹而非压缩摘要,带来了15个百分点的性能提升 [10] - 该方法在编程Agent任务中超越了人类手工方案,能自主发现环境自举等优化策略,在文本分类任务中仅需4次迭代即可匹配竞品40次迭代的效果 [10] - 该方法重新定义了模型能力与框架工程的关系,当Harness优化被自动化后,模型变强时框架会自动变薄,实现了“Build to Delete”的理念 [10] Sam Altman谈行业竞争焦点转变 - Sam Altman在BlackRock基础设施峰会上表示,新一代创业公司的关注重点已从招聘人数转向算力获取,工程团队计划实现两到三倍的交付增长 [11] - OpenAI的核心信念是让智能成为像电力一样的公用事业,公司愿意在收入到来前提前重投基础设施,其推理模型成本在16个月内下降了约1000倍 [12] - Altman预测,到2028年下半年,数据中心内的认知能力总量将超过外部,CEO等角色将越来越多地转变为监督AI系统工作并提供指导 [12]
What's Behind The Jump In Alphabet Stock?
Benzinga· 2026-04-01 03:13
公司产品与战略 - 谷歌发布Veo 3.1 Lite,这是一款面向开发者的经济型视频生成模型,能以低于Veo 3.1 Fast一半的成本提供相同的速度,支持720p和1080p的文本到视频和图像到视频生成[1] - 开发者可选择4秒、6秒或8秒的片段长度,价格相应调整,该模型已通过Gemini API付费层和Google AI Studio提供[2] - 谷歌宣布自4月7日起降低Veo 3.1 Fast的价格,旨在扩大AI视频工具的访问范围,并将更多开发者吸引至其生态系统[2] 股价表现与技术分析 - 谷歌股价在发布日上涨4.72%,报收于286.03美元[7] - 股价交易于其20日简单移动平均线(SMA)下方4.1%,位于其100日SMA下方8%,显示近期趋势仍承压[4] - 过去12个月股价上涨83.00%,股价位置更接近52周高点而非低点[4] - 相对强弱指数(RSI)为23.56,处于超卖区域,通常表明抛售压力可能过度[5] - 平滑异同移动平均线(MACD)为-8.6663,仍低于其信号线-5.8516,动量背景看跌[5] - 关键阻力位为311.00美元,关键支撑位为271.50美元[8] 行业与宏观环境 - 半导体和科技指数上涨2%至3%,因投资者对中东紧张局势可能缓和的迹象做出反应[3] - 有报道称,美国前总统特朗普暗示即使霍尔木兹海峡部分关闭,美国也可能结束对伊朗的军事行动,市场将此解读为局势可能降级的潜在步骤[3] 分析师观点与评级 - 该股获得“买入”评级,平均目标价为274.71美元[6] - UBS于2月12日给出“中性”评级,并将目标价上调至348.00美元[8] - Scotiabank于2月5日给出“行业跑赢大盘”评级,并将目标价上调至400.00美元[8] - JP Morgan于2月5日给出“超配”评级,并将目标价上调至395.00美元[8] - 分析指出,若股价能重新站上311.00美元阻力区,则其高估值倍数更容易被捍卫[7]
48小时“烧光”56万!三人创业团队濒临破产,仅因Gemini API密钥被盗:“AI账单远超我们的银行余额”
猿大侠· 2026-03-11 12:26
事件概述 - 一家墨西哥小型初创公司因Google Cloud API密钥泄露,在48小时内产生了82,314.44美元(约56.8万元)的Gemini API调用费用,而其正常月费仅为180美元(约1242元),费用飙升至正常水平的约455倍 [1][5] - 该公司仅有三名开发者,这笔意外账单可能直接导致公司破产 [7] 事件经过与处理 - 密钥在2025年2月11日至12日之间被泄露,具体原因不明 [4] - 攻击者利用被盗密钥疯狂调用Gemini 3 Pro的图像和文本接口,导致费用激增 [5] - 团队发现异常后,立即删除了被盗API密钥、禁用了Gemini接口、更换了所有访问凭证、全面启用双重验证并收紧IAM权限配置 [5] - 团队已向Google Cloud提交支持工单寻求帮助 [6] Google的回应与责任模型 - Google方面在沟通中提到了“Shared Responsibility Model(共享责任模式)”,即云平台负责基础设施安全,而账户和密钥管理由用户负责 [7] - 根据此原则,即便是密钥被盗导致的费用,也可能需要用户承担 [7] - 截至报道时,Google尚未明确说明是否会强制要求支付全部费用或承担部分损失 [7] 暴露的系统性安全漏洞 - 美国网络安全公司Truffle Security扫描发现,至少2863个Google API密钥原本只用于标识计费项目,现在却可直接用于Gemini API身份验证 [11] - 问题的根源在于Google Cloud使用同一种以“AIza...”开头的API Key格式来处理公开身份识别和敏感认证两种不同用途 [15] - 过去Google指导开发者将API Key安全地嵌入客户端代码(如HTML中),并明确其并非机密信息,设计初衷是项目标识符和用于计费 [16][18][19] - 但当用户在Google Cloud项目中启用Gemini API时,该项目中现有的API Key(包括已公开嵌入网站的Key)会在无任何警告或通知的情况下,自动获得访问敏感Gemini端点的权限 [21] - 这导致了两个核心问题:权限溯源扩张(Retroactive Privilege Expansion)和默认配置不安全(Insecure Defaults)[23] - 结果是成千上万原本无害的计费API Key,变成了公开网络上的Gemini凭证,攻击者仅需从公共网页抓取Key即可实施攻击,访问私有数据并造成账单激增 [24][25][32] 漏洞披露与修复进展 - Truffle Security早在2025年11月就向Google漏洞披露项目提交了报告,但当时Google将其认定为“预期行为” [27] - 2025年12月1日,研究人员提交了来自Google自身基础设施的案例后,Google才重新评估,将问题归类为“系统漏洞”并提高了严重等级 [27] - 截至2026年2月2日,Google反馈仍在研究和努力修复问题 [28] - 随着90天漏洞披露窗口期结束,Truffle Security公开了此问题,并表示尚未看到任何“具体结果” [29] 开发者社区的疑问与讨论 - 受害开发者质疑Google Cloud为何没有在费用出现极端增长(如48小时从180美元到8.2万美元)时触发基本的异常保护机制,例如自动停止服务、要求额外确认或暂时冻结账户 [8][9][10] - 社区讨论排除了事件与“氛围编码”等自动生成代码工具泄露密钥的关联 [30] - 有开发者建议受害公司坚持联系Google寻求解决 [31]
48小时“烧光”56万!三人创业团队濒临破产,仅因Gemini API密钥被盗:“AI账单远超我们的银行余额”
猿大侠· 2026-03-08 12:12
事件概述 - 一家墨西哥小型初创公司因API密钥被盗,在48小时内产生了82,314.44美元(约56.8万元)的Gemini API费用,较其正常的月费约180美元(约1242元)暴涨近46000%,相当于正常月费的约455倍 [1][5] - 该公司仅有三位开发者,此次天价账单对其构成生存威胁,若被要求支付部分费用也可能导致公司直接破产 [1][7] 事件经过与处理 - 该公司的Google Cloud API密钥在2月11日至12日之间被泄露,攻击者利用该密钥疯狂调用Gemini 3 Pro的图像和文本接口,导致费用激增 [4][5] - 发现异常后,团队立即删除了被盗的API密钥,禁用了Gemini相关接口,更换了所有访问凭证,全面启用双重验证,并收紧IAM权限配置 [5] - 团队已向Google Cloud提交支持工单寻求官方协助,但尚未获得费用减免的明确承诺 [6][7] 谷歌的回应与责任模型 - 谷歌在沟通中提到了“Shared Responsibility Model(共享责任模式)”,即云平台负责基础设施安全,而账户和密钥管理由用户自行负责 [7] - 根据此原则,即便是密钥被盗导致的调用费用,也可能需要用户承担 [7] - 截至事件发生时,谷歌尚未明确说明是否会强制要求支付全部费用或承担部分损失 [7] 安全机制与设计缺陷 - 开发者质疑谷歌云缺乏基本的异常保护机制,例如在使用量或费用出现极端异常增长时,没有自动停止服务、要求额外确认或暂时冻结账户的机制 [8][9] - 问题的技术根源在于,谷歌云使用同一种以“AIza...”开头的API Key格式来处理两种不同用途:公开身份识别和敏感认证 [15] - 谷歌长期以来告知开发者API密钥可安全嵌入客户端代码,Firebase安全清单和Google Maps JavaScript文档均指导开发者将API密钥公开使用,因其设计初衷是项目标识符和计费用途,而非认证凭证 [16][18][19] - 关键缺陷在于:当在一个Google Cloud项目中启用Gemini API时,该项目中**现有**的所有API密钥(包括那些已公开嵌入在网站代码中的密钥)会在没有任何警告或通知的情况下,自动获得访问敏感Gemini端点的权限,这被称为“权限溯源扩张” [21][24] - 新创建的API密钥默认状态为“无限制”,意味着它立即对项目中所有已启用的API(包括Gemini)有效,此默认配置被认为不安全 [24] 漏洞的普遍性与影响 - 网络安全公司Truffle Security的扫描发现,至少有2863个Google API密钥(原本仅用于标识计费项目)暴露在外,并可直接用于Gemini API身份验证 [11] - 攻击者获取此类密钥后,可访问账户中的上传文件和缓存数据,并不断消耗API配额,将所有计算费用转嫁给密钥拥有者 [11] - 攻击者可以轻易从公共网页(如嵌入了Google Maps的网站)源代码中抓取API密钥,无需接触受害者基础设施即可发起攻击,导致受害者面临私有数据泄露、账单费用激增(每天可能产生数千美元)以及服务配额耗尽的风险 [25][31] 漏洞披露与修复进展 - Truffle Security早在2025年11月就已向谷歌的漏洞披露项目提交报告,但当时谷歌将其认定为“预期行为” [27] - 2025年12月1日,研究人员提交了一个来自谷歌自身基础设施的暴露密钥案例后,谷歌才重新评估,将问题归类为“系统漏洞”并提高了严重等级 [27] - 截至2026年2月2日,谷歌向研究人员反馈仍在研究和努力修复问题 [28] - 随着90天漏洞披露窗口期结束,Truffle Security公开了此问题,并表示尚未看到任何“具体结果” [29]
全年维度看好AI的价值落地与商业化
中国能源网· 2026-02-24 09:56
核心观点 - 2026年是AI走向价值落地和商业化的关键年,商业化成为大模型公司的核心命题 [1][3] - 2026年多模态模型有望迎来“DS时刻”,在能力提升的同时实现成本大幅下降,推动相关应用领域繁荣 [4][5] 市场回顾 - 报告期内(2026.2.9-2026.2.13),沪深300指数上涨0.36%,计算机指数上涨4.35% [2] AI价值落地与商业化 - Anthropic被视为商业化速度最快的大模型企业之一,其G轮融资300亿美元,估值达3800亿美元 [1][3] - Anthropic的年度经常性收入(ARR)增长迅速,从2023年底的1亿美元,提升至2024年底的10亿美元,截至2026年2月已达140亿美元 [3] - Claude Code是其最大增长引擎,ARR已突破25亿美元,2026年初以来企业订阅量激增4倍,企业客户贡献营收占比已超过一半 [3] - Claude的应用正从编程向金融分析、数据建模、销售、网络安全、科研发现等关键领域拓展 [3] - OpenAI近期解散其内部“使命对齐”团队,并将算力支出目标下调至6000亿美元,预计到2030年总营收将超过2800亿美元,消费者与企业业务贡献大致相当,显示出从AGI理想转向商业优先的迹象 [3] 多模态模型发展 - OpenAI在2024年2月推出初代Sora模型,被视为视频领域的“GPT 1时刻”;2025年9月底推出Sora2,迎来“GPT3.5式突破” [4] - 谷歌于2025年10月16日在Gemini API中发布Veo3.1和Veo3.1Fast付费预览版,在音频支持、叙事控制及质感还原方面进行重大升级 [4] - 2026年2月5日,可灵AI全球上线3.0系列模型;2月7日,Seedance2.0正式上线,能生成1080p广播级标准视频 [4] - 借鉴DeepSeek开源与成本优势驱动文本大模型普及的经验,多模态模型有望在2026年迎来类似时刻,能力提升伴随成本端大幅下降,从而推动影视、游戏、广告等内容创意领域繁荣 [4][5] 投资建议 - 报告维持两个关键判断:2026年是AI价值落地和商业化关键年;多模态模型有望迎来“DS时刻” [5] - AI应用推荐公司包括:金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等 [5] - AI应用受益标的包括:泛微网络、福昕软件、汉得信息、万兴科技、第四范式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等 [5] - 多模态领域受益标的包括:万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司、阜博集团等 [5]
周观点:全年维度看好AI的价值落地与商业化-20260223
开源证券· 2026-02-23 15:56
报告投资评级 - 行业投资评级:看好(维持) [1] 报告核心观点 - 核心观点一:2026年是AI走向价值落地和商业化的关键年,商业化成为大模型公司的核心命题 [4][10] - 核心观点二:2026年多模态模型有望迎来“DS时刻”,即在能力提升的同时实现成本大幅下降,推动影视、游戏、广告等内容创意领域繁荣 [5][11] - 市场回顾:2026年2月9日至2月13日期间,沪深300指数上涨0.36%,计算机指数上涨4.35% [3][13] 周观点:全年维度看好AI的价值落地与商业化 - **AI商业化加速**:全球AI发展已从模型混战进入应用探索阶段 [4][10] - **标杆公司表现**:Anthropic被认为是商业化最快的大模型企业之一,其G轮融资300亿美元,估值达3800亿美元 [4][10] - **收入增长迅猛**:Anthropic的年度经常性收入(ARR)从2023年底的1亿美元,增长至2024年底的10亿美元,截至2026年2月已达140亿美元 [4][10] - **核心增长引擎**:Claude Code的ARR已突破25亿美元,2026年初以来企业订阅量激增4倍,企业客户贡献营收占比超一半 [4][10] - **应用领域拓展**:Claude正从编程向金融分析、数据建模、销售、网络安全、科研发现等关键领域拓展 [4][10] - **行业战略转向**:OpenAI解散内部“使命对齐”团队,并将算力支出目标从1.4万亿美元下调至6000亿美元,预计2030年总营收超2800亿美元,表明其从AGI理想转向商业优先 [4][10][31] 多模态模型进展 - **发展历程**:OpenAI的Sora模型在2024年2月推出是视频领域的“GPT-1时刻”,2025年9月底的Sora 2则是“GPT-3.5式突破” [5][11] - **竞品迭代**:2025年10月16日,谷歌发布Veo 3.1和Veo 3.1 Fast付费预览版,带来音频支持、叙事控制等升级 [5][11] - **国内模型发布**:2026年2月5日,可灵AI全球上线3.0系列模型;2月7日,Seedance 2.0正式上线,能生成真正的1080p广播级视频 [5][11] - **技术突破**:Seedance 2.0具备音视频同步、多镜头叙事、流畅运动合成及卓越的提示词遵循能力 [11] - **成本与普及**:DeepSeek的开源与成本优势驱动文本大模型普及,预计多模态模型将迎来“DS时刻”,实现能力提升与成本下降 [5][11] 投资建议 - **维持两大判断**:一是2026年是AI价值落地和商业化关键年;二是多模态模型将迎来“DS时刻” [6][12] - **AI应用推荐标的**:包括金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等 [6][12] - **AI应用受益标的**:包括泛微网络、福昕软件、汉得信息、万兴科技、第四范式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等 [6][12] - **多模态领域受益标的**:包括万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司、阜博集团等 [6][12] 公司动态 - **业绩快报**: - 光云科技:2025年度预计营业收入56,538.06万元,同比增长18.33%;归母净利润-2,638.02万元,同比减亏67.85% [14] - 国网信通:预计营业总收入1,062,782.05万元,同比增长1.99%;归母净利润67,820.02万元,同比下降16.91% [14] - 中控技术:预计营业总收入805,062.53万元,同比减少11.90%;归母净利润45,009.58万元,同比减少59.70% [15] - 莱斯信息:预计营业总收入127,353.29万元,同比下降20.89%;归母净利润5,523.29万元,同比下降57.20% [15] - 金橙子:预计营业收入25,339.82万元,同比增长19.46%;归母净利润3,726.47万元,同比增长22.20% [15] - **投资与并购**: - 盛视科技:拟投资2亿元设立全资子公司深圳盛信投资 [16] - 恒为科技:拟出资3500万元(占比20%)参与设立规模1.75亿元的创业投资基金 [16] - 银信科技:拟出资510万元(持股51%)设立合资公司 [16] - 拓尔思:拟以2120万元认购深圳星连荣基创业投资基金份额,基金规模2.1201亿元 [17] - **股权激励**: - ST迪威迅:发布2026年股票期权激励计划(草案),拟授予第一类限制性股票2725.49万股,占公司总股本7%,授予价格每股2.55元 [18] - 智莱科技:发布第一期员工持股计划(草案),筹集资金总额不超3860万元,考核目标为以2024年营收为基数,2026/2027年营收增长率不低于45%/65% [19] - **其他公告(股东减持)**: - 焦点科技:三位高管计划合计减持不超过143,760股 [20] - 捷顺科技:实际控制人计划减持不超过1791万股,占公司总股本不超过2.80% [21] - 千方科技:大股东计划减持不超过2365.0697万股,占公司总股本(剔除回购股份)1.50% [21] - 岩山科技:两位高管计划合计减持不超过1690.31万股 [22][23] 行业动态 - **国内要闻**: - 腾讯元宝在春节活动期间日活跃用户突破5000万,月活跃用户达1.14亿 [24] - 月之暗面Kimi即将完成新一轮超7亿美元融资,由阿里、五源等老股东联合领投 [25] - 宇树科技创始人预计2026年公司人形机器人目标出货量在1-2万台左右 [26] - 豆包通过春晚送出超10万份科技好礼和现金红包,AI总互动达19亿次 [27] - 阿里正式发布全新一代多模态大模型千问Qwen3.5-Plus,以不到40%参数量达到顶尖性能 [28][29] - 豆包大模型2.0正式发布,包含Pro、Lite、Mini三款通用Agent模型和Code模型 [30] - **海外要闻**: - OpenAI预计2030年总营收将超2800亿美元,并将算力建设支出计划从1.4万亿美元修正至6000亿美元 [31] - NASA“阿耳忒弥斯2号”载人绕月任务因技术问题推迟,原定3月发射取消 [32] - Google曝光Gemini 3.1 Pro模型,在ARC-AGI-2推理基准测试中得分为77.1%,较Gemini 3 Pro的31.1%大幅提升,且定价不变 [33] - 英伟达拟斥资约300亿美元投资OpenAI,取代此前宣布的1000亿美元合作计划 [34]
Gemini 3 Deep Think 发布:1张草图直接获得3D模型
新浪财经· 2026-02-13 09:19
产品发布与定位 - Google宣布对Gemini 3 Deep Think进行重大升级,这是一款专为解决科学、研究和工程挑战而设计的推理模型[1][15] - 该模型旨在弥合深奥科学理论与日常工程应用之间的鸿沟,核心在于“深度思考”能力的进化,着重解决缺乏明确边界、数据混乱或不完整的复杂问题[1][16] - 目前,Google AI Ultra订阅用户已可在Gemini App中使用该更新版本,同时Google首次向选定的研究人员、工程师和企业开放了Gemini API的Deep Think早期访问权限[1][15] 核心性能与基准测试 - 在“Humanity‘s Last Exam”基准测试中,该模型在不使用额外工具的情况下达到了48.4%的准确率,树立了新的行业标准[1][16] - 在ARC-AGI-2测试中,该模型取得了84.6%的前所未有的高分,这一成绩在通用人工智能推理领域具有重要意义[2][4][16] - 在Codeforces编程挑战中,该模型的Elo等级分高达3455分[4][18] - 在2025年国际数学奥林匹克竞赛中达到了金牌水平[4][18] - 根据基准测试表格,该模型在多项测试中领先于竞争对手,如在MMMU-Pro测试中得分为81.5%,高于Claude Opus 4.6的73.9%和GPT-5.2的79.5%[13][26] 科研与工程应用实例 - 罗格斯大学的数学家将该模型应用于高能物理数学结构审查,成功识别出一篇高度技术性数学论文中此前未被人类发现的微妙逻辑漏洞,该发现对于连接爱因斯坦引力理论与量子力学具有潜在价值[5][18] - 杜克大学的Wang Lab利用该模型优化了复杂晶体生长的制造方法,成功设计出了一套生长大于100微米薄膜的配方,解决了以往方法难以应对的挑战[6][18] - 该模型展示了将手绘草图转化为实体对象的能力,用户提供草图后,模型可分析图纸、建立复杂3D形状模型并生成可直接用于3D打印的文件,大幅压缩从概念到物理原型的转化过程[8][10][19][21][23] 跨学科能力表现 - 该模型在化学和物理等广泛科学领域表现出色,在2025年国际物理奥林匹克和化学奥林匹克的笔试部分均达到了金牌水平[12][25] - 在针对高级理论物理的CMT-Benchmark测试中,获得了50.5%的分数,显示出处理复杂科学领域的熟练度[13][26] - 根据基准测试表格,该模型在国际化学奥林匹克竞赛理论部分得分为82.8%,在国际物理奥林匹克竞赛理论部分得分为87.7%[13][26] 行业影响与趋势 - 此次更新标志着AI模型正从通用的聊天助手,加速向专业的科研与工程辅助工具转型[14][27]
Gemini API暴涨140%!谷歌商业化狂飙,直面挑战OpenAI
格隆汇· 2026-01-20 16:47
Gemini系列模型商业化突破 - 自2025年3月Gemini 2.5发布至8月,其API调用量从350亿次飙升至850亿次,增长超过140% [1] - Gemini企业版已覆盖1500家公司,积累800万订阅用户,线上注册用户突破100万 [1] - 公司计划在2025年第四季度财报中重点强调Gemini企业版的增长表现 [1] AI战略与生态布局 - 公司确立了“模型迭代+生态融合”的双线战略,Gemini模型在两年内从1.0快速迭代至3.0版本 [3] - 公司将Gemini模型深度嵌入Workspace、搜索等核心产品,并通过生态合作扩大覆盖范围 [3] - 2025年1月12日,公司与苹果达成协议,下一代苹果基础模型将基于Gemini构建,苹果每年支付10亿美元“租金” [3] - 客户在AI领域的投入往往会带动其对谷歌云存储、数据库等其他产品的采购,助推云核心服务器销售业务增长 [3] 业务表现与增长动能 - 2025年第三季度,谷歌云营收达151.57亿美元,同比增长34% [6] - 同期,谷歌云AI相关收入达“每季度数十亿美元”规模,云业务订单积压环比激增46%至1550亿美元 [6] - 广告业务仍是主要收入来源,第三季度总营收达到741.82亿美元,同比增长12.6% [8] - 公司正在其AI购物工具中引入新的个性化广告功能,以超越传统搜索广告框架 [8] 市场竞争与行业格局 - 当前AI行业处于“有史以来最激烈的竞争时期”,公司需直面OpenAI、亚马逊、Anthropic等玩家的挑战 [9] - OpenAI近期宣布将在其免费及低档付费服务中引入广告 [9] - 谷歌云增速(34.4%)领先行业,正式确立全球云服务“三足鼎立”格局 [15] 公司全栈AI体系与增长模式 - 公司构建了从自研芯片(TPU)到应用端(Search/Cloud)的垂直整合全栈AI体系 [14] - 增长动能正由单一广告驱动转向“云业务 + 通用大模型 + 广告赋能”的三位一体增长模式 [14] - AI提升变现效率与经营效率,推动万亿市值基数上的价值增长 [14] 各业务板块营收表现 - 谷歌服务(Google Services)2025年第三季度营收871亿美元,同比增长14% [16] - 谷歌云(Google Cloud)同期营收151.6亿美元,同比增长34.9%,营业利润率攀升至23.7% [16] - 其他业务(Other Bets)同期营收3.88亿美元,同比增长31% [16] 核心竞争壁垒 - 算力主权:大规模部署自研TPU芯片(如v7),降低对外部GPU依赖并优化推理成本 [17] - 生态协同效应:拥有全球30亿+用户的产品矩阵,为Gemini提供闭环的训练数据与分发网络 [17] - 企业级AI粘性:Vertex AI平台深度集成Gemini能力,积压订单预示长期增长确定性 [17]