2Q26大模型发展复盘及展望:关注算力利用效率提升及差异化定价能力
招银国际·2026-07-03 20:55

行业投资评级 - 报告未明确给出整体行业投资评级,但推荐了具体股票 [1] 核心观点 - 大模型行业竞争加剧,模型能力上界持续提升,Claude Fable 5和智谱GLM-5.2是国际与国内的代表 [1][6] - 行业演进围绕两大趋势:深化编程/办公智能体能力探索,以及持续优化推理调用价格及性价比以提升模型调用渗透 [1][6] - 模型能力上界是决定定价能力的关键,行业玩家将通过全栈能力优化推动成本优化 [1] - 在应用端,编程场景竞争将加剧,但龙头厂商或能维持领先地位;完全自治的智能体系统是行业探索方向 [1][8] - 全球AI Token消耗量将呈指数级增长,预计2030年全球月均AI Token消耗量将超过26万万亿,2025-2030年复合增速107%,其中Agent场景是核心驱动力,预计2030年月均消耗超21万万亿,占比约84% [4][48] - 建议关注三条主线投资机会:基础设施云厂商和头部基础模型厂商;头部编程/办公/企业AI Agent应用厂商;头部多模态模型与多模态AI应用厂商 [4][49] 行业发展趋势:模型能力迭代加速,Fable推升智能能力上界 - 2Q26基础模型智能能力竞争加剧,Claude Fable 5推升行业智能能力上界,智谱GLM5.2助力中国厂商维持开源模型优势地位 [6] - 行业演进三大趋势:深化编程/办公智能体能力探索;持续优化推理调用价格及性价比;基于性价比优势,中国模型已成为全球AI Token主要供应商 [6] - 在OpenRouter平台,截至6月22日当周,DeepSeek以6.7万亿tokens居首位,高于Anthropic的4.25万亿;小米、MiniMax、智谱等中国厂商合计占比高 [8][53] 大语言模型:模型能力快速迭代,Claude领跑全球,智谱位居中国前列 - 根据Artificial Analysis智能能力指数,截至2026年7月1日,行业综合能力领先模型为Claude Fable 5 (60分)和Claude Opus 4.8 (56分),智谱GLM 5.2 (51分)位列中国厂商第一 [11][14] - 闭源模型智能能力仍领先开源模型,但开源模型的智谱GLM-5.2 (51分)、MiniMax-M3 (44分)、DeepSeek V4 Pro (44分)处于行业领先水平 [16] - 在智能体能力方面,国际领先为Anthropic Claude系列,国内领先为智谱Z.AI GLM-5.2、DeepSeek V4 Pro、MiniMax M3 [20] - 在编程能力方面,国际领先为Anthropic Claude Fable 5/Opus 4.8和OpenAI GPT 5.5,国内智谱GLM-5.2排名第一 [7][23] 行业趋势:关注算力利用效率提升,而智能能力仍是模型定价水平的决定性因素 - AI算力效率改善通过硬件端芯片升级、软件端优化、国产模型架构创新、调度与基础设施优化等多环节推进 [27] - 主要模型厂商降本路径各有侧重:国产厂商如DeepSeek、智谱、MiniMax主要依托模型架构层与训练系统优化;海外厂商如Anthropic、OpenAI更多在API与产品层及自研芯片上优化 [27][28] - 芯片升级推动效率改善,英伟达Vera Rubin平台系统推理吞吐量较前代提升最高35倍;OpenAI与博通推出的Jalapeño芯片可节省约50%成本 [30] - 软件栈与算子优化提升硬件产出,英伟达通过优化CUDA软件使系统性能最高提升5倍;微软通过优化使Copilot常用模型推理吞吐提升40%,自研图像模型GPU利用效率最高提升260% [31] - 国产模型通过架构创新压低成本,DeepSeek V4的混合注意力机制将长文本单token推理FLOPs和KV cache降至V3.2的10%-27%和7%-10%;MiniMax M3在100万token上下文时单token计算量仅为M2的约1/20 [32][33] - 系统调度优化提升资源利用率,华为云CCE VolcanoNext提升资源利用率超30%;阿里巴巴平头哥GPU超60%算力服务外部客户;Cloudflare将GPU利用率提升至70%-80% [34] - 在算力成本优化推动下,2Q26不同智能能力区间模型推理成本均下降,其中智能能力指数40-50区间的最优模型调用价格从2026年3月的约1.2美元/百万tokens降至2026年6月的约0.058美元/百万tokens,降幅约95%;智能能力指数50-60区间的最优模型调用价格从约2.175美元/百万tokens降至约0.902美元/百万tokens,降幅约58.5% [35] - 强智能能力模型仍可持续维持较高定价,模型智能能力是定价水平的决定性因素 [35] - 从成本效率看,DeepSeek V4 Pro、DeepSeek V4 Flash、MiniMax M3、小米MiMo-V2.5-Pro处于最具吸引力的象限 [40] 行业探索最新进展:长程工作水平演进,编程与多模态操作能力强化 - 以真实工作流执行为导向的智能体能力成为本轮大模型迭代核心方向,并向长程智能体演进 [43] - 能力演进三大趋势:强化长程工具调用与执行连贯性;重点提升编程与工程执行能力;强化原生多模态理解并向真实操作场景延伸 [43] - 各厂商最新旗舰模型在长上下文、编程、多模态等方面均有显著升级,上下文窗口普遍达到1M tokens [44][46][47] 大语言模型调用量:2Q26 token消耗持续上升,中国开源模型贡献主要增量 - 测算显示全球月均AI Token消耗量将在2030年超过26万万亿,2025-2030年复合增速107% [48] - 增长驱动力:模型智能水平提升带动用户规模及粘性;多模态输入/输出占比提升推动单次prompt的token消耗量增加;底层模型能力提升+Harness框架完善带动Agent产品渗透率提升 [4][48] - Agent场景是2025-2030年Token消耗量增长核心驱动力,预计2030年全球Agent场景月均Token消耗量将超过21万万亿,2025-2030年复合增速165%,占全球AI Token消耗量约84% [4][48] - 短期看,OpenRouter平台周度token调用量持续上升,截至2026年6月15日当周总调用量为46.66万亿tokens,较一年前增长约22倍 [52] - 2Q26增速加快,平台周度调用量从4月初约21万亿升至6月15日的46.66万亿,单季约翻倍 [52] - 中国开源模型贡献主要增量,截至6月22日当周,DeepSeek以6.7万亿tokens居平台首位,中国厂商合计调用量已明显超过美国厂商 [53] 图像模型仍由海外厂商领跑,但视频赛道中国厂商更具优势 - 图像模型功能演进转向工作流执行,重点包括多轮编辑和可控性增强,以及进一步嵌入创意生产流程 [57] - 文生图领域,海外厂商如OpenAI、Microsoft、Google等领先,中国厂商智象未来HiDream O1 Image 1.5具备强竞争力 [58] - 视频模型功能演进趋势:强调更强的镜头可控性与角色一致性;原生音视频一体化推进;高清化与生产级输出能力提升 [60] - 文生视频领域,中国厂商阿里巴巴HappyHorse-1.0、字节跳动Seedance 2.0、快手可灵3.0形成行业第一梯队,美国厂商由xAI、Runway领先 [61] - 图生视频领域,字节跳动即梦Dreamina- Seedance 2.0 720p位居行业第一,多个中国厂商形成第一梯队 [65] 龙头基础模型平台模型及业务进展更新 海外AI基础模型平台:ARR竞赛持续,Anthropic增长领跑,进入IPO筹备阶段 - 2Q26海外AI平台格局边际变化:Anthropic ARR在5月反超OpenAI;Anthropic和OpenAI先后开启IPO筹备;xAI/SpaceX以算力租赁形式打开新收入曲线 [68] - Anthropic ARR已达约470亿美元,超过OpenAI的约250亿美元,预计2Q26实现首个盈利季度 [69][70] - 三家龙头估值体系转向公开市场:SpaceX(合并xAI)已上市;Anthropic以9650亿美元估值保密递交IPO;OpenAI已提交保密S-1 [71] - 基础模型后续关注点:模型迭代与智能能力提升;Anthropic 2Q26运营盈利兑现;商业化节奏和创新业务探索 [71] Anthropic进展 - ARR从2025年底约90亿美元提升至2026年5月中约470亿美元,企业收入占比80% [74] - Claude Code年化收入规模已超过25亿美元,企业订阅自年初增长4倍 [75] - 发布Claude Fable 5 / Mythos 5,API定价较Mythos Preview减半,在多项基准上达到SOTA [77] - 发布Claude Sonnet 5,智能体能力显著提升,定价低于Opus 4.8 [78] - 与xAI(SpaceX)算力租赁合作缓解GPU瓶颈 [79] - 推理毛利率已从上年的38%提升至70% [79] OpenAI进展 - 用户规模领先,ChatGPT App MAU达10亿,周活9亿+,付费消费者订阅5000万+ [80] - 发布GPT-5.6,旗舰模型Sol在Terminal-Bench 2.1达到88.8% [81] - 收入结构多元化,Codex与广告打开第二增长曲线,广告pilot在不到6周内达1亿美元ARR [82] - 现金消耗仍在扩大,每1美元收入对应约1.22美元亏损 [82] - 已提交保密IPO申请 [83] xAI进展 - 并入SpaceX完成上市,市场以“生态+算力”逻辑定价 [84] - 收入与亏损同步扩大,1Q26收入8.18亿美元,运营亏损24.7亿美元 [85] - 算力租赁成为新收入曲线,Anthropic按月支付12.5亿美元租赁其算力 [86] 重点覆盖公司2Q26 AI业务进展更新及催化展望 - 微软:将Copilot从单点应用升级为平台化架构,深化Agent业务发展布局 [5] - 谷歌:全栈AI策略支撑AI相关业务强劲增长 [5] - 亚马逊:关注AWS营收同比增长环比加速趋势 [5] - Meta:持续推动C端AI应用落地 [5] - 腾讯:关注微信AI智能体进展 [5] - 阿里巴巴:组织架构重构与AI入口升级 [5] - 快手:外部融资释放可灵价值 [5] 股票推荐 - 中国互联网板块推荐:阿里巴巴(BABA US)、腾讯(700 HK)、快手(1024 HK) [1] - 美国互联网板块推荐:微软(MSFT US)、谷歌(GOOG US)、亚马逊(AMZN US) [1]

2Q26大模型发展复盘及展望:关注算力利用效率提升及差异化定价能力 - Reportify