大模型商业化周报：海外模型定价重构

行业投资评级 - 行业评级为“看好”，且维持此评级 [2] 报告核心观点 - 大模型行业延续“密集发布+定价重构”的双线节奏 [1] - 供给端，国内外厂商产品快速迭代，覆盖全模态、图像生成、高性能基座及开源模型，并构建从模型层到基础设施层的商业化闭环 [2] - 需求端，领先厂商的付费与计费结构整体趋势指向从订阅/席位制向按实际消耗量迁移，以更好适配Agent场景下用量波动较大的特征 [2] 国内厂商动态总结 - 通义（阿里巴巴）：一周内密集发布三款模型，产品迭代迅速 [2] - Qwen 3.6 Plus作为新一代基座模型，发布当日平台日调用量突破1.4万亿Token，刷新OpenRuter单日单模型调用纪录 [2] - Qwen3.5-Omni在多项多模态评测中超越Gemini-3.1 Pro [2] - Wan2.7-Image尝试用单一模型覆盖图像生成全链路场景 [2] - 综合来看，通义在模型层的产品节奏和生态拉动能力在国内头部厂商中处于较领先位置 [2] - 智谱：发布首个多模态Coding基座模型GLM-5V-Turbo，深度适配Agent工作流 [2] - 2025年全年实现收入7.24亿元，同比增长131.9% [2] - 云端部署收入1.90亿元，同比增长292.6% [2] - 本地化部署收入5.34亿元，同比增长102.3% [2] - 用户生态覆盖全球218个国家和地区，MaaS平台注册用户突破400万，付费开发者（Coding Plan）达24.2万 [2] - 中国前十大互联网公司中已有9家深度集成GLM系列模型 [2] - 3月推出的Claw Plan上线2天订阅用户破10万，上线20天订阅用户破40万 [2] - 2026年2月主动上调Coding Plan价格30%并取消首购优惠，MaaS平台API调用定价较2025年底提升83%，市场呈现供不应求态势，量价齐升趋势显现 [2] - MiniMax与Kimi（月之暗面）：本周均未有重要产品发布 [2] 国外厂商动态总结 - Anthropic：自4月4日起调整订阅政策，第三方工具调用权限从订阅中剥离，用户需单独购买额度包或使用API Key [2] - 因代码意外泄露，曝光了包括24小时自主代理KAIROS和AI电子宠物BUDDY在内的多项未发布功能 [2] - 泄露代码显示其技术栈融合了Prompt Engineering、Context Engineering和Harness Engineering三层范式，公司正从模型能力提供商向端到端Agent平台方向持续探索 [2] - OpenAI：完成1,220亿美元最新融资，投后估值达8,520亿美元，并首次从个人投资者处筹集资金，该估值水平已接近部分全球头部科技公司市值 [2] - 产品端，Codex更新定价策略，新增按用量计费并下调团队年费，与Anthropic的调整方向趋同 [2] - Google：以三条线同步推进，构建商业化闭环 [2] - Gemma 4开源家族覆盖四种规格，其中31B模型在Arena AI排行榜排名第3，26B模型排名第6，超越了20倍于其大小的模型 [3] - Veo 3.1 Lite以0.05美元/秒（720p）的价格切入视频生成市场，仅为标准版的1/8 [3] - 推出Gemini Flex/Priority推理分层，Flex API定价为标准API的50%，Priority API则上浮75–100%，为不同场景提供成本与延迟之间的显性权衡 [3]