大模型商业化周报：海外模型定价重构-20260406

报告行业投资评级 - 行业评级为“看好”，且为“维持” [2] 报告的核心观点 - 本周大模型行业延续“密集发布+定价重构”的双线节奏 [1] - 供给端，厂商产品快速迭代，并构建从模型层到基础设施层的商业化闭环 [2] - 需求端，付费模式整体趋势指向从订阅/席位制向按实际消耗量迁移，以适配Agent场景下用量波动较大的特征 [2] 国内厂商动态 - 通义（阿里巴巴）：一周内密集发布三款模型。Qwen 3.6 Plus发布当日平台日调用量突破1.4万亿Token，刷新OpenRuter单日单模型调用纪录 [2]。Qwen3.5-Omni在多项多模态评测中超越Gemini-3.1 Pro [2]。Wan2.7-Image尝试用单一模型覆盖图像生成全链路场景 [2] - 智谱：发布首个多模态Coding基座模型GLM-5V-Turbo，深度适配Agent工作流 [2]。2025年全年实现收入7.24亿元，同比增长131.9% [2]。其中云端部署收入1.90亿元，同比增长292.6%；本地化部署收入5.34亿元，同比增长102.3% [2]。MaaS平台注册用户突破400万，付费开发者（Coding Plan）达24.2万 [2]。中国前十大互联网公司中已有9家深度集成GLM系列模型 [2]。3月推出的Claw Plan上线2天订阅用户破10万，上线20天破40万 [2]。2026年2月主动上调Coding Plan价格30%，MaaS平台API调用定价较2025年底提升83% [2] - MiniMax与Kimi（月之暗面）：本周均未有重要产品发布 [2] 国外厂商动态 - Anthropic：自4月4日起调整订阅政策，第三方工具调用权限从订阅中剥离，用户需单独购买额度包或使用API Key [2]。因代码泄露，曝光了包括24小时自主代理KAIROS和AI电子宠物BUDDY在内的多项未发布功能 [2] - OpenAI：完成1,220亿美元最新融资，投后估值达8,520亿美元，并首次从个人投资者处筹集资金 [2]。Codex更新定价策略，新增按用量计费并下调团队年费 [2] - Google：开源Gemma 4家族，其中31B模型在Arena AI排行榜排名第3，26B模型排名第6 [3]。推出Veo 3.1 Lite视频生成模型，定价为0.05美元/秒（720p），仅为标准版的1/8 [3]。推出Gemini Flex/Priority推理分层，Flex API定价为标准API的50%，Priority API则上浮75–100% [3]