报告行业投资评级 - 行业评级为“看好”,且为“维持” [2] 报告的核心观点 - 本周大模型行业延续“密集发布+定价重构”的双线节奏 [1] - 供给端,厂商产品快速迭代,并构建从模型层到基础设施层的商业化闭环 [2] - 需求端,付费模式整体趋势指向从订阅/席位制向按实际消耗量迁移,以适配Agent场景下用量波动较大的特征 [2] 国内厂商动态 - 通义(阿里巴巴):一周内密集发布三款模型。Qwen 3.6 Plus发布当日平台日调用量突破1.4万亿Token,刷新OpenRuter单日单模型调用纪录 [2]。Qwen3.5-Omni在多项多模态评测中超越Gemini-3.1 Pro [2]。Wan2.7-Image尝试用单一模型覆盖图像生成全链路场景 [2] - 智谱:发布首个多模态Coding基座模型GLM-5V-Turbo,深度适配Agent工作流 [2]。2025年全年实现收入7.24亿元,同比增长131.9% [2]。其中云端部署收入1.90亿元,同比增长292.6%;本地化部署收入5.34亿元,同比增长102.3% [2]。MaaS平台注册用户突破400万,付费开发者(Coding Plan)达24.2万 [2]。中国前十大互联网公司中已有9家深度集成GLM系列模型 [2]。3月推出的Claw Plan上线2天订阅用户破10万,上线20天破40万 [2]。2026年2月主动上调Coding Plan价格30%,MaaS平台API调用定价较2025年底提升83% [2] - MiniMax与Kimi(月之暗面):本周均未有重要产品发布 [2] 国外厂商动态 - Anthropic:自4月4日起调整订阅政策,第三方工具调用权限从订阅中剥离,用户需单独购买额度包或使用API Key [2]。因代码泄露,曝光了包括24小时自主代理KAIROS和AI电子宠物BUDDY在内的多项未发布功能 [2] - OpenAI:完成1,220亿美元最新融资,投后估值达8,520亿美元,并首次从个人投资者处筹集资金 [2]。Codex更新定价策略,新增按用量计费并下调团队年费 [2] - Google:开源Gemma 4家族,其中31B模型在Arena AI排行榜排名第3,26B模型排名第6 [3]。推出Veo 3.1 Lite视频生成模型,定价为0.05美元/秒(720p),仅为标准版的1/8 [3]。推出Gemini Flex/Priority推理分层,Flex API定价为标准API的50%,Priority API则上浮75–100% [3]
大模型商业化周报:海外模型定价重构-20260406
浙商证券·2026-04-06 15:52