行业核心观点 - 中国人工智能行业正从“百模大战”阶段迈向以商业化落地能力、模型创新实力及全球化布局为决定成败之关键的阶段[1] - 具备实力且资金充足的模型开发商数量已从超200家缩减至不足10家[1] - 行业不再奖励“能不能做模型”,而是奖励“能不能长期活下来”[1] - 大模型竞争的主线正在从技术竞赛转向商业系统的构建能力[3] - 模型能力逐步趋同,资金消耗呈指数级上升,客户开始更关注交付能力、稳定性与可持续性[2] 行业利润池与竞争格局 - 生成式AI的持久利润池可能高度集中于大型互联网平台,尤其是腾讯和阿里巴巴[5][6] - 平台掌控全国范围层级的分发、变现通道以及高频消费和商户事务流[6] - 平台拥有高频用户触点,AI能力更容易被内化为功能而非独立产品售卖[6] - 平台已具备成熟的收费机制,AI更多是提升ARPU与转化率的工具[6] - 高频使用场景决定了推理调用量,也决定了规模效应是否成立[7] - 模型能力本身并不必然转化为盈利能力,分发和变现路径在中国市场尤为关键[7] - 行业玩家分为双轨竞争格局:拥有全栈生态的综合型科技巨头与在特定维度具备领先性的独立模型开发商[11] 独立模型公司的生存策略 - 独立模型公司的机会在于提供“结构性中立”的选择,其激励结构旨在赋能客户应用,而非与客户形成竞争关系[11][12] - 独立提供商通过API、企业授权或私有化部署直接将模型变现,不要求客户绑定单一基础设施或软件生态[12] - 对于大型企业,引入平台模型存在潜在的战略依赖风险,而独立模型商更容易被视为工具型伙伴[12] 智谱公司分析 - 公司被定义为以结构性持久的本地化业务为锚点,并迎来能力导向型API业务拐点的典型代表[13] - 2025财年上半年,公司总收入的85%来自本地化部署,该业务板块毛利率达到59.1%,而云端部署毛利率为-0.4%[14] - 本地化部署主要面向受监管行业,随着基础模型迭代,安装基数可能演变为升级驱动型、经常性经济利益[14][15] - 随着GLM-4.7发布,战略重心向智能体系统和工具增强推理倾斜,预计云端API采用率将加速提升[17] - 预计2025年下半年起云端部署的收入和利润率将双双爬坡[17] - 摩根大通给予智谱“增持”评级,目标价400港元[3][17] - 训练成本占算力总成本的百分比将从2025年的93%大幅下降至2030年的32%[39] - 推理相关算力成本占比将从2025年的7%激增至2030年的68%[39] MiniMax公司分析 - 公司被描述为拥有可扩展增长引擎的全谱系AI企业,核心标签是“天生全球化”和“全模态”[21] - 2025年前九个月,公司73%的总收入来自中国以外的市场,已在200多个国家和地区进行部署[23] - 2025年前三季度,开放平台、生成式媒体和AI陪伴业务的营收占比各约三分之一[23] - AI陪伴业务贡献35%收入,预计到2030年付费率将达到18%,年度ARPU达到31美元[23] - 生成式媒体业务贡献33%收入,为内容创作者提供视频工具,年度ARPU高达75美元[32] - 开放平台业务贡献29%收入,服务13.2万名开发者,付费用户年化ARPU达8200美元[32] - 预计2026-2030年营收年复合增长率高达138%[33] - 预计公司将于2029年起实现盈利,2030年调整后净利润率将正常化至24%[33] - 预计集团将需要在2026年和2027年进行外部融资,预计每年金额为7亿美元[33] - 采用混合专家架构,模型迭代速度为两月一次,快于3-4个月的行业平均水平[28] - 采用“双引擎”策略,同时开发模型和消费者产品,利用消费者应用作为技术的验证器[28] - 摩根大通给予MiniMax“增持”评级,目标价700港元[3][28] - 训练成本占算力总成本的百分比将从2025年的80%下降至2030年的28%[39] - 推理相关算力成本占比将从2025年的20%激增至2030年的72%[39] 行业关键财务拐点:推理成本 - 算力成本结构将从“训练驱动”彻底切换为“推理驱动”[29] - 训练与推理的增长曲线和成本驱动因素将与2022-25年的扩张阶段出现显著差异[30] - 随着基础模型架构确立,前沿扩展预训练将变得更具选择性,研发支出将进入更理性的“正常化阶段”[34] - 未来的竞争是推理效率的竞争,算力支出将逐渐从研发费用转移到营收成本[35] - 未来竞争的核心是谁的推理更便宜、谁的利用率更高、谁能掌握定价权[36]
中国AI大战:“百模大战”已结束,最大的利润池归属大厂,智谱和MiniMax如何突围?