中金公司- Token启示录系列：大模型商业模式的中观分析

行业与公司 * 行业：人工智能（AI）大模型行业，特别是大模型商业化、Token经济、Agentic AI（智能体）[2][4] * 涉及公司： * 海外模型厂商：OpenAI (ChatGPT, Codex)、Anthropic (Claude, Claude Code)、Google (Gemini) [4][19][22][45] * 国内模型厂商：智谱 (GLM)、深度求索 (DeepSeek)、Kimi、阿里 (通义千问)、字节 (豆包)、MiniMax [45][60][71][75] * 云厂商/合作伙伴：微软 (Azure)、亚马逊 (AWS)、谷歌 (TPU) [22][27][40] 核心观点与论据 1. 商业模式：B端与C端双轮驱动，Token价值分层 * B端模式（Token Factory）：以API调用为核心，模型智能水平和效率是关键。企业愿意为能提升生产力的智能模型付费 [4][5]。 * 核心场景：AI编程（Coding）是首个进入真实生产力级别的应用，已初步验证投资回报率（ROI）[6][9]。 * ROI测算：假设中国程序员每日Token花费116美元（对应每年22万元），每日节省约4.5小时ROI即可转正；美国程序员在相同花费下，节省不到2.5小时ROI即可为正 [9]。 * Token消耗量：单用户基于Agentic Coding的Token消耗是普通ChatBot的百倍以上 [10]。例如，完成一个代码重构（多文件）任务可能消耗15,000-80,000个Token，而一次普通ChatBot对话仅消耗900-5,700个Token [12]。 * 市场空间（TAM）巨大：全球白领AI Agent市场总规模（TAM）估算在1万亿美元（基准情形）至3万亿美元（乐观情形） [4][16]。 * 用户分层与ARPU假设： * 重度用户（如软件工程师）：年ARPU 12，000-20，000美元 [17][18]。 * 中度用户（如金融分析师）：年ARPU 1，000-5，000美元 [17][18]。 * 轻度用户（广义白领）：年ARPU 200-1，500美元 [17][18]。 * 竞争格局：Anthropic与OpenAI在企业市场展开角逐 [19][22]。 * Anthropic：专注于Coding和企业市场，年化经常性收入（ARR）从2025年底的90亿美元快速增长至2026年5月的450亿美元，预计年底有望达到1000亿美元，其中80%来自B端客户 [4][19]。 * OpenAI：优化商业化战略，加码企业级及Coding市场，其Codex产品周活用户已达200万，三个月增长5倍 [22]。 * C端模式：通过订阅制和广告进行商业转化，核心是巩固流量入口 [4][5]。 * 用户规模：截至2026年5月，ChatGPT和Gemini的C端月活分别达到10亿和9亿 [4][45]。 * 订阅模式：ChatGPT付费用户约占周活用户的5%（约3500万用户）。OpenAI预计到2030年付费人数将达到2.2亿，占周活人数（26亿）的8.5%。假设2030年C端用户平均价格50美元/月，则OpenAI C端订阅ARR将达到约1320亿美元 [45]。 * 广告模式：作为覆盖免费用户Token成本的重要路径 [4][50]。 * OpenAI：ChatGPT广告上线不到6周ARR已超1亿美元，覆盖600个广告主。预计2026年广告收入达25亿美元，2030年达1000亿美元 [50]。 * Google：以搜索引擎为基本盘，在AI Overview和AI Mode中加入广告，截至2025年10月，AI Overview年化收入已达50亿美元 [50]。 * 国内市场：付费意愿较低，厂商主要依托免费模型占据流量入口，通过与自身生态（如电商、本地生活）联动实现间接变现 [60]。 * Token价值分层： * C端消费级：完成日常任务，通过订阅/广告变现，预计2030年TAM约6000亿美元（订阅4800亿+广告1000亿）[65]。 * B端Token Factory：解决复杂任务，按Token或订阅付费，TAM或达约4万亿美元 [65]。 * AI原生应用：按产出结果收费，价值含量最高，仍处探索阶段 [5][65]。 2. 成本与盈利：训练投入高昂，推理毛利率趋势性提升，远期有望盈利 * 成本结构：模型厂商成本主要集中在训练、推理和人员 [66]。 * 2025年情况：海外模型厂商算力支出（训练+推理）基本是收入的1.5倍，人员成本占收入的42%-64%。Anthropic和OpenAI现金花费分别为30亿/90亿美元 [66]。 * 训练端：是当前算力投入重点（约占70%），以提升模型参数规模和智能水平 [68][71]。 * 参数规模：海外头部模型参数达2-3T（Anthropic Mythos甚至达5-10T），国内模型突破1T [71]。 * 投入增长：Anthropic预计2026年训练侧投入约120亿美元（同比+193%）；OpenAI预计投入约320亿美元（同比+285%）[71]。 * 推理端：随着Agentic AI需求爆发，推理算力占比将提升 [68]。工程优化（如注意力机制优化、PD分离）能有效降低单Token推理成本，提升毛利率 [75][78]。 * 盈利前景：随着收入放量摊薄训练成本，以及推理毛利率提升，中长期模型厂商将实现盈利 [4][78]。 * 毛利率趋势：国内模型因价格和参数规模差异，毛利率低于海外，但通过工程优化有望提升至40%-50%左右。OpenAI预测未来五年毛利率在52%-67%；Anthropic预计2029年毛利率达77% [75][78]。 * 盈利时间点：根据公司预测及第三方估算，Anthropic和OpenAI分别在2029和2030年实现盈利 [78]。敏感性模型显示，大模型公司可能在运营第5年实现营业利润转正 [80]。 3. 发展趋势与风险 * 发展趋势： * Agentic AI渗透加速：模型正从Coding向提升通用生产力进阶，未来可能出现以天、月为单位工作的智能体 [32]。 * 算力与生态成为关键：充足的算力储备以支撑激增的推理需求，以及构建吸引开发者和企业的生态系统，将成为模型厂商的竞争壁垒 [38]。 * Token管理精细化：随着消耗指数级增长，Task Budget（任务预算）管理将变得重要，以实现任务输出与成本的平衡 [35]。 * 主要风险：[3][82] 1. 算力持续涨价：若上游算力（存储、GPU等）涨价幅度超过API提价，将挤压模型厂商利润。 2. Agent泛化能力不及预期：若Agent能力无法快速拓展至Coding以外的场景，将影响整体市场空间（TAM）的扩张。 3. API价格战：若厂商为争夺份额发起价格战，将影响毛利率和盈利时间表。 其他重要信息 * 模型能力进展：Claude Opus-4.6在准确率为50%的情况下可执行10+小时的复杂任务（如RFC工程化）[32]。 * 算力储备对比：OpenAI已上线及锁定算力约10 GW，Anthropic约5 GW [40]。 * 分成模式差异：OpenAI与微软分成较严苛（2030年前支付收入的20%），而Anthropic与AWS更偏向合作关系，ARR计算口径不同 [27]。 * 广告效率对比：当前ChatGPT广告的每次购买成本（CPA）低于Google和Meta，但线索质量高于Meta、低于Google [54]。