报告核心观点 - 基于超过100万亿个真实生产环境Token数据的实证研究,揭示了AI领域正经历三大根本性转变:从单一模型竞争走向多元化生态系统;从简单文本生成迈向智能体推理范式;从西方中心向全球分布式创新格局演进 [3] 行业范式转变:从文本预测到机器思考 - 2024年12月5日OpenAI发布o1模型,标志着AI从“模式补全”转向“结构化内部认知”的关键转折点,该模型引入了扩展的推理时计算过程,包含内部多步思考、潜在规划和迭代优化 [6] - 推理优化模型所处理的Token量已从近乎零增长至占总量的50%以上,意味着半数以上的AI交互不再是简单问答,而是涉及多步思考、状态管理和工具调用的复杂过程 [4][18] - 交互序列长度显著增加,平均输入Token数从约1,500增长到超过6,000,输出Token数也从150左右增加到约400,反映了用户正在将更复杂的上下文交给AI处理 [20] 市场格局重塑:开源崛起与多元化竞争 - 开源模型使用量显著上升,打破了少数闭源巨头主导的市场格局,其中中国开源力量崛起尤为引人注目,其周使用量占比从2024年底的1.2%跃升至2025年后期某些周度的近30% [4][7][9] - 截至2025年底,开源模型市场呈现健康的多元化态势,没有任何单一开源模型能持续占据超过25%的市场份额,流量均匀分布在五到七个主要竞争者之间 [11] - 中型模型(参数规模在150亿至700亿之间)崛起,在能力与效率之间取得了更好的平衡,满足了大量实际应用场景的需求 [12] 主要参与者与市场份额 - 根据2024年11月至2025年11月的总Token使用量,DeepSeek以14.37万亿Token位居榜首,其次是Qwen(5.59万亿)、Meta LLaMA(3.96万亿)、Mistral AI(2.92万亿)和OpenAI(1.65万亿) [12] - 中国模型提供商如Minimax(1.26万亿)、Z-AI(1.18万亿)、Moonshot AI(0.92万亿)也进入了前十名,显示出中国在全球AI版图中的重要地位 [12] 应用场景分化:从生产力到情感陪伴 - 超过一半(约52%)的开源模型使用量流向了角色扮演、故事创作等创意对话场景,这一比例甚至超过了编程辅助,揭示了AI作为情感伙伴与创作引擎的巨大需求 [4][15] - 编程相关的查询量在2025年实现了稳定增长,从年初占总Token量的约11%攀升至年底的超过50%,成为推动输入Token增长的主要动力 [4][17][20] - 编程相关的提示平均长度是其他类别的3-4倍,且增长速率更快,表明软件开发者正以激进的方式探索AI能力的边界 [20] 全球化与区域市场动态 - 亚洲在全球AI使用量中的份额已从约13%显著提升至31%,反映了该区域企业采纳AI技术的加速和本地创新生态的成熟 [23] - 按大洲划分,北美以47.22%的份额领先,亚洲(28.61%)和欧洲(21.32%)紧随其后 [24] - 按国家/地区划分,美国以47.17%的份额占据绝对主导,新加坡(9.21%)、德国(7.51%)、中国(6.01%)位列其后 [24] - 从语言分布看,英语仍占据主导地位(82.87%的Token使用),但中文(简体)以4.95%的占比成为第二大使用语言 [25] 定价策略与市场分层 - 高端市场由Anthropic的Claude系列和OpenAI的GPT系列等闭源模型主导,其每百万Token成本在2美元(Claude)至35美元(GPT-4/5)之间,但在关键业务场景中用户对性能和质量的要求超过对成本的敏感 [29] - 大众市场以Google Gemini Flash、DeepSeek V3等高效模型为代表,以低于0.4美元每百万Token的成本吸引了海量日常使用 [29] - 市场呈现出复杂的价值分层,而非简单的成本驱动,研究显示价格弹性较弱,降价10%仅能带来0.5-0.7%的使用量增加 [29] - “技术”类查询的平均成本显著高于其他所有类别,但使用量依然保持高位,反映了高复杂性、高价值任务的特殊需求 [32] 用户行为与留存模式 - 报告提出“灰姑娘水晶鞋”理论,即当新模型恰好满足一类长期存在的高价值工作负载需求时,会形成“完美契合”,产生强大的用户锁定效应 [33][34] - 数据支持该理论,例如Claude 4 Sonnet在2025年5月的用户群体,在五个月后依然保持了约40%的留存率,显著高于后续用户群体 [34] - DeepSeek模型展现出“回旋镖效应”,部分用户在尝试其他模型后,会重新回归DeepSeek,暗示其在某些特定能力维度上建立了难以替代的优势 [4][35] 未来竞争焦点 - 行业竞争焦点正从对单一“最佳模型”的追逐,转向构建灵活、多样、适应性强的模型生态系统 [36] - 未来竞争将进一步转向运营卓越性,包括精确衡量真实场景下的任务完成率、降低模型性能波动、使AI行为更好对齐生产环境实际需求等 [36] - 开源模型的持续进步正在对闭源市场构成“底线压力”,推动整个行业的技术进步和成本优化 [32]
a16z 100万亿Token研究揭示的真相:中国力量重塑全球AI版图
36氪·2025-12-08 16:33