100万亿Token揭示今年AI趋势！硅谷的这份报告火了

文章核心观点 - 基于对OpenRouter平台超过100万亿Token使用数据的实证分析，揭示了2025年AI行业的发展趋势，核心结论包括开源与闭源模型关系转变为互补、中国开源模型力量崛起、模型功能向推理与执行系统演进、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等[1][8][12] 开源与闭源模型格局演变 - 开源模型不再是闭源模型的廉价替代品，两者关系已演变为互补，开发者常同时使用两类模型[9][10] - 开源模型使用量稳步增长，预计到2025年底将占据约三分之一的Token用量[10][12] - 开源模型市场从高度集中走向多元化，早期DeepSeek V3和R1曾占一半以上用量，但预计到2025年底，没有单一模型能持续占比超25%，市场将由5~7个模型均分[16][17][18] - 中型模型（参数在150亿到700亿之间）更受市场青睐，小模型正在失宠，市场分化为强大的中型模型类别或整合到最强大的单个大型模型上[20][21] 中国开源模型崛起 - 中国开源模型成为增长主要引擎，其每周Token使用量占比从2024年底的1.2%最高激增至30%，平均占比为13%，与其他地区开源模型平均13.7%的份额相当[12][13] - 中国模型如DeepSeek、MiniMax、Kimi K2等在开源领域受到青睐，其中DeepSeek在角色扮演和闲聊领域有极高粘性，超过三分之二的流量用于此[1][16][50] - 在编程领域，中国模型如MiniMax已成为快速崛起的新秀，近几周取得显著增长[48] 模型功能与使用范式转变 - 语言模型正从对话系统升级为推理与执行系统，使用推理功能的Token用量从年初可忽略不计增长至超过50%[22] - 模型调用工具的功能使用占比上升，从年初集中于少数模型发展到更多模型支持，缺乏可靠工具的模型有落后风险[29][30][31][33] - 用户任务复杂度提升，从生成短文转向解决难题，如分析完整文档或代码库[35] - 用户平均每次提示词长度增加约4倍，模型完成任务所需Token用量增加近3倍，反映出工作负载更依赖上下文且推理消耗更多[36][39] - AI正从聊天机器人转变为能独立规划步骤、调用工具并完成复杂目标的自动智能体（Agent）[42][43] 主要应用场景与模型偏好 - 编程和角色扮演是AI模型最主要的使用方式[12][44] - 编程查询的Token用量从年初的11%上涨至最近的超过50%，增长最为稳定[45] - 在编程领域，Claude系列长期占据主导地位，大部分时间占比超过60%，但其份额在2025年11月首次跌破60%[47] - OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%，谷歌份额稳定在约15%[47][48] - 在角色扮演领域，开源模型中其使用量占比高达52%，中国与西方开源模型在该领域平分秋色[50] 用户行为与留存特征 - 用户留存呈现“水晶鞋效应”，即新模型发布时若能完美解决特定用户痛点，便能锁定一批高粘性用户，即使后续有更好模型也难以被替换[12][67] - 例如，Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40%高位[67] - 该效应窗口期很短，仅在模型被视为“最前沿”时有效，一旦竞品能力赶超则难以吸引新用户[69][70] - 用户留存模式可分为：成功锁定（如Claude、GPT-4o Mini）、从未合脚（如Gemini 2.0 Flash）、回旋镖效应（用户离开后因性价比或特定能力又回归，如DeepSeek）[74] 市场与区域动态 - AI不再是硅谷独角戏，亚洲地区付费使用量占比从13%翻倍至31%[71] - 北美仍是最大市场，但份额已不足50%[80] - 英语以82%的份额占据绝对主导，简体中文以近5%的份额位居第二[80] 其他关键发现 - 模型价格下降对使用量的影响有限，价格下降10%仅带来0.5%-0.7%的使用量增长[80] - 存在“杰文斯悖论”现象，即模型降价且好用后，用户会在更多场景更频繁地调用，导致总Token用量飙升，总支出可能并未降低[75][76] - 报告数据主要反映开发者与服务端API调用行为，未涵盖通过App或Web直接访问的流量，且平台定价策略可能影响数据代表性[76]