Workflow
TAC(Token Architecture Capability)
icon
搜索文档
涨价83%后token卖爆,智谱的财报藏着一个行业拐点
华尔街见闻· 2026-03-31 23:31
中国大模型行业格局与商业化拐点 - 2026年2月,全球最大AI模型API聚合平台OpenRouter上,中国大模型的周Token调用量攀升至5.16万亿,首次超越美国模型的2.7万亿,全球调用量前五的模型中,中国占据四席 [1] - 一年前,该平台上Anthropic一家独占42%的Token份额,中国模型几乎不在牌桌上,此次逆转标志着中国大模型在全球市场的影响力发生根本性变化 [2] 智谱公司:商业模式验证与业绩增长 - 2025年全年,智谱收入达7.24亿人民币,同比增长131.9%,继续保持国内收入规模最大的独立大模型公司地位 [2] - 公司CEO张鹏将增长逻辑归结为“当模型足够强,API本身就是最好的商业模式”,并判断“智能的质量创造定价权,企业和用户的深度使用创造增长的Scaling” [2] - 2026年一季度,智谱在发布GLM-5的同时,宣布API涨价83%,这是国产大模型的第一张涨价牌,市场反应为抢购、售罄、限售 [2][5] - 涨价后调用量不降反升,验证了其定价权逻辑,公司正沿着“中国Anthropic”的商业路径发展 [5][8][11] 行业价格战与商业化转折 - 2024年下半年到2025年初,中国大模型行业经历了惨烈的价格战,字节豆包、阿里通义千问、智谱等均大幅降价,旨在用补贴换生态,用低价换调用量 [3] - 价格战完成了历史使命,培养了个人开发者和企业的使用习惯,建立了调用量的基本盘 [4] - 行业转折点在于从“谁更便宜”转向“谁先让客户觉得贵得值”,价格战的终局是价值竞争 [5] 编程场景:价值创造与商业模式升级 - GLM-5在SWE-bench Verified等核心编程榜单中稳居开源第一,能自主完成后端重构、深度调试等系统工程任务 [6] - 智谱2025年在国内首家推出编程套餐GLM Coding Plan,付费开发者规模快速突破24.2万,Token调用量6个月涨了15倍 [6] - 编程从写代码片段升格为完成系统工程,使得Token消耗量和单价可以同步上升,开发者付费决策从“成本支出”转变为“效率投资” [6][9] 收入结构转型与估值逻辑重塑 - 智谱的收入结构发生根本变化:API调用爆发式增长,私有化收入占比大幅收缩,API经常性收入成为业绩主引擎 [6] - 增长不再靠签约驱动,而是靠用量自然增长,公司从项目制公司转变为平台公司,估值逻辑从看PE转向看ARR(年度经常性收入) [7] - 公司MaaS API平台的ARR约17亿元,过去12个月提升60倍,平台毛利率提升近5倍至18.9% [11] 生态构建与“被集成”密度 - 中国前十大互联网公司中,已有9家每天深度调用GLM模型,每一代模型发布后24小时内即获得字节跳动、阿里巴巴、腾讯、美团、快手、百度及WPS Office等头部平台的官方接入 [12] - 超过400万企业用户及开发者在真实生产环境中持续调用,覆盖全球超218个国家和地区,GLM已成为Windsurf、OpenCode等国际编程平台的默认模型,并在OpenRouter付费模型排名第一 [12] - “被集成”的密度反映了模型的不可替代性,是飞轮运转状态的关键指标 [12][13] 技术实力与飞轮效应 - GLM系列模型持续保持全球开源模型第一、中国模型第一,在全球所有模型中紧跟GPT、Claude和Gemini,稳定进入全球AI第一梯队 [13] - GLM-5以匿名身份“Pony Alpha”登上OpenRouter热度榜首,上线首日即处理40亿Token、20.6万请求 [13] - 通过软硬协同的co-design以及动态稀疏注意力机制等技术,将部署成本降至原来的50%且性能无损,同时涨价起到了客户正向筛选作用,提升了留存率和调用深度 [13] - 公司形成了“智能上界突破推动Token消耗量指数级增加 -> 商业正反馈支撑更大研发投入 -> 进一步抬升智能上界”的飞轮效应 [13] Token经济学与未来增长逻辑 - 英伟达CEO黄仁勋强调“计算即收入,推理即收入”,Token是AI时代收入增长的基础 [15] - 过去一年,OpenRouter前十大模型的周Token调用量从1.24万亿暴增至近14万亿,增幅超10倍,单用户的Token消耗深度也在跃升 [15] - 智谱CEO张鹏提出,2025年关键词是“智能上界”,2026年关键词是“Token量”,公司目标是将推理性能压榨至极限,以支撑高质量Token消耗的指数曲线 [16] - 从AI coding到Vibe coding,再到Agentic engineering和long horizon阶段,每一次能力跃迁,单任务的Token消耗都是上一阶段的倍数级放大 [16] 应用爆发与算力保障 - 智谱推出的AI Agent产品OpenClaw(Claw Plan)上线两天订阅用户即破10万,20天突破40万,AI Agent作为“数字员工”7×24小时自主运行,持续燃烧Token [17] - GLM-5已完成与华为昇腾、摩尔线程、寒武纪等7家国产芯片平台的深度推理适配,在国产芯片上跑出了比肩国际顶级芯片的推理效率,保障了算力自主可控和Token产能 [17] 核心战略概念:Token架构力 (TAC) - 智谱提出TAC(Token Architecture Capability,Token架构力)概念,其公式为:TAC = 智能调用量 x 智能质量 x 经济转化效率 [18] - 未来衡量价值的标准是作为“Token架构师”驱动大模型和Agent完成复杂任务的能力,智谱的目标是成为提升全社会TAC的基础设施,让每一滴Token都能转化为可交付的经济增量 [18] - Anthropic以同样的逻辑实现了190亿美元的ARR和3800亿美元估值,为中国MaaS模式提供了参照 [10][18] 行业地位与市场信号 - 智谱的财报被视为国内大模型行业坐标系级别的参照点,展示了类似Anthropic的商业模式与增长正在发生 [2] - 市场出现“供不应求”和“卖断货”的现象,这比任何财报数字都更有力地证明了公司已掌握定价权 [19]