Token消耗成为企业组织行为新信号 - 硅谷流行“Tokenmaxxing”概念,Meta和OpenAI内部工程师在AI使用排行榜上竞争,有工程师一周消耗2100亿个Token,相当于33个维基百科的文本量,有人每月AI账单高达15万美元 [6] - 企业将Token消耗与员工福利和绩效挂钩,例如爱立信工程师的公司账单超过其工资,Shopify CEO要求团队在申请新人力前需证明AI无法完成工作,并将AI使用纳入绩效考核,Meta宣布从2026年起将“AI驱动的影响力”纳入所有员工绩效评估 [6] Token被产业界提升为战略核心 - 英伟达CEO黄仁勋在GTC大会上将Token定义为“AI时代的基石”和“最值钱的大宗商品” [7] - 阿里巴巴宣布成立由CEO直接负责的“Alibaba Token Hub”事业群,定位为“创造Token、输送Token、应用Token” [7] - Token从技术计量单位转变为定义产品价值、重组事业群、员工福利和核心KPI的关键要素 [9] Token定价体系复杂化,成本结构发生根本变化 - 大模型定价从简单的输入/输出Token分层,以Anthropic Claude Opus 4.6为例,标准输入为每百万Token 5美元,输出为25美元,但启用Prompt Caching、Batch API、指定区域推理或Fast Mode等条件会导致价格出现数倍至十余倍差异 [13] - 模型调用之外的附加功能成为独立成本中心,例如OpenAI对Web Search、File Search、代码容器(Container)等单独计费,File Search为每千次调用2.50美元,向量存储每GB每天0.10美元 [13][14] - Google Vertex AI也对Agent Engine中的代码执行、会话和记忆库等按vCPU小时和GiB内存小时分别计价 [15] - 大模型厂商销售的是包含运行、存储、搜索、调用工具和持续执行的一整套AI基础能力 [15] Token单价下降与总成本上升并存,存在多重驱动机制 - 模型API单价大幅下降,例如Anthropic Opus从上一代15美元/百万Token降至5美元,降幅三分之二,DeepSeek V3.2低至0.28美元/百万Token,Google Gemini 2.5 Flash Lite约0.10美元/百万Token [18] - 中国模型价格优势明显,单价约为海外竞品的六分之一到十分之一,腾讯云混元HY2.0 Instruct涨价超过460%后折合约0.62美元/百万Token,仍低于Anthropic最便宜的模型 [18] - 总使用成本未降源于三个机制:1) 模型更智能但输出更长,推理模型平均输出Token使用量是非推理模型的5.5倍 [20];2) AI智能体(Agent)导致持续消耗,单个Agent算力消耗是传统Chatbot的100到1000倍,中国整体日均Token消耗从2025年中的30万亿跃升至2026年2月的180万亿级别 [20];3) 底层算力成本上涨,2026年3月阿里云和百度智能云AI算力与存储产品价格最高上调34%,AWS机器学习容量块提价约15% [20] 行业面临Token投入与产出衡量的核心缺陷 - 当前Token消耗量(如一周2100亿Token)只衡量投入,不衡量产出质量和任务完成有效性,这是Token经济的最大盲区 [9][23] - 企业将Token消耗纳入KPI可能引发“生产力表演”,而非真实生产力跃升,行业缺乏从Token消耗到任务完成的有效度量标准 [23] - 产生新型职业焦虑,高昂的Token消耗成为展示AI生产力的信号,但真实价值衡量被推迟,这与过去企业争相建网站、做App的逻辑类似 [23] - 高成本使“烧Token”与“用Token创造价值”的区别从哲学问题变为财务问题,未来的商业机会与成本陷阱在于高效地将Token转化为任务完成率 [24]
“烧Token”成KPI,有程序员一个月花掉15w
创业邦·2026-03-25 08:10