大厂Token不再“管够”:腾讯开始限额,字节可部分报销

文章核心观点 - 随着AI智能体在工作中的广泛应用,大模型Token消耗成本呈指数级增长,国内外顶级科技公司已开始对员工内部AI使用进行限制和动态调配,以控制算力成本 [2] - 企业正在探索如何划定和分配Token额度,以平衡成本控制与生产效率,但目前尚无统一标准答案,各公司策略不一 [1][12] 大厂Token额度管控与分配现状 - 腾讯:作为国内率先对员工Token控额的互联网大厂之一,自2026年6月起,多个业务员工的Token额度下降,部门间差异显著,例如混元大模型团队员工月额度约7000元人民币,优图实验室约5250元,而娱乐外包员工仅1000元 [4] - 腾讯分配方式:Token额度分配到组,由管理者在组内分配;员工可申请提高额度,但部门预算有限可能导致申请被拒 [2][10] - 阿里:在产研等AI使用程度较高的岗位,员工每月Token额度约为8000元人民币,且不限制模型,员工反馈处理日常需求基本够用 [7] - 京东:员工可不限量调用自家模型,调用外部模型产生的费用分摊到部门 [7] - 字节跳动:员工可不限量调用内部TRAE产品内的模型(包含GPT、Gemini等);如需调用外部模型,费用可部分报销,例如产研岗位年度报销上限为1000美元,其他岗位为300美元 [8] - 美团:有员工表示未听说明确的Token额度标准,但使用内部AI产品时常遇到模型质量下降的情况,怀疑是因调用量过多被降级 [8] Token成本激增与行业影响 - 成本压力:AI支出已成为企业的大问题,OpenAI CEO Sam Altman在2026年6月初的直播中指出了这一点 [8] - 成本案例:米哈游团队有员工搭建数十个Agent协作,一晚上烧掉约200万元人民币的Token;一家约50人的AI初创企业,过去一个月团队Token成本约20万美元,人均成本达4000美元 [8] - 行业趋势:到2026年中,包括微软、Meta在内的全球顶级科技公司都已开始对员工AI Token用量进行监控、限制和动态调配,踩下内部AI无限使用的“刹车” [2] 员工应对策略与效率困境 - 自费补额:在腾讯,有员工因公司配额不够用,选择自掏腰包订阅每月200美元的Codex Pro 20x服务 [10] - 转向低价或自有模型:腾讯员工在外部模型额度受限后,可不限量使用自研混元大模型,但部分员工反馈混元模型工作效率下降、幻觉严重,不如“手搓”(人工编程) [10] - 规避排队:在字节跳动,尽管GPT-5.5模型在公司付费范围内,但接口排队严重,导致有员工用个人账号自费订阅以避免工作耽搁 [11] - 效率依赖与阵痛:员工普遍反映,工作量并未因Token额度减少而下降,且在使用AI后很难回归“古法编程”(纯人工模式),面临由奢入俭的阵痛 [3][11] 公司管理策略的演变 - 腾讯的调整:2026年,腾讯持续加码Token投入,但改变了此前按统一标准分配到员工的“大锅饭”模式,不再单纯以Token消耗量排名或衡量员工产出,转为由部门管理者结合工作情况动态分配资源 [5] - 早期激励与问题:2026年3月,腾讯曾为激励员工使用AI提效,配置了“每人年均22万元Token资源”,包括每月700美元Cursor额度、700美元Claude额度等,但这导致了员工为追求用量排名而进行无意义消耗甚至“接私活”的现象 [4]

大厂Token不再“管够”:腾讯开始限额,字节可部分报销 - Reportify