大厂Token不再“管够”：腾讯开始限额，字节可部分报销

文章核心观点 - 随着AI智能体在工作中的广泛应用，大模型Token消耗成本呈指数级增长，国内外顶级科技公司已开始对员工内部AI使用进行限制和动态调配，以控制算力成本 [2] - 企业正在探索如何划定和分配Token额度，以平衡成本控制与生产效率，但目前尚无统一标准答案，各公司策略不一 [1][12] 大厂Token额度管控与分配现状 - 腾讯：作为国内率先对员工Token控额的互联网大厂之一，自2026年6月起，多个业务员工的Token额度下降，部门间差异显著，例如混元大模型团队员工月额度约7000元人民币，优图实验室约5250元，而娱乐外包员工仅1000元 [4] - 腾讯分配方式：Token额度分配到组，由管理者在组内分配；员工可申请提高额度，但部门预算有限可能导致申请被拒 [2][10] - 阿里：在产研等AI使用程度较高的岗位，员工每月Token额度约为8000元人民币，且不限制模型，员工反馈处理日常需求基本够用 [7] - 京东：员工可不限量调用自家模型，调用外部模型产生的费用分摊到部门 [7] - 字节跳动：员工可不限量调用内部TRAE产品内的模型（包含GPT、Gemini等）；如需调用外部模型，费用可部分报销，例如产研岗位年度报销上限为1000美元，其他岗位为300美元 [8] - 美团：有员工表示未听说明确的Token额度标准，但使用内部AI产品时常遇到模型质量下降的情况，怀疑是因调用量过多被降级 [8] Token成本激增与行业影响 - 成本压力：AI支出已成为企业的大问题，OpenAI CEO Sam Altman在2026年6月初的直播中指出了这一点 [8] - 成本案例：米哈游团队有员工搭建数十个Agent协作，一晚上烧掉约200万元人民币的Token；一家约50人的AI初创企业，过去一个月团队Token成本约20万美元，人均成本达4000美元 [8] - 行业趋势：到2026年中，包括微软、Meta在内的全球顶级科技公司都已开始对员工AI Token用量进行监控、限制和动态调配，踩下内部AI无限使用的“刹车” [2] 员工应对策略与效率困境 - 自费补额：在腾讯，有员工因公司配额不够用，选择自掏腰包订阅每月200美元的Codex Pro 20x服务 [10] - 转向低价或自有模型：腾讯员工在外部模型额度受限后，可不限量使用自研混元大模型，但部分员工反馈混元模型工作效率下降、幻觉严重，不如“手搓”（人工编程） [10] - 规避排队：在字节跳动，尽管GPT-5.5模型在公司付费范围内，但接口排队严重，导致有员工用个人账号自费订阅以避免工作耽搁 [11] - 效率依赖与阵痛：员工普遍反映，工作量并未因Token额度减少而下降，且在使用AI后很难回归“古法编程”（纯人工模式），面临由奢入俭的阵痛 [3][11] 公司管理策略的演变 - 腾讯的调整：2026年，腾讯持续加码Token投入，但改变了此前按统一标准分配到员工的“大锅饭”模式，不再单纯以Token消耗量排名或衡量员工产出，转为由部门管理者结合工作情况动态分配资源 [5] - 早期激励与问题：2026年3月，腾讯曾为激励员工使用AI提效，配置了“每人年均22万元Token资源”，包括每月700美元Cursor额度、700美元Claude额度等，但这导致了员工为追求用量排名而进行无意义消耗甚至“接私活”的现象 [4]