Workflow
Token demand
icon
搜索文档
AI Demand Is Overstated — Only Anthropic Is Being Realistic
Youtube· 2026-04-18 02:00
行业现状:AI需求信号与成本失控 - 当前科技行业正经历历史上最大的支出周期,但AI需求信号已失灵,多数公司并未真正理解其承担的风险,仅因潮流而盲目投入 [1] - AI使用的基本成本单位是token(代币),每次互动均产生成本 从简单的聊天到新一代AI智能体,成本差异巨大 智能体可在后台运行数小时,消耗数百万代币,而用户难以监控和预算 [2][3] - 企业AI支出严重超出预算 例如,Uber的AI编码工具在四月份已耗尽其全年AI预算 高盛研究指出,公司的初始推理预算超支达数个数量级,AI成本今年有望与工程人员总成本相当 [4] 企业AI使用与效率问题 - 部分企业以使用量而非产出作为AI采纳的衡量标准 例如Meta和Shopify将员工按AI使用量排名,这可能导致资源错配和浪费 [5] - 当追踪使用量而非产出时,员工会“刷数据”以达成目标 这导致大量资金被低效或无效消耗,例如使用最先进的模型处理简单邮件编辑 [6] - 行业领袖指出效率是关键问题 单纯追求高额token消耗(如一位50万美元年薪的工程师应消耗至少25万美元的token)并非合理的业务目标,缺乏效率的支出令人担忧 [5][6] 定价模式转变:从固定费率到按量计费 - 固定费率模式在AI智能体时代难以为继 消费者习惯的固定月费无限使用模式(如ChatGPT Pro)正变得不可持续,因为智能体消耗token的速度远快于聊天机器人 [7] - Anthropic率先响应,取消了固定费率计划,并转向按token计费 该公司切断了第三方工具使用其无限订阅的权限,因为估计一个200美元的Max套餐可能消耗2000至5000美元的计算成本 [7] - 定价模式转变可能抑制需求 企业和消费者若已为固定费用编制预算,当每个token都附上新价格标签时,可能会开始减少使用 [8] 投资周期与基础设施过剩风险 - 整个AI投资周期建立在token需求持续增长的假设之上 这支撑了英伟达数千亿美元的芯片销售、数据中心公司建设30吉瓦的容量以及科技巨头数百亿美元的基础设施投入 [9] - 若当前需求中有相当部分来自员工刷榜、智能体空转或企业不可持续的预算消耗,那么为此建设的基础设施规模可能基于不真实的需求数字 行业存在明显的过度投资 [10] - 数据中心建设周期长达1-2年,AI公司正基于尚未实现的需求进行数十亿美元的押注 投资过少会失去客户,投资过多则收入无法覆盖成本,导致商业模式失效 [11] 公司策略与市场分化 - Anthropic是首家采取行动的主要AI实验室,其策略是取消固定费率、按token计费,并基于可验证的真实需求进行建设 这种对需求时间点的误判可能带来毁灭性后果 [11] - 在预期IPO的背景下,Anthropic展示了清晰的按token计费数据,使其能够了解客户付费内容及原因 市场正在甄别不同策略的公司 [12] - 采取激进目标但更关注投资回报率、并奉行“低承诺高交付”策略的公司,通常更具审慎性和长期性 为真实需求定价的公司将与未这样做的公司呈现显著差异 [12]