The AI Trade Is Moving Beyond GPUs As Inference Demand Builds

文章核心观点 - AI投资焦点正从模型训练的“训练阶段”转向模型实际应用的“推理阶段”，这预示着投资机会将从GPU等训练算力基础设施，扩散到更广泛的支撑推理工作的硬件和系统公司[4][5][14] AI算力需求演变：从训练到推理 - 过去两年AI投资的核心逻辑是模型训练需要巨大的计算能力，这使GPU成为焦点并引发了对数据中心空间、电力及整体容量的争夺[2][3] - 模型训练完成后，其价值创造依赖于实际使用，即运行已训练模型以回答问题或执行任务的“推理”过程，这标志着投资讨论的转变[5] - 训练阶段需要巨大的计算能力来构建模型，而推理阶段则依赖于AI融入搜索、软件、客服等工作流后所需的稳定算力容量[6] 推理阶段的关键硬件与成本动态 - 推理需求的增长使CPU重新变得重要，其作用是帮助协调跨计算资源的AI工作负载，而非取代GPU[6][7] - 随着硬件改进，公司生成每个AI模型响应所使用的“令牌”成本正在下降，这使得昂贵的芯片能处理更多工作[8] - 随着AI智能体变得更普遍，需求可能从回答单一问题转向完成多步骤任务，从而驱动AI系统的使用量大幅增长[9] - 若令牌成本下降而使用量增长且定价保持稳定，构建AI基础设施的公司可能获得更宽的利润空间，使芯片、数据中心和电力支出从投机性押注更像一个大型运营业务的基础[10] 推理需求对产业链公司的具体影响 - 英特尔和Arm均强调了CPU在推理增长中日益重要的角色[11] - 英特尔预测，随着推理需求增长，AI服务器配置可能从大约每颗CPU对应8颗GPU转变为每颗CPU对应约4颗GPU[11] - 推理可能将AI支出推向GPU之外，更深地进入CPU、服务器以及大规模运行模型所需的系统领域[11] - 服务器的重要性可能提升，规模较小的云提供商和为推理构建的新型云公司往往需要能快速部署和轻松支持的设备，这可能利好戴尔和HPE等销售承载AI工作负载的服务器的公司[12] 市场准备与未来展望 - 许多公司仍在为更广泛的AI应用做准备，需要清理数据和连接系统，然后才能在业务中部署智能体，这项工作需要时间，但也意味着随着更多公司从准备转向实际使用，推理需求可能会持续累积[13] - 推理可能将下一阶段的AI支出扩散到更广泛的公司群体，如果模型将在真实工作流中持续运行，投资者需要将目光从训练模型的公司转向维持模型运行的公司[14]