Edge AI Inference
搜索文档
Can Cloudflare's Edge AI Inference Reshape Cost Economics?
ZACKS· 2025-12-24 00:06
Cloudflare的AI推理战略与竞争优势 - 公司的AI推理战略与超大规模云服务商不同 其不依赖出租服务器容量并赚取硬件成本倍数的模式 而是致力于最大化每单位资本支出所构建基础设施的系统效率和利用率 从而优化AI推理的成本结构 [1] - 公司通过使用专为其硬件和边缘网络定制的、基于Rust语言编写的自定义大型语言模型推理引擎Infire 来最大化GPU利用率并最小化间接成本 [2] - 该系统能够用更少的CPU和GPU实现更高的吞吐量 将模型部署在更靠近用户的位置 并提升启动速度和效率 而超大规模云服务商仍在应对高延迟、因CPU限制和网络瓶颈导致的GPU利用率不足等问题 [3] Infire引擎的技术架构与优势 - Infire的工作流程包括一个OpenAI兼容的HTTP服务器 一个批处理器 以及一个运行模型的LLM推理引擎 当模型被调度运行时 Infire会从R2存储下载模型权重 [4] - 该引擎允许将模型权重缓存在边缘节点本地 以实现未来更快的加载并快速启动推理 [4] - 公司的供应链高度优化 其使用现成的硬件 尤其在一线城市 这使得公司能够在完全支付硬件费用前快速部署并开始产生收入 从而在需要增加容量时具备灵活性和快速响应能力 [5] 与竞争对手的战略对比 - 在AI推理和边缘部署方面 公司的战略与亚马逊和微软等超大规模云服务商、传统云及推理提供商截然不同 [6] - 为亚马逊AWS和微软Azure构建的超大规模数据中心使用大型设施进行高容量数据处理、存储和大规模工作负载 但这种方法存在功耗更高和延迟更高的问题 [6] - 亚马逊AWS通过引入作为Amazon CloudFront功能的Lambda@Edge来解决此问题 该功能允许用户在更靠近其应用程序的位置运行代码 从而大幅提升性能并降低延迟 [7] - 微软则采用了混合云战略 允许客户在本地边缘运行AI工作负载 [7] 股价表现与估值 - 过去六个月 Cloudflare股价上涨了9.9% 而Zacks互联网-软件行业指数同期下跌了3.1% [8] - 从估值角度看 公司基于远期市销率的交易倍数为26.19倍 远高于行业平均的4.86倍 [11] - Zacks对Cloudflare 2025年收益的一致预期意味着同比增长21.3% 且该预期在过去30天内被向上修正 [14] - 当前对2025年第四季度、2026年第一季度、2025年全年及2026年全年的每股收益共识预期分别为0.27美元、0.25美元、0.91美元和1.16美元 [16] 核心能力总结 - 公司使用基于Rust的自定义Infire引擎来最大化GPU利用率并降低AI推理成本 [10] - 公司将模型部署在更靠近用户的位置 并在边缘缓存权重以降低延迟并加速启动 [10] - 公司依赖现成硬件来快速增加容量并更早产生收入 [10]