AI云服务
搜索文档
AI 云服务市场分析,算力租赁厂商该如何卖 token?
傅里叶的猫· 2026-05-30 23:53
AWS-Anthropic 合作模式与经济效益 - AWS 2026年第一季度营业利润率环比增长213个基点,主要得益于与 Anthropic 的新合作模式 Token-as-a-Service [2] - 传统IaaS模式收入稳定但利润率受限于硬件折旧等成本挤压,而AWS Bedrock平台让客户直接购买AI模型生成的token,采用不同商业模式 [3] - AWS从该交易中获得基础设施费用和分成费用两层收益,当Anthropic每兆瓦算力年化收入超过特定阈值时还会触发额外激励 [3] - 2026年第一季度,Anthropic在Bedrock上的收入约为每兆瓦2600万美元,使Bedrock的EBIT利润率达到约55%,远超传统GPU租赁 [4] - Bedrock业务规模快速增长,2026年第一季度和第四季度收入分别环比增长170%和60%,年化收入达55亿美元,占AWS AI业务的37% [4] - Bedrock平台80-90%的客户使用Anthropic模型,而Azure和Google Cloud的AI业务中传统IaaS仍占80%以上份额 [4][5] - 该模式使Anthropic获得AWS庞大企业客户基础且无需签订昂贵多年期IaaS合同,使AWS获得显著更高的利润率 [5] - Anthropic在2026年第一季度新增210亿美元年化经常性收入,总ARR达300亿美元,主要由Claude Code驱动 [5] - Anthropic推理业务毛利率从2024年的负94%提升至2025年的38%,再到2026年的60%以上 [5] - 2026年第一季度,Bedrock贡献了AWS年度毛利润增长的30%,尽管只占AWS总收入的4% [6] - 预计到2026年第二季度,Anthropic每兆瓦算力的ARR将达4200万美元,Bedrock收入占AWS AI业务比例将提升至53%,为AWS总收入增长贡献9个百分点 [6] 自研芯片与垂直整合战略 - AWS的关键优势是垂直整合,其自研Trainium芯片已支撑Bedrock平台50%以上的token使用量,降低对Nvidia依赖并改善经济效益 [7] - Bedrock架构对客户隐藏底层硬件细节,使AWS可灵活选择最经济的硬件方案 [7] - Trainium针对推理和强化学习负载优化,在这些场景下内存带宽比原始计算能力更重要 [7] - AWS的Graviton CPU重要性上升,第五代Graviton芯片在性能和总体拥有成本方面有优势 [8] - Graviton4将集成到Trainium3中作为主节点,并单独用于处理强化学习和agentic工作负载,AWS已与Anthropic、OpenAI和Meta签订大规模CPU和Graviton合同 [8] - 自研芯片成功需要特定条件,如拥有大规模云业务以通过规模效应分摊研发成本并针对自身负载优化 [8] 云厂商容量建设与竞争格局 - 容量建设成为AI云竞争终极战场,AWS在2025、2026和2027年将建设比任何竞争对手都多的容量 [11] - AWS策略激进,签订数十亿美元电力购买协议确保能源供应,电力供应已成为比GPU供应更关键的瓶颈 [11] - AWS推出新数据中心设计加速部署,在印第安纳州和密西西比州以惊人速度建设接近2GW容量 [11] - Microsoft经历长达一年数据中心建设暂停,显著降低2027年容量预测,威斯康星州大规模AI集群建设进度缓慢 [11] - Microsoft大量AI算力被OpenAI长期合同锁定,OpenAI积压订单规模是Azure年收入的2.5倍,导致服务外部客户容量比账面数字少 [12] - Microsoft为弥补容量不足从Coreweave等新兴云服务商租用容量,但成本更高且侵蚀利润率优势 [12] - Google Cloud最近一个季度收入增长超过60%,利润率创历史新高,但部分利润率增长被分析认为是"假象" [12] - Alphabet层面在2026年第一季度反映共享AI研发支出达54亿美元,而2025年同期为30亿美元,年化超100亿美元成本计入Alphabet层面而非Google Cloud [13] - 所有Gemini API收入流向Google Cloud并享受高利润率,但训练成本在别处,若成本合理分配则Google Cloud利润率表现不会那么亮眼 [14] 模型竞争与平台化趋势 - AI模型间差异正在快速缩小,预计未来两年内对于常见使用场景各家模型质量将非常接近 [17] - 当模型质量趋同后,首先将出现价格压力,模型商品化后定价权大幅下降 [17] - 竞争焦点将向价值链上游转移,转向生态系统、集成能力、企业支持等方面 [17] - 模型本身会变成基础设施,真正价值体现在如何将模型整合到具体业务流程中并确保可靠、安全、合规运行 [18] - 企业市场护城河不在模型本身而在平台能力,企业客户更关心数据处理、法规遵从、数据安全等问题 [19] - 数据引力使企业客户在不同平台间迁移数据成本高,对于需与现有数据资产深度整合的agentic工作负载,数据位置至关重要 [19] - Agent兴起强化平台趋势,Agent需要身份认证、权限管理、审计日志等企业IT基本要求 [20] - 企业级AI部署需要一整套平台能力,而不仅是好的模型,这是大型云平台的优势 [21] 商业模式与企业市场洞察 - 需区分企业市场和消费者市场,企业市场利润空间大,企业客户支付价格与实际成本间有相当大差距 [22] - 企业客户对价格敏感度不高,更关心任务可靠完成、版本稳定性、企业支持等因素 [22] - 推理成本已在下降且价格继续降低,企业客户对此压力不大,真正可能问题是Agent工作负载的token消耗 [22] - 消费者AI服务很难直接盈利,必须依赖广告支持,免费用户推理成本是沉重负担 [23] - OpenAI有大量免费用户产生高推理成本但不产生收入,付费用户单价远低于企业客户 [23] - Anthropic收入主要来自API和企业客户,消费者业务占比较小,使其在2026年第二季度实现运营利润(调整股权激励后)而OpenAI仍在亏损 [23] - 不同业务模式利润率差异巨大,传统IaaS业务利润率受成本挤压,而Bedrock这样的TaaS业务利润率可达55% [23] - Anthropic推理业务毛利率从2024年负94%快速提升至2026年60%以上,改善速度远超预期 [24] - 在AI领域,商业模式选择可能比技术优势更重要,找到合适商业模式即使技术不是最领先也可能获得很好财务回报 [24] 行业生态与合作伙伴关系演变 - Google的TPU案例显示生态系统成熟度往往比单纯性能指标更重要,Nvidia的CUDA生态系统拥有工具、库和有经验开发者等生态优势 [9][10] - Midjourney团队爆料因使用TPU导致开发进度延后一年,主要因TPU生态系统不够成熟 [9] - Google在多战场竞争导致资源分散,容量建设无法满足所有需求,其内部容量足以支撑一个成功AI实验室但留给云业务增长空间有限 [10] - Google通过Broadcom向Anthropic销售TPU硬件并扮演IP授权方角色,但这种一次性硬件销售收入商业价值远低于持续云服务收入 [10] - Microsoft与OpenAI关系发生微妙变化,从独家IP合作转向真正多模型平台策略,客户可在Azure上使用Anthropic、Grok、DeepSeek等多公司模型 [15] - Microsoft核心产品如GitHub Copilot和Office Copilot本质是产品层,底层模型可替换,产品价值在于与生态系统的深度整合 [15] - OpenAI最近采用多云策略,开始与Oracle、Cerebras等多家云服务商合作,削弱了与Microsoft独家合作的价值 [16] - 在AI基础设施领域,独家合作价值正在下降,平台能力和生态系统整合变得更加重要 [16]