推理经济
搜索文档
AWS 要重新加速了?OpenAI“多云化”,可能是云计算格局变化的开始
美股研究社· 2026-03-09 19:12
核心观点 - AI算力需求正从“单一云平台”走向“多云平台”,全球云计算市场的增长结构可能发生重大变化,亚马逊云服务(AWS)可能成为最大的潜在受益者 [2][3][20] 从“Azure独占”到“多云算力”:AI基础设施的第一道裂缝 - 过去两年,AI基础设施的叙事由“OpenAI + Azure + NVIDIA”的铁三角组合主导 [5] - 微软对OpenAI投入超过130亿美元,达成深度排他性合作,OpenAI的训练与推理算力几乎完全运行在微软Azure上 [7] - AI服务在2024至2025年间为微软Azure贡献了超过7个百分点的额外增长 [7] - 单一云平台面临物理与商业瓶颈,难以承载AI时代指数级算力需求 [7] - GPT-4级别模型的单次训练成本已达到数亿美元,大模型的推理请求量每年以10倍级速度扩张 [7] - 头部AI公司为规避“供应商锁定”风险,开始主动采用多云策略 [8] - 英伟达CEO黄仁勋的表态显示,OpenAI已开始将部分算力需求扩展至AWS,标志着AI云市场首次在基础设施层面出现“分流” [2][8] AWS的AI飞轮:OpenAI、Anthropic与推理经济 - Azure在AI时代第一阶段凭借“训练算力”的独占性获胜,而AWS可能在第二阶段押注“推理经济” [10] - OpenAI的算力扩张,特别是从C端向B端企业应用渗透时,倾向于采用跨云部署以获取更多GPU资源并降低平台依赖风险,这为AWS带来新的收入增量机会 [11] - Amazon已向Anthropic投资80亿美元以上,并计划进一步追加投资,建立了深度战略合作 [13] - Claude系列模型的基础设施大量运行在AWS上,并通过Amazon Bedrock平台向企业客户开放 [13] - AI推理是长期的现金流,每一次模型调用都关联着API调用、数据库读写、对象存储、网络带宽及安全服务,能带来更稳定、品类更丰富的云收入 [14] - 在推理阶段,市场关注点从谁有最多的H100 GPU,转向谁的生态系统最能支撑大规模、低延迟、高并发的应用落地,AWS积累十年的企业级服务能力构成其新护城河 [14] Agentic AI:真正放大云计算需求的“下一阶段” - Agentic AI(代理智能)使AI从“回答问题”转向“执行任务”,任务流程包含多轮模型推理、自主规划、数据库访问、第三方API调用、后台服务执行及长期记忆存储 [16] - 这种转变意味着AI将同时拉动CPU、存储、数据库、网络以及整个云服务生态的消耗,而不仅仅是GPU [16][17] - 每一个AI Agent都像一个全天候运行的软件系统,会持续消耗云资源并产生云收入 [18] - AWS拥有超过200种云服务品类,当AI从“对话框”变成“操作系统”,这种提供全方位基础设施的平台价值将被重新放大,Agentic AI越复杂,对AWS的依赖可能越深 [18] 从算力军备到生态长跑 - AI基础设施的叙事正从“谁能拿到最多GPU”的硬件军备竞赛,转向关于稳定性、生态系统、成本控制及多云架构能力的综合平台竞争 [20] - 随着AI从训练走向推理、从工具走向Agent,云计算市场真正的增长周期可能才刚刚开始 [20] - 投资者视角应从关注英伟达的显卡出货量,转向关注云厂商如何将AI流量转化为持久的平台收入 [20] - AWS凭借其深厚的基础设施积淀和多云策略的红利,很可能重新回到舞台中心 [20]
深度|CEO详解亚马逊的AI路径图: 创收数十亿只是起点
搜狐财经· 2025-07-01 15:54
AWS业务成就与AI发展 - AWS过去一年最大成就是客户对新技术尤其是AI和生成式技术的快速采用,见证了大量企业将业务体系迁移至云端[4] - AI业务规模已达数十亿美元,包含客户运行自有模型业务、Amazon Bedrock平台服务以及应用层产品如Amazon Q[6] - 生成式AI技术被广泛应用于亚马逊内部,包括物流中心优化、零售网站用户评论总结、Alexa Plus服务升级等[7] AI工作负载趋势 - AI工作负载中推理占比已超过训练,长期预计将达80%-90%,推理功能正成为应用程序的基础设施组件[8][10] - AI深度融入应用开发与用户体验,未来难以区分业务收入中AI驱动比例,因其已成为核心部分[9] - 行业指标从单纯关注token生成量转向更复杂评估,因图像视频生成等场景运算强度远超token输出量[11] 技术创新与项目进展 - Project Rainier是与Anthropic合作打造的巨型计算集群,规模是前代5倍,采用定制处理器Tranium two训练下一代模型[13] - Tranium two在性能、性价比及扩展性方面突破极限,正部署并投入运营,Anthropic已开始使用部分资源[13] - 推出基于Nvidia GB 200的P6实例系列,性能表现优异,正全球扩展产能满足需求[16] 生态合作与市场扩展 - 市场空间足够容纳Tranium与Nvidia技术共存,AWS与Nvidia保持设计合作伙伴关系,提供最新技术选项[14][15] - 支持跨云平台策略,但观察到绝大多数AI应用仍运行在AWS上,典型案例如Mondelez全面迁移至AWS[17] - 在拉美地区积极扩展数据中心产能,包括墨西哥、智利新建区域及巴西现有区域[18] 未来机遇 - 即将推出"欧洲主权云",专为欧盟关键主权工作负载设计,预计创造巨大市场机遇[5] - AI技术仍处变革起点,当前数十亿美元业务规模仅是开端,将深度重构各行业运作方式[6]
深度|CEO详解亚马逊的AI路径图: 创收数十亿只是起点
Z Potentials· 2025-07-01 15:22
AWS的成就与AI业务发展 - AWS在过去一年见证了客户创新和新技术的快速采用,尤其是AI和生成式技术的爆发式增长[3] - AWS的AI业务已达到数十亿美元规模,包含基础设施业务、Amazon Bedrock平台以及应用层产品如Amazon Q[4] - AI已渗透到亚马逊业务的每个环节,包括物流中心优化、零售网站用户评论总结、Alexa Plus服务等[5] AI工作负载与推理经济 - 当前AI工作负载中推理的使用量已超过训练,预计未来80%至90%的AI工作负载将属于推理范畴[7][8] - 推理将深度嵌入应用程序,成为基础设施组件,如同计算、存储和数据库一样不可或缺[6][7] - token生成量是衡量AI工作负载的参考标准之一,但无法完全反映实际工作量,尤其在图像和视频生成领域[9] 技术创新与项目进展 - Project Rainier是与Anthropic合作的大规模定制服务器项目,用于训练下一代云端模型,规模是前代集群的五倍多[10] - Tranium two服务器已投入运营,在性能、性价比及扩展性方面表现突出[10] - AI成本仍然过高,需通过芯片级创新、软件优化及算法改进来降低计算资源消耗[11][12] 开放生态与合作策略 - AWS与Nvidia保持合作关系,提供最新的Nvidia技术如P6实例系列,同时发展自有技术如Trainium[14][16] - 市场空间巨大,AWS与Nvidia并非对立关系,客户需要技术选择的自由[14][15] - Anthropic模型在其他云平台的可用性不影响AWS的核心竞争力,多数相关应用仍运行在AWS上[17] 全球扩展与市场机遇 - AWS在拉美地区持续扩展产能,包括墨西哥、智利和巴西区域[19] - 欧洲市场将推出"欧洲主权云",专为欧盟关键主权工作负载设计,预计创造巨大市场机遇[6][19]