行业趋势:AI大模型从生成式向代理式演进 - AI大模型正处于从生成式AI走向代理式AI的关键时刻 [1] - 在此背景下,腾讯、阿里等厂商通过发红包以争夺用户 [1] 市场现象:红包大战与算力需求激增 - 腾讯、阿里巴巴、百度、字节跳动等厂商纷纷下场参与红包大战 [2] - 红包大战使得对AI基础设施的需求大增 [2] - 算力需求已从训练驱动的单一模式,转变为训练+推理双轮驱动且推理占比不断上升的新模式 [5] 行业影响:云服务与算力租赁价格上涨 - 云计算服务商优刻得宣布自2026年3月1日起,对全线产品与服务进行价格上浮调整 [1][2] - 涨价公告发布后,优刻得股价收涨20% [1] - 全球云计算巨头亚马逊云科技(AWS)对其面向大模型训练的EC2机器学习容量块实施约15%的价格上调,这是AWS约20年来首次打破“只降不涨”的定价传统 [2] - 开源证券认为,AWS此次涨价确认了全球AI算力需求端的高景气度,同时AI云产业链资源稀缺性或日益凸显 [3] 涨价动因:成本上升与需求爆发 - 优刻得表示涨价主要由于全球供应链波动导致核心硬件采购等基础设施成本出现显著、结构性的上涨,同时近期需求也在增加 [2] - 云服务商派欧云(PPIO)指出,涨价主要原因是推理需求的爆发式增长,其中Agent(智能体)的需求是主要增长因素 [4] - 推理成本的上涨动力还来自服务质量的持续提高,如高SLA、低时延、长上下文、多模态等服务会产生支付溢价 [4] 需求驱动:Agent应用导致推理需求指数级增长 - Agent的实时交互、多轮推理、工具调用与自主规划等能力,使得单次任务所需的推理次数呈指数级上升 [5] - Agent的广泛应用放大了Token(词元)的消耗,进而推高算力需求 [5] - Agent推理上下文逐渐增加到200K以上,且由于计算复杂度与上下文长度是平方关系,长上下文对算力的需求呈指数级增长 [5] - 据估算,Agent场景下单用户的Token消耗量是普通Chat的10倍至50倍 [5] - Agent对内存的需求也在持续增加,主要体现在Agent工具的数据记忆需求 [5] 算力部署架构:云-边-端协同发展 - 对于边缘和端侧AI推理,行业认为会增加部署,但会是“云—边—端协同”的混合架构 [5] - 实时性强、隐私要求高、网络不稳定的场景会下沉到端和边缘,用小模型或本地推理保证响应 [5] - 需要最强通用能力、快速迭代的大模型能力,仍会集中在云端 [5] - 关键不在把所有算力搬到端上,而在把任务链路切分得更合理 [5] - 优刻得表示会根据客户对延迟、成本、合规性的差异化要求,灵活调度云端、边缘与端侧算力资源 [5]
发布涨价公告后股价“20CM”涨停!红包大战正酣,算力租赁赚翻?