算力缺口
搜索文档
未知机构:算力缺口将持续到2027年Agent爆发带来的算力缺口是底层-20260209
未知机构· 2026-02-09 11:05
行业与公司 * **涉及的行业**:人工智能(AI)算力行业,具体涵盖AI芯片(GPU、CPU)、存储(HBM)、先进封装、数据中心基础设施等[1][2][3] * **涉及的公司/案例**:Kimi(月之暗面)[1]、特斯拉[4]、小鹏汽车[5] 核心观点与论据 * **核心观点:AI Agent的爆发将导致算力缺口持续至2027年,甚至更久** * **根本原因**:AI Agent的普及是底层逻辑的质变,驱动算力需求呈指数级增长,而非线性增长[1][3] * **持续时间**:算力缺口将持续至2027年第二季度,部分高端环节的紧张可能延续至2030年[1][3] * **论据一:单Agent算力消耗远超传统Chatbot** * **任务性质质变**:Agent任务从“聊天”变为“执行”(如一句话点外卖),导致Token消耗爆炸式增长[1] * **具体数据**:传统Chatbot单次交互约2,000 token;Agent启动阶段消耗1-2万 token,单步思考消耗20万+ token,完成项目总消耗达百万级token,是普通用户的100-1000倍[1] * **论据二:算力需求结构发生质变,并发率飙升** * **工作模式**:从“用户触发”变为“7×24小时自主工作”[1] * **并发率变化**:长任务并发率从ChatGPT时代的约1%飙升至Agent时代的30%-40%,导致资源持续占用不释放[1] * **论据三:算力核心硬件全面缺货且扩产周期长** * **缺货现状**:GPU(“卡”)严重短缺,Kimi(月之暗面)在2026年2月5日公开表示“是真的缺卡”[1][2];存储(如HBM)价格已上涨好几倍;CPU也面临缺货和延期[2] * **供给受限**:先进制程产能优先排产GPU,材料供给受限等多因素叠加[2] * **扩产周期**:算力核心硬件(GPU、HBM、先进封装、CPU)的扩产周期都在18-24个月以上[3] * **论据四:2026-2027年将迎来“训练+推理+边缘”三端共振** * 进一步拉长算力缺口周期[3] * **论据五:区域数据政策导致算力需求区域错配,催生新增量** * **政策要求**:许多国家(如美国、中国、欧洲)不允许数据出境,跨国企业需在当地建立数据中心[4] * **新增市场**:这催生了数据中心本地化建设的新增长需求[4] * **案例佐证**:特斯拉宣布其国内的AI训练中心投入使用;小鹏汽车出海欧洲,其智能驾驶也需要在欧洲建立AI训练中心[4][5] 其他重要但可能被忽略的内容 * **CPU成为Agent任务的核心瓶颈**:在Agent任务中,**90.6%的端到端延迟消耗在CPU**(用于工具调用、任务拆解、逻辑判断),GPU仅负责不到20%的密集计算[1] * **对产业链的潜在影响**:硬件短缺和区域错配可能**利好国产替代**,例如光刻机、光刻胶等领域[3] * **一个创新的设想**:为应对数据本地化要求,提出了一个设想——是否可能在巨轮上建立可移动的数据中心,以实现硬件复用,同时满足数据本地化要求[5]