未知机构:算力缺口将持续到2027年Agent爆发带来的算力缺口是底层-20260209
2026-02-09 11:05

行业与公司 * 涉及的行业:人工智能(AI)算力行业,具体涵盖AI芯片(GPU、CPU)、存储(HBM)、先进封装、数据中心基础设施等[1][2][3] * 涉及的公司/案例:Kimi(月之暗面)[1]、特斯拉[4]、小鹏汽车[5] 核心观点与论据 * 核心观点:AI Agent的爆发将导致算力缺口持续至2027年,甚至更久 * 根本原因:AI Agent的普及是底层逻辑的质变,驱动算力需求呈指数级增长,而非线性增长[1][3] * 持续时间:算力缺口将持续至2027年第二季度,部分高端环节的紧张可能延续至2030年[1][3] * 论据一:单Agent算力消耗远超传统Chatbot * 任务性质质变:Agent任务从“聊天”变为“执行”(如一句话点外卖),导致Token消耗爆炸式增长[1] * 具体数据:传统Chatbot单次交互约2,000 token;Agent启动阶段消耗1-2万 token,单步思考消耗20万+ token,完成项目总消耗达百万级token,是普通用户的100-1000倍[1] * 论据二:算力需求结构发生质变,并发率飙升 * 工作模式:从“用户触发”变为“7×24小时自主工作”[1] * 并发率变化:长任务并发率从ChatGPT时代的约1%飙升至Agent时代的30%-40%,导致资源持续占用不释放[1] * 论据三:算力核心硬件全面缺货且扩产周期长 * 缺货现状:GPU(“卡”)严重短缺,Kimi(月之暗面)在2026年2月5日公开表示“是真的缺卡”[1][2];存储(如HBM)价格已上涨好几倍;CPU也面临缺货和延期[2] * 供给受限:先进制程产能优先排产GPU,材料供给受限等多因素叠加[2] * 扩产周期:算力核心硬件(GPU、HBM、先进封装、CPU)的扩产周期都在18-24个月以上[3] * 论据四:2026-2027年将迎来“训练+推理+边缘”三端共振 * 进一步拉长算力缺口周期[3] * 论据五:区域数据政策导致算力需求区域错配,催生新增量 * 政策要求:许多国家(如美国、中国、欧洲)不允许数据出境,跨国企业需在当地建立数据中心[4] * 新增市场:这催生了数据中心本地化建设的新增长需求[4] * 案例佐证:特斯拉宣布其国内的AI训练中心投入使用;小鹏汽车出海欧洲,其智能驾驶也需要在欧洲建立AI训练中心[4][5] 其他重要但可能被忽略的内容 * CPU成为Agent任务的核心瓶颈:在Agent任务中,90.6%的端到端延迟消耗在CPU(用于工具调用、任务拆解、逻辑判断),GPU仅负责不到20%的密集计算[1] * 对产业链的潜在影响:硬件短缺和区域错配可能利好国产替代,例如光刻机、光刻胶等领域[3] * 一个创新的设想:为应对数据本地化要求,提出了一个设想——是否可能在巨轮上建立可移动的数据中心,以实现硬件复用,同时满足数据本地化要求[5]