中信证券:存力升级为当前智能体推理核心需求
文章核心观点 - AI技术正从“简单对话”向“智能体(Agent)”演进,这一趋势驱动模型上下文长度激增,进而导致对显存(存力)的需求爆发,存储行业的成长趋势被坚定看好 [1] AI技术演进与需求驱动 - AI技术演进路径是从“简单对话”向“智能体(Agent)”发展 [1] - 技术演进驱动模型上下文长度激增 [1] - 据Epoch AI数据,最长上下文窗口约每年增长30倍 [1] 显存需求与硬件瓶颈 - 关键值缓存(KV Cache)的显存容量与上下文长度呈线性增长关系 [1] - 显存需求的增速远超硬件配置的增速 [1] - 尽管大模型厂商和硬件厂商通过量化、分层存储、模型架构优化等方式试图解决存力瓶颈,但显存需求爆发的趋势并未改变 [1] 成本、需求与行业影响 - 显存优化有望降低单Token的生成成本 [1] - 成本降低预计将刺激用户开启更高并发与使用更长上下文 [1] - 因此,总存力需求将不减反增 [1] - 存力升级被视为当前Agent推理的核心需求 [1] - 基于以上判断,行业坚定看好存储的成长趋势 [1]