存力中国行暨先进存力AI推理工作研讨会在京顺利召开
证券日报网·2025-11-07 15:29

会议核心观点 - 会议核心观点为AI规模化应用推进过程中,推理环节的成本、效率、质量问题凸显,先进存力成为提升AI推理效能、控制成本的关键支撑 [1][2] - 国家政策层面高度重视先进存力发展,在《算力基础设施高质量发展行动计划》等政策中明确方向,行业需凝聚共识共同推动存算协同发展 [2] 行业挑战与趋势 - AI推理面临KV Cache存储需求升级、多模态数据协同、存算协同带宽不足、负载潮汐性及成本控制等挑战 [3] - IT基础设施能力面临三大挑战:"管不好"的数据、"喂不饱"的算力、"降不下"的成本,传统存储架构难以满足高吞吐、低时延及异构数据融合需求 [4] - 未来存储技术趋势是从被动存储转向智算协同,分阶段落地高密全闪存储、数据高速互联、存算一体等技术,长远构建池化多体存储体系 [3] 公司技术方案与实践 - 中国移动云能力中心采用分层缓存调度、高速数据互联、多模数据专属存储、架构池化重组、高密全闪存储、数据缩减及自研SPU高密服务器等技术应对推理挑战并降低成本 [3] - 华为推出UCM推理记忆数据管理技术,通过集中高质数据、提速AI训练、优化推理效能三个角度打造AI推理加速解决方案 [4] - 北京硅基流动科技有限公司构建AI infra工具链,核心推理框架适配100多款开源大模型,结合UCM技术卸载KVCache释放显存,并通过智能网关优化流量调度与弹性扩缩容 [4] 行业生态建设 - 中国信息通信研究院联合产业链企业成立"算力产业发展方阵先进存力AI推理工作组",工作组成员包括中国移动云能力中心、华为、硅基流动、浪潮信息等公司 [2][5] - 会议提出三点产业发展建议:鼓励前沿存储技术研发创新,推动存算运深度融合,加强存算协同产业生态建设 [2]