Workflow
UCM(Unified Cache Management)统一缓存管理技术
icon
搜索文档
存力中国行北京站释放信号:AI推理进入存算协同深水区
搜狐财经· 2025-11-11 20:38
【环球网科技报道 记者 张阳】11月4日,"存力中国行"北京站活动在中国信息通信研究院顺利举办,来自产业链上下游的企业代表、专家学者及媒体共同聚 焦AI推理时代的存力挑战与创新路径。随着AI技术从模型研发走向行业规模化应用,推理阶段的性能、效率与成本控制成为决定技术落地价值的"最后一公 里",而先进存力作为核心支撑底座,正迎来技术重构与生态协同的关键变革期。 Token经济时代,推理成本成行业落地瓶颈 但繁荣背后,三大核心痛点制约着AI推理的规模化落地:数据层面,多模态数据爆发式增长使存储面临PB到EB级的容量压力,且数据格式异构、流通困难 导致高质量数据集构建成本高昂;性能层面,KV Cache技术的广泛应用对存储的高带宽、低时延提出严苛要求,传统架构难以满足存算协同需求;成本层 面,HBM等高端存储介质价格昂贵,叠加推理负载的潮汐性特征,导致中小企业智能化转型门槛居高不下。 当前,AI产业已从"造模型"的狂热期迈入"用模型"的深耕期,大模型数量逐渐收敛,推理应用呈现爆发式增长。金融风控、医疗辅助诊断、电商推荐、投研 分析等场景的深度渗透,推动Token调用量呈指数级攀升,"Token经济"时代已然到来。 ...