黄仁勋:AI彻底改变计算堆栈,现在,存储也加入了这场变革丨直击CES
公司产品发布 - NVIDIA在CES 2026上宣布推出NVIDIA推理上下文记忆存储平台,这是一种新型AI原生存储基础设施,专为AI新前沿而打造[1][4] - 该平台由NVIDIA BlueField-4数据处理器提供支持,作为全栈NVIDIA BlueField平台的一部分[1][4] - 平台旨在提升键值(KV)缓存容量,并加速机架规模AI系统集群之间的上下文共享[2][5] - 平台可为多轮AI智能体的上下文持久地提高响应速度和AI工厂吞吐量,并支持长上下文、多智能体推理的高效扩展[2][5] 产品技术背景与需求 - AI模型正扩展到数万亿参数和多步骤推理,生成大量以键值(KV)缓存表示的上下文数据,这对准确性、用户体验和连续性至关重要[1][4] - 键值(KV)缓存无法长期存储在GPU上,因为这会成为多智能体系统中实时推理的瓶颈[1][4] - AI原生应用需要一种新型的可扩展基础设施来存储和共享这些上下文数据[1][4] 产品性能与优势 - NVIDIA推理上下文记忆存储平台通过扩展GPU内存容量为上下文记忆提供基础设施,实现跨节点的高速共享[1][5] - 与传统存储相比,该平台可将每秒处理的token数量和能效提升高达5倍[1][5] 行业与战略意义 - AI正在彻底改变整个计算堆栈,存储也加入了这场变革[2][5] - AI正从单次交互的聊天机器人,演进为能够理解物理世界、进行长期推理、基于事实、使用工具完成实际工作并兼具短期和长期记忆的智能协作伙伴[2][5] - 借助BlueField-4,NVIDIA及其软硬件合作伙伴正在为AI新前沿重塑存储堆栈[2][5]