Workflow
记忆计算
icon
搜索文档
首个大规模记忆平台MemoryLake发布 推动AI基础设施从“数据”迈向“记忆”的关键一步
证券日报网· 2026-02-06 19:10
文章核心观点 - 质变科技发布多模态记忆平台MemoryLake 标志着AI基础设施从“以数据为中心”迈入“以记忆为中心”的新阶段 被视为AI技术发展史上的重要分水岭 [1][5] 产品发布与定位 - 公司正式发布具备超大规模实践能力的多模态记忆平台MemoryLake 该平台首次将多模态内容深度理解、存储、计算与管理全栈能力融为一体 [1] - MemoryLake由MemoryLake-D1大模型、MemoryLake记忆引擎和多模态存储与计算平台构成 是首个大规模记忆平台 [1] - 产品旨在解决企业AI落地的根本挑战 包括多模态信息融合难、数据碎片化、模型决策不可靠、大模型调用成本高、数据规模大响应迟缓等痛点 [1] 技术范式与能力 - 平台基于“记忆计算”新范式 推动AI基础设施从处理“行为记录”转向处理“决策轨迹” 这是智能体网络的基础 [2] - 平台搭载三大核心技术组件 打通了记忆的提取、存储、管理与计算全流程 [2] - MemoryLake记忆引擎是平台的核心“大脑” 实现类人方式的记忆组织、动态更新与高效检索 [3] - 在实际测试中 模型可执行复杂指令 如从多日数据中提取、分组汇总并跨日对比分析 将耗时数日的工作缩短至分钟级 [2] - 该模型在权威的表格理解评测中表现出全球领先的准确率 [2] 市场验证与行业应用 - 平台能力已在超大规模实践中得到验证 服务全球超过150万个专业用户和1.5万家企业客户 [4] - 行业覆盖金融、工业制造、游戏、教育、法律、电商等 [4] - 在沉浸式游戏场景中 能为AI NPC构建持续演进的“世界观记忆”和“玩家记忆” [4] - 与市场上其他同类方案相比 在长期记忆能力、多模态支持、记忆演化管理、平台扩展性、企业级安全合规等方面展现出显著优势 [4] 战略意义与行业影响 - 公司创始人认为AI的未来是记忆驱动的未来 企业需要的是一个更懂业务、更能积累、更善推理与反思的“记忆系统” [5] - MemoryLake的发布是将“记忆即智能”理念转化为企业级认知基础设施的关键一步 [5] - 这一发布标志着AI基础设施范式正从数据驱动跨越到记忆驱动 一个全新的认知计算时代已然开启 [5]
业界首个!记忆张量联手商汤大装置落地国产 PD 分离集群,推理性价比达 A100 的 150%
新浪财经· 2025-12-05 20:56
核心观点 - 记忆张量与商汤大装置联合,在国产GPGPU上成功部署了业内首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群,实现了显著的性能提升和成本优势,标志着国产算力体系在大模型商业化路径上首次具备“体系级”竞争力 [1][8] 技术方案与架构创新 - 记忆张量的核心产品MemOS是业内唯一以记忆为中心、进行系统设计的基础设施,它将大模型认知结构划分为三类记忆,并形成跨时间尺度的调度链路,能精细决策计算的前移与保留 [2][9] - MemOS与PD分离技术结合,通过其调度逻辑将PD分离的收益空间最大化,使PD分离从一个性能优化技巧转变为可完整描述、度量并长期运行的新推理范式 [2][5][9] - 商汤大装置为MemOS提供了顶层系统级基础设施支撑,包括IaaS算力池、智能调度、Ignite框架的性能增强以及万象MaaS平台的统一调度策略 [2][10] - 在国产GPGPU集群上,MemOS的记忆结构被清晰映射为物理分工:P域作为“记忆工厂”批量预生成KV Cache;D域作为“实时交互前台”专注解码;跨节点KV Cache通过高带宽互联实现“即产即用” [4][12] 性能与效率成果 - 在真实C端负载下,单卡并发效率提升约20%,从25.00并发/卡提升至29.42并发/卡 [1][6][12] - 集群整体吞吐量提升超过75%,从Naive部署下的107.85 tokens/s提升到189.23 tokens/s [6][12] - 综合推理性价比达到同代NVIDIA A100的150%左右,在严格SLA与相同负载结构下,首次实现了对A100的体系级正面超越 [1][6][13] - TTFT(首字延迟)全程稳定小于2秒,KV Cache在热门场景中的命中率提升70%+,提高了预计算复用率,进一步摊薄了推理成本 [6][12] 行业意义与未来展望 - 该成果为高性能模型的大规模落地打开了全新的降本增效空间 [1][8] - 双方计划未来围绕更大规模国产GPGPU集群构建记忆驱动流水线推理底座,并持续打磨Prefill行为预测、多级记忆管理等方向,以承载伴随式AI、具身智能体等更复杂任务 [7][14] - 此次实践为国产算力体系开辟了一条从“参数计算”走向“记忆计算”、从“静态推理”走向“动态流水线”的结构性路线,国产GPGPU有机会成为下一代推理范式的定义者之一 [7][14]