行业活动与产品发布 - 2025年开放数据中心大会(ODCC)于9月9日至11日在北京举行 主题为"拥抱AI变革 点燃算网引擎" 聚焦数据中心 算力 存储领域专家和企业代表 [1] - 江波龙在大会现场正式发布基于LPDDR5/5x的创新企业级内存产品SOCAMM2 旨在应对不同规模AI工作负载挑战 [1] - 公司企业级SSD产品总监曹匡文发表《用AI存储赋能AI应用》主题演讲 全面介绍如何利用人工智能技术优化存储系统 [1] SOCAMM2产品技术特性 - SOCAMM2基于LPDDR5/5x颗粒和CAMM模块化设计 采用4-N-4 HDI超高密度互连叠层结构 极大提升设计复杂度和孔密度 [7] - 产品去除顶部凸出梯形结构 降低整体高度 更适合服务器安装环境和液体冷却系统 在14×90 mm紧凑尺寸内最大实现256GB容量 [7] - 数据传输速率高达8533Mbps 功耗仅为标准DDR5 RDIMM的1/3 同容量下带宽提升至2.5倍 显著降低AI推理延迟 [7] - 主要面向HPC 通用服务器 AI集群服务器 AI训练/推理 智能辅助驾驶和工业边缘网关等应用场景 [7] SOCAMM2与HBM的架构互补性 - HBM以固定封装和高成本换取极致带宽 SOCAMM2以可替换 高效益模块化设计实现容量 功耗与弹性平衡 [10] - 实际系统中可同时采用HBM应用于GPU侧 SOCAMM2用作CPU侧 兼顾带宽与容量双重提升 [10] - SOCAMM2在性能 能效与空间效率三个维度创新 为高性能计算与创新存储架构提供全新解决方案 [10] AI存储系统挑战与解决方案 - AI大集群存储系统面临GB级 TB级到PB级数据流的不同性能瓶颈和可靠性挑战 企业级SSD是AI集群核心基石 [12] - 性能瓶颈包括训练阶段随机读取 推理阶段高并发访问 检查点保存时大量顺序写入 需低延迟 优秀QoS和规避长尾延时 [14] - 可靠性挑战包括高写入量和高负载下故障预测困难 生命末期数据安全保障 [14] - 通过智能负载感知技术实时识别冷热数据 优化缓存策略和数据布局 显著提升系统性能 [14] - 通过机器学习模型分析SSD内部多项实时参数 建立精准可靠性模型 实现预测性主动维护和及时告警 [14] 智能存储技术突破 - 智能性能优化利用控制器内置ML机器学习能力 实现预测性流量控制 智能任务优先级调度和数据访问模式学习 [16] - 与无流量控制 无优先级管理 无冷热识别的传统方案相比 新一代智能存储显著提升吞吐效率和响应速度 [16] - 寿命预测智能化通过分析实时工作温度梯度 NAND健康特性 最优读写电压变化 读写错误计数和系统日志等数据 [16] - 智能运维系统自动预警硬盘健康状况 实现存储生命末期提前告警 规避掉盘和数据丢失风险 降低运维复杂度 [16] 可靠性提升技术 - 通过ML机器学习模型精确计算最佳读取电压 提高读取速度和纠错能力 UBER等可靠性指标显著优于业内主流水平 [17] - 通过NAND Flash闪存介质研究和特性分析改善QLC生命末期数据可靠性 [17] - 结合智能算法识别LBA热度 实现冷热分流 有效降低WAF(写放大) 进一步提升SSD寿命 [17] - 未来计划将QLC领域技术储备全面应用于即将发布的企业级SSD产品 [17] 研发制造体系 - 上海总部是TCM与PTM商业模式核心载体 也是AI存储技术研发中枢 配备企业级存储实验室 [21] - 实验室聚焦大容量 高性能 高阶软硬件的产品技术方案 与苏州封测制造基地 中山存储产业园多地协同 [21] - 通过"研发+封测+制造"一站式存储服务 根据客户特定需求完成高度定制化创新产品 [21] - 能够精确控制产品特性 成本与交付周期 持续深化AI训练 AIGC推理等多元应用场景 [21] 未来产品规划 - 公司将推出支持QLC和PCIe Gen5的企业级SSD 融入更多智能化创新与高阶算法 [25] - 为AI数据中心提供更多优选存储方案 [25]
江波龙发布SOCAMM2:创新内存加速AI算力