AI存力

搜索文档
突破存力瓶颈,平头哥镇岳SSD主控芯片:全面赋能
半导体行业观察· 2025-03-19 08:54
核心观点 - AI全生命周期对存力有多维度、动态化需求,传统存储架构面临挑战,行业需要芯片底层技术革新 [1] - 平头哥半导体镇岳510 SSD主控芯片通过架构与算法创新破解AI存力瓶颈 [1][3] - 镇岳510在低时延、高能效、高带宽、高可靠、低成本、高容量六个维度实现突破,被称为"六边形战士" [4] - 芯片采用RISC-V核异构计算集群和专用硬件加速单元,实现全链路硬件化,时延压缩至4μs [5] - 创新LDPC算法将UBER降至10^-18级别,纠错性能达国际第一梯队 [6] - 已与阿里云、忆恒创源、得瑞领新、佰维存储等厂商合作构建AI存力生态 [9][10][11] 技术突破 架构创新 - 集成6颗RISC-V核构建异构计算集群,搭配专用硬件加速单元 [5] - 实现"指令解析-队列管理-缓存分配"全链路硬件化,IO处理延迟压缩至4μs [5] - IO执行路径全面硬化,命令解析等环节无需软件干预 [5] 算法创新 - 突破LDPC纠错算法的"不可能三角",融合BF和NMS两套算法优势 [6] - 开发动态适配矩阵架构,一套基础矩阵支持多种NAND码率需求 [6] - 实测UBER达10^-18级别,纠错性能天花板降低一个数量级 [6] 性能指标 - 随机写时延4微秒,4K随机写性能100万IOPS [4][10] - 每瓦特提供420K IO处理能力,能效比提升70% [4][10] - 带宽≥3400K IOPS,顺序读写速度达14/10 GB/s [4][10] - 支持≥32TB容量,全面兼容QLC/TLC NAND [4] 商业化落地 - 已在阿里云EBS业务大规模上线,时延压缩92% [9] - 忆恒创源PBlaze7 7A40 SSD实现55/5μs超低延迟 [10] - 得瑞领新D8436/D8456系列性能功耗比提升70% [10] - 佰维存储企业级SSD产品开发中,多维度性能获认可 [10] 未来规划 - 下一代芯片目标为提升可靠性同时大幅降低功耗 [14] - 计划打通存储、网络、计算三方协议,推动生态协同 [14] - 以芯片级创新撬动存储产业链升级,支撑AI智能化跃迁 [14]
低调平头哥,吹响先进存力商业化号角
量子位· 2025-03-17 12:37
文章核心观点 - 公司认为在AI时代需全面提升先进存力,平头哥凭借镇岳510方案成为存储设施建设重要力量,其在多方面取得进展并具备技术优势,有望引领存力设备升级换代潮 [1][26] 分组1:AI存力发展现状与需求 - 存储设备在AI基础设施中受关注少,存力发展不充分,但会制约AI等大规模数据应用 [1] - SSD的I/O延迟远高于DRAM延迟,数据从存储到内存的传输是大模型训练数据供给速度的瓶颈 [7] - 推理阶段行业大模型需更高数据访问速度和更低数据时延,AI大模型训练和部署中存储设备需具备高写入吞吐量 [8][9] 分组2:镇岳510商业化进展 - 镇岳510已在阿里云的EBS规模化上线,提升系统IOPS和吞吐带宽,优化IO延迟,助客户承载更多访问量,实现降本增效 [2] - 镇岳510让阿里云EBS业务上的客户应用获得更快响应,赢得更好用户体验 [3] - 忆恒创源的PBlaze7 7A40系列SSD产品基于镇岳510打造,成为业界首款具有100万IOPS的4K随机写性能的企业级SSD产品 [5] - 得瑞领新的PCIe 5.0高性能企业级NVMe SSD D8436/D8456系列利用镇岳510,相比上一代PCIe4.0产品实现了70%性能功耗比的提升 [5] 分组3:镇岳510对AI应用的意义 - 提高存储设备的数据供给速度能拉高单位算力的利用效率,节省算力时间,提升存力对AI训练降本增效更经济 [10] - DeepSeek的3FS刺激AI从业者升级存储设施,激励存力厂商提高产品性能,推动改善存力设备不足,贴合SSD行业演进节奏 [10] 分组4:镇岳510研发与市场匹配 - 2025年是PCIe 5服务器大规模上线的崛起之年,匹配基于镇岳510的SSD大规模上线的节奏 [11] - 镇岳510早在2021年立项,定下PCIe 5的接口方案,产品上市后匹配市场需求 [11] 分组5:镇岳510技术创新 - 镇岳510研发中进行芯片架构和算法的全面创新,采用自研紧耦合芯片架构,适应AI等高性能应用场景 [16][17] - 镇岳510每秒可处理高达340万次IO,数据带宽达到14GByte/s,支持最新的PCle 5.0主机接口以及DDR5.0内存接口 [18][19] - 镇岳510实现4μs的超低时延,比业界主流降低30%以上,在阿里云EBS上实测将读写混合99.99%长尾延时降低92% [19] - 镇岳510实现低至10^-18的UBER,比业内标杆领先一个数量级,采用自研高性能LDPC纠错算法等 [21] - 镇岳510更加节能,每瓦功耗可提供42万笔的IO访问,以10万块SSD的数据中心为例,每年节省260万度电 [22] 分组6:镇岳510行业应用拓展 - 公司希望推动存力生态建设,拓展行业合作,将先进存力带到更多应用场景 [23] - 镇岳510集容量、时延、成本、能效、可靠和带宽于一体,结合灵活性设计,可根据行业特点专门化增强关键因素 [24]