SPU存储处理器
搜索文档
端侧AI时代,存储变了:江波龙全面出击
半导体行业观察· 2026-03-31 10:23
文章核心观点 - 人工智能正从云端训练转向终端推理大规模落地,2026年被认为是AI大规模落地元年,这带来了对终端设备存储的新需求[1] - 端侧AI存储与云端训练存储需求存在本质区别,其核心需求围绕高性能容量、系统级集成封装和定制化服务展开[3][5] - 公司作为国内领先的半导体存储品牌,已构建全链条能力,并推出包括新一代PCIe Gen5 mSSD、SPU存储处理器与iSA存储智能体在内的创新产品组合,以解决端侧AI在性能、功耗、散热和成本方面的挑战,领跑端侧AI存储赛道[5][8][9][16] 端侧AI存储的核心需求与挑战 - **需求转变**:云端AI训练聚焦海量数据吞吐与高性能可靠性,而端侧AI推理则更关注与具体应用场景的结合,需在功耗、性能和尺寸上创新[3] - **核心挑战**:端侧SoC的显存与系统内存共享,运行大模型需常驻占用数GB高速空间,压缩了系统流畅度,并对LPDDR5/5x带宽提出苛刻要求[4] - **数据模式挑战**:为降低Token计算成本并提升响应速度,系统需频繁调度巨大的KV Cache,这种“高频、小碎块、长驻留”的数据存取模式,对底层闪存提出了智能化演进要求[4] - **效率与成本挑战**:无论是训练还是推理都面临算力浪费问题,高的token成本给端侧AI带来巨大挑战,需通过存储处理分层化来细化解决[3] 公司的端侧AI存储战略与模式 - **定制化战略**:端侧AI需要深度集成的定制化存储方案,而非通用标准产品,其要求与过往标准存储生态存在本质区别[5] - **Foundry服务模式**:公司构建了芯片设计、固件算法、材料工程、封测制造等全链条能力,承接端侧AI存储定制服务,突破传统存储单一升级瓶颈[5] - **全链路覆盖**:该模式覆盖芯片设计、硬件设计、固件软件、封装工艺、工业设计、自动化测试、材料工程、生产制造等全产业链核心环节,实现从设计到交付的全链路定制化与高效化[7] - **场景导向**:精准匹配AI手机、AI辅助驾驶、AI穿戴、AI PC、具身机器人等多元场景,与云端AI存储形成优势互补[7] 新一代高速存储介质:PCIe Gen5 mSSD - **产品定位**:面向端侧AI设备的新一代高速存储介质,以“小尺寸、高性能、多形态”为核心亮点,精准适配AI PC等终端设备[9] - **规格特性**:延续DRAM-less架构与20×30mm超小尺寸,完美兼容M.2 2230规格,并可灵活衍生为M.2 2242/2280、AI存储卡、PSSD等多种形态[9] - **性能参数**:搭载联芸1802主控芯片,顺序读写性能最高可达**11GB/s、10GB/s**,随机读写性能峰值达**2200K、1800K IOPS**,单盘最高容量支持**8TB**[10] - **散热突破**:针对小体积、高性能运行下的散热痛点,设计了集成均热器+TIM1导热胶、石墨烯散热片、VC均热板、铝合金散热拓展卡等多重散热组件的高效散热方案[13] - **散热效果**:该高效散热方案可将**11GB/s**峰值性能维持时间提升至**181秒**,连续读取容量可达**1991GB**,是常规PCBA SSD散热方案的近**2.5倍**,专为AI PC KV Cache高负载场景设计[13][14] 软硬件协同技术:SPU存储处理器与iSA存储智能体 - **技术定位**:SPU与iSA的组合构建了“芯片硬件+智能调度”的端侧AI存储软硬件协同技术闭环,SPU是“高速载体”,iSA是“智能大脑”[16] - **SPU核心特性**:基于**5nm**先进制程工艺打造,单盘最大容量达**128TB**,有效平衡了容量与成本,可高效益替代HDD[16] - **SPU关键技术**: - 具备存内无损压缩能力,平均压缩比达**2:1**,实测覆盖文本/代码/数据库等多类数据,大幅节省SSD容量和成本[16] - 具备HLC高级缓存技术,可实现温冷数据下沉至SSD,节省近**40%** DRAM容量需求[16] - **iSA核心价值**:作为面向端侧AI推理的专属智能调度引擎,解决存储调度痛点,通过MoE专家卸载、KV Cache智能管理与智能预取算法,大幅提升存储调度效率[19] - **生态验证**:公司与AMD深度协同,基于锐龙AI Max+ 395处理器开展联合调优,成功实现**397B**超大模型的本地部署,在**256K**超长上下文场景下,将DRAM占用降低近**40%**[19] HLC高级缓存技术的全端侧落地 - **技术目标**:精准解决端侧设备“性能与成本平衡”的行业核心难题,为终端产品迭代提供高性价比存储解决方案[21] - **AI PC端应用**:依托SPU实现分层架构设计,性能层打造AI专用高速缓存区,存储层承担操作系统与通用数据存储,通过智能调度策略优化AI体验并降低DRAM需求,压缩硬件成本[22] - **嵌入式端应用**:与紫光展锐深度联合开发,实测数据显示,**4GB DDR**搭配HLC技术后,20款App启动响应时间仅**851ms**,性能表现接近**6GB/8GB DDR**的正常配置水平[22] - **UFS产品性能**:搭载**14nm**制程工艺WM7200主控的UFS 2.2产品,顺序读写最高可达**1070MB/s、1000MB/s**,随机读写IOPS分别最高可达**240K、210K**,性能超越行业主流水平[22] 端侧AI SiP系统级封装技术 - **技术能力**:依托自研优势,完成SiP全流程设计,可将SoC、eMMC/UFS、LPDDR、WiFi、Bluetooth、NFC等多类芯片集成于一颗封装内,实现硬件高度集成化[25] - **应用价值**:针对AI眼镜、智能手表、POS机等对空间、轻薄度、散热有严苛要求的产品,能显著缩小硬件尺寸、优化布局及散热表现[26] - **供应链优势**:结合本土供应链核心能力,将SiP技术优势充分释放,不仅节省产品内部空间,更降低海外制造难度,灵活适配全球市场需求,提升全球竞争力[26] 行业展望与公司愿景 - **行业趋势**:人工智能浪潮正从大模型中心转向终端设备,存储的角色转变为赋能物理世界智能化的核心引擎[28] - **公司定位**:在关乎效率、功耗与成本的较量中,具备全链条创新能力的公司将在变局中锚定坐标,助力AI从云端走向万物终端,并重塑全球存储产业格局[28] - **未来理念**:公司将秉持“Everything for Memory”的理念,持续以技术创新为核心驱动力,与全球产业链伙伴携手,共同推动端侧AI产业创新发展[28]