Workflow
存算一体瓶颈,中国团队实现突破
半导体芯闻·2025-07-02 18:21

冯诺依曼架构与内存墙问题 - 冯诺依曼架构将数据和指令存储在同一内存中,简化硬件设计并实现通用计算,但存在指令顺序执行和CPU等待存储器读写的性能瓶颈[1][3] - 存储器性能发展滞后于CPU导致"内存墙"问题,CPU需大量时间等待数据搬运,降低系统整体性能[3] 存算一体技术发展 - 存算一体(PIM/CIM)通过在内存中执行计算任务,避免数据传输,解决存储墙问题,降低时间和能源成本[5] - 技术演进分为三个阶段:早期基于DRAM/Flash的近存计算、新型存储器(RRAM/PCM/STT-MRAM)推动的模拟计算型PIM、2017年后原型产品落地[6][8] - 主流PIM技术包括数字型(SRAM/DRAM)、模拟型(RRAM/PCM)和混合型,分别面临面积功耗、精度控制和架构设计挑战[7][8] 行业参与与产业化进展 - 三星、SK海力士、美光、英伟达等国际巨头与寒武纪、华为海思、阿里达摩院等国内企业共同投入研发[6][8] - 知存、苹芯、亿铸等国内初创企业聚焦ReRAM/MRAM领域,推动存算一体在边缘计算的应用[8] 排序操作的瓶颈与突破 - 排序是AI系统中耗时最高的基础操作,存在于智能驾驶、推荐系统、大模型训练等场景,传统架构难以高效处理[10][11] - 北京大学团队首次实现存算一体排序架构,通过忆阻器阵列和并行比较机制,速度提升15倍,能效提升6-183倍,功耗仅为CPU/GPU的1/10[13][15][17] - 该技术支持百万级数据并行排序,AI推理响应速度提升70%,突破存算一体通用性限制[15][17] 技术应用与战略意义 - 成果可应用于国产智能芯片、边缘AI设备、智慧城市等领域,实现毫秒级十万级事件优先级评估[16] - 全自主技术栈具备国产化能力,为下一代AI算力体系提供底层支持[16][17]