文章核心观点 - 中国团队在ISSCC 2026上展示了一条差异化创新路径,即通过成熟制程结合架构创新(特别是ReRAM存算一体技术)来满足AI全场景推理需求,挑战先进制程的性能表现 [2][3][4] - 合肥睿科微电子作为中国RRAM领军企业,凭借两项纯自主研发的技术成果,在全球顶级学术舞台上证明了其在AI推理硬件领域的实力,为AI芯片的低成本、高性能国产化发展提供了可行方案 [2][17][19] ISSCC 2026与中国技术突破 - ISSCC是全球固态电路领域最权威的学术会议,被誉为“芯片界的奥林匹克”,其入选资格代表技术达到国际领先水平 [2] - 一家来自中国的RRAM领军企业(合肥睿科微电子)在本届ISSCC上一举拿下两篇高质量论文,展现出中国在先进存储架构上的实力与产业竞争力 [2] 技术路径:成熟制程与架构创新 - AI推理规模化落地面临先进制程研发成本高、周期长以及传统冯·诺依曼架构“存储墙”导致功耗高、延迟大两大痛点 [4] - ReRAM(阻变存储器)作为一种新型非易失性存储器,具备非易失性、高速读写、低功耗、高密度集成及成本优势,其“存储与计算一体化”的天然优势能从根本上消除数据搬运损耗 [4] - 采用成熟制程(如55nm CMOS)结合ReRAM存算一体等架构创新,可以完美平衡性能、成本与功耗,为以成熟制程挑战先进制程奠定基础 [3][4][17] 突破一:LLM高效推理加速器 - 针对大语言模型推理中参数规模大、内存带宽紧张、外部访存延迟高的痛点,公司联合香港科技大学等机构推出了一款55nm基于推测解码的LLM加速器 [7][9] - 该加速器采用纯自主的凸点面对面ReRAM-on-Logic 3D堆叠技术,搭配全栈自主研发的算法优化 [9] - 三大自主创新设计精准解决LLM推理痛点 [10]: 1. 自主研发的局部旋转单元支持W4A8高精度量化,在节省92.7%芯片面积的同时,实现3.82-3.93倍的推理速度提升 [10] 2. ReRAM堆叠式近存计算架构将4颗ReRAM芯片垂直堆叠,实现32MB片上存储与102.4GB/s极致带宽,彻底消除外部访存延迟,推理速度再提升1.1-1.46倍 [10] 3. 自适应并行推测解码方案搭配自主设计的调度器,进一步提升1.1-1.29倍推理速度,降低10-14%草稿token拒绝率 [10] - 实测表现亮眼:该55nm加速器逻辑芯片工作频率63.5-285MHz,峰值性能2.33TOPS,单颗ReRAM芯片功耗仅49.54mW [11] - 在LLaMA2-7B等主流模型上,解码吞吐量达到14.08-135.69 token/s,其中在MT-Bench数据集上解码吞吐量达17.82 token/s,能耗仅123.41 mJ/token [11] - 对比传统高精度推理基线,速度提升4.46-7.17倍,能耗降低3.74-4.85倍,困惑度可与主流W8A16 LLM加速器媲美 [11] 突破二:边缘AI全模拟感知SoC - 由南方科技大学、犀灵视觉与睿科微电子联合研发的全模拟智能视觉SoC相关论文入选ISSCC 2026图像传感器专题,实现了边缘AI传感器融合推理的全链路国产化突破 [12][14] - 核心亮点在于“终结模数转换”,从图像传感、特征提取到神经网络推理,信号全程保持模拟形态,彻底摒弃所有中间环节的A/D转换,从根源上降低损耗 [14] - 芯片基于55nm国产成熟CMOS制程,集成128×128 PWM图像传感器、近传感器MAC单元、线性恢复模拟存储器及双256×1024 1T1R多层单元ReRAM存算宏(1.5Mbit,3b/单元) [15] - 犀灵视觉贡献了“像素级运算技术”,PWM图像传感器直接将光电流转换为脉宽信号,输入ReRAM存算阵列完成电荷域MAC运算,再通过内置转换器补偿非线性偏差,实现高精度推理 [15] - 实测数据优异:实现11 pJ/(pixel·frame)的感知能效,峰值MAC能效高达8791 TOPS/W,系统级能效达到345.54 TOPS/W(接近346 TOPS/W) [16] - 在CIFAR-10、CIFAR-100分类及PASCAL VOC 2007目标检测任务中,分别实现91.12%、77.22%的准确率和20.5%的mAP@0.5,推理延迟低至0.12ms(分类)与0.195ms(检测) [16] - 相较于过往同类先进方案,其能效比实现了75.6倍至966倍的跨越式提升,成本却降低40%以上 [16] 产业启示与价值 - 在后摩尔时代,制程微缩红利放缓,以ReRAM存算一体为核心的架构创新与3D堆叠等先进封装技术的结合,正成为释放AI算力的关键引擎 [17] - 纯国产ReRAM结合55nm成熟制程的组合,打破了国外在新型存储器与AI推理硬件领域的技术垄断,同时规避了先进制程的高研发成本与高设备投入门槛 [18] - 该技术路径契合中国半导体产业“自主可控、降本增效”的发展趋势,为AI推理的国产化、规模化落地提供了可行路径 [18] - 从应用前景看,该技术可广泛覆盖边缘AI、LLM轻量化部署、智能终端等多个场景,推动AI产业向自主可控、高质量发展迈进 [18] - 公司(合肥睿科微电子)成立于2018年,是一家国家高新技术企业,已在全球布局超过300项存储器技术专利 [17]
国产RRAM:闪耀ISSCC
半导体行业观察·2026-03-13 09:53