Workflow
28nm CiR芯片
icon
搜索文档
ISSCC 重磅:28nm CiM 芯片,能效飙升 181 倍,市场空间有多大?
是说芯语· 2026-03-02 10:41
文章核心观点 - 清华大学与华为等联合发布的基于HYDAR框架的28nm混合存内计算芯片,在性能、能效和精度上取得突破,为推荐系统等场景的算力瓶颈提供了全新解决方案,具备广阔的市场前景[1][3][18] 技术突破与性能表现 - 该芯片采用28nm工艺,以RRAM为核心载体,通过DL-ADC早期终止、PPSP调度流水线等优化,实现了高吞吐、高能效与高精度的平衡[1] - 单芯片性能表现:吞吐率达390K QPS,能效比达1574K QPS/W[1] - 多芯片扩展后,性能提升显著:QPS提升66倍,能效提升181倍[1][5] - 与同业技术对比优势明显:在28nm工艺下,其吞吐率(390K QPS)和能效比(1574K QPS/W)远超采用55nm DRAM、96层3D NAND或SRAM-CAM等技术的其他方案[9] 核心应用场景:推荐系统 - 芯片精准匹配推荐系统对相似向量检索的高算力需求,核心落地场景包括电商、流媒体、社交、广告等领域[4] - 可破解大规模推荐算力瓶颈:例如,帮助短视频平台应对高峰期每秒数十万并发调用、从上百亿级内容库中完成精准推荐的挑战[5] - 对于互联网巨头,该芯片可直接替换现有低效加速器,在保证推荐准确率的前提下,大幅降低数据中心算力成本与能耗[5] - 芯片的大规模扩展能力可适配不同业务规模,从中小平台的轻量化需求到巨头的超大规模向量检索场景,实现性能与成本的最优平衡[5] - 其高吞吐特性还能支撑生成式推荐模型的快速推理,助力平台构建“内容-推荐-广告”的协同闭环[5] 市场延伸与行业赋能 - 除推荐系统外,芯片的高并行度优势可延伸至AI推理、大数据检索、图像识别等高并行计算场景[10] - 在AI大模型边缘推理场景中,其高能效比可降低设备功耗,适配终端算力需求[10] - 中国AI芯片市场规模预计在2029年激增至1.34万亿元,年复合增长率达53.7%,存算一体芯片作为核心支撑,市场需求将持续释放[10] - 芯片采用28nm成熟工艺,相较于高端制程更具成本优势,易于规模化量产,可快速切入AI算力市场,填补中高端加速器市场空白[10] - 芯片的高能效比与小型化潜力,可适配工业物联网和消费物联网中的边缘计算场景,如设备状态监测、智能调度、个性化推荐等[11] - RRAM具备非易失性、低功耗、高密度优势,随着3D堆叠技术成熟,芯片性能与存储密度将进一步提升,成为边缘计算的核心算力支撑[11] 行业发展前景与竞争格局 - 存算一体技术被公认为深度学习加速的极具前景的技术路线,RRAM成为行业布局重点,台积电、三星、美光等全球巨头及国内企业均在积极布局[13] - 该芯片首次将RRAM存内计算技术与推荐系统深度结合,解决了核心痛点,其优化方案为行业提供了可复用的技术范式[14] - 未来随着工艺向14nm及以下制程升级,以及多芯片扩展技术完善,其性能将提升,成本将持续降低[14] - 推荐系统加速器是AI芯片的重要细分市场,互联网平台推荐系统升级需求迫切,AI大模型与推荐系统结合将进一步推高算力需求[15] - 全球存算一体技术市场规模预计从2024年的2.68亿美元增长至2031年的54亿美元,年复合增长率达42.7%[15] - 芯片凭借“高吞吐、高能效、高精度”的差异化优势,打破了现有由传统转型企业、通用工具厂商和垂直服务商构成的“三足鼎立”竞争格局[16] - 产学研协同模式是核心竞争力:清华大学提供科研支撑,华为等企业提供产业资源与场景验证,加速技术迭代与规模化应用[16] - 采用28nm成熟工艺,避免了高端制程的产能瓶颈与成本压力,量产和成本优势显著[16]