Workflow
MRAM(磁性随机存储器)
icon
搜索文档
带宽战争前夜,“中国版Groq”浮出水面
半导体芯闻· 2026-01-16 18:27
文章核心观点 - AI行业的竞争焦点正从单纯的算力规模转向对单位面积带宽的极致追求,以解决大模型推理中的“带宽墙”与“延迟瓶颈”问题 [4] - 英伟达通过斥资200亿美元收购Groq核心技术,并计划在2028年推出集成LPU的Feynman架构GPU,旨在从“算力霸主”向“推理之王”转型 [2] - 中国AI芯片公司寒序科技采用片上MRAM(磁性随机存储器)技术路线,开发超高带宽推理芯片,被视为“中国版Groq”,有望在下一代AI推理芯片的“带宽战争”中实现换道超车 [6][9][35] AI推理的行业趋势与挑战 - 传统GPU架构(如英伟达H100)面向训练与图形渲染设计,在大模型推理的解码阶段存在强序列性、小批量和带宽主导的特征错配,导致算力利用率常低于30% [4][14] - 行业共识认为,大模型推理90%的延迟源于数据搬运,未来推理性能的竞争核心是单位面积带宽与执行范式,而非算力规模 [4][15] - 为应对挑战,行业出现多种技术路径:英伟达计划通过Feynman架构集成Groq LPU;AMD采用3D V-Cache;d-Matrix、SambaNova等公司聚焦流式执行与片上带宽 [2][4] 英伟达的战略布局 - 英伟达以创纪录的200亿美元收购Groq核心技术,是其历史上最大手笔交易,旨在抢跑AI推理市场 [2] - 公司计划在2028年推出新一代Feynman架构GPU,采用台积电A16先进制程与SoIC 3D堆叠技术,核心目的是在GPU内部深度集成Groq的LPU,以攻克推理的“带宽墙”与“延迟瓶颈” [2] 寒序科技的技术与产品 - 公司以“超高带宽推理芯片”为核心产品,采用片上MRAM构建“磁性流式处理架构”,目标是将访存带宽密度提升至0.1-0.3TB/mm²·s [6][12] - 该带宽指标不仅能比肩Groq LPU的0.11 TB/mm²·s,更是英伟达H100(0.002-0.003 TB/mm²·s)的数十倍 [12] - 技术路线选择MRAM而非主流的片外DRAM/HBM或Groq的SRAM方案,MRAM采用1T1M结构,同等条件下存储密度是SRAM的5-6倍,且兼具高速、高密度与非易失性优势 [9][11] - 公司采用“双线布局”:SpinPU-M系列覆盖组合优化与量子启发式计算;本轮融资核心的SpinPU-E系列直指大模型解码阶段加速 [7] 寒序科技的竞争优势 - 核心团队源自北京大学物理学院应用磁学中心,具备从物理、材料、器件到芯片设计、算法的全链条技术把控与跨学科积淀 [16] - 公司是国内首个有能力跑通从物理到算法全链条的交叉团队,拥有深厚的学术积累与工程化落地能力 [16] - 公司前瞻性地在北京市科技计划项目中锁定0.1TB/mm²/s超大带宽流式推理芯片研发,全面对标Groq的技术路线与带宽指标 [7] MRAM技术的优势与战略意义 - **工艺成本优势**:MRAM物理结构使其在国产成熟制程下性能可对标先进制程的SRAM,大幅降低流片与量产成本(单片成本可降至原来的十分之一以下),保障供应链自主可控 [20] - **性能优势**:具备非易失性、高能效、快速启动、低待机功耗和高耐用性,为边缘与云端部署提供极佳能效 [20] - **战略破局价值**:在美国限制内存带宽密度超过2GB/s/mm²的存储器出口背景下,MRAM能基于国产28nm/22nm等成熟制程实现超高带宽,规避对尖端工艺和海外HBM供应链的依赖 [21] - **产业带动作用**:MRAM技术革新能带动磁性材料、磁电子器件、存算一体架构等全产业链突破,为AI算力产业打造自主可控的“第二曲线” [22] 全球及中国MRAM产业生态 - **全球布局**:台积电、三星、英特尔、SK海力士等巨头已将嵌入式MRAM推进到22nm、16nm等节点,并在汽车电子、边缘AI等领域推动商业化落地 [23] - **市场规模**:2024年全球MRAM市场规模估计为42.2亿美元,预计到2034年增长至约847.7亿美元,复合年增长率高达34.99% [30] - **中国厂商格局**:致真存储、驰拓科技、凌存科技等本土厂商主要集中于存储、加密等传统MRAM领域 [27] - **寒序科技的差异化定位**:公司独辟蹊径,以MRAM为核心介质构建计算芯片,开辟“磁性计算”新赛道,推动国内MRAM技术从存储替代向计算革新跨越 [28][29] 未来展望与行业启示 - 下一代AI芯片的竞争分水岭在于“谁能率先跨过带宽墙”,主导者将属于能在“带宽战争”中沉淀出护城河的先行者 [35] - 国内AI芯片厂商应抓住“通用算力+专用引擎”的行业趋势,加强与在新型介质与架构上具备底层创新能力的团队合作,构建差异化竞争力 [32][33] - 寒序科技依托MRAM磁性计算新范式,给出了突破带宽瓶颈的“中国版”实现路径,有望成为中国AI芯片产业换道超车的关键抓手 [33][35]
带宽战争前夜,“中国版Groq”浮出水面
半导体行业观察· 2026-01-15 09:38
AI推理芯片行业趋势:从算力竞赛转向带宽战争 - AI行业竞争焦点正从单纯算力比拼转向对单位面积带宽的极致追求[4] - 大模型推理中90%的延迟源于数据搬运,导致算力利用率常低于30%[4] - 行业共识是通过存储靠近计算、流式执行与片上带宽构建来提升推理效率,AMD、d-Matrix、SambaNova等公司均印证此方向[4] 英伟达的战略布局:收购与架构革新 - 英伟达斥资200亿美元收购Groq核心技术,创公司历史最大交易,旨在抢占AI推理市场[2] - 计划于2028年推出新一代Feynman架构GPU,采用台积电A16制程与SoIC 3D堆叠技术,核心目的是在GPU内部深度集成Groq的LPU(语言处理单元)[2] - 此举旨在解决AI推理中长期存在的“带宽墙”与“延迟瓶颈”,推动公司从“算力霸主”向“推理之王”转型[2] 传统GPU在推理任务中的瓶颈 - 英伟达GPU架构最初为大规模训练与图形渲染设计,强调峰值算力与吞吐能力[14] - 在大模型推理的Decode阶段,GPU性能瓶颈主要来自对外部存储(HBM)和复杂内存层级的高度依赖[14] - 该过程呈现强序列性、小批量和带宽主导特征,与GPU设计初衷错配,导致访存延迟波动、算力难以稳定发挥[14] 寒序科技:中国MRAM推理芯片的开拓者 - 公司源于北京大学物理学院,以“超高带宽推理芯片”为核心产品,被业内视为中国大陆少有的在技术路线层面对标Groq的团队[6] - 采用“双线布局”:SpinPU-M系列磁概率计算芯片覆盖组合优化市场;SpinPU-E磁逻辑计算芯片系列直指大模型推理解码阶段加速[7] - 核心技术路线是片上MRAM(磁性随机存储器),构建超高带宽磁性流式处理架构(MSA)[7][9] - 目标是将访存带宽密度提升至0.1-0.3 TB/mm²·s,比肩Groq LPU(0.11 TB/mm²·s),是英伟达H100(0.002-0.003 TB/mm²·s)的数十倍[12] - 公司是国内首个有能力跑通从物理、材料、器件到芯片设计、算法全链条的交叉团队,拥有“材料-器件-芯片-系统-算法”的全栈攻关能力[16] MRAM技术的优势与战略价值 - **存储密度领先**:MRAM采用1T1M结构,同等芯片面积和工艺节点下,存储密度是SRAM的5-6倍[11] - **工艺成本更低**:MRAM在国产成熟制程(如28nm/22nm)下性能可对标先进制程的SRAM,单片流片成本可降至原来的十分之一以下,保障供应链自主可控[20] - **非易失性与高能效**:断电后数据不丢失,待机功耗接近零,具备快速启动、高耐用性优势,为边缘和云端部署提供极佳能效[20] - **规避技术封锁**:美国出口管制限制内存带宽密度超过2GB/s/mm²的存储器,而HBM产能被海外巨头垄断,Groq的SRAM方案成本极高。MRAM基于成熟制程实现超高带宽,可规避对尖端工艺和海外供应链的依赖[21] - **市场前景广阔**:2024年全球MRAM市场规模估计为42.2亿美元,预计到2034年增长至约847.7亿美元,复合年增长率高达34.99%[30] 国内外MRAM产业发展现状 - **国际大厂积极布局**:台积电、三星、英特尔、SK海力士等已将嵌入式MRAM推进到22nm、16nm等节点。恩智浦、瑞萨电子、GlobalFoundries等已在汽车、工业领域推动MRAM商业化落地[23] - **国内生态初步形成**:RRAM领域有昕原半导体等玩家;MRAM赛道有寒序科技、致真存储、驰拓科技、凌存科技、亘存科技等企业[26] - **国内厂商侧重各异**:致真存储专注于MTJ器件与制造工艺,研制出全球首颗8Mb容量SOT-MRAM芯片;驰拓科技是国内首家实现MRAM量产的企业;凌存科技专注于存储模块开发[27] - **寒序科技的差异化定位**:以MRAM为核心介质构建计算芯片,开辟“磁性计算”新赛道,推动国内MRAM技术从存储替代向计算革新跨越[28][29] 下一代AI推理芯片的竞争格局 - 下一代竞争分水岭在于“谁能率先跨过带宽墙”,主导市场者需在“带宽战争”中沉淀出护城河[35] - 两条突破路径清晰:一是Groq选择的极致SRAM片上集成路径;二是以MRAM为代表的新型存储介质路线,后者更具根本性且符合长期成本与供应链安全需求[35] - “通用算力+专用引擎”成为行业趋势,英伟达收购Groq整合LPU即是例证。国内AI芯片厂商应加强与在新型介质与架构上有底层创新能力的团队合作[32] - 以MRAM为代表的新型存储已成为后摩尔时代核心焦点,有望成为中国AI芯片产业实现换道超车的关键抓手[33]