Workflow
带宽战争
icon
搜索文档
带宽战争前夜,“中国版Groq”浮出水面
半导体芯闻· 2026-01-16 18:27
文章核心观点 - AI行业的竞争焦点正从单纯的算力规模转向对单位面积带宽的极致追求,以解决大模型推理中的“带宽墙”与“延迟瓶颈”问题 [4] - 英伟达通过斥资200亿美元收购Groq核心技术,并计划在2028年推出集成LPU的Feynman架构GPU,旨在从“算力霸主”向“推理之王”转型 [2] - 中国AI芯片公司寒序科技采用片上MRAM(磁性随机存储器)技术路线,开发超高带宽推理芯片,被视为“中国版Groq”,有望在下一代AI推理芯片的“带宽战争”中实现换道超车 [6][9][35] AI推理的行业趋势与挑战 - 传统GPU架构(如英伟达H100)面向训练与图形渲染设计,在大模型推理的解码阶段存在强序列性、小批量和带宽主导的特征错配,导致算力利用率常低于30% [4][14] - 行业共识认为,大模型推理90%的延迟源于数据搬运,未来推理性能的竞争核心是单位面积带宽与执行范式,而非算力规模 [4][15] - 为应对挑战,行业出现多种技术路径:英伟达计划通过Feynman架构集成Groq LPU;AMD采用3D V-Cache;d-Matrix、SambaNova等公司聚焦流式执行与片上带宽 [2][4] 英伟达的战略布局 - 英伟达以创纪录的200亿美元收购Groq核心技术,是其历史上最大手笔交易,旨在抢跑AI推理市场 [2] - 公司计划在2028年推出新一代Feynman架构GPU,采用台积电A16先进制程与SoIC 3D堆叠技术,核心目的是在GPU内部深度集成Groq的LPU,以攻克推理的“带宽墙”与“延迟瓶颈” [2] 寒序科技的技术与产品 - 公司以“超高带宽推理芯片”为核心产品,采用片上MRAM构建“磁性流式处理架构”,目标是将访存带宽密度提升至0.1-0.3TB/mm²·s [6][12] - 该带宽指标不仅能比肩Groq LPU的0.11 TB/mm²·s,更是英伟达H100(0.002-0.003 TB/mm²·s)的数十倍 [12] - 技术路线选择MRAM而非主流的片外DRAM/HBM或Groq的SRAM方案,MRAM采用1T1M结构,同等条件下存储密度是SRAM的5-6倍,且兼具高速、高密度与非易失性优势 [9][11] - 公司采用“双线布局”:SpinPU-M系列覆盖组合优化与量子启发式计算;本轮融资核心的SpinPU-E系列直指大模型解码阶段加速 [7] 寒序科技的竞争优势 - 核心团队源自北京大学物理学院应用磁学中心,具备从物理、材料、器件到芯片设计、算法的全链条技术把控与跨学科积淀 [16] - 公司是国内首个有能力跑通从物理到算法全链条的交叉团队,拥有深厚的学术积累与工程化落地能力 [16] - 公司前瞻性地在北京市科技计划项目中锁定0.1TB/mm²/s超大带宽流式推理芯片研发,全面对标Groq的技术路线与带宽指标 [7] MRAM技术的优势与战略意义 - **工艺成本优势**:MRAM物理结构使其在国产成熟制程下性能可对标先进制程的SRAM,大幅降低流片与量产成本(单片成本可降至原来的十分之一以下),保障供应链自主可控 [20] - **性能优势**:具备非易失性、高能效、快速启动、低待机功耗和高耐用性,为边缘与云端部署提供极佳能效 [20] - **战略破局价值**:在美国限制内存带宽密度超过2GB/s/mm²的存储器出口背景下,MRAM能基于国产28nm/22nm等成熟制程实现超高带宽,规避对尖端工艺和海外HBM供应链的依赖 [21] - **产业带动作用**:MRAM技术革新能带动磁性材料、磁电子器件、存算一体架构等全产业链突破,为AI算力产业打造自主可控的“第二曲线” [22] 全球及中国MRAM产业生态 - **全球布局**:台积电、三星、英特尔、SK海力士等巨头已将嵌入式MRAM推进到22nm、16nm等节点,并在汽车电子、边缘AI等领域推动商业化落地 [23] - **市场规模**:2024年全球MRAM市场规模估计为42.2亿美元,预计到2034年增长至约847.7亿美元,复合年增长率高达34.99% [30] - **中国厂商格局**:致真存储、驰拓科技、凌存科技等本土厂商主要集中于存储、加密等传统MRAM领域 [27] - **寒序科技的差异化定位**:公司独辟蹊径,以MRAM为核心介质构建计算芯片,开辟“磁性计算”新赛道,推动国内MRAM技术从存储替代向计算革新跨越 [28][29] 未来展望与行业启示 - 下一代AI芯片的竞争分水岭在于“谁能率先跨过带宽墙”,主导者将属于能在“带宽战争”中沉淀出护城河的先行者 [35] - 国内AI芯片厂商应抓住“通用算力+专用引擎”的行业趋势,加强与在新型介质与架构上具备底层创新能力的团队合作,构建差异化竞争力 [32][33] - 寒序科技依托MRAM磁性计算新范式,给出了突破带宽瓶颈的“中国版”实现路径,有望成为中国AI芯片产业换道超车的关键抓手 [33][35]