独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资
雷峰网·2026-03-09 08:35
公司融资与背景 - 国内AI推理芯片创业公司寒序科技完成数千万元融资,投资方为启高资本、赛意产业基金,源合资本担任独家财务顾问 [2] - 公司成立于2023年8月,源于北京大学磁学中心,核心团队是国内首个能跑通从物理、材料、器件到异质集成、芯片设计、算法的交叉团队 [3] 产品技术与性能 - 公司专注于超快流式推理芯片,产品定义聚焦于推理速度,核心理念为“唯快不破”,不做GPU,不卷通用训练 [2][3] - 首颗AI推理芯片(SpinPU-E Series)样片测试结果“非常理想”,其关键指标“单位面积带宽”与Groq LPU披露一致,达到100 GB/s/mm²,这是实现2000Tokens/s速度的底气 [2] - 下一代芯片已在流片中,采用“片上MRAM+SRAM”和“确定性流式乘加单元”技术,目标性能指向2000Tokens/s以上,而目前主流对话模型推理速度仅约30-50Tokens/s [2] - 公司的方案被业界认为是最贴近Groq方案的超大带宽流式处理芯片 [3] 行业定位与竞争 - 公司的单位面积带宽指标是当前AI推理芯片竞争中最具辨识度的硬指标之一,被评价为国内少有的、真正沿着Groq方向发展的团队 [2][3] - 业内传闻NVIDIA已以约200亿美元估值级别锁定Groq的推理技术合作,并计划在NVIDIA GTC 2026发布的新一代AI推理系统中采用Groq芯片设计 [3] 公司发展现状 - 公司此前较为低调,过去两年未对外系统披露产品进展,近期开始对外释放信息的重要背景是其关键技术与样片验证已度过最危险阶段 [2][3] - 目前,公司的新一轮融资已在推进中 [3]