独家|聚焦大模型推理,水下AI芯片公司斩获10亿元Pre-A轮融资
Z Potentials·2026-03-09 09:06

公司近期动态与融资 - 上海昉擎科技于近日完成Pre-A3轮融资,新引入投资人包括国开科创、钧山资本、建发新兴投资、多维资本,其中多维资本担任本轮及后续融资的独家财务顾问 [1] - 多位老股东进行了超额加注,包括某头部VC机构、华业天成、蔚来资本、广发信德、三七互娱等 [1] - 公司在近三个月内完成了多轮融资,历史投资人包括头部产业资本及财务投资机构 [1] 公司领导层背景 - 公司CEO梁军拥有超过二十年的芯片行业经验,履历贯穿国产芯片发展的关键节点 [3] - 梁军早年以总架构师身份主导华为海思麒麟SoC芯片研发,并全球首次在海量发货的手机SoC中集成NPU取得商业成功 [3] - 2017年加入寒武纪后出任CTO,主导推出首款7nm AI训练芯片思元290及后续系列产品,将AI芯片技术从实验室推向规模化应用 [3] - 其兼具顶尖技术品味与产业落地能力,在行业中属于稀缺人才 [3][4] 行业趋势与市场机会 - AI大模型快速迭代与场景落地导致推理需求激增,产生了巨大的AI算力缺口,为国产AI算力芯片带来了历史性发展窗口期 [6] - 当前算力市场仍由英伟达主导,但海外初创企业凭借新型架构已获得资本市场高度认可,例如:Groq被英伟达以200亿美元收购,相较前轮融资溢价3倍;Cerebras最新估值超220亿美元,相较几月前增长3倍;Tenstorrent累计融资近20亿美元 [6] - AI正从云端向边缘深度渗透,分布式与C端场景化趋势明显,开源项目带动硬件热销,加速了Agent应用推广 [7] - Agent应用对低时延低成本token的强需求,正在推动AI行业发生深刻变化,针对低延迟优化的推理系统将迅速成为新的产业和市场热点 [7][8] 公司核心技术架构 - 公司核心技术是一套全球首创的“上下文相关”与“上下文无关”解耦的分布式计算架构 [8][11] - 该架构直指Transformer模型效率痛点,将传统串联在同一层中的注意力机制与前馈神经网络彻底分离,分配给最适合的硬件进行分布式处理 [11] - 通过解耦设计,系统被分解为两部分,两者通过明确定义接口通信,使得系统扩展从单一维度变为多个维度 [11] - 公司认为芯片设计的首要任务应从追求单一芯片性能,转变为优先追求可扩展的系统设计 [12] - 在新的架构视角下,“Memory”被赋予了容量、带宽、计算语义和通信四个维度属性,分离式架构允许两个组件在这四个维度上以不同方式设计和扩展,从而创造出新的AI系统 [12] 公司产品愿景与应用场景 - 公司的分离式架构旨在定义AI时代全新的计算系统范式,而非单纯制造“又一款芯片” [5] - 基于该架构设计的、面向低延迟的推理系统,因更好地匹配了Agent应用需求,有望快速成为市场热点 [12] - 在端侧,公司计划通过该架构让“大模型普惠化”成为可能,发展出新型的个人AI计算机 [13] - 在家庭场景,设想通过一个“家庭AI计算中心”小盒子集中处理AI推理,家中所有智能设备可通过Wi-Fi调用大模型能力 [13] - 在个人穿戴场景,设想通过一个名片大小的“个人计算平台”卡片集中处理复杂推理,穿戴设备仅负责数据采集与信号转换,该卡片未来还可能集成数字身份、健康档案、AI Agent人格等功能 [14] - 公司相信,将设计第一优先级改为追求可扩展的系统设计后,将颠覆现有AI硬件设计思路,引领全新的系统形态并创造新市场 [15] 公司战略定位与行业意义 - 公司的目标不是进行简单的国产替代,而是从底层逻辑出发进行范式重构 [17] - 其技术路线不依赖先进制程,不迷信单一芯片性能,而是通过重新组织计算、存储与通信的关系来释放效率与灵活性 [17] - 公司选择了一条定义属于中国原创架构的AI算力新时代的道路,而非单纯追赶算力峰值或比拼性能数字 [17]

独家|聚焦大模型推理,水下AI芯片公司斩获10亿元Pre-A轮融资 - Reportify