30 亿融资砸向推理算力!目标:百万 Token 一分钱!
是说芯语·2026-01-22 18:21

公司近期重大融资与战略意义 - 杭州GPU芯片企业曦望在一年内完成近30亿元人民币的战略融资 [1] - 融资资金将全部投向下一代推理GPU的研发、量产和生态搭建 [1] - 投资方阵容强大,形成产业、资本、国资三维加持:产业方包括三一华胥基金、杭州数据集团,提供场景与产业链资源;顶尖VC/PE如IDG资本、高榕创投、中金资本持续加码;国资如诚通混改基金入局,凸显公司在国家算力自主战略中的分量 [1] - 此轮融资为公司提供了从技术研发到场景落地、市场拓展的全链条支持 [2] 公司核心管理团队 - 公司由双CEO掌舵,构成黄金搭档 [3] - 联席CEO王勇是芯片行业20年老兵,曾任职于AMD、昆仑芯,并在商汤带领百人团队成功完成两代芯片的研发与量产,精通从架构设计到批量生产的全流程 [3] - 联席CEO王湛是百度创始核心成员、前集团副总裁,曾领导8000人团队负责百度搜索核心业务,于2025年初跨界加入,专注于产品化与商业化,运用互联网思维解决芯片落地难题 [3] 公司核心团队与技术实力 - 公司核心团队约300人,主要来自NVIDIA、AMD、昆仑芯、商汤等头部企业 [5] - 核心技术骨干平均拥有15年行业经验,团队掌握200多项核心专利 [5] - 团队曾创下百人团队“一次流片成功”的行业佳绩,技术硬核且商业落地迅速 [5] 公司产品战略与技术创新 - 公司采取差异化路线,精准卡位AI推理场景,而非主流的训推一体赛道 [6] - 针对推理场景重构原生GPU架构,对调度机制、缓存设计、片上SRAM配置等核心环节进行深度优化 [6] - 创新性融合LPDDR内存技术,从根源上降低单位Token的推理成本 [6] - 通过全栈自研的指令集、GPGPU IP和编译工具链,实现软硬件深度协同,打破“参数越高越好”的行业误区 [6] - 公司目标是极致降低大模型推理的成本和门槛,让算力变得人人可用 [7] 公司产品发展路线与里程碑 - 公司已构建覆盖视觉推理到大模型全场景的三代芯片矩阵 [8] - S1芯片于2020年量产,是国内首款视觉推理专用芯片,适配上千种CV模型,通过IP授权已服务于索尼、小米等大厂 [8] - S2芯片于2024年量产,对标主流A/H系列GPU,兼容CUDA生态,可适配DeepSeek、Qwen等主流大模型,实现了从专用芯片到通用推理芯片的跨越 [8] - S3芯片计划于2026年推出,原生支持FP8/FP4低精度推理,旨在将单位Token成本和能耗降低一个数量级,目标设定为“百万Token一分钱”的行业新基准 [8] - 公司为S3芯片投入了20亿元人民币的研发资金 [8] 公司生态合作与发展理念 - 公司定位为现有算力系统的“推理分流与成本优化层”,不搞零和竞争,旨在与本土芯片厂商深度合作,为客户搭建推理加速专区,实现互补共赢 [10] - 通过生态共建,整合行业资源以提升国产算力整体实力,致力于形成“应用越广→技术越精→成本越低”的良性循环 [10] - 公司从商汤科技大芯片部门独立,发展路径从专注视觉推理到覆盖全场景,精准踩中AI产业核心需求 [10] - 随着30亿融资到账和S3芯片即将量产,公司正通过技术创新与生态协同,在全球算力竞争中走出一条国产芯片的差异化道路 [10] - 在AI商业化浪潮中,推理成为核心抓手,公司的崛起有望重新定义国产算力产业格局,为千行百业提供普惠的推理算力,加速智能化转型与AGI时代到来 [10]