Workflow
商汤分拆的AI芯片公司,为何全盘押注模型推理市场?

曦望Sunrise脱胎于商汤的芯片业务部门,于2024年底独立并完成第一轮外部融资,今年7月宣布了一笔 近10亿元的新融资。公司董事长由商汤科技联合创始人徐冰担任,联席CEO王勇和王湛均有百度从业背 景。 截至目前,该公司已推出三代推理芯片。据记者了解,第一代S1芯片于2020年量产,定位于视觉推理 芯片,主要服务于商汤的计算机视觉(CV)业务,累计销售超2万颗;第二代S2芯片从2024年9月起量 产,采用GPGPU(通用GPU)架构,公司方面声称该芯片实测性能接近英伟达A100的80%;第三代S3 芯片在2025年5月正式立项,预计2026年点亮——该步骤意味着芯片设计和制造过程已经成功。S3芯片 针对大模型推理定制优化,支持FP8和FP4(8位和4位浮点数)低精度数据格式。 阎研介绍,S3芯片将配置200G以上的显存以及足够的带宽去满足推理需求。公司的目标是使其在大模 型推理部署的成本,能接近英伟达的下一代Rubin架构芯片。 相较于训练芯片,推理芯片的设计难度和数据处理规模相对较低,成为众多国产AI芯片公司必争之 地。同时,AI应用的加速普及,带动推理算力市场需求的高涨。这也是曦望Sunrise全面押注 ...