启望S3 - 财报，业绩电话会，研报，新闻

启望S3

搜索文档

21世纪经济报道· 2026-02-02 17:56

全球AI算力市场趋势：推理成为新主战场 - 2025年全球大模型token消耗量增长了100倍，每一次消耗都对应一次AI推理，推理成本成为AI公司盈利的关键[1] - 根据德勤报告，到2026年，推理算力在整体AI计算中的占比将超过训练，达到66%，推理从技术配角转变为商业主力[1] - 大模型从“被训练出来”走向“被用起来”，推理需求被描述为“百花齐放”且“看不到天花板”[1][3] 曦望公司的战略定位与产品路径 - 公司选择All in推理、放弃训练，在行业普遍追求“训推一体”的背景下进行战略聚焦[1] - 公司于2025年初从商汤科技大芯片部门独立运营，一年内完成近30亿元战略融资，股东兼具产业龙头与国资背景[1] - 公司发布了新一代专注推理的GPU“启望S3”，其设计思路是做减法，放弃针对训练的冗余设计[5] 推理芯片的技术与设计逻辑 - 训推一体GPU为兼顾训练，采用昂贵的高级封装和HBM，但在推理场景下算力利用率仅5%到10%，导致高功耗和高成本[4] - 启望S3未采用HBM，而是选择成本更低、容量更大的LPDDR6内存，使得显存容量比上一代训推一体芯片提升四倍以上[5] - 芯片计算核心将算力向低精度倾斜，特别是FP4和FP8精度，通过加强FP4算力带来了数倍的性价比提升[6] - 结合架构、访存、软件栈等全方位优化，公司称S3能实现比上一代产品“十倍以上的性价比提升”[6] 行业竞争格局与国产芯片新趋势 - 行业正从集中式训练转向长期、大规模的推理场景，竞争核心转向效率、稳定性和长期成本[3] - 国产芯片创业趋势从“替代”转向“差异化”，单纯在“训推一体”通用赛道上追赶英伟达面临CUDA生态垄断、高研发投入等同质化竞争挑战[7] - 推理需求的爆发性增长（如智能体、多模态交互等）创造了新窗口，需求高度多样化且尚未收敛，没有公司能通吃所有场景[7] - 2025年底，英伟达以约200亿美元价格与AI芯片初创公司Groq达成非独家技术授权协议，以补强其在AI推理领域的技术[3] 生态构建与未来挑战 - 国产GPU生态面临巨大差距，Hugging Face上有200万个模型，而顶尖国产GPU能顺畅支持的只有几十到几百个，99%的中国AI应用仍建立在英伟达体系之上[8] - 国产芯片的突围必须是“芯片+生态+场景”的协同创新，公司正积极适配以DeepSeek为代表的国内大模型公司走出的不同技术路径（如MoE架构）[9] - 行业进入更为务实的“商业化验证”周期，最终取决于能否让更多企业用得起、用得好AI算力[10] - 公司管理层认为，AI芯片将占据未来AGI产业价值的70%甚至90%，相信未来7×24小时不停歇的推理需求将没有天花板[8]