专注推理,放弃训练!一家中国GPU公司要差异化突围
21世纪经济报道·2026-02-02 17:56

全球AI算力市场趋势:推理成为新主战场 - 2025年全球大模型token消耗量增长了100倍,每一次消耗都对应一次AI推理,推理成本成为AI公司盈利的关键[1] - 根据德勤报告,到2026年,推理算力在整体AI计算中的占比将超过训练,达到66%,推理从技术配角转变为商业主力[1] - 大模型从“被训练出来”走向“被用起来”,推理需求被描述为“百花齐放”且“看不到天花板”[1][3] 曦望公司的战略定位与产品路径 - 公司选择All in推理、放弃训练,在行业普遍追求“训推一体”的背景下进行战略聚焦[1] - 公司于2025年初从商汤科技大芯片部门独立运营,一年内完成近30亿元战略融资,股东兼具产业龙头与国资背景[1] - 公司发布了新一代专注推理的GPU“启望S3”,其设计思路是做减法,放弃针对训练的冗余设计[5] 推理芯片的技术与设计逻辑 - 训推一体GPU为兼顾训练,采用昂贵的高级封装和HBM,但在推理场景下算力利用率仅5%到10%,导致高功耗和高成本[4] - 启望S3未采用HBM,而是选择成本更低、容量更大的LPDDR6内存,使得显存容量比上一代训推一体芯片提升四倍以上[5] - 芯片计算核心将算力向低精度倾斜,特别是FP4和FP8精度,通过加强FP4算力带来了数倍的性价比提升[6] - 结合架构、访存、软件栈等全方位优化,公司称S3能实现比上一代产品“十倍以上的性价比提升”[6] 行业竞争格局与国产芯片新趋势 - 行业正从集中式训练转向长期、大规模的推理场景,竞争核心转向效率、稳定性和长期成本[3] - 国产芯片创业趋势从“替代”转向“差异化”,单纯在“训推一体”通用赛道上追赶英伟达面临CUDA生态垄断、高研发投入等同质化竞争挑战[7] - 推理需求的爆发性增长(如智能体、多模态交互等)创造了新窗口,需求高度多样化且尚未收敛,没有公司能通吃所有场景[7] - 2025年底,英伟达以约200亿美元价格与AI芯片初创公司Groq达成非独家技术授权协议,以补强其在AI推理领域的技术[3] 生态构建与未来挑战 - 国产GPU生态面临巨大差距,Hugging Face上有200万个模型,而顶尖国产GPU能顺畅支持的只有几十到几百个,99%的中国AI应用仍建立在英伟达体系之上[8] - 国产芯片的突围必须是“芯片+生态+场景”的协同创新,公司正积极适配以DeepSeek为代表的国内大模型公司走出的不同技术路径(如MoE架构)[9] - 行业进入更为务实的“商业化验证”周期,最终取决于能否让更多企业用得起、用得好AI算力[10] - 公司管理层认为,AI芯片将占据未来AGI产业价值的70%甚至90%,相信未来7×24小时不停歇的推理需求将没有天花板[8]

专注推理,放弃训练!一家中国GPU公司要差异化突围 - Reportify