投资评级与核心观点 - 报告对天数智芯(09903.HK)给予“买入”评级 [4][12][14] - 核心观点:公司深耕GPGPU架构多年,深度适配CUDA生态,产品可插拔即用,产品力领先、生态优势显著;当前国产推理算力紧缺,在头部供应不足的背景下,公司客户导入有望全面加速,爆发拐点临近 [4][12] 公司概况与财务表现 - 天数智芯是国内最早实现通用GPU量产的厂商之一,成立于2015年,聚焦全功能通用GPU赛道 [9][20] - 公司构建了“云端训练+云边推理+边端算力”协同互补的完整产品矩阵 [9][26] - 2022至2025年,公司营收分别为1.89亿元、2.89亿元(同比增长52.6%)、5.40亿元(同比增长86.7%)、10.34亿元(同比增长91.6%),增速逐年抬升 [9][33] - 公司2025年尚未实现盈利,主要因研发投入较大,当年研发开支达9.74亿元 [33] - 2025年公司综合毛利率为54.0%,较2024年的49.1%提升4.9个百分点 [39] - 截至2025年末,公司累计服务超过340名客户,产品及解决方案在金融服务、医疗保健、交通运输等行业逾1000个项目中部署应用 [9][31] 行业需求与市场机遇 - AI算力需求爆发:本轮大模型产业周期的底层逻辑是遵循Scaling Law,通过消耗大规模算力换取模型智力水平的跃升 [10][45] - 从Chatbot到Agent再到Harness的产品形态升级,导致任务复杂性、多轮推理和工具调用增加,引发Token消耗量剧增 [45][48] - 2026年以来,以DeepSeek-V4、智谱GLM5.1等为代表的国产模型在性能与成本端展现出竞争力,国产模型Token消耗斜率高于海外,并通过海外云服务向全球输出Token服务 [10][50] - 国产GPU已完成对DeepSeek、Qwen等主流模型的推理优化与适配,国产芯模适配加速将带动国产算力需求天花板持续扩容 [10][50] - 2025年国内BAT三家(阿里、腾讯、百度)合计资本开支为2113亿元,较2018年提升3倍;2026年第一季度合计资本开支为647亿元,同比/环比分别增长18%和38% [53] - 根据统计,2024年中国AI芯片市场规模已达到约2175亿元人民币,预计到2029年将达到约8981亿元人民币,2025年至2029年的复合年增长率为29.1% [56] 供给侧与竞争格局 - 美国对华AI芯片出口管制及技术封锁自2022年起逐级加码,包括限制英伟达A100、H100等旗舰训练GPU的销售,并进一步管控H20“特供版”的出口 [59] - 我国通过“东数西算”工程等多项政策支持智能算力自主可控发展,国资委要求国央企新建智算集群以国产为主 [61][63] - 受益于技术迭代和美国出口管制,中国本土品牌AI芯片数量占比从2022年的15%提升至2024年的30% [64] - 天数智芯在国内训练型通用GPU市场中排名第三,2024年占据国内通用GPU市场份额的10.5%;在国内推理型通用GPU市场中排名第二,2024年占据国内通用GPU市场份额的8.6% [67] 公司产品与技术优势 - 产品体系完善:公司具备“训推一体、云边端”全场景产品矩阵,覆盖云端训练(天垓系列)、云端/边缘推理(智铠系列)及边端低功耗算力(彤央系列) [11][69] - 公司遵循“量产一代、设计一代、预研一代”的研发节奏,下一代训练卡天垓Gen5计划于2027年第一季度推出,目标计算性能显著提升,并增强对FP8、FP4等精度格式的支持 [80] - 公司具备全栈自研能力,从芯片架构、指令集到核心算子、基础软件栈(DeepSpark)均实现自主研发,带来独特优势 [11][84] - 优势一:实现对英伟达CUDA生态的“API级别兼容”,降低客户迁移门槛 [11][85] - 优势二:全栈自研赋予的极致调优能力使芯片性能在部分场景赶超英伟达A800,例如在FA算子优化中将MFU从13.26%提升至56.12%,并在LLaMA2 7B和DeepSeek R1 671B模型的Prefill场景中,吞吐性能达到或优于A800水平 [11][90][93][94] - 优势三:全栈自研赋予公司应对下游客户深度定制需求的灵活性,有助于导入大客户 [11][95] - 截至2025年末,公司自研软件栈已累计完成超过450个AI模型的执行验证 [100]
天数智芯(09903):深度研究:时来天地皆同力,国产GPU主力爆发在即