天数智芯（09903）：深度研究：时来天地皆同力，国产GPU主力爆发在即

投资评级与核心观点 - 报告对天数智芯（09903.HK）给予“买入”评级 [4][12][14] - 核心观点：公司深耕GPGPU架构多年，深度适配CUDA生态，产品可插拔即用，产品力领先、生态优势显著；当前国产推理算力紧缺，在头部供应不足的背景下，公司客户导入有望全面加速，爆发拐点临近 [4][12] 公司概况与财务表现 - 天数智芯是国内最早实现通用GPU量产的厂商之一，成立于2015年，聚焦全功能通用GPU赛道 [9][20] - 公司构建了“云端训练+云边推理+边端算力”协同互补的完整产品矩阵 [9][26] - 2022至2025年，公司营收分别为1.89亿元、2.89亿元（同比增长52.6%）、5.40亿元（同比增长86.7%）、10.34亿元（同比增长91.6%），增速逐年抬升 [9][33] - 公司2025年尚未实现盈利，主要因研发投入较大，当年研发开支达9.74亿元 [33] - 2025年公司综合毛利率为54.0%，较2024年的49.1%提升4.9个百分点 [39] - 截至2025年末，公司累计服务超过340名客户，产品及解决方案在金融服务、医疗保健、交通运输等行业逾1000个项目中部署应用 [9][31] 行业需求与市场机遇 - AI算力需求爆发：本轮大模型产业周期的底层逻辑是遵循Scaling Law，通过消耗大规模算力换取模型智力水平的跃升 [10][45] - 从Chatbot到Agent再到Harness的产品形态升级，导致任务复杂性、多轮推理和工具调用增加，引发Token消耗量剧增 [45][48] - 2026年以来，以DeepSeek-V4、智谱GLM5.1等为代表的国产模型在性能与成本端展现出竞争力，国产模型Token消耗斜率高于海外，并通过海外云服务向全球输出Token服务 [10][50] - 国产GPU已完成对DeepSeek、Qwen等主流模型的推理优化与适配，国产芯模适配加速将带动国产算力需求天花板持续扩容 [10][50] - 2025年国内BAT三家（阿里、腾讯、百度）合计资本开支为2113亿元，较2018年提升3倍；2026年第一季度合计资本开支为647亿元，同比/环比分别增长18%和38% [53] - 根据统计，2024年中国AI芯片市场规模已达到约2175亿元人民币，预计到2029年将达到约8981亿元人民币，2025年至2029年的复合年增长率为29.1% [56] 供给侧与竞争格局 - 美国对华AI芯片出口管制及技术封锁自2022年起逐级加码，包括限制英伟达A100、H100等旗舰训练GPU的销售，并进一步管控H20“特供版”的出口 [59] - 我国通过“东数西算”工程等多项政策支持智能算力自主可控发展，国资委要求国央企新建智算集群以国产为主 [61][63] - 受益于技术迭代和美国出口管制，中国本土品牌AI芯片数量占比从2022年的15%提升至2024年的30% [64] - 天数智芯在国内训练型通用GPU市场中排名第三，2024年占据国内通用GPU市场份额的10.5%；在国内推理型通用GPU市场中排名第二，2024年占据国内通用GPU市场份额的8.6% [67] 公司产品与技术优势 - 产品体系完善：公司具备“训推一体、云边端”全场景产品矩阵，覆盖云端训练（天垓系列）、云端/边缘推理（智铠系列）及边端低功耗算力（彤央系列） [11][69] - 公司遵循“量产一代、设计一代、预研一代”的研发节奏，下一代训练卡天垓Gen5计划于2027年第一季度推出，目标计算性能显著提升，并增强对FP8、FP4等精度格式的支持 [80] - 公司具备全栈自研能力，从芯片架构、指令集到核心算子、基础软件栈（DeepSpark）均实现自主研发，带来独特优势 [11][84] - 优势一：实现对英伟达CUDA生态的“API级别兼容”，降低客户迁移门槛 [11][85] - 优势二：全栈自研赋予的极致调优能力使芯片性能在部分场景赶超英伟达A800，例如在FA算子优化中将MFU从13.26%提升至56.12%，并在LLaMA2 7B和DeepSeek R1 671B模型的Prefill场景中，吞吐性能达到或优于A800水平 [11][90][93][94] - 优势三：全栈自研赋予公司应对下游客户深度定制需求的灵活性，有助于导入大客户 [11][95] - 截至2025年末，公司自研软件栈已累计完成超过450个AI模型的执行验证 [100]