AI训练和推理 - 财报，业绩电话会，研报，新闻

AI训练和推理

搜索文档

壁仞科技：AI 训练、推理领域的本土 GPU 龙头；首次覆盖给予 “买入” 评级，目标价 54 港元

2026-02-10 11:24

研究报告关键要点总结涉及的公司与行业 * 公司：壁仞科技 (Biren，股票代码 6082.HK) [1] * 行业：中国半导体行业，特别是AI训练/推理GPU芯片设计领域 [1][2][18] 核心观点与投资建议 * 高盛对壁仞科技首次覆盖，给予“买入”评级，12个月目标价为54港元，较当前价格有60.4%的上涨空间 [1] * 核心观点：壁仞科技是中国本土AI训练/推理GPU的领导者，预计其AI GPU业务在2025-2030E年将实现101%的复合年增长率 [1][31] * 估值方法：目标价基于2030年预测的EV/EBITDA（46.6倍）折现至2027年得出，资本成本为12.7% [2][41][44] * 目标价隐含的估值倍数：对应2027年预测市销率20倍，2030年预测市盈率38倍 [2][45] * 并购可能性：给予并购评级3分（低概率），认为其近期被收购的可能性较低 [55] 增长驱动因素 * **中国云资本开支增长**：中国主要云服务提供商（字节跳动、阿里巴巴、腾讯、百度）的资本开支预计在2025-2027E年将分别增长62%、17%和9%，为AI基础设施扩张提供动力 [1][19][20] * **本土市场份额提升**：凭借有竞争力的性价比、不断发展的本土AI生态系统以及中国政府对本土AI芯片的支持，公司有望在中国市场获得份额 [1][56] * **产品性能升级与新品发布**：向更高算力和性能的AI芯片迁移是关键驱动因素 [1] * BR166模块已于2025年8月发布，采用Chiplet设计，集成两颗BR106，性能翻倍，预计将支持未来增长并改善毛利率 [1][32][33] * 产品路线图包括预计在2026E年推出的BR20X（采用Chiplet设计，支持FP8/FP4等数据格式）以及2028E年规划的BR30X/BR31X（用于云训练/推理和边缘推理） [31][32] * **全栈解决方案与生态系统**：公司提供集成GPGPU硬件和BIRENSUPA软件平台的全栈解决方案，加速客户AI部署 [1][31] * **中国先进制程产能扩张**：支持本土AI芯片的增长 [1] * **AI芯片本土化趋势**：受益于中国AI芯片的国产化替代趋势 [31] 财务预测与业务展望 * **收入高速增长**：预计总收入将从2024年的3.368亿元人民币增长至2030E年的313.88亿元人民币，2025-2030E年复合年增长率达101% [6][31][45] * 2025E、2026E、2027E年收入预测分别为9.454亿、19.190亿、55.888亿元人民币，同比增长率分别为180.7%、103.0%、191.2% [6][11] * **GPU板卡出货量激增**：预计AI芯片（GPU板卡）出货量将从2025E年的3万片增长至2030E年的90万片，2025-2030E年复合年增长率达96% [2][25][26] * **毛利率改善**：随着出货量上升和产品结构向高性能GPU升级，毛利率预计将从2025E年的35.3%提升至2030E年的38.5% [34][36][45] * **费用率下降**：随着收入规模扩大和运营效率提升，运营费用率预计将从2025E年的160.3%显著改善至2030E年的27.6% [34][36] * **盈利拐点**：预计净亏损将持续收窄，并在2028E年首次实现扭亏为盈，净利润达到8800万元人民币，到2030E年净利润将增至31.23亿元人民币 [34][36][40] * **现金流改善**：自由现金流预计在2028E年转正，达到3.37亿元人民币，2030E年进一步增至12.86亿元人民币 [36][40] * **运营效率提升**：现金周转周期预计将从2026E年的127天大幅改善至2030E年的14天，主要得益于库存天数从240天降至60天 [36][38] 市场争议与风险 * **关键争议点**：市场担忧本土晶圆厂产能和竞争 [2] * **高盛观点**： * 本土科技公司对培育本土AI生态系统有强烈承诺 [2] * 存在大量不需要高算力的AI推理市场 [2] * 可通过有效利用网络技术扩展大型AI训练计算集群 [2] * 考虑到市场庞大且在增长，以及AI芯片设计的高进入壁垒（需兼具硬件和软件能力），预计不会出现激烈的价格竞争 [2] * **主要下行风险**： 1. **中国AI芯片需求低于预期**：这是公司收入增长的关键驱动力之一 [17][57][58] 2. **市场竞争激烈程度超预期**：可能拖累GPU板卡出货增长和利润率 [17][57][58] 3. **晶圆供应限制**：公司于2023年10月被列入美国实体清单，若先进制程晶圆供应进一步受限，或本土代工厂供应不及预期，将对GPU板卡出货构成风险 [17][57][58] 估值与同业比较 * **目标估值倍数**：基于2030E的EV/EBITDA为46.6倍，该倍数源自同业公司的EV/EBITDA与其EBITDA同比增长率及EBITDA利润率的相关性 [2][41][43] * **同业比较**： * 目标价隐含的2027E市销率（20倍）高于全球同业（英伟达8.2倍，AMD 5.7倍），但低于中国同业（芯原股份16.7倍），并得到2027-28E年161%的平均收入增速支持 [2][52] * 目标价隐含的2030E市盈率（38倍）对应的PEG&M比率（0.4倍）低于部分相对成熟的中国半导体同业（如长电科技1.1倍，北方华创0.9倍），表明估值未过度拉伸 [45][46] 其他重要信息 * **财务数据**： * 市值：约821亿港元（105亿美元）[6] * 企业价值：约735亿港元（94亿美元）[6] * 2024年毛利率为53.2%，但处于净亏损状态，净亏损15.381亿元人民币 [6][11][15] * 预计2025-2027E年将持续亏损，但亏损额收窄 [6][11] * **行业背景**：生成式AI的发展，特别是2024年底本土基础模型（如深度求索）的发布，预计将利好中国半导体在IP、设计、代工、先进封装和SPE等环节的发展 [18] * **股东结构**：公司于2026年1月上市，股权相对集中（创始人及员工持股平台截至2026年1月分别持股约16%和8%），降低了近期被收购的可能性 [55]

新浪科技· 2025-12-12 19:22

英伟达Blackwell芯片部署与微软数据中心冷却方案 - 英伟达正在为微软数据中心部署最新一代Blackwell芯片，以支持AI模型训练与推理的算力需求[1] - 部署过程中，英伟达员工发现微软一处设施的冷却方式显得“过于浪费”，但该设计带来了良好的弹性与故障容忍能力[1] - 具体部署包括两组GB200 NVL72机架，每组搭载72颗英伟达GPU，高密度GPU阵列产生巨量热能，微软采用液冷技术将热量从服务器周围迅速带走[1] 数据中心冷却技术路径与权衡 - 专家解释数据中心通常采用“双层冷却结构”：服务器内部用液冷，建筑本体需另一套系统将整体热量排到室外[2] - 微软被指“浪费”的冷却方式，可能是指其采用空气冷却作为建筑级散热，而非使用水冷[2] - 空气冷却虽然能源消耗更高，但不耗水，企业在能源消耗、水资源压力与舆论反应之间必须进行权衡[2] 英伟达Fairwater集群的性能与设计 - Fairwater是由数十万个NVIDIA GB200无缝连接的集群，连接它们的光纤足以绕地球4.5圈[3] - 该集群将提供比当今世界最快超级计算机高出10倍的性能，实现前所未有的AI训练和推理工作负载水平[3] - 为满足指数级AI训练算力需求，公司将数据中心、GPU集群和网络设计为一个集成系统，确保单个作业从第一天起就可以在数千个GPU上以指数级规模运行[4] 英伟达的可持续数据中心战略 - Fairwater采用液冷闭环系统来冷却GPU，该系统在建造完成后运行过程中无需用水[5] - 公司正在用可再生能源来匹配数据中心所有消耗的能源[5] - 公司正在开辟新道路，设计闭环能源系统以满足现实世界的计算需求，并与当地社区合作确保可持续性并创造就业机会[7][8] 英伟达全球AI基础设施布局 - Fairwater只是公司在70多个区域启用的类似站点之一[6] - 公司还在美国其他地区建造多个相同的Fairwater数据中心[6] - 公司的人工智能基础设施已部署在全球100多个数据中心，为模型训练、测试时计算、强化学习调优和全球范围内的实时推理提供支持[6][7]

傅里叶的猫· 2025-06-08 20:28

售价 - RTX5090发布时预期售价高达4万元以上但4个月后价格已跌至2万元出头部分电商平台同德品牌低至2.3万元 [2] - 价格快速下滑原因包括芯片过热问题影响消费者信心多卡组网性能瓶颈传闻降低企业采购意愿厂商初期大幅抬价导致需求不及预期 RTX4090改装48GB版本更具性价比 [2] 租金 - 初期售价高昂导致租赁市场发展缓慢 5月份价格回落后部分机房开始上架RTX5090机型 [3] - 8卡整机扣除机柜租赁费和电费后投资回本周期约4年对AI企业而言周期较长 [3] - 单卡租赁价格约1万元/年 8卡整机配置价格约30万元 [6] 算力 - FP16精度算力单卡419 TFLOPS 8卡整机约3.4 PFLOPS 300张可组成PFLOPS级算力集群 [4] - 在大型语言模型训练推理及高性能计算任务中具备显著优势但需依赖软件优化和组网效率 [4] 功耗 - 额定功耗575W 峰值功耗瞬间高达900W 8卡整机功耗约6kW [7] - 按每千瓦时电费0.6元计算 8卡整机每月电费约3600元高功耗增加运营成本并对机房散热供电系统提出更高要求 [7] 性能 - 支持FP8/FP4低精度运算显著提升AI推理效率与RTX4090相比推理速度快约50% [8] - 4K分辨率下游戏平均帧率显著优于4090 但性能优势发挥需针对性优化 [8] 发热 - 发热问题集中在芯片和12V-2x6电源连接器出现过热和熔化现象发生概率较低但需关注 [9] - 缓解措施包括限制瞬间功率采用液冷或涡轮风扇使用原厂电源连接线 [9] 组网 - 早期多卡组网锁卡或性能瓶颈传闻源于驱动不成熟随着驱动更新问题已基本解决 [11] - NVLink和PCIe组网表现稳定适合构建高性能AI集群 [11]