Workflow
AI训练和推理
icon
搜索文档
壁仞科技:AI 训练、推理领域的本土 GPU 龙头;首次覆盖给予 “买入” 评级,目标价 54 港元
2026-02-10 11:24
研究报告关键要点总结 涉及的公司与行业 * 公司:壁仞科技 (Biren,股票代码 6082.HK) [1] * 行业:中国半导体行业,特别是AI训练/推理GPU芯片设计领域 [1][2][18] 核心观点与投资建议 * 高盛对壁仞科技首次覆盖,给予“买入”评级,12个月目标价为54港元,较当前价格有60.4%的上涨空间 [1] * 核心观点:壁仞科技是中国本土AI训练/推理GPU的领导者,预计其AI GPU业务在2025-2030E年将实现101%的复合年增长率 [1][31] * 估值方法:目标价基于2030年预测的EV/EBITDA(46.6倍)折现至2027年得出,资本成本为12.7% [2][41][44] * 目标价隐含的估值倍数:对应2027年预测市销率20倍,2030年预测市盈率38倍 [2][45] * 并购可能性:给予并购评级3分(低概率),认为其近期被收购的可能性较低 [55] 增长驱动因素 * **中国云资本开支增长**:中国主要云服务提供商(字节跳动、阿里巴巴、腾讯、百度)的资本开支预计在2025-2027E年将分别增长62%、17%和9%,为AI基础设施扩张提供动力 [1][19][20] * **本土市场份额提升**:凭借有竞争力的性价比、不断发展的本土AI生态系统以及中国政府对本土AI芯片的支持,公司有望在中国市场获得份额 [1][56] * **产品性能升级与新品发布**:向更高算力和性能的AI芯片迁移是关键驱动因素 [1] * BR166模块已于2025年8月发布,采用Chiplet设计,集成两颗BR106,性能翻倍,预计将支持未来增长并改善毛利率 [1][32][33] * 产品路线图包括预计在2026E年推出的BR20X(采用Chiplet设计,支持FP8/FP4等数据格式)以及2028E年规划的BR30X/BR31X(用于云训练/推理和边缘推理) [31][32] * **全栈解决方案与生态系统**:公司提供集成GPGPU硬件和BIRENSUPA软件平台的全栈解决方案,加速客户AI部署 [1][31] * **中国先进制程产能扩张**:支持本土AI芯片的增长 [1] * **AI芯片本土化趋势**:受益于中国AI芯片的国产化替代趋势 [31] 财务预测与业务展望 * **收入高速增长**:预计总收入将从2024年的3.368亿元人民币增长至2030E年的313.88亿元人民币,2025-2030E年复合年增长率达101% [6][31][45] * 2025E、2026E、2027E年收入预测分别为9.454亿、19.190亿、55.888亿元人民币,同比增长率分别为180.7%、103.0%、191.2% [6][11] * **GPU板卡出货量激增**:预计AI芯片(GPU板卡)出货量将从2025E年的3万片增长至2030E年的90万片,2025-2030E年复合年增长率达96% [2][25][26] * **毛利率改善**:随着出货量上升和产品结构向高性能GPU升级,毛利率预计将从2025E年的35.3%提升至2030E年的38.5% [34][36][45] * **费用率下降**:随着收入规模扩大和运营效率提升,运营费用率预计将从2025E年的160.3%显著改善至2030E年的27.6% [34][36] * **盈利拐点**:预计净亏损将持续收窄,并在2028E年首次实现扭亏为盈,净利润达到8800万元人民币,到2030E年净利润将增至31.23亿元人民币 [34][36][40] * **现金流改善**:自由现金流预计在2028E年转正,达到3.37亿元人民币,2030E年进一步增至12.86亿元人民币 [36][40] * **运营效率提升**:现金周转周期预计将从2026E年的127天大幅改善至2030E年的14天,主要得益于库存天数从240天降至60天 [36][38] 市场争议与风险 * **关键争议点**:市场担忧本土晶圆厂产能和竞争 [2] * **高盛观点**: * 本土科技公司对培育本土AI生态系统有强烈承诺 [2] * 存在大量不需要高算力的AI推理市场 [2] * 可通过有效利用网络技术扩展大型AI训练计算集群 [2] * 考虑到市场庞大且在增长,以及AI芯片设计的高进入壁垒(需兼具硬件和软件能力),预计不会出现激烈的价格竞争 [2] * **主要下行风险**: 1. **中国AI芯片需求低于预期**:这是公司收入增长的关键驱动力之一 [17][57][58] 2. **市场竞争激烈程度超预期**:可能拖累GPU板卡出货增长和利润率 [17][57][58] 3. **晶圆供应限制**:公司于2023年10月被列入美国实体清单,若先进制程晶圆供应进一步受限,或本土代工厂供应不及预期,将对GPU板卡出货构成风险 [17][57][58] 估值与同业比较 * **目标估值倍数**:基于2030E的EV/EBITDA为46.6倍,该倍数源自同业公司的EV/EBITDA与其EBITDA同比增长率及EBITDA利润率的相关性 [2][41][43] * **同业比较**: * 目标价隐含的2027E市销率(20倍)高于全球同业(英伟达8.2倍,AMD 5.7倍),但低于中国同业(芯原股份16.7倍),并得到2027-28E年161%的平均收入增速支持 [2][52] * 目标价隐含的2030E市盈率(38倍)对应的PEG&M比率(0.4倍)低于部分相对成熟的中国半导体同业(如长电科技1.1倍,北方华创0.9倍),表明估值未过度拉伸 [45][46] 其他重要信息 * **财务数据**: * 市值:约821亿港元(105亿美元)[6] * 企业价值:约735亿港元(94亿美元)[6] * 2024年毛利率为53.2%,但处于净亏损状态,净亏损15.381亿元人民币 [6][11][15] * 预计2025-2027E年将持续亏损,但亏损额收窄 [6][11] * **行业背景**:生成式AI的发展,特别是2024年底本土基础模型(如深度求索)的发布,预计将利好中国半导体在IP、设计、代工、先进封装和SPE等环节的发展 [18] * **股东结构**:公司于2026年1月上市,股权相对集中(创始人及员工持股平台截至2026年1月分别持股约16%和8%),降低了近期被收购的可能性 [55]
英伟达员工指微软数据中心冷却系统浪费资源
新浪科技· 2025-12-12 19:22
英伟达Blackwell芯片部署与微软数据中心冷却方案 - 英伟达正在为微软数据中心部署最新一代Blackwell芯片,以支持AI模型训练与推理的算力需求[1] - 部署过程中,英伟达员工发现微软一处设施的冷却方式显得“过于浪费”,但该设计带来了良好的弹性与故障容忍能力[1] - 具体部署包括两组GB200 NVL72机架,每组搭载72颗英伟达GPU,高密度GPU阵列产生巨量热能,微软采用液冷技术将热量从服务器周围迅速带走[1] 数据中心冷却技术路径与权衡 - 专家解释数据中心通常采用“双层冷却结构”:服务器内部用液冷,建筑本体需另一套系统将整体热量排到室外[2] - 微软被指“浪费”的冷却方式,可能是指其采用空气冷却作为建筑级散热,而非使用水冷[2] - 空气冷却虽然能源消耗更高,但不耗水,企业在能源消耗、水资源压力与舆论反应之间必须进行权衡[2] 英伟达Fairwater集群的性能与设计 - Fairwater是由数十万个NVIDIA GB200无缝连接的集群,连接它们的光纤足以绕地球4.5圈[3] - 该集群将提供比当今世界最快超级计算机高出10倍的性能,实现前所未有的AI训练和推理工作负载水平[3] - 为满足指数级AI训练算力需求,公司将数据中心、GPU集群和网络设计为一个集成系统,确保单个作业从第一天起就可以在数千个GPU上以指数级规模运行[4] 英伟达的可持续数据中心战略 - Fairwater采用液冷闭环系统来冷却GPU,该系统在建造完成后运行过程中无需用水[5] - 公司正在用可再生能源来匹配数据中心所有消耗的能源[5] - 公司正在开辟新道路,设计闭环能源系统以满足现实世界的计算需求,并与当地社区合作确保可持续性并创造就业机会[7][8] 英伟达全球AI基础设施布局 - Fairwater只是公司在70多个区域启用的类似站点之一[6] - 公司还在美国其他地区建造多个相同的Fairwater数据中心[6] - 公司的人工智能基础设施已部署在全球100多个数据中心,为模型训练、测试时计算、强化学习调优和全球范围内的实时推理提供支持[6][7]
RTX5090目前的市场行情
傅里叶的猫· 2025-06-08 20:28
售价 - RTX5090发布时预期售价高达4万元以上 但4个月后价格已跌至2万元出头 部分电商平台同德品牌低至2.3万元 [2] - 价格快速下滑原因包括芯片过热问题影响消费者信心 多卡组网性能瓶颈传闻降低企业采购意愿 厂商初期大幅抬价导致需求不及预期 RTX4090改装48GB版本更具性价比 [2] 租金 - 初期售价高昂导致租赁市场发展缓慢 5月份价格回落后部分机房开始上架RTX5090机型 [3] - 8卡整机扣除机柜租赁费和电费后投资回本周期约4年 对AI企业而言周期较长 [3] - 单卡租赁价格约1万元/年 8卡整机配置价格约30万元 [6] 算力 - FP16精度算力单卡419 TFLOPS 8卡整机约3.4 PFLOPS 300张可组成PFLOPS级算力集群 [4] - 在大型语言模型训练 推理及高性能计算任务中具备显著优势 但需依赖软件优化和组网效率 [4] 功耗 - 额定功耗575W 峰值功耗瞬间高达900W 8卡整机功耗约6kW [7] - 按每千瓦时电费0.6元计算 8卡整机每月电费约3600元 高功耗增加运营成本并对机房散热供电系统提出更高要求 [7] 性能 - 支持FP8/FP4低精度运算 显著提升AI推理效率 与RTX4090相比推理速度快约50% [8] - 4K分辨率下游戏平均帧率显著优于4090 但性能优势发挥需针对性优化 [8] 发热 - 发热问题集中在芯片和12V-2x6电源连接器 出现过热和熔化现象 发生概率较低但需关注 [9] - 缓解措施包括限制瞬间功率 采用液冷或涡轮风扇 使用原厂电源连接线 [9] 组网 - 早期多卡组网锁卡或性能瓶颈传闻源于驱动不成熟 随着驱动更新问题已基本解决 [11] - NVLink和PCIe组网表现稳定 适合构建高性能AI集群 [11]