大厂算力进展交流
2026-04-24 08:10

关键要点总结 一、 纪要涉及的行业与公司 * 行业:人工智能算力、国产AI芯片、大模型基础设施、MaaS(模型即服务)[1] * 主要涉及公司: * 互联网大厂:字节跳动、腾讯、阿里巴巴、百度[1][3][4] * 国产AI芯片/GPU供应商:寒武纪、华为升腾、昆仑芯、思远、海光、天数智芯、平头哥、沐曦[1][5][6][8][10][18][22] * 芯片代工厂:中芯国际、台积电、三星[1][2][12][16][22] * 其他:英伟达、AMD、博通、浪潮、华三、盛科网络[3][5][20][25][27] 二、 核心观点与论据 1. 行业趋势与市场格局 * 国产芯片进入满产满销阶段:预计2026年绝大多数国产芯片公司将处于满产满销状态,产能即订单[1][3] * 竞争核心转向产能保障:未来1-2年,行业竞争的关键将从芯片设计能力转向产能保障问题,先进工艺受限可能锁定设计能力上限[1][14] * 算力市场供不应求:当前算力市场处于阶段性供不应求状态,国内厂商算力预算正在常态化增加,增速和幅度可能超出预期[3] * 自研芯片门槛降低:当资金和人才到位后,芯片设计和定制的门槛降低,预计未来更多厂商可能涉足芯片研发,产品性能可能趋于同质化[15] 2. 主要科技公司资本支出与采购计划 * 字节跳动: * 2026年整体资本支出预计最少为4,300亿至4,500亿元,其中GPU整机采购预算约为2,300亿至2,500亿元,较年初的1,600亿元大幅上调[1][3] * GPU预算上调主因:存储模组价格上涨两到三倍,CPU、HBM、DDR等部件价格显著上涨[3] * 通用算力CPU采购预算从约七八百亿元增加到1,100多亿元,服务器采购量从约100多万台增加到接近120万至130万台[3] * 腾讯: * 2026年GPU采购预算保底为1,000亿元,甚至有高层表示可能提升至2,000亿或3,000亿元[1][3] * 通用算力采购预算约为六七百亿元,整体基础设施建设投入可能达到两三千亿元[3][4] * 阿里巴巴: * 2026年GPU采购预算约为1,100亿至1,200亿元,通用算力采购预算约为五六百亿元[1][4] * 部分算力扩张通过OPEX模式的租赁方式进行,而非完全依赖CAPEX[4] * 百度: * 资本支出相对较少,通用算力投入约为几十万台服务器(二三十万或三四十万台),智算投入约为两三百亿元[4] * 业务模式特殊,倾向于通过百度智能云先将昆仑芯片销售给政府或智算中心等客户,再以返租形式使用算力,转移建设成本[4] 3. 供应商采购分配详情 * 字节跳动GPU采购分配(总预算2,300-2,500亿元): * 海外市场(约1,200多亿元):约60%以上采购英伟达芯片,30%左右采购AMD芯片,另有至少5%用于与博通合作的定制芯片[5][7] * 国内市场(约1,100多亿元): * 约200多亿元采购英伟达H200,获批额度约为七八万张[5][7] * 寒武纪:获250-300亿元订单,几乎包揽其690型号全部产能,同时大量采购590和580型号[1][5][8] * 华为升腾:获220-250亿元订单,采购型号包括910C、950PR和950RDT等,950PR当前采购价约4万多至5万元,未来可能上调[1][5][6] * 自研芯片:投入约10%预算(200-300亿元),在三星代工[1][6][7] * 其他厂商:剩余100-200亿元预算分配给天数智芯(至少10万张卡入库,单卡价格约1.2万元)、海光(深算三号)、沐曦等[6][8][9] * 采购门槛:供应商需能保证每月约一万张卡、即年化十多万张卡的稳定交付能力[6] * 腾讯GPU采购分配: * 国产订单或达700-800亿元[1] * 供应商格局:昆仑芯为一供,思远为二供,之后是海光和寒武纪(但寒武纪产能基本被字节跳动包揽)[1][18] * 向英伟达采购额预计略超100亿元,因H200配额不多[18] * 昆仑芯供应产品包括R600(单卡价格约6.2万至6.3万元)和R900机柜方案[19] * 阿里巴巴GPU采购分配: * 若整体采购规模为一千几百亿元(整机),其中国产采购约七八百亿[22] * 思远有望在阿里国产采购中获100-200亿元份额[1][22] * 平头哥2026年预计出卡量约三四十万张,但取决于台积电和国内晶圆厂的实际产能[22] 4. 芯片自研进展 * 字节跳动自研芯片: * 团队规模约1,200至1,300人,下设GPU、CPU及弹性网卡和编解码芯片三大组,其中GPU团队约五六百人[2][16] * 训练芯片在三星代工,推理芯片在台积电制造,旨在垂直场景下实现更优成本控制[2][16] * CPU研发进度与GPU相似,预计2026年和2027年各推出一个代次,第一代产品正在流片[16] * 此前与博通合作的FP16集成HBM3芯片项目已停止[17] * 研发投入估算:以团队1,200-1,300人、人均年成本100万至150万元计,加上流片等费用,总投入可能达两三百亿至三四百亿元[18] 5. 产能与供应链关键信息 * 中芯国际先进工艺产能分配优先级:华为 > 海光 > 平头哥 > 昆仑芯[1][23] * 昆仑芯在N+1工艺上2026年获得的总产能可能仅为几万片[23][24] * 平头哥设计能力不错,但此前过度依赖台积电面临产能瓶颈,正寻求三星作为补充[1][22] * 天数智芯天罡300风险:核心风险在于供给,若采用台积电5nm等先进工艺,其能获得的晶圆产能存在很大不确定性[12] * 新芯片采购流程周期:从流片成功到获得大厂批量订单,整个周期快则需五个月,每个环节都可能成为瓶颈导致延迟[10] 6. 业务驱动与市场需求 * 字节跳动MaaS业务爆发: * 企业付费客户数从2025年1月的四五千家,增长至2025年底的十万多家,2026年3月已超过二十万家[1][28] * 带动火山引擎ToB业务年收入预期从原先的100多亿元上调至接近300亿元,下游客户付费意愿和客单价呈上涨趋势[1][28] * Token消耗驱动算力扩容: * 字节跳动内部token消耗量在2026年3月约为100多万亿/天,4月预计增长至140-150万亿/天,若到五六月份达500万亿/天,总用卡需求约330万张;若年底达1,000万亿/天,总用卡需求可能达450-500万张[26] * token消耗量增长直接影响对思远等供应商的采购扩容节奏,思远2026年七八月份到年底出货量保守估计可能达30万张,整个产品生命周期(2026年五六月至2027年五六月)总出货量有机会达百万张级别[26] * 算力焦虑存在差异:字节跳动因托管业务量明确增长确实存在算力焦虑,腾讯业务量尚未完全起量,焦虑程度可能没有市场传闻高[21] 三、 其他重要信息 * 供应商表现与订单确定性: * 天数智芯、昆仑芯订单确定,海光可能获得订单[8][10] * 对毕升不要抱有太高期待,燧原基本不会被考虑,因产品表现不佳[10][13] * 字节跳动未测试过毕升新一代芯片样片,合作与否主要取决于产品产能和工程表现,而非股东背景[13] * 技术方案细节: * 华为升腾集群方案采用32卡或64卡模组形式,通过博通互联芯片进行节点间通信,非领先创新架构[25] * 字节跳动正在测试昆仑芯的R900超级节点方案,测试结合博通和盛科网络产品,目前盛科方案运行表现一般[27] * 在P-D分离架构中,对D卡的核心要求是高性价比,需FP16算力密度高、显存大、互联通信能力好[27] * 昆仑芯下一代产品: * M300芯片预计快则2026年九、十月份流片,慢则到2027年,字节跳动对其期待很高,可能获得数万张级别订单[11] * 采用N+1工艺的M100预计供应量可能不会很大[11]

大厂算力进展交流 - Reportify