大厂算力进展交流

关键要点总结一、纪要涉及的行业与公司 * 行业：人工智能算力、国产AI芯片、大模型基础设施、MaaS（模型即服务）[1] * 主要涉及公司： * 互联网大厂：字节跳动、腾讯、阿里巴巴、百度[1][3][4] * 国产AI芯片/GPU供应商：寒武纪、华为升腾、昆仑芯、思远、海光、天数智芯、平头哥、沐曦[1][5][6][8][10][18][22] * 芯片代工厂：中芯国际、台积电、三星[1][2][12][16][22] * 其他：英伟达、AMD、博通、浪潮、华三、盛科网络[3][5][20][25][27] 二、核心观点与论据 1. 行业趋势与市场格局 * 国产芯片进入满产满销阶段：预计2026年绝大多数国产芯片公司将处于满产满销状态，产能即订单[1][3] * 竞争核心转向产能保障：未来1-2年，行业竞争的关键将从芯片设计能力转向产能保障问题，先进工艺受限可能锁定设计能力上限[1][14] * 算力市场供不应求：当前算力市场处于阶段性供不应求状态，国内厂商算力预算正在常态化增加，增速和幅度可能超出预期[3] * 自研芯片门槛降低：当资金和人才到位后，芯片设计和定制的门槛降低，预计未来更多厂商可能涉足芯片研发，产品性能可能趋于同质化[15] 2. 主要科技公司资本支出与采购计划 * 字节跳动： * 2026年整体资本支出预计最少为4,300亿至4,500亿元，其中GPU整机采购预算约为2,300亿至2,500亿元，较年初的1,600亿元大幅上调[1][3] * GPU预算上调主因：存储模组价格上涨两到三倍，CPU、HBM、DDR等部件价格显著上涨[3] * 通用算力CPU采购预算从约七八百亿元增加到1,100多亿元，服务器采购量从约100多万台增加到接近120万至130万台[3] * 腾讯： * 2026年GPU采购预算保底为1,000亿元，甚至有高层表示可能提升至2,000亿或3,000亿元[1][3] * 通用算力采购预算约为六七百亿元，整体基础设施建设投入可能达到两三千亿元[3][4] * 阿里巴巴： * 2026年GPU采购预算约为1,100亿至1,200亿元，通用算力采购预算约为五六百亿元[1][4] * 部分算力扩张通过OPEX模式的租赁方式进行，而非完全依赖CAPEX[4] * 百度： * 资本支出相对较少，通用算力投入约为几十万台服务器（二三十万或三四十万台），智算投入约为两三百亿元[4] * 业务模式特殊，倾向于通过百度智能云先将昆仑芯片销售给政府或智算中心等客户，再以返租形式使用算力，转移建设成本[4] 3. 供应商采购分配详情 * 字节跳动GPU采购分配（总预算2,300-2,500亿元）： * 海外市场（约1,200多亿元）：约60%以上采购英伟达芯片，30%左右采购AMD芯片，另有至少5%用于与博通合作的定制芯片[5][7] * 国内市场（约1,100多亿元）： * 约200多亿元采购英伟达H200，获批额度约为七八万张[5][7] * 寒武纪：获250-300亿元订单，几乎包揽其690型号全部产能，同时大量采购590和580型号[1][5][8] * 华为升腾：获220-250亿元订单，采购型号包括910C、950PR和950RDT等，950PR当前采购价约4万多至5万元，未来可能上调[1][5][6] * 自研芯片：投入约10%预算（200-300亿元），在三星代工[1][6][7] * 其他厂商：剩余100-200亿元预算分配给天数智芯（至少10万张卡入库，单卡价格约1.2万元）、海光（深算三号）、沐曦等[6][8][9] * 采购门槛：供应商需能保证每月约一万张卡、即年化十多万张卡的稳定交付能力[6] * 腾讯GPU采购分配： * 国产订单或达700-800亿元[1] * 供应商格局：昆仑芯为一供，思远为二供，之后是海光和寒武纪（但寒武纪产能基本被字节跳动包揽）[1][18] * 向英伟达采购额预计略超100亿元，因H200配额不多[18] * 昆仑芯供应产品包括R600（单卡价格约6.2万至6.3万元）和R900机柜方案[19] * 阿里巴巴GPU采购分配： * 若整体采购规模为一千几百亿元（整机），其中国产采购约七八百亿[22] * 思远有望在阿里国产采购中获100-200亿元份额[1][22] * 平头哥2026年预计出卡量约三四十万张，但取决于台积电和国内晶圆厂的实际产能[22] 4. 芯片自研进展 * 字节跳动自研芯片： * 团队规模约1,200至1,300人，下设GPU、CPU及弹性网卡和编解码芯片三大组，其中GPU团队约五六百人[2][16] * 训练芯片在三星代工，推理芯片在台积电制造，旨在垂直场景下实现更优成本控制[2][16] * CPU研发进度与GPU相似，预计2026年和2027年各推出一个代次，第一代产品正在流片[16] * 此前与博通合作的FP16集成HBM3芯片项目已停止[17] * 研发投入估算：以团队1,200-1,300人、人均年成本100万至150万元计，加上流片等费用，总投入可能达两三百亿至三四百亿元[18] 5. 产能与供应链关键信息 * 中芯国际先进工艺产能分配优先级：华为 > 海光 > 平头哥 > 昆仑芯[1][23] * 昆仑芯在N+1工艺上2026年获得的总产能可能仅为几万片[23][24] * 平头哥设计能力不错，但此前过度依赖台积电面临产能瓶颈，正寻求三星作为补充[1][22] * 天数智芯天罡300风险：核心风险在于供给，若采用台积电5nm等先进工艺，其能获得的晶圆产能存在很大不确定性[12] * 新芯片采购流程周期：从流片成功到获得大厂批量订单，整个周期快则需五个月，每个环节都可能成为瓶颈导致延迟[10] 6. 业务驱动与市场需求 * 字节跳动MaaS业务爆发： * 企业付费客户数从2025年1月的四五千家，增长至2025年底的十万多家，2026年3月已超过二十万家[1][28] * 带动火山引擎ToB业务年收入预期从原先的100多亿元上调至接近300亿元，下游客户付费意愿和客单价呈上涨趋势[1][28] * Token消耗驱动算力扩容： * 字节跳动内部token消耗量在2026年3月约为100多万亿/天，4月预计增长至140-150万亿/天，若到五六月份达500万亿/天，总用卡需求约330万张；若年底达1,000万亿/天，总用卡需求可能达450-500万张[26] * token消耗量增长直接影响对思远等供应商的采购扩容节奏，思远2026年七八月份到年底出货量保守估计可能达30万张，整个产品生命周期（2026年五六月至2027年五六月）总出货量有机会达百万张级别[26] * 算力焦虑存在差异：字节跳动因托管业务量明确增长确实存在算力焦虑，腾讯业务量尚未完全起量，焦虑程度可能没有市场传闻高[21] 三、其他重要信息 * 供应商表现与订单确定性： * 天数智芯、昆仑芯订单确定，海光可能获得订单[8][10] * 对毕升不要抱有太高期待，燧原基本不会被考虑，因产品表现不佳[10][13] * 字节跳动未测试过毕升新一代芯片样片，合作与否主要取决于产品产能和工程表现，而非股东背景[13] * 技术方案细节： * 华为升腾集群方案采用32卡或64卡模组形式，通过博通互联芯片进行节点间通信，非领先创新架构[25] * 字节跳动正在测试昆仑芯的R900超级节点方案，测试结合博通和盛科网络产品，目前盛科方案运行表现一般[27] * 在P-D分离架构中，对D卡的核心要求是高性价比，需FP16算力密度高、显存大、互联通信能力好[27] * 昆仑芯下一代产品： * M300芯片预计快则2026年九、十月份流片，慢则到2027年，字节跳动对其期待很高，可能获得数万张级别订单[11] * 采用N+1工艺的M100预计供应量可能不会很大[11]