Workflow
平头哥P810E芯片
icon
搜索文档
2026大厂资本开支-AI算力格局分析
2026-04-13 14:12
纪要涉及的行业或公司 * 行业:AI算力、云计算、半导体芯片 * 公司:阿里巴巴(阿里云、平头哥、通义千问、百炼、Token Hub事业群)、华为(升腾)、海光信息、寒武纪、中科曙光、沐曦、摩尔线程、新源、英特尔、AMD、英伟达、中芯国际、台积电 [1][2][4][5][6][7][10][12][14][16][17] 核心观点与论据 1. AI交互模式变革驱动高核CPU结构性需求 * **观点**:AI交互逻辑从直接与模型交互转变为Agent方式,驱动对高核CPU的结构性需求,CPU与GPU的配比向4:1演进 [1][2] * **论据**: * Agent模式需要额外多核CPU进行任务编排和下发,若CPU成为瓶颈将导致GPU闲置 [2] * 量化测算:支撑1亿DAU(约1000万并发用户)需要约2000万个CPU内核,若采用96核CPU,相当于需要约20万颗高核CPU,同时需要近250万颗H20级别的GPU卡,CPU:GPU配比为4:1 [2][3] * 阿里为满足亿级DAU产品目标,预计2026年需新增超过20万颗高核CPU [1][4] 2. 阿里资本开支与芯片采购规划明确,国产化率目标高 * **观点**:阿里2027财年资本开支预算1600亿元,其中AI服务器占1040亿元,芯片采购预算650亿元,国产化率目标直指70% [1][5][17] * **论据**: * **资本开支**:2027财年总资本支出预算约1600亿元,AI服务器相关预算1040亿元,芯片直接采购预算约650亿元 [1][5] * **芯片采购预算分配**: * 英伟达H200:预留190-200亿元(采购存在不确定性)[5] * 自研芯片(平头哥):计划生产约40万颗,预算约200亿元 [1][5] * 升腾910B/C:计划采购约15万颗,预算约120亿元 [5] * 海光芯片:预算约40亿元 [5] * 寒武纪590/690:计划采购4万多颗,预算约30亿元 [5] * **国产化目标**:政策引导、国家采购优先国产、自身业务算力需求紧迫共同推动,目标在2026-2027年上半年窗口期内实现70%国产化率 [17] 3. 国产AI芯片性能与生态对比 * **观点**:国产AI芯片性能持续追赶,生态成熟度是关键差异点 [6] * **论据**(以英伟达H100为基准): * **性能对比**: * 升腾910:性能达H100的65%-70% [1][6] * 平头哥自研芯片:性能约为H100的35%,介于H20和A100之间 [6][7] * 海光DCU三号:性能约为H100的45% [1][6] * 寒武纪思元690:性能约为H100的55% [6] * 沐曦、摩尔线程等:性能为H100的一半以下 [6] * **生态成熟度(百分制)与稳定性**: * 升腾:约80分,万卡集群无故障运行约35天,年故障率约4% [6] * 阿里自研芯片:约75分,带宽700GB/s限制超大模型训练能力 [6] * 海光:约72分,类CUDA生态迁移成本低,数千卡集群无故障运行约25天 [6][7] * 寒武纪思元690:约68分,软件迁移代价高,无故障运行约20天,年故障率约6% [6][7] 4. 自研芯片进展显著,成本优势明显 * **观点**:平头哥自研芯片P810E量产推进,采用国产工艺,可显著降低推理成本 [1][7] * **论据**: * **量产情况**:截至2026年Q1累计生产近20万颗,2026年目标在中芯国际量产40万颗(一半对外供给,一半自用)[1][7] * **技术迭代**:当前量产N+1工艺版本(96GB显存,700GB/s带宽,440W功耗),推进N+2工艺(性能提升15%,功耗更低),下一代研发目标为功耗再降30%、显存提升至120GB [7] * **成本影响**:全部采用自研卡,推理成本较英伟达方案可降低45%;内部应用(如“千牛”APP)可带来约15%的成本下降 [1][7][8] 5. 阿里云产品提价以改善利润 * **观点**:阿里云上调部分产品价格,预计将显著贡献利润增长 [1][11] * **论据**: * **提价详情(2025年3月7日起)**: * 通算产品(ECS/容器):涨幅5% [11] * AI/高性能计算实例:涨幅21% [1][11] * 大数据产品(大内存、内存即时访问):涨幅35% [1][11] * **利润影响**:通算业务(占收入55%)提价5%贡献约2.5个百分点利润增长;大数据等PaaS业务(占收入25%-30%)提价21%预计贡献8-9个百分点利润增幅 [11] * **执行原则**:“老客老价、新客新价”,2025年4月18日前签约老客户合同到期前执行旧价 [1][11] 6. 超节点定位高端,渗透率有限 * **观点**:超节点(高密度算力集群)不会成为主流,预计在推理集群中渗透率约15% [10] * **论据**: * **定位**:用于核心业务及密集型推理,通过显存共享能力连接成大规模显存池,更接近未来训练集群 [10] * **规模**:阿里在手订单近600台,预计2026年下半年达1000台,其中50%-60%交付外部客户(如国家电网、运营商)[1][10] * **特点**:单机柜峰值功耗达350kW,远高于普通机架的80-100kW,成本和功耗高 [1][10] * **竞争格局**:华为订单最多(数百台),升腾订单量近1000台,海光和中科曙光处于样机测试阶段 [16] 7. Token Hub事业群整合资源,目标驱动业务增长 * **观点**:成立Token Hub事业群,整合模型研发、基础设施、应用环节,形成以Token为导向的业务闭环,目标提升MaaS收入占比和单位Token毛利 [1][19][20] * **论据**: * **组织与分工**: * Token生产:通义事业部负责模型研发 [19] * Infra团队:目标实现高效、低成本推理,保证供给,计划到2026年底实现200万亿日均Token处理能力(从Q1的50-60万亿起,每季度增30%-40%)[1][19][20] * 应用环节:通过B端(如悟空平台,目标渗透钉钉2亿企业用户的30%)和C端(千问系列目标1亿日活)重点项目消耗Token [20] * **业务目标**:百炼MaaS业务在阿里云收入占比计划从十几个百分点提升至25%以上 [1][20] 其他重要内容 8. 数据中心布局与芯片采购节奏 * **数据中心布局**:2026年约60%+资源部署在国内(服务政企、金融等),30%-40%投向海外(新加坡、马来西亚、菲律宾、日本、韩国、墨西哥等)[6] * **2026上半年采购节奏**: * 自研芯片:4月起每月采购2-3万片 [14] * 升腾910:3月拿样片测试,预计6月下旬正式下单,全年forecast 15万片(上半年下单约8万片)[14] * 海光芯片:正在进行价格谈判(期望从6-7万元降至4-5万元),若顺利预计5月下第一批订单 [14] * 寒武纪:待软件问题修复(预计4-5月),可能6月获得订单 [14][15] 9. 高核CPU供应紧张,国产CPU作为补充 * **供应现状**:高核CPU(96核/128核)由英特尔和AMD主导,正提价(每季度40%-50%)且交货周期延长至16-18周,因先进制程产能被GPU占用 [4] * **供应商结构变化**:英特尔和AMD在阿里采购占比预计从超70%降至60%左右;国产CPU(海光C86、华为鲲鹏、倚天710、玄铁C950)将占30%-40%份额 [4][5] 10. 技术细节与策略 * **异构算力调度**:通过飞天系统将CUDA架构与非CUDA架构芯片分别池化,提供标准化vCPU/vGPU单元,动态调度任务,使不同GPU使用率保持65%-70% [11][12] * **玄铁C950(RISC-V CPU)特点**:主频约3.2GHz,采用国产N+1制程,内置AI双引擎加速和机密计算支持,生态适配进行中,预计未来三年在计算中心占比从个位数提升至20%-25% [12][13] * **下一代AI芯片设计**:阿里负责前端设计(逻辑架构、IP整合),合作方(如新源)负责后端设计(物理布线、流片、良率提升)[14] * **MaaS定价模式**: * 公有云API:按模型矩阵定价,如旗舰模型约20元/百万tokens,最便宜可至2元/百万tokens [8] * 私有化部署:收费基于云端处理的数据量(如1亿tokens),加上本地后训练的技术服务费,可与云端API调用结合 [9][10]