文章核心观点 - 在严格的芯片出口管制倒逼下,国产数据中心AI芯片自主化进程加速,一批公司出货量或订单量已达到万卡级别,市场份额迅速攀升至35%,行业竞争进入“规模化交付验证”新阶段 [1][2] - 国产AI芯片在推理场景寻求突破,部分产品性能已接近或超过英伟达特供版H20,并通过优化致力于大幅降低推理成本,但整体在软件生态适配、先进制程与内存供应方面仍面临挑战 [12][14][11] - 行业未来可能参照光伏产业发展路径,通过激烈竞争跑出具备国际竞争力的企业,但AI芯片的竞争由软件、硬件和生态共同决定,其淘汰机制与光伏产业存在本质差异 [15][16] 国产AI芯片市场规模与份额 - 2025年上半年中国加速服务器(AI芯片)市场规模达160亿美元,出货量超过190万张,其中国产AI芯片市场份额约占35%,英伟达占62%,国产芯片需求增长速度远超英伟达 [2] - 国产AI芯片单价约在3万至20万元人民币每卡不等,出货量或订单量达到万卡规模,表明其性能、稳定性和总拥有成本已获得一定市场认可 [1] - 随着国产AI芯片代工产能提升,预计2026年国产AI推理芯片出货量将迎来一轮爆发式增长 [2] 主要参与者及出货情况 - 华为昇腾与百度昆仑芯是出货规模最大的国产AI芯片,性能突出并已用于部分模型训练场景,IDC数据显示华为昇腾市场份额位居国内第一,百度昆仑芯位居国内第三 [5] - 百度已于2025年2月点亮昆仑芯P800万卡集群,并计划未来点亮三万卡集群,客户包括金融、能源、制造等领域大型企业 [5] - 寒武纪是国内出货量最大的国产AI芯片之一,主要客户包括大型互联网公司、电信运营商和金融机构 [5] - 多家AI芯片创业公司累积出货量已超过万卡:沐曦超过2.5万卡 [8],天数智芯已交付5.2万枚芯片 [8],燧原科技AI加速卡及模组合计销量达9.72万张 [9] - 包括曦望、清微智能在内的非上市公司出货量或订单量也已超过万卡:曦望2025年AI芯片交付破万卡 [10],清微智能截至2026年1月订单量累计超过至少2万卡 [10] 技术路径与产品策略 - 部分国产AI芯片创业公司为追求可用、可控及出货规模,并未采用7nm及以下先进制程和HBM内存,而是采用更成熟且本土产业链能更快量产的12nm工艺和LPDDR内存,价格可低至3万元/卡 [11] - 行业预计2026年-2027年中国市场还会有多款国产AI推理芯片上市,并迎来爆发 [11] - 国产AI芯片公司普遍注重提升推理性能以“榨干”每一枚芯片的Token(词元)生成能力,这是衡量芯片实际推理效率的核心指标 [12] - 曦望公司目标是将百万Tokens的推理成本从2025年的1元人民币降低至1分级别,其下一代启望S3芯片目标推理性能相比上一代提升十倍以上 [13] 性能表现与生态挑战 - 在推理场景,部分国产AI芯片性能表现已接近或超过英伟达特供版H20芯片,例如百度昆仑芯P800、阿里PPU在运行适配优化模型时,Token吞吐效率优于H20 [14] - 国产AI芯片在软件生态层面普遍面临适配慢、适配难的问题,无法像英伟达芯片一样快速适配市面上大部分模型,为国产芯片适配新模型通常需一两个月,导致无法第一时间使用最新模型 [15] - 据业内人士表示,某国产AI芯片在Hugging Face开源社区上适配的模型数量只有几十款,而该社区拥有超过200万款模型 [15] - 国产AI芯片上游受限于芯片代工产能,下游受限于软件生态,其交付稳定性、软件栈成熟度与生态迁移成本将决定“万卡之后”的复购与生存 [16]
至少有九家中国AI芯片公司出货量超万卡