涉及行业与公司 * 行业:人工智能(AI)行业,特别是大语言模型(LLM)领域 [1] * 涉及公司:中国AI实验室(如MiniMax、阿里巴巴、深度求索、智谱华章等)与美国AI实验室(如OpenAI、xAI、Anthropic、Google、Meta等)[2][22][118] 中国云服务提供商(如阿里巴巴、腾讯、百度、字节跳动等)与美国云服务提供商(如AWS、微软、谷歌、Meta)[2][14] 半导体公司(如英伟达、华为)[4][26] 核心观点与论据 中国AI投资效率与追赶态势 * 中国顶级AI模型(MiniMax M2)的性能仅比美国顶级模型(GPT5)低10%,但中国超大规模云服务商2023-2025年的合计资本支出为1240亿美元,比美国同行(6940亿美元)低82%,显示出更高的投资效率 [2][12] * 中国AI模型有望赶超美国,因为许多中国参与者可以在境外进行预训练,不受芯片限制 [2] * 对于开源模型,中国模型的性能已经处于世界领先地位 [2] 中美AI发展路径差异 * 美国AI参与者专注于提升模型性能以实现AGI,导致资本支出持续增加,但规模定律的效益正在显著放缓,意味着潜在投资回报率下降 [3][86] * 中国AI参与者专注于开源模型和提高模型效率以应对硬件限制,从而降低Token成本和API定价 [3] * 中国拥有全球最低的AI API定价,深度求索近期因其效率提升将API定价降低了63%,低价更容易推动应用开发和用户采用 [3][32][81] 中国AI资本支出与芯片供应预测上调 * 将2025-2030年中国累计AI资本支出预测上调8%至8840亿美元,调整基于:1)取消此前对进口英伟达降级芯片的预测(已被政府禁止) 2)将中国7nm制程良率假设从7%-20%上调至15%-35% [4][26][71] * 良率上调基于华为在其GPU设计中减少核心数量以增加并行计算面积,使得即使存在一些缺陷的芯片仍可使用 [4] * 更新后的预测意味着2025/2026年AI资本支出下调,但2027-2030年上调,到2030年,预计中国将生产411万颗GPU,高于此前约280万颗的预测 [4][26][73] Token消耗快速增长与计算需求 * 中国的每日Token消耗量在2024年3月至2025年3月间增长了100倍,并在截至2025年6月的三个月内再增长3倍,达到30万亿 [4][37] * 预测中国的推理Token使用量到2030年将增长140倍,达到184.5万亿,主要由企业需求驱动(2028年2B需求占比将从2024年的12%升至53%) [39][40][90] * 尽管Token消耗量增长140倍,但由于效率提升,计算需求仅增长10倍 [4] * 基于芯片供应的计算可用性预测在2030年将超过Token消耗需求119%,意味着有额外的6000 EFLOPS可用于训练和/或更多推理,芯片短缺不再是重大风险 [4][42][97] 其他重要内容 * 模型性能改善的边际收益正在递减,例如OpenAI的模型增量改进幅度已显著下降 [25][86] * 尽管ChatGPT-5仍然领先,但其领先优势随着竞争加剧已大幅缩小 [18][64] * 长期推理需求和训练后需求可能显著超过当前预测 [42][96]
全球语境下的中国人工智能 —— 我们月度产品首发-China AI in a Global Context – Inauguration of Our Monthly Product
2025-11-13 10:48