GPU神话松动,AI真正的战场变了
虎嗅APP·2026-04-30 21:35

AI产业竞争格局的演变 - AI产业的主战场正从训练竞赛转向部署竞赛,价值重心从峰值算力转向系统效率 [2] - 真正决定AI商业化速度的,是整套系统能否以可控成本、稳定吞吐和高利用率运行模型 [2] - 竞争从“单卡性能”转向“端到端效率”,CPU成为AI基础设施中被长期低估的关键系统变量 [2][5] 市场重新关注英特尔的原因 - 英特尔2026年第一季度营收约136亿美元,同比增长7%,连续第六个季度超预期;净利润同比增长156% [4] - 数据中心与AI相关业务(DCAI)收入约51亿美元,同比增长22%,成为增长最快的板块 [4] - 市场关注点变化的核心在于AI基础设施需求结构改变,不再只是“多买GPU” [4] - 数据中心中CPU与GPU的部署比例正从传统的1:8收紧到1:4,在智能体场景中可能进一步向1:1靠近 [4] AI从训练到推理的价值转移 - AI的核心矛盾从训练能力不足转向如何推理、部署、扩展和控制成本 [4] - 训练是阶段性的资本开支,而推理、部署和调用是持续性的运营开支 [7] - Deloitte估算,推理工作负载占AI总算力的比例在2023年约1/3,2025年接近1/2,2026年预计达2/3 [8] - IDC预测,到2027年中国推理算力占整体算力比例将突破70% [8] - 到2026年推理带来的市场规模预计是训练硬件市场的2到3倍 [8] - 大模型推理成本中,算力占95%,人力占3%,数据占2% [8] - ChatGPT的推理开销每天约70万美元,DeepSeek V3每天约8.7万美元 [8] - 中国日均Token调用量从2024年初约1000亿,跃升至2026年3月的140万亿,两年增长超千倍 [9] CPU重要性提升的系统性原因 - 大量AI系统面临的核心问题是“系统喂不饱GPU”,而非GPU性能不足 [9] - MLPerf测试显示,数据加载、预处理、参数同步等环节的延迟可占总训练时间的35%到60% [9] - 头部互联网企业的AI推理集群GPU平均利用率长期低于40%,大量中小企业的GPU集群利用率甚至不足15% [9] - 数据流动、任务调度、内存管理、I/O协同、网络处理等系统环节的瓶颈导致昂贵的AI资源被大规模浪费 [10] - CPU直接决定AI系统的资源利用率和ROI,因为它承担了数据准备、结果处理、任务调度、缓存维护、网络通信等控制流和系统协同工作 [10] 智能体(Agent)兴起对CPU的放大效应 - 智能体是一套需要执行任务的系统,涉及理解目标、拆解步骤、调用工具、访问数据库、连接API、执行代码、维护状态等 [12] - 大量工作属于控制流和系统协同(如调度、编排、切换、访问、管理),这正是CPU擅长的领域 [12] - 康奈尔大学研究显示,在五类代表性Agent工作负载中,CPU端的工具处理、逻辑调度和数据预处理,占总端到端延迟的比例高达43.8%到90.6% [12] - 在典型的RAG场景中,CPU处理可能占总延迟的90%以上,GPU推理反而不到10% [12] CPU与GPU配比变化及产业动态 - 当前AI数据中心中CPU与GPU的配比大约是1:4到1:8,而在智能体AI时代,这一比例预计将逐步演变为1:1到1:2 [13] - 2026年第一季度末,Intel和AMD对部分CPU产品线提价,服务器CPU交期拉长至约6个月 [13] - 英伟达和Arm也在同一时期宣布进军服务器CPU市场 [13] - 竞争从“单芯片”变成“系统工程”,所有头部玩家都在补CPU、补系统、补整机能力 [14] - AMD EPYC服务器CPU在2025年Q4营收份额已达到41.3%,首次突破40% [14] - 英特尔、AMD、Arm、云厂商自研CPU及英伟达的Grace CPU,均在强化系统层能力 [14][15] 中国市场的特殊意义与挑战 - 中国是全球AI应用落地最快的市场之一,截至2026年3月,我国日均Token调用量已突破140万亿 [15] - 2025年中国AI加速卡总出货约400万张,其中国产厂商出货165万张,占比41% [15] - 中国AI进入“调用热”和“部署热”,企业面临AI能否长期运行及成本可控的现实问题 [15] 1. 成本压力:某制造企业将智能体接入生产线时发现,每个决策步骤的推理成本高达0.3美元,是传统规则系统的20倍 [16] 2. 兼容压力:中国企业IT系统复杂,AI需与存量系统(数据库、ERP、CRM等)深度融合,CPU承担兼容、调度和运行时支撑角色 [17] 3. 自主可控:随着AI部署深化,国产CPU、服务器、操作系统、数据库、中间件和调度软件的重要性提升 [18]

GPU神话松动,AI真正的战场变了 - Reportify