计算机行业周报：ARM持续性如何？当前如何看大模型？-20260607

报告行业投资评级 - 看好 [2] 报告的核心观点 - 报告核心围绕两大主题展开：一是AI时代下Arm架构在PC端的持续渗透及其背后的驱动力，二是大型语言模型（LLM）厂商进入商业闭环验证阶段，盈利能力得到初步验证 [3][31] - 报告认为，随着AI应用（特别是Coding和Agent）的快速发展，LLM模型商的收入进入数百亿美元年度经常性收入（ARR）级别，并有望提前实现盈利 [3][32][38] - 报告指出，在Agent范式下，CPU在AI系统中的重要性显著提升，投资占比增加，同时CPU市场面临供给约束，为国产CPU提供了验证机会 [15][26][28] 根据相关目录分别进行总结 1. ARM是否具备持续性 1.1 ARM在AI时代持续渗透 - 英伟达与微软联合推出基于Arm架构的RTX Spark Windows PC，标志着Arm架构正从轻薄长续航场景向高性能Windows PC、创作生产力和本地复杂计算场景延伸 [4] - RTX Spark平台整合了Blackwell RTX GPU、Grace CPU、统一内存和英伟达图形/计算软件栈，最高支持1 PFLOP AI性能和128GB统一内存，产品覆盖轻薄笔记本和小型台式机 [4][5][9] - 微软针对RTX Spark优化了Windows调度、功耗管理、统一内存和Prism模拟层，英伟达将CUDA、RTX等能力带入Windows on Arm，生态适配改善，有助于缓解过去软件兼容和性能波动的痛点，提升Arm PC生态竞争力 [3][10] - 随着PC从传统办公终端升级为本地生产力和智能交互入口，高能效、多核、强集成的Arm架构CPU价值提升，成为AI时代PC升级的重要受益方向 [3][11] 1.2 Agent时代，CPU投资占比大幅提升 - AI需求对CPU的拉动已从“GPU服务器数量增长带来的线性配套”，升级为“应用复杂化对CPU平台能力提出更高要求” [15] - 在Agent范式下，CPU与GPU的配比可能从此前的1:4提升至1:1 [18] - CPU在AI推理和Agent工作负载中的角色发生根本性变化：在推理规模化阶段，CPU负责请求调度、上下文管理、RAG流程编排等；在智能体（Agent）范式中，CPU成为工作流的调度中枢与状态管理器；ASIC生态成熟进一步凸显了CPU作为“系统兜底”的通用平台价值 [18][19] - 实际部署验证了CPU需求上升，例如在英伟达Rubin NVL72机柜中，CPU与GPU的配比已提升至约1:2 [25] 1.3 供给弹性有限，国产CPU迎来验证机会 - 高端CPU市场面临价格上涨和交付周期延长，主要受先进制程产能、封装工艺限制以及AI计算需求增长影响 [13][14] - CPU供给弹性有限，为国产CPU和AI芯片在数据中心和AI系统中进行系统级验证提供了窗口期 [26][28] - 通过超节点、多卡集群部署等系统级验证，国产CPU能够测试在高负载场景下的性能和稳定性，为未来大规模应用奠定基础 [26][29] 2. LLM模型商进入商业闭环验证阶段 - Anthropic已向美国SEC秘密提交拟IPO的S-1注册草案，若后续顺利推进，将成为AI产业商业化进展的重要观察窗口 [31] - 2026年初以来，在coding和agent应用快速发展的趋势下，以OpenAI和Anthropic为代表的模型商ARR飞速提升，进入数百亿美元级别 [3][32] - Anthropic的快速增长主要源于代码需求（Claude Code）以及以企业客户为主的高价值策略：2025年Claude年花费超10万美元的客户数量增长7倍，年合作超100万美元的客户超500位；26年初以来企业对Claude Code的订阅量增加4倍，企业使用占Claude Code收入的一半以上 [34] - OpenAI与Anthropic的经营策略呈现差异：OpenAI的月活用户（MAU）为9亿，单用户平均收入（ARPU）为2.2美元，策略过去更偏向C端流量入口；Anthropic的MAU为1.34亿，ARPU为16.2美元（约为OpenAI的7.4倍），主要服务企业客户。目前OpenAI的企业客户收入占比也在提升，两者策略未来可能趋同 [35][37] - 根据华尔街日报报道，Anthropic 2026年第二季度收入预计为109亿美元，有望迎来首季度盈利。报告预测Anthropic很可能在2026年实现全年现金流打平，早于原先2027年的预期 [3][38] - 报告对Anthropic进行了盈利预测，预计其2026年收入为545亿美元，营业利润为22亿美元，营业利润率为4.1% [40] 3. 其他行业动态：智谱发布GLM-5.1高速版 - 2026年5月22日，智谱发布GLM-5.1高速版（GLM-5.1 High-Speed）API，输出速度达到400 tokens/s，显著高于其普通版（40-60 tokens/s）以及GPT-5（约102 tokens/s）、Gemini 3.0（约148 tokens/s） [42] - 该版本的意义在于，国内大模型竞争逻辑正从预训练能力竞争转向推理系统效率竞争。“首Token时间（TTFT）+输出速度”成为与模型智力同等重要的指标 [45][46] - 高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景 [46] 4. 重点推荐主线 - 报告列出了九大重点推荐投资主线，包括：1) 数字经济领军；2) AIGC应用；3) AIGC算力；4) 数据要素；5) 信创弹性；6) 港股核心；7) 智联汽车；8) 新型工业化；9) 医疗信息化 [3][48]