计算机行业周报20260601-20260605:ARM持续性如何?当前如何看大模型?-20260607
申万宏源证券·2026-06-07 15:03

行业投资评级 - 看好 计算机行业 [2] 报告核心观点 - ARM架构在AI时代的PC端渗透具备持续性,生态适配改善和高能效CPU价值提升是核心驱动力 [3][11] - AI工作负载,特别是智能体(Agent)范式,根本性加重了CPU的职责,使其在算力投资中的占比大幅提升 [15][19][21] - 大型语言模型(LLM)厂商正进入商业闭环验证阶段,以Anthropic为代表的公司收入增速显著,并有望提前实现盈利 [3][31][38] - 国内大模型竞争逻辑正从预训练能力竞争转向推理系统效率竞争,智谱发布的GLM-5.1高速版是重要标志 [45] 根据目录总结 1. ARM是否具备持续性? 1.1 ARM在AI时代持续渗透 - 英伟达与微软联合推出RTX Spark Windows PC,标志着Arm架构开始进入高性能Windows PC、创作生产和本地复杂计算场景 [4] - RTX Spark平台整合了Blackwell RTX GPU(最高6144个CUDA核心)、20核NVIDIA Grace CPU和128GB统一内存,最高支持1 PFLOPs AI性能 [5] - 产品形态覆盖轻薄笔记本(约14毫米厚,约3磅重)和小型台式机,表明Arm PC正从“低功耗轻办公”升级为“高能效、高性能本地计算平台” [9] - 微软针对该平台优化了Windows调度、功耗管理及Prism模拟层,英伟达将CUDA、RTX等软件栈带入,生态确定性增强,有助于缓解过去软件兼容和性能波动的痛点 [10] - CPU市场因需求旺盛、产能受限而面临价格上涨和交付周期延长,这进一步凸显了高能效Arm架构的价值 [13][14] 1.2 Agent时代,CPU投资占比大幅提升 - AI需求对CPU的拉动已从为GPU配套,升级为应用复杂化对CPU平台能力提出更高要求 [15] - 在智能体(Agent)工作负载下,CPU与GPU的配比可能从此前的1:4提升至1:1 [18] - CPU在推理阶段负责请求调度、上下文管理、RAG流程编排;在Agent范式中更成为任务规划、工具调度、状态管理的核心中枢 [18][19] - 外部工具处理(如代码执行、API调用)成为CPU负载的核心来源,其并行性和调度效率决定了系统性能上限 [21] - 实际部署验证了CPU需求上升,例如英伟达Rubin NVL72机柜中CPU与GPU配比已提升至约1:2 [25] 1.3 供给弹性有限,国产CPU迎来验证机会 - 高端CPU供给受限,为国产CPU和AI芯片在数据中心和AI系统中进行系统级验证提供了窗口期 [26] - 通过超节点、多卡集群部署,国产CPU可以在高负载复杂场景下验证其性能、稳定性及在集群调度、节点通信方面的能力 [26][29] 2. LLM模型商进入商业闭环验证阶段 - Anthropic已向SEC秘密提交IPO申请,若推进顺利将成为观察AI产业商业化进展的重要窗口 [31] - 2026年初以来,在编程(coding)和智能体(agent)应用驱动下,以OpenAI和Anthropic为代表的模型商年度经常性收入(ARR)飞速提升,进入数百亿美元级别 [3][32] - Anthropic的快速增长主要源于:1) Claude Code带来新编程时代,全球4%的GitHub公开提交由其创作;2) 客户以高价值、高粘性的企业客户为主,企业收入占比高达80% [34] - 2025年,Claude年花费超10万美元的客户数量增长7倍,年合作超100万美元的客户超500位 [34] - 2026年第一季度,OpenAI总收入为57亿美元,Anthropic为48亿美元,但单计LLM收入,Anthropic市占率更高 [35] - Anthropic的月活用户(MAU)为1.34亿,平均每用户收入(ARPU)达16.2美元,是OpenAI(ARPU为2.2美元)的7.4倍,反映其更聚焦高价值企业客户的策略 [37] - 据《华尔街日报》报道,Anthropic 2026年第二季度收入预计达109亿美元,有望迎来首次季度盈利,并很可能在2026年实现全年现金流打平,早于原先2027年的预期 [3][38] - 报告粗略预测Anthropic 2026年收入为545亿美元,营业利润率为4.1%,并预计其毛利率可能因Agent工作负载的高效率而提升至50-60% [40][41] - 智谱发布GLM-5.1高速版API,输出速度达到400 tokens/s,显著高于其普通版(40-60 tokens/s)及GPT-5(约102 tokens/s) [42] - 该版本的意义在于标志着国内大模型竞争从预训练能力转向推理系统效率竞争,通过推理引擎和底层基础设施优化实现突破,适用于AI编程、实时交互等对延迟敏感的场景 [45][46] 3. 重点推荐主线 - 报告列出了九大重点投资主线及相关标的公司,包括:数字经济领军、AIGC应用、AIGC算力、数据要素、信创弹性、港股核心、智联汽车、新型工业化、医疗信息化 [48]

计算机行业周报20260601-20260605:ARM持续性如何?当前如何看大模型?-20260607 - Reportify