报告行业投资评级 - 看好 [2] 报告的核心观点 - 报告核心围绕两大主题展开:一是AI时代下Arm架构在PC端的持续渗透及其背后的驱动力,二是大型语言模型(LLM)厂商进入商业闭环验证阶段,盈利能力得到初步验证 [3][31] - 报告认为,随着AI应用(特别是Coding和Agent)的快速发展,LLM模型商的收入进入数百亿美元年度经常性收入(ARR)级别,并有望提前实现盈利 [3][32][38] - 报告指出,在Agent范式下,CPU在AI系统中的重要性显著提升,投资占比增加,同时CPU市场面临供给约束,为国产CPU提供了验证机会 [15][26][28] 根据相关目录分别进行总结 1. ARM是否具备持续性 1.1 ARM在AI时代持续渗透 - 英伟达与微软联合推出基于Arm架构的RTX Spark Windows PC,标志着Arm架构正从轻薄长续航场景向高性能Windows PC、创作生产力和本地复杂计算场景延伸 [4] - RTX Spark平台整合了Blackwell RTX GPU、Grace CPU、统一内存和英伟达图形/计算软件栈,最高支持1 PFLOP AI性能和128GB统一内存,产品覆盖轻薄笔记本和小型台式机 [4][5][9] - 微软针对RTX Spark优化了Windows调度、功耗管理、统一内存和Prism模拟层,英伟达将CUDA、RTX等能力带入Windows on Arm,生态适配改善,有助于缓解过去软件兼容和性能波动的痛点,提升Arm PC生态竞争力 [3][10] - 随着PC从传统办公终端升级为本地生产力和智能交互入口,高能效、多核、强集成的Arm架构CPU价值提升,成为AI时代PC升级的重要受益方向 [3][11] 1.2 Agent时代,CPU投资占比大幅提升 - AI需求对CPU的拉动已从“GPU服务器数量增长带来的线性配套”,升级为“应用复杂化对CPU平台能力提出更高要求” [15] - 在Agent范式下,CPU与GPU的配比可能从此前的1:4提升至1:1 [18] - CPU在AI推理和Agent工作负载中的角色发生根本性变化:在推理规模化阶段,CPU负责请求调度、上下文管理、RAG流程编排等;在智能体(Agent)范式中,CPU成为工作流的调度中枢与状态管理器;ASIC生态成熟进一步凸显了CPU作为“系统兜底”的通用平台价值 [18][19] - 实际部署验证了CPU需求上升,例如在英伟达Rubin NVL72机柜中,CPU与GPU的配比已提升至约1:2 [25] 1.3 供给弹性有限,国产CPU迎来验证机会 - 高端CPU市场面临价格上涨和交付周期延长,主要受先进制程产能、封装工艺限制以及AI计算需求增长影响 [13][14] - CPU供给弹性有限,为国产CPU和AI芯片在数据中心和AI系统中进行系统级验证提供了窗口期 [26][28] - 通过超节点、多卡集群部署等系统级验证,国产CPU能够测试在高负载场景下的性能和稳定性,为未来大规模应用奠定基础 [26][29] 2. LLM模型商进入商业闭环验证阶段 - Anthropic已向美国SEC秘密提交拟IPO的S-1注册草案,若后续顺利推进,将成为AI产业商业化进展的重要观察窗口 [31] - 2026年初以来,在coding和agent应用快速发展的趋势下,以OpenAI和Anthropic为代表的模型商ARR飞速提升,进入数百亿美元级别 [3][32] - Anthropic的快速增长主要源于代码需求(Claude Code)以及以企业客户为主的高价值策略:2025年Claude年花费超10万美元的客户数量增长7倍,年合作超100万美元的客户超500位;26年初以来企业对Claude Code的订阅量增加4倍,企业使用占Claude Code收入的一半以上 [34] - OpenAI与Anthropic的经营策略呈现差异:OpenAI的月活用户(MAU)为9亿,单用户平均收入(ARPU)为2.2美元,策略过去更偏向C端流量入口;Anthropic的MAU为1.34亿,ARPU为16.2美元(约为OpenAI的7.4倍),主要服务企业客户。目前OpenAI的企业客户收入占比也在提升,两者策略未来可能趋同 [35][37] - 根据华尔街日报报道,Anthropic 2026年第二季度收入预计为109亿美元,有望迎来首季度盈利。报告预测Anthropic很可能在2026年实现全年现金流打平,早于原先2027年的预期 [3][38] - 报告对Anthropic进行了盈利预测,预计其2026年收入为545亿美元,营业利润为22亿美元,营业利润率为4.1% [40] 3. 其他行业动态:智谱发布GLM-5.1高速版 - 2026年5月22日,智谱发布GLM-5.1高速版(GLM-5.1 High-Speed)API,输出速度达到400 tokens/s,显著高于其普通版(40-60 tokens/s)以及GPT-5(约102 tokens/s)、Gemini 3.0(约148 tokens/s) [42] - 该版本的意义在于,国内大模型竞争逻辑正从预训练能力竞争转向推理系统效率竞争。“首Token时间(TTFT)+输出速度”成为与模型智力同等重要的指标 [45][46] - 高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景 [46] 4. 重点推荐主线 - 报告列出了九大重点推荐投资主线,包括:1) 数字经济领军;2) AIGC应用;3) AIGC算力;4) 数据要素;5) 信创弹性;6) 港股核心;7) 智联汽车;8) 新型工业化;9) 医疗信息化 [3][48]
计算机行业周报:ARM持续性如何?当前如何看大模型?-20260607