核心观点 报告提出,随着生成式AI进入推理时代,Token(词元)正从技术参数演变为AI时代的核心经济单位,驱动产业链围绕其生成、流转、增值和消费进行系统性重构。英伟达提出的“五层蛋糕”理论(能源、芯片、基础设施、模型、应用)构成了Token经济时代的产业价值体系。报告认为,AI产业竞争已从“模型竞争”进入“Token经济竞争”阶段,并基于此框架,详细分析了从底层算力生产到上层应用消费的全产业链投资机会[10][31][33]。 第一部分:Token经济时代的产业价值体系 - Token正从模型训练的技术参数,演变为AI时代核心经济单位,是AI服务计费、算力消耗、Agent运行及数据价值流转的核心载体[10] - AI推理需求进入结构性扩张阶段,推理模型Token消耗占比已超过50%,且单次请求的复杂度(平均Sequence Length)从不足2,000 tokens提升至超过5,000 tokens,驱动Token需求从用户增长驱动转向推理复杂度驱动[12][16] - 中国AI推理需求加速落地,日均词元调用量从2024年初的1000亿增长至2026年3月的超过140万亿,增长超过1000倍;字节跳动平台日均Token调用量在两年内也从千亿级提升至百万亿级,增长超过1000倍[23][27] - 英伟达提出的“五层蛋糕”理论构成了Token经济产业架构:1)能源层决定Token生产上限;2)芯片层决定Token生成效率;3)基础设施层负责Token传输与调度;4)模型层决定Token智能密度;5)应用层决定Token消耗规模[31][33] 第二部分:生产Token——能源与芯片构筑生产力底座 2.1 算电协同 - 算电协同通过“比特”与“瓦特”的高效匹配,实现算力与电力的双向优化配置,于2026年首次被写入中国政府工作报告,上升为国家顶层战略[40][42] - 全球算力规模预计未来五年以超过60%的速度增长,至2030年将超过50 ZFlops;中国智能算力规模在2023-2028年的年复合增长率预计达46.2%[45] - AI数据中心电力需求激增,单机柜功率密度可达20-100KW,全球数据中心关键IT电力需求将从2023年的49GW激增至2026年的96GW,其中90%增长来自AI需求[48] - 中国算力中心总用电量2025年达1700亿千瓦时,占全社会用电量1.6%,预计到2030年将达8000亿千瓦时,占比提升至6%左右[48] 2.2 xPU:CPU价值回归与国产GPU突破 - AI推理与Agent爆发带动CPU价值回归,CPU承担系统调度、数据搬运等负载提升,CPU与GPU的配置比例正从训练时代的1:8向1:4甚至1:1演进[60][62] - 国产开源大模型DeepSeek V4的Engram记忆模块等技术特性,以及英伟达GB200 NVL576超节点1:2的CPU/GPU配比,共同催化国产CPU需求提升与价值重估[67] - 国产GPU厂商持续突破:海光信息DCU系列已落地20多个行业;摩尔线程MTT S5000单卡AI算力最高达1,000 TFLOPS;沐曦股份曦云C600系列GPU累计销量超5.5万颗;壁仞科技BR10X系列已实现千卡级集群部署[71][74][78] - 2026年5月,包括海思昇腾、平头哥真武、壁仞壁砺等9款国产AI训练推理芯片通过国家安全可靠测评并获得I级认证,国家层面指导国产大模型加大力度适配国产算力芯片[84][85] 2.3 超节点:国产算力多维联合优化 - 超节点是为解决大模型训练中通信墙、功耗散热墙、存储墙和复杂度墙而生的系统形态,其核心特征是大带宽、低时延、资源池化与高可靠稳定性[104][105] - 技术演进正从“光进铜退”,光互联技术从可插拔光模块,向近封装光学(NPO)、共封装光学(CPO)和封装内光I/O(OIO)演进,以降低功耗、提升带宽[131][137] - 超节点规模可分为三级:超大规模(如华为Atlas SuperPoD A5,8192卡)、大规模(如阿里云磐久、中科曙光ScaleX640)和中型(如英伟达NVL72,72卡)[156] - 国内厂商积极布局:华为Atlas 950 SuperPoD基于自研“灵衢”协议实现8192卡全互联;中科曙光发布单机柜640卡超节点scaleX640;英伟达NVL72通过第五代NVSwitch实现72个B200 GPU全互联[161][163][169] 第三部分:流转Token——基础设施打造高速网络 (注:根据提供的目录和内容,报告第三部分“流转Token”应包含光互联、卫星互联、液冷&电源、云计算&IDC等主题,但所给文档片段未包含这些章节的详细正文内容,故此处基于目录结构列出主题,具体要点待补充。) - 光互联:AI下游高景气,拉动测试需求高增[37] - 卫星互联:下一代互联底座,乘星座组网提速东风[37] - 液冷&电源:算力高密化,带动热管理/供电升级[37] - 云计算&IDC:国内外厂商加速投入,算力资源进入涨价周期[37] 第四部分:增值Token——模型进化提升智能密度 (注:根据提供的目录和内容,报告第四部分“增值Token”应包含大模型迭代、AI Agent能力、企业级平台、空间智能等主题,但所给文档片段未包含这些章节的详细正文内容,故此处基于目录结构列出主题,具体要点待补充。) - 大模型:国内外大模型持续迭代[39] - 大模型:AI Agent开始具备长期运行与自主执行能力[39] - 大模型:企业级AI平台加速落地[39] - 空间智能:从语言智能走向空间智能[39] - 量子科技:颠覆式技术创新,计算/通信/测量迎机遇[37][39] 第五部分:消费Token——Agent驱动应用生态繁荣 (注:根据提供的目录,报告第五部分“消费Token”应包含AI应用、经营管理软件、生产研发软件、智能驾驶、AI4S等主题,但所给文档片段未包含这些章节的详细正文内容,故此处基于目录结构列出主题。) - AI应用:模型重塑格局,专业数据和经验构筑壁垒[38] - 经营管理软件:收费模式向Token计费转型[38] - 生产研发软件:AI助力提质增效[38] - 智能驾驶:端到端架构演进,L2+/L4逐步落地[38] - AI4S:AI助力,加速药物研发过程[38]
计算机行业2026年中期投资策略:迈向token经济新时代