Workflow
基于XGBoost模型的AI行业配置系统
中银国际·2025-05-28 13:20

报告核心观点 - 基于 XGBoost 模型构建 AI 行业配置系统,实现月度行业配置输出,该系统结合中银策略“周期 - 信号 - 动量”配置框架,数据驱动、结构清晰、逻辑可循,能支持策略判断与行业轮动决策 [3][5] 分组1:“周期 - 信号 - 动量”中观行业配置体系概述 研究背景 - A股市场风格切换频繁、热点轮动加快,传统行业配置策略难捕捉结构性机会,策略研究需向数据驱动转型,本报告旨在构建行业配置系统支持决策 [11] “周期 - 信号 - 动量”行业配置框架概述 - 该体系为周期定风格、信号找行业、动量辅助择时,通过资本开支与库存周期识别中短周期变化定风格,结合“次年 g - 复合 g”模型与信号体系找行业,引入市场动量指标辅助择时,形成自上而下行业配置体系,关注不同时长投资周期 [12][13] 分组2:“周期 - 信号 - 动量”行业配置体系信号系统 顺周期、价格主导行情的周期资源品 - 资源品业绩与经济周期相关,行情与大宗商品价格高度相关,产出缺口上行时业绩优,商品价格对行情指示性更强 [17] 逆周期表现占优的建筑地产与公用事业 - 地产具逆周期特征,行情与地产周期高度相关,受政策调节影响大;公用事业有防御属性,市场偏好弱势时表现坚挺 [18] 防御性强、价格驱动效应明显的必选消费 - 必选消费防御性强,需求平稳,衰退后期有超额收益,价格是驱动行情重要因素,行情与 CPI 相关性高 [21] 收入及消费预期驱动的可选消费 - 可选消费行情受居民收入及消费预期驱动,与社零同比高度相关,经济向好时消费者支出增加带动行业业绩改善 [24] 产业周期驱动、流动性助推的科技和高端制造(软科技、硬科技) - 科技和高端制造行业受产业周期驱动,如 3G、4G、5G 周期及“能源革命”推动行情,充裕流动性也会助推行情 [27][28] 金融周期驱动的金融类行业 - 金融行业行情受金融周期驱动,银行投资关注“量价 - 质量”因素,保险投资关注负债端与资产端因素 [32] 分组3:AI 行业配置模型构建与实证方法 XGBoost 模型简介 - XGBoost 是基于梯度提升框架的增强型决策树方法,拟合能力高效、非线性建模能力强、泛化表现好,在结构化数据建模中广泛应用 [37] 基于 XGBoost 的 AI 行业配置系统构建流程 - 包括数据样本及因子选择、因子体系构建、XGBoost 模型构建、行业预测与筛选、模型因子 Shap 分析、输出配置分析六个核心步骤 [41] 数据样本及因子选择 - 选取 2006 年 1 月至 2025 年 3 月月度数据为样本区间,纳入 15 个核心因子,采用滚动训练 + 逐月预测方式回测与模拟预测 [44][45] 模型构建与参数选取 - 以次月月度收益率为因变量,与 30 个行业的 15 个因子构建面板数据,以 8 年数据为训练集滚动训练,选取决策树数量、树的最大深度等参数 [53] 分组4:AI 行业配置模型回测表现与配置建议 AI 行业配置模型回测表现 - 2014 年 1 月 - 2025 年 3 月,AI 行业配置模型筛选 Top3 行业累积收益率为 122.31%,高于同期等权重行业指数的 80.26%,Top3 组合夏普比率、最大回撤均优于等权重指数及传统宽基指数 [54][57] 模型因子 Shap 分析 - 对模型输出进行 Shap 分析,发现不同时期高贡献模型因子不同,市场风格也随之切换,价值与成长风格受不同因子催化 [61] 5 月行情配置分析 - 5 月 AI 行业配置模型输出 TOP10 行业主要分布在消费、红利等风格,截至 5 月 22 日,TOP3、TOP5、TOP10 行业平均收益率均高于全行业平均收益 [65]