软科技

搜索文档
策略深度报告:基于XGBoost模型的AI行业配置系统
中银国际· 2025-05-28 14:18
报告的核心观点 - 近年来A股市场风格切换频繁、主线热点轮动加快,传统行业配置策略难以捕捉结构性机会,需构建新的行业配置系统 [2] - 基于XGBoost模型,结合“周期 - 信号 - 动量”配置框架,构建数据驱动、结构清晰、逻辑可循的行业配置系统,支持策略判断与行业轮动决策 [2] - AI行业配置模型回测表现良好,筛选Top3行业累积收益率高于同期等权重行业指数,夏普比率、最大回撤等指标也更优 [3] 各部分内容总结 “周期 - 信号 - 动量”中观行业配置体系概述 - 研究背景:A股市场风格切换频繁,传统策略难以捕捉机会,策略研究需从经验驱动向数据驱动转型,构建可解释、可落地的行业配置系统 [16] - “周期 - 信号 - 动量”行业配置框架:周期定风格,关注资本开支周期与库存周期确定优势风格;信号找行业,结合“次年g - 复合g”景气衔接体系与行业特有信号体系判断投资机会;动量辅助择时,结合市场动量因素判断投资时机 [17][18] “周期 - 信号 - 动量”行业配置体系信号系统 - 周期资源品:业绩与经济周期密切相关,行情与大宗商品价格高度相关,是典型的顺周期行业 [29] - 建筑地产与公用事业:地产具有逆周期特征,行情与地产周期高度相关;公用事业有较强防御属性,在市场偏好弱势时表现坚挺 [32] - 必选消费:防御性强,价格驱动效应明显,行情与CPI具有较高相关性 [36] - 可选消费:行情受居民收入及消费预期驱动,与社零同比高度相关 [41] - 科技和高端制造:具有显著的产业周期驱动特征,充裕的流动性会助推行情,如3G、4G、5G周期及“能源革命”推动相关板块行情 [43] - 金融类行业:行情受金融周期驱动,银行投资关注“量价 - 质量”因素,保险投资关注负债端保费收入与资产端10年期国债收益率变动 [48] AI行业配置模型构建与实证方法 - XGBoost模型简介:是基于梯度提升框架的增强型决策树方法,具有高效拟合、非线性建模和良好泛化能力,能建立“经济环境 - 市场情绪 - 行业表现”量化映射关系 [57][58] - 基于XGBoost的AI行业配置系统构建流程:包括数据样本及因子选择、因子体系构建、XGBoost模型构建、行业预测与筛选、模型因子Shap分析、输出配置分析六个核心步骤 [63] - 数据样本及因子选择:选取2006年1月至2025年3月的月度数据,纳入15个核心因子,采用8年滚动训练 + 逐月预测方式回测与模拟预测 [67][68] - 模型构建与参数选取:以次月月度收益率为因变量,与30个行业的15个因子构建面板数据,选取特定参数进行建模 [80] AI行业配置模型回测表现与配置建议 - AI行业配置模型回测表现:2014年1月 - 2025年3月,模型筛选Top3行业累积收益率为122.31%,高于同期等权重行业指数的80.26%;Top3组合夏普比率、最大回撤均优于等权重指数及传统宽基指数 [85][88] - 模型因子Shap分析:不同时期模型主要贡献因子不同,对应不同市场风格,如2014年“移动互联网”行情中ERP与10年期美债因子贡献度高,输出成长风格行业 [93][96] - 5月行情配置分析:5月AI行业配置模型输出TOP10行业主要分布在消费、红利等风格,截至5月22日,TOP3、TOP5、TOP10行业平均收益率均高于全行业平均收益 [98]
基于XGBoost模型的AI行业配置系统
中银国际· 2025-05-28 13:20
报告核心观点 - 基于 XGBoost 模型构建 AI 行业配置系统,实现月度行业配置输出,该系统结合中银策略“周期 - 信号 - 动量”配置框架,数据驱动、结构清晰、逻辑可循,能支持策略判断与行业轮动决策 [3][5] 分组1:“周期 - 信号 - 动量”中观行业配置体系概述 研究背景 - A股市场风格切换频繁、热点轮动加快,传统行业配置策略难捕捉结构性机会,策略研究需向数据驱动转型,本报告旨在构建行业配置系统支持决策 [11] “周期 - 信号 - 动量”行业配置框架概述 - 该体系为周期定风格、信号找行业、动量辅助择时,通过资本开支与库存周期识别中短周期变化定风格,结合“次年 g - 复合 g”模型与信号体系找行业,引入市场动量指标辅助择时,形成自上而下行业配置体系,关注不同时长投资周期 [12][13] 分组2:“周期 - 信号 - 动量”行业配置体系信号系统 顺周期、价格主导行情的周期资源品 - 资源品业绩与经济周期相关,行情与大宗商品价格高度相关,产出缺口上行时业绩优,商品价格对行情指示性更强 [17] 逆周期表现占优的建筑地产与公用事业 - 地产具逆周期特征,行情与地产周期高度相关,受政策调节影响大;公用事业有防御属性,市场偏好弱势时表现坚挺 [18] 防御性强、价格驱动效应明显的必选消费 - 必选消费防御性强,需求平稳,衰退后期有超额收益,价格是驱动行情重要因素,行情与 CPI 相关性高 [21] 收入及消费预期驱动的可选消费 - 可选消费行情受居民收入及消费预期驱动,与社零同比高度相关,经济向好时消费者支出增加带动行业业绩改善 [24] 产业周期驱动、流动性助推的科技和高端制造(软科技、硬科技) - 科技和高端制造行业受产业周期驱动,如 3G、4G、5G 周期及“能源革命”推动行情,充裕流动性也会助推行情 [27][28] 金融周期驱动的金融类行业 - 金融行业行情受金融周期驱动,银行投资关注“量价 - 质量”因素,保险投资关注负债端与资产端因素 [32] 分组3:AI 行业配置模型构建与实证方法 XGBoost 模型简介 - XGBoost 是基于梯度提升框架的增强型决策树方法,拟合能力高效、非线性建模能力强、泛化表现好,在结构化数据建模中广泛应用 [37] 基于 XGBoost 的 AI 行业配置系统构建流程 - 包括数据样本及因子选择、因子体系构建、XGBoost 模型构建、行业预测与筛选、模型因子 Shap 分析、输出配置分析六个核心步骤 [41] 数据样本及因子选择 - 选取 2006 年 1 月至 2025 年 3 月月度数据为样本区间,纳入 15 个核心因子,采用滚动训练 + 逐月预测方式回测与模拟预测 [44][45] 模型构建与参数选取 - 以次月月度收益率为因变量,与 30 个行业的 15 个因子构建面板数据,以 8 年数据为训练集滚动训练,选取决策树数量、树的最大深度等参数 [53] 分组4:AI 行业配置模型回测表现与配置建议 AI 行业配置模型回测表现 - 2014 年 1 月 - 2025 年 3 月,AI 行业配置模型筛选 Top3 行业累积收益率为 122.31%,高于同期等权重行业指数的 80.26%,Top3 组合夏普比率、最大回撤均优于等权重指数及传统宽基指数 [54][57] 模型因子 Shap 分析 - 对模型输出进行 Shap 分析,发现不同时期高贡献模型因子不同,市场风格也随之切换,价值与成长风格受不同因子催化 [61] 5 月行情配置分析 - 5 月 AI 行业配置模型输出 TOP10 行业主要分布在消费、红利等风格,截至 5 月 22 日,TOP3、TOP5、TOP10 行业平均收益率均高于全行业平均收益 [65]