量化模型与构建方式 1. DFQ工业类行业轮动模型 - 模型构建思路:基于38个证监会二级行业构建行业因子,转化为中信一级行业后进行行业轮动[16][19] - 模型具体构建过程: - 使用中观行业数据、分析师预期、业绩超预期、资金流向四个维度的14个单因子合成行业因子[16][17] - 将证监会二级行业因子得分转化为中信一级行业因子得分,采用市值加权方式[19] - 因子值进行截面标准化,缺失值用0填充[19] - 模型评价:转化为中信一级行业后损失较多信息,近年来策略有效性降低[20] 2. DFQ行业动量轮动模型 - 模型构建思路:基于行业动量的改进算法,构建月频行业轮动策略[25] - 模型具体构建过程: - 提出三种行业动量的改进算法,将三个单因子合成行业因子[25] - 使用过去12个月的行业动量、行业换手率等特征[24] - 模型评价:动量类策略整体表现不如基本面策略,近年来策略有效性降低[26] 3. DFQ遗传规划行业因子挖掘系统 - 模型构建思路:通过遗传规划算法挖掘行业因子,优化进化效率,生成高质量因子[51][52] - 模型具体构建过程: - 使用gplearn库的SymbolicTransformer模块,加入145个特征和140个算子[74][76] - 采用滚动挖掘方式,每隔一年重新挖掘,训练集长度固定为10年[69][72] - 适应度指标为20个路径下多头(top5)行业组合的月均超额收益的最小值,阈值为0.5%[78][80] - 通过7点改进提升进化效率,包括提升初始种群质量、动态调整进化参数、降低因子相关性等[52][54][61] - 模型评价:挖掘出的单因子数量多且相关性低,但样本外易失效,需通过加权提升表现[194] 4. DFQ机器学习行业轮动模型 - 模型构建思路:将vae、xgb、gp三个行业因子等权合成,构建行业轮动模型[165] - 模型具体构建过程: - vae和xgb因子通过选股因子加权得到,gp因子通过遗传规划挖掘得到[163][164] - 合成因子前对单因子进行Boxplot去异常值、zscore标准化、以0填充缺失值[124] - 等权合成后进行回测[165] - 模型评价:模型表现突出,能实现1+1>2的效果[165] --- 模型的回测效果 1. DFQ工业类行业轮动模型 - 年化超额收益:2020-2024年为3.33%[20] - 超额收益最大回撤:19.39%[20] 2. DFQ行业动量轮动模型 - 年化超额收益:2020-2024年为3.68%[26] - 超额收益最大回撤:24.78%[26] 3. DFQ遗传规划行业因子挖掘系统 - 年化超额收益:2020-2024年为11.10%(动态xgb加权)[128] - 超额收益最大回撤:10.28%[128] - 月度胜率:61.40%[128] - 超额收益夏普比:1.16[128] 4. DFQ机器学习行业轮动模型 - 年化超额收益:2020-2024年为18.42%[165] - 超额收益最大回撤:7.76%[165] - 月度胜率:66.67%[165] - 超额收益夏普比:1.77[165] --- 量化因子与构建方式 1. vae因子 - 因子构建思路:通过选股因子加权得到行业因子[43] - 因子具体构建过程: - 选股因子匹配到中证全指股票池,进行Boxplot去异常值、zscore标准化[43] - 按个股市值加权得到行业因子[43] - 因子评价:多头端top5行业组合表现较好[43] 2. xgb因子 - 因子构建思路:通过选股因子加权得到行业因子[43] - 因子具体构建过程: - 同vae因子[43] - 因子评价:多头端top5行业组合表现较好[43] 3. gp因子 - 因子构建思路:通过遗传规划算法挖掘行业因子[51] - 因子具体构建过程: - 使用滚动挖掘方式,每隔一年重新挖掘[69] - 适应度指标为多头月均超额收益的最小值[78] - 因子评价:相关性低,适合与其他因子结合使用[164] --- 因子的回测效果 1. vae因子 - 年化超额收益:10.01%[166] - 超额收益最大回撤:10.09%[166] - 月度胜率:57.89%[166] - 超额收益夏普比:1.03[166] 2. xgb因子 - 年化超额收益:10.82%[166] - 超额收益最大回撤:10.61%[166] - 月度胜率:59.65%[166] - 超额收益夏普比:1.02[166] 3. gp因子 - 年化超额收益:11.10%[166] - 超额收益最大回撤:10.28%[166] - 月度胜率:61.40%[166] - 超额收益夏普比:1.16[166]
量化策略系列之八:DFQ机器学习行业轮动模型
东方证券·2024-11-19 09:23