Workflow
如何克服因子表现的截面差异
国泰海通证券·2025-08-19 14:14

量化模型与构建方式 1. 模型名称:市值分域的线性回归模型 - 模型构建思路:通过市值分组加权回归方法构建复合因子,适配不同市值选股域的表现差异[7] - 模型具体构建过程: 1. 将全市场股票按市值对数分为11组(KMedian聚类) 2. 采用分组加权回归,权重公式: wi=wbase+(1wbase)iI/nw_{i}=w_{b a s e}+(1-w_{b a s e})*|i-I|/n 其中: - (w_{base})为最小权数(取0.9、0.5、0三种情况) - (n=11)为分组数 - (I)为最大权重分组(从1到11循环测试) 3. 对5类子因子(分红、ROE_SUE、日度量价、高频量价、复合因子)分别采用OLS回归系数IR加权复合[7][10] 2. 模型名称:风格因子加权复合模型 - 模型构建思路:基于市值、估值、价值-成长指标、行业等多风格因子聚类加权,提升因子在不同风格域的适应性[98] - 模型具体构建过程: 1. 对5类风格因子(市值、市值三次方、估值、价值-成长指标、行业)进行曼哈顿距离聚类,分为11组 2. 价值-成长指标计算: - 价值指标:分析师一致预期市盈率+市净率+市销率+市现率+预期分红 - 成长指标:盈利增长+历史市值增长率+利润增长率+净现金流增长率+营收增长率 - 最终指标为两者相减[98] 3. 行业合并为TMT、上游、中游、消费、金融、综合六类,跨类时曼哈顿距离贡献为聚类数[98] 4. 采用与市值分域类似的交叉复合加权方法构建因子 --- 量化因子与构建方式 1. 因子名称:分红因子 - 因子构建思路:结合股息率与分红虚拟变量,反映基本面分红能力[10] - 因子具体构建过程:由股息率因子与是否有分红的虚拟变量线性回归复合[10] 2. 因子名称:ROE_SUE因子 - 因子构建思路:综合ROE和SUE指标,反映盈利质量与增长[10] - 因子具体构建过程:由ROE、SUE及对应的虚拟变量线性回归复合[10] 3. 因子名称:日度量价因子 - 因子构建思路:捕捉短期量价特征[10] - 因子具体构建过程:由换手率、反转、特质波动、非流动性四个因子复合[10] 4. 因子名称:高频量价因子 - 因子构建思路:利用高频数据捕捉微观结构信号[10] - 因子具体构建过程:由10个手工高频因子复合(具体因子未列明)[10] --- 模型的回测效果 1. 市值分域线性回归模型(全市场测试,2017.01-2025.07) - IC:0.057(等权)→0.058(base_w=0.5)[8][9] - Rank MAE:1.090(等权)→1.089(base_w=0.5)[8][9] - 多空收益:1.07%(等权)→1.08%(base_w=0.9)[11] - 多头收益:0.33%(等权)→0.31%(base_w=0)[11] 2. 风格因子加权模型(沪深300增强,严约束) - 年化超额收益:5.83%(等权)→7.36%(base_w=0交叉复合)[103] - IR:0.804(等权)→0.901(base_w=0交叉复合)[103] - 最大回撤:14.99%(等权)→16.33%(base_w=0交叉复合)[103] --- 因子的回测效果 1. 分红因子(全市场IC,2017.01-2025.07) - IC:0.006(等权)→0.007(base_w=0)[13][14] 2. ROE_SUE因子(全市场IC) - IC:0.020(等权)→0.021(base_w=0.5)[15][16] 3. 日度量价因子(全市场IC) - IC:0.042(等权)→0.044(base_w=0)[17][18] 4. 高频量价因子(全市场IC) - IC:0.035(等权)→0.037(base_w=0.5)[19][20] --- 关键结论 - 市值加权效果: - 沪深300增强中,极端大市值加权(base_w=0)提升年化超额1%以上[49][97] - 中证500增强中,base_w=0.5交叉复合效果最佳(年化超额15.06%)[92] - 风格因子加权局限性:对中证1000增强效果不显著,仅严约束组合年化提升1%[132][141]