复合因子

搜索文档
如何克服因子表现的截面差异
国泰海通证券· 2025-08-19 14:14
量化模型与构建方式 1. **模型名称**:市值分域的线性回归模型 - **模型构建思路**:通过市值分组加权回归方法构建复合因子,适配不同市值选股域的表现差异[7] - **模型具体构建过程**: 1. 将全市场股票按市值对数分为11组(KMedian聚类) 2. 采用分组加权回归,权重公式: $$w_{i}=w_{b a s e}+(1-w_{b a s e})*|i-I|/n$$ 其中: - \(w_{base}\)为最小权数(取0.9、0.5、0三种情况) - \(n=11\)为分组数 - \(I\)为最大权重分组(从1到11循环测试) 3. 对5类子因子(分红、ROE_SUE、日度量价、高频量价、复合因子)分别采用OLS回归系数IR加权复合[7][10] 2. **模型名称**:风格因子加权复合模型 - **模型构建思路**:基于市值、估值、价值-成长指标、行业等多风格因子聚类加权,提升因子在不同风格域的适应性[98] - **模型具体构建过程**: 1. 对5类风格因子(市值、市值三次方、估值、价值-成长指标、行业)进行曼哈顿距离聚类,分为11组 2. 价值-成长指标计算: - 价值指标:分析师一致预期市盈率+市净率+市销率+市现率+预期分红 - 成长指标:盈利增长+历史市值增长率+利润增长率+净现金流增长率+营收增长率 - 最终指标为两者相减[98] 3. 行业合并为TMT、上游、中游、消费、金融、综合六类,跨类时曼哈顿距离贡献为聚类数[98] 4. 采用与市值分域类似的交叉复合加权方法构建因子 --- 量化因子与构建方式 1. **因子名称**:分红因子 - **因子构建思路**:结合股息率与分红虚拟变量,反映基本面分红能力[10] - **因子具体构建过程**:由股息率因子与是否有分红的虚拟变量线性回归复合[10] 2. **因子名称**:ROE_SUE因子 - **因子构建思路**:综合ROE和SUE指标,反映盈利质量与增长[10] - **因子具体构建过程**:由ROE、SUE及对应的虚拟变量线性回归复合[10] 3. **因子名称**:日度量价因子 - **因子构建思路**:捕捉短期量价特征[10] - **因子具体构建过程**:由换手率、反转、特质波动、非流动性四个因子复合[10] 4. **因子名称**:高频量价因子 - **因子构建思路**:利用高频数据捕捉微观结构信号[10] - **因子具体构建过程**:由10个手工高频因子复合(具体因子未列明)[10] --- 模型的回测效果 1. **市值分域线性回归模型**(全市场测试,2017.01-2025.07) - **IC**:0.057(等权)→0.058(base_w=0.5)[8][9] - **Rank MAE**:1.090(等权)→1.089(base_w=0.5)[8][9] - **多空收益**:1.07%(等权)→1.08%(base_w=0.9)[11] - **多头收益**:0.33%(等权)→0.31%(base_w=0)[11] 2. **风格因子加权模型**(沪深300增强,严约束) - **年化超额收益**:5.83%(等权)→7.36%(base_w=0交叉复合)[103] - **IR**:0.804(等权)→0.901(base_w=0交叉复合)[103] - **最大回撤**:14.99%(等权)→16.33%(base_w=0交叉复合)[103] --- 因子的回测效果 1. **分红因子**(全市场IC,2017.01-2025.07) - **IC**:0.006(等权)→0.007(base_w=0)[13][14] 2. **ROE_SUE因子**(全市场IC) - **IC**:0.020(等权)→0.021(base_w=0.5)[15][16] 3. **日度量价因子**(全市场IC) - **IC**:0.042(等权)→0.044(base_w=0)[17][18] 4. **高频量价因子**(全市场IC) - **IC**:0.035(等权)→0.037(base_w=0.5)[19][20] --- 关键结论 - **市值加权效果**: - 沪深300增强中,极端大市值加权(base_w=0)提升年化超额1%以上[49][97] - 中证500增强中,base_w=0.5交叉复合效果最佳(年化超额15.06%)[92] - **风格因子加权局限性**:对中证1000增强效果不显著,仅严约束组合年化提升1%[132][141]