量化因子与构建方式 1. 因子名称:股东户数变动因子(SNC) - 因子的构建思路:股东户数的增加通常表明个人投资者的扎堆行为,而个人投资者的从众交易特征往往蕴含负向alpha,因此股东户数大幅增加的公司未来股价倾向于跑输股东户数减少的公司[17][21] - 因子具体构建过程: - 对数据缺失的月份进行前值填充,对相同月份的多条数据取最新值[17] - 采用间隔选取多期后再进行时序标准化处理,公式如下: 其中,,为当前值,为时序均值,为滚动期数,为选取间隔[19][20] - 默认选取间隔为3个月,滚动窗口长度为8期[20] - 对上市不满一年的新股、退市股和停牌股进行剔除,并对异常值进行剪枝和标准化处理[20] - 对因子值进行行业市值中性化处理[20] - 最终生成的因子值取负处理,使其转为正向选股因子[21] - 因子评价:SNC因子在测试期内表现优异,具有较高的选股能力[21] 2. 因子名称:人均持股占比变动因子(PCRC) - 因子的构建思路:与SNC因子类似,PCRC因子通过计算人均持股比例的时序变动来捕捉股东户数变化的影响[20][27] - 因子具体构建过程: - 数据预处理与SNC因子一致,包括前值填充、异常值剪枝、标准化处理和行业市值中性化处理[20] - 采用间隔选取多期后进行时序标准化处理,公式与SNC因子一致[19][20] - 默认选取间隔为3个月,滚动窗口长度为8期[20] - 因子评价:PCRC因子在多空对冲稳定性上表现优异,尤其在超额回撤控制方面优于SNC因子[30] 3. 因子名称:调参后的PCRC因子 - 因子的构建思路:通过调整间隔跨度(Gap)和滚动窗口长度(Window)优化PCRC因子的表现[34] - 因子具体构建过程: - 测试不同参数组合,发现每4个月选一次数据、滚动选取9期时,PCRC因子显著性最高,RankIC均值达到5.79%[34][35] - 每3个月选取一次、滚动选取4期时,因子稳定性达到局部最优解,RankICIR高达2.752[34][35] - 局部最优参数下,PCRC因子单调性改善,不同分组的走势区分度更加明显[36] - 因子评价:调参后的PCRC因子显著性和稳定性均有提升,表现更加优异[36] --- 因子的回测效果 1. 股东户数变动因子(SNC) - RankIC均值:4.5%[21] - RankICIR:2.50[21] - RankIC为正次数占比:约74%[21] - 多空对冲年化收益率:13.4%[24] - 多空对冲最大回撤:-3.9%[24] - 多空对冲胜率:约80%[24] 2. 人均持股占比变动因子(PCRC) - RankIC均值:4.4%[27] - RankICIR:2.53[27] - 多空对冲年化收益率:13.3%[31] - 多空对冲最大回撤:-2.9%[31] - 多空对冲胜率:约77.7%[31] 3. 调参后的PCRC因子 - RankIC均值:5.79%(显著性最高参数组合)[34] - RankICIR:2.752(稳定性最优参数组合)[34] - 多头端年化收益率:14.5%(局部最优参数下)[36] 4. PCRC因子在不同宽基指数中的表现 - 沪深300: - RankIC均值:2.19%[41] - RankICIR:0.93[41] - 年化超额收益率:4.18%(对冲组)[52] - 最大回撤:-4.00%(对冲组)[52] - 中证1000: - RankIC均值:4.88%[41] - RankICIR:1.508[52] - 年化超额收益率:9.08%(对冲组)[52] - 最大回撤:-6.22%(对冲组)[52] - 国证2000: - RankICIR:2.59[41] - 年化超额收益率:5.95%(对冲组)[52] - 最大回撤:-5.35%(对冲组)[52]
20221122_开源证券_金融工程专题_扎堆效应的识别:以股东户数变动为例_金工研究团队_20221122