量化因子与构建方式 1. 因子名称:羊群效应因子 - 因子的构建思路:利用个股日内高频交易数据,结合LSV模型,构建个股短期内的羊群效应指标[10][34][39] - 因子具体构建过程: - 计算特定时间段内的买方驱动单数量 和卖方驱动单数量 - 计算羊群行为度量 其中 为所有股票的买单占其交易单比例的横截面平均值, 是调整项,其表达式为 - 根据个股买单比例的相对水平,将羊群行为划分成买入羊群行为 和卖出羊群行为 - 使用天软数据库的高频数据,识别个股每笔买卖方向,统计买方和卖方驱动单[39][40][41] 2. 因子名称:处理后的羊群效应因子 - 因子的构建思路:对原始因子进行去极值、中性化和标准化处理,以提高因子的有效性[4][10][108] - 因子具体构建过程: - 去极值:采用MAD法对异常数据进行剔除 - 中性化:将原始因子值和股票的市值以及行业进行回归,取残差项作为新因子 - 标准化:使用因子的Z-Score值作为新的因子值 - 处理后的因子在全市场、中证800、中证500及沪深300板块内进行了详细地测算[108][110][111] 因子的回测效果 1. 原始羊群效应因子 - 全市场: - IC均值:0.047 - 正IC占比:69.90% - 多头组合年化收益率:34.02% - 信息比率:1.05 - 多头组合相对中证500指数年化超额收益率:24.61% - 信息比率:2.59[4][46][59] 2. 处理后的羊群效应因子 - 全市场: - IC均值:0.051 - 正IC占比:73.77% - 多头组合年化收益率:34.62% - 信息比率:1.09 - 多头组合相对中证500指数年化超额收益率:24.98% - 信息比率:2.84[4][111][125] 3. 中证800 - 原始因子: - IC均值:0.043 - 正IC占比:64.68% - 多头组合年化收益率:22.01% - 信息比率:1.14 - 多头组合相对中证800指数年化超额收益率:16.27% - 信息比率:1.14[61][65][74] - 处理后因子: - IC均值:0.046 - 正IC占比:69.15% - 多头组合年化收益率:24.63% - 信息比率:0.84 - 多头组合相对中证800指数年化超额收益率:18.84% - 信息比率:1.45[126][128][136] 4. 中证500 - 原始因子: - IC均值:0.052 - 正IC占比:67.96% - 多头组合年化收益率:25.79% - 信息比率:0.81 - 多头组合相对中证500指数年化超额收益率:16.72% - 信息比率:1.87[76][79][89] - 处理后因子: - IC均值:0.055 - 正IC占比:71.54% - 多头组合年化收益率:28.19% - 信息比率:0.88 - 多头组合相对中证500指数年化超额收益率:19.13% - 信息比率:2.35[137][139][147] 5. 沪深300 - 原始因子: - IC均值:0.028 - 正IC占比:57.82% - 多头组合年化收益率:15.49% - 信息比率:0.56 - 多头组合相对沪深300指数年化超额收益率:9.19% - 信息比率:0.68[91][95][105] - 处理后因子: - IC均值:0.031 - 正IC占比:60.21% - 多头组合年化收益率:20.36% - 信息比率:0.74 - 多头组合相对沪深300指数年化超额收益率:14.08% - 信息比率:1.25[148][150][156]
高频数据因子研究系列三:基于个股羊群效应的选股因子研究
广发证券·2020-05-05 00:00