Workflow
多因子ALPHA系列报告之(四十一):高频价量数据的因子化方法
广发证券·2021-07-12 00:00

量化因子与构建方式 日内价格相关因子 - 因子名称:real_skew(已实现偏度) 因子的构建思路:通过收益率的高阶统计量提取日内价格信息[28][30] 因子具体构建过程: 1. 设个股i在D日的日内分钟频率下的股票价格序列为{p_{t,D,i}}, t=1,2,...,T 2. 收益率序列为{r_{t,D,i}}, 其中 rt,D,i=pt,D,ipt1,D,i1r_{t,D,i} = \frac{p_{t,D,i}}{p_{t-1,D,i}} - 1 3. 已实现收益率偏度计算公式: real_skewD,i=1T1t=2T(rt,D,irˉD,i)3real_varD,i3/2real\_skew_{D,i} = \frac{1}{T-1} \sum_{t=2}^{T} \frac{(r_{t,D,i} - \bar{r}_{D,i})^3}{real\_var_{D,i}^{3/2}} 其中,rˉD,i\bar{r}_{D,i}为收益率均值,real_varD,ireal\_var_{D,i}为收益率方差[30][32] 因子评价:长期表现稳定,收益预测能力较强[38][41] - 因子名称:ret_intraday(日内收益率) 因子的构建思路:衡量日内股价变化[31][32] 因子具体构建过程: 1. 计算公式: ret_intradayD,i=pT,D,iopenD,i1ret\_intraday_{D,i} = \frac{p_{T,D,i}}{open_{D,i}} - 1 其中,pT,D,ip_{T,D,i}为收盘价,openD,iopen_{D,i}为开盘价[32] 因子评价:收益预测能力有所下降,但仍具备一定选股能力[38][44] 日内价量相关因子 - 因子名称:ratio_volumeH8(尾盘半小时成交量占比) 因子的构建思路:通过成交量分布反映投资者行为特征[58] 因子具体构建过程: 1. 将每天的交易时间分为8段,计算尾盘半小时成交量占全天成交量的比值[58] 因子评价:选股能力较强,尤其在尾盘时段表现突出[66][68] - 因子名称:corr_VP(日内价量相关性) 因子的构建思路:通过价格与成交量的相关性确认价格形态信息[59] 因子具体构建过程: 1. 记股票日内分钟频率下的成交量序列为{v_{t,D,i}},价格序列为{p_{t,D,i}} 2. 计算公式: corr_VPD,i=corr(vt,D,i,pt,D,i)corr\_VP_{D,i} = corr(v_{t,D,i}, p_{t,D,i})[59] 因子评价:预测能力较强,但近年来表现有所下降[66][69] - 因子名称:Amihud_illiq(Amihud非流动性因子) 因子的构建思路:衡量单位成交额驱动下股价变化幅度[60] 因子具体构建过程: 1. 计算公式: Amihud_illiqD,i=1T1t=2Trt,D,ipt,D,ivt,D,iAmihud\_illiq_{D,i} = \frac{1}{T-1} \sum_{t=2}^{T} \frac{|r_{t,D,i}|}{p_{t,D,i}v_{t,D,i}} 其中,rt,D,ir_{t,D,i}为收益率,pt,D,ip_{t,D,i}为价格,vt,D,iv_{t,D,i}为成交量[60][61] 因子评价:具有较高的超额收益能力,表现稳定[79][82] 盘前信息因子 - 因子名称:ret_open2AH1(开盘价相对第一阶段集合竞价最高价的收益率) 因子的构建思路:利用集合竞价信息提取资金试盘行为[95][98] 因子具体构建过程: 1. 计算公式: ret_open2AH1=openD,iA1_highD,i1ret\_open2AH1 = \frac{open_{D,i}}{A1\_high_{D,i}} - 1 其中,A1_highD,iA1\_high_{D,i}为第一阶段集合竞价最高价[98] 因子评价:选股能力较强,正Alpha收益略低于负Alpha收益[103][109] 特定时段采样因子 - 因子名称:ret_H8(尾盘半小时收益率) 因子的构建思路:通过尾盘时段的价量信息提取多空博弈特征[129][130] 因子具体构建过程: 1. 计算公式: ret_H8=pT,D,ipT1,D,i1ret\_H8 = \frac{p_{T,D,i}}{p_{T-1,D,i}} - 1 其中,pT,D,ip_{T,D,i}为尾盘时段的价格[130] 因子评价:多空收益表现优异,选股能力显著[137][141] - 因子名称:real_skewlarge(大成交量已实现偏度) 因子的构建思路:通过大成交量时段的收益率偏度提取主力资金行为[131][132] 因子具体构建过程: 1. 计算公式与real_skew类似,但仅针对大成交量时段[132] 因子评价:收益预测能力较强,表现稳定[137][141] 因子的回测效果 - real_skew:多空超额收益率29.27%,正Alpha收益5.87%,负Alpha收益-18.42%[50][164] - ret_intraday:多空超额收益率34.23%,正Alpha收益5.42%,负Alpha收益-22.87%[50][164] - ratio_volumeH8:多空超额收益率33.91%,正Alpha收益10.96%,负Alpha收益-17.71%[80][164] - corr_VP:多空超额收益率47.57%,正Alpha收益10.17%,负Alpha收益-26.09%[80][164] - Amihud_illiq:多空超额收益率36.22%,正Alpha收益16.22%,负Alpha收益-16.63%[80][164] - ret_open2AH1:多空超额收益率21.61%,正Alpha收益8.23%,负Alpha收益-11.52%[116][164] - ret_H8:多空超额收益率50.04%,正Alpha收益11.20%,负Alpha收益-26.38%[150][164] - real_skewlarge:多空超额收益率27.73%,正Alpha收益7.35%,负Alpha收益-16.20%[150][164] 因子相对中证500的超额收益表现 - Amihud_illiq:年化超额收益率17.28%,超额最大回撤-22.93%,超额胜率64.01%[165][167] - ratio_volumeH8:年化超额收益率8.64%,超额最大回撤-17.21%,超额胜率64.20%[165][167] - ret_H8:年化超额收益率8.14%,超额最大回撤-44.81%,超额胜率66.55%[165][167]