Workflow
多因子ALPHA系列报告之(四十八):高频数据的因子化研究
广发证券·2023-03-10 00:00

量化因子与构建方式 日内价格相关因子 - 因子名称:real_var、real_skew、real_kurtosis、real_upvar、real_downvar、ratio_realupvar、ratio_realdownvar、trendratio、ret_intraday、intraday_maxdrawdown - 因子的构建思路:基于日内收益率的高阶统计量和价格形态特征,提取反映股票价格波动、分布特性及趋势的信息[18][22][23] - 因子具体构建过程: 1. 已实现收益率方差real_varD,i=1T2t=2T(rt,D,irˉD,i)2r e a l\_v a r_{D,i}=\frac{1}{T-2}{\sum}_{t=2}^{T}\left(r_{t,D,i}-{\bar{r}}_{D,i}\right)^{2} 其中,rt,D,ir_{t,D,i}为分钟收益率,rˉD,i\bar{r}_{D,i}为日内收益率均值[22] 2. 已实现收益率偏度real_skewD,i=1T1t=2T(rt,D,irˉD,i)3(real_varD,i)3/2r e a l\_s k e w_{D,i}=\frac{1}{T-1}\sum_{t=2}^{T}\frac{\left(r_{t,D,i}-\bar{r}_{D,i}\right)^3}{(r e a l\_v a r_{D,i})^{3/2}} 偏度反映收益率分布的不对称性[22] 3. 已实现收益率峰度real_kurtosisD,i=1T1t=2T(rt,D,irˉD,i)4real_varD,ir e a l\_k u r t o s i s_{D,i}=\frac{1}{T-1}\sum_{t=2}^{T}\frac{\left(r_{t,D,i}-\bar{r}_{D,i}\right)^4}{r e a l\_v a r_{D,i}} 峰度反映分布的陡峭程度[23] 4. 上行/下行收益率方差比值ratio_realupvarD,i=real_upvarD,ireal_varD,ir a t i o_{\_}r e a l u p v a r_{D,i}=\frac{r e a l_{\_}u p v a r_{D,i}}{r e a l_{\_}v a r_{D,i}} ratio_realdownvarD,i=real_downvarD,ireal_varD,ir a t i o_{\_}r e a l d o w n v a r_{D,i}=\frac{r e a l_{\_}d o w n v a r_{D,i}}{r e a l_{\_}v a r_{D,i}} 分别计算收益率大于0和小于0时的方差占比[24] 5. 趋势占比trendratioD,i=pT,D,ip1,D,it=2Tpt,D,ipt1,D,it r e n d r a t i o_{D,i}=\frac{p_{T,D,i}-p_{1,D,i}}{\sum_{t=2}^{T}\left|p_{t,D,i}-p_{t-1,D,i}\right|} 衡量日内股价的趋势强度[25] 6. 日内收益率retintradayD,i=pT,D,iopenD,i1r e t_{-}i n t r a d a y_{D,i}=\frac{p_{T,D,i}}{o p e n_{D,i}}-1 反映开盘到收盘的收益率[25] 7. 日内最大回撤intradaymaxdrawdomD,i=min0<t<Tmin0<τTtpt+τ,D,ipt,D,i1i n t r a d a y_{-}m a x d r a w d o m_{D,i}=\operatorname*{min}_{0<t<T}\operatorname*{min}_{0<\tau\leq T-t}{\frac{p_{t+\tau,D,i}}{p_{t,D,i}}}-1 衡量日内价格的最大回撤幅度[26] 日内价量相关因子 - 因子名称:ratio_volumeH1、ratio_volumeH2、...、ratio_volumeH8、corr_VP、corr_VR、corr_VRlag、corr_VRlead、Amihud_illiq - 因子的构建思路:基于成交量分布及价量关系,提取反映投资者行为特征和流动性的信息[18][47] - 因子具体构建过程: 1. 成交量分布因子ratio_volumeHn=第n段时间成交量全天成交量r a t i o_{\_}v o l u m e H n = \frac{\text{第n段时间成交量}}{\text{全天成交量}} 将交易时间分为8段,计算每段成交量占比[47] 2. 价量相关性corrVPD,i=corr(vt,D,i,pt,D,i)c o r r_{-}V P_{D,i}=c o r r(v_{t,D,i},p_{t,D,i}) 计算价格与成交量的相关性[47] 3. 收益率与量相关性corrVRD,i=corr(vt,D,i,rt,D,i)c o r r_{-}V R_{D,i}=c o r r(v_{t,D,i},r_{t,D,i}) corrVRlagD,i=corr(vt,D,i,rt1,D,i)c o r r_{-}V R l a g_{D,i}=c o r r(v_{t,D,i},r_{t-1,D,i}) corrVRleadD,i=corr(vt,D,i,rt+1,D,i)c o r r_{-}V R l e a d_{D,i}=c o r r(v_{t,D,i},r_{t+1,D,i}) 分别计算成交量与当前、滞后、超前收益率的相关性[47][48] 4. Amihud非流动性因子Amihud_illiqD,i=1T1t=2Trt,D,ipt,D,ivt,D,iA m i h u d\_i l l i q_{D,i}=\frac{1}{T-1}\sum_{t=2}^{T}\frac{\left|r_{t,D,i}\right|}{p_{t,D,i}v_{t,D,i}} 衡量单位成交额驱动下的价格变化幅度[49][50] 盘前信息因子 - 因子名称:ret_overnight、ret_open2AH1、ret_open2AL1、ret_open2AH2、ret_open2AL2、diverge_A1、diverge_A2 - 因子的构建思路:基于隔夜收益率和开盘集合竞价信息,提取反映资金试盘行为和多空博弈的信息[18][75] - 因子具体构建过程: 1. 隔夜收益率ret_overnight=开盘价前收盘价1r e t_{\_}o v e r n i g h t = \frac{\text{开盘价}}{\text{前收盘价}}-1 反映隔夜市场的价格变化[75] 2. 集合竞价收益率ret_open2AH1=开盘价第一阶段最高价1r e t_{\_}o p e n 2 A H 1 = \frac{\text{开盘价}}{\text{第一阶段最高价}}-1 ret_open2AL1=开盘价第一阶段最低价1r e t_{\_}o p e n 2 A L 1 = \frac{\text{开盘价}}{\text{第一阶段最低价}}-1 分别计算开盘价相对集合竞价最高价和最低价的收益率[75] 3. 集合竞价振幅diverge_A1=第一阶段最高价第一阶段最低价第一阶段最低价d i v e r g e_{\_}A 1 = \frac{\text{第一阶段最高价}-\text{第一阶段最低价}}{\text{第一阶段最低价}} 衡量集合竞价的价格波动幅度[75] 特定时段采样因子 - 因子名称:ret_H1、ret_close2H1、ret_H8、real_varH1、real_varH8、real_skewH1、real_skewH8、real_kurtosisH1、real_kurtosisH8、corr_VPH1、corr_VPH8、corr_VRleadH1、corr_VRleadH8、corr_VRlagH1、corr_VRlagH8 - 因子的构建思路:基于开盘后和收盘前半小时的价量信息,提取反映多空博弈和主力资金行为的信息[18][97] - 因子具体构建过程: 1. 收益率因子ret_H1=10点价开盘价1r e t_{\_}H 1 = \frac{\text{10点价}}{\text{开盘价}}-1 ret_H8=收盘价14:30价1r e t_{\_}H 8 = \frac{\text{收盘价}}{\text{14:30价}}-1 分别计算开盘后和收盘前半小时的收益率[97][99] 2. 价量相关性因子corr_VPH1=corr(vt,D,i,pt,D,i)c o r r_{\_}V P H 1 = c o r r(v_{t,D,i},p_{t,D,i}) $$ c o r r