高频数据因子研究系列八:日内价量数据因子化研究
广发证券· 2022-06-06 00:00
量化因子与构建方式 1. 因子名称:DPIN_MEAN类因子 - **因子的构建思路**:通过分析个股日内未预期收益与交易行为的关系,构建衡量动态日内知情交易概率的因子,主要关注知情交易概率的平均水平[8][39][43] - **因子具体构建过程**: 1. 计算个股在日内区间的未预期收益,公式为: $$ R_{i,j} = \gamma_0 + \sum_{k=1}^{4}\gamma_{1i,k}D_{k}^{Day} + \sum_{k=1}^{48}\gamma_{2i,k}D_{k}^{Int} + \sum_{k=1}^{12}\gamma_{3i,k}R_{i,j-k} + \epsilon_{i,j} $$ 其中,$R_{i,j}$为区间收益率,$D_{k}^{Day}$为周内效应虚拟变量,$D_{k}^{Int}$为日内效应虚拟变量,$R_{i,j-k}$为滞后收益率[42] 2. 根据未预期收益的正负,计算知情交易概率,公式为: $$ DPIN_{BASE}^{i,j} = \frac{NB_{i,j}}{NT_{i,j}} \cdot (\epsilon_{i,j} < 0) + \frac{NS_{i,j}}{NT_{i,j}} \cdot (\epsilon_{i,j} > 0) $$ 其中,$NB_{i,j}$、$NS_{i,j}$、$NT_{i,j}$分别为主买成交笔数、主卖成交笔数和总成交笔数[43] 3. 对日内5分钟频率的DPIN值取均值,构建日度因子[48] - **因子评价**:该类因子能够较好地刻画个股日内知情交易概率的平均水平,具有显著的分层效果[74][92] 2. 因子名称:DPIN_STD类因子 - **因子的构建思路**:通过计算个股日内知情交易概率的分散程度,衡量信息优势交易的波动性[8][39][43] - **因子具体构建过程**: 1. 在计算日内知情交易概率的基础上,计算其标准差,公式为: $$ DPIN_{BASE\_TOTAL\_STD} = STD(\{DPIN_{BASE}^{i,j}\}) $$ 其中,$STD$为标准差函数,$DPIN_{BASE}^{i,j}$为日内各区间的知情交易概率[59] 2. 对日内5分钟频率的DPIN值计算均值标准差比值,进一步刻画分散程度[50][59] - **因子评价**:该类因子能够有效反映个股日内知情交易概率的分散程度,分层效果显著[92][154] 3. 因子名称:DPIN_STABLE类因子 - **因子的构建思路**:通过分析个股日内知情交易概率的稳定性,衡量信息优势交易的持续性[8][39][43] - **因子具体构建过程**: 1. 在计算日内知情交易概率的基础上,计算其稳定性指标,公式为: $$ DPIN_{BASE\_TOTAL\_STABLE} = \frac{1}{N} \sum_{j=1}^{N} |DPIN_{BASE}^{i,j} - \overline{DPIN_{BASE}}| $$ 其中,$\overline{DPIN_{BASE}}$为日内知情交易概率的均值[59] 2. 对日内5分钟频率的DPIN值进行稳定性分析,构建日度因子[50][59] - **因子评价**:该类因子能够较好地反映个股日内知情交易概率的稳定性,分层效果显著[92][176] --- 因子的回测效果 1. DPIN_MEAN类因子 - **IC均值**:0.044[135] - **正IC占比**:84.4%[135] - **多空策略年化收益率**:37.5%[135] - **信息比率**:3.66[135] - **多头相对中证800策略年化收益率**:23.4%[135] - **多头相对中证800策略信息比率**:1.31[135] 2. DPIN_STD类因子 - **IC均值**:0.061[156] - **正IC占比**:72.4%[156] - **多空策略年化收益率**:44.3%[156] - **信息比率**:3.16[156] - **多头相对中证800策略年化收益率**:18.8%[156] - **多头相对中证800策略信息比率**:1.08[156] 3. DPIN_STABLE类因子 - **IC均值**:-0.059[178] - **负IC占比**:72.4%[178] - **多空策略年化收益率**:41.5%[178] - **信息比率**:2.82[178] - **多头相对中证800策略年化收益率**:19.2%[178] - **多头相对中证800策略信息比率**:1.09[178]
20220602_开源证券_金融工程专题_新型因子_资金流动力学与散户羊群效应--市场微观结构研究系列(14)
开源证券· 2022-06-02 00:00
量化因子与构建方式 1. 同步相关性因子 - **因子名称**:同步相关性因子 - **因子的构建思路**:通过计算不同类型资金流在过去一段时间内的同步净流入秩相关系数,来衡量其选股能力[14] - **因子具体构建过程**: - 针对任意两类资金流,其同步相关性被定义为:两类资金流在过去若干交易日同步净流入的秩相关系数 - 若某只股票过去若干交易日A类资金净流入序列为$EL_t$,B类资金净流入序列为$S_t$,则该股票的同步相关性被记为$RankCorr(EL_t, S_t)$[14] - 计算公式: $$ RankCorr(EL_t, S_t) $$ - **因子评价**:同步相关性因子具备一定的选股能力,尤其是超大单和小单的同步相关性表现最好[14][16] 2. 错位相关性因子 - **因子名称**:错位相关性因子 - **因子的构建思路**:通过计算不同类型资金流在过去一段时间内的错位净流入秩相关系数,来衡量其选股能力[28] - **因子具体构建过程**: - 针对任意两类资金流,其错位相关性被定义为:两类资金流在过去若干交易日错位净流入的秩相关系数 - 若某只股票过去若干交易日A类资金净流入序列为$S_t$,B类资金净流入序列为$S_{t+1}$,则该股票的错位相关性被记为$RankCorr(S_t, S_{t+1})$[28] - 计算公式: $$ RankCorr(S_t, S_{t+1}) $$ - **因子评价**:错位相关性因子具备一定的选股能力,尤其是小单和小单的错位相关性表现最好[28][32] 3. 行业轮动因子 - **因子名称**:行业轮动因子 - **因子的构建思路**:通过计算行业层面的小单资金净流入日度变化与昨日行业收益日度变化的秩相关系数,来衡量其行业轮动能力[51] - **因子具体构建过程**: - 使用一阶差分秩相关性$RankCorr(\Delta R_t, \Delta S_{t+1})$作为行业散户羊群效应的代理变量 - 具体解释为:对于某行业小单资金净流入的日度变化而言,若其跟随昨日行业收益日度变化越紧密,则认为该行业散户羊群效应较高,后市表现可能较差[51] - 计算公式: $$ RankCorr(\Delta R_t, \Delta S_{t+1}) $$ - **因子评价**:行业轮动因子具备较好的行业轮动能力,整体绩效较为优异[52] 因子的回测效果 同步相关性因子 - **IC均值**:5.13%[16] - **ICIR**:2.43[16] - **多空对冲年化收益**:12.09%[16] - **信息比率**:1.93[16] - **月度胜率**:76.79%[16] - **最大回撤**:7.17%[16] 错位相关性因子 - **IC均值**:3.09%[28] - **ICIR**:2.07[28] - **多空对冲年化收益**:8.45%[28] - **信息比率**:2.05[28] - **月度胜率**:76.58%[28] - **最大回撤**:4.21%[28] 行业轮动因子 - **IC均值**:-5.85%[52] - **ICIR**:-1.04[52] - **多空对冲年化收益**:11.99%[52] - **信息比率**:1.25[52] - **胜率**:66.07%[52] - **最大回撤**:8.22%[52]
高频数据因子研究系列七:再谈信息不对称理论下的因子研究
广发证券· 2022-03-30 00:00
量化因子与构建方式 1. 因子名称:VPIN因子 - **因子的构建思路** VPIN因子基于信息不对称理论,旨在衡量市场中个股反映信息不对称程度的刻画。通过交易量不平衡性来估计知情交易者的交易概率[7][36][171] - **因子具体构建过程** 1. **划分等交易量的交易区间** 将按时间排列的交易数据分成等交易量的交易篮子,每个交易篮子所包含的交易量定为前三个月的日均成交量的五十分之一[29][37] 2. **基于正态分布假设对交易方向进行判断** - 计算每个交易篮子的买单交易量和卖单交易量 $$V_{\tau}^{B}=\sum_{i=t(\tau-1)+1}^{t(\tau)}V_{i}*Z\left(\frac{P_{i}-P_{i-1}}{\sigma_{\nabla P}}\right)$$ $$V_{\tau}^{S}=\sum_{i=t(\tau-1)+1}^{t(\tau)}V_{i}\left[1-Z\left(\frac{P_{i}-P_{i-1}}{\sigma_{\nabla P}}\right)\right]$$ 其中,$Z$为正态分布的累计密度函数,$P_{i}$为价格,$\sigma_{\nabla P}$为价格变动的标准差[30][31][37] 3. **计算交易不平衡量** $$O I_{\tau}=|V_{\tau}^{S}-V_{\tau}^{B}|$$ 4. **计算VPIN值** $$\mathrm{VPIN}={\frac{\sum_{\tau=1}^{n}\left|V_{\tau}^{S}-V_{\tau}^{B}\right|}{n V}}$$ 最后对个股在日历周内的VPIN值求均值,得到VPIN因子[31][37][45] - **因子评价** VPIN因子能够有效刻画信息不对称程度,且与传统BARRA因子相关性较低,具有独立性和补充性[159][161][173] --- 因子的回测效果 1. 全市场选股 - **IC均值**:-0.0467 - **负IC占比**:74.18% - **年化收益率**:18.67% - **信息比率(IR)**:1.28 - **换手率**:58%[56][68][77] 2. 中证1000选股 - **IC均值**:-0.0322 - **负IC占比**:64.50% - **年化收益率**:8.07% - **信息比率(IR)**:1.20 - **换手率**:57%[79][85][92] 3. 中证800选股 - **IC均值**:-0.0329 - **负IC占比**:64.69% - **年化收益率**:11.25% - **信息比率(IR)**:1.08 - **换手率**:60%[94][103][111] 4. 中证500选股 - **IC均值**:-0.0394 - **负IC占比**:66.53% - **年化收益率**:11.54% - **信息比率(IR)**:1.72 - **换手率**:60.04%[113][118][125] 5. 沪深300选股 - **IC均值**:-0.0211 - **负IC占比**:59.68% - **年化收益率**:6.91% - **信息比率(IR)**:0.71 - **换手率**:60%[128][134][142] 6. 创业板选股 - **IC均值**:-0.0189 - **负IC占比**:56.81% - **年化收益率**:6.36% - **信息比率(IR)**:0.53 - **换手率**:60%[143][149][155]
高频数据因子研究系列六:信息不对称理论下的因子研究
广发证券· 2022-02-21 00:00
量化因子与构建方式 1. **因子名称**:VWPIN因子 **因子构建思路**:基于信息不对称理论,通过交易量加权的订单数量不平衡程度来衡量市场中个股反映信息不对称程度的知情交易概率[5][45]。 **因子具体构建过程**: - 首先,在第t天第i个交易区间,利用个股的主买(卖)成交笔数计算交易数量的不平衡性,公式为: $$Pin_i = \frac{|S_i - B_i|}{S_i + B_i}$$ 其中,\(S_i\)为第i个交易区间的卖单数量,\(B_i\)为第i个交易区间的买单数量[46]。 - 其次,根据第t天全天总体交易量与第i个交易区间的交易量数据,计算个股区间交易量占比,公式为: $$w_i = \frac{TradVol_i}{\sum_{i=1}^{n} TradVol_i}$$ 其中,\(TradVol_i\)为第i个交易区间的交易量[46]。 - 最后,将第i个交易时段的交易量占比权重与交易概率相乘,并对所有交易区间的加权概率求和,得到VWPIN因子,公式为: $$VWPIN = \sum_{i=1}^{n} w_i Pin_i$$[46] **因子评价**:VWPIN因子综合考虑了订单数量和交易量的不平衡性,能够更准确地反映信息不对称程度[44]。 2. **因子名称**:VWPIN平滑因子 **因子构建思路**:在VWPIN因子的基础上,对个股在周/月内的VWPIN因子数据求均值,以平滑因子波动[46]。 **因子具体构建过程**: - 对个股在周一至周五的VWPIN因子进行等权求和,取得当周周五的VWPIN平滑因子[93]。 - 同理,可以取得月频交易的VWPIN平滑因子[93]。 **因子评价**:VWPIN平滑因子在全市场、创业板范围内分档效果及净值表现均显著优于VWPIN因子[129]。 因子的回测效果 1. **VWPIN因子** - 全市场范围内,中性化因子IC均值为0.06,正IC占比76.59%,多头相对中证800年化收益率为19.07%,年化波动率16.15%,最大回撤33.71%,信息比率为1.18[5]。 - 中证500指数内,IC均值为0.04,正IC占比为66.12%,多空对冲策略年化收益率为17.61%,年化波动率为9.99%,信息比为1.76,最大回撤为18.60%[5]。 2. **VWPIN平滑因子** - 在月度调仓、周度调仓的历史回测下,VWPIN平滑因子在全市场、创业板范围内分档效果及净值表现均显著优于VWPIN因子[129]。
20211227_海通证券_金融工程专题_冯佳睿余浩淼_选股因子系列研究(七十五)——限价订单簿(LOB)的还原和应用
海通证券· 2021-12-27 00:00
量化模型与因子分析总结 量化模型与构建方式 1. **模型名称**:改进TWAP策略 **模型构建思路**:通过限价订单簿(LOB)指标预测限价单成交概率,优化传统TWAP策略的下单决策[4] **模型具体构建过程**: - 定义买卖成交概率指标: $$TradeRatio_{t_j}=BidMatchVol_{max,t_j}/BidOrderVol_{t_j}-AskMatchVol_{max,t_j}/AskOrderVol_{t_j}$$[28] - 构建4个LOB衍生预测指标: - 订单簿相对强弱: $$SheetDiff_{t_j}=(V_{B1t_j}-V_{A1t_j})/(V_{B1t_j}+V_{A1t_j})$$[41] - 成交相对强弱: $$MatchDiff_{t_{j-1,j}}=(MatchVol_{B1t_{j-1,j}}-MatchVol_{A1t_{j-1,j}})/TotVol_{B1t_{j-1,j}}$$[42] - 挂单相对强弱: $$OrderDiff_{t_{j-1,j}}=(OrderVol_{B1t_{j-1,j}}-OrderVol_{A1t_{j-1,j}})/TotVol_{B1t_{j-1,j}}$$[43] - 撤单相对强弱: $$CancelDiff_{t_{j-1,j}}=(CancelVol_{B1t_{j-1,j}}-CancelVol_{A1t_{j-1,j}})/TotVol_{B1t_{j-1,j}}$$[43] - 建立回归模型预测买卖成交概率,指导下单决策[46] **模型评价**:对于京东方A和证券ETF效果显著,但对其他证券改进有限[57] 2. **模型名称**:模拟撮合系统 **模型构建思路**:利用逐笔数据还原盘口行情,模拟真实交易撮合过程[20] **模型具体构建过程**: - 基于逐笔委托和逐笔成交数据还原0.01秒级订单簿[18] - 跟踪虚拟订单在委托队列中的优先级变化[21] - 根据后续成交/撤单信息判断虚拟订单成交情况[21] **模型评价**:能更准确估计交易成本,但对大额订单冲击效果有限[22] 量化因子与构建方式 1. **因子名称**:买入意愿因子 **因子构建思路**:结合盘口变动和主买主卖数据衡量开盘后买入强度[60] **因子具体构建过程**: - 原始构建方法(基于快照数据): - 计算委买增额与委卖增额差值[61] - 加上主买成交与主卖成交的净额[61] - 除以总成交金额得到占比[60] - LOB分解方法: - 定义委买增量价格集合: $$Set_{bid}=\{B_i|([B_{1,t},B_{1,t+3}],B_{1,t+3}>B_{1,t})\}$$[65] - 计算净挂单金额、净撤单金额、净成交金额和净被动买入金额[68] - 等权复合四个分量得到最终因子[68] **因子评价**:两种构建方法选股效果相当,但LOB方法提供了更多分解维度[70] 2. **因子名称**:LOB衍生细分因子 **因子构建思路**:将买入意愿因子分解为四个独立成分[72] **因子具体构建过程**: - 开盘后净挂单占比:价格集合内买卖挂单净额/总成交[65][68] - 开盘后净撤单占比:价格集合内买卖撤单净额/总成交[65][68] - 开盘后净成交占比:价格集合内买卖成交净额/总成交[65][68] - 开盘后被动净买入占比:被动买卖成交净额/总成交[68] **因子评价**:被动净买入占比IC最高(-0.027),净撤单占比效果最弱(0.009)[73] 模型的回测效果 1. **改进TWAP策略**: - 京东方A(1000万):相对市价单超额收益0.016%(买入)/0.010%(卖出),胜率87.32%/69.01%[57] - 证券ETF(200万):相对市价单超额收益0.006%(买入)/0.004%(卖出),胜率67.61%/61.97%[57] - 中国平安(1亿):相对市价单超额收益-0.003%(买入)/-0.010%(卖出),胜率45.07%/21.13%[57] 2. **限价单TWAP策略**: - 京东方A(1000万):日均超额收益0.005%(买入)/0.007%(卖出),胜率59.15%/71.83%[26] - 证券ETF(200万):日均超额收益0.008%(买入)/0.009%(卖出),胜率63.38%/74.65%[26] - 强制成交比例普遍在80%以上[26] 因子的回测效果 1. **买入意愿因子**: - IC=0.034,IC-IR=4.006,多空月均收益1.25%[70] - 正交+IC加权复合后IC提升至0.034,IC-IR提升至4.023[75] 2. **LOB细分因子**: - 被动净买入占比:IC=-0.027,多空月均收益1.38%[73] - 净成交占比:IC=-0.022,多空月均收益1.37%[73] - 净挂单占比:IC=0.014,多空月均收益0.50%[73] - 净撤单占比:IC=0.009,多空月均收益0.32%[73]
20211107_开源证券_金融工程专题_从北向资金持仓行为到股票关联网络
开源证券· 2021-11-07 00:00
量化模型与构建方式 1. **模型名称**:Traction-NS 因子 **模型构建思路**:通过外资券商持仓数据构建股票关联网络,利用关联网络刻画股票涨跌之间的牵引关系,预期关联股票的涨跌幅会对目标股票产生锚定效应,进而构建牵引因子[5][28] **模型具体构建过程**: - 每月末,按照40%留存比例,对外资券商关联网络进行稀疏处理[29] - 取外资券商持仓股票过去20日累计涨跌幅,计算截面中位数作为市场收益水平,记作med[29] - 对于关联网络中的节点股票A,取其所有关联股票过去20日涨跌幅数据,记作向量chg_A[29] - 计算chg_A - med,作为股票A关联股票的alpha收益,记作向量alpha_A[29] - 取股票A与所有关联股票之间的关联度,记作向量K_A[29] - 利用关联度向量K_A与向量alpha_A,得到股票A所有关联股票的alpha锚定值,记作exp_A[29] - 计算exp_A的均值,作为股票A的alpha锚定值均值,得到股票A的原始因子,记作exp_ave_A[29] - 对所有股票的exp_ave指标,做横截面回归,剔除股票自身alpha和行业因素,得到关联网络牵引因子Traction-NS[29] **模型评价**:Traction-NS因子表现稳健,年化收益率达到23.75%,年化IR为3.45,最大回撤为5.33%,月度胜率在83%左右[5][38] 模型的回测效果 1. **Traction-NS模型**,年化收益率23.75%,年化IR 3.45,最大回撤5.33%,月度胜率83%[5][38] 2. **Traction-NS模型**,在中证1000上年化收益21.02%,年化IR 2.89,最大回撤6.52%[6][40] 3. **Traction-NS模型**,在中证500上年化收益15.7%,年化IR 2.18,最大回撤6.62%[6][40] 4. **Traction-NS模型**,在沪深300上年化收益13.96%,年化IR 1.83,最大回撤9.69%[6][40] 量化因子与构建方式 1. **因子名称**:关联度指标 **因子的构建思路**:通过外资券商持仓数据定义股票间的关联强度,最终加总得到两只股票的关联度指标[4][24] **因子具体构建过程**: - 取外资券商A共同持有的股票a与股票b持仓市值数据,记作H_a、H_b,以及相应的流通市值数据,记作MV_a、MV_b[27] - 计算H_a / MV_a,记作I_a,股票b记作I_b[27] - 定义外资券商A共同持仓股票a与股票b的关联强度指标为:$$J_{ab}=min(I_a, I_b)$$[27] - 将所有共同持仓股票a与股票b的外资券商得到的关联度指标求和,得到股票a与股票b的关联度指标Kab[27] **因子评价**:关联度指标能够有效衡量股票间的关联强度,为后续牵引因子的构建提供基础[4][24] 因子的回测效果 1. **关联度指标**,在40%留存比例下,因子RankIC达到峰值6.09%[33] 2. **关联度指标**,在10%留存比例下,因子RankIC为4%[33] 3. **关联度指标**,在50%留存比例下,因子RankIC为6.07%[33]
20211002_开源证券_金融工程专题_从基金持仓行为到股票关联网络--金融工程专题_魏建榕,王志豪
开源证券· 2021-10-02 00:00
量化模型与构建方式 1. 模型名称:关联网络牵引因子 Traction20d - **模型构建思路**:利用股票关联网络刻画股票涨跌之间的牵引关系,通过关联股票的涨跌幅来预测目标股票的涨幅[5] - **模型具体构建过程**: 1. 取所有基金持仓股票过去20日累计涨跌幅,并计算截面中位数,作为市场收益水平,记作med[37] 2. 对于关联网络中节点股票A,取其所有关联股票过去20日涨跌幅数据,记作向量chg_A[37] 3. 计算chg_A - med,作为股票A关联股票的alpha收益,记作向量alpha_A[37] 4. 取股票A与所有关联股票之间的关联度,记作向量K_A[37] 5. 利用关联度向量K_A与向量alpha_A,得到股票A所有关联股票的alpha锚定值,记作exp_A[37] 6. 计算exp_A的均值,作为股票A的alpha锚定值均值,得到股票A的原始因子,记作exp_ave_A[37] 7. 对所有股票的exp_ave指标,做横截面回归,剔除股票自身alpha和行业因素,得到关联网络牵引因子Traction20d[37] - **模型评价**:整体表现稳定,因子与常见因子相关性较低[5][6][36] 模型的回测效果 - **Traction20d模型**: - RankIC:3.84%[5] - RankICIR:2.60[5] - 多头组年化收益:17.1%[5] - 多头换手率:69.5%[5] - 收益波动比:0.61[5] - 多空组合年化收益率:14.3%[5] - 年化IR:2.6[5] - 最大回撤:6.06%[5] - 整体胜率:72.6%[5] 量化因子与构建方式 1. 因子名称:关联度指标 - **因子的构建思路**:通过基金共同持仓数据,构建股票间的关联度指标,刻画股票关联网络[23] - **因子具体构建过程**: 1. 取基金持仓股票市值数据,用持仓市值与成交额的比值,衡量基金对个股的影响力强弱(影响周期)[23] 2. 取同一基金在两只股票上的影响力最小值,作为二者由同一基金持仓带来的关联强度[23] 3. 两只股票在所有持仓基金上的关联强度加总,得到两只股票的关联度指标[23] 4. 定义A基金共同持仓股票a与股票b的关联度指标为:$J_{ab} = \min(I_a, I_b)$[28] 5. 将所有共同持仓股票a与股票b的基金得到的关联度指标求和,得到股票a与股票b的关联度指标$K_{ab}$[28] - **因子评价**:同行业股票间的关联度指标均值高于不同行业股票间的关联度指标均值[29] 因子的回测效果 - **关联度指标**: - 最高组R方均值:16.96%[31] - 最低组R方均值:14.92%[31] - 基金共同持仓R方均值:15.05%[21] - 基金持仓R方均值:14.07%[21]
独家量价因子的高频测试
开源证券· 2021-09-24 16:04
量化因子与构建方式 - **主动买卖因子** - 构建思路:逐日计算大单和中单的主动买卖因子以及小单的主动买卖因子,分别取高收益日和低收益日的因子均值[36] - 公式: $ ACT正向,𝑡 = \frac{主动买入金额(大单 + 中单) − 主动卖出金额(大单 + 中单)}{主动买入金额(大单 + 中单) + 主动卖出金额(大单 + 中单)} $ $ ACT负向,𝑡 = \frac{主动买入金额(小单) − 主动卖出金额(小单)}{主动买入金额(小单) + 主动卖出金额(小单)} $ - 评价:在高频测试中表现优异,尤其在多空端收益波动比表现较好[4][5] - **聪明钱因子** - 构建思路:基于分钟数据,筛选成交量累积占比前20%的分钟作为聪明钱交易,计算其成交量加权平均价与全市场成交量加权平均价的比值[34] - 公式: $ Q = \frac{VWAPsmart}{VWAPall} $ - 评价:在高频测试中多空端表现优异[4][5] - **理想振幅因子** - 构建思路:基于过去N日数据,计算高价振幅与低价振幅的差值[36] - 公式: $ V(𝜆) = Vhigh(𝜆) − Vlow(𝜆) $ - 评价:在高频测试中多空端表现优异[4][5] - **APM因子** - 构建思路:基于上午与下午的收益率残差差异,构造统计量并剔除动量因子影响[34] - 公式: $ stat = \frac{\mu(𝛿𝑡)}{\sigma(𝛿𝑡)/\sqrt{N}} $ - 评价:在高频测试中表现稳定[4][5] - **理想反转因子** - 构建思路:基于单笔成交金额高低的交易日涨跌幅差值[34] - 公式: $ M = Mhigh − Mlow $ - 评价:在高频测试中表现稳定[4][5] - **长端动量因子** - 构建思路:基于过去160日数据,选择振幅较低的70%交易日涨跌幅加总[36] - 评价:在高频测试中多头端表现优异[5] - **大单资金流因子** - 构建思路:基于大单买卖额的强度,剔除过去20日涨跌幅的影响[36] - 评价:在高频测试中多头端和多空端均表现优异[5] - **小单资金流因子** - 构建思路:基于小单买卖额的强度,剔除过去20日涨跌幅的影响[36] - 评价:在高频测试中表现稳定[5] - **复合因子** - 构建思路:基于主动买卖、理想振幅、APM、理想反转、大单资金流和长端动量因子,滚动回看12期,以最大化ICIR为目标计算权重[28][29] - 评价:在多头端及多空端均显著优于原始因子[6][28] --- 因子的回测效果 周频下 - **多空收益波动比** - 主动买卖:2.08[22] - 聪明钱:2.49[22] - 理想振幅:2.92[27] - APM:1.99[23] - 理想反转:1.98[23] - 长端动量:1.67[27] - 大单资金流:2.95[28] - 小单资金流:1.88[28] 双周频下 - **年化收益率** - 主动买卖:15.82%[18] - 聪明钱:23.34%[18] - 理想振幅:27.69%[18] - APM:10.70%[18] - 理想反转:17.87%[18] - 长端动量:22.54%[18] - 大单资金流:19.04%[18] - 小单资金流:13.36%[18] 月频下 - **年化收益率** - 主动买卖:13.47%[21] - 聪明钱:22.38%[21] - 理想振幅:22.72%[21] - APM:10.01%[21] - 理想反转:16.00%[21] - 长端动量:19.17%[21] - 大单资金流:15.32%[21] - 小单资金流:4.47%[21]
分析师目标价的 Alpha 信息
开源证券· 2021-09-14 08:08
量化因子与构建方式 - **WTR因子** - **构建思路**:基于分析师目标价格预测,考虑报告发布时的价格而非月末价格,赋予目标价格权重,权重由股票价格走势是否验证目标价格决定[79][80][83] - **公式**: $ WTR = \sum{\frac{P_{i}^{e}}{P_{i}^{0}}} = \frac{\sum P_{i}^{e} \times P / P_{i}^{0}}{P} = \sum{\frac{P_{i}^{e}}{P}} \omega_{i} = TR \times W $ 其中,$P_{i}^{0}$为机构发布价格预测前一个交易日的收盘价,$P_{i}^{e}$为机构发布的股票目标价格,$P$为月末计算因子时的股票收盘价,$\omega_{i}$为权重[80] - **评价**:因子收益主要集中在多头端,说明高预期收益率的股票表现更优,分析师对个股价格预测具有选股能力[84] - **MTR因子** - **构建思路**:基于WTR因子的同比变化,反映分析师预期调整对市场的短期冲击[88][89] - **公式**: $ MTR = diff(WTR) $[88] - **评价**:空头端收益显著,分析师下调预期收益率的负面信息更强烈,而上调预期收益率对未来收益率的预测敏感性较低[91] - **CTR因子** - **构建思路**:结合WTR因子和分析师关注度因子C的排序值,反映股票热度差异性[94] - **公式**: $ CTR = Rank(WTR) \times Rank(C) $ 其中,$Rank(WTR)$为WTR因子的排序值,$Rank(C)$为关注度因子的排序值[94] - **评价**:多头收益显著,关注度较高的股票存在溢价,尤其在市场风格切换时表现偏弱[98] - **TR_ICIR因子** - **构建思路**:将WTR、MTR和CTR因子通过ICIR加权合成,提升因子稳定性[99][100] - **评价**:合成因子在选股效果和稳定性上优于原始因子[100] --- 因子的回测效果 **WTR因子** - **ICIR**:N=20时为1.52,N=40时为1.41,N=60时为1.346,N=90时为1.264[85][86] - **IR**:N=20时为1.265,N=40时为1.047,N=60时为0.996,N=90时为0.997[85][86] - **年化收益**:N=20时为14.4%,N=40时为14.2%,N=60时为14.1%,N=90时为14.7%[85][86] - **夏普比率**:N=20时为0.522,N=40时为0.517,N=60时为0.515,N=90时为0.538[85][86] - **月度胜率**:N=20时为69.6%,N=40时为66.7%,N=60时为66.7%,N=90时为62.3%[85][86] **MTR因子** - **ICIR**:N=20时为2.022,N=40时为1.87,N=60时为1.808,N=90时为1.933[92][93] - **IR**:N=20时为1.772,N=40时为1.486,N=60时为1.537,N=90时为1.616[92][93] - **年化收益**:N=20时为12.3%,N=40时为11.7%,N=60时为11.5%,N=90时为11.7%[92][93] - **夏普比率**:N=20时为0.456,N=40时为0.434,N=60时为0.426,N=90时为0.43[92][93] - **月度胜率**:N=20时为70.3%,N=40时为68.1%,N=60时为68.1%,N=90时为68.8%[92][93] **CTR因子** - **ICIR**:N=20时为1.061,N=40时为0.973,N=60时为0.919,N=90时为0.823[99] - **IR**:N=20时为1.233,N=40时为1.108,N=60时为1.124,N=90时为0.967[99] - **年化收益**:N=20时为12.5%,N=40时为13.5%,N=60时为14.4%,N=90时为14.4%[99] - **夏普比率**:N=20时为0.469,N=40时为0.506,N=60时为0.546,N=90时为0.549[99] - **月度胜率**:N=20时为62.3%,N=40时为64.5%,N=60时为67.4%,N=90时为60.9%[99] **TR_ICIR因子** - **ICIR**:1.533[100] - **IR**:1.401[100] - **年化收益**:14.9%[100] - **夏普比率**:0.545[100] - **月度胜率**:67.4%[100]
多因子ALPHA系列报告之(四十一):高频价量数据的因子化方法
广发证券· 2021-07-12 00:00
量化因子与构建方式 日内价格相关因子 - **因子名称**:real_skew(已实现偏度) **因子的构建思路**:通过收益率的高阶统计量提取日内价格信息[28][30] **因子具体构建过程**: 1. 设个股i在D日的日内分钟频率下的股票价格序列为{p_{t,D,i}}, t=1,2,...,T 2. 收益率序列为{r_{t,D,i}}, 其中 $ r_{t,D,i} = \frac{p_{t,D,i}}{p_{t-1,D,i}} - 1 $ 3. 已实现收益率偏度计算公式: $ real\_skew_{D,i} = \frac{1}{T-1} \sum_{t=2}^{T} \frac{(r_{t,D,i} - \bar{r}_{D,i})^3}{real\_var_{D,i}^{3/2}} $ 其中,$\bar{r}_{D,i}$为收益率均值,$real\_var_{D,i}$为收益率方差[30][32] **因子评价**:长期表现稳定,收益预测能力较强[38][41] - **因子名称**:ret_intraday(日内收益率) **因子的构建思路**:衡量日内股价变化[31][32] **因子具体构建过程**: 1. 计算公式: $ ret\_intraday_{D,i} = \frac{p_{T,D,i}}{open_{D,i}} - 1 $ 其中,$p_{T,D,i}$为收盘价,$open_{D,i}$为开盘价[32] **因子评价**:收益预测能力有所下降,但仍具备一定选股能力[38][44] 日内价量相关因子 - **因子名称**:ratio_volumeH8(尾盘半小时成交量占比) **因子的构建思路**:通过成交量分布反映投资者行为特征[58] **因子具体构建过程**: 1. 将每天的交易时间分为8段,计算尾盘半小时成交量占全天成交量的比值[58] **因子评价**:选股能力较强,尤其在尾盘时段表现突出[66][68] - **因子名称**:corr_VP(日内价量相关性) **因子的构建思路**:通过价格与成交量的相关性确认价格形态信息[59] **因子具体构建过程**: 1. 记股票日内分钟频率下的成交量序列为{v_{t,D,i}},价格序列为{p_{t,D,i}} 2. 计算公式: $ corr\_VP_{D,i} = corr(v_{t,D,i}, p_{t,D,i}) $[59] **因子评价**:预测能力较强,但近年来表现有所下降[66][69] - **因子名称**:Amihud_illiq(Amihud非流动性因子) **因子的构建思路**:衡量单位成交额驱动下股价变化幅度[60] **因子具体构建过程**: 1. 计算公式: $ Amihud\_illiq_{D,i} = \frac{1}{T-1} \sum_{t=2}^{T} \frac{|r_{t,D,i}|}{p_{t,D,i}v_{t,D,i}} $ 其中,$r_{t,D,i}$为收益率,$p_{t,D,i}$为价格,$v_{t,D,i}$为成交量[60][61] **因子评价**:具有较高的超额收益能力,表现稳定[79][82] 盘前信息因子 - **因子名称**:ret_open2AH1(开盘价相对第一阶段集合竞价最高价的收益率) **因子的构建思路**:利用集合竞价信息提取资金试盘行为[95][98] **因子具体构建过程**: 1. 计算公式: $ ret\_open2AH1 = \frac{open_{D,i}}{A1\_high_{D,i}} - 1 $ 其中,$A1\_high_{D,i}$为第一阶段集合竞价最高价[98] **因子评价**:选股能力较强,正Alpha收益略低于负Alpha收益[103][109] 特定时段采样因子 - **因子名称**:ret_H8(尾盘半小时收益率) **因子的构建思路**:通过尾盘时段的价量信息提取多空博弈特征[129][130] **因子具体构建过程**: 1. 计算公式: $ ret\_H8 = \frac{p_{T,D,i}}{p_{T-1,D,i}} - 1 $ 其中,$p_{T,D,i}$为尾盘时段的价格[130] **因子评价**:多空收益表现优异,选股能力显著[137][141] - **因子名称**:real_skewlarge(大成交量已实现偏度) **因子的构建思路**:通过大成交量时段的收益率偏度提取主力资金行为[131][132] **因子具体构建过程**: 1. 计算公式与real_skew类似,但仅针对大成交量时段[132] **因子评价**:收益预测能力较强,表现稳定[137][141] 因子的回测效果 - **real_skew**:多空超额收益率29.27%,正Alpha收益5.87%,负Alpha收益-18.42%[50][164] - **ret_intraday**:多空超额收益率34.23%,正Alpha收益5.42%,负Alpha收益-22.87%[50][164] - **ratio_volumeH8**:多空超额收益率33.91%,正Alpha收益10.96%,负Alpha收益-17.71%[80][164] - **corr_VP**:多空超额收益率47.57%,正Alpha收益10.17%,负Alpha收益-26.09%[80][164] - **Amihud_illiq**:多空超额收益率36.22%,正Alpha收益16.22%,负Alpha收益-16.63%[80][164] - **ret_open2AH1**:多空超额收益率21.61%,正Alpha收益8.23%,负Alpha收益-11.52%[116][164] - **ret_H8**:多空超额收益率50.04%,正Alpha收益11.20%,负Alpha收益-26.38%[150][164] - **real_skewlarge**:多空超额收益率27.73%,正Alpha收益7.35%,负Alpha收益-16.20%[150][164] 因子相对中证500的超额收益表现 - **Amihud_illiq**:年化超额收益率17.28%,超额最大回撤-22.93%,超额胜率64.01%[165][167] - **ratio_volumeH8**:年化超额收益率8.64%,超额最大回撤-17.21%,超额胜率64.20%[165][167] - **ret_H8**:年化超额收益率8.14%,超额最大回撤-44.81%,超额胜率66.55%[165][167]