Workflow
高频数据因子研究系列六:信息不对称理论下的因子研究
广发证券· 2022-02-21 00:00
量化因子与构建方式 1. **因子名称**:VWPIN因子 **因子构建思路**:基于信息不对称理论,通过交易量加权的订单数量不平衡程度来衡量市场中个股反映信息不对称程度的知情交易概率[5][45]。 **因子具体构建过程**: - 首先,在第t天第i个交易区间,利用个股的主买(卖)成交笔数计算交易数量的不平衡性,公式为: $$Pin_i = \frac{|S_i - B_i|}{S_i + B_i}$$ 其中,\(S_i\)为第i个交易区间的卖单数量,\(B_i\)为第i个交易区间的买单数量[46]。 - 其次,根据第t天全天总体交易量与第i个交易区间的交易量数据,计算个股区间交易量占比,公式为: $$w_i = \frac{TradVol_i}{\sum_{i=1}^{n} TradVol_i}$$ 其中,\(TradVol_i\)为第i个交易区间的交易量[46]。 - 最后,将第i个交易时段的交易量占比权重与交易概率相乘,并对所有交易区间的加权概率求和,得到VWPIN因子,公式为: $$VWPIN = \sum_{i=1}^{n} w_i Pin_i$$[46] **因子评价**:VWPIN因子综合考虑了订单数量和交易量的不平衡性,能够更准确地反映信息不对称程度[44]。 2. **因子名称**:VWPIN平滑因子 **因子构建思路**:在VWPIN因子的基础上,对个股在周/月内的VWPIN因子数据求均值,以平滑因子波动[46]。 **因子具体构建过程**: - 对个股在周一至周五的VWPIN因子进行等权求和,取得当周周五的VWPIN平滑因子[93]。 - 同理,可以取得月频交易的VWPIN平滑因子[93]。 **因子评价**:VWPIN平滑因子在全市场、创业板范围内分档效果及净值表现均显著优于VWPIN因子[129]。 因子的回测效果 1. **VWPIN因子** - 全市场范围内,中性化因子IC均值为0.06,正IC占比76.59%,多头相对中证800年化收益率为19.07%,年化波动率16.15%,最大回撤33.71%,信息比率为1.18[5]。 - 中证500指数内,IC均值为0.04,正IC占比为66.12%,多空对冲策略年化收益率为17.61%,年化波动率为9.99%,信息比为1.76,最大回撤为18.60%[5]。 2. **VWPIN平滑因子** - 在月度调仓、周度调仓的历史回测下,VWPIN平滑因子在全市场、创业板范围内分档效果及净值表现均显著优于VWPIN因子[129]。
20211227_海通证券_金融工程专题_冯佳睿余浩淼_选股因子系列研究(七十五)——限价订单簿(LOB)的还原和应用
海通证券· 2021-12-27 00:00
量化模型与因子分析总结 量化模型与构建方式 1. **模型名称**:改进TWAP策略 **模型构建思路**:通过限价订单簿(LOB)指标预测限价单成交概率,优化传统TWAP策略的下单决策[4] **模型具体构建过程**: - 定义买卖成交概率指标: $$TradeRatio_{t_j}=BidMatchVol_{max,t_j}/BidOrderVol_{t_j}-AskMatchVol_{max,t_j}/AskOrderVol_{t_j}$$[28] - 构建4个LOB衍生预测指标: - 订单簿相对强弱: $$SheetDiff_{t_j}=(V_{B1t_j}-V_{A1t_j})/(V_{B1t_j}+V_{A1t_j})$$[41] - 成交相对强弱: $$MatchDiff_{t_{j-1,j}}=(MatchVol_{B1t_{j-1,j}}-MatchVol_{A1t_{j-1,j}})/TotVol_{B1t_{j-1,j}}$$[42] - 挂单相对强弱: $$OrderDiff_{t_{j-1,j}}=(OrderVol_{B1t_{j-1,j}}-OrderVol_{A1t_{j-1,j}})/TotVol_{B1t_{j-1,j}}$$[43] - 撤单相对强弱: $$CancelDiff_{t_{j-1,j}}=(CancelVol_{B1t_{j-1,j}}-CancelVol_{A1t_{j-1,j}})/TotVol_{B1t_{j-1,j}}$$[43] - 建立回归模型预测买卖成交概率,指导下单决策[46] **模型评价**:对于京东方A和证券ETF效果显著,但对其他证券改进有限[57] 2. **模型名称**:模拟撮合系统 **模型构建思路**:利用逐笔数据还原盘口行情,模拟真实交易撮合过程[20] **模型具体构建过程**: - 基于逐笔委托和逐笔成交数据还原0.01秒级订单簿[18] - 跟踪虚拟订单在委托队列中的优先级变化[21] - 根据后续成交/撤单信息判断虚拟订单成交情况[21] **模型评价**:能更准确估计交易成本,但对大额订单冲击效果有限[22] 量化因子与构建方式 1. **因子名称**:买入意愿因子 **因子构建思路**:结合盘口变动和主买主卖数据衡量开盘后买入强度[60] **因子具体构建过程**: - 原始构建方法(基于快照数据): - 计算委买增额与委卖增额差值[61] - 加上主买成交与主卖成交的净额[61] - 除以总成交金额得到占比[60] - LOB分解方法: - 定义委买增量价格集合: $$Set_{bid}=\{B_i|([B_{1,t},B_{1,t+3}],B_{1,t+3}>B_{1,t})\}$$[65] - 计算净挂单金额、净撤单金额、净成交金额和净被动买入金额[68] - 等权复合四个分量得到最终因子[68] **因子评价**:两种构建方法选股效果相当,但LOB方法提供了更多分解维度[70] 2. **因子名称**:LOB衍生细分因子 **因子构建思路**:将买入意愿因子分解为四个独立成分[72] **因子具体构建过程**: - 开盘后净挂单占比:价格集合内买卖挂单净额/总成交[65][68] - 开盘后净撤单占比:价格集合内买卖撤单净额/总成交[65][68] - 开盘后净成交占比:价格集合内买卖成交净额/总成交[65][68] - 开盘后被动净买入占比:被动买卖成交净额/总成交[68] **因子评价**:被动净买入占比IC最高(-0.027),净撤单占比效果最弱(0.009)[73] 模型的回测效果 1. **改进TWAP策略**: - 京东方A(1000万):相对市价单超额收益0.016%(买入)/0.010%(卖出),胜率87.32%/69.01%[57] - 证券ETF(200万):相对市价单超额收益0.006%(买入)/0.004%(卖出),胜率67.61%/61.97%[57] - 中国平安(1亿):相对市价单超额收益-0.003%(买入)/-0.010%(卖出),胜率45.07%/21.13%[57] 2. **限价单TWAP策略**: - 京东方A(1000万):日均超额收益0.005%(买入)/0.007%(卖出),胜率59.15%/71.83%[26] - 证券ETF(200万):日均超额收益0.008%(买入)/0.009%(卖出),胜率63.38%/74.65%[26] - 强制成交比例普遍在80%以上[26] 因子的回测效果 1. **买入意愿因子**: - IC=0.034,IC-IR=4.006,多空月均收益1.25%[70] - 正交+IC加权复合后IC提升至0.034,IC-IR提升至4.023[75] 2. **LOB细分因子**: - 被动净买入占比:IC=-0.027,多空月均收益1.38%[73] - 净成交占比:IC=-0.022,多空月均收益1.37%[73] - 净挂单占比:IC=0.014,多空月均收益0.50%[73] - 净撤单占比:IC=0.009,多空月均收益0.32%[73]
20211107_开源证券_金融工程专题_从北向资金持仓行为到股票关联网络
开源证券· 2021-11-07 00:00
量化模型与构建方式 1. **模型名称**:Traction-NS 因子 **模型构建思路**:通过外资券商持仓数据构建股票关联网络,利用关联网络刻画股票涨跌之间的牵引关系,预期关联股票的涨跌幅会对目标股票产生锚定效应,进而构建牵引因子[5][28] **模型具体构建过程**: - 每月末,按照40%留存比例,对外资券商关联网络进行稀疏处理[29] - 取外资券商持仓股票过去20日累计涨跌幅,计算截面中位数作为市场收益水平,记作med[29] - 对于关联网络中的节点股票A,取其所有关联股票过去20日涨跌幅数据,记作向量chg_A[29] - 计算chg_A - med,作为股票A关联股票的alpha收益,记作向量alpha_A[29] - 取股票A与所有关联股票之间的关联度,记作向量K_A[29] - 利用关联度向量K_A与向量alpha_A,得到股票A所有关联股票的alpha锚定值,记作exp_A[29] - 计算exp_A的均值,作为股票A的alpha锚定值均值,得到股票A的原始因子,记作exp_ave_A[29] - 对所有股票的exp_ave指标,做横截面回归,剔除股票自身alpha和行业因素,得到关联网络牵引因子Traction-NS[29] **模型评价**:Traction-NS因子表现稳健,年化收益率达到23.75%,年化IR为3.45,最大回撤为5.33%,月度胜率在83%左右[5][38] 模型的回测效果 1. **Traction-NS模型**,年化收益率23.75%,年化IR 3.45,最大回撤5.33%,月度胜率83%[5][38] 2. **Traction-NS模型**,在中证1000上年化收益21.02%,年化IR 2.89,最大回撤6.52%[6][40] 3. **Traction-NS模型**,在中证500上年化收益15.7%,年化IR 2.18,最大回撤6.62%[6][40] 4. **Traction-NS模型**,在沪深300上年化收益13.96%,年化IR 1.83,最大回撤9.69%[6][40] 量化因子与构建方式 1. **因子名称**:关联度指标 **因子的构建思路**:通过外资券商持仓数据定义股票间的关联强度,最终加总得到两只股票的关联度指标[4][24] **因子具体构建过程**: - 取外资券商A共同持有的股票a与股票b持仓市值数据,记作H_a、H_b,以及相应的流通市值数据,记作MV_a、MV_b[27] - 计算H_a / MV_a,记作I_a,股票b记作I_b[27] - 定义外资券商A共同持仓股票a与股票b的关联强度指标为:$$J_{ab}=min(I_a, I_b)$$[27] - 将所有共同持仓股票a与股票b的外资券商得到的关联度指标求和,得到股票a与股票b的关联度指标Kab[27] **因子评价**:关联度指标能够有效衡量股票间的关联强度,为后续牵引因子的构建提供基础[4][24] 因子的回测效果 1. **关联度指标**,在40%留存比例下,因子RankIC达到峰值6.09%[33] 2. **关联度指标**,在10%留存比例下,因子RankIC为4%[33] 3. **关联度指标**,在50%留存比例下,因子RankIC为6.07%[33]
20211002_开源证券_金融工程专题_从基金持仓行为到股票关联网络--金融工程专题_魏建榕,王志豪
开源证券· 2021-10-02 00:00
量化模型与构建方式 1. 模型名称:关联网络牵引因子 Traction20d - **模型构建思路**:利用股票关联网络刻画股票涨跌之间的牵引关系,通过关联股票的涨跌幅来预测目标股票的涨幅[5] - **模型具体构建过程**: 1. 取所有基金持仓股票过去20日累计涨跌幅,并计算截面中位数,作为市场收益水平,记作med[37] 2. 对于关联网络中节点股票A,取其所有关联股票过去20日涨跌幅数据,记作向量chg_A[37] 3. 计算chg_A - med,作为股票A关联股票的alpha收益,记作向量alpha_A[37] 4. 取股票A与所有关联股票之间的关联度,记作向量K_A[37] 5. 利用关联度向量K_A与向量alpha_A,得到股票A所有关联股票的alpha锚定值,记作exp_A[37] 6. 计算exp_A的均值,作为股票A的alpha锚定值均值,得到股票A的原始因子,记作exp_ave_A[37] 7. 对所有股票的exp_ave指标,做横截面回归,剔除股票自身alpha和行业因素,得到关联网络牵引因子Traction20d[37] - **模型评价**:整体表现稳定,因子与常见因子相关性较低[5][6][36] 模型的回测效果 - **Traction20d模型**: - RankIC:3.84%[5] - RankICIR:2.60[5] - 多头组年化收益:17.1%[5] - 多头换手率:69.5%[5] - 收益波动比:0.61[5] - 多空组合年化收益率:14.3%[5] - 年化IR:2.6[5] - 最大回撤:6.06%[5] - 整体胜率:72.6%[5] 量化因子与构建方式 1. 因子名称:关联度指标 - **因子的构建思路**:通过基金共同持仓数据,构建股票间的关联度指标,刻画股票关联网络[23] - **因子具体构建过程**: 1. 取基金持仓股票市值数据,用持仓市值与成交额的比值,衡量基金对个股的影响力强弱(影响周期)[23] 2. 取同一基金在两只股票上的影响力最小值,作为二者由同一基金持仓带来的关联强度[23] 3. 两只股票在所有持仓基金上的关联强度加总,得到两只股票的关联度指标[23] 4. 定义A基金共同持仓股票a与股票b的关联度指标为:$J_{ab} = \min(I_a, I_b)$[28] 5. 将所有共同持仓股票a与股票b的基金得到的关联度指标求和,得到股票a与股票b的关联度指标$K_{ab}$[28] - **因子评价**:同行业股票间的关联度指标均值高于不同行业股票间的关联度指标均值[29] 因子的回测效果 - **关联度指标**: - 最高组R方均值:16.96%[31] - 最低组R方均值:14.92%[31] - 基金共同持仓R方均值:15.05%[21] - 基金持仓R方均值:14.07%[21]
独家量价因子的高频测试
开源证券· 2021-09-24 16:04
量化因子与构建方式 - **主动买卖因子** - 构建思路:逐日计算大单和中单的主动买卖因子以及小单的主动买卖因子,分别取高收益日和低收益日的因子均值[36] - 公式: $ ACT正向,𝑡 = \frac{主动买入金额(大单 + 中单) − 主动卖出金额(大单 + 中单)}{主动买入金额(大单 + 中单) + 主动卖出金额(大单 + 中单)} $ $ ACT负向,𝑡 = \frac{主动买入金额(小单) − 主动卖出金额(小单)}{主动买入金额(小单) + 主动卖出金额(小单)} $ - 评价:在高频测试中表现优异,尤其在多空端收益波动比表现较好[4][5] - **聪明钱因子** - 构建思路:基于分钟数据,筛选成交量累积占比前20%的分钟作为聪明钱交易,计算其成交量加权平均价与全市场成交量加权平均价的比值[34] - 公式: $ Q = \frac{VWAPsmart}{VWAPall} $ - 评价:在高频测试中多空端表现优异[4][5] - **理想振幅因子** - 构建思路:基于过去N日数据,计算高价振幅与低价振幅的差值[36] - 公式: $ V(𝜆) = Vhigh(𝜆) − Vlow(𝜆) $ - 评价:在高频测试中多空端表现优异[4][5] - **APM因子** - 构建思路:基于上午与下午的收益率残差差异,构造统计量并剔除动量因子影响[34] - 公式: $ stat = \frac{\mu(𝛿𝑡)}{\sigma(𝛿𝑡)/\sqrt{N}} $ - 评价:在高频测试中表现稳定[4][5] - **理想反转因子** - 构建思路:基于单笔成交金额高低的交易日涨跌幅差值[34] - 公式: $ M = Mhigh − Mlow $ - 评价:在高频测试中表现稳定[4][5] - **长端动量因子** - 构建思路:基于过去160日数据,选择振幅较低的70%交易日涨跌幅加总[36] - 评价:在高频测试中多头端表现优异[5] - **大单资金流因子** - 构建思路:基于大单买卖额的强度,剔除过去20日涨跌幅的影响[36] - 评价:在高频测试中多头端和多空端均表现优异[5] - **小单资金流因子** - 构建思路:基于小单买卖额的强度,剔除过去20日涨跌幅的影响[36] - 评价:在高频测试中表现稳定[5] - **复合因子** - 构建思路:基于主动买卖、理想振幅、APM、理想反转、大单资金流和长端动量因子,滚动回看12期,以最大化ICIR为目标计算权重[28][29] - 评价:在多头端及多空端均显著优于原始因子[6][28] --- 因子的回测效果 周频下 - **多空收益波动比** - 主动买卖:2.08[22] - 聪明钱:2.49[22] - 理想振幅:2.92[27] - APM:1.99[23] - 理想反转:1.98[23] - 长端动量:1.67[27] - 大单资金流:2.95[28] - 小单资金流:1.88[28] 双周频下 - **年化收益率** - 主动买卖:15.82%[18] - 聪明钱:23.34%[18] - 理想振幅:27.69%[18] - APM:10.70%[18] - 理想反转:17.87%[18] - 长端动量:22.54%[18] - 大单资金流:19.04%[18] - 小单资金流:13.36%[18] 月频下 - **年化收益率** - 主动买卖:13.47%[21] - 聪明钱:22.38%[21] - 理想振幅:22.72%[21] - APM:10.01%[21] - 理想反转:16.00%[21] - 长端动量:19.17%[21] - 大单资金流:15.32%[21] - 小单资金流:4.47%[21]
分析师目标价的 Alpha 信息
开源证券· 2021-09-14 08:08
量化因子与构建方式 - **WTR因子** - **构建思路**:基于分析师目标价格预测,考虑报告发布时的价格而非月末价格,赋予目标价格权重,权重由股票价格走势是否验证目标价格决定[79][80][83] - **公式**: $ WTR = \sum{\frac{P_{i}^{e}}{P_{i}^{0}}} = \frac{\sum P_{i}^{e} \times P / P_{i}^{0}}{P} = \sum{\frac{P_{i}^{e}}{P}} \omega_{i} = TR \times W $ 其中,$P_{i}^{0}$为机构发布价格预测前一个交易日的收盘价,$P_{i}^{e}$为机构发布的股票目标价格,$P$为月末计算因子时的股票收盘价,$\omega_{i}$为权重[80] - **评价**:因子收益主要集中在多头端,说明高预期收益率的股票表现更优,分析师对个股价格预测具有选股能力[84] - **MTR因子** - **构建思路**:基于WTR因子的同比变化,反映分析师预期调整对市场的短期冲击[88][89] - **公式**: $ MTR = diff(WTR) $[88] - **评价**:空头端收益显著,分析师下调预期收益率的负面信息更强烈,而上调预期收益率对未来收益率的预测敏感性较低[91] - **CTR因子** - **构建思路**:结合WTR因子和分析师关注度因子C的排序值,反映股票热度差异性[94] - **公式**: $ CTR = Rank(WTR) \times Rank(C) $ 其中,$Rank(WTR)$为WTR因子的排序值,$Rank(C)$为关注度因子的排序值[94] - **评价**:多头收益显著,关注度较高的股票存在溢价,尤其在市场风格切换时表现偏弱[98] - **TR_ICIR因子** - **构建思路**:将WTR、MTR和CTR因子通过ICIR加权合成,提升因子稳定性[99][100] - **评价**:合成因子在选股效果和稳定性上优于原始因子[100] --- 因子的回测效果 **WTR因子** - **ICIR**:N=20时为1.52,N=40时为1.41,N=60时为1.346,N=90时为1.264[85][86] - **IR**:N=20时为1.265,N=40时为1.047,N=60时为0.996,N=90时为0.997[85][86] - **年化收益**:N=20时为14.4%,N=40时为14.2%,N=60时为14.1%,N=90时为14.7%[85][86] - **夏普比率**:N=20时为0.522,N=40时为0.517,N=60时为0.515,N=90时为0.538[85][86] - **月度胜率**:N=20时为69.6%,N=40时为66.7%,N=60时为66.7%,N=90时为62.3%[85][86] **MTR因子** - **ICIR**:N=20时为2.022,N=40时为1.87,N=60时为1.808,N=90时为1.933[92][93] - **IR**:N=20时为1.772,N=40时为1.486,N=60时为1.537,N=90时为1.616[92][93] - **年化收益**:N=20时为12.3%,N=40时为11.7%,N=60时为11.5%,N=90时为11.7%[92][93] - **夏普比率**:N=20时为0.456,N=40时为0.434,N=60时为0.426,N=90时为0.43[92][93] - **月度胜率**:N=20时为70.3%,N=40时为68.1%,N=60时为68.1%,N=90时为68.8%[92][93] **CTR因子** - **ICIR**:N=20时为1.061,N=40时为0.973,N=60时为0.919,N=90时为0.823[99] - **IR**:N=20时为1.233,N=40时为1.108,N=60时为1.124,N=90时为0.967[99] - **年化收益**:N=20时为12.5%,N=40时为13.5%,N=60时为14.4%,N=90时为14.4%[99] - **夏普比率**:N=20时为0.469,N=40时为0.506,N=60时为0.546,N=90时为0.549[99] - **月度胜率**:N=20时为62.3%,N=40时为64.5%,N=60时为67.4%,N=90时为60.9%[99] **TR_ICIR因子** - **ICIR**:1.533[100] - **IR**:1.401[100] - **年化收益**:14.9%[100] - **夏普比率**:0.545[100] - **月度胜率**:67.4%[100]
多因子ALPHA系列报告之(四十一):高频价量数据的因子化方法
广发证券· 2021-07-12 00:00
量化因子与构建方式 日内价格相关因子 - **因子名称**:real_skew(已实现偏度) **因子的构建思路**:通过收益率的高阶统计量提取日内价格信息[28][30] **因子具体构建过程**: 1. 设个股i在D日的日内分钟频率下的股票价格序列为{p_{t,D,i}}, t=1,2,...,T 2. 收益率序列为{r_{t,D,i}}, 其中 $ r_{t,D,i} = \frac{p_{t,D,i}}{p_{t-1,D,i}} - 1 $ 3. 已实现收益率偏度计算公式: $ real\_skew_{D,i} = \frac{1}{T-1} \sum_{t=2}^{T} \frac{(r_{t,D,i} - \bar{r}_{D,i})^3}{real\_var_{D,i}^{3/2}} $ 其中,$\bar{r}_{D,i}$为收益率均值,$real\_var_{D,i}$为收益率方差[30][32] **因子评价**:长期表现稳定,收益预测能力较强[38][41] - **因子名称**:ret_intraday(日内收益率) **因子的构建思路**:衡量日内股价变化[31][32] **因子具体构建过程**: 1. 计算公式: $ ret\_intraday_{D,i} = \frac{p_{T,D,i}}{open_{D,i}} - 1 $ 其中,$p_{T,D,i}$为收盘价,$open_{D,i}$为开盘价[32] **因子评价**:收益预测能力有所下降,但仍具备一定选股能力[38][44] 日内价量相关因子 - **因子名称**:ratio_volumeH8(尾盘半小时成交量占比) **因子的构建思路**:通过成交量分布反映投资者行为特征[58] **因子具体构建过程**: 1. 将每天的交易时间分为8段,计算尾盘半小时成交量占全天成交量的比值[58] **因子评价**:选股能力较强,尤其在尾盘时段表现突出[66][68] - **因子名称**:corr_VP(日内价量相关性) **因子的构建思路**:通过价格与成交量的相关性确认价格形态信息[59] **因子具体构建过程**: 1. 记股票日内分钟频率下的成交量序列为{v_{t,D,i}},价格序列为{p_{t,D,i}} 2. 计算公式: $ corr\_VP_{D,i} = corr(v_{t,D,i}, p_{t,D,i}) $[59] **因子评价**:预测能力较强,但近年来表现有所下降[66][69] - **因子名称**:Amihud_illiq(Amihud非流动性因子) **因子的构建思路**:衡量单位成交额驱动下股价变化幅度[60] **因子具体构建过程**: 1. 计算公式: $ Amihud\_illiq_{D,i} = \frac{1}{T-1} \sum_{t=2}^{T} \frac{|r_{t,D,i}|}{p_{t,D,i}v_{t,D,i}} $ 其中,$r_{t,D,i}$为收益率,$p_{t,D,i}$为价格,$v_{t,D,i}$为成交量[60][61] **因子评价**:具有较高的超额收益能力,表现稳定[79][82] 盘前信息因子 - **因子名称**:ret_open2AH1(开盘价相对第一阶段集合竞价最高价的收益率) **因子的构建思路**:利用集合竞价信息提取资金试盘行为[95][98] **因子具体构建过程**: 1. 计算公式: $ ret\_open2AH1 = \frac{open_{D,i}}{A1\_high_{D,i}} - 1 $ 其中,$A1\_high_{D,i}$为第一阶段集合竞价最高价[98] **因子评价**:选股能力较强,正Alpha收益略低于负Alpha收益[103][109] 特定时段采样因子 - **因子名称**:ret_H8(尾盘半小时收益率) **因子的构建思路**:通过尾盘时段的价量信息提取多空博弈特征[129][130] **因子具体构建过程**: 1. 计算公式: $ ret\_H8 = \frac{p_{T,D,i}}{p_{T-1,D,i}} - 1 $ 其中,$p_{T,D,i}$为尾盘时段的价格[130] **因子评价**:多空收益表现优异,选股能力显著[137][141] - **因子名称**:real_skewlarge(大成交量已实现偏度) **因子的构建思路**:通过大成交量时段的收益率偏度提取主力资金行为[131][132] **因子具体构建过程**: 1. 计算公式与real_skew类似,但仅针对大成交量时段[132] **因子评价**:收益预测能力较强,表现稳定[137][141] 因子的回测效果 - **real_skew**:多空超额收益率29.27%,正Alpha收益5.87%,负Alpha收益-18.42%[50][164] - **ret_intraday**:多空超额收益率34.23%,正Alpha收益5.42%,负Alpha收益-22.87%[50][164] - **ratio_volumeH8**:多空超额收益率33.91%,正Alpha收益10.96%,负Alpha收益-17.71%[80][164] - **corr_VP**:多空超额收益率47.57%,正Alpha收益10.17%,负Alpha收益-26.09%[80][164] - **Amihud_illiq**:多空超额收益率36.22%,正Alpha收益16.22%,负Alpha收益-16.63%[80][164] - **ret_open2AH1**:多空超额收益率21.61%,正Alpha收益8.23%,负Alpha收益-11.52%[116][164] - **ret_H8**:多空超额收益率50.04%,正Alpha收益11.20%,负Alpha收益-26.38%[150][164] - **real_skewlarge**:多空超额收益率27.73%,正Alpha收益7.35%,负Alpha收益-16.20%[150][164] 因子相对中证500的超额收益表现 - **Amihud_illiq**:年化超额收益率17.28%,超额最大回撤-22.93%,超额胜率64.01%[165][167] - **ratio_volumeH8**:年化超额收益率8.64%,超额最大回撤-17.21%,超额胜率64.20%[165][167] - **ret_H8**:年化超额收益率8.14%,超额最大回撤-44.81%,超额胜率66.55%[165][167]
20210707_开源证券_金融工程专题_业绩超预期Plus组合的构建--开源量化评论(25)_魏建榕,胡亮勇
开源证券· 2021-07-07 00:00
量化模型与构建方式 标准化预期外盈余因子(SUE) 1. **因子名称**:标准化预期外盈余因子(SUE) 2. **因子的构建思路**:通过比较实际净利润与预期净利润的差异,并标准化该差异,来衡量公司业绩的超预期程度 3. **因子具体构建过程**: - 公式:$$S U E={\frac{R_{t}-E_{t}}{\sigma(\mathrm{R_{t}-E_{t})})}}$$ - 公式中,$R_{t}$表示财报披露的净利润水平,$E_{t}$表示预期的净利润水平,$\sigma(\mathrm{R_{t}-E_{t})}$表示预测偏差的波动率水平[30] 4. **因子评价**:基于个股财报数据和分析师一致预期数据构建的SUE因子在不同报告样本池中均具有良好的表现,其中业绩预告对应的多头表现最佳,多报告融合对应的多空对冲夏普比率最高[41] 预期外百分比因子(PCT) 1. **因子名称**:预期外百分比因子(PCT) 2. **因子的构建思路**:通过比较实际净利润与预期净利润的差异,并标准化该差异,来衡量公司业绩的超预期程度 3. **因子具体构建过程**: - 公式:$$P C T={\frac{R_{t}-E_{t}}{a b s(E_{t})}}\,,\;\;E_{t}\neq0$$ - 公式中,$R_{t}$表示财报披露的净利润水平,$E_{t}$表示预期的净利润水平,$a b s(E_{t})$表示预期净利润的绝对值[42] 4. **因子评价**:无论是SUE因子,还是PCT因子,在测试区间均表现了优异的选股能力[49] 超预期收益因子(OER) 1. **因子名称**:超预期收益因子(OER) 2. **因子的构建思路**:通过计算公告日前后一个交易日的超额收益之和,来衡量公司业绩的超预期程度 3. **因子具体构建过程**: - 公式:OER = 公告前一个交易日收益 + 公告后一个交易日收益 - 公式中,公告前一个交易日收益用来表征知情交易者的相关信息,后一个交易日收益用来表征市场反应情况[62] 4. **因子评价**:2016年之前,OER因子在超预期股票池内的区分度不显著,但之后开始逐渐有了稳定的区分效果[66] 跳空因子(JUMP) 1. **因子名称**:跳空因子(JUMP) 2. **因子的构建思路**:通过计算公告后第二个交易日的跳空收益率,来衡量公司业绩的超预期程度 3. **因子具体构建过程**: - 公式:JUMP = 股票跳空收益率 - 指数跳空收益率 - 公式中,股票跳空收益率为公告后第二个交易日最低价与前一个交易日收盘价的差值,指数跳空收益率为中证500指数的跳空收益率[73] 4. **因子评价**:JUMP因子在2017年之后开始有显著的超额收益[76] 理想反转因子 1. **因子名称**:理想反转因子 2. **因子的构建思路**:通过观察公告日后7个交易日的累计收益,来衡量公司业绩的超预期程度 3. **因子具体构建过程**:具体构建方法参见开源金融工程团队研究报告《A股反转之力的微观来源》[74] 4. **因子评价**:理想反转因子在全区间内对超预期股票池具有显著的分层能力[78] 大小单残差因子 1. **因子名称**:大小单残差因子 2. **因子的构建思路**:通过观察个股资金流的强弱关系,来衡量公司业绩的超预期程度 3. **因子具体构建过程**:具体构建方法参见开源金融工程团队研究报告《大单与小单资金流的alpha能力》[78] 4. **因子评价**:小单残差因子比大单残差因子的效果表现更好[79][80] 因子的回测效果 1. **SUE因子** - 业绩预告样本池:多头年化收益率26.43%,夏普比率0.81,多空对冲年化收益率17.93%,夏普比率2.24[32] - 定期报告样本池:多头年化收益率18.09%,夏普比率0.63,多空对冲年化收益率9.49%,夏普比率2.35[34] - 多报告融合样本池:多头年化收益率21.56%,夏普比率0.72,多空对冲年化收益率14.15%,夏普比率3.46[39] 2. **PCT因子** - 业绩预告样本池:多头年化收益率25.78%,夏普比率0.79,多空对冲年化收益率22.81%,夏普比率2.93[43] - 定期报告样本池:多头年化收益率17.31%,夏普比率0.58,多空对冲年化收益率10.81%,夏普比率2.10[43] - 多报告融合样本池:多头年化收益率17.23%,夏普比率0.72,多空对冲年化收益率14.10%,夏普比率2.68[46] 3. **超预期30组合** - 多头收益率43.13%,夏普比率1.53,月度胜率约70% - 对冲基准收益31.08%,夏普比率3.6,月度胜率超80%[90][93]
20210612-华西证券-华西证券分析师目标价选股策略:Black-Litterman模型研究系列之三
华西证券· 2021-06-12 00:00
量化模型与构建方式 Black-Litterman模型 - **模型名称**:Black-Litterman模型 - **模型构建思路**:通过结合分析师目标价与股票当前价格计算目标收益率,生成主观观点矩阵和收益向量,并利用BL模型优化股票权重[1][2][7] - **模型具体构建过程**: 1. **均衡收益率计算**:资产收益率的均值公式为 $ \mu_{p}=[(\tau\Sigma)^{-1}+P^{T}\Omega^{-1}P]^{-1}[(\tau\Sigma)^{-1}\pi+P^{T}\Omega^{-1}Q] $ 其中,$\tau$为主观观点权重,$\Sigma$为资产收益率协方差矩阵,$\pi$为均衡收益率向量,$P$为主观观点矩阵,$\Omega$为观点信心矩阵,$Q$为主观观点收益向量[7][8] 2. **协方差矩阵计算**:资产收益率的协方差矩阵公式为 $ \Sigma_{p}^{*}=\Sigma+[(\tau\Sigma)^{-1}+P^{T}\Omega^{-1}P]^{-1} $[7] 3. **权重计算**:当无约束条件时,股票权重公式为 $ w=(\delta\Sigma_{p}^{*})^{-1}\mu_{p} $ 其中,$\delta$为风险厌恶系数[8] 4. **主观观点收益向量**:通过行业内目标收益率排名靠前和靠后的股票构造多空组合,计算行业内的预期收益率,公式为 $ Q=P \cdot TRV $ 其中,$TRV$为目标收益率向量[12][14][15] 5. **主观观点信心矩阵**:通过分析师目标价的标准差计算观点信心矩阵,公式为 $ \Omega=P Z P^{T} $ 其中,$Z$为目标收益率的标准差矩阵[18][19] 6. **选股范围与权重分配**:基于基准指数成分股,权重根据目标收益率排名调整,负权重股票剔除后形成组合[22][23] - **模型评价**:BL模型能够有效结合分析师目标价生成主观观点,并优化权重分配,选股效果优于市值加权、等权加权及直接排序法[3][25][35] --- 模型的回测效果 沪深300指数 - **全量组合累计收益率**:186.52%[26] - **正向组合累计收益率**:215.15%[26] - **基准指数累计收益率**:49.11%[26] - **全量组合超额收益**:137.41%[26] - **正向组合超额收益**:166.05%[26] - **年度收益表现**: | 年度 | 全量组合超额收益 | 正向组合超额收益 | | --- | --- | --- | | 2010 | 14.59% | 14.79% | | 2011 | 6.31% | 6.89% | | 2012 | 4.62% | 4.88% | | 2013 | 5.22% | 5.91% | | 2014 | -11.17% | -11.97% | | 2015 | 28.73% | 31.55% | | 2016 | -2.87% | -2.65% | | 2017 | -4.89% | -2.00% | | 2018 | 5.36% | 5.78% | | 2019 | 17.21% | 20.46% | | 2020 | 0.40% | 1.51% | | 2021年5月 | 4.07% | 4.10% |[31] 中证500指数 - **全量组合累计收益率**:354.89%[40] - **正向组合累计收益率**:469.14%[40] - **基准指数累计收益率**:50.02%[40] - **全量组合超额收益**:304.87%[40] - **正向组合超额收益**:419.12%[40] - **年度收益表现**: | 年度 | 全量组合超额收益 | 正向组合超额收益 | | --- | --- | --- | | 2010 | 19.16% | 24.72% | | 2011 | 12.16% | 13.95% | | 2012 | 11.67% | 16.08% | | 2013 | 11.35% | 12.66% | | 2014 | -20.75% | -23.19% | | 2015 | 60.81% | 71.37% | | 2016 | 6.22% | 7.75% | | 2017 | 1.19% | 0.60% | | 2018 | 1.58% | 1.37% | | 2019 | 11.44% | 14.74% | | 2020 | 23.41% | 32.02% | | 2021年5月 | 1.36% | 0.44% |[45] --- 模型对比与敏感性分析 对比其他选股方法 - **市值加权与等权加权**:BL模型权重分配效果优于市值加权和等权加权组合[35][38] - **直接排序法**:BL模型选股效果优于目标收益率直接排序法,累计收益率更高[47][48] 主观观点权重敏感性 - **参数变化**:τ值分别设置为0.05、0.1、0.2、0.3,结果显示τ值越大,组合收益率越高,但变化幅度较小,参数较为稳定[54][55][58]
深度学习研究报告之八:基本面因子模型的深度学习增强
广发证券· 2021-06-07 00:00
量化模型与构建方式 1. **模型名称:基本面多因子选股模型** - **模型构建思路**:基于盈利、成长和估值三大类因子,筛选出基本面优秀的股票[14] - **模型具体构建过程**: 1. 盈利因子:使用净资产收益率(ROE)筛选全市场前25%的股票,毛利率(GPM)筛选前50%的股票[20] 2. 成长因子:使用营业收入同比增长率(YoyOr)筛选前25%的股票,资产同比增长率(YoyAsset)筛选前50%的股票[20] 3. 估值因子:使用市现率倒数(CFP)筛选前70%的股票[20] 4. 最终筛选同时满足以上5个条件的股票,构建组合[20] - **模型评价**:基本面模型通过财务因子筛选中长期看好的股票,具有较低的换手率[8] 2. **模型名称:深度学习选股模型** - **模型构建思路**:通过深度学习模型提取股票特征,预测股票未来走势[30] - **模型具体构建过程**: 1. 输入层:包含156个股票特征,包括传统选股因子(如估值因子、规模因子等)和价量技术指标(如MACD、KDJ等)[30] 2. 隐藏层:5层隐藏层,节点数分别为512、200、200、200、128[33] 3. 输出层:3个节点,分别表示股票未来上涨、平盘、下跌的概率,使用softmax函数计算概率[31] 4. 模型打分:使用股票上涨概率与下跌概率之差作为模型打分[31] - **模型评价**:深度学习模型基于价量信息筛选短期看好的股票,具有较高的换手率[8] 3. **模型名称:IC加权模型** - **模型构建思路**:将基本面因子和深度学习因子加权,按照因子加权打分进行选股[52] - **模型具体构建过程**: 1. 计算大类因子打分,每期根据大类因子过去120天IC的均值加权获得综合打分[52] 2. 选出与基本面模型和深度学习模型持股数量相当的股票组合,月度调仓[52] - **模型评价**:IC加权模型通过因子加权组合,筛选综合打分靠前的股票,但可能在某些因子上暴露不足[59] 4. **模型名称:增强模型** - **模型构建思路**:结合基本面模型和深度学习模型,先筛选基本面优秀的股票,再通过深度学习模型进一步筛选[61] - **模型具体构建过程**: 1. 第一步:使用基本面模型筛选初选股票池,筛选条件放宽,初选股票池中位数248只[62] 2. 第二步:使用深度学习模型对初选股票池进行分组,选择打分最高的一组构建组合,平均持股数量83只[63] - **模型评价**:增强模型结合了基本面模型和深度学习模型的优势,既筛选中长期看好的股票,又筛选短期看好的股票,换手率较低[124] 模型的回测效果 1. **基本面多因子选股模型** - 年化收益率:18.12%[28] - 年化超额收益率:14.07%[28] - 年化换手率倍数:3.51[83] 2. **深度学习选股模型** - 年化收益率:24.70%[38] - 年化超额收益率:20.65%[38] - 年化换手率倍数:10.89[83] 3. **IC加权模型** - 年化收益率:24.62%[58] - 年化超额收益率:20.69%[58] - 年化换手率倍数:10.04[83] 4. **增强模型** - 年化收益率:28.58%(千分之三费率)[71] - 年化超额收益率:24.29%(千分之三费率)[79] - 年化换手率倍数:8.83[83] - 年化收益率:25.22%(千分之五费率)[91] - 年化超额收益率:21.00%(千分之五费率)[96] - 年化收益率:27.58%(沪深300基准)[107] - 年化超额收益率:22.23%(沪深300基准)[113] 量化因子与构建方式 1. **因子名称:盈利因子** - **因子构建思路**:通过净资产收益率(ROE)和毛利率(GPM)衡量公司的盈利能力[17] - **因子具体构建过程**: 1. ROE:净资产收益率,行业中性、市值中性[20] 2. GPM:毛利率,行业中性、市值中性[20] - **因子评价**:盈利因子反映公司过去的盈利能力,是基本面分析的核心指标之一[14] 2. **因子名称:成长因子** - **因子构建思路**:通过营业收入同比增长率(YoyOr)和资产同比增长率(YoyAsset)衡量公司的成长性[17] - **因子具体构建过程**: 1. YoyOr:营业收入同比增长率,行业中性、市值中性[20] 2. YoyAsset:资产同比增长率,行业中性、市值中性[20] - **因子评价**:成长因子反映公司未来的盈利能力,是基本面分析的重要指标[14] 3. **因子名称:估值因子** - **因子构建思路**:通过市现率倒数(CFP)衡量公司的估值水平[17] - **因子具体构建过程**: 1. CFP:市现率倒数,行业中性、市值中性[20] - **因子评价**:估值因子帮助判断股票是否被低估,是基本面分析的关键指标[14] 因子的回测效果 1. **盈利因子** - 年化收益率:18.12%(基本面模型)[28] - 年化超额收益率:14.07%(基本面模型)[28] 2. **成长因子** - 年化收益率:18.12%(基本面模型)[28] - 年化超额收益率:14.07%(基本面模型)[28] 3. **估值因子** - 年化收益率:18.12%(基本面模型)[28] - 年化超额收益率:14.07%(基本面模型)[28]