20210602_开源证券_金融工程专题_大单与小单资金流的alpha能力--——市场微观结构研究系列(12)_魏建榕,高鹏
开源证券· 2021-06-02 00:00
量化因子与构建方式 资金流因子 - **因子名称**:大单资金流因子与小单资金流因子 - **因子的构建思路**:通过成交额标准化计算资金流入强度,反映股票微观供求信息,区分大单和小单资金流的选股能力[4][16][21] - **因子具体构建过程**: 1. 按照成交金额划分资金流类型:超大单(>100万元)、大单(20-100万元)、中单(4-20万元)、小单(<4万元)[14] 2. 使用成交额标准化公式构造因子: $$S_{1} = \frac{\sum_{t-T}^{t} (buy_{t} - sell_{t})}{\sum_{t-T}^{t} Amount_{t}}$$ 其中,分母为过去T个交易日个股的成交额之和[22] 3. 提出两种改进标准化方法: - "资金流买入金额+卖出金额"标准化 $$S_{2} = \frac{\sum_{t-T}^{t} (buy_{t} - sell_{t})}{\sum_{t-T}^{t} (buy_{t} + sell_{t})}$$ - "资金净流入金额绝对值"标准化 $$S_{3} = \frac{\sum_{t-T}^{t} (buy_{t} - sell_{t})}{\sum_{t-T}^{t} |buy_{t} - sell_{t}|}$$[22] - **因子评价**:大单资金流因子具有稳定的正向选股效果,小单资金流因子具有稳定的负向选股效果[4][16] 残差资金流强度因子 - **因子名称**:残差资金流强度因子 - **因子的构建思路**:剥离资金流强度因子中涨跌幅的影响,提升选股能力[6][25] - **因子具体构建过程**: 1. 使用横截面回归剥离涨跌幅影响,回归公式为: $$S_{t} = a + b \cdot Ret20_{t} + \varepsilon_{t}$$ 其中,$S_{t}$为净流入金额绝对值标准化后的资金流强度因子,$Ret20_{t}$为20日涨跌幅,$\varepsilon_{t}$为回归后的残差[25][26] 2. 回归后残差即为残差资金流强度因子,代表在同等涨跌幅情况下资金流强度的选股能力[26] - **因子评价**:残差资金流强度因子选股效果显著优于资金流强度因子,表现更加优异[6][29] 残差反转因子 - **因子名称**:残差反转因子 - **因子的构建思路**:剥离传统反转因子中资金流强度的影响,提升反转因子的选股能力[7][39] - **因子具体构建过程**: 1. 使用横截面回归剥离资金流强度影响,回归公式为: $$Ret20_{t} = a + b \cdot S_{t} + \varepsilon_{t}$$ 其中,$Ret20_{t}$为传统反转因子,$S_{t}$为资金流强度因子,$\varepsilon_{t}$为回归后的残差[40] 2. 回归后残差即为残差反转因子,用于替代传统反转因子进行选股回测[40][43] - **因子评价**:残差反转因子显著优于传统反转因子,尤其是小单残差反转因子表现更好[43] --- 因子的回测效果 资金流因子 - **大单资金流因子**:IC均值为0.025,IR为2.69 - **小单资金流因子**:IC均值为-0.027,IR为1.37[5][16][22] 残差资金流强度因子 - **大单残差资金流强度因子**:IC均值为0.054,IR为3.96 - **小单残差资金流强度因子**:IC均值为-0.057,IR为3.81[6][29][31] 残差反转因子 - **全市场**: - **大单残差反转因子**:多头IR为0.62,空头IR为-0.11,多空对冲IR为1.87 - **小单残差反转因子**:多头IR为0.72,空头IR为-0.14,多空对冲IR为2.26[43][50] - **沪深300**: - **大单残差反转因子**:多头IR为0.51,空头IR为-0.02,多空对冲IR为1.59 - **小单残差反转因子**:多头IR为0.59,空头IR为-0.05,多空对冲IR为2.05[53] - **中证500**: - **大单残差反转因子**:多头IR为0.41,空头IR为-0.01,多空对冲IR为1.14 - **小单残差反转因子**:多头IR为0.56,空头IR为-0.04,多空对冲IR为1.68[54]
深度学习研究报告之七:深度学习框架下高频数据因子挖掘
广发证券· 2021-03-07 00:00
量化模型与构建方式 1. **模型名称**:深层全连接神经网络模型 **模型构建思路**:通过深层全连接神经网络从日频因子中提取股票特征,预测股票未来走势[28][29] **模型具体构建过程**: - 输入层包含76个日频变量,包括73个高频数据低频化的股票特征和3个低频风格因子(股票市值、5日换手率均值、5日收益率)[29] - 网络结构包含7层,分别为输入层X(76个节点)、隐含层H1(128个节点)、H2(128个节点)、H3(64个节点)、H4(64个节点)、H5(32个节点)和输出层Y(3个节点)[30] - 输出层采用softmax激活函数,预测股票未来走势的三种可能性(上涨、平盘、下跌)[31] - 损失函数采用交叉熵损失函数,优化目标为: $$E(w)=-\sum_{n=1}^{N}\sum_{k=1}^{K}[y_{n k}\log{\hat{y}}_{n k}+(1-y_{n k})\log(1-{\hat{y}}_{n k})]$$ - 训练数据为全市场股票,剔除上市时间不足20个交易日、ST股票、停牌及涨停跌停的股票[33] 2. **模型名称**:特征组合模型 **模型构建思路**:通过回归分析机器生成的特征与股票收益率的关系,构建预测模型[34] **模型具体构建过程**: - 对第t期的全市场股票走势,通过回归模型分析股票因子与收益率的关系: $$r_{i}^{t}=r_{m}^{t}+\sum_{k=1}^{n}x_{i k}^{t}\beta_{k}^{t}+\varepsilon_{i}$$ - 通过滚动平均的方式构建因子对股票收益率的预测模型,将过去T个交易日的回归系数取平均,作为因子对股票收益率解释度的期望值: $$E^{s}[\beta_{k}]={\frac{1}{T}}\sum\nolimits_{\tau=1}^{T}\beta_{k}^{s-\tau}$$ - 对新一期的股票相对收益率进行预测: $${\hat{r}}_{i}^{s}=\sum_{k=1}^{n}x_{i k}^{s}E^{s}[\beta_{k}]$$ - 基于预测收益率筛选股票组合[36][37] 模型的回测效果 1. **深层全连接神经网络模型** - 样本外所有特征的平均IC(取绝对值)为7.7%[2] - 样本外IC均值低于5%的特征数量为5个,占比约16%[2] 2. **特征组合模型** - 2019年以来的样本外数据回测,5日IC均值为7.6%,标准差为7.8%[2] - 在20%的换手率约束下,中证500指数成分股内选股多头组合的年化超额收益率为26.0%,超额收益的夏普比率为2.99[2] - 在20%的换手率约束下,中证1000指数成分股内选股多头组合的年化超额收益率为42.4%,超额收益的夏普比率为3.37[2] 量化因子与构建方式 1. **因子名称**:日内价格相关因子 **因子构建思路**:从日内累积收益率、日内收益率的高阶统计量和日内价格的趋势强度中提取因子[39] **因子具体构建过程**: - 包括日内收益率(ret_intraday)、收益率方差(real_var)、收益率峰度(real_kurtosis)、收益率偏度(real_skew)、上行收益率方差(real_upvar)、下行收益率方差(real_downvar)、上行收益率方差占比(ratio_realupvar)、下行收益率方差占比(ratio_realdownvar)、趋势占比(trendratio)[40] 2. **因子名称**:成交量相关因子 **因子构建思路**:从成交量的分布及其与价格或价格走势的关系中提取因子[41] **因子具体构建过程**: - 包括开盘后各半小时成交量占比(ratio_volumeH1至ratio_volumeH8)、分钟成交量与价格相关性(corr_VP)、分钟成交量与收益率相关性(corr_VR)、分钟成交量与上一时刻收益率相关性(corr_VRlag)、分钟成交量与下一时刻收益率相关性(corr_VRlead)[42] 3. **因子名称**:盘前价量因子 **因子构建思路**:从隔夜收益率和开盘前集合竞价信息中提取因子[43] **因子具体构建过程**: - 包括隔夜收益率(ret_overnight)、开盘价相对第一阶段集合竞价最高价的收益率(ret_open2AH1)、开盘价相对第一阶段集合竞价最低价的收益率(ret_open2AL1)、开盘价相对第二阶段集合竞价最高价的收益率(ret_open2AH2)、开盘价相对第二阶段集合竞价最高价的收益率(ret_open2AL2)、第一阶段集合竞价振幅(diverge_A1)、第二阶段集合竞价振幅(diverge_A2)[44] 4. **因子名称**:资金流向因子 **因子构建思路**:通过Level 2数据计算资金流向,区分不同交易金额的买入和卖出行为[46] **因子具体构建过程**: - 包括机构买入金额(amountbuy_exlarge)、机构卖出金额(amountsell_exlarge)、大户买入金额(amountbuy_large)、大户卖出金额(amountsell_large)、中户买入金额(amountbuy_med)、中户卖出金额(amountsell_med)、散户买入金额(amountbuy_small)、散户卖出金额(amountsell_small)、散户净买入金额(amountdiff_small)、散户净主动买入金额(amountdiff_smallact)、中户净买入金额(amountdiff_med)、中户净主动买入金额(amountdiff_medact)、大户净买入金额(amountdiff_large)、大户净主动买入金额(amountdiff_largeact)、机构净买入金额(amountdiff_exlarge)、机构净主动买入金额(amountdiff_exlargeact)、开盘资金流入率(volumeinflowrate_open)、尾盘资金流入率(volumeinflowrate_close)、净流入金额(moneyflow_diff)、净流入率(amountinflow_rate)[47] 因子的回测效果 1. **日内价格相关因子** - 5日IC最高的因子为real_upvar,IC为-5.52%[55] 2. **成交量相关因子** - 5日IC最高的因子为corr_VP,IC为-3.96%[55] 3. **盘前价量因子** - 5日IC最高的因子为ret_open2AH1,IC为4.15%[55] 4. **资金流向因子** - 5日IC最高的因子为amountbuy_small,IC为-7.60%[55]
20210119-华西证券-Black_Litterman模型研究系列之二:应用演示
华西证券· 2021-01-19 00:00
量化模型与构建方式 1. **模型名称**:Black-Litterman模型 - **模型构建思路**:通过结合市场均衡收益率与投资者主观观点,生成后验收益率,优化资产配置权重[7][8] - **模型具体构建过程**: 1. **计算均衡收益率**:逆向优化市场基准组合权重,得到隐含均衡收益率向量Π,公式为 $$\Pi = \delta \Sigma w_{eq}$$ 其中δ为风险厌恶系数,Σ为资产收益率协方差矩阵,$w_{eq}$为市值权重[10][12] 2. **设定主观观点**:通过矩阵P(观点涉及资产)和向量Q(观点收益率)表达绝对或相对收益观点,例如汽车行业绝对收益6%或食品饮料相对家用电器超额收益-1%[16][17][19] 3. **计算后验收益率**:结合均衡收益率与主观观点,公式为 $$\mu_{p}=[(\tau\Sigma)^{-1}+P^{T}\Omega^{-1}P]^{-1}[(\tau\Sigma)^{-1}\Pi+P^{T}\Omega^{-1}Q]$$ 其中τ控制主观观点权重(τ=0.025),Ω为观点协方差矩阵[7][15][28] 4. **权重计算**:无约束时直接求解,有约束时通过均值-方差优化[7][43] - **模型评价**:权重结果稳定且可解释,避免均值-方差模型的极端配置[41][42] 2. **协方差矩阵计算方法** - **历史方法**:Ω矩阵元素与资产历史波动率成正比,公式为 $$\Omega = \tau \cdot \text{diag}(P\Sigma P^{T})$$[28] - **指定信心水平方法**:根据投资者对观点的确信度(如50%或95%)反推Ω矩阵[29][35] 模型的回测效果 1. **无约束BL模型权重**: - 汽车行业权重28.58%(均衡权重5.06%),传媒行业权重-8.27%(均衡权重6.10%)[38][40] - 电子、计算机、电气设备权重因观点收益率低于隐含值而下降[41] 2. **有权重约束BL模型权重**: - 约束1(仅做多):传媒权重降至0%,汽车权重27.15%[46] - 约束3(权重上限20%):汽车权重降至20%[46] 量化因子与构建方式 1. **因子名称**:主观观点因子 - **因子构建思路**:将投资者对资产收益的绝对或相对观点量化为矩阵P和向量Q[16][19] - **因子具体构建过程**: - 绝对观点(如汽车收益6%)对应P矩阵行元素为1[17] - 相对观点(如电子+计算机+电气设备跑赢银行+房地产2%)按市值权重分配P矩阵元素值[17][19] - **因子评价**:需确保观点收益率与均衡收益率可比,避免数量级偏差[16][42] 因子的回测效果 1. **观点变化影响**: - 汽车观点收益率从6%下调至5%时,权重从28.58%降至10.51%[51][54] - 食品饮料相对家用电器观点从-1%改为+1%时,食品饮料权重从2.91%升至27.97%[55][56] 2. **信心水平影响**: - 汽车观点信心水平从50%升至95%时,权重从30.49%升至70.01%[62] 其他关键指标 - **均衡收益率示例**:医药生物4.19%,电子5.64%,银行2.62%[12] - **历史协方差矩阵**:电子行业方差0.0969,医药生物与电子协方差0.0513[14] - **观点隐含收益率**:电子+计算机+电气设备跑赢银行+房地产的隐含收益率为2.48%[24]
多因子ALPHA系列报告之(四十):科技板块量化选股策略研究
广发证券· 2020-09-11 00:00
量化因子与构建方式 研发费用因子 - **因子的构建思路** 研发费用因子用于衡量公司在创新研发方面的投入,研发费用越高的公司,其未来股票收益率可能更高[4][32][50] - **因子具体构建过程** 1. 收集公司年度研发费用数据,并对研发费用进行市值中性化处理,以剔除市值对因子的影响[50] 2. 使用市值中性化后的研发费用因子值进行选股,选股周期为每年4月底至次年4月底[50] 3. 计算研发费用因子与未来一年收益率的相关性,使用IC均值作为因子选股能力的衡量指标[50] 4. 调仓时点为每年4月底、8月底和10月底,分档收益率计算累计收益率和年化收益率[56] - **因子评价** 研发费用因子具有显著的选股能力,尤其在近年来表现更加显著[50] 盈利因子 - **因子的构建思路** 盈利因子用于衡量公司盈利能力,高盈利的公司在未来股价表现较好[60][63] - **因子具体构建过程** 1. 收集单季度ROE、单季度ROA等11个盈利相关指标[60] 2. 计算每个因子的季度IC值和多空年化收益率[63] 3. 调仓时点为每年4月底、8月底和10月底,计算多头相对基准的超额收益[60][63] - **因子评价** 盈利因子是科技股表现的重要驱动因素,具有较好的选股能力[60][63] 成长因子 - **因子的构建思路** 成长因子用于衡量公司成长性,高成长的公司在未来一段时间有望获取超额收益[65][66] - **因子具体构建过程** 1. 收集单季度净利润同比增长、单季度营业收入同比增长等成长相关指标[65] 2. 计算每个因子的季度IC值和多空年化收益率[66] 3. 调仓时点为每年4月底、8月底和10月底,计算多头相对基准的超额收益[65][66] - **因子评价** 成长因子是科技股未来表现的重要驱动因素,表现出不错的选股能力[65][66] 质量因子 - **因子的构建思路** 质量因子用于衡量公司运营效率和财务质量,但对科技股表现的影响较弱[66][70] - **因子具体构建过程** 1. 收集总资产周转率、流动资产周转率等质量相关指标[66][70] 2. 计算每个因子的季度IC值和多空年化收益率[70] 3. 调仓时点为每年4月底、8月底和10月底,计算多头相对基准的超额收益[66][70] - **因子评价** 质量因子对科技股走势的影响较弱,选股能力有限[66][70] 估值因子 - **因子的构建思路** 估值因子用于衡量股票的估值水平,低估值的科技股在未来一个月表现较好[80][81] - **因子具体构建过程** 1. 收集BP(市净率倒数)、EP(市盈率倒数)、SP(市销率倒数)等估值相关指标[80][81] 2. 计算每个因子的月度IC值和多空年化收益率[81] 3. 调仓时点为每月最后一个交易日,计算多头相对基准的超额收益[80][81] - **因子评价** 估值因子具有不错的选股效果,其中EP因子的选股能力相对更好[80][81] 其他风格因子 - **因子的构建思路** 其他风格因子包括流通市值、换手率、波动率、1月反转和12月反转等,低流通市值、低换手率、低波动率的股票表现较好[85][86] - **因子具体构建过程** 1. 收集流通市值、换手率等风格相关指标[85][86] 2. 计算每个因子的月度IC值和多空年化收益率[86] 3. 调仓时点为每月最后一个交易日,计算多头相对基准的超额收益[85][86] - **因子评价** 小市值因子和低换手率因子具有较高的多空超额收益,其中低换手率因子近年来表现较好[85][86] --- 因子的回测效果 研发费用因子 - IC均值:0.12(2008年4月以来),0.19(2016年4月以来)[50] - 多空年化超额收益率:21.58%[56] 盈利因子 - 单季度ROE:IC均值0.08,多空年化超额收益率12.04%[63] - 单季度ROA:IC均值0.08,多空年化超额收益率11.34%[63] 成长因子 - 单季度净利润同比增长:IC均值0.12,多空年化超额收益率17.16%[66] - 单季度营业收入同比增长:IC均值0.10,多空年化超额收益率12.90%[66] 质量因子 - 总资产周转率:IC均值0.04,多空年化超额收益率5.01%[70] - 流动资产周转率:IC均值0.02,多空年化超额收益率4.02%[70] 估值因子 - BP:IC均值0.055,多空年化超额收益率11.93%[81] - EP:IC均值0.050,多空年化超额收益率19.44%[81] 其他风格因子 - 流通市值:IC均值-0.030,多空年化超额收益率34.88%[86] - 换手率:IC均值-0.097,多空年化超额收益率42.98%[86]
20200905_开源证券_金融工程专题_主动买卖因子的正确用法--市场微观结构研究系列(9)_魏建榕,傅开波,苏俊豪
开源证券· 2020-09-05 00:00
量化因子与构建方式 1. 因子名称:主动买卖因子(ACT因子) - **因子的构建思路**:通过“主动买入金额”与“主动卖出金额”的定量比较,度量“主动净买入强度”,以此反映交易者的主动性行为对股价未来走势的影响[13][14] - **因子具体构建过程**: 1. 定义交易者类型:根据订单委托金额大小,将交易者分为超大单(>100万元)、大单(20-100万元)、中单(4-20万元)和小单(<4万元)[13] 2. 计算公式: $$ \mathrm{ACT} = \frac{\text{主动买入金额} - \text{主动卖出金额}}{\text{主动买入金额} + \text{主动卖出金额}} $$ 公式中,分子为主动净买入金额,分母为主动买卖总金额[13][14] 3. 每月末取过去20日的ACT指标均值,作为因子值[14] 4. 剔除停牌、ST、涨跌停、过去20日有效交易日小于10天的股票[14] - **因子评价**:ACT因子的IC绝对值较低,选股能力不达预期,尤其是超大单因子覆盖率较低,且存在“拆单”行为,导致高低收益端均表现不佳[14][21] 2. 因子名称:切割后的ACT因子 - **因子的构建思路**:通过“因子切割论”,将ACT因子按照收益率高低进行切分,分析不同交易日的因子表现,以更精细化地刻画市场行为模式[6][15] - **因子具体构建过程**: 1. 回溯过去20个交易日,计算逐日的ACT值[20] 2. 按收益率排序,取最高比例的交易日为高收益日,最低比例的交易日为低收益日[20][29] 3. 对高收益日的ACT值取平均,得到ACT_high因子;对低收益日的ACT值取平均,得到ACT_low因子[20][29] - **因子评价**: - 大单和中单因子在高收益端呈现较强的正向选股效应[6][25] - 小单因子在低收益端呈现较强的负向选股效应[6][25] - 超大单因子在高低收益端均表现不佳[6][25] 3. 因子名称:ACT正向因子与ACT负向因子 - **因子的构建思路**:基于切割分析,分别构建大单和中单的正向主动买卖因子(ACT正向),以及小单的负向主动买卖因子(ACT负向),以区分不同交易者的行为特征[7][24] - **因子具体构建过程**: 1. 逐日计算大单和中单的主动买卖因子,公式为: $$ \mathrm{ACT正向,t} = \frac{\text{主动买入金额(大单 + 中单)} - \text{主动卖出金额(大单 + 中单)}}{\text{主动买入金额(大单 + 中单)} + \text{主动卖出金额(大单 + 中单)}} $$ [26] 2. 逐日计算小单的主动买卖因子,公式为: $$ \mathrm{ACT负向,t} = \frac{\text{主动买入金额(小单)} - \text{主动卖出金额(小单)}}{\text{主动买入金额(小单)} + \text{主动卖出金额(小单)}} $$ [26] 3. 对上述因子取平均,分别记为ACT正向和ACT负向[26] - **因子评价**: - ACT正向因子在不同切割比例下选股能力优异,尤其在λ=10%时表现最佳[7][26] - ACT负向因子选股能力较弱,且近年来收益逐渐降低[7][33] --- 因子的回测效果 1. 主动买卖因子(ACT因子) - **IC水平**:按照小单、中单、大单、超大单的顺序,IC水平逐渐上升(从负到正)[14] - **多空对冲净值**:表现不理想,选股能力不达预期[14][16] 2. 切割后的ACT因子 - **小单因子**: - 低收益端:负向选股效应强,衰减速度较慢[6][25] - 高收益端:正向选股效应弱,衰减速度较快[6][25] - **中单因子**: - 高收益端:正向选股效应强[6][25] - 低收益端:负向选股效应弱[6][25] - **大单因子**: - 高收益端:正向选股效应强[6][25] - 低收益端:负向选股效应弱[6][25] - **超大单因子**:高低收益端均无明显选股效应[6][25] 3. ACT正向因子与ACT负向因子 - **ACT正向因子**: - λ=10%时,多空收益波动比为3.06,多头收益波动比为0.87[26][28] - 提纯后(行业风格中性化),λ=10%时,多空收益波动比为2.40,多头收益波动比为0.66[36][38] - 在沪深300和中证500样本空间内,λ=20%时,多空收益波动比分别为1.32和1.78,多头收益波动比分别为0.63和0.80[43][44] - **ACT负向因子**: - λ=10%时,多空收益波动比为0.82,多头收益波动比为0.73[33] - 收益波动比相对稳定,但总体选股能力较弱[7][33]
20200812-华西证券-模型研究系列之一:原理解析
华西证券· 2020-08-12 00:00
量化模型与构建方式 1.模型名称:Black-Litterman模型(BL模型) 模型构建思路:BL模型通过贝叶斯定理将市场均衡收益率(CAPM推导的先验信息)与投资者主观观点结合,优化资产配置权重[2][3][8] 模型具体构建过程: - **先验收益率计算**:基于CAPM逆向优化,市场均衡收益率Π通过效用函数最大化推导,公式为 $$\Pi=\delta\Sigma w_{eq}$$ 其中δ为风险厌恶系数,$w_{eq}$为市值加权均衡权重,Σ为收益率协方差矩阵[12][13][15] - **主观观点表达**:通过矩阵P(k×n观点矩阵)和向量Q(k×1预期收益)定义,并引入信心矩阵Ω(对角矩阵)[9][21][22] - **贝叶斯融合**:后验收益率均值$\mu_p$和协方差$\Sigma_p$计算公式为 $$\mu_{p}=[(\tau\Sigma)^{-1}+P^{T}\Omega^{-1}P]^{-1}[(\tau\Sigma)^{-1}\Pi+P^{T}\Omega^{-1}Q]$$ $$\Sigma_{p}=[(\tau\Sigma)^{-1}+P^{T}\Omega^{-1}P]^{-1}$$ 其中τ调节先验权重[9][10][29] - **最终权重计算**:将后验收益率输入均值-方差模型,无约束时权重为 $$w=(\delta\Sigma_{p}^{*})^{-1}\mu_{p}$$ 其中$\Sigma_{p}^{*}=\Sigma_{p}+\Sigma$为调整后协方差矩阵[30][32][34] 模型评价:稳定性高(以均衡组合为起点),灵活性好(支持部分资产观点表达),但协方差计算方式影响权重调整范围[2][8][31] 模型的回测效果 (注:原文未提供具体回测指标数据) 量化因子与构建方式 (注:原文未涉及独立因子构建) 因子的回测效果 (注:原文未涉及因子测试结果) 关键要点引用说明: - 模型稳定性与灵活性优点[2][8] - CAPM逆向优化推导均衡收益率[12][15] - 贝叶斯融合公式及参数定义[9][10][29] - 协方差矩阵计算争议[30][31] - 最终权重计算逻辑[32][34]
20200616_开源证券_金融工程专题_估值因子坏了怎么修?--开源量化评论(1)_魏建榕,高鹏,苏俊豪
开源证券· 2020-06-16 00:00
量化因子与构建方式 1. 因子名称:EP(估值因子) - **因子的构建思路**:EP 因子是传统估值因子之一,基于静态价值投资理念,关注“哪些股票的估值目前是最便宜的”[4][12] - **因子具体构建过程**:EP 因子的计算公式为 $EP(t) = E(t) / P(t)$,其中 $E(t)$ 表示股票的盈利,$P(t)$ 表示股票的价格[13] - **因子评价**:近年来,EP 因子在 A 股市场的表现出现失效迹象,其收益能力显著下降[4][12] 2. 因子名称:BP(估值因子) - **因子的构建思路**:BP 因子是另一种传统估值因子,基于静态价值投资理念,关注低估值股票的表现[12] - **因子具体构建过程**:BP 因子的计算公式为 $BP = B / P$,其中 $B$ 表示账面价值,$P$ 表示股票价格[12] - **因子评价**:与 EP 因子类似,BP 因子在 A 股市场的表现也出现了失效迹象[12] 3. 因子名称:dEP(估值变动因子) - **因子的构建思路**:dEP 因子基于动态价值投资理念,关注“哪些股票的估值正在变得越来越便宜”[5][15] - **因子具体构建过程**:dEP 因子是 EP 因子的 60 日变化量,公式为: $$ dEP = \frac{E(t)}{P(t)} - \frac{E(t-60)}{P(t-60)} $$ 进一步拆解为: $$ dEP = EP(t) * \left(1 - \frac{R}{G}\right) $$ 其中,$R = P(t) / P(t-60)$ 表示股票价格的变动比率,$G = E(t) / E(t-60)$ 表示股票盈利的变动比率[13][15][16] - **因子评价**:dEP 因子在收益结构、分行业表现以及多头选股能力上均显著优于传统估值因子[5][24][33] --- 因子的回测效果 1. EP 因子 - 年化多空收益:15.6%[17] - IC 均值:0.032[17] - IR:1.49[17] - 多空收益(2019 年后):-3.4%[17] 2. BP 因子 - 本报告未提供 BP 因子的具体回测数据 3. dEP 因子 - 年化多空收益:22.9%[17] - IC 均值:0.043[17] - IR:2.70[17] - 多空收益(2019 年后):21.9%[17] --- 因子的比较优势 1. 收益结构 - dEP 因子的多头收益与空头收益均显著优于 EP 因子,且分组收益单调性更好[24][25] 2. 行业表现 - dEP 因子在除银行行业外的所有一级行业中选股能力均优于 EP 因子,且在部分行业(如石油石化、基础化工、医药等)中,EP 因子甚至表现为负向选股指标,而 dEP 因子在所有行业中 IC 均值均在 0.03 以上[25][27] 3. 因子暴露 - dEP 因子的多头组合相比 EP 因子具有更大的平均市值、更高的市净率(BP)、相对较低的 ROE[28][32] --- 因子的细分行业应用 1. 半导体行业 - dEP 因子多头组合自 2018 年 10 月以来跑赢 EP 因子多头组合,超额收益率为 13.1%[33][38] 2. 生物医药行业 - dEP 因子多头组合自 2018 年 10 月以来跑赢 EP 因子多头组合,超额收益率为 18.3%[35][39] 3. 白酒行业 - dEP 因子多头组合自 2018 年 10 月以来跑赢 EP 因子多头组合,超额收益率为 10.8%[36][41]
20200516_开源证券_金融工程专题_振幅因子的隐藏结构--市场微观结构研究系列(7)_魏建榕,高鹏,苏俊豪
开源证券· 2020-05-16 00:00
量化因子与构建方式 振幅因子 - 因子名称:振幅因子 - 因子的构建思路:振幅因子作为波动类因子的代理变量,用于衡量股票在过去一段时间内的振幅平均水平[15][16] - 因子具体构建过程:回看最近20个交易日,计算股票每日的振幅(最高价/最低价-1),取其均值作为振幅因子[16][18] - 因子评价:振幅因子具有一定负向选股能力,但选股效果的稳定性不佳[5][18] 高价振幅因子 - 因子名称:高价振幅因子 - 因子的构建思路:通过价格维度切割振幅因子,提取高价区域的振幅信息以增强选股能力[21][23] - 因子具体构建过程: 1. 回溯最近20个交易日的股票数据 2. 计算每日振幅(最高价/最低价-1) 3. 选择收盘价较高的λ(如40%)有效交易日,计算振幅均值得到高价振幅因子 $V_{high}(\lambda)$ 4. 剔除停牌和一字涨跌停后的交易日,若有效交易日小于10日,则因子值设为空值[24][25] - 因子评价:高价振幅因子具有更强的负向选股能力,但多空对冲净值波动性较高,分组收益非单调[26][28][29] 理想振幅因子 - 因子名称:理想振幅因子 - 因子的构建思路:通过高价振幅因子与低价振幅因子作差,标准化处理以提升选股稳定性[31][32] - 因子具体构建过程: 1. 在同一切割比例λ下,将高价振幅因子 $V_{high}(\lambda)$ 与低价振幅因子 $V_{low}(\lambda)$ 作差 2. 构造得到理想振幅因子 $V(\lambda)$,公式如下: $$\mathrm{V(\lambda\,)=V_{\,\,\,h i g h(\lambda\,)}-V_{\,\,\,l o w(\lambda\,)}}$$[31][32] - 因子评价:理想振幅因子选股能力显著优于高价振幅因子,表现稳定,分组收益单调排列[33][35] 换手率因子 - 因子名称:理想换手率因子 - 因子的构建思路:基于理想振幅因子的构造框架,对换手率因子进行切割以提取隐藏结构[45] - 因子具体构建过程: 1. 回看最近20个交易日,计算每日换手率均值作为换手率因子 2. 按价格维度切割,构造高价换手率因子与低价换手率因子 3. 将高价换手率因子与低价换手率因子作差,得到理想换手率因子 $T(\lambda)$[45][48] - 因子评价:理想换手率因子选股能力优于原始换手率因子,可视为改进方案[45][48] --- 因子的回测效果 振幅因子 - 月度IC均值:-0.035 - rankIC均值:-0.068 - ICIR:-0.77 - 月度胜率:59.2%[5][18] 高价振幅因子 - λ=20%时: - 多空对冲年化收益率:16.7% - 年化波动率:11.8% - 最大回撤:13.9% - IC均值:-0.062 - ICIR:-1.76[26][28] 理想振幅因子 - λ=25%时: - 多空对冲年化收益率:23.3% - IC均值:-0.067 - ICIR:-2.97 - 月度胜率:84.2%[35][39] 理想换手率因子 - λ=25%时: - 多空对冲年化收益率:优于原始换手率因子 - ICIR:显著提升[45][48]
高频数据因子研究系列三:基于个股羊群效应的选股因子研究
广发证券· 2020-05-05 00:00
量化因子与构建方式 1. **因子名称**:羊群效应因子 - **因子的构建思路**:利用个股日内高频交易数据,结合LSV模型,构建个股短期内的羊群效应指标[10][34][39] - **因子具体构建过程**: - 计算特定时间段内的买方驱动单数量 $B(i,T)$ 和卖方驱动单数量 $S(i,T)$ - 计算羊群行为度量 $H(i,T)$ $$ H(i,T)=\left|{\frac{B(i,T)}{B(i,T)+S(i,T)}}-P_{T}\right|-\,A F(t,T) $$ 其中 $P_{T}$ 为所有股票的买单占其交易单比例的横截面平均值,$AF(i,T)$ 是调整项,其表达式为 $$ A F(i,T)=\sum_{k=0}^{N_{i,T}}{\binom{N_{i,T}}{k}}\,p_{T}^{k}(1-p_{T})^{N_{i,T}-}\left|{\frac{k}{N_{i,T}}}-\ p_{T}\right| $$ - 根据个股买单比例的相对水平,将羊群行为划分成买入羊群行为 $HB(i,T)$ 和卖出羊群行为 $HS(i,T)$ $$ H B(i,T)=-H(i,T)\;\;\;i f\;\frac{B(i,T)}{B(i,T)+S(i,T)}>\;P_{T} $$ $$ H S(i,T)=H(i,T)\;\;\;i f\;\frac{B(i,T)}{B(i,T)+S(i,T)}<\;P_{T} $$ - 使用天软数据库的高频数据,识别个股每笔买卖方向,统计买方和卖方驱动单[39][40][41] 2. **因子名称**:处理后的羊群效应因子 - **因子的构建思路**:对原始因子进行去极值、中性化和标准化处理,以提高因子的有效性[4][10][108] - **因子具体构建过程**: - 去极值:采用MAD法对异常数据进行剔除 $$ m d=m e d i a n\{x_{i},i=1,2,3\ldots,n\} $$ $$ M A D=\,m e d i a n(|x_{i}-m d|),i=1,2,3,\ldots,n $$ - 中性化:将原始因子值和股票的市值以及行业进行回归,取残差项作为新因子 $$ H(i,T)=\beta_{0}+\,\beta_{1}s i z e(i,T)+\beta_{2}i n d u s t r y(i,T)+\varepsilon(i,T) $$ - 标准化:使用因子的Z-Score值作为新的因子值 $$ H_{n e w}(i,T)=\frac{H(i,T)-\,m e a n(H(i,T))}{s t d(H(i,T))} $$ - 处理后的因子在全市场、中证800、中证500及沪深300板块内进行了详细地测算[108][110][111] 因子的回测效果 1. **原始羊群效应因子** - **全市场**: - IC均值:0.047 - 正IC占比:69.90% - 多头组合年化收益率:34.02% - 信息比率:1.05 - 多头组合相对中证500指数年化超额收益率:24.61% - 信息比率:2.59[4][46][59] 2. **处理后的羊群效应因子** - **全市场**: - IC均值:0.051 - 正IC占比:73.77% - 多头组合年化收益率:34.62% - 信息比率:1.09 - 多头组合相对中证500指数年化超额收益率:24.98% - 信息比率:2.84[4][111][125] 3. **中证800** - **原始因子**: - IC均值:0.043 - 正IC占比:64.68% - 多头组合年化收益率:22.01% - 信息比率:1.14 - 多头组合相对中证800指数年化超额收益率:16.27% - 信息比率:1.14[61][65][74] - **处理后因子**: - IC均值:0.046 - 正IC占比:69.15% - 多头组合年化收益率:24.63% - 信息比率:0.84 - 多头组合相对中证800指数年化超额收益率:18.84% - 信息比率:1.45[126][128][136] 4. **中证500** - **原始因子**: - IC均值:0.052 - 正IC占比:67.96% - 多头组合年化收益率:25.79% - 信息比率:0.81 - 多头组合相对中证500指数年化超额收益率:16.72% - 信息比率:1.87[76][79][89] - **处理后因子**: - IC均值:0.055 - 正IC占比:71.54% - 多头组合年化收益率:28.19% - 信息比率:0.88 - 多头组合相对中证500指数年化超额收益率:19.13% - 信息比率:2.35[137][139][147] 5. **沪深300** - **原始因子**: - IC均值:0.028 - 正IC占比:57.82% - 多头组合年化收益率:15.49% - 信息比率:0.56 - 多头组合相对沪深300指数年化超额收益率:9.19% - 信息比率:0.68[91][95][105] - **处理后因子**: - IC均值:0.031 - 正IC占比:60.21% - 多头组合年化收益率:20.36% - 信息比率:0.74 - 多头组合相对沪深300指数年化超额收益率:14.08% - 信息比率:1.25[148][150][156]
20200307_开源证券_金融工程专题_APM因子模型的进阶版--市场微观结构研究系列(5)_魏建榕,苏俊豪
开源证券· 2020-03-07 00:00
量化模型与构建方式 原始APM因子模型 - **模型名称**: 原始APM因子(APMraw) - **模型构建思路**: 通过分析上午和下午行情数据所蕴含信息量的差别,提取股票价格行为的日内模式差异[2][12] - **模型具体构建过程**: 1. 对选定股票,回溯过去20日数据,记录逐日上午的股票收益率 $r_{am}$ 和指数收益率 $R_{am}$;下午的股票收益率 $r_{pm}$ 和指数收益率 $R_{pm}$[12] 2. 将得到的40组上午与下午 $(r, R)$ 的收益率数据进行回归:$r = \alpha + \beta R + \epsilon$,得到残差项 $\epsilon$[12] 3. 上午残差记为 $\epsilon_{am}$,下午残差记为 $\epsilon_{pm}$,进一步计算每日上午与下午残差的差值 $\delta_t = \epsilon_{am} - \epsilon_{pm}$[12] 4. 构造统计量 $stat$ 来衡量上午与下午残差的差异程度,公式如下: $$ stat = \frac{\mu(\delta_t)}{\sigma(\delta_t)/\sqrt{N}} $$ 其中 $\mu$ 为均值,$\sigma$ 为标准差,$N$ 为样本数量[12] 5. 为消除动量因子的影响,将统计量 $stat$ 对动量因子进行横截面回归:$stat = \gamma_{20} + \beta_{momentum}$,其中 $\gamma_{20}$ 为股票过去20日的收益率,代表动量因子[13] 6. 回归得到的残差值作为因子[13] - **模型评价**: 样本内表现优异,但样本外表现略逊,尤其在2019年出现连续回撤[3][13] 改进APM因子模型 - **模型名称**: 改进APM因子(APMnew) - **模型构建思路**: 通过调整原始APM因子使用的数据时段,将上午收益替换为隔夜收益,以提高因子稳定性和预测能力[4][19] - **模型具体构建过程**: 1. 在原始APM因子的第一步中,用隔夜收益 $r_{overnight}$ 替代上午收益 $r_{am}$,指数收益也相应替换为隔夜的指数收益 $R_{overnight}$[26] 2. 其余步骤保持不变,最终得到改进因子 $APMnew$[26] - **模型评价**: 改进后的因子在样本内和样本外均表现优异,尤其在2019年显著优于原始因子[4][26] OVP因子与AVP因子 - **因子名称**: OVP因子与AVP因子 - **因子构建思路**: 结合APM因子方法论与W式切割方法,通过分时段收益数据构造反转属性因子[38] - **因子具体构建过程**: 1. 对选定股票,回溯过去20个交易日数据[38] 2. 将股票逐日的涨跌幅拆分成隔夜、上午、下午三个阶段,分别加总,所得和依次记作 $RO$、$RA$、$RP$[38] 3. 构造因子 $OVP = RO - RP$ 和 $AVP = RA - RP$[38] - **因子评价**: OVP因子表现显著优于AVP因子,尤其在预测能力和稳定性方面[38][40] --- 模型的回测效果 原始APM因子(APMraw) - 年化收益率: 样本内15.90%,样本外6.41%[3][13] - 信息比率(IR): 样本内2.84,样本外略低[3][13] - 最大回撤: 样本内2.52%,样本外5.72%[3][13] - 月度胜率: 样本内78.6%,样本外略低[3][13] 改进APM因子(APMnew) - 年化收益率: 12.81%[29] - 信息比率(IR): 3.17[29] - 最大回撤: 2.32%[29] - 月度胜率: 81.25%[29] OVP因子与AVP因子 - OVP因子: - 年化收益率: 18.04%[41] - 信息比率(IR): 4.17[41] - 最大回撤: 2.21%[41] - 月度胜率: 86.25%[41] - AVP因子: - 年化收益率: 3.00%[41] - 信息比率(IR): 0.15[41] - 最大回撤: 11.32%[41] - 月度胜率: 53.75%[41] --- 因子的回测效果 APM因子系列 - **APMraw**: 上午(9:30-11:30)与下午(13:00-15:00)收益差异[32] - **APMnew**: 隔夜与下午(13:00-15:00)收益差异[32] - **APM_1**: 隔夜与下午(14:00-15:00)收益差异[32] - **APM_2**: 上午(9:30-10:30)与下午(14:00-15:00)收益差异[32] - **APM_3**: 上午(10:30-11:30)与下午(13:00-14:00)收益差异[32] 回测表现 - 使用隔夜数据的因子(APMnew、APM_1)在2019年表现较好[35] - 使用日内交易数据的因子(APM_2、APM_3)表现逊色,尤其APM_3因子由于中间时段成交寡淡,难以提炼有效信息[35]