Workflow
20221126_开源证券_金融工程专题报告_长端动量2.0:长期、低换手、多头显著的量价因子_金工研究团队_20221126
开源证券· 2022-11-26 00:00
量化因子与构建方式 长端动量1.0因子 - **因子名称**:长端动量1.0因子 - **因子的构建思路**:通过剔除高振幅交易日的涨跌幅数据,去除过度反应的影响,从而捕捉A股市场中的动量效应[3][16] - **因子具体构建过程**: - 步骤1:对选定股票,回溯取其最近160个交易日的数据[17] - 步骤2:计算股票每日的振幅(最高价/最低价-1)[17] - 步骤3:选择振幅较低的70%交易日,涨跌幅加总,得到长端动量因子[17] - **因子评价**:有效捕捉A股市场中的动量效应,分组收益分化且单调性良好,多头组收益显著高于其他组[16][17] 长端动量2.0因子 - **因子名称**:长端动量2.0因子 - **因子的构建思路**:在长端动量1.0因子的基础上,通过剔除涨跌停及停牌交易日数据,并对日超额收益进行反转中性化处理,进一步提升因子有效性[19][21] - **因子具体构建过程**: - 步骤1:对选定股票,回溯取其最近160个交易日的数据[19] - 步骤2:剔除涨跌停及停牌交易日数据[19] - 步骤3:计算股票每日的振幅:(最高价-最低价)/前收盘价[19] - 步骤4:选择振幅较低的70%交易日,日超额收益(涨跌幅-市场涨跌幅均值)加总,记作$ \alpha Retlow $[19] - 步骤5:$ \alpha Retlow $作20日反转中性化,得到长端动量2.0因子[19] - **因子评价**:相比长端动量1.0因子,长端动量2.0因子有效性显著提升,收益表现稳健,且与基本面因子兼容性良好[23][55][57] 行业长端动量因子 - **因子名称**:行业长端动量因子 - **因子的构建思路**:将个股长端动量2.0因子值按自由流通市值加权聚合,构建行业因子值,用于行业轮动策略[63] - **因子具体构建过程**: - 将个股长端动量2.0因子值按自由流通市值加权聚合,得到行业因子值[63] - **因子评价**:具备行业轮动能力,收益表现显著优于行业等权组合[63][66] --- 因子的回测效果 长端动量1.0因子 - RankIC:4.01%[17] - RankICIR:1.76[17] - RankIC胜率:74.36%[17] - 多头年化收益:16.41%[17] - 月均换手率:35.7%[17] - 多空年化收益:10.94%[17] - 年化IR:1.75[17] - 最大回撤:10.57%[17] - 月度胜率:68%[17] 长端动量2.0因子 - RankIC:6.92%[23] - RankICIR:2.75[23] - RankIC胜率:79.49%[23] - 多头年化收益:20.26%[23] - 月均换手率:34.28%[23] - 多空年化收益:18.09%[29] - 年化IR:2.61[29] - 最大回撤:8.45%[29] - 月度胜率:75.9%[29] 行业长端动量因子 - RankIC:6.72%[63] - RankICIR:0.84[63] - RankIC胜率:60.19%[63] - 多头年化收益:12.64%[66] - 月均换手率:22.72%[66] - 多空年化收益:14.28%[63] - 年化IR:1.04[63] - 超额年化收益率:5.31%[66]
20221122_开源证券_金融工程专题_扎堆效应的识别:以股东户数变动为例_金工研究团队_20221122
开源证券· 2022-11-22 00:00
量化因子与构建方式 1. 因子名称:股东户数变动因子(SNC) - **因子的构建思路**:股东户数的增加通常表明个人投资者的扎堆行为,而个人投资者的从众交易特征往往蕴含负向alpha,因此股东户数大幅增加的公司未来股价倾向于跑输股东户数减少的公司[17][21] - **因子具体构建过程**: - 对数据缺失的月份进行前值填充,对相同月份的多条数据取最新值[17] - 采用间隔选取多期后再进行时序标准化处理,公式如下: $$ factor_{t} = \frac{x_{t} - \tilde{x}}{\sqrt{\frac{1}{N}\Sigma_{i,j=0}^{N}(x_{t-i*j} - \tilde{x})^{2}}} $$ 其中,$\tilde{x} = \frac{1}{N}\sum_{i,j=0}^{N}x_{t-i*j}$,$x_{t}$为当前值,$\tilde{x}$为时序均值,$N$为滚动期数,$i,j$为选取间隔[19][20] - 默认选取间隔为3个月,滚动窗口长度为8期[20] - 对上市不满一年的新股、退市股和停牌股进行剔除,并对异常值进行剪枝和标准化处理[20] - 对因子值进行行业市值中性化处理[20] - 最终生成的因子值取负处理,使其转为正向选股因子[21] - **因子评价**:SNC因子在测试期内表现优异,具有较高的选股能力[21] 2. 因子名称:人均持股占比变动因子(PCRC) - **因子的构建思路**:与SNC因子类似,PCRC因子通过计算人均持股比例的时序变动来捕捉股东户数变化的影响[20][27] - **因子具体构建过程**: - 数据预处理与SNC因子一致,包括前值填充、异常值剪枝、标准化处理和行业市值中性化处理[20] - 采用间隔选取多期后进行时序标准化处理,公式与SNC因子一致[19][20] - 默认选取间隔为3个月,滚动窗口长度为8期[20] - **因子评价**:PCRC因子在多空对冲稳定性上表现优异,尤其在超额回撤控制方面优于SNC因子[30] 3. 因子名称:调参后的PCRC因子 - **因子的构建思路**:通过调整间隔跨度(Gap)和滚动窗口长度(Window)优化PCRC因子的表现[34] - **因子具体构建过程**: - 测试不同参数组合,发现每4个月选一次数据、滚动选取9期时,PCRC因子显著性最高,RankIC均值达到5.79%[34][35] - 每3个月选取一次、滚动选取4期时,因子稳定性达到局部最优解,RankICIR高达2.752[34][35] - 局部最优参数下,PCRC因子单调性改善,不同分组的走势区分度更加明显[36] - **因子评价**:调参后的PCRC因子显著性和稳定性均有提升,表现更加优异[36] --- 因子的回测效果 1. 股东户数变动因子(SNC) - **RankIC均值**:4.5%[21] - **RankICIR**:2.50[21] - **RankIC为正次数占比**:约74%[21] - **多空对冲年化收益率**:13.4%[24] - **多空对冲最大回撤**:-3.9%[24] - **多空对冲胜率**:约80%[24] 2. 人均持股占比变动因子(PCRC) - **RankIC均值**:4.4%[27] - **RankICIR**:2.53[27] - **多空对冲年化收益率**:13.3%[31] - **多空对冲最大回撤**:-2.9%[31] - **多空对冲胜率**:约77.7%[31] 3. 调参后的PCRC因子 - **RankIC均值**:5.79%(显著性最高参数组合)[34] - **RankICIR**:2.752(稳定性最优参数组合)[34] - **多头端年化收益率**:14.5%(局部最优参数下)[36] 4. PCRC因子在不同宽基指数中的表现 - **沪深300**: - RankIC均值:2.19%[41] - RankICIR:0.93[41] - 年化超额收益率:4.18%(对冲组)[52] - 最大回撤:-4.00%(对冲组)[52] - **中证1000**: - RankIC均值:4.88%[41] - RankICIR:1.508[52] - 年化超额收益率:9.08%(对冲组)[52] - 最大回撤:-6.22%(对冲组)[52] - **国证2000**: - RankICIR:2.59[41] - 年化超额收益率:5.95%(对冲组)[52] - 最大回撤:-5.35%(对冲组)[52]
多因子ALPHA系列报告之(四十五):基于SEMIBETA的因子研究
广发证券· 2022-11-18 00:00
量化因子与构建方式 因子名称:传统Beta因子 - **因子的构建思路**:基于CAPM模型,传统Beta因子刻画了资产收益率对市场收益的敏感程度[11][12] - **因子具体构建过程**:通过滚动回溯过去20、60和120个交易日计算各股票换仓时点的传统Beta因子,公式如下: $$ E(R_{i})=R_{f}+\beta_{i}*(E(R_{m})-R_{f}) $$ 其中: - $E(R_{i})$:风险资产的预期收益率 - $R_{f}$:无风险收益率 - $E(R_{m})$:市场整体的预期收益率 - $\beta_{i}$:风险资产与市场整体的系统性风险系数[11][12] - **因子评价**:传统Beta因子在A股市场较难稳定贡献Alpha收益,高Beta个股未能带来稳定的超额收益[13] 因子名称:SemiBeta因子 - **因子的构建思路**:基于行为金融学中的损失厌恶理论,将传统Beta因子拆解为4个部分,分别反映市场和个股收益方向的不同[5][21][25] - **因子具体构建过程**: - SemiBeta因子公式: $$ \beta\equiv\frac{Cov(R_{i},R_{m})}{Var(R_{m})}=\frac{N+P+M^{+}+M^{-}}{Var(R_{m})} $$ 其中: - $N$:市场和个股均为负收益 - $P$:市场和个股均为正收益 - $M^{+}$:市场收益为正但个股收益为负 - $M^{-}$:市场收益为负但个股收益为正[21][22] - 进一步细化公式: $$ \beta_{t,i}^{N}=\frac{\sum_{k=1}^{m}r_{t,k,i}^{-}f_{t,k}^{-}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ $$ \beta_{t,i}^{P}=\frac{\sum_{k=1}^{m}r_{t,k,i}^{+}f_{t,k}^{+}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ $$ \beta_{t,i}^{M^{-}}=-\frac{\sum_{k=1}^{m}r_{t,k,i}^{+}f_{t,k}^{-}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ $$ \beta_{t,i}^{M^{+}}=-\frac{\sum_{k=1}^{m}r_{t,k,i}^{-}f_{t,k}^{+}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ 其中: - $r_{t,k,i}^{+}=\operatorname*{max}(r_{t,k,i},0)$ - $r_{t,k,i}^{-}=\operatorname*{min}(r_{t,k,i},0)$[28][29] - 回溯周期分别为20、60、120个交易日,市场基准包括沪深300、中证500、中证1000和创业板指,共构建48个细分因子[30][31] - **因子评价**:fBeta_MN系列因子表现较好,整体呈现负IC特征,回溯周期越短,回测总收益越高[5][34][55] --- 因子的回测效果 传统Beta因子 - **fBeta120D300**:IC为-1.8%,LS_IR为0.19,IC_IR为-0.14,年化收益为2.0%,胜率为54.9%,换股比例为27.1%[14] - **fBeta120D500**:IC为-1.4%,LS_IR为-0.17,IC_IR为-0.10,年化收益为-4.2%,胜率为52.1%,换股比例为24.4%[14] - **fBeta120D800**:IC为-2.2%,LS_IR为0.19,IC_IR为-0.16,年化收益为1.9%,胜率为51.4%,换股比例为26.5%[14] - **fBeta20D300**:IC为1.2%,LS_IR为0.52,IC_IR为0.05,年化收益为10.0%,胜率为51.4%,换股比例为78.5%[14] - **fBeta20D500**:IC为0.5%,LS_IR为0.83,IC_IR为0.08,年化收益为35.2%,胜率为54.9%,换股比例为75.4%[14] SemiBeta因子 - **fBeta_MN_60_S399006**:IC为-7.4%,LS_IR为1.88,IC_IR为-0.86,年化收益为128.7%,胜率为72.2%,换股比例为43.5%[5][34][55] - **fBeta_MN_20_S399006**:IC为-6.7%,LS_IR为1.97,IC_IR为-0.85,年化收益为180.0%,胜率为71.5%,换股比例为80.4%[34][65][73] - **fBeta_MN_120_S000852**:IC为-5.8%,LS_IR为1.64,IC_IR为-0.81,年化收益为76.5%,胜率为65.3%,换股比例为30.6%[34][46][47] --- 指数增强策略的回测效果 沪深300增强策略 - **年化收益**:6.2% - **年化超额收益**:约5% - **2022年初至今超额收益**:约7.2%[82][83][85] 中证500增强策略 - **年化收益**:12.4% - **年化超额收益**:约10% - **2022年初至今超额收益**:约12%[88][89][91] 中证1000增强策略 - **年化收益**:14.3% - **年化超额收益**:约12.8% - **2022年初至今超额收益**:约13.3%[93][94][96]
多因子ALPHA系列报告之(四十四):再谈地理关联度因子研究
广发证券· 2022-11-08 00:00
量化因子与构建方式 1. 因子名称:INDUCORR(行业相关系数因子) - **因子的构建思路**:衡量个股与其行业关联公司(不同省份但同申万一级行业)的整体相关程度[24][25] - **因子具体构建过程**: 1. 剔除停牌股、ST股、上市未满一年的股票[25] 2. 筛选与目标股票办公地所属省份不同但行业相同的股票[25] 3. 计算目标股票与筛选股票的日频收益序列皮尔森相关系数[25] 4. 对相关系数加权求和(默认等权),得到行业相关系数因子值[25] - 公式: $$ CORR_{i,j,t} = \frac{cov(R_{i}, R_{j})}{std(R_{i}) \cdot std(R_{j})} $$ $$ INDUCORR_{i,t} = \sum_{j=1}^{N} w_{j,t} \cdot CORR_{i,j,t} $$[25][26] - **因子评价**:能够有效挖掘股票间的行业关联信息,具有较高的选股区分度[50][75] 2. 因子名称:INDUCORRP(行业相关系数拆解因子之一) - **因子的构建思路**:基于收益序列的方向性拆解,度量个股与行业关联公司在正收益情况下的相关程度[27][29] - **因子具体构建过程**: 1. 将目标股票与行业关联股票的日度收益序列调整为正值(负值调整为0)[27][29] 2. 计算调整后的收益序列的皮尔森相关系数[29] 3. 对相关系数加权求和,得到因子值[29] - 公式: $$ R_{i}^{+} = max(R_{i}, 0) $$ $$ INDUCORRP_{i,t} = \sum_{j=1}^{N} w_{j} \cdot CORR(R_{i}^{+}, R_{j}^{+}) $$[29] - **因子评价**:通过拆解收益序列,更精确地度量了基于行业共性挖掘的正向共同基本面信息[75] --- 因子的回测效果 1. INDUCORR因子 - **IC均值**:0.071[51] - **IC胜率**:85.71%[51] - **年化超额收益率(多头相对中证500)**:14.98%[51] - **信息比率(IR)**:1.773[51] - **多头平均换手率**:77.90%[51] 2. INDUCORRP因子 - **IC均值**:0.065[51] - **IC胜率**:88.31%[51] - **年化超额收益率(多头相对中证500)**:15.32%[51] - **信息比率(IR)**:1.816[51] - **多头平均换手率**:81.03%[51] --- 因子的行业分组表现 INDUCORR因子 - **表现较好的行业**:机械设备、电子、汽车[78] - **IC均值**:机械设备(0.092)、电子(0.081)、汽车(0.104)[78] - **多空策略年化收益率**:汽车(29.78%)[78] - **多头相对基准策略信息比率**:机械设备(1.688)[78] INDUCORRP因子 - **表现较好的行业**:机械设备、汽车、基础化工[80] - **IC均值**:机械设备(0.081)、汽车(0.094)、基础化工(0.076)[80] - **多空策略年化收益率**:汽车(28.39%)[80] - **多头相对基准策略信息比率**:机械设备(1.733)[80] --- 因子的敏感性分析 1. 选股范围 - **INDUCORR因子**:在中证1000选股范围内表现最佳,年化超额收益率为12.50%,信息比率为1.440[92] - **INDUCORRP因子**:在中证1000选股范围内表现最佳,年化超额收益率为11.81%,信息比率为1.504[92] 2. 手续费费率 - **结果**:两种因子策略在扣除千五手续费后仍能获得超额收益,但手续费水平上升会降低策略净值表现[98]
20220904_开源证券_金融工程专题_大小单重定标与资金流因子改进_市场微观结构研究系列(16)
开源证券· 2022-09-04 00:00
量化模型与构建方式 1. 模型名称:NIR_MOD - 模型构建思路:通过设定金额阈值重新划定大、小单来捕捉资金流中的主力行为信息,并通过截面回归的方法剥离反转因素的影响以提纯资金流的Alpha信息[3][4] - 模型具体构建过程: 1. 设定金额阈值重新划定大、小单 2. 计算大单买入卖出金额比作为代理变量(IMB),公式为: $$ IMB = ln(B/S) $$ 3. 进行截面回归,剥离IMB与涨跌幅的相关性影响,公式为: $$ ln(B/S) = \alpha + \beta \times Ret + \varepsilon $$ 4. 基于修正系数反算大单买入和大单卖出的比例关系,并重新分配大单买入和卖出的成交金额,公式为: $$ \hat{B} = \frac{e^{\varepsilon}}{1+e^{\varepsilon}} \times (B+S) $$ $$ \hat{S} = \frac{1}{1+e^{\varepsilon}} \times (B+S) $$ - 模型评价:NIR_MOD因子相比NIR因子选股能力明显提升[3][4][43] 2. 模型名称:CNIR - 模型构建思路:将Wind的超大单、大单和中单合并,定义为有定价权的"广义主力资金",在NIR_MOD的基础上构造CNIR因子[6][87] - 模型具体构建过程: 1. 分别计算主力资金的买入金额和卖出金额: $$ BP = B_{Extra} + B_{Large} + B_{Med} $$ $$ SP = S_{Extra} + S_{Large} + S_{Med} $$ 2. 利用日涨跌幅来修正主力资金的买入金额和卖出金额: $$ ln(BP/SP) = \alpha + \beta Ret + \varepsilon $$ 3. 计算主力资金的净流入占比,即为CNIR因子: $$ CNIR = \frac{\sum (B_{P,i} - S_{P,i})}{\sum (B_{P,i} + S_{P,i})} $$ - 模型评价:CNIR因子在全市场上表现优于NIR_MOD因子,收益显著增厚[87][88][95] 模型的回测效果 1. NIR_MOD模型 - Rank IC:0.049[45] - Rank ICIR:4.196[45] - 多空IR:4.766[45] - 多空收益:20.77%[45] - 多空最大回撤:-2.95%[45] - 胜率:77.68%[45] 2. CNIR模型 - Rank IC:0.056[100] - Rank ICIR:3.647[100] - 多空IR:4.91[95] - 多空收益:27.86%[95] - 多空最大回撤:48.79%[93] - 胜率:76.14%[100] 量化因子与构建方式 1. 因子名称:NIR_MOD - 因子的构建思路:通过设定金额阈值重新划定大、小单来捕捉资金流中的主力行为信息,并通过截面回归的方法剥离反转因素的影响以提纯资金流的Alpha信息[3][4] - 因子具体构建过程: 1. 设定金额阈值重新划定大、小单 2. 计算大单买入卖出金额比作为代理变量(IMB),公式为: $$ IMB = ln(B/S) $$ 3. 进行截面回归,剥离IMB与涨跌幅的相关性影响,公式为: $$ ln(B/S) = \alpha + \beta \times Ret + \varepsilon $$ 4. 基于修正系数反算大单买入和大单卖出的比例关系,并重新分配大单买入和卖出的成交金额,公式为: $$ \hat{B} = \frac{e^{\varepsilon}}{1+e^{\varepsilon}} \times (B+S) $$ $$ \hat{S} = \frac{1}{1+e^{\varepsilon}} \times (B+S) $$ - 因子评价:NIR_MOD因子相比NIR因子选股能力明显提升[3][4][43] 2. 因子名称:CNIR - 因子的构建思路:将Wind的超大单、大单和中单合并,定义为有定价权的"广义主力资金",在NIR_MOD的基础上构造CNIR因子[6][87] - 因子具体构建过程: 1. 分别计算主力资金的买入金额和卖出金额: $$ BP = B_{Extra} + B_{Large} + B_{Med} $$ $$ SP = S_{Extra} + S_{Large} + S_{Med} $$ 2. 利用日涨跌幅来修正主力资金的买入金额和卖出金额: $$ ln(BP/SP) = \alpha + \beta Ret + \varepsilon $$ 3. 计算主力资金的净流入占比,即为CNIR因子: $$ CNIR = \frac{\sum (B_{P,i} - S_{P,i})}{\sum (B_{P,i} + S_{P,i})} $$ - 因子评价:CNIR因子在全市场上表现优于NIR_MOD因子,收益显著增厚[87][88][95] 因子的回测效果 1. NIR_MOD因子 - Rank IC:0.049[45] - Rank ICIR:4.196[45] - 多空IR:4.766[45] - 多空收益:20.77%[45] - 多空最大回撤:-2.95%[45] - 胜率:77.68%[45] 2. CNIR因子 - Rank IC:0.056[100] - Rank ICIR:3.647[100] - 多空IR:4.91[95] - 多空收益:27.86%[95] - 多空最大回撤:48.79%[93] - 胜率:76.14%[100]
多因子ALPHA系列报告之(四十三):基于地理关联度因子研究
广发证券· 2022-08-31 00:00
量化因子与构建方式 1. **因子名称:地理相关系数因子 (GEOGCORR)** - **因子构建思路**:通过计算个股与其地理关联公司股票之间的整体相关程度,构建地理相关系数因子,用于预测个股未来收益[7][38] - **因子具体构建过程**: 1. 在全市场范围内剔除ST/*ST、停牌股及上市不满一年的股票 2. 筛选出与目标股票办公地所属省份相同、申万一级行业不同的所有股票 3. 计算目标股票与每支关联股票在月度日频收益序列的皮尔森相关系数 4. 对所有相关系数进行加权求和,得到地理相关系数因子 公式: $$CORR_{i,j,t}=\frac{cov(R_{i},R_{j})}{std(R_{i})*std(R_{j})}$$ $$GEOGCORR_{i,t}=\sum_{j=1}^{N}w_{j,t}*CORR_{i,j,t}$$ 其中,$w_{j,t}$为权重,通常设置为等权[39] 2. **因子名称:地理相关系数变动因子 (GEOGCORRCHG)** - **因子构建思路**:通过计算个股与地理关联公司股票相关程度的变动,构建地理相关系数变动因子,用于捕捉相关性的变化对个股收益的影响[41] - **因子具体构建过程**: 1. 计算目标股票与关联股票在月度日频收益序列的相关系数 2. 计算目标股票与关联股票在过去3个月的日频收益序列的相关系数 3. 计算两者相关系数的差值,衡量相关性的变动程度 4. 对所有关联股票的相关系数差值进行加权求和,得到地理相关系数变动因子 公式: $$GEOGCORRCHG_{i,t}=\sum_{j=1}^{N}w_{j,t}*(CORR_{i,j,t}-CORR_{i,j,t-2,t})$$ 3. **因子名称:地理相关系数拆解因子 (GEOGCORRP, GEOGCORRN, GEOGCORRIP, GEOGCORRJP)** - **因子构建思路**:通过将个股与地理关联公司股票的收益序列拆分为正收益和负收益,构建四种地理相关系数拆解因子,用于捕捉不同方向收益序列的相关性对个股收益的影响[43] - **因子具体构建过程**: 1. 对目标股票与关联股票的日度收益序列进行调整,将负收益调整为0 2. 分别计算正收益序列与正收益序列、负收益序列与负收益序列、正收益序列与负收益序列、负收益序列与正收益序列的相关系数 3. 对所有相关系数进行加权求和,得到四种地理相关系数拆解因子 公式: $$R_{i}^{+}=max(R_{i},0)$$ $$R_{i}^{-}=min(R_{i},0)$$ $$GEOGCORRP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{+},R_{j}^{+})$$ $$GEOGCORRN_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{-},R_{j}^{-})$$ $$GEOGCORRIP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{+},R_{j}^{-})$$ $$GEOGCORRJP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{-},R_{j}^{+})$$ 因子的回测效果 1. **GEOGCORR因子** - IC均值:0.074 - 正IC占比:88.00% - 多空策略年化收益率:22.11% - 多空策略信息比率:2.84 - 多头相对中证500策略年化收益率:13.21% - 多头相对中证500策略信息比率:1.55 - 多头平均换手率:77.77%[78][79][80] 2. **GEOGCORRP因子** - IC均值:0.069 - 正IC占比:90.00% - 多空策略年化收益率:21.19% - 多空策略信息比率:3.234 - 多头相对中证500策略年化收益率:13.98% - 多头相对中证500策略信息比率:1.706 - 多头平均换手率:81.92%[78][92][96] 3. **GEOGCORRIP因子** - IC均值:0.063 - 正IC占比:88.67% - 多空策略年化收益率:18.92% - 多空策略信息比率:3.099 - 多头相对中证500策略年化收益率:13.48% - 多头相对中证500策略信息比率:1.659 - 多头平均换手率:84.62%[78][104]
高频数据因子研究系列九:基于股价跳跃模型的因子研究
广发证券· 2022-08-31 00:00
量化因子与构建方式 因子名称:SRJV_week - **因子的构建思路** 基于跳跃波动分量的分解,提取股价波动中的上下行跳跃波动不对称性信息[5][24][33] - **因子具体构建过程** 使用已实现波动率分解为上行分量和下行分量,计算公式如下: $ SJ_{t} = RV_{t}^{+} - RV_{t}^{-} $ 归一化因子公式: $ RSJ_{t} = \frac{RV_{t}^{+} - RV_{t}^{-}}{RV_{t}} $ 其中 $ RV_{t}^{+} $ 和 $ RV_{t}^{-} $ 分别表示上行和下行跳跃波动[25][26][33] - **因子评价** 因子表现稳定,IC均值和多空收益均较高,风格相关性较低,行业暴露无明显偏离[5][139][187] 因子名称:RJVP_week - **因子的构建思路** 提取股价波动中的上行跳跃波动信息,关注上行跳跃对收益率的预测作用[5][24][33] - **因子具体构建过程** 使用已实现波动率的上行跳跃分量,计算公式如下: $ RJVP_{t} = \sum_{i=1}^{n} r_{i,t}^{2} I_{\{r_{i,t} > 0\}} $ 归一化因子公式: $ RRJVP_{t} = \frac{RJVP_{t}}{RV_{t}} $ 其中 $ r_{i,t} $ 表示高频区间内股价的对数收益率[25][33][34] - **因子评价** 因子表现稳定,IC均值和多空收益较高,与残差波动率因子、BP、流动性因子相关性较高[5][152][187] 因子名称:RLJVP_week - **因子的构建思路** 提取股价波动中的大程上行跳跃波动信息,关注大程跳跃对收益率的预测作用[5][27][33] - **因子具体构建过程** 使用已实现波动率的跳跃分量分解为大程跳跃波动,计算公式如下: $ RLJVP_{t} = min(RJV_{t}, \sum_{i=1}^{n} r_{i,t}^{2} I_{\{|r_{i,t}| > \gamma\}}) $ 其中 $\gamma$ 为阈值参数,归一化因子公式: $ RRLJVP_{t} = \frac{RLJVP_{t}}{RV_{t}} $ 其中 $ r_{i,t} $ 表示高频区间内股价的对数收益率[27][33][34] - **因子评价** 因子表现稳定,IC均值和多空收益较高,与残差波动率因子、BP、流动性因子相关性较高[5][163][187] 因子名称:SRLJV_week - **因子的构建思路** 提取股价波动中的上下行大程跳跃波动不对称性信息[5][27][33] - **因子具体构建过程** 使用已实现波动率的跳跃分量分解为上下行大程跳跃波动不对称性,计算公式如下: $ SRLJV_{t} = RLJVP_{t} - RLJVN_{t} $ 归一化因子公式: $ RSRLJV_{t} = \frac{SRLJV_{t}}{RV_{t}} $ 其中 $ RLJVP_{t} $ 和 $ RLJVN_{t} $ 分别表示大程上行和下行跳跃波动[27][33][34] - **因子评价** 因子表现稳定,IC均值和多空收益较高,风格相关性较低,行业暴露无明显偏离[5][171][187] --- 因子的回测效果 周度未归一化因子 - **SRJV_week** IC均值:-8.76% 年化ICIR:-8.91 多空年化:45.97% 多空夏普:4.40 最大回撤:9.58%[126][130][139] - **RJVP_week** IC均值:-8.58% 年化ICIR:-7.29 多空年化:43.85% 多空夏普:3.45 最大回撤:12.84%[126][130][152] - **RLJVP_week** IC均值:-8.26% 年化ICIR:-8.68 多空年化:42.16% 多空夏普:4.13 最大回撤:9.07%[126][130][163] - **SRLJV_week** IC均值:-7.88% 年化ICIR:-9.57 多空年化:37.19% 多空夏普:4.05 最大回撤:8.54%[126][130][171] 周度归一化因子 - **SRJV_week** IC均值:-7.24% 年化ICIR:-7.19 多空年化:30.40% 多空夏普:3.05 最大回撤:8.98%[131][132][139] - **RJVP_week** IC均值:-6.00% 年化ICIR:-5.43 多空年化:25.08% 多空夏普:2.49 最大回撤:11.62%[131][132][152] - **RLJVP_week** IC均值:-5.34% 年化ICIR:-6.67 多空年化:15.03% 多空夏普:1.86 最大回撤:12.92%[131][132][163] - **SRLJV_week** IC均值:-6.16% 年化ICIR:-8.48 多空年化:17.24% 多空夏普:2.18 最大回撤:8.67%[131][132][171] 月度未归一化因子 - **SRJV_month** IC均值:-9.33% 年化ICIR:-5.56 多空年化:30.60% 多空夏普:3.82 最大回撤:9.53%[133][134][139] - **RJVP_month** IC均值:-9.15% 年化ICIR:-3.51 多空年化:26.82% 多空夏普:2.35 最大回撤:11.39%[133][134][152] - **RLJVP_month** IC均值:-9.04% 年化ICIR:-3.99 多空年化:28.79% 多空夏普:2.92 最大回撤:10.49%[133][134][163] - **SRLJV_month** IC均值:-8.89% 年化ICIR:-5.44 多空年化:29.16% 多空夏普:3.75 最大回撤:9.14%[133][134][171] 月度归一化因子 - **SRJV_month** IC均值:-7.43% 年化ICIR:-4.33 多空年化:24.17% 多空夏普:3.23 最大回撤:7.28%[135][137][139] - **RJVP_month** IC均值:-4.79% 年化ICIR:-1.96 多空年化:15.60% 多空夏普:1.83 最大回撤:14.85%[135][137][152] - **RLJVP_month** IC均值:-4.41% 年化ICIR:-2.32 多空年化:11.63% 多空夏普:1.47 最大回撤:15.43%[135][137][163] - **SRLJV_month**
20220806_开源证券_金融工程专题_盈利预期调整优选组合的构建_金融工程团队_20220806
开源证券· 2022-08-06 00:00
量化模型与构建方式 盈利预期调整因子 FYR_DISP - **因子名称**:FYR_DISP - **因子的构建思路**:通过分析师盈利预期调整的分歧度标准化,捕捉分析师预期调整对股票价格的影响[5][31][32] - **因子具体构建过程**: 1. 每月底回看过去180天,计算所有分析师最近一期的盈利预期调整值 $\Delta FY_{i,j,t}$,并求平均得到因子值 $FYR\_DISP_{i,t}$ 2. 公式为: $$ FYR\_DISP_{i,t} = \frac{\sum_{j=1}^{m}\Delta FY_{i,j,t}/m}{std(\Delta FY_{i,j,t})/\sqrt{m}} $$ 其中,$m$为分析师覆盖数,$std$为标准差[32] 3. 若分析师覆盖数小于3,则因子值被设置为空值[31][32] - **因子评价**:FYR_DISP在IC均值、ICIR、多空对冲和多头表现上均优于其他标准化方式,覆盖度较高,效果最佳[33][35] 改进后的盈利预期调整因子 FYR_DISP_strength - **因子名称**:FYR_DISP_strength - **因子的构建思路**:在FYR_DISP的基础上,结合时间加权和股价跟随性加权,提升因子效果[5][34][49] - **因子具体构建过程**: 1. **时间加权**: - 使用半衰期加权法,权重公式为: $$ W_{\Delta t1_{i,j}} = \frac{2^{-\Delta t1_{i,j}/N}}{\sum_{j=1}^{m}2^{-\Delta t1_{i,j}/N}} $$ 其中,$\Delta t1$为前后两次预测间隔时间差,$N$为半衰期参数[36] - 合成时间加权权重$\Delta t$,并归一化[39][40] 2. **股价跟随性加权**: - 若盈利预期调整与股票前60天的超额收益方向一致,赋予权重$A$,反之赋予$1-A$,最后归一化[43][44] - 参数敏感性分析后,选取$A=0.3$[45] 3. **综合加权**:将时间加权和股价跟随性加权相乘并归一化,得到最终权重[49] - **因子评价**:改进后的因子多空对冲信息比率从2.38提升至3.14,最大回撤从6.83%降至3.92%,效果显著提升[49][55] 羊群效应因子 ∆CSAD_FR - **因子名称**:∆CSAD_FR - **因子的构建思路**:通过分析师预测值与一致预期的偏离程度,捕捉分析师羊群效应的变化[57][60] - **因子具体构建过程**: 1. 定义分析师羊群效应指标: $$ CSAD\_FR_{i,t} = \frac{1}{m}\sum_{j=1}^{m}|fr_{i,j,t} - fr_{i,con,t}| $$ 其中,$fr_{i,j,t}$为分析师预测值,$fr_{i,con,t}$为一致预期[57] 2. 定义羊群效应变动因子: $$ \Delta CSAD\_FR_{i,t} = \frac{CSAD\_FR_{i,t} - \frac{1}{N}\sum_{k=0}^{N-1}CSAD\_FR_{i,t-k}}{\frac{1}{N}\sum_{k=0}^{N-1}CSAD\_FR_{i,t-k}} $$ 其中,$N$为回看窗口期[60] - **因子评价**:在盈利预期上调股票池中,∆CSAD_FR呈现正向选股能力,多空对冲信息比率为0.60[62][63] 动量与反转合成因子 R_M - **因子名称**:R_M - **因子的构建思路**:结合动量因子和反转因子,综合捕捉股票的动量与反转效应[76] - **因子具体构建过程**: 1. 动量因子包括长端动量、分析师关联动量、盈利预期调整OER因子[67][69][72] 2. 反转因子采用M_High[65] 3. 动量因子正序排列,反转因子逆序排列,排序相加后形成合成因子R_M[76] - **因子评价**:R_M因子在盈利预期上调股票池的多空对冲信息比率为1.30,整体绩效较优[79] 大单残差因子 - **因子名称**:大单残差 - **因子的构建思路**:通过大单资金流的残差,捕捉资金流强度对股票价格的影响[79] - **因子具体构建过程**: 1. 每月底回看过去20天,计算大单残差[80] 2. 不筛选特定交易日,统一计算因子值[80] - **因子评价**:在盈利预期上调股票池内,多空对冲信息比率为1.76,选股效果显著[84] 评级变动因子 - **因子名称**:评级变动因子 - **因子的构建思路**:通过分析师评级的上调或下调,捕捉评级变动对股票价格的影响[85] - **因子具体构建过程**: 1. 每月底回看过去180天,计算评级上调分析师个数减去评级下调分析师个数[85] 2. 若结果大于0,则评级上调;小于0,则评级下调[85] - **因子评价**:在盈利预期上调股票池内,评级上调对冲评级下调后的信息比率为1.41[87][91] --- 因子的回测效果 盈利预期调整因子 FYR_DISP - ICIR:2.38 - 多空对冲年化收益:14.95% - 最大回撤:6.83%[35] 改进后的盈利预期调整因子 FYR_DISP_strength - ICIR:3.14 - 多空对冲年化收益:15.48% - 最大回撤:3.92%[55] 羊群效应因子 ∆CSAD_FR - 多空对冲信息比率:0.60[63] 动量与反转合成因子 R_M - 多空对冲信息比率:1.30[79] 大单残差因子 - 多空对冲信息比率:1.76[84] 评级变动因子 - 多空对冲信息比率:1.41[91]
20220721_开源证券_金融工程专题_从小单资金流行为到股票关联网络_金工团队研究_20220721
开源证券· 2022-07-21 00:00
量化模型与构建方式 1. 模型名称:小单资金流关联网络 - 模型构建思路:通过小单资金流的行为协同,识别股票间的关联关系,构建股票关联网络[3][4] - 模型具体构建过程: 1. 选点:选定关联网络所覆盖股票池(网络节点)[14] 2. 连线:寻找股票之间的关联关系(关联线)[14] 3. 定粗细:确定股票间的关联性强弱(关联度指标)[14] 4. 计算预期收益率:将个股关联股票涨跌幅按关联度加权,作为个股当月预期收益率(正向因子)[14] 5. 中性化处理:做反转、市值、行业中性化处理[14] 6. 得到关联网络牵引因子:将个股当月预期收益与真实收益对比,若上涨不及预期,则未来倾向于出现补涨行情[14] - 模型评价:通过小单资金流的行为协同,识别股票间的关联关系,构建股票关联网络[3][4] 量化因子与构建方式 1. 因子名称:Traction-SI 因子 - 因子的构建思路:基于小单资金流关联网络,构建关联网络牵引因子[5] - 因子具体构建过程: 1. 根据关联网络刻画的股票关联关系,放大高关联股票涨跌幅权重,缩小低关联股票涨跌幅权重,重构股票 A 当月收益对比的基准[5] 2. 预期收益因子做 20 日反转、市值、行业中性化处理[5] 3. 衡量股票当月预期收益与真实收益之间的预期差,得到 Traction-SI 因子[5] - 因子评价:Traction-SI 因子表现稳健,与常见因子相关性均保持较低水平[5][46] 2. 因子名称:Traction45p-SI 因子 - 因子的构建思路:对关联网络进行稀疏处理,剔除关联度指标低于 N%阈值的关联线,保留高于 N%阈值的关联线[51] - 因子具体构建过程: 1. 稀疏阈值在 40%至 50%范围内达到有效性峰值,选 45%作为稀疏阈值,构建 Traction45p-SI 因子[51] - 因子评价:因子有效性呈先升后降的变化趋势,稀疏处理后因子表现稳健[51][55] 3. 因子名称:Traction5d-SI 因子 - 因子的构建思路:考虑到日度小单净流入数据连续性较弱,滚动取过去 N 日的小单累计净流入数据,构建股票间同向比例指标[56] - 因子具体构建过程: 1. 随着累计天数增加,因子有效性逐渐提高,在累计天数超过 4 天后,因子有效性达到基本稳定状态,取 5 日小单累计净流入数据,构建 Traction5d-SI 因子[56] - 因子评价:因子有效性在累计天数超过 4 天后达到相对稳定状态[56][57] 4. 因子名称:TractionCorr-SI 因子 - 因子的构建思路:综合考虑小单净流入的方向协同与规模协同[61] - 因子具体构建过程: 1. 按照小单净流入成交占比计算余弦相似度,参考转换关系计算新的关联度指标,构建 TractionCorr-SI 因子[61] - 因子评价:因子表现稳健,综合考虑了方向协同与规模协同[61][62] 5. 因子名称:Traction-SIO 因子 - 因子的构建思路:基于小单净流入反向比例构建股票关联网络[68] - 因子具体构建过程: 1. 计算小单净流入反向比例,构建 Traction-SIO 因子[68] - 因子评价:反向协同弱于同向协同,因子表现较弱[68][72] 6. 因子名称:Traction-LI 因子 - 因子的构建思路:通过大单净流入同向比例构建股票关联网络[73] - 因子具体构建过程: 1. 计算大单净流入同向比例,构建 Traction-LI 因子[73] - 因子评价:因子表现稳健,但收益率略低于小单资金流因子[73][74] 模型的回测效果 1. Traction-SI 因子,RankIC 均值 3.98%,RankICIR 2.74,多空组合年化收益 13.91%,年化 IR 2.99,最大回撤 6.93%,月度胜率 80.27%[5][36][38] 2. Traction45p-SI 因子,RankIC 均值 4.4%,RankICIR 3.78,多空组合年化收益 14.22%,年化 IR 3.34,最大回撤 3.86%,月度胜率 81.63%[55] 3. Traction5d-SI 因子,RankIC 均值 4.85%,RankICIR 3.65,多空组合年化收益 15.5%,年化 IR 3.2,最大回撤 5.36%,月度胜率 80.95%[57] 4. TractionCorr-SI 因子,RankIC 均值 4.27%,RankICIR 2.71,多空组合年化收益 14.57%,年化 IR 2.92,最大回撤 7.34%,月度胜率 76.19%[62] 5. Traction-SIO 因子,RankIC 均值 -3.63%,RankICIR -2.25,多空组合年化收益 12.24%,年化 IR 2.5,最大回撤 7.68%,月度胜率 75.51%[68] 6. Traction-LI 因子,RankIC 均值 3.54%,RankICIR 2.47,多空组合年化收益 10.35%,年化 IR 2.13,最大回撤 6.69%,月度胜率 73.47%[73]
20220718-国盛证券-量化专题报告:PEAD.notice:基于预告的盈余惊喜选股策略
国盛证券· 2022-07-18 00:00
量化模型与构建方式 1. 模型名称:PEAD.notice选股策略 - **模型构建思路**:基于上市公司财报相对业绩预告的盈余惊喜程度,结合企业生命周期理论,筛选出具有成长性且盈余超预期的股票[3][63][67] - **模型具体构建过程**: 1. **数据筛选**:在每年2、4、8、10月末,回溯股票最近2个月的盈余披露信息,筛选出以下条件的股票: - 业绩预增:业绩预告利润中值大于去年同期利润,且二者非负 - 盈余惊喜:正式财报/业绩快报中真实利润大于业绩预告利润中值 - 生命周期:企业生命周期阶段为成长期或成熟期[63][67] 2. **排序与筛选**:按照盈余惊喜程度(p_score因子)从高到低排序,剔除尾端25%的股票,选取指标值最高的150只股票构建盈余惊喜股票池[65] 3. **因子优化**:结合估值、财务质量和技术特征因子(如BP、EP、ROE等),对股票池进一步筛选,最终选取30只股票构建PEAD.notice组合[74][75] - **模型评价**:PEAD.notice策略偏向中小市值机构冷门股,收益显著且稳健,与基于分析师文本信息的PEAD.text策略在收益分布和持仓风格上具有互补性[3][86] --- 模型的回测效果 1. PEAD.notice选股策略 - **年化收益**:41.3%[78] - **相对中证500指数年化超额收益**:35.0%[78] - **月度胜率**:79.2%[78] - **信息比率(IR)**:2.64[78] --- 量化因子与构建方式 1. 因子名称:p_score因子 - **因子构建思路**:衡量财报真实利润相对业绩预告预计利润的盈余惊喜程度,p_score值越高,盈余惊喜程度越大[2][32] - **因子具体构建过程**: 1. 定义公式: $$p\_score=\ (p\_real-p\_min)/(p\_max-p\_min)$$ 其中,$p\_real$为正式财报的真实利润,$p\_min$和$p\_max$分别为预计利润区间的上下限[32] 2. 数据调整:当预计利润上/下限相等或之一缺失时,按照上下限偏离均值(10%和20%)进行调整[33][34] 3. 数据分组:将股票按p_score值分组,验证因子在不同分组的超额收益表现[34] - **因子评价**:p_score因子在有预告股票样本池中表现出显著的选股能力,年化多空收益超过15%,月度IC均值3.0%,ICIR为2.89,但覆盖率较低,仅为46.2%[36][39] 2. 因子名称:生命周期因子 - **因子构建思路**:基于企业现金流特征划分生命周期阶段,筛选出处于成长期和成熟期的企业[47][49] - **因子具体构建过程**: 1. **现金流划分**:根据经营、投资、筹资活动的现金流净额正负,将企业分为8种类型[47] 2. **生命周期分类**:按照现金流特征,将企业划分为初创期、成长期、成熟期、衰退期和死亡期5个阶段[49][54] 3. **因子赋值**:将生命周期阶段重新分组为3个阶段(初创/死亡期为阶段1,成长期/衰退期为阶段2,成熟期为阶段3),并赋值1、2、3[55] 4. **因子测试**:在中证800和中证1000指数成分股中测试因子表现,验证生命周期因子与股票未来超额收益的正相关性[55] - **因子评价**:生命周期因子在全A股市场具有良好的区分效果,尤其在成长期和成熟期企业中表现出显著的超额收益[57][59] --- 因子的回测效果 1. p_score因子 - **年化多空收益**:15.3%[36] - **月度IC均值**:3.0%[36] - **ICIR**:2.89[36] - **覆盖率**:46.2%[36] 2. 生命周期因子 - **月度Rank IC均值**:2.4%[55] - **ICIR**:1.30[55] - **分组超额收益**:阶段3(成熟期)企业的超额收益显著高于阶段1(初创/死亡期)企业[56]