Workflow
多因子ALPHA系列报告之(四十三):基于地理关联度因子研究
广发证券· 2022-08-31 00:00
量化因子与构建方式 1. **因子名称:地理相关系数因子 (GEOGCORR)** - **因子构建思路**:通过计算个股与其地理关联公司股票之间的整体相关程度,构建地理相关系数因子,用于预测个股未来收益[7][38] - **因子具体构建过程**: 1. 在全市场范围内剔除ST/*ST、停牌股及上市不满一年的股票 2. 筛选出与目标股票办公地所属省份相同、申万一级行业不同的所有股票 3. 计算目标股票与每支关联股票在月度日频收益序列的皮尔森相关系数 4. 对所有相关系数进行加权求和,得到地理相关系数因子 公式: $$CORR_{i,j,t}=\frac{cov(R_{i},R_{j})}{std(R_{i})*std(R_{j})}$$ $$GEOGCORR_{i,t}=\sum_{j=1}^{N}w_{j,t}*CORR_{i,j,t}$$ 其中,$w_{j,t}$为权重,通常设置为等权[39] 2. **因子名称:地理相关系数变动因子 (GEOGCORRCHG)** - **因子构建思路**:通过计算个股与地理关联公司股票相关程度的变动,构建地理相关系数变动因子,用于捕捉相关性的变化对个股收益的影响[41] - **因子具体构建过程**: 1. 计算目标股票与关联股票在月度日频收益序列的相关系数 2. 计算目标股票与关联股票在过去3个月的日频收益序列的相关系数 3. 计算两者相关系数的差值,衡量相关性的变动程度 4. 对所有关联股票的相关系数差值进行加权求和,得到地理相关系数变动因子 公式: $$GEOGCORRCHG_{i,t}=\sum_{j=1}^{N}w_{j,t}*(CORR_{i,j,t}-CORR_{i,j,t-2,t})$$ 3. **因子名称:地理相关系数拆解因子 (GEOGCORRP, GEOGCORRN, GEOGCORRIP, GEOGCORRJP)** - **因子构建思路**:通过将个股与地理关联公司股票的收益序列拆分为正收益和负收益,构建四种地理相关系数拆解因子,用于捕捉不同方向收益序列的相关性对个股收益的影响[43] - **因子具体构建过程**: 1. 对目标股票与关联股票的日度收益序列进行调整,将负收益调整为0 2. 分别计算正收益序列与正收益序列、负收益序列与负收益序列、正收益序列与负收益序列、负收益序列与正收益序列的相关系数 3. 对所有相关系数进行加权求和,得到四种地理相关系数拆解因子 公式: $$R_{i}^{+}=max(R_{i},0)$$ $$R_{i}^{-}=min(R_{i},0)$$ $$GEOGCORRP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{+},R_{j}^{+})$$ $$GEOGCORRN_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{-},R_{j}^{-})$$ $$GEOGCORRIP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{+},R_{j}^{-})$$ $$GEOGCORRJP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{-},R_{j}^{+})$$ 因子的回测效果 1. **GEOGCORR因子** - IC均值:0.074 - 正IC占比:88.00% - 多空策略年化收益率:22.11% - 多空策略信息比率:2.84 - 多头相对中证500策略年化收益率:13.21% - 多头相对中证500策略信息比率:1.55 - 多头平均换手率:77.77%[78][79][80] 2. **GEOGCORRP因子** - IC均值:0.069 - 正IC占比:90.00% - 多空策略年化收益率:21.19% - 多空策略信息比率:3.234 - 多头相对中证500策略年化收益率:13.98% - 多头相对中证500策略信息比率:1.706 - 多头平均换手率:81.92%[78][92][96] 3. **GEOGCORRIP因子** - IC均值:0.063 - 正IC占比:88.67% - 多空策略年化收益率:18.92% - 多空策略信息比率:3.099 - 多头相对中证500策略年化收益率:13.48% - 多头相对中证500策略信息比率:1.659 - 多头平均换手率:84.62%[78][104]
高频数据因子研究系列九:基于股价跳跃模型的因子研究
广发证券· 2022-08-31 00:00
量化因子与构建方式 因子名称:SRJV_week - **因子的构建思路** 基于跳跃波动分量的分解,提取股价波动中的上下行跳跃波动不对称性信息[5][24][33] - **因子具体构建过程** 使用已实现波动率分解为上行分量和下行分量,计算公式如下: $ SJ_{t} = RV_{t}^{+} - RV_{t}^{-} $ 归一化因子公式: $ RSJ_{t} = \frac{RV_{t}^{+} - RV_{t}^{-}}{RV_{t}} $ 其中 $ RV_{t}^{+} $ 和 $ RV_{t}^{-} $ 分别表示上行和下行跳跃波动[25][26][33] - **因子评价** 因子表现稳定,IC均值和多空收益均较高,风格相关性较低,行业暴露无明显偏离[5][139][187] 因子名称:RJVP_week - **因子的构建思路** 提取股价波动中的上行跳跃波动信息,关注上行跳跃对收益率的预测作用[5][24][33] - **因子具体构建过程** 使用已实现波动率的上行跳跃分量,计算公式如下: $ RJVP_{t} = \sum_{i=1}^{n} r_{i,t}^{2} I_{\{r_{i,t} > 0\}} $ 归一化因子公式: $ RRJVP_{t} = \frac{RJVP_{t}}{RV_{t}} $ 其中 $ r_{i,t} $ 表示高频区间内股价的对数收益率[25][33][34] - **因子评价** 因子表现稳定,IC均值和多空收益较高,与残差波动率因子、BP、流动性因子相关性较高[5][152][187] 因子名称:RLJVP_week - **因子的构建思路** 提取股价波动中的大程上行跳跃波动信息,关注大程跳跃对收益率的预测作用[5][27][33] - **因子具体构建过程** 使用已实现波动率的跳跃分量分解为大程跳跃波动,计算公式如下: $ RLJVP_{t} = min(RJV_{t}, \sum_{i=1}^{n} r_{i,t}^{2} I_{\{|r_{i,t}| > \gamma\}}) $ 其中 $\gamma$ 为阈值参数,归一化因子公式: $ RRLJVP_{t} = \frac{RLJVP_{t}}{RV_{t}} $ 其中 $ r_{i,t} $ 表示高频区间内股价的对数收益率[27][33][34] - **因子评价** 因子表现稳定,IC均值和多空收益较高,与残差波动率因子、BP、流动性因子相关性较高[5][163][187] 因子名称:SRLJV_week - **因子的构建思路** 提取股价波动中的上下行大程跳跃波动不对称性信息[5][27][33] - **因子具体构建过程** 使用已实现波动率的跳跃分量分解为上下行大程跳跃波动不对称性,计算公式如下: $ SRLJV_{t} = RLJVP_{t} - RLJVN_{t} $ 归一化因子公式: $ RSRLJV_{t} = \frac{SRLJV_{t}}{RV_{t}} $ 其中 $ RLJVP_{t} $ 和 $ RLJVN_{t} $ 分别表示大程上行和下行跳跃波动[27][33][34] - **因子评价** 因子表现稳定,IC均值和多空收益较高,风格相关性较低,行业暴露无明显偏离[5][171][187] --- 因子的回测效果 周度未归一化因子 - **SRJV_week** IC均值:-8.76% 年化ICIR:-8.91 多空年化:45.97% 多空夏普:4.40 最大回撤:9.58%[126][130][139] - **RJVP_week** IC均值:-8.58% 年化ICIR:-7.29 多空年化:43.85% 多空夏普:3.45 最大回撤:12.84%[126][130][152] - **RLJVP_week** IC均值:-8.26% 年化ICIR:-8.68 多空年化:42.16% 多空夏普:4.13 最大回撤:9.07%[126][130][163] - **SRLJV_week** IC均值:-7.88% 年化ICIR:-9.57 多空年化:37.19% 多空夏普:4.05 最大回撤:8.54%[126][130][171] 周度归一化因子 - **SRJV_week** IC均值:-7.24% 年化ICIR:-7.19 多空年化:30.40% 多空夏普:3.05 最大回撤:8.98%[131][132][139] - **RJVP_week** IC均值:-6.00% 年化ICIR:-5.43 多空年化:25.08% 多空夏普:2.49 最大回撤:11.62%[131][132][152] - **RLJVP_week** IC均值:-5.34% 年化ICIR:-6.67 多空年化:15.03% 多空夏普:1.86 最大回撤:12.92%[131][132][163] - **SRLJV_week** IC均值:-6.16% 年化ICIR:-8.48 多空年化:17.24% 多空夏普:2.18 最大回撤:8.67%[131][132][171] 月度未归一化因子 - **SRJV_month** IC均值:-9.33% 年化ICIR:-5.56 多空年化:30.60% 多空夏普:3.82 最大回撤:9.53%[133][134][139] - **RJVP_month** IC均值:-9.15% 年化ICIR:-3.51 多空年化:26.82% 多空夏普:2.35 最大回撤:11.39%[133][134][152] - **RLJVP_month** IC均值:-9.04% 年化ICIR:-3.99 多空年化:28.79% 多空夏普:2.92 最大回撤:10.49%[133][134][163] - **SRLJV_month** IC均值:-8.89% 年化ICIR:-5.44 多空年化:29.16% 多空夏普:3.75 最大回撤:9.14%[133][134][171] 月度归一化因子 - **SRJV_month** IC均值:-7.43% 年化ICIR:-4.33 多空年化:24.17% 多空夏普:3.23 最大回撤:7.28%[135][137][139] - **RJVP_month** IC均值:-4.79% 年化ICIR:-1.96 多空年化:15.60% 多空夏普:1.83 最大回撤:14.85%[135][137][152] - **RLJVP_month** IC均值:-4.41% 年化ICIR:-2.32 多空年化:11.63% 多空夏普:1.47 最大回撤:15.43%[135][137][163] - **SRLJV_month**
20220806_开源证券_金融工程专题_盈利预期调整优选组合的构建_金融工程团队_20220806
开源证券· 2022-08-06 00:00
量化模型与构建方式 盈利预期调整因子 FYR_DISP - **因子名称**:FYR_DISP - **因子的构建思路**:通过分析师盈利预期调整的分歧度标准化,捕捉分析师预期调整对股票价格的影响[5][31][32] - **因子具体构建过程**: 1. 每月底回看过去180天,计算所有分析师最近一期的盈利预期调整值 $\Delta FY_{i,j,t}$,并求平均得到因子值 $FYR\_DISP_{i,t}$ 2. 公式为: $$ FYR\_DISP_{i,t} = \frac{\sum_{j=1}^{m}\Delta FY_{i,j,t}/m}{std(\Delta FY_{i,j,t})/\sqrt{m}} $$ 其中,$m$为分析师覆盖数,$std$为标准差[32] 3. 若分析师覆盖数小于3,则因子值被设置为空值[31][32] - **因子评价**:FYR_DISP在IC均值、ICIR、多空对冲和多头表现上均优于其他标准化方式,覆盖度较高,效果最佳[33][35] 改进后的盈利预期调整因子 FYR_DISP_strength - **因子名称**:FYR_DISP_strength - **因子的构建思路**:在FYR_DISP的基础上,结合时间加权和股价跟随性加权,提升因子效果[5][34][49] - **因子具体构建过程**: 1. **时间加权**: - 使用半衰期加权法,权重公式为: $$ W_{\Delta t1_{i,j}} = \frac{2^{-\Delta t1_{i,j}/N}}{\sum_{j=1}^{m}2^{-\Delta t1_{i,j}/N}} $$ 其中,$\Delta t1$为前后两次预测间隔时间差,$N$为半衰期参数[36] - 合成时间加权权重$\Delta t$,并归一化[39][40] 2. **股价跟随性加权**: - 若盈利预期调整与股票前60天的超额收益方向一致,赋予权重$A$,反之赋予$1-A$,最后归一化[43][44] - 参数敏感性分析后,选取$A=0.3$[45] 3. **综合加权**:将时间加权和股价跟随性加权相乘并归一化,得到最终权重[49] - **因子评价**:改进后的因子多空对冲信息比率从2.38提升至3.14,最大回撤从6.83%降至3.92%,效果显著提升[49][55] 羊群效应因子 ∆CSAD_FR - **因子名称**:∆CSAD_FR - **因子的构建思路**:通过分析师预测值与一致预期的偏离程度,捕捉分析师羊群效应的变化[57][60] - **因子具体构建过程**: 1. 定义分析师羊群效应指标: $$ CSAD\_FR_{i,t} = \frac{1}{m}\sum_{j=1}^{m}|fr_{i,j,t} - fr_{i,con,t}| $$ 其中,$fr_{i,j,t}$为分析师预测值,$fr_{i,con,t}$为一致预期[57] 2. 定义羊群效应变动因子: $$ \Delta CSAD\_FR_{i,t} = \frac{CSAD\_FR_{i,t} - \frac{1}{N}\sum_{k=0}^{N-1}CSAD\_FR_{i,t-k}}{\frac{1}{N}\sum_{k=0}^{N-1}CSAD\_FR_{i,t-k}} $$ 其中,$N$为回看窗口期[60] - **因子评价**:在盈利预期上调股票池中,∆CSAD_FR呈现正向选股能力,多空对冲信息比率为0.60[62][63] 动量与反转合成因子 R_M - **因子名称**:R_M - **因子的构建思路**:结合动量因子和反转因子,综合捕捉股票的动量与反转效应[76] - **因子具体构建过程**: 1. 动量因子包括长端动量、分析师关联动量、盈利预期调整OER因子[67][69][72] 2. 反转因子采用M_High[65] 3. 动量因子正序排列,反转因子逆序排列,排序相加后形成合成因子R_M[76] - **因子评价**:R_M因子在盈利预期上调股票池的多空对冲信息比率为1.30,整体绩效较优[79] 大单残差因子 - **因子名称**:大单残差 - **因子的构建思路**:通过大单资金流的残差,捕捉资金流强度对股票价格的影响[79] - **因子具体构建过程**: 1. 每月底回看过去20天,计算大单残差[80] 2. 不筛选特定交易日,统一计算因子值[80] - **因子评价**:在盈利预期上调股票池内,多空对冲信息比率为1.76,选股效果显著[84] 评级变动因子 - **因子名称**:评级变动因子 - **因子的构建思路**:通过分析师评级的上调或下调,捕捉评级变动对股票价格的影响[85] - **因子具体构建过程**: 1. 每月底回看过去180天,计算评级上调分析师个数减去评级下调分析师个数[85] 2. 若结果大于0,则评级上调;小于0,则评级下调[85] - **因子评价**:在盈利预期上调股票池内,评级上调对冲评级下调后的信息比率为1.41[87][91] --- 因子的回测效果 盈利预期调整因子 FYR_DISP - ICIR:2.38 - 多空对冲年化收益:14.95% - 最大回撤:6.83%[35] 改进后的盈利预期调整因子 FYR_DISP_strength - ICIR:3.14 - 多空对冲年化收益:15.48% - 最大回撤:3.92%[55] 羊群效应因子 ∆CSAD_FR - 多空对冲信息比率:0.60[63] 动量与反转合成因子 R_M - 多空对冲信息比率:1.30[79] 大单残差因子 - 多空对冲信息比率:1.76[84] 评级变动因子 - 多空对冲信息比率:1.41[91]
20220721_开源证券_金融工程专题_从小单资金流行为到股票关联网络_金工团队研究_20220721
开源证券· 2022-07-21 00:00
量化模型与构建方式 1. 模型名称:小单资金流关联网络 - 模型构建思路:通过小单资金流的行为协同,识别股票间的关联关系,构建股票关联网络[3][4] - 模型具体构建过程: 1. 选点:选定关联网络所覆盖股票池(网络节点)[14] 2. 连线:寻找股票之间的关联关系(关联线)[14] 3. 定粗细:确定股票间的关联性强弱(关联度指标)[14] 4. 计算预期收益率:将个股关联股票涨跌幅按关联度加权,作为个股当月预期收益率(正向因子)[14] 5. 中性化处理:做反转、市值、行业中性化处理[14] 6. 得到关联网络牵引因子:将个股当月预期收益与真实收益对比,若上涨不及预期,则未来倾向于出现补涨行情[14] - 模型评价:通过小单资金流的行为协同,识别股票间的关联关系,构建股票关联网络[3][4] 量化因子与构建方式 1. 因子名称:Traction-SI 因子 - 因子的构建思路:基于小单资金流关联网络,构建关联网络牵引因子[5] - 因子具体构建过程: 1. 根据关联网络刻画的股票关联关系,放大高关联股票涨跌幅权重,缩小低关联股票涨跌幅权重,重构股票 A 当月收益对比的基准[5] 2. 预期收益因子做 20 日反转、市值、行业中性化处理[5] 3. 衡量股票当月预期收益与真实收益之间的预期差,得到 Traction-SI 因子[5] - 因子评价:Traction-SI 因子表现稳健,与常见因子相关性均保持较低水平[5][46] 2. 因子名称:Traction45p-SI 因子 - 因子的构建思路:对关联网络进行稀疏处理,剔除关联度指标低于 N%阈值的关联线,保留高于 N%阈值的关联线[51] - 因子具体构建过程: 1. 稀疏阈值在 40%至 50%范围内达到有效性峰值,选 45%作为稀疏阈值,构建 Traction45p-SI 因子[51] - 因子评价:因子有效性呈先升后降的变化趋势,稀疏处理后因子表现稳健[51][55] 3. 因子名称:Traction5d-SI 因子 - 因子的构建思路:考虑到日度小单净流入数据连续性较弱,滚动取过去 N 日的小单累计净流入数据,构建股票间同向比例指标[56] - 因子具体构建过程: 1. 随着累计天数增加,因子有效性逐渐提高,在累计天数超过 4 天后,因子有效性达到基本稳定状态,取 5 日小单累计净流入数据,构建 Traction5d-SI 因子[56] - 因子评价:因子有效性在累计天数超过 4 天后达到相对稳定状态[56][57] 4. 因子名称:TractionCorr-SI 因子 - 因子的构建思路:综合考虑小单净流入的方向协同与规模协同[61] - 因子具体构建过程: 1. 按照小单净流入成交占比计算余弦相似度,参考转换关系计算新的关联度指标,构建 TractionCorr-SI 因子[61] - 因子评价:因子表现稳健,综合考虑了方向协同与规模协同[61][62] 5. 因子名称:Traction-SIO 因子 - 因子的构建思路:基于小单净流入反向比例构建股票关联网络[68] - 因子具体构建过程: 1. 计算小单净流入反向比例,构建 Traction-SIO 因子[68] - 因子评价:反向协同弱于同向协同,因子表现较弱[68][72] 6. 因子名称:Traction-LI 因子 - 因子的构建思路:通过大单净流入同向比例构建股票关联网络[73] - 因子具体构建过程: 1. 计算大单净流入同向比例,构建 Traction-LI 因子[73] - 因子评价:因子表现稳健,但收益率略低于小单资金流因子[73][74] 模型的回测效果 1. Traction-SI 因子,RankIC 均值 3.98%,RankICIR 2.74,多空组合年化收益 13.91%,年化 IR 2.99,最大回撤 6.93%,月度胜率 80.27%[5][36][38] 2. Traction45p-SI 因子,RankIC 均值 4.4%,RankICIR 3.78,多空组合年化收益 14.22%,年化 IR 3.34,最大回撤 3.86%,月度胜率 81.63%[55] 3. Traction5d-SI 因子,RankIC 均值 4.85%,RankICIR 3.65,多空组合年化收益 15.5%,年化 IR 3.2,最大回撤 5.36%,月度胜率 80.95%[57] 4. TractionCorr-SI 因子,RankIC 均值 4.27%,RankICIR 2.71,多空组合年化收益 14.57%,年化 IR 2.92,最大回撤 7.34%,月度胜率 76.19%[62] 5. Traction-SIO 因子,RankIC 均值 -3.63%,RankICIR -2.25,多空组合年化收益 12.24%,年化 IR 2.5,最大回撤 7.68%,月度胜率 75.51%[68] 6. Traction-LI 因子,RankIC 均值 3.54%,RankICIR 2.47,多空组合年化收益 10.35%,年化 IR 2.13,最大回撤 6.69%,月度胜率 73.47%[73]
20220718-国盛证券-量化专题报告:PEAD.notice:基于预告的盈余惊喜选股策略
国盛证券· 2022-07-18 00:00
量化模型与构建方式 1. 模型名称:PEAD.notice选股策略 - **模型构建思路**:基于上市公司财报相对业绩预告的盈余惊喜程度,结合企业生命周期理论,筛选出具有成长性且盈余超预期的股票[3][63][67] - **模型具体构建过程**: 1. **数据筛选**:在每年2、4、8、10月末,回溯股票最近2个月的盈余披露信息,筛选出以下条件的股票: - 业绩预增:业绩预告利润中值大于去年同期利润,且二者非负 - 盈余惊喜:正式财报/业绩快报中真实利润大于业绩预告利润中值 - 生命周期:企业生命周期阶段为成长期或成熟期[63][67] 2. **排序与筛选**:按照盈余惊喜程度(p_score因子)从高到低排序,剔除尾端25%的股票,选取指标值最高的150只股票构建盈余惊喜股票池[65] 3. **因子优化**:结合估值、财务质量和技术特征因子(如BP、EP、ROE等),对股票池进一步筛选,最终选取30只股票构建PEAD.notice组合[74][75] - **模型评价**:PEAD.notice策略偏向中小市值机构冷门股,收益显著且稳健,与基于分析师文本信息的PEAD.text策略在收益分布和持仓风格上具有互补性[3][86] --- 模型的回测效果 1. PEAD.notice选股策略 - **年化收益**:41.3%[78] - **相对中证500指数年化超额收益**:35.0%[78] - **月度胜率**:79.2%[78] - **信息比率(IR)**:2.64[78] --- 量化因子与构建方式 1. 因子名称:p_score因子 - **因子构建思路**:衡量财报真实利润相对业绩预告预计利润的盈余惊喜程度,p_score值越高,盈余惊喜程度越大[2][32] - **因子具体构建过程**: 1. 定义公式: $$p\_score=\ (p\_real-p\_min)/(p\_max-p\_min)$$ 其中,$p\_real$为正式财报的真实利润,$p\_min$和$p\_max$分别为预计利润区间的上下限[32] 2. 数据调整:当预计利润上/下限相等或之一缺失时,按照上下限偏离均值(10%和20%)进行调整[33][34] 3. 数据分组:将股票按p_score值分组,验证因子在不同分组的超额收益表现[34] - **因子评价**:p_score因子在有预告股票样本池中表现出显著的选股能力,年化多空收益超过15%,月度IC均值3.0%,ICIR为2.89,但覆盖率较低,仅为46.2%[36][39] 2. 因子名称:生命周期因子 - **因子构建思路**:基于企业现金流特征划分生命周期阶段,筛选出处于成长期和成熟期的企业[47][49] - **因子具体构建过程**: 1. **现金流划分**:根据经营、投资、筹资活动的现金流净额正负,将企业分为8种类型[47] 2. **生命周期分类**:按照现金流特征,将企业划分为初创期、成长期、成熟期、衰退期和死亡期5个阶段[49][54] 3. **因子赋值**:将生命周期阶段重新分组为3个阶段(初创/死亡期为阶段1,成长期/衰退期为阶段2,成熟期为阶段3),并赋值1、2、3[55] 4. **因子测试**:在中证800和中证1000指数成分股中测试因子表现,验证生命周期因子与股票未来超额收益的正相关性[55] - **因子评价**:生命周期因子在全A股市场具有良好的区分效果,尤其在成长期和成熟期企业中表现出显著的超额收益[57][59] --- 因子的回测效果 1. p_score因子 - **年化多空收益**:15.3%[36] - **月度IC均值**:3.0%[36] - **ICIR**:2.89[36] - **覆盖率**:46.2%[36] 2. 生命周期因子 - **月度Rank IC均值**:2.4%[55] - **ICIR**:1.30[55] - **分组超额收益**:阶段3(成熟期)企业的超额收益显著高于阶段1(初创/死亡期)企业[56]
20220702_开源证券_金融工程专题_北上资金攻守兼顾因子的构造——定价权与协同效应的融合--开源量化评论(56)_魏建榕,胡亮勇
开源证券· 2022-07-02 00:00
量化模型与构建方式 模型名称:协同因子 - 模型构建思路:协同因子代表了不同托管机构间的行为异同性[26] - 模型具体构建过程: 1. 在每个月末,计算过去一个月不同托管机构对每只个股的持仓数量增减变化,并将该数值除以上月末持仓总量,得到每个托管机构的持仓变动比例[27] 2. 基于不同托管机构的持仓变动进行整体持仓变化趋势的统计显著性处理,公式如下: $$ \mathrm{d}{\bf p}_{i,t}^{j}=\frac{\Delta h_{i,t}^{j}}{h_{i,t-1}^{j}} $$ $$ s f_{i,t}=\frac{d p_{i,t}^{a v g}}{d p_{i,t}^{s t d}}*\sqrt{m} $$ 其中,$\mathrm{d}{\bf p}_{i,t}^{j}$表示托管机构当月在个股上的持仓变动比例,$\Delta h_{i,t}^{j}$表示托管机构在当月对个股的累计增减仓数量,$h_{i,t-1}^{j}$表示托管机构在上月最后一个交易日个股的持仓量,$d p_{i,t}^{a v g}$表示个股在不同托管机构中当月持仓变动的均值,$d p_{i,t}^{s t d}$表示个股在不同托管机构中当月的持仓变动标准差,$m$表示当月交易个股的托管机构数量,$s f_{i,t}$表示个股当月持仓变动按统计显著性调整后的值[31][32] 3. 对持仓变动的异常值进行处理,剔除持仓变动超过3倍的个股,并对因子进行缩尾调整和z-score处理[33] 4. 对因子值进行市值行业中性化处理[33] - 模型评价:协同因子的优势主要体现在控制回撤的能力上,即"防守"属性[33] 模型名称:合成因子 - 模型构建思路:将进攻性的成交占比因子和防守性的协同因子进行合成,达到攻守兼顾的效果[54] - 模型具体构建过程: 1. 选取成交金额占比(一个月)和净流入金额占比(三个月)因子正交处理后合成最终的跟踪因子[24] 2. 对成交占比因子和协同因子进行等权合成,保持因子计算口径一致[54] 3. 合成因子公式: $$ \max\alpha^{Tw}S.t.\leq X_{s}(w-w_{b})\leq S_{u} $$ $$ h_{l}\leq X_{h}(w-w_{b})\leq h_{u} $$ $$ w_{l}\leq w-w_{b}\leq w_{u} $$ $$ b^{Tw}\geq c_{l} $$ $$ 1^{Tw}=1 $$ $$ 0\leq w\leq1 $$ 其中,$\alpha$表示因子暴露度,$w$表示待优化权重,$X_{s}$表示风格暴露度矩阵,$X_{h}$表示行业哑变量矩阵,$S_{u}$和$S_{l}$分别表示风格暴露度的偏离上下限,$h_{u}$和$h_{l}$分别表示行业偏离上下限,$w_{u}$和$w_{l}$分别表示权重偏离的上下限,$b$表示股票池个股是否位于指数成分股的示性向量,$c_{l}$表示成分股权重之和下限[81][82] - 模型评价:合成因子在有效控制回撤的基础上,最大可能地获取了多头收益[60] 模型的回测效果 协同因子 - 年化收益率:9.5%[33] - 年化波动率:3.7%[40] - 收益波动比:2.56[40] - 最大回撤:2.4%[33] - 胜率:70%[33] 合成因子 - 年化收益率:19.5%[67] - 年化波动率:5.7%[71] - 收益波动比:3.43[67] - 最大回撤:4.1%[71] - 胜率:87.3%[71] 量化因子与构建方式 因子名称:成交占比因子 - 因子的构建思路:反映外资定价权的因子,进攻能力突出[20] - 因子具体构建过程:选取成交金额占比(一个月)和净流入金额占比(三个月)因子正交处理后合成最终的跟踪因子[24] - 因子评价:成交占比因子在多头收益获取上具有优秀的表现,但超额波动较大[54] 因子的回测效果 成交占比因子 - 年化收益率:9.2%[55] - 年化波动率:18.0%[71] - 收益波动比:0.51[71] - 最大回撤:10.6%[71] - 胜率:65.6%[71]
20220621_海通证券_金融工程专题_冯佳睿余浩淼_选股因子系列研究(八十一)——净利润相关指标的进一步改进
海通证券· 2022-06-21 00:00
量化因子与构建方式 1. 因子名称:ROE因子 - **因子的构建思路**:通过改进ROE因子的可用性和有效性,提升其选股效果[3][12][16] - **因子具体构建过程**: 1. **可用性改进**:将最新披露的ROE替换为业绩快报或业绩预告中的数值,结合一致预期ROE,建立当期真实ROE的预测模型[12][13] - 业绩预告数据采用上下限均值,若有多个业绩快报或预告,使用最新数值[13] - 使用ROE历史波动率倒数加权,降低预测精度较差股票的影响[12] 2. **有效性改进**: - 剔除对ROE因子有效性影响较大的行业(如电力及公用事业、房地产等),通过计算剔除行业后的5年滑动平均IC均值,确定行业对ROE因子的影响[16][21] - 对影响较大的行业股票降低权重,采用等权降权或分级降权方式[23][24] 3. **综合改进**:结合业绩快报修正预测ROE,并对行业权重进行分级加权调整[25][26] - **因子评价**:改进后的ROE因子在可用性和有效性方面均有显著提升,选股效果更优[25] 2. 因子名称:SUE因子 - **因子的构建思路**:通过调整行业权重,提升SUE因子的选股有效性[3][31] - **因子具体构建过程**: 1. **特性分析**: - SUE因子公式:$ SUE = \frac{DREV}{\sigma(DREV)} $,其中$ DREV $为净利润同比增量,$ \sigma(DREV) $为过去四个季度净利润同比增量的标准差[28] - 通过正交分析,发现SUE因子选股效果部分来源于业绩动量效应,但还包含其他信息[29][30] 2. **有效性改进**: - 逐一剔除行业,分析行业对SUE因子IC的影响,发现不同行业对SUE因子的影响大于ROE因子[32][37] - 以0.05%为阈值调整行业权重,采用等权降权或分级降权方式[34][35] - **因子评价**:调整权重后,SUE因子的因子溢价和多空收益显著提升,分级降权方式效果更稳定[35] 3. 因子组合:基本面因子组合 - **因子的构建思路**:将改进后的ROE和SUE因子与高评级机构数结合,构建多因子模型[38] - **因子具体构建过程**: 1. **全市场多头组合**: - 包括3个组合,分别采用以下因子: 1. 最新披露ROE、最新披露SUE、最高评级机构数 2. 预测最新ROE(叠加业绩快报)、最新披露SUE、最高评级机构数 3. 改进预测最新ROE(叠加业绩快报并加权调整)、加权调整的最新披露SUE、最高评级机构数[44] - 设置个股权重不超过1%,并对市值暴露进行约束[40] 2. **指数增强组合**: - 在多头组合基础上添加约束条件,如成分股权重不低于50%、行业偏离不超过50%、月度跟踪误差不高于3%等[45] --- 因子的回测效果 1. ROE因子 - **全市场**: - 最新披露ROE:因子溢价0.27%,多空收益1.14%[14] - 预测ROE:因子溢价0.28%,多空收益1.29%[14] - 预测ROE+剔除4个行业:因子溢价0.29%,多空收益1.40%[17][20] - 快报修正预测ROE+分级加权:因子溢价0.32%,多空收益1.39%[26] - **沪深300**: - 最新披露ROE:因子溢价0.37%,多空收益0.94%[14] - 预测ROE:因子溢价0.44%,多空收益1.37%[14] - 预测ROE+剔除4个行业:因子溢价0.48%,多空收益1.41%[17][20] - 快报修正预测ROE+分级加权:因子溢价0.48%,多空收益1.45%[26] 2. SUE因子 - **全市场**: - 正交ROE:因子溢价0.40%,多空收益1.26%[35] - 正交ROE+等权降权:因子溢价0.44%,多空收益1.30%[35] - 正交ROE+分级降权:因子溢价0.44%,多空收益1.30%[35] - **中证500**: - 正交ROE:因子溢价0.43%,多空收益1.31%[35] - 正交ROE+等权降权:因子溢价0.49%,多空收益1.41%[35] - 正交ROE+分级降权:因子溢价0.50%,多空收益1.59%[35] 3. 基本面因子组合 - **全市场多头组合**: - 最新披露组合:年化收益15.5%,夏普比0.551[42] - 预测最新组合:年化收益17.6%,夏普比0.625[42] - 改进预测最新组合:年化收益17.9%,夏普比0.631[42] - **指数增强组合**: - 沪深300:改进预测最新组合年化超额收益6.3%,IR为0.791[48] - 中证500:改进预测最新组合年化超额收益12.8%,IR为1.745[48] - 中证800:改进预测最新组合年化超额收益8.4%,IR为1.277[48]
高频数据因子研究系列八:日内价量数据因子化研究
广发证券· 2022-06-06 00:00
量化因子与构建方式 1. 因子名称:DPIN_MEAN类因子 - **因子的构建思路**:通过分析个股日内未预期收益与交易行为的关系,构建衡量动态日内知情交易概率的因子,主要关注知情交易概率的平均水平[8][39][43] - **因子具体构建过程**: 1. 计算个股在日内区间的未预期收益,公式为: $$ R_{i,j} = \gamma_0 + \sum_{k=1}^{4}\gamma_{1i,k}D_{k}^{Day} + \sum_{k=1}^{48}\gamma_{2i,k}D_{k}^{Int} + \sum_{k=1}^{12}\gamma_{3i,k}R_{i,j-k} + \epsilon_{i,j} $$ 其中,$R_{i,j}$为区间收益率,$D_{k}^{Day}$为周内效应虚拟变量,$D_{k}^{Int}$为日内效应虚拟变量,$R_{i,j-k}$为滞后收益率[42] 2. 根据未预期收益的正负,计算知情交易概率,公式为: $$ DPIN_{BASE}^{i,j} = \frac{NB_{i,j}}{NT_{i,j}} \cdot (\epsilon_{i,j} < 0) + \frac{NS_{i,j}}{NT_{i,j}} \cdot (\epsilon_{i,j} > 0) $$ 其中,$NB_{i,j}$、$NS_{i,j}$、$NT_{i,j}$分别为主买成交笔数、主卖成交笔数和总成交笔数[43] 3. 对日内5分钟频率的DPIN值取均值,构建日度因子[48] - **因子评价**:该类因子能够较好地刻画个股日内知情交易概率的平均水平,具有显著的分层效果[74][92] 2. 因子名称:DPIN_STD类因子 - **因子的构建思路**:通过计算个股日内知情交易概率的分散程度,衡量信息优势交易的波动性[8][39][43] - **因子具体构建过程**: 1. 在计算日内知情交易概率的基础上,计算其标准差,公式为: $$ DPIN_{BASE\_TOTAL\_STD} = STD(\{DPIN_{BASE}^{i,j}\}) $$ 其中,$STD$为标准差函数,$DPIN_{BASE}^{i,j}$为日内各区间的知情交易概率[59] 2. 对日内5分钟频率的DPIN值计算均值标准差比值,进一步刻画分散程度[50][59] - **因子评价**:该类因子能够有效反映个股日内知情交易概率的分散程度,分层效果显著[92][154] 3. 因子名称:DPIN_STABLE类因子 - **因子的构建思路**:通过分析个股日内知情交易概率的稳定性,衡量信息优势交易的持续性[8][39][43] - **因子具体构建过程**: 1. 在计算日内知情交易概率的基础上,计算其稳定性指标,公式为: $$ DPIN_{BASE\_TOTAL\_STABLE} = \frac{1}{N} \sum_{j=1}^{N} |DPIN_{BASE}^{i,j} - \overline{DPIN_{BASE}}| $$ 其中,$\overline{DPIN_{BASE}}$为日内知情交易概率的均值[59] 2. 对日内5分钟频率的DPIN值进行稳定性分析,构建日度因子[50][59] - **因子评价**:该类因子能够较好地反映个股日内知情交易概率的稳定性,分层效果显著[92][176] --- 因子的回测效果 1. DPIN_MEAN类因子 - **IC均值**:0.044[135] - **正IC占比**:84.4%[135] - **多空策略年化收益率**:37.5%[135] - **信息比率**:3.66[135] - **多头相对中证800策略年化收益率**:23.4%[135] - **多头相对中证800策略信息比率**:1.31[135] 2. DPIN_STD类因子 - **IC均值**:0.061[156] - **正IC占比**:72.4%[156] - **多空策略年化收益率**:44.3%[156] - **信息比率**:3.16[156] - **多头相对中证800策略年化收益率**:18.8%[156] - **多头相对中证800策略信息比率**:1.08[156] 3. DPIN_STABLE类因子 - **IC均值**:-0.059[178] - **负IC占比**:72.4%[178] - **多空策略年化收益率**:41.5%[178] - **信息比率**:2.82[178] - **多头相对中证800策略年化收益率**:19.2%[178] - **多头相对中证800策略信息比率**:1.09[178]
20220602_开源证券_金融工程专题_新型因子_资金流动力学与散户羊群效应--市场微观结构研究系列(14)
开源证券· 2022-06-02 00:00
量化因子与构建方式 1. 同步相关性因子 - **因子名称**:同步相关性因子 - **因子的构建思路**:通过计算不同类型资金流在过去一段时间内的同步净流入秩相关系数,来衡量其选股能力[14] - **因子具体构建过程**: - 针对任意两类资金流,其同步相关性被定义为:两类资金流在过去若干交易日同步净流入的秩相关系数 - 若某只股票过去若干交易日A类资金净流入序列为$EL_t$,B类资金净流入序列为$S_t$,则该股票的同步相关性被记为$RankCorr(EL_t, S_t)$[14] - 计算公式: $$ RankCorr(EL_t, S_t) $$ - **因子评价**:同步相关性因子具备一定的选股能力,尤其是超大单和小单的同步相关性表现最好[14][16] 2. 错位相关性因子 - **因子名称**:错位相关性因子 - **因子的构建思路**:通过计算不同类型资金流在过去一段时间内的错位净流入秩相关系数,来衡量其选股能力[28] - **因子具体构建过程**: - 针对任意两类资金流,其错位相关性被定义为:两类资金流在过去若干交易日错位净流入的秩相关系数 - 若某只股票过去若干交易日A类资金净流入序列为$S_t$,B类资金净流入序列为$S_{t+1}$,则该股票的错位相关性被记为$RankCorr(S_t, S_{t+1})$[28] - 计算公式: $$ RankCorr(S_t, S_{t+1}) $$ - **因子评价**:错位相关性因子具备一定的选股能力,尤其是小单和小单的错位相关性表现最好[28][32] 3. 行业轮动因子 - **因子名称**:行业轮动因子 - **因子的构建思路**:通过计算行业层面的小单资金净流入日度变化与昨日行业收益日度变化的秩相关系数,来衡量其行业轮动能力[51] - **因子具体构建过程**: - 使用一阶差分秩相关性$RankCorr(\Delta R_t, \Delta S_{t+1})$作为行业散户羊群效应的代理变量 - 具体解释为:对于某行业小单资金净流入的日度变化而言,若其跟随昨日行业收益日度变化越紧密,则认为该行业散户羊群效应较高,后市表现可能较差[51] - 计算公式: $$ RankCorr(\Delta R_t, \Delta S_{t+1}) $$ - **因子评价**:行业轮动因子具备较好的行业轮动能力,整体绩效较为优异[52] 因子的回测效果 同步相关性因子 - **IC均值**:5.13%[16] - **ICIR**:2.43[16] - **多空对冲年化收益**:12.09%[16] - **信息比率**:1.93[16] - **月度胜率**:76.79%[16] - **最大回撤**:7.17%[16] 错位相关性因子 - **IC均值**:3.09%[28] - **ICIR**:2.07[28] - **多空对冲年化收益**:8.45%[28] - **信息比率**:2.05[28] - **月度胜率**:76.58%[28] - **最大回撤**:4.21%[28] 行业轮动因子 - **IC均值**:-5.85%[52] - **ICIR**:-1.04[52] - **多空对冲年化收益**:11.99%[52] - **信息比率**:1.25[52] - **胜率**:66.07%[52] - **最大回撤**:8.22%[52]
高频数据因子研究系列七:再谈信息不对称理论下的因子研究
广发证券· 2022-03-30 00:00
量化因子与构建方式 1. 因子名称:VPIN因子 - **因子的构建思路** VPIN因子基于信息不对称理论,旨在衡量市场中个股反映信息不对称程度的刻画。通过交易量不平衡性来估计知情交易者的交易概率[7][36][171] - **因子具体构建过程** 1. **划分等交易量的交易区间** 将按时间排列的交易数据分成等交易量的交易篮子,每个交易篮子所包含的交易量定为前三个月的日均成交量的五十分之一[29][37] 2. **基于正态分布假设对交易方向进行判断** - 计算每个交易篮子的买单交易量和卖单交易量 $$V_{\tau}^{B}=\sum_{i=t(\tau-1)+1}^{t(\tau)}V_{i}*Z\left(\frac{P_{i}-P_{i-1}}{\sigma_{\nabla P}}\right)$$ $$V_{\tau}^{S}=\sum_{i=t(\tau-1)+1}^{t(\tau)}V_{i}\left[1-Z\left(\frac{P_{i}-P_{i-1}}{\sigma_{\nabla P}}\right)\right]$$ 其中,$Z$为正态分布的累计密度函数,$P_{i}$为价格,$\sigma_{\nabla P}$为价格变动的标准差[30][31][37] 3. **计算交易不平衡量** $$O I_{\tau}=|V_{\tau}^{S}-V_{\tau}^{B}|$$ 4. **计算VPIN值** $$\mathrm{VPIN}={\frac{\sum_{\tau=1}^{n}\left|V_{\tau}^{S}-V_{\tau}^{B}\right|}{n V}}$$ 最后对个股在日历周内的VPIN值求均值,得到VPIN因子[31][37][45] - **因子评价** VPIN因子能够有效刻画信息不对称程度,且与传统BARRA因子相关性较低,具有独立性和补充性[159][161][173] --- 因子的回测效果 1. 全市场选股 - **IC均值**:-0.0467 - **负IC占比**:74.18% - **年化收益率**:18.67% - **信息比率(IR)**:1.28 - **换手率**:58%[56][68][77] 2. 中证1000选股 - **IC均值**:-0.0322 - **负IC占比**:64.50% - **年化收益率**:8.07% - **信息比率(IR)**:1.20 - **换手率**:57%[79][85][92] 3. 中证800选股 - **IC均值**:-0.0329 - **负IC占比**:64.69% - **年化收益率**:11.25% - **信息比率(IR)**:1.08 - **换手率**:60%[94][103][111] 4. 中证500选股 - **IC均值**:-0.0394 - **负IC占比**:66.53% - **年化收益率**:11.54% - **信息比率(IR)**:1.72 - **换手率**:60.04%[113][118][125] 5. 沪深300选股 - **IC均值**:-0.0211 - **负IC占比**:59.68% - **年化收益率**:6.91% - **信息比率(IR)**:0.71 - **换手率**:60%[128][134][142] 6. 创业板选股 - **IC均值**:-0.0189 - **负IC占比**:56.81% - **年化收益率**:6.36% - **信息比率(IR)**:0.53 - **换手率**:60%[143][149][155]