多因子ALPHA系列报告之(四十六):弹性因子研究
广发证券· 2023-02-02 00:00
量化因子与构建方式 1. 因子名称:弹性因子 - **因子的构建思路**:弹性因子用于衡量股票价格从暂时性价格冲击中恢复到基本价格的速度,反映了股票的流动性特征[7][18][20] - **因子具体构建过程**: 1. **股票价格分解**:将每日股价的自然对数分解为基本价格和暂时价格,公式为: $$ p_{t}=q_{t}+z_{t} $$ 其中,$p_{t}$为每日股价的自然对数,$q_{t}$为基本价格,$z_{t}$为暂时价格[23] - 使用Hodrick-Prescott (HP)算法进行分解,HP算法能够平滑基本价格并提取暂时价格的波动[24] 2. **弹性测量**: - 使用傅立叶变换将暂时价格序列转换为频域中的频谱函数形式,公式为: $$ Z_{k}=\sum_{t=1}^{D}z_{t}\,e^{\frac{i2\pi k t}{D}},\qquad({\bf k}=1,2,\cdots,{\bf D}) $$ 其中,$z_{t}$为暂时价格序列,$Z_{k}$为频谱函数,$D$为交易日总天数,$i$为虚数单位[27] - 归一化频谱函数的幅度,计算每个频率级别的暂时价格移动速度,最终得到暂时价格恢复的平均速度,公式为: $$ Resiliency_{i,t}=\frac{1}{\left[\frac{D_{i,t}}{2}\right]}\sum_{k=1}^{\left[D_{i,t}/2\right]}\frac{2|Z_{\mathrm{k,i,t}}|}{\mathrm{T_{k,i,t}}} $$ 其中,$D_{i,t}$为样本天数,$T_{k,i,t}$为频率分量的周期[28] 3. **因子构建**:在每月月末调仓时,使用过去36个月的滚动窗口数据,通过HP分解和傅立叶变换计算每只股票的弹性水平[28] - **因子评价**:弹性因子能够有效捕捉股票的流动性特征,分层效果显著,且在不同板块中均表现出较好的选股能力[7][69] --- 因子的回测效果 1. 创业板 - **年化收益率**:多头22.12%,创业板指数12.64%,超额收益9.48%[38][39] - **最大回撤率**:多头49.66%,创业板指数65.34%[39] - **年化波动率**:多头33.66%,创业板指数31.43%[39] - **平均换手率**:多头21.03%[39] - **信息比率(IR)**:0.66[39] - **夏普比率**:0.58[39] - **收益回撤比**:0.45[39] 2. 全市场 - **年化收益率**:多头11.35%,沪深300指数1.48%,超额收益8.99%[44][45] - **最大回撤率**:多头43.45%,沪深300指数40.56%[45] - **年化波动率**:多头25.01%,沪深300指数22.42%[45] - **平均换手率**:多头13.57%[45] - **信息比率(IR)**:0.45[45] - **夏普比率**:0.35[45] - **收益回撤比**:0.26[45] 3. 沪深300 - **年化收益率**:多头4.36%,沪深300指数1.48%,超额收益2.33%[49][50] - **最大回撤率**:多头39.45%,沪深300指数40.56%[50] - **年化波动率**:多头21.20%,沪深300指数22.42%[50] - **平均换手率**:多头16.62%[50] - **信息比率(IR)**:0.21[50] - **夏普比率**:0.09[50] - **收益回撤比**:0.11[50] 4. 中证500 - **年化收益率**:多头8.20%,中证500指数2.29%,超额收益5.21%[54][55] - **最大回撤率**:多头42.10%,中证500指数58.18%[55] - **年化波动率**:多头24.10%,中证500指数25.13%[55] - **平均换手率**:多头16.22%[55] - **信息比率(IR)**:0.34[55] - **夏普比率**:0.24[55] - **收益回撤比**:0.19[55] 5. 中证800 - **年化收益率**:多头7.58%,中证800指数1.66%,超额收益5.55%[59][61] - **最大回撤率**:多头40.01%,中证800指数44.22%[61] - **年化波动率**:多头22.59%,中证800指数22.20%[61] - **平均换手率**:多头14.35%[61] - **信息比率(IR)**:0.34[61] - **夏普比率**:0.22[61] - **收益回撤比**:0.19[61] 6. 中证1000 - **年化收益率**:多头8.15%,中证1000指数0.14%,超额收益7.14%[65][66] - **最大回撤率**:多头53.72%,中证1000指数66.56%[66] - **年化波动率**:多头28.05%,中证1000指数29.77%[66] - **平均换手率**:多头16.88%[66] - **信息比率(IR)**:0.29[66] - **夏普比率**:0.20[66] - **收益回撤比**:0.15[66]
20230130_海通证券_金融工程专题_冯佳睿_选股因子系列研究(八十六)——深度学习高频因子的特征工程(1)
海通证券· 2023-01-30 00:00
量化因子与构建方式 深度学习高频因子 特征构建 - **构建思路**:使用"原始数据-分钟级基础指标-目标频率衍生指标"的方式生成高频特征[5][17] - **具体构建过程**: - 基于原始数据生成分钟级基础指标,如主买、主卖金额序列[17] - 通过变换输入的基础指标序列生成特征,使用固定算子变换输入的方式[17] - 生成的特征包括下行大买单金额占比、下行小买单单均金额占比等[18] - 最终生成176个30分钟级别的特征集合[18] 特征处理 - **构建思路**:对特征进行分布调整、极值处理和标准化[5][23] - **具体构建过程**: - **分布调整**:对偏度较大的特征进行调整,如取自然对数[24][26] - **极值处理**:采用N倍标准差截断法处理极值[29] - **标准化**:对特征进行单一截面标准化和跨截面标准化[35] 特征归因 - **构建思路**:使用积分梯度法进行特征归因[5][46] - **具体构建过程**: - 设定基线模型与模型输入间的路径,对梯度进行积分[44] - 计算每个特征的绝对贡献度,比较其对预测结果的重要性[47] 特征筛选 - **构建思路**:基于特征归因结果进行特征筛选[5][53] - **具体构建过程**: - **静态精选**:根据全区间平均贡献度筛选出64个特征[53] - **动态精选**:每次预测时,先使用176特征集合训练模型,再根据积分梯度法筛选出贡献度最高的特征[57] 因子的评价 - **评价**:特征处理和筛选可以有效剔除冗余信息,提升模型表现[28][55][58] 因子的回测效果 176特征集合 - **周均IC**:0.072[20] - **年化ICIR**:8.884[20] - **周度胜率**:90%[20] - **年化多头超额收益**:28.5%[20] - **年化空头超额收益**:-38.8%[20] - **年化多空收益**:67.3%[20] 176特征集合(偏度调整) - **周均IC**:0.073[27] - **年化ICIR**:9.158[27] - **周度胜率**:90%[27] - **年化多头超额收益**:31.1%[27] - **年化空头超额收益**:-38.6%[27] - **年化多空收益**:69.7%[27] 176特征集合(偏度调整&去极值) - **周均IC**:0.073[30] - **年化ICIR**:9.265[30] - **周度胜率**:91%[30] - **年化多头超额收益**:31.4%[30] - **年化空头超额收益**:-38.7%[30] - **年化多空收益**:70.1%[30] 静态64特征集合 - **周均IC**:0.075[54] - **年化ICIR**:8.708[54] - **周度胜率**:90%[54] - **年化多头超额收益**:32.6%[54] - **年化空头超额收益**:-39.1%[54] - **年化多空收益**:71.7%[54] 动态64特征集合 - **周均IC**:0.074[58] - **年化ICIR**:8.764[58] - **周度胜率**:91%[58] - **年化多头超额收益**:33.4%[58] - **年化空头超额收益**:-38.0%[58] - **年化多空收益**:71.4%[58]
日内分钟收益率的时序特征:逻辑讨论与因子增强——市场微观结构研究系列(19)
开源证券· 2022-12-25 00:01
量化因子与构建方式 1. 因子名称:跌幅时间重心偏离因子 - **因子的构建思路**:通过涨、跌幅时间重心的相对位置,刻画日内分钟收益率的时序特征,提取有效的Alpha信号[4][33] - **因子具体构建过程**: 1. 统计日内每分钟的涨幅和跌幅时间序列,分别记为 $(U, R_u)$ 和 $(D, R_d)$[13] 2. 计算涨幅时间重心 $G_u$ 和跌幅时间重心 $G_d$,公式如下: $$ G_u = U{R_u}^T / \|R_u\|_1 $$ $$ G_d = U{R_d}^T / \|R_d\|_1 $$[15] 3. 以跌幅时间重心对涨幅时间重心进行截面回归,取残差作为因子暴露值,并对过去20日均值进行平滑处理,得到跌幅时间重心偏离因子[4][33] - **因子评价**:相比简单的“时间差”因子,跌幅时间重心偏离因子更能有效刻画分钟时序特征,且稳定性更高[33] 2. 因子名称:时间重心偏离(TGD)因子 - **因子的构建思路**:在跌幅时间重心偏离因子的基础上,剥离收益率结构和极端样本的干扰因子,增强因子有效性[6][95] - **因子具体构建过程**: 1. 逐日计算个股的涨幅时间重心 $G_u$ 和跌幅时间重心 $G_d$,以及以下干扰因子: - 平均涨幅 $\bar{R}_u$ 和平均跌幅 $\bar{R}_d$ - 时段1(09:31-10:00)和时段2(10:01-10:30)的涨跌幅 $R_1$ 和 $R_2$ - 隔夜涨跌幅 $R_{overnight}$[97] 2. 将涨、跌幅时间重心分别回归干扰因子,剥离其影响,得到残差项 $\varepsilon_u$ 和 $\varepsilon_d$: $$ G_u = f_u(\bar{R}_u, R_1, R_2, R_{overnight}) + \varepsilon_u $$ $$ G_d = f_d(\bar{R}_d, R_1, R_2, R_{overnight}) + \varepsilon_d $$[97] 3. 通过截面回归方法构造“时间差”指标,并取其20日均值作为TGD因子: $$ \varepsilon_d = \alpha + \beta \varepsilon_u + \varepsilon $$[97] - **因子评价**:TGD因子在全市场范围内表现稳定,收益分布均匀,且对其他因子中性化后仍保留显著的选股能力[99][103] 3. 因子名称:合成因子(TCD + SKEW) - **因子的构建思路**:将时间维度的TCD因子与收益率分布特征的SKEW因子合成,进一步提升因子效果[7][116] - **因子具体构建过程**: 1. 选取TCD因子和SKEW因子,分别在横截面上排序加总,得到合成因子[116] 2. 对合成因子进行五分组测试,验证其有效性[116] - **因子评价**:合成因子相比单一因子在稳定性和收益率上均有显著提升,尤其在全市场范围内表现更优[120] --- 因子的回测效果 1. 跌幅时间重心偏离因子 - **Rank IC**:0.054[33] - **Rank ICIR**:2.99[33] - **多空收益**:17.9%[72] - **多空IR**:2.39[33] 2. 时间重心偏离(TGD)因子 - **Rank IC**:0.067[109] - **Rank ICIR**:4.94[109] - **多空收益**:21.35%[109] - **多空IR**:4.5[6] 3. 合成因子(TCD + SKEW) - **Rank IC**:0.084[120] - **Rank ICIR**:5.74[120] - **多空收益**:22.99%[120] - **多空IR**:4.45[117]
20221218_开源证券_金融工程专题报告_大小单资金流alpha探究2.0:变量精筛与高频测算_金融工程团队_20221218
开源证券· 2022-12-18 00:00
量化模型与构建方式 大小单残差因子 - **因子名称**:原始大小单残差因子 - **因子的构建思路**:剥离收益率缠绕的资金流强度,分别构造大单和小单资金流强度因子[17] - **因子具体构建过程**:以大单为例,计算大单资金流强度因子,剥离涨跌幅影响后得到大单残差资金流强度因子;小单残差因子则通过小单资金流回归收益率构造[17][18] - **因子评价**:样本内外表现优异,原始大单残差效果更优[18] 改进大单残差因子 - **因子名称**:改进大单残差因子 - **因子的构建思路**:通过变量精筛,结合主动大单净流入和主动中单净流入,排序相加后与非主动大单强度结合[24][25] - **因子具体构建过程**: 1. 计算主动大单净流入和主动中单净流入相加,得到主动大中单残差 2. 与非主动大单强度排序相加,形成改进大单残差因子[24][25] - **因子评价**:改进后信息比率显著提升,效果更优[25] 改进小单残差因子 - **因子名称**:改进小单残差因子 - **因子的构建思路**:剔除主动小单强度,使用非主动小单残差作为因子核心[31][36] - **因子具体构建过程**: 1. 计算非主动小单净流入,形成非主动小单残差 2. 排除主动小单强度及非主动中单残差的叠加影响[36][37] - **因子评价**:改进后信息比率提升,选股效果更稳定[36][37] 散户羊群效应因子 - **因子名称**:原始散户羊群效应因子 - **因子的构建思路**:通过当前交易日收益率与下个交易日小单净流入之间的秩相关系数定义[48] - **因子具体构建过程**:计算当前交易日收益率与下个交易日小单净流入+1之间的秩相关系数,形成因子值[48] - **因子评价**:有效但信息比率较低,最大回撤较大[49] 改进散户羊群效应因子 - **因子名称**:改进散户羊群效应因子 - **因子的构建思路**:通过变量精筛和高频化尝试优化因子表现[49][63] - **因子具体构建过程**: 1. 使用日内收益率代替日度收益率 2. 使用开盘至10点之间的非主动小单净流入代替小单全部净流入[63] - **因子评价**:信息比率显著提升,最大回撤显著降低[63] 大小单综合资金流因子 - **因子名称**:大小单综合资金流因子 - **因子的构建思路**:将改进大单残差、改进小单残差和改进散户羊群效应因子等权合成[65] - **因子具体构建过程**: 1. 测算三者相关性,确保独立性 2. 等权合成三者,形成综合因子[65][66] - **因子评价**:综合因子表现优异,信息比率显著提升[65] --- 因子的回测效果 原始大小单残差因子 - **RankIC均值**:大单6.71%,小单-5.56%[18] - **RankICIR**:大单3.44,小单-2.90[18] - **10分组多空对冲年化收益率**:大单26.62%,小单23.04%[18] - **信息比率**:大单3.48,小单3.02[18] - **胜率**:大单79.49%,小单82.91%[18] - **最大回撤**:大单4.21%,小单3.38%[18] 改进大单残差因子 - **RankIC均值**:6.70%[27] - **RankICIR**:3.84[27] - **10分组多空对冲年化收益率**:28.37%[27] - **信息比率**:4.81[27] - **胜率**:91.45%[27] - **最大回撤**:2.36%[27] 改进小单残差因子 - **RankIC均值**:-5.59%[37] - **RankICIR**:-3.20[37] - **10分组多空对冲年化收益率**:25.78%[37] - **信息比率**:3.56[37] - **胜率**:81.20%[37] - **最大回撤**:3.32%[37] 原始散户羊群效应因子 - **RankIC均值**:-4.90%[48] - **RankICIR**:-2.35[48] - **10分组多空对冲年化收益率**:16.88%[48] - **信息比率**:2.51[48] - **胜率**:81.20%[48] - **最大回撤**:8.85%[48] 改进散户羊群效应因子 - **10分组多空年化收益率**:16.49%[63] - **信息比率**:3.01[63] - **最大回撤**:3.15%[63] 大小单综合资金流因子 - **RankIC均值**:7.89%[65] - **RankICIR**:3.99[65] - **10分组多空对冲年化收益率**:35.36%[65] - **信息比率**:4.82[65] - **胜率**:89.19%[65] - **最大回撤**:2.09%[65]
20221126_开源证券_金融工程专题报告_长端动量2.0:长期、低换手、多头显著的量价因子_金工研究团队_20221126
开源证券· 2022-11-26 00:00
量化因子与构建方式 长端动量1.0因子 - **因子名称**:长端动量1.0因子 - **因子的构建思路**:通过剔除高振幅交易日的涨跌幅数据,去除过度反应的影响,从而捕捉A股市场中的动量效应[3][16] - **因子具体构建过程**: - 步骤1:对选定股票,回溯取其最近160个交易日的数据[17] - 步骤2:计算股票每日的振幅(最高价/最低价-1)[17] - 步骤3:选择振幅较低的70%交易日,涨跌幅加总,得到长端动量因子[17] - **因子评价**:有效捕捉A股市场中的动量效应,分组收益分化且单调性良好,多头组收益显著高于其他组[16][17] 长端动量2.0因子 - **因子名称**:长端动量2.0因子 - **因子的构建思路**:在长端动量1.0因子的基础上,通过剔除涨跌停及停牌交易日数据,并对日超额收益进行反转中性化处理,进一步提升因子有效性[19][21] - **因子具体构建过程**: - 步骤1:对选定股票,回溯取其最近160个交易日的数据[19] - 步骤2:剔除涨跌停及停牌交易日数据[19] - 步骤3:计算股票每日的振幅:(最高价-最低价)/前收盘价[19] - 步骤4:选择振幅较低的70%交易日,日超额收益(涨跌幅-市场涨跌幅均值)加总,记作$ \alpha Retlow $[19] - 步骤5:$ \alpha Retlow $作20日反转中性化,得到长端动量2.0因子[19] - **因子评价**:相比长端动量1.0因子,长端动量2.0因子有效性显著提升,收益表现稳健,且与基本面因子兼容性良好[23][55][57] 行业长端动量因子 - **因子名称**:行业长端动量因子 - **因子的构建思路**:将个股长端动量2.0因子值按自由流通市值加权聚合,构建行业因子值,用于行业轮动策略[63] - **因子具体构建过程**: - 将个股长端动量2.0因子值按自由流通市值加权聚合,得到行业因子值[63] - **因子评价**:具备行业轮动能力,收益表现显著优于行业等权组合[63][66] --- 因子的回测效果 长端动量1.0因子 - RankIC:4.01%[17] - RankICIR:1.76[17] - RankIC胜率:74.36%[17] - 多头年化收益:16.41%[17] - 月均换手率:35.7%[17] - 多空年化收益:10.94%[17] - 年化IR:1.75[17] - 最大回撤:10.57%[17] - 月度胜率:68%[17] 长端动量2.0因子 - RankIC:6.92%[23] - RankICIR:2.75[23] - RankIC胜率:79.49%[23] - 多头年化收益:20.26%[23] - 月均换手率:34.28%[23] - 多空年化收益:18.09%[29] - 年化IR:2.61[29] - 最大回撤:8.45%[29] - 月度胜率:75.9%[29] 行业长端动量因子 - RankIC:6.72%[63] - RankICIR:0.84[63] - RankIC胜率:60.19%[63] - 多头年化收益:12.64%[66] - 月均换手率:22.72%[66] - 多空年化收益:14.28%[63] - 年化IR:1.04[63] - 超额年化收益率:5.31%[66]
20221122_开源证券_金融工程专题_扎堆效应的识别:以股东户数变动为例_金工研究团队_20221122
开源证券· 2022-11-22 00:00
量化因子与构建方式 1. 因子名称:股东户数变动因子(SNC) - **因子的构建思路**:股东户数的增加通常表明个人投资者的扎堆行为,而个人投资者的从众交易特征往往蕴含负向alpha,因此股东户数大幅增加的公司未来股价倾向于跑输股东户数减少的公司[17][21] - **因子具体构建过程**: - 对数据缺失的月份进行前值填充,对相同月份的多条数据取最新值[17] - 采用间隔选取多期后再进行时序标准化处理,公式如下: $$ factor_{t} = \frac{x_{t} - \tilde{x}}{\sqrt{\frac{1}{N}\Sigma_{i,j=0}^{N}(x_{t-i*j} - \tilde{x})^{2}}} $$ 其中,$\tilde{x} = \frac{1}{N}\sum_{i,j=0}^{N}x_{t-i*j}$,$x_{t}$为当前值,$\tilde{x}$为时序均值,$N$为滚动期数,$i,j$为选取间隔[19][20] - 默认选取间隔为3个月,滚动窗口长度为8期[20] - 对上市不满一年的新股、退市股和停牌股进行剔除,并对异常值进行剪枝和标准化处理[20] - 对因子值进行行业市值中性化处理[20] - 最终生成的因子值取负处理,使其转为正向选股因子[21] - **因子评价**:SNC因子在测试期内表现优异,具有较高的选股能力[21] 2. 因子名称:人均持股占比变动因子(PCRC) - **因子的构建思路**:与SNC因子类似,PCRC因子通过计算人均持股比例的时序变动来捕捉股东户数变化的影响[20][27] - **因子具体构建过程**: - 数据预处理与SNC因子一致,包括前值填充、异常值剪枝、标准化处理和行业市值中性化处理[20] - 采用间隔选取多期后进行时序标准化处理,公式与SNC因子一致[19][20] - 默认选取间隔为3个月,滚动窗口长度为8期[20] - **因子评价**:PCRC因子在多空对冲稳定性上表现优异,尤其在超额回撤控制方面优于SNC因子[30] 3. 因子名称:调参后的PCRC因子 - **因子的构建思路**:通过调整间隔跨度(Gap)和滚动窗口长度(Window)优化PCRC因子的表现[34] - **因子具体构建过程**: - 测试不同参数组合,发现每4个月选一次数据、滚动选取9期时,PCRC因子显著性最高,RankIC均值达到5.79%[34][35] - 每3个月选取一次、滚动选取4期时,因子稳定性达到局部最优解,RankICIR高达2.752[34][35] - 局部最优参数下,PCRC因子单调性改善,不同分组的走势区分度更加明显[36] - **因子评价**:调参后的PCRC因子显著性和稳定性均有提升,表现更加优异[36] --- 因子的回测效果 1. 股东户数变动因子(SNC) - **RankIC均值**:4.5%[21] - **RankICIR**:2.50[21] - **RankIC为正次数占比**:约74%[21] - **多空对冲年化收益率**:13.4%[24] - **多空对冲最大回撤**:-3.9%[24] - **多空对冲胜率**:约80%[24] 2. 人均持股占比变动因子(PCRC) - **RankIC均值**:4.4%[27] - **RankICIR**:2.53[27] - **多空对冲年化收益率**:13.3%[31] - **多空对冲最大回撤**:-2.9%[31] - **多空对冲胜率**:约77.7%[31] 3. 调参后的PCRC因子 - **RankIC均值**:5.79%(显著性最高参数组合)[34] - **RankICIR**:2.752(稳定性最优参数组合)[34] - **多头端年化收益率**:14.5%(局部最优参数下)[36] 4. PCRC因子在不同宽基指数中的表现 - **沪深300**: - RankIC均值:2.19%[41] - RankICIR:0.93[41] - 年化超额收益率:4.18%(对冲组)[52] - 最大回撤:-4.00%(对冲组)[52] - **中证1000**: - RankIC均值:4.88%[41] - RankICIR:1.508[52] - 年化超额收益率:9.08%(对冲组)[52] - 最大回撤:-6.22%(对冲组)[52] - **国证2000**: - RankICIR:2.59[41] - 年化超额收益率:5.95%(对冲组)[52] - 最大回撤:-5.35%(对冲组)[52]
多因子ALPHA系列报告之(四十五):基于SEMIBETA的因子研究
广发证券· 2022-11-18 00:00
量化因子与构建方式 因子名称:传统Beta因子 - **因子的构建思路**:基于CAPM模型,传统Beta因子刻画了资产收益率对市场收益的敏感程度[11][12] - **因子具体构建过程**:通过滚动回溯过去20、60和120个交易日计算各股票换仓时点的传统Beta因子,公式如下: $$ E(R_{i})=R_{f}+\beta_{i}*(E(R_{m})-R_{f}) $$ 其中: - $E(R_{i})$:风险资产的预期收益率 - $R_{f}$:无风险收益率 - $E(R_{m})$:市场整体的预期收益率 - $\beta_{i}$:风险资产与市场整体的系统性风险系数[11][12] - **因子评价**:传统Beta因子在A股市场较难稳定贡献Alpha收益,高Beta个股未能带来稳定的超额收益[13] 因子名称:SemiBeta因子 - **因子的构建思路**:基于行为金融学中的损失厌恶理论,将传统Beta因子拆解为4个部分,分别反映市场和个股收益方向的不同[5][21][25] - **因子具体构建过程**: - SemiBeta因子公式: $$ \beta\equiv\frac{Cov(R_{i},R_{m})}{Var(R_{m})}=\frac{N+P+M^{+}+M^{-}}{Var(R_{m})} $$ 其中: - $N$:市场和个股均为负收益 - $P$:市场和个股均为正收益 - $M^{+}$:市场收益为正但个股收益为负 - $M^{-}$:市场收益为负但个股收益为正[21][22] - 进一步细化公式: $$ \beta_{t,i}^{N}=\frac{\sum_{k=1}^{m}r_{t,k,i}^{-}f_{t,k}^{-}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ $$ \beta_{t,i}^{P}=\frac{\sum_{k=1}^{m}r_{t,k,i}^{+}f_{t,k}^{+}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ $$ \beta_{t,i}^{M^{-}}=-\frac{\sum_{k=1}^{m}r_{t,k,i}^{+}f_{t,k}^{-}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ $$ \beta_{t,i}^{M^{+}}=-\frac{\sum_{k=1}^{m}r_{t,k,i}^{-}f_{t,k}^{+}}{\sum_{k=1}^{m}f_{t,k}^{2}} $$ 其中: - $r_{t,k,i}^{+}=\operatorname*{max}(r_{t,k,i},0)$ - $r_{t,k,i}^{-}=\operatorname*{min}(r_{t,k,i},0)$[28][29] - 回溯周期分别为20、60、120个交易日,市场基准包括沪深300、中证500、中证1000和创业板指,共构建48个细分因子[30][31] - **因子评价**:fBeta_MN系列因子表现较好,整体呈现负IC特征,回溯周期越短,回测总收益越高[5][34][55] --- 因子的回测效果 传统Beta因子 - **fBeta120D300**:IC为-1.8%,LS_IR为0.19,IC_IR为-0.14,年化收益为2.0%,胜率为54.9%,换股比例为27.1%[14] - **fBeta120D500**:IC为-1.4%,LS_IR为-0.17,IC_IR为-0.10,年化收益为-4.2%,胜率为52.1%,换股比例为24.4%[14] - **fBeta120D800**:IC为-2.2%,LS_IR为0.19,IC_IR为-0.16,年化收益为1.9%,胜率为51.4%,换股比例为26.5%[14] - **fBeta20D300**:IC为1.2%,LS_IR为0.52,IC_IR为0.05,年化收益为10.0%,胜率为51.4%,换股比例为78.5%[14] - **fBeta20D500**:IC为0.5%,LS_IR为0.83,IC_IR为0.08,年化收益为35.2%,胜率为54.9%,换股比例为75.4%[14] SemiBeta因子 - **fBeta_MN_60_S399006**:IC为-7.4%,LS_IR为1.88,IC_IR为-0.86,年化收益为128.7%,胜率为72.2%,换股比例为43.5%[5][34][55] - **fBeta_MN_20_S399006**:IC为-6.7%,LS_IR为1.97,IC_IR为-0.85,年化收益为180.0%,胜率为71.5%,换股比例为80.4%[34][65][73] - **fBeta_MN_120_S000852**:IC为-5.8%,LS_IR为1.64,IC_IR为-0.81,年化收益为76.5%,胜率为65.3%,换股比例为30.6%[34][46][47] --- 指数增强策略的回测效果 沪深300增强策略 - **年化收益**:6.2% - **年化超额收益**:约5% - **2022年初至今超额收益**:约7.2%[82][83][85] 中证500增强策略 - **年化收益**:12.4% - **年化超额收益**:约10% - **2022年初至今超额收益**:约12%[88][89][91] 中证1000增强策略 - **年化收益**:14.3% - **年化超额收益**:约12.8% - **2022年初至今超额收益**:约13.3%[93][94][96]
多因子ALPHA系列报告之(四十四):再谈地理关联度因子研究
广发证券· 2022-11-08 00:00
量化因子与构建方式 1. 因子名称:INDUCORR(行业相关系数因子) - **因子的构建思路**:衡量个股与其行业关联公司(不同省份但同申万一级行业)的整体相关程度[24][25] - **因子具体构建过程**: 1. 剔除停牌股、ST股、上市未满一年的股票[25] 2. 筛选与目标股票办公地所属省份不同但行业相同的股票[25] 3. 计算目标股票与筛选股票的日频收益序列皮尔森相关系数[25] 4. 对相关系数加权求和(默认等权),得到行业相关系数因子值[25] - 公式: $$ CORR_{i,j,t} = \frac{cov(R_{i}, R_{j})}{std(R_{i}) \cdot std(R_{j})} $$ $$ INDUCORR_{i,t} = \sum_{j=1}^{N} w_{j,t} \cdot CORR_{i,j,t} $$[25][26] - **因子评价**:能够有效挖掘股票间的行业关联信息,具有较高的选股区分度[50][75] 2. 因子名称:INDUCORRP(行业相关系数拆解因子之一) - **因子的构建思路**:基于收益序列的方向性拆解,度量个股与行业关联公司在正收益情况下的相关程度[27][29] - **因子具体构建过程**: 1. 将目标股票与行业关联股票的日度收益序列调整为正值(负值调整为0)[27][29] 2. 计算调整后的收益序列的皮尔森相关系数[29] 3. 对相关系数加权求和,得到因子值[29] - 公式: $$ R_{i}^{+} = max(R_{i}, 0) $$ $$ INDUCORRP_{i,t} = \sum_{j=1}^{N} w_{j} \cdot CORR(R_{i}^{+}, R_{j}^{+}) $$[29] - **因子评价**:通过拆解收益序列,更精确地度量了基于行业共性挖掘的正向共同基本面信息[75] --- 因子的回测效果 1. INDUCORR因子 - **IC均值**:0.071[51] - **IC胜率**:85.71%[51] - **年化超额收益率(多头相对中证500)**:14.98%[51] - **信息比率(IR)**:1.773[51] - **多头平均换手率**:77.90%[51] 2. INDUCORRP因子 - **IC均值**:0.065[51] - **IC胜率**:88.31%[51] - **年化超额收益率(多头相对中证500)**:15.32%[51] - **信息比率(IR)**:1.816[51] - **多头平均换手率**:81.03%[51] --- 因子的行业分组表现 INDUCORR因子 - **表现较好的行业**:机械设备、电子、汽车[78] - **IC均值**:机械设备(0.092)、电子(0.081)、汽车(0.104)[78] - **多空策略年化收益率**:汽车(29.78%)[78] - **多头相对基准策略信息比率**:机械设备(1.688)[78] INDUCORRP因子 - **表现较好的行业**:机械设备、汽车、基础化工[80] - **IC均值**:机械设备(0.081)、汽车(0.094)、基础化工(0.076)[80] - **多空策略年化收益率**:汽车(28.39%)[80] - **多头相对基准策略信息比率**:机械设备(1.733)[80] --- 因子的敏感性分析 1. 选股范围 - **INDUCORR因子**:在中证1000选股范围内表现最佳,年化超额收益率为12.50%,信息比率为1.440[92] - **INDUCORRP因子**:在中证1000选股范围内表现最佳,年化超额收益率为11.81%,信息比率为1.504[92] 2. 手续费费率 - **结果**:两种因子策略在扣除千五手续费后仍能获得超额收益,但手续费水平上升会降低策略净值表现[98]
20220904_开源证券_金融工程专题_大小单重定标与资金流因子改进_市场微观结构研究系列(16)
开源证券· 2022-09-04 00:00
量化模型与构建方式 1. 模型名称:NIR_MOD - 模型构建思路:通过设定金额阈值重新划定大、小单来捕捉资金流中的主力行为信息,并通过截面回归的方法剥离反转因素的影响以提纯资金流的Alpha信息[3][4] - 模型具体构建过程: 1. 设定金额阈值重新划定大、小单 2. 计算大单买入卖出金额比作为代理变量(IMB),公式为: $$ IMB = ln(B/S) $$ 3. 进行截面回归,剥离IMB与涨跌幅的相关性影响,公式为: $$ ln(B/S) = \alpha + \beta \times Ret + \varepsilon $$ 4. 基于修正系数反算大单买入和大单卖出的比例关系,并重新分配大单买入和卖出的成交金额,公式为: $$ \hat{B} = \frac{e^{\varepsilon}}{1+e^{\varepsilon}} \times (B+S) $$ $$ \hat{S} = \frac{1}{1+e^{\varepsilon}} \times (B+S) $$ - 模型评价:NIR_MOD因子相比NIR因子选股能力明显提升[3][4][43] 2. 模型名称:CNIR - 模型构建思路:将Wind的超大单、大单和中单合并,定义为有定价权的"广义主力资金",在NIR_MOD的基础上构造CNIR因子[6][87] - 模型具体构建过程: 1. 分别计算主力资金的买入金额和卖出金额: $$ BP = B_{Extra} + B_{Large} + B_{Med} $$ $$ SP = S_{Extra} + S_{Large} + S_{Med} $$ 2. 利用日涨跌幅来修正主力资金的买入金额和卖出金额: $$ ln(BP/SP) = \alpha + \beta Ret + \varepsilon $$ 3. 计算主力资金的净流入占比,即为CNIR因子: $$ CNIR = \frac{\sum (B_{P,i} - S_{P,i})}{\sum (B_{P,i} + S_{P,i})} $$ - 模型评价:CNIR因子在全市场上表现优于NIR_MOD因子,收益显著增厚[87][88][95] 模型的回测效果 1. NIR_MOD模型 - Rank IC:0.049[45] - Rank ICIR:4.196[45] - 多空IR:4.766[45] - 多空收益:20.77%[45] - 多空最大回撤:-2.95%[45] - 胜率:77.68%[45] 2. CNIR模型 - Rank IC:0.056[100] - Rank ICIR:3.647[100] - 多空IR:4.91[95] - 多空收益:27.86%[95] - 多空最大回撤:48.79%[93] - 胜率:76.14%[100] 量化因子与构建方式 1. 因子名称:NIR_MOD - 因子的构建思路:通过设定金额阈值重新划定大、小单来捕捉资金流中的主力行为信息,并通过截面回归的方法剥离反转因素的影响以提纯资金流的Alpha信息[3][4] - 因子具体构建过程: 1. 设定金额阈值重新划定大、小单 2. 计算大单买入卖出金额比作为代理变量(IMB),公式为: $$ IMB = ln(B/S) $$ 3. 进行截面回归,剥离IMB与涨跌幅的相关性影响,公式为: $$ ln(B/S) = \alpha + \beta \times Ret + \varepsilon $$ 4. 基于修正系数反算大单买入和大单卖出的比例关系,并重新分配大单买入和卖出的成交金额,公式为: $$ \hat{B} = \frac{e^{\varepsilon}}{1+e^{\varepsilon}} \times (B+S) $$ $$ \hat{S} = \frac{1}{1+e^{\varepsilon}} \times (B+S) $$ - 因子评价:NIR_MOD因子相比NIR因子选股能力明显提升[3][4][43] 2. 因子名称:CNIR - 因子的构建思路:将Wind的超大单、大单和中单合并,定义为有定价权的"广义主力资金",在NIR_MOD的基础上构造CNIR因子[6][87] - 因子具体构建过程: 1. 分别计算主力资金的买入金额和卖出金额: $$ BP = B_{Extra} + B_{Large} + B_{Med} $$ $$ SP = S_{Extra} + S_{Large} + S_{Med} $$ 2. 利用日涨跌幅来修正主力资金的买入金额和卖出金额: $$ ln(BP/SP) = \alpha + \beta Ret + \varepsilon $$ 3. 计算主力资金的净流入占比,即为CNIR因子: $$ CNIR = \frac{\sum (B_{P,i} - S_{P,i})}{\sum (B_{P,i} + S_{P,i})} $$ - 因子评价:CNIR因子在全市场上表现优于NIR_MOD因子,收益显著增厚[87][88][95] 因子的回测效果 1. NIR_MOD因子 - Rank IC:0.049[45] - Rank ICIR:4.196[45] - 多空IR:4.766[45] - 多空收益:20.77%[45] - 多空最大回撤:-2.95%[45] - 胜率:77.68%[45] 2. CNIR因子 - Rank IC:0.056[100] - Rank ICIR:3.647[100] - 多空IR:4.91[95] - 多空收益:27.86%[95] - 多空最大回撤:48.79%[93] - 胜率:76.14%[100]
多因子ALPHA系列报告之(四十三):基于地理关联度因子研究
广发证券· 2022-08-31 00:00
量化因子与构建方式 1. **因子名称:地理相关系数因子 (GEOGCORR)** - **因子构建思路**:通过计算个股与其地理关联公司股票之间的整体相关程度,构建地理相关系数因子,用于预测个股未来收益[7][38] - **因子具体构建过程**: 1. 在全市场范围内剔除ST/*ST、停牌股及上市不满一年的股票 2. 筛选出与目标股票办公地所属省份相同、申万一级行业不同的所有股票 3. 计算目标股票与每支关联股票在月度日频收益序列的皮尔森相关系数 4. 对所有相关系数进行加权求和,得到地理相关系数因子 公式: $$CORR_{i,j,t}=\frac{cov(R_{i},R_{j})}{std(R_{i})*std(R_{j})}$$ $$GEOGCORR_{i,t}=\sum_{j=1}^{N}w_{j,t}*CORR_{i,j,t}$$ 其中,$w_{j,t}$为权重,通常设置为等权[39] 2. **因子名称:地理相关系数变动因子 (GEOGCORRCHG)** - **因子构建思路**:通过计算个股与地理关联公司股票相关程度的变动,构建地理相关系数变动因子,用于捕捉相关性的变化对个股收益的影响[41] - **因子具体构建过程**: 1. 计算目标股票与关联股票在月度日频收益序列的相关系数 2. 计算目标股票与关联股票在过去3个月的日频收益序列的相关系数 3. 计算两者相关系数的差值,衡量相关性的变动程度 4. 对所有关联股票的相关系数差值进行加权求和,得到地理相关系数变动因子 公式: $$GEOGCORRCHG_{i,t}=\sum_{j=1}^{N}w_{j,t}*(CORR_{i,j,t}-CORR_{i,j,t-2,t})$$ 3. **因子名称:地理相关系数拆解因子 (GEOGCORRP, GEOGCORRN, GEOGCORRIP, GEOGCORRJP)** - **因子构建思路**:通过将个股与地理关联公司股票的收益序列拆分为正收益和负收益,构建四种地理相关系数拆解因子,用于捕捉不同方向收益序列的相关性对个股收益的影响[43] - **因子具体构建过程**: 1. 对目标股票与关联股票的日度收益序列进行调整,将负收益调整为0 2. 分别计算正收益序列与正收益序列、负收益序列与负收益序列、正收益序列与负收益序列、负收益序列与正收益序列的相关系数 3. 对所有相关系数进行加权求和,得到四种地理相关系数拆解因子 公式: $$R_{i}^{+}=max(R_{i},0)$$ $$R_{i}^{-}=min(R_{i},0)$$ $$GEOGCORRP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{+},R_{j}^{+})$$ $$GEOGCORRN_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{-},R_{j}^{-})$$ $$GEOGCORRIP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{+},R_{j}^{-})$$ $$GEOGCORRJP_{i,t}=\sum_{j=1}^{N}w_{j}*CORR(R_{i}^{-},R_{j}^{+})$$ 因子的回测效果 1. **GEOGCORR因子** - IC均值:0.074 - 正IC占比:88.00% - 多空策略年化收益率:22.11% - 多空策略信息比率:2.84 - 多头相对中证500策略年化收益率:13.21% - 多头相对中证500策略信息比率:1.55 - 多头平均换手率:77.77%[78][79][80] 2. **GEOGCORRP因子** - IC均值:0.069 - 正IC占比:90.00% - 多空策略年化收益率:21.19% - 多空策略信息比率:3.234 - 多头相对中证500策略年化收益率:13.98% - 多头相对中证500策略信息比率:1.706 - 多头平均换手率:81.92%[78][92][96] 3. **GEOGCORRIP因子** - IC均值:0.063 - 正IC占比:88.67% - 多空策略年化收益率:18.92% - 多空策略信息比率:3.099 - 多头相对中证500策略年化收益率:13.48% - 多头相对中证500策略信息比率:1.659 - 多头平均换手率:84.62%[78][104]