多因子ALPHA系列报告之(三十八):从个股分化看风格轮动
广发证券· 2019-01-08 00:00
量化模型与构建方式 1. **模型名称**:基于分化度的动态风格轮动策略 **模型构建思路**:通过个股分化度指标MADI来判断市场风格,当分化度低于特定阈值时,采用风格趋势策略,反之则采用风格反转策略[2] **模型具体构建过程**:首先计算个股分化度MADI,公式为: $$MADI_{t}=DI_{t}\times{\frac{Vol_{t}}{M}}\sum Vol_{t}$$ 其中,DI为个股横截面月收益率标准差,Vol为个股成交量,M为近12期成交量。当MADI低于阈值F时,采用风格趋势策略,否则采用风格反转策略[23][33] **模型评价**:该策略能够根据市场分化度动态调整风格,显著提升了策略的年化超额收益率[3] 模型的回测效果 1. **基于分化度的动态风格轮动策略**,年化超额收益率为17.6%,年化波动率为9.2%,信息比率(IR)为1.92,最大回撤为7.5%,月换手率为49.5%[40][43] 2. **静态因子策略**,年化超额收益率为13.2%,年化波动率为8.0%,信息比率(IR)为1.65,最大回撤为6.4%,月换手率为47.0%[40] 3. **风格趋势策略**,年化超额收益率为15.6%,年化波动率为8.5%,信息比率(IR)为1.83,最大回撤为7.5%,月换手率为45.5%[40] 4. **风格反转策略**,年化超额收益率为14.6%,年化波动率为9.5%,信息比率(IR)为1.54,最大回撤为17.9%,月换手率为50.8%[40] 量化因子与构建方式 1. **因子名称**:成交量调整分化度指标(VADI) **因子构建思路**:通过剔除股票池涨跌幅首尾各10%的个股,并在剩余80%的个股中计算分化度,再乘以相对成交量进行调整[23] **因子具体构建过程**:首先计算个股分化度DI,公式为: $$DI_{t}=\sqrt{\frac{1}{N-1}\sum(r_{it}-{\bar{r}}_{it})^{2}}$$ 然后计算VADI,公式为: $$VADI_{t}=DI_{t}\times{\frac{Vol_{t}}{M}}\sum Vol_{t}$$ 其中,Vol为个股成交量,M为近12期成交量[23] **因子评价**:VADI能够更准确地反映市场分化度,尤其是在极端市场环境下[23] 因子的回测效果 1. **VADI因子**,在中证800成分股中的平均值为6.7%[25] 2. **DI因子**,在中证800成分股中的平均值为9.7%[25] 最新风格配置结果 1. **中证800策略**,最新风格配置权重为:股息率17%,市现率17%,换手率17%,EPS增长率17%,ROE 4.3%,1个月成交金额2.1%,流通市值0%,DP 17%,CFP 17%,EP 8.5%,SP 8.5%,BP 8.5%[76] 2. **中证500策略**,最新风格配置权重为:ROE 5.4%,1个月成交金额21.6%,换手率5.4%,一个月股价反转10.8%,三个月股价反转0%,流通市值2.7%,DP 21.6%,CFP 10.8%,EP 5.4%,SP 10.8%,BP 5.4%[79] 3. **沪深300策略**,最新风格配置权重为:ROE 3.8%,1个月成交金额3.8%,换手率30.8%,一个月股价反转3.8%,容量比3.8%,流通市值0%,营业费用比例0%,固定比7.7%,EP 15.4%,BP 30.8%[83]
20181228-渤海证券-渤海证券多因子模型研究系列之六:使用thompson sampling算法的策略混合模型
渤海证券· 2018-12-28 00:00
量化模型与构建方式 分层抽样多因子模型 - **模型名称**: 分层抽样多因子模型 - **模型构建思路**: 针对沪深300和中证500成分股,以月度调仓频率构建投资组合,剔除行业影响,单独检测市值因子在历史不同时间段的表现[14][15] - **模型具体构建过程**: 1. 选取估值、盈利、成长、动量、反转、波动率、流动性、市值八大类因子构建多因子模型,经过缺失值处理、去极值、标准化、中性化等前期准备步骤,采用半衰期加权移动平均方法构建收益预测模型[14] 2. 将基准指数按行业划分为31个子集,每个子集中用市值因子将股票划分为数目相等的两组:大市值组与小市值组[15] 3. 在每个组中各自选取预期收益最高的两只股票,令其均分所在行业在基准指数中的权重,从而剔除行业影响[15] - **模型评价**: 能否适应因子的风格变化,主要看其能否在市场风格转变时迅速调整[16] Thompson Sampling 算法 - **模型名称**: Thompson Sampling 算法 - **模型构建思路**: 将多臂赌博机每一个臂的回报概率看作一个Beta分布,通过不断测试调整Beta分布的参数α和β的值,确定最后的权重[27][29] - **模型具体构建过程**: 1. Beta分布的概率密度函数形式如下: $$ f(x;\alpha,\beta)=\mathrm{constant}\cdot x^{\alpha-1}(1-x)^{\beta-1} $$ 其中,α表示实验成功次数,β表示实验失败次数,α/(α+β)为Beta分布的均值[28] 2. 在离散空间中,每次试验中选中一个臂,有收益则该臂的Beta分布的参数α增加1,否则β增加1[29] 3. 扩展到连续空间后,计算之前M期历史收益情况,当大市值组合收益>小市值组合收益时,α值增加1;反之,β值增加1[29] 4. 大市值组合的权重设为α/(α+β),小市值组合的权重设为β/(α+β),得到两个组合混合的最优比例[29] - **模型评价**: 在自我调整的及时性上有更大的优势,表现出较好的适应性[29] Greedy Algorithm - **模型名称**: Greedy Algorithm - **模型构建思路**: 计算每一个臂的回报,选择回报最大的臂进行操作[23] - **模型具体构建过程**: 1. 设置M(M=24)期历史数据为观测窗口,计算两种组合的历史收益[23] 2. 在下一期选择收益高的一组[23] - **模型评价**: 没有完全探索其它奖励概率的可能性,很容易丢掉最优解[23] Epsilon-Greedy Algorithm - **模型名称**: Epsilon-Greedy Algorithm - **模型构建思路**: 在贪心算法的基础上引入探索机制,通过随机数生成来决定是否探索[24] - **模型具体构建过程**: 1. 选定一个较小的常数ε,每次生成一个0到1之间的随机数[24] 2. 如果随机数落在[0,ε]区间内,则随机选择一个臂;如果落在[ε,1]区间内,则选择当前情况下回报率最大的臂[24] 3. 扩展到连续空间后,赋予预期回报率较大组合1-ε的权重,赋予另外一组投资组合ε的权重[24] - **模型评价**: 保持了一定对于探索的开放性,但不能根据试验结果进行自我调整,影响最终整体收益[24] --- 模型的回测效果 沪深300回测结果 - **Thompson Sampling**: 年化收益7.02%,信息比率1.41,胜率66.67%[31][34] - **Epsilon-Greedy Algorithm**: 年化收益5.93%,信息比率1.25,胜率61.90%[34] - **Greedy Algorithm**: 年化收益3.05%,信息比率0.25,胜率55.24%[34] - **定期调整资产比例组(CRP)**: 年化收益6.47%,信息比率1.39,胜率60.95%[34] - **买入持有组(BAH)**: 年化收益6.71%,信息比率1.37,胜率60.00%[34] 中证500回测结果 - **Thompson Sampling**: 年化收益12.43%,信息比率2.24,胜率75.24%[40][44] - **Epsilon-Greedy Algorithm**: 年化收益9.04%,信息比率1.45,胜率66.67%[44] - **Greedy Algorithm**: 年化收益10.72%,信息比率2.00,胜率73.33%[44] - **定期调整资产比例组(CRP)**: 年化收益11.71%,信息比率2.19,胜率74.29%[44] - **买入持有组(BAH)**: 年化收益11.82%,信息比率2.23,胜率79.05%[44] 股债混合模型回测结果 - **Thompson Sampling**: 年化收益15.73%,信息比率3.0044,胜率53.24%[49][51] - **Epsilon-Greedy Algorithm**: 年化收益8.46%,信息比率0.5649,胜率51.90%[51] - **Greedy Algorithm**: 年化收益12.84%,信息比率0.5289,胜率51.90%[51] - **定期调整资产比例组(CRP)**: 年化收益5.76%,信息比率0.0825,胜率47.41%[51]
20180926-渤海证券-渤海证券多因子模型研究系列之五:使用Bandit Learning算法的多因子模型
渤海证券· 2018-09-26 00:00
量化模型与构建方式 1. 模型名称:Bandit Learning 模型 - **模型构建思路**:Bandit Learning 模型是一种在线学习算法,旨在通过实时反馈平衡守成(exploitation)与探索(exploration)的比例,以最大化总体收益[4][10][12] - **模型具体构建过程**: 1. 定义资产收益率 $R_{k}=(R_{k,1},\cdots R_{k,n})^{T},k=1,\cdots,m$,并在每个时刻 $k$ 求解权重 $W_{k}=(W_{k,1},\cdots,W_{k,n})^{\rm T}$,满足 $\sum_{i=1}^{n}w_{k,i}=1$ 和 $w_{k,i}\geq0$[13][14] 2. 使用传统多因子模型估计资产收益率和协方差矩阵 $\Sigma_{k}$,并对协方差矩阵进行主成分分解,得到特征值和特征向量[14][16] 3. 对特征向量进行归一化处理,得到线性不相关的投资组合权重 $\widetilde{H}_{k}$,并计算新的协方差矩阵 $\tilde{\Sigma}_{k}$[16][17] 4. 使用 UCB(Upper Confidence Bound)算法计算每个特征向量的奖赏函数 $\bar{r}_{i}(t_{k})=\frac{\bar{H}_{k,i}R_{k,i}}{\sqrt{\hat{A}_{k,i}}}$,并选择最优臂 $i_{k}^{*}$ 和 $j_{k}^{*}$[19][21][23] 5. 通过优化权重 $\theta_{k}^{*}=\frac{\tilde{\lambda}_{k,i_{k}^{*}}}{\tilde{\lambda}_{k,i_{k}^{*}}+\tilde{\lambda}_{k,j_{k}^{*}}}$,构建最终投资组合权重 $w_{k}=(1-\theta_{k}^{*})\bar{H}_{k,i_{k}^{*}}+\theta_{k}^{*}\bar{H}_{k,j_{k}^{*}}$[24][25] 6. 对权重进行非负约束调整,最终输出最优权重 $w_{new,k}$[26][27] - **模型评价**:Bandit Learning 模型在震荡市中表现优于传统多因子模型,但在趋势性市场中表现稍逊。其选股风格较为跳跃,适应性较强,但收益来源和延续能力存在不确定性[4][42][50] 2. 模型名称:传统多因子模型 - **模型构建思路**:基于 Markowitz 风险收益模型,通过线性模型预测收益,结合 Barra 模型估计协方差矩阵,优化投资组合[9][31] - **模型具体构建过程**: 1. 选取估值、盈利、成长、动量、反转、波动率、流动性、市值八大类因子,经过缺失值处理、去极值、标准化和中性化等步骤,构建收益预测模型[31][33] 2. 使用 Barra 模型估计协方差矩阵 $\Sigma=X_{f}F X_{f}{}^{\prime}+\Delta$,其中 $X_{f}$ 为因子暴露矩阵,$F$ 为因子收益率协方差矩阵,$\Delta$ 为个股残差波动率对角矩阵[33][34] 3. 结合收益预测和风险预测,求解优化问题 $\max \alpha^{\prime}w-\frac{1}{2}\lambda w^{\prime}\Sigma w$,其中 $\alpha$ 为收益预测,$\Sigma$ 为协方差矩阵,$\lambda$ 为风险厌恶系数[35][36] - **模型评价**:传统多因子模型在趋势性市场中表现优异,但在震荡市和市场剧变时回撤较大,适应性较弱[4][42][50] --- 模型的回测效果 Bandit Learning 模型 - **累计收益**:$l=3$为143.73%,$l=4$为175.09%,$l=5$为95.01%[43] - **年化收益**:$l=3$为17.82%,$l=4$为20.48%,$l=5$为13.08%[43] - **波动率**:$l=3$为30.69%,$l=4$为30.23%,$l=5$为30.07%[43] - **最大回撤**:均为57.03%[43] - **夏普比率**:$l=3$为0.578,$l=4$为0.6742,$l=5$为0.4331[43] - **胜率**:$l=3$为53.03%,$l=4$为52.81%,$l=5$为52.67%[43] 传统多因子模型 - **累计收益**:180.34%[43] - **年化收益**:20.89%[43] - **波动率**:25.71%[43] - **最大回撤**:35.59%[43] - **夏普比率**:0.8088[43] - **胜率**:53.76%[43] --- 量化因子与构建方式 1. 因子名称:估值因子 - **因子的构建思路**:衡量股票的估值水平[33] - **因子具体构建过程**:选取 BP 和扣非 EP_ttm 作为估值因子[33] 2. 因子名称:盈利因子 - **因子的构建思路**:衡量公司盈利能力[33] - **因子具体构建过程**:选取单季度 ROE 作为盈利因子[33] 3. 因子名称:成长因子 - **因子的构建思路**:衡量公司成长性[33] - **因子具体构建过程**:选取单季度营业收入增长率和单季度归母净利润增长率[33] 4. 因子名称:动量因子 - **因子的构建思路**:衡量股票的动量效应[33] - **因子具体构建过程**:选取指数加权一年收益率和上月收益率[33] 5. 因子名称:反转因子 - **因子的构建思路**:衡量股票的反转效应[33] - **因子具体构建过程**:选取上月收益率[33] 6. 因子名称:波动率因子 - **因子的构建思路**:衡量股票的波动性[33] - **因子具体构建过程**:选取月度、季度和年度波动率[33] 7. 因子名称:流动性因子 - **因子的构建思路**:衡量股票的流动性[33] - **因子具体构建过程**:选取月度、季度和年度换手率[33] 8. 因子名称:市值因子 - **因子的构建思路**:衡量股票的市值规模[33] - **因子具体构建过程**:选取流通市值对数[33] --- 因子的回测效果 Bandit Learning 模型因子 - **因子均值**:市值-0.197,盈利-0.050,反转-0.002,动量-0.004,成长0.226,流动性0.043,波动率0.167,估值-0.138[49] - **因子波动**:市值0.413,盈利0.521,反转0.490,动量0.446,成长1.114,流动性0.457,波动率0.378,估值0.297[49] - **因子收益**:市值0.007,盈利-0.005,反转-0.027,动量0.019,成长0.063,流动性-0.018,波动率-0.069,估值-0.094[49] 传统多因子模型因子 - **因子均值**:市值-0.174,盈利0.221,反转0.002,动量0.141,成长0.700,流动性-0.218,波动率-0.131,估值0.245[49] - **因子波动**:市值0.534,盈利0.425,反转0.368,动
20180816_海通证券_金融工程专题_冯佳睿吕丽颖_选股因子系列研究(三十六)——哪些宏观经济指标存在选股效应?
海通证券· 2018-08-16 00:00
量化因子与构建方式 1. 因子名称:宏观敏感性因子(MacroBeta) - **因子的构建思路**:通过宏观敏感性因子(MacroBeta)刻画股票与宏观经济指标之间的关系,包括方向与程度[10][13][63] - **因子具体构建过程**: 1. **原始模型**:计算股票对宏观经济指标的暴露系数(MacroBeta),公式为: $$ Return_{i,t} = \alpha_{i,t} + \beta_{i,t}^{F} \cdot F_{t} + \varepsilon_{i,t} $$ 其中,$F$ 表示宏观经济指标第 $t$ 期的取值,$Return$ 表示第 $t$ 期的股票绝对收益[13] 2. **控制风格因子**:为剥离市值等风格因子的影响,加入Fama-French三因子模型,公式为: $$ Return_{i,t} = \alpha_{i,t} + \beta_{i,t}^{F} \cdot F_{t} + \beta_{i,t}^{MKT} \cdot MKT_{t} + \beta_{i,t}^{SMB} \cdot SMB_{t} + \beta_{i,t}^{HML} \cdot HML_{t} + \varepsilon_{i,t} $$ 其中,$MKT$ 表示市场因子,$SMB$ 表示市值因子,$HML$ 表示估值因子[14] 3. **数据处理**:以月度差分的方式计算宏观经济指标 $F$,以获得平稳的数据序列[15] 4. **选股逻辑**:基于T值筛选股票,设定两种筛选标准: - T值绝对值≥1.96(95%显著性水平) - T值绝对值≥1.65(90%显著性水平)[15][63] - **因子评价**:宏观敏感性因子在选股的收益预测模型中应用价值有限,但在风控模型中具有一定的应用价值,可用于约束股票权重以规避宏观经济变化的风险[66] 2. 因子名称:价格类因子(CPI同比、PPI同比) - **因子的构建思路**:通过股票对价格类指标(如CPI同比、PPI同比)的敏感性,捕捉其与股票收益之间的关系[5][16] - **因子具体构建过程**: 1. **CPI同比**: - 正敏感组合:选择MacroBeta系数T值大于1.65的股票(90%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[22] 2. **PPI同比**: - 正敏感组合:选择MacroBeta系数T值大于1.96的股票(95%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[17] - **因子评价**: - PPI同比:正敏感组合和负敏感组合均存在明显的选股效应[20] - CPI同比:选股效应在2015年后逐渐消失,可能与CPI波动趋于平稳有关[25] 3. 因子名称:利率类因子(利率水平、期限利差、信用利差) - **因子的构建思路**:通过股票对利率类指标(如利率水平、期限利差、信用利差)的敏感性,捕捉其与股票收益之间的关系[5][34] - **因子具体构建过程**: 1. **利率水平**: - 正敏感组合:选择MacroBeta系数T值大于1.65的股票(90%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[34] 2. **期限利差**: - 正敏感组合:选择MacroBeta系数T值大于1.96的股票(95%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[41] 3. **信用利差**: - 正敏感组合:选择MacroBeta系数T值大于1.96的股票(95%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[47] - **因子评价**: - 利率水平和信用利差:正敏感组合和负敏感组合均存在明显的选股效应[38][49] - 期限利差:仅正敏感组合存在选股效应[46] 4. 因子名称:股市波动率因子 - **因子的构建思路**:通过股票对股市波动率的敏感性,捕捉其与股票收益之间的关系[5][53] - **因子具体构建过程**: - 正敏感组合:选择MacroBeta系数T值大于1.96的股票(95%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[53] - **因子评价**:仅正敏感组合存在选股效应[56] 5. 因子名称:金价因子 - **因子的构建思路**:通过股票对金价的敏感性,捕捉其与股票收益之间的关系[57] - **因子具体构建过程**: - 正敏感组合:选择MacroBeta系数T值大于1.96的股票(95%显著性水平) - 负敏感组合:选择MacroBeta系数T值小于-1.96的股票(95%显著性水平)[57] - **因子评价**:仅正敏感组合存在选股效应[62] --- 因子的回测效果 1. 宏观敏感性因子 - 年化收益率:11.9%(基于当期指标方向预测)[20] - 年化收益率:18.9%(基于下期指标方向预测)[20] - 夏普比率:0.44(当期预测)/ 0.83(下期预测)[20] 2. CPI同比因子 - 2015年以前:选股策略有效,净值震荡上行[25] - 2015年以后:选股策略失效[25] 3. 利率水平因子 - 年化收益率:2.8%(当期预测)/ 20.0%(下期预测)[40] - 夏普比率:0.08(当期预测)/ 1.18(下期预测)[40] 4. 信用利差因子 - 年化收益率:4.2%(当期预测)/ 21.7%(下期预测)[52] - 夏普比率:0.23(当期预测)/ 1.38(下期预测)[52]
多因子ALPHA系列报告之(三十七):探寻资金流背后的风格轮动规律
广发证券· 2018-07-15 00:00
量化模型与构建方式 模型名称:净流入比率策略 - **模型构建思路**:通过资金流偏好度的横向对比,找到资金流入最强的风格因子,并根据训练机制进行配置[71] - **模型具体构建过程**: - 样本来源:全市场非停牌且上市满1年的股票[71] - 样本区间:2010年5月7日-2018年6月29日,其中2010年5月7日-2018年4月20日为样本内训练,其余为样本外数据[71] - 行业分类:申万一级行业分类,共28个行业[71] - 策略设置:每周末根据风格因子上的净流入比率判断资金流偏好度最高的风格因子,并根据训练机制配置下一周的风格[71] - 策略基准:上证综指对冲[71] - 交易费率:0.2%[71] - **模型评价**:除了2017年超额收益率为负,其余年份均为正,策略在市场剧烈波动时仍能捕获收益[74] 模型名称:融资余额增量占比策略 - **模型构建思路**:通过资金流偏好度的横向对比,分析融资余额增量占比对风格因子的影响[76] - **模型具体构建过程**: - 样本来源、样本区间、行业分类、策略设置、策略基准、交易费率与净流入比率策略相同[76] - 策略回测:每周末根据融资余额增量占比判断资金流偏好度最高的风格因子,并配置下一周的风格[76] - **模型评价**:策略善于捕捉牛市中的小市值行情,但难以把握大盘蓝筹行情,近两年表现不佳[79] 模型名称:沪深股通资金流入交易额占比策略 - **模型构建思路**:通过资金流偏好度的横向对比,分析沪深股通资金流入交易额占比对风格因子的影响[81] - **模型具体构建过程**: - 样本区间:2017年3月17日-2018年6月29日,其中2017年3月17日-2018年4月20日为样本内训练,其余为样本外数据[81] - 策略回测:每周末根据沪深股通资金流入交易额占比判断资金流偏好度最高的风格因子,并配置下一周的风格[81] - **模型评价**:策略表现出色,显著跑赢基准,偏好盈利和大市值股票,但训练时间较短[84] 模型名称:主动流入资金环比增长策略 - **模型构建思路**:通过资金流偏好度的纵向变化对比,分析主动流入资金环比增长对风格因子的影响[86] - **模型具体构建过程**: - 样本来源、样本区间、行业分类、策略设置、策略基准、交易费率与净流入比率策略相同[86] - 策略回测:每周末根据主动流入资金环比增长判断资金流偏好度最高的风格因子,并配置下一周的风格[86] - **模型评价**:策略在牛市和大盘蓝筹行情中表现较好,但近两年表现不佳[88] 模型名称:融资增量环比增长策略 - **模型构建思路**:通过资金流偏好度的纵向变化对比,分析融资增量环比增长对风格因子的影响[90] - **模型具体构建过程**: - 样本来源、样本区间、行业分类、策略设置、策略基准、交易费率与净流入比率策略相同[90] - 策略回测:每周末根据融资增量环比增长判断资金流偏好度最高的风格因子,并配置下一周的风格[90] - **模型评价**:策略在所有年份超额收益率均为正,能较好捕捉牛市和大盘蓝筹行情,但在熊市中回撤较高[92] 模型名称:沪深股通环比增长策略 - **模型构建思路**:通过资金流偏好度的纵向变化对比,分析沪深股通环比增长对风格因子的影响[93] - **模型具体构建过程**: - 样本区间:2017年3月17日-2018年6月29日,其中2017年3月17日-2018年4月20日为样本内训练,其余为样本外数据[93] - 策略回测:每周末根据沪深股通环比增长判断资金流偏好度最高的风格因子,并配置下一周的风格[93] - **模型评价**:策略表现较好,但不如沪深股通资金流入交易额占比策略,偏好杠杆类因子[94] 模型名称:综合策略 - **模型构建思路**:综合4个资金流偏好度的配置方案,构成最终的综合配置方案[95] - **模型具体构建过程**: - 每期监测4个资金流偏好度的最强风格因子,记录推荐配置方案及权重,最终等权配置归一化后得到综合策略[95] - **模型评价**:相比单一策略,综合策略表现更加稳定,超额收益率提高,最大回撤改善[103] --- 模型的回测效果 净流入比率策略 - **超额收益率**:全样本428%,2010年27%,2011年1%,2012年1%,2013年38%,2014年11%,2015年127%,2016年21%,2017年-6%,2018年2%[74] - **胜率**:全样本64%,2010年62%,2011年59%,2012年56%,2013年71%,2014年64%,2015年81%,2016年68%,2017年51%,2018年56%[74] - **最大回撤**:全样本-20%,2010年-7%,2011年-11%,2012年-8%,2013年-3%,2014年-20%,2015年-10%,2016年-7%,2017年-13%,2018年-7%[74] 融资余额增量占比策略 - **超额收益率**:全样本546%,2010年33%,2011年2%,2012年15%,2013年43%,2014年4%,2015年159%,2016年24%,2017年-10%,2018年-3%[79] - **胜率**:全样本65%,2010年65%,2011年53%,2012年58%,2013年75%,2014年68%,2015年83%,2016年64%,2017年53%,2018年60%[79] - **最大回撤**:全样本-27%,2010年-5%,2011年-8%,2012年-6%,2013年-3%,2014年-27%,2015年-14%,2016年-6%,2017年-12%,2018年-9%[79] 沪深股通资金流入交易额占比策略 - **超额收益率**:全样本26%,2017年10%,2018年14%[84] - **胜率**:全样本71%,2017年69%,2018年75%[84] - **最大回撤**:全样本-4%,2017年-4%,2018年-1%[84] 主动流入资金环比增长策略 - **超额收益率**:全样本686%,2010年22%,2011年8%,2012年8%,2013年32%,2014年26%,2015年150%,2016年36%,2017年-2%,2018年0%[88] - **胜率**:全样本66%,2010年68%,2011年59%,2012年52%,2013年76%,2014年68%,2015年83%,2016年70%,2017年55%,2018年56%[88] - **最大回撤**:全样本-18%,2010年-3%,2011年-9%,2012年-7%,2013年-3%,2014年-10%,2015年-18%,2016年-2%,2017年-6%,2018年-9%[88] 融资增量环比增长策略 - **超额收益
深度学习研究报告之五:风险中性的深度学习选股策略
广发证券· 2018-07-14 00:00
量化模型与构建方式 1. **模型名称**:风险中性的深度学习选股模型 **模型构建思路**:通过对股票样本进行风险中性化处理,减小风险因子轮动和行业轮动对模型训练和预测的影响[3] **模型具体构建过程**: - 首先,对股票样本进行风险中性化处理,通过截面回归剥离风险因子影响,寻找在相同行业和相似市值区间内的强势股票和弱势股票进行样本标注[3] - 使用传统选股因子和技术指标作为输入特征,训练深度学习预测模型,对股票未来走势进行预测打分和选股交易[4] - 模型采用7层深层神经网络,输入层包含156个特征,输出层为3个节点,分别表示股票未来走势的三种可能性:上涨、平盘、下跌[23][24] - 隐含层激活函数采用ReLU,输出层激活函数采用softmax[33][66] - 模型训练时采用Dropout和Batch Normalization技术提高泛化能力和训练效率[38] 2. **模型名称**:普通深度学习选股模型 **模型构建思路**:通过历史数据训练深度学习模型,预测股票未来走势,未进行风险中性化处理[39] **模型具体构建过程**: - 对股票样本进行标注,根据未来10个交易日的涨跌幅将股票分为上涨、平盘、下跌三类[39] - 使用传统选股因子和技术指标作为输入特征,训练深度学习预测模型[4] - 模型结构与风险中性模型相同,均为7层深层神经网络[23][24] 模型的回测效果 1. **风险中性的深度学习选股模型** - 年化收益率:21.95%[4] - 最大回撤:-5.03%[4] - 胜率:74.6%[4] - 信息比率(IR):2.92[4] 2. **普通深度学习选股模型** - 年化收益率:19.71%[77] - 最大回撤:-5.35%[77] - 胜率:69.5%[77] - 信息比率(IR):2.47[77] 量化因子与构建方式 1. **因子名称**:行业中性因子 **因子构建思路**:通过将股票按行业划分,在同一行业内进行收益率排序,选出每个行业内跑赢和跑输的股票,避免行业轮动的影响[43] **因子具体构建过程**: - 将全市场股票按申万一级行业划分[43] - 在同一时间截面对不同行业内的股票进行收益率排序,选出每个行业内跑赢和跑输的股票[43] 2. **因子名称**:市值风格中性因子 **因子构建思路**:通过将股票按市值区间划分,在同一市值区间内进行收益率排序,选出每个市值区间内跑赢和跑输的股票,避免市值风格切换的影响[46] **因子具体构建过程**: - 将全市场股票按不同市值区间划分[46] - 在同一时间截面对不同市值区间内的股票进行收益率排序,选出每个市值区间内跑赢和跑输的股票[46] 3. **因子名称**:风险中性因子 **因子构建思路**:通过回归方法剥离多个风险因子的影响,选出剥离风险因子后收益率在前10%的股票[48] **因子具体构建过程**: - 假设考虑K个风险因子,通过回归方法对风险因子进行剥离[48] - 回归公式为: $$r_{i}^{t+1}=X_{i1}^{t}f_{1}^{t}+X_{i2}^{t}f_{2}^{t}+\cdots+X_{i K}^{t}f_{K}^{t}+\epsilon_{i}^{t}$$ - 按照回归残差在同一时间截面进行排序,选出剥离风险因子后收益率在前10%的股票[48] 因子的回测效果 1. **行业中性因子** - 因子IC:0.082[68] - 因子IC标准差:0.108[68] 2. **市值风格中性因子** - 因子IC:0.082[68] - 因子IC标准差:0.108[68] 3. **风险中性因子** - 因子IC:0.082[68] - 因子IC标准差:0.108[68]
20180624_海通证券_金融工程专题_冯佳睿吕丽颖_选股因子系列研究(三十四)——宏观经济数据可以用来选股吗?
海通证券· 2018-06-24 00:00
量化因子与构建方式 宏观敏感性因子(MacroBeta) - **因子名称**:宏观敏感性因子(MacroBeta)[3][17] - **因子的构建思路**:通过回归模型刻画股票收益与宏观经济指标之间的关系,量化股票对宏观经济指标的敏感性[17] - **因子具体构建过程**: 1. 使用模型一:将股票的历史超额收益对宏观经济变量进行回归,回归系数即为MacroBeta,公式如下: $$ ExcessReturn_{i,t} = \alpha_{i,t} + MacroBeta_{i,t} \cdot F_t + \varepsilon_{i,t} $$ 其中,$F_t$表示宏观经济指标的取值,$ExcessReturn$为股票的超额收益[17] 2. 使用模型二:在模型一的基础上加入Fama-French三因子,控制市值、估值等风格因子的影响,公式如下: $$ Return_{i,t} = \alpha_{i,t} + MacroBeta_{i,t} \cdot F_t + \beta_{i,t}^{MKT} \cdot MKT_t + \beta_{i,t}^{SMB} \cdot SMB_t + \beta_{i,t}^{HML} \cdot HML_t + \varepsilon_{i,t} $$ 其中,$MKT$为市场因子,$SMB$为市值因子,$HML$为估值因子[17] 3. 数据清洗:对宏观经济数据进行差分法、Surprise替代法或资产组合模拟法处理,以解决数据滞后、不平稳等问题[22][24][27] 4. 回归计算:将个股过去60个月的超额收益对同期的模拟组合收益进行回归,获得MacroBeta[41] - **因子评价**:该因子能够刻画股票与宏观经济指标的关系,但其选股效果依赖于宏观经济指标的变化方向和因子稳定性[3][104] 基于宏观得分的因子 - **因子名称**:宏观得分因子[80] - **因子的构建思路**:结合股票的宏观敏感性与预期宏观经济走势,计算每只股票的宏观得分,用于选股[80] - **因子具体构建过程**: 1. 定义宏观得分公式: $$ Score = MacroBeta \times 预期宏观经济走势 $$ [80] 2. 在选股时,根据$t$期个股的宏观敏感性和对$t+1$期宏观经济的预判,计算每只股票的得分: $$ Score_{t+1} = MacroBeta_t \times P_{t+1} $$ 其中,$P_{t+1}$为预测的宏观经济指标变化值[81] 3. 根据得分排序,选择得分最高的若干股票形成组合[81] - **因子评价**:该因子在理论上可行,但实际效果依赖于对未来宏观经济走势的准确预测以及敏感性因子的跨期稳定性[84][105] --- 因子的回测效果 宏观敏感性因子 - **多空收益差**: - 工业增加值当月同比:-0.004[68] - PPI同比:-0.004[68] - CPI同比:-0.003[68] - **IC均值**: - 工业增加值当月同比:-0.010[68] - PPI同比:-0.014[68] - CPI同比:-0.014[68] - **胜率**: - 工业增加值当月同比:44.8%[68] - PPI同比:45.8%[68] - CPI同比:45.8%[68] 基于宏观得分的因子 - **PPI敏感性因子**: - 宏观得分多空净值曲线在2015年后依然稳定向上,表明基于宏观得分的选股逻辑存在可行性[84] - **油价敏感性因子**: - 宏观得分选股后,不论油价上涨还是下跌,因子均展现出较好的选股效果[88][93] --- 其他关键点 - **宏观敏感性因子的跨期稳定性**: - PPI同比和油价涨跌幅的跨期稳定性较高,适合构建宏观得分并应用于选股[99][102] - 外汇储备敏感性因子的跨期稳定性较低,选股效果不佳[99][102] - **宏观敏感性因子的选股陷阱**: - 选股效果依赖于宏观经济指标的变化方向,忽视这一点可能导致错误的选股结果[71][75]
多因子ALPHA系列报告之(三十六):机器学习多因子动态调仓策略
广发证券· 2018-04-26 00:00
量化模型与构建方式 1. **模型名称**:XGBoost模型 **模型构建思路**:通过机器学习方法,基于历史数据提炼因子风格轮动的规律,预测因子未来的IC值,动态调整因子权重[2] **模型具体构建过程**: - 选择7个风格因子,包括盈利、质量、成长、估值、规模、流动性、技术因子[31] - 提取因子历史IC序列、宏观经济变量、市场变量作为特征,共34个特征[59] - 使用XGBoost模型对每个因子未来一期的IC值进行预测,预测周期为5个交易日[59] - 根据预测的IC值对因子进行动态加权,正向因子IC>0时赋予权重,负向因子IC<0时赋予权重,否则剔除[82] - 对权重进行归一化处理,确保权重总和为1[82] **模型评价**:XGBoost模型能够有效捕捉因子风格轮动的规律,预测效果优于基于动量效应的模型[76] 2. **模型名称**:滚动训练XGBoost模型 **模型构建思路**:通过滚动训练方式,每个季度更新模型,以更好地追踪市场风格的变化[113] **模型具体构建过程**: - 每个季度采用最新数据更新模型,保持训练集样本数量一致[113] - 根据滚动训练的模型预测因子未来一期的IC值,动态调整因子权重[113] **模型评价**:滚动训练模型能够更好地适应市场风格的变化,提升策略表现[113] 模型的回测效果 1. **XGBoost模型** - 年化收益率:17.12%[94] - 年化波动率:13.22%[94] - 信息比(IR):1.30[94] - 最大回撤:-15.36%[94] - 累积收益率:88.18%[94] - 周度胜率:55.96%[94] 2. **滚动训练XGBoost模型** - 年化收益率:20.08%[120] - 年化波动率:11.51%[120] - 信息比(IR):1.74[120] - 最大回撤:-7.68%[120] - 累积收益率:107.89%[120] - 周度胜率:63.21%[120] 量化因子与构建方式 1. **因子名称**:ROE、速动比率、ROE同比、EP、流通市值、月成交金额、一个月动量 **因子构建思路**:从盈利、质量、成长、估值、规模、流动性、技术等7大类因子中各选取一个典型因子[31] **因子具体构建过程**: - 每个因子采用分位数变换进行标准化,保留因子排名信息[31] - 标准化公式为: $$Score(stock_i, factor_j) = \frac{Rank(stock_i, factor_j)}{N}$$ 其中,N为参与排名的股票总数[31] **因子评价**:因子风格轮动现象与宏观经济和市场变量密切相关,因子有效性随时间变化[18] 因子的回测效果 1. **ROE因子** - 近1年平均IC:3.83[22] - 近11年平均IC:0.72[22] - ICIR:0.06[22] 2. **速动比率因子** - 近1年平均IC:-0.62[22] - 近11年平均IC:0.68[22] - ICIR:0.06[22] 3. **ROE同比因子** - 近1年平均IC:3.28[22] - 近11年平均IC:0.88[22] - ICIR:0.12[22] 4. **EP因子** - 近1年平均IC:4.95[22] - 近11年平均IC:3.01[22] - ICIR:0.25[22] 5. **流通市值因子** - 近1年平均IC:-2.83[22] - 近11年平均IC:2.87[22] - ICIR:0.29[22] 6. **月成交金额因子** - 近1年平均IC:2.41[22] - 近11年平均IC:5.87[22] - ICIR:0.43[22] 7. **一个月动量因子** - 近1年平均IC:1.93[22] - 近11年平均IC:6.44[22] - ICIR:0.40[22]
多因子ALPHA系列报告之(三十五):宏观视角下的风格轮动探讨
广发证券· 2018-04-08 00:00
量化模型与构建方式 宏观事件驱动策略 - **模型名称**:宏观事件驱动策略 - **模型构建思路**:通过为各个风格因子找到能够使其表现凸显的宏观事件,根据宏观事件是否触发来选择本期应当配置的风格因子[2][58] - **模型具体构建过程**: 1. 确定样本训练时间区间(2005年1月至2017年12月)[34] 2. 设定训练参数 $K=6, 9, 12$ 个月(若为季度数据则为 $K=4, 6, 8$ 个季度)[34] 3. 根据参数计算宏观事件的触发时间点[34] 4. 计算触发事件后风格的表现,包括触发次数、平均收益率、IR、胜率等指标[34] 5. 筛选有效事件:触发次数超过15次,平均收益率为正,胜率超过50%,并且IR、IC、胜率高于全样本表现[34] 6. 若多个参数满足条件,按胜率排序,保留胜率最高的参数作为最佳参数[34] 7. 策略运行时,每月末判断宏观事件是否触发,选择触发的风格因子进行等权配置[58] - **模型评价**:该策略能够显著提升超额收益,但在极端环境下可能产生较大回撤[60][99] 宏观趋势匹配策略 - **模型名称**:宏观趋势匹配策略 - **模型构建思路**:通过比较当前宏观因子走势与历史上某一时期的宏观因子走势的相似性,利用历史相似时期的未来风格表现来指导当前风格配置[75][76] - **模型具体构建过程**: 1. 确定样本训练时间区间(2009年2月至2017年12月)[77] 2. 将宏观因子分为8大类,从每类中选出一个因子构成宏观因子组合[77] 3. 每月末利用最近12个月的宏观因子数据与历史数据计算匹配度,匹配度公式为:两个时间点宏观因子相关系数的均值[81] 4. 找到匹配度最高的历史时间点,利用该时间点未来6个月的风格因子表现作为当前风格配置依据[77][81] 5. 筛选出IR表现最高的10个风格因子,并根据过去12期和匹配时间点未来6期的IR表现之和进行权重配置[77][86] - **模型评价**:该策略回撤较小,稳定性较高,但测算时间避开了2008年金融危机[87] 综合策略 - **模型名称**:综合策略 - **模型构建思路**:结合宏观事件驱动策略和宏观趋势匹配策略,利用宏观事件驱动策略选择风格因子,通过宏观趋势匹配策略为风格因子提供权重配置建议[92] - **模型具体构建过程**: 1. 每月末根据宏观事件驱动策略找到触发的风格因子[93] 2. 利用宏观趋势匹配策略找到最佳历史匹配时点[93] 3. 结合触发因子在当前最近12期的IR表现和匹配时点未来6期的IR表现,计算权重并进行配置[93] - **模型评价**:综合策略相比前两种策略表现更加稳定,超额回报更高[96][99] --- 模型的回测效果 宏观事件驱动策略 - **累计超额收益率**:346.59%[60] - **胜率**:66.44%[60] - **最大回撤**:51.79%[60] 宏观趋势匹配策略 - **累计超额收益率**:183.66%[87] - **胜率**:65.14%[87] - **最大回撤**:19.42%[87] 综合策略 - **累计超额收益率**:270.88%[96] - **胜率**:71.56%[96] - **最大回撤**:22.08%[96] --- 量化因子与构建方式 流通市值(小盘) - **因子构建思路**:通过观察PPI同比突破布林带上轨,捕捉小市值风格的显著表现[39] - **因子具体构建过程**: 1. 计算PPI同比的布林带上轨(过去6个月均值+2倍标准差)[39] 2. 当PPI同比突破布林带上轨时,触发小市值风格因子[39] - **因子评价**:物价上涨改善中小企业营业能力,小市值风格表现显著[39] 流通市值(大盘) - **因子构建思路**:通过观察波罗的海干散货指数突破布林带上轨,捕捉大市值风格的显著表现[42] - **因子具体构建过程**: 1. 计算波罗的海干散货指数的布林带上轨(过去12个月均值+2倍标准差)[42] 2. 当波罗的海干散货指数突破布林带上轨时,触发大市值风格因子[42] - **因子评价**:原材料运费上涨,大公司更能抵御成本上升风险[42] 毛利率 - **因子构建思路**:通过观察OECD综合领先指标连续上涨,捕捉毛利率风格的显著表现[46] - **因子具体构建过程**: 1. 计算OECD综合领先指标的连续上涨期数(9期)[46] 2. 当指标连续上涨9期时,触发毛利率风格因子[46] - **因子评价**:市场过热阶段企业盈利能力增强,毛利率风格表现显著[46] EP(估值因子) - **因子构建思路**:通过观察1年期国债利率创下最近6期新高,捕捉EP风格的显著表现[49] - **因子具体构建过程**: 1. 计算1年期国债利率的最近6期新高[49] 2. 当利率创下新高时,触发EP风格因子[49] - **因子评价**:货币流动性下降,价值股更受青睐[49] 一个月股价反转 - **因子构建思路**:通过观察全市场PE值创下最近6期新低,捕捉股价反转风格的显著表现[53] - **因子具体构建过程**: 1. 计算全市场PE值的最近6期新低[53] 2. 当PE值创下新低时,触发股价反转风格因子[53] - **因子评价**:市场触底反弹或盈利改善,投机热情提升[53] 一年股价动量 - **因子构建思路**:通过观察消费者信心指数突破布林带上轨,捕捉股价动量风格的显著表现[57] - **因子具体构建过程**: 1. 计算消费者信心指数的布林带上轨(过去6个月均值+2倍标准差)[57] 2. 当指数突破布林带上轨时,触发股价动量风格因子[57] - **因子评价**:投资者预期向好,倾向于持有股票[57] --- 因子的回测效果 流通市值(小盘) - **胜率**:82.61%[39] - **年化IR**:3.97[39] 流通市值(大盘) - **胜率**:60%[42] - **年化IR**:1.09[42] 毛利率 - **胜率**:77.78%[46] - **年化IR**:1.63[46] EP - **胜率**:76.47%[49] - **年化IR**:2.07[50] 一个月股价反转 - **胜率**:86.11%[53] - **年化IR**:3.22[53] 一年股价动量 - **胜率**:68.75%[57] - **年化IR**:
20180104_海通证券_金融工程专题_冯佳睿袁林青_选股因子系列研究(三十一)——因子择时指标的筛选
海通证券· 2018-01-04 00:00
量化模型与构建方式 1. 模型名称:回归法下的因子择时模型 - **模型构建思路**:将因子择时模型视为因子收益的预测模型,通过因子收益与外生变量的稳定相关性,预测因子未来收益[11] - **模型具体构建过程**: 1. 模型公式为: $$ \beta_{j,t}=\alpha+C_{1,t}X_{1,t}+C_{2,t}X_{2,t}+\cdots+C_{N,t}X_{N,t}+\varepsilon_{t} $$ 其中,$\beta_{j,t}$为因子收益,$X_{1,t}, X_{2,t}, \dots, X_{N,t}$为外生变量,$C_{1,t}, C_{2,t}, \dots, C_{N,t}$为回归系数[11] 2. 使用宏观经济、金融市场及因子历史表现构建因子择时变量库[11] 3. 通过回归方法筛选适合当前市场环境的择时变量[12] - **模型评价**:模型易于理解且具有较强的扩展性,能够动态筛选变量以适应市场环境[11][12] 2. 模型名称:套索回归法下的因子择时模型 - **模型构建思路**:通过L1正则化实现变量选择,剔除冗余变量,同时对参数估计进行收缩[13] - **模型具体构建过程**: 1. 模型公式为: $$ \operatorname*{min}_{\beta_{0},\beta}(\frac{1}{2N}{\sum_{i=1}^{N}}(y_{i}-\beta_{0}-x_{i}^{T}\beta)^{2}+\lambda\sum_{j=1}^{p}|\beta_{j}|) $$ 其中,$\lambda$为正则化参数,控制变量选择的强度[14] 2. 使用2009年至2017年的数据进行回测,剔除次新股与ST股[13] 3. 使用规模因子、中盘因子、流动性因子等构建收益预测模型,并对因子间进行正交处理[13] 4. 基准模型与因子择时模型均采用最大化单期复合因子IC法进行因子加权[13] - **模型评价**:模型在因子权重分配上具有极强的灵活性,年度收益更加稳定,适合因子波动较大的市场环境[15][19] 3. 模型名称:弹性网回归法下的因子择时模型 - **模型构建思路**:结合岭回归(L2正则化)和套索回归(L1正则化)的优点,平衡变量选择与参数收缩[22] - **模型具体构建过程**: 1. 模型公式为: $$ \operatorname*{min}_{\beta_{0},\beta}(\frac{1}{2N}{\sum_{i=1}^{N}}(y_{i}-\beta_{0}-x_{i}^{T}\beta)^{2}+\lambda(\alpha{\sum_{j=1}^{p}}|\beta_{j}|+(\frac{1-\alpha}{2}){\sum_{j=1}^{p}}\beta_{j}^{2})) $$ 其中,$\alpha$为控制L1和L2正则化权重的参数[22] 2. 使用不同$\alpha$值进行测试,分析其对因子择时表现的影响[23][30] - **模型评价**:模型在因子权重分配上同样具有灵活性,但需深入了解参数设置对模型表现的影响[26][29] 4. 模型名称:衰减加权的因子择时模型 - **模型构建思路**:通过对因子历史收益进行衰减加权,赋予近期收益更高权重,以提高预测准确性[32] - **模型具体构建过程**: 1. 使用因子历史收益窗口为48个月,设定半衰期为12个月进行衰减加权[32] 2. 基于衰减加权的因子收益,构建套索回归模型进行因子择时[32] - **模型评价**:在因子收益波动较大的时间段中,模型表现出较强的因子权重分配能力,增强了基准模型的表现[34][36] 5. 模型名称:因子择时模型与风控模型结合 - **模型构建思路**:将因子择时模型与风险控制模型结合,构建指数增强组合[37] - **模型具体构建过程**: 1. 基于因子择时模型和基准模型分别构建收益预测模型[37] 2. 结合相同的风控措施,构建沪深300增强组合[37] - **模型评价**:模型增强了收益预测的灵活性,但指数增强组合的收益风险特征会因风控措施的不同而变化[40][41] 6. 模型名称:因子择时模型与风格概率模型 - **模型构建思路**:通过Logistic回归,将因子收益预测值转化为概率预测值,以协助风格轮动[42] - **模型具体构建过程**: 1. 模型公式为: $$ log{\frac{P_{t}}{1-P_{t}}}=\alpha+C_{1,t}X_{1,t}+C_{2,t}X_{2,t}+\cdots+C_{N,t}X_{N,t}+\varepsilon_{t} $$ 其中,$P_{t}$为因子收益为正的概率[42] 2. 以大小盘风格为例,使用市值因子TOP BOTTOM 10%多空收益构建Logistic回归模型[42] 3. 基于概率预测值,构建风格轮动策略[43] - **模型评价**:概率预测值更加直观,便于应用于风格轮动策略[42][43] --- 模型的回测效果 1. 回归法下的因子择时模型 - 年化收益:44.2%(2008.12.31-2017.12.29)[17] - 收益:12.3%(2016.12.30-2017.12.29)[17] 2. 套索回归法下的因子择时模型 - 年化收益:44.2%(2008.12.31-2017.12.29)[17] - 收益:12.3%(2016.12.30-2017.12.29)[17] 3. 弹性网回归法下的因子择时模型 - 年化收益:44.3%(2008.12.31-2017.12.29)[24] - 收益:11.4%(2016.12.30-2017.12.29)[24] 4. 衰减加权的因子择时模型 - 年化收益:33.9%(2010.12.31-2017.12.29)[33] - 收益:15.4%(2016.12.30-2017.12.29)[33] 5. 因子择时模型与风控模型结合 - 年化收益:16.9%(2008.12.31-2017.12.29)[40] - 收益:30.6%(2016.12.30-2017.12.29)[40]