Workflow
深度学习研究报告之四:趋势策略的深度学习增强
广发证券· 2017-10-26 00:00
量化模型与构建方式 模型名称:循环神经网络(RNN)增强的趋势策略 - **模型构建思路**:利用循环神经网络模型预测每日趋势策略的盈利能力,判断是否进行趋势交易[3][22] - **模型具体构建过程**: 1. **数据选取**:使用沪深300股指期货(IF)主力合约的1分钟价格数据,2010年4月16日至2013年12月31日的数据为样本内数据,2014年1月1日至2017年7月31日为样本外数据[66] 2. **特征数据序列**:包括开盘价、收盘价、最高价、最低价、成交量、主买量、主卖量、收盘价变化率、收盘价序列的二阶差分、主买主卖量之比、成交量变化率、主买量变化率、主卖量变化率,并对特征数据进行标准化[66] 3. **机器学习模型**:采用13(输入层)-200(LSTM层)-1(输出层)的RNN模型,激活函数为Sigmoid函数,优化目标函数为最小化交叉熵[66] 4. **交易策略**:在每天开盘后T分钟,用模型预测当日的趋势策略盈利指标R,计算过去120个交易日里T时刻概率p的均值MA120(p),若p > MA120(p),则进行趋势交易,否则不开仓交易[63] 5. **止损设置**:按照固定比例的方式止损,开仓交易后持有头寸至当日收盘前平仓,若盘中触发止损则立即平仓[63] - **模型评价**:通过RNN模型对交易信号的筛选,过滤掉趋势策略盈利期望不高的交易机会,有效提高了策略的收益率[61][85] 模型的回测效果 - **全样本表现**: - 年化收益率:18.01%[68] - 累积收益率:223.46%[68] - 最大回撤:-8.63%[68] - 交易次数:707次[68] - 胜率:40.74%[68] - 盈亏比:2.17[68] - 单次交易收益率:0.17%[68] - **样本外表现**: - 年化收益率:18.47%[71][72] - 累积收益率:80.72%[71][72] - 最大回撤:-8.63%[71][72] - 交易次数:372次[71][72] - 胜率:39.52%[71][72] - 盈亏比:2.27[71][72] - 单次交易收益率:0.17%[71][72] 量化因子与构建方式 因子名称:成份股一致性指标R - **因子的构建思路**:通过计算市场成份股的一致性强弱,预判市场指数未来的趋势强弱[14] - **因子具体构建过程**: 1. **定义**:成份股一致性指标R表示市场成份股走势是否同涨同跌[14] 2. **公式**: $$R={\frac{\lambda_{1}}{\sum_{i=1}^{300}\lambda_{i}}}\times100\%={\frac{\lambda_{1}}{\lambda_{1}+\lambda_{2}+\cdots+\lambda_{300}}}\times100\%$$ 其中,$\lambda_{1}, \lambda_{2}, \ldots, \lambda_{300}$是成份股走势的协方差矩阵的所有特征值,一致性指标R是主成分分析中,第一个主成分的方差贡献率[14] - **因子评价**:成份股一致性指标R能够有效衡量市场的趋势强弱,适合进行趋势交易的市场一致性较强,不适合进行趋势交易的市场一致性较弱[14][21] 因子的回测效果 - **成份股一致性指标R**: - 强一致性市场(R=86.4%)[16] - 弱一致性市场(R=45.2%)[19]
多因子ALPHA系列报告之(三十四):基于多期限的选股策略研究
广发证券· 2017-09-20 00:00
量化模型与构建方式 1. 模型名称:基于多期限均线的因子模型 - **模型构建思路**:通过分析不同期限的均线数据,捕捉短期反转、中期动量和长期反转等价格趋势[2][14] - **模型具体构建过程**: 1. 选取不同期限的均线数据(如3、5、10、20、30、60、90、120、180、240、270、300天)[21] 2. 计算均线因子: $$A_{j t,L}={\frac{P_{j,\,d-L+1}^{t}+\cdots+P_{j,d}^{t}}{L}}$$ 其中,$P_{j,d}$为股票$j$在第$d$天的价格,$L$为均线周期[21] 3. 标准化均线因子: $$\tilde{A}_{j t,\,L}=\frac{A_{j t,\,L}}{P_{j}^{t}}$$ 其中,$P_{j}^{t}$为股票$j$在$t$时刻的价格[22] 4. 对股票收益率与前一周的均线因子进行回归,得到回归系数: $$r_{j,t}=\beta_{0,t}+\Sigma_{i}\beta_{i,t}\tilde{A}_{j t-1,L_{i}}+\epsilon_{j,t}$$[23] 5. 计算近25周回归系数的均值,作为下周回归系数预测值: $$E\left[\beta_{i,\,t+1}\right]=\frac{1}{25}\,\sum_{m=1}^{25}\,\beta_{i,t+1-m}$$[24] 6. 用预测的回归系数与新一周的因子值计算股票的下周预期收益率: $$E\left[r_{j,t+1}\right]=\Sigma_{i}\,E\left[\beta_{i,\,t+1}\right]\tilde{A}_{j t,\,L_{i}}$$[25] 7. 根据预期收益率降序排列,选择收益率最高的一档股票作为多头组合,最低的一档股票作为空头组合[26] - **模型评价**:该模型能够有效捕捉不同期限下的动量和反转效应,对股票收益率具有较好的区分能力[3][32] 2. 模型名称:基于LLT(低延迟趋势线)的因子模型 - **模型构建思路**:针对传统均线对价格趋势敏感性差、延迟性高的缺点,引入LLT低延迟趋势线替代均线,构造改进后的因子[4][76] - **模型具体构建过程**: 1. LLT趋势线的递推公式: $$L L T=\begin{cases}&P(T),\quad T=1,2\\ &(2-2\alpha)L L T(T-1)-(1-\alpha)^{2}L L T(T-2)+\left(\alpha-\frac{\alpha^{2}}{4}\right)P(T)\\ &+\left(\frac{\alpha^{2}}{2}\right)P(T-1)-\left(\alpha-\frac{3}{4}\alpha^{2}\right)P(T-2)\;,\quad\quad e l s e\end{cases}$$ 其中,$\alpha = \frac{2}{1+L}$,$L$为平滑参数[76] 2. 用LLT趋势线替代均线,重复基于多期限均线因子模型的构建步骤[76] - **模型评价**:LLT因子模型在捕捉价格趋势方面更敏感,能够更好地刻画动量和反转效应,且在收益率、信息比率等指标上优于传统均线因子模型[4][82][112] --- 模型的回测效果 1. 基于多期限均线的因子模型 - **全市场多空对冲**:年化收益率25.58%,年化波动率14.12%,最大回撤13.31%,信息比率1.81[48][52] - **中证500指数对冲**:年化收益率25.40%,年化波动率10.42%,最大回撤9.11%,信息比率2.44[3][59][62] - **中证500行业中性策略**:年化收益率26.01%,年化波动率12.66%,最大回撤10.37%,信息比率2.51[64][66] 2. 基于LLT的因子模型 - **全市场多空对冲**:年化收益率35.83%,年化波动率14.11%,最大回撤15.64%,信息比率2.54[85][87] - **中证500指数对冲**:年化收益率29.58%,年化波动率10.46%,最大回撤11.57%,信息比率2.83[4][103][106] - **中证500行业中性策略**:年化收益率29.42%,年化波动率10.60%,最大回撤12.78%,信息比率2.78[107][110][112] --- 量化因子与构建方式 1. 因子名称:多期限均线因子 - **因子构建思路**:通过不同期限的均线数据,捕捉短期反转、中期动量和长期反转效应[2][14] - **因子具体构建过程**: 1. 计算均线因子: $$A_{j t,L}={\frac{P_{j,\,d-L+1}^{t}+\cdots+P_{j,d}^{t}}{L}}$$[21] 2. 标准化均线因子: $$\tilde{A}_{j t,\,L}=\frac{A_{j t,\,L}}{P_{j}^{t}}$$[22] 3. 回归分析与收益率预测,详见模型构建过程[23][24][25] - **因子评价**:因子对股票收益率的区分能力较强,IC值以正为主,且在不同指数成分股中表现稳定[3][32][35] 2. 因子名称:LLT因子 - **因子构建思路**:用LLT低延迟趋势线替代传统均线,提升对价格趋势的敏感性[4][76] - **因子具体构建过程**: 1. LLT趋势线的递推公式: $$L L T=\begin{cases}&P(T),\quad T=1,2\\ &(2-2\alpha)L L T(T-1)-(1-\alpha)^{2}L L T(T-2)+\left(\alpha-\frac{\alpha^{2}}{4}\right)P(T)\\ &+\left(\frac{\alpha^{2}}{2}\right)P(T-1)-\left(\alpha-\frac{3}{4}\alpha^{2}\right)P(T-2)\;,\quad\quad e l s e\end{cases}$$[76] 2. 用LLT替代均线,重复多期限均线因子的构建步骤[76] - **因子评价**:LLT因子在收益率、信息比率等指标上优于传统均线因子,且对股票收益率的区分能力更强[82][84][112] --- 因子的回测效果 1. 多期限均线因子 - **IC均值**:全市场0.026,中证500指数0.037,中证800指数0.030[31][32] - **正IC占比**:全市场61.46%,中证500指数61.98%,中证800指数60.68%[31][32] 2. LLT因子 - **IC均值**:全市场0.036,高于多期限均线因子[83] - **正IC占比**:全市场66.93%,高于多期限均线因子[83]
深度学习研究报告之三:深度学习新进展:ALPHA因子再挖掘
广发证券· 2017-07-11 00:00
量化模型与构建方式 - **模型名称**:深度学习预测模型 **模型构建思路**:通过深度学习技术对股票未来走势进行预测打分,筛选强势股票构建组合[3][53][55] **模型具体构建过程**: 1. **输入层**:包含128个选股因子(估值因子、规模因子、反转因子、流动性因子、波动性因子、技术指标)和28个申万一级行业类别因子,共计156个节点[74] 2. **隐含层**:采用网格搜索优化结构,最终确定5个隐含层,节点数分别为512、200、200、200、128[74] 3. **输出层**:采用softmax激活函数,输出3维向量表示股票标签(上涨、平盘、下跌)[74] 4. **训练过程**:通过样本筛选,标记股票标签,使用2007年至2010年的数据训练模型,随机划分37万个样本作为训练集,5万多个样本作为验证集[75][69][70] 5. **优化方法**:采用梯度下降法进行参数优化,使用迷你批量梯度下降提高效率[34][32] **模型评价**:模型能够有效预测强势股票,分类准确率显著优于随机预测,验证集预测准确率为62.32%[77][78] 量化因子与构建方式 - **因子名称**:深度学习选股因子 **因子的构建思路**:通过深度学习模型对股票进行预测打分,选取上涨打分最高的股票构建组合[55][73] **因子具体构建过程**: 1. **因子提取**:从市场数据中提取估值因子、规模因子、反转因子、流动性因子、波动性因子、技术指标和行业属性,共计156个特征[60][74] 2. **因子标准化**:包括异常值处理、极值压边界处理、时间方向标准化、截面方向标准化(如z-score、min-max、排序标准化)[61][62][63][64][65][66] 3. **因子调整**:根据深度学习模型的假设调整因子分布,确保输入数据适配模型[67] **因子评价**:选股因子与传统风格因子(规模、反转、流动性、估值)的相关性较低,具有独立性,可作为新的选股因子[3][93][95] 模型的回测效果 - **深度学习预测模型** - 样本内预测准确率:67.84%[77] - 样本外预测准确率:62.32%[77] - 样本外选股因子IC均值:0.092,标准差:0.065[80][83] - 样本外对冲策略年化收益率:20.3%,最大回撤:-4.77%,月度胜率:88.0%[3][85][90] - 换手率:每次调仓平均换手率78.9%,年化换手率9.47倍[90] - 不同交易成本下年化收益率:0.3%成本时为20.28%,0.6%成本时为16.93%[93] - 模型更新后年化收益率提升至25.71%,最大回撤降低至-3.34%[99] 因子的回测效果 - **深度学习选股因子** - 分档表现:选股因子值大的股票整体表现优于因子值小的股票,分档单调性好[82][83] - 分档累积收益率:因子值最高档(D1)累积收益率显著高于最低档(D10)[87][88] - 与风格因子相关性:与流通市值因子平均秩相关系数为-0.060,与20日换手率因子为-0.119,与20日股价反转因子为-0.073,与盈市率因子为0.017[93][95]
多因子ALPHA系列报告之三十:个股配对思想在因子策略中的应用
广发证券· 2017-03-30 00:00
量化模型与构建方式 1. 模型名称:配对反转因子 - **模型构建思路**:配对反转因子捕捉行业内个股之间的反转机会,其核心思想与配对交易一致,但将配对交易的止盈止损条件改为定期平仓[22][47] - **模型具体构建过程**: 1. **协整回归**:对资产A和资产B的对数价格序列进行协整检验,假设两者满足协整关系,协整系数为$\gamma$,价差公式为: $$ ln(P_{t}^{A})-\gamma ln(P_{t}^{B})=\mu+Spread_{t} $$ 剔除均值后的价差序列为: $$ Spread_{t}/\sigma_{t}=(log(P_{t}^{A})-\gamma log(P_{t}^{B})-\mu)/\sigma_{t} $$ 其中$\sigma_{t}$为学习期的标准差[43][46] 2. **开仓规则**:当价差序列超出开仓阈值时,进行多空配对交易,具体规则为: - 情形一:当$Spread_{t}/\sigma_{t} > T1$,做空资产A,做多资产B - 情形二:当$Spread_{t}/\sigma_{t} < -T1$,做多资产A,做空资产B[49] 3. **平仓规则**:不设置止盈止损条件,统一在每月最后一个交易日平仓[51] - **模型评价**:配对反转因子能够在个股层面捕捉股价反转和价差的均值回复特性,具有较强的超额收益能力[69] 2. 模型名称:基于个股配对思想的指数增强方法 - **模型构建思路**:通过调整中证800成分股的权重实现指数增强,避免传统配对交易中融券的高成本问题[71] - **模型具体构建过程**: 1. **权重调整**:根据个股配对思想,调整中证800成分股的权重 2. **调仓频率**:每月末按照配对系数对个股权重进行调整 3. **参数设置**:资产相关性阈值C=0.7,学习期长度和开仓阈值取最优参数[75][78] - **模型评价**:该方法在测试期内实现了显著的超额收益,且换手率较为平稳[79] 3. 模型名称:基于个股配对思想的多因子组合配对调仓 - **模型构建思路**:将个股配对思想应用于多因子组合的周度调仓,通过加入或剔除股票优化组合收益[87] - **模型具体构建过程**: 1. **基准多因子组合**:选取12个因子(如1个月成交金额、换手率、一个月股价反转等),按等权加权构建基准组合[83] 2. **配对调仓**:基于个股配对思想,按周度频率调整组合,加入或剔除股票[87] 3. **参数优化**:通过分行业或全行业统一参数优化,选择学习期长度和开仓阈值的最优组合[90][97] - **模型评价**:配对调仓策略在大多数年份均显著提升了收益水平,且对参数变化不敏感[101] --- 模型的回测效果 配对反转因子 - 年化收益:1246.06%(全样本)[63] - 最大回撤:5.48%(全样本)[63] - 胜率:58.27%(全样本)[63] 基于个股配对思想的指数增强方法 - 超额收益:216.24%(全样本)[78] - 最大回撤:17.38%(全样本)[78] - 胜率:57.09%(全样本)[78] - 信息比率:0.97(全样本)[79] 基于个股配对思想的多因子组合配对调仓 - 年化超额收益:501.59%(全样本)[102] - 月胜率:77.78%(全样本)[102] - 换手率:约30%(月度平均)[105]
多因子ALPHA系列报告之(二十八):基于因子及事件的智能替换策略
广发证券· 2016-07-25 00:00
- 多因子策略结合事件驱动策略,通过智能替换策略控制风险并加强收益[2][3][4] - 多因子策略通过综合打分优选个股,避免单一风格依赖,利用股指期货对冲市场风险,获取alpha绝对收益[18] - 事件驱动策略通过捕捉上市公司特定事件进行短期投资获利,常见事件包括业绩预增、业绩快报、高管增持、股权激励和定增破发[21] - 智能替换策略的基本步骤包括期初按照多因子策略构建组合,监测事件驱动机会进行个股替换,并在组合持有期内反复进行替换[25][27][29] - 业绩快报事件替换策略在每个月第5个交易日开始替换,剔除与事件个股"一个月股价反转"因子最为接近的个股[56][57] - 高管增持事件替换策略在每个月第1个交易日开始替换,剔除与事件个股"一个月股价反转"因子最为接近的个股[61][62] - 股权激励事件替换策略在每个月第1个交易日开始替换,剔除与事件个股"CFP"估值因子最为接近的个股[65][66] - 业绩预增事件替换策略在每个月第10个交易日开始替换,在行业内进行剔除[69][70] - 定增破发事件替换策略在每个月第1个交易日开始替换,在行业内进行剔除[73][74] - 多事件替换策略结合各单事件的最优替换规则,监测多事件同时进行替换,最高调仓比例限制放宽至40%[77][80] 模型的回测效果 - 业绩快报事件替换策略:累计净值521.60%,年化收益率26.60%,胜率76.30%,最大回撤5.77%,信息比2.39[59][60] - 高管增持事件替换策略:累计净值535.70%,年化收益率27.00%,胜率77.40%,最大回撤5.75%,信息比2.40[63][64] - 股权激励事件替换策略:累计净值464.30%,年化收益率25.00%,胜率75.30%,最大回撤5.77%,信息比2.31[67][68] - 业绩预增事件替换策略:累计净值462.40%,年化收益率25.00%,胜率74.20%,最大回撤5.86%,信息比2.27[71][72] - 定增破发事件替换策略:累计净值467.60%,年化收益率25.10%,胜率75.30%,最大回撤6.05%,信息比2.28[75][76] - 多事件替换策略:累计净值577.70%,年化收益率28.00%,胜率75.30%,最大回撤9.13%,信息比2.51[81][82]
SVM 算法选股以及 Adaboost 增强
国信证券· 2016-05-31 00:00
量化模型与构建方式 支持向量机(SVM)模型 1. **模型名称**:支持向量机(SVM)模型 2. **模型构建思路**:SVM通过将非线性问题转化为高维空间的线性问题,利用核函数替代高维空间中的内积运算,从而解决复杂计算问题,并有效克服维数灾难和局部极小问题[1][9] 3. **模型具体构建过程**: - **线性分类问题**:SVM算法通过寻找最优超平面,将训练样本分成两类。优化问题为: $$ \operatorname*{max}\sum_{j=1}^{l}\alpha_{j}-\frac{1}{2}\sum_{i=1}^{l}\sum_{j=1}^{l}y_{i}y_{j}\alpha_{i}\alpha_{j}(x_{i}\cdot x_{j}) $$ $$ \begin{array}{c c c}{{s u b j e c t\;t o}}&{{\sum_{i=1}^{l}y_{i}\alpha_{i}=0}}&{{}}&{{c\geq\alpha_{i}\geq0}}&{{}}&{{i=1,...,l}}\end{array} $$ 其中,$x_i$是输入,$y_i$是$x_i$对应的输出值,$l$是样本个数,$\alpha_i$是拉格朗日系数,$c$是正则化参数[15] - **非线性分类问题**:通过核函数将数据映射到高维空间,使数据线性可分。优化问题为: $$ \frac{1}{2}\sum_{i=1}^{l}y_{i}y_{j}\alpha_{i}\alpha_{j}Ker(x_{i},x_{j}) $$ $$ \begin{array}{r l r l}{s u b j e c t\ to}&{{}\sum_{i=1}^{l}y_{i}\alpha_{i}=0}&{}&{{}c\geq\alpha_{i}\geq0}&{}&{{}i=1,...,l}\end{array} $$ 其中,$Ker(x_i, x_j)$是核函数[17] 4. **模型评价**:SVM模型具有很好的泛化能力,能够有效处理非线性问题,克服维数灾难和局部极小问题[1][9] Adaboost-SVM 组合算法 1. **模型名称**:Adaboost-SVM 组合算法 2. **模型构建思路**:利用Adaboost算法对每个月的数据的SVM分类算法进行增强,提高分类效果[3][28] 3. **模型具体构建过程**: - 提取12个月股票数据,设置初始权重$D1(i)=1/N$,N为样本个数 - 在样本t上训练SVM分类器$h_t$,并用$h_t$对全部样本进行分类 - 分类误差$\varepsilon_t$计算公式: $$ \alpha_{i}=\frac{1}{2}\ln\frac{1-\varepsilon_{i}}{\varepsilon_{i}} $$ - 更新全部样本的权值: $$ D_{t+1}(i)=\frac{D_{t}(i)}{Z_{t}}\times\{\begin{array}{l l}{{e^{-\alpha_{i}}}}&{{\quad\mathrm{if}\quad h_{t}(x_{i})=y_{i}}}\\ {{e^{\alpha_{t}}}}&{{\quad\mathrm{otherwise}}}\end{array} $$ - 最终的Adaboost-SVM分类算法表示为: $$ H(x)=\sum_{t=1}^{12}\alpha_{t}h_{t}(x) $$ 利用新一期样本数据代入$H(x)$,得到每一只股票的信任得分,并分为十档,选择收尾两档进行观察[34] 4. **模型评价**:Adaboost-SVM组合算法相比单月SVM效果显著增强,但整体效果不如传统SVM模型[3][36][39] 模型的回测效果 1. **SVM模型**: - **净值**:SVM算法的净值最高,波动程度小于传统回归方法[25] - **多空策略净值**:SVM算法的多空策略净值显著高于传统回归方法和Adaboost算法[26] 2. **Adaboost-SVM模型**: - **净值**:Adaboost-SVM算法相比单月SVM效果显著增强,但整体效果不如传统SVM模型[36][39] - **多空策略净值**:Adaboost-SVM算法的多空策略净值显著高于传统回归方法和Adaboost算法[38][42] 量化因子与构建方式 1. **因子名称**:盈利收益率(Earnings Yield)、盈利波动率(Earnings Variability)、成长(Growth)、杠杆(Leverage)、流动性(Liquidity)、动量(Momentum)、规模(Size)、价值(Value)、波动(Volatility)、股利收益率(Dividend Yield)、财务质量(Financial Quality) 2. **因子的构建思路**:根据指标构造的经济含义,以及参考BARRA模型的因子分类,将68个指标划分为11个因子[19] 3. **因子具体构建过程**:计算每个股票按某因子的排序然后除以总股票数,这样因子的值归到(0,1]。对下一期收益率从大到小排序,取前30%作为强势股,后30%作为弱势股,强势股划分类标为+1,弱势股划分类标为-1;中间40%的股票排出训练集[19][20] 因子的回测效果 1. **盈利收益率因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 2. **盈利波动率因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 3. **成长因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 4. **杠杆因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 5. **流动性因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 6. **动量因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 7. **规模因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 8. **价值因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 9. **波动因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 10. **股利收益率因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 11. **财务质量因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22]
多因子ALPHA系列报告之(二十六):牛股归因下的风格动量策略
广发证券· 2016-01-27 00:00
量化模型与构建方式 单风格因子策略 - **模型名称**:单风格因子策略 - **模型构建思路**:通过单一风格因子判断行业是否形成稳定风格,并超配具有上涨空间的个股[27][28][30] - **模型具体构建过程**: 1. 对行业内所有个股的风格因子值进行排序,风格因子值最小的20%个股集合记为A1,风格因子值最大的20%个股集合记为A2,收益率最大的20%个股集合记为B[27][28] 2. 开仓条件: - **反向开仓**:若风格因子与收益率相关系数显著为负,且A1与B的重叠比例远大于A2与B的重叠比例,同时A1中的个股超额收益率为正,则筛选A1中未涨停或停牌的个股进行超配[27][28] - **正向开仓**:若风格因子与收益率相关系数显著为正,且A2与B的重叠比例远大于A1与B的重叠比例,同时A2中的个股超额收益率为正,则筛选A2中未涨停或停牌的个股进行超配[29][30] 3. 平仓条件:持仓满5天、累计超额收益率超过15%或累计超额下跌超过5%[30] 4. 资金分配:行业内等权分配个股,行业间等权分配行业[31] - **模型评价**:能够有效判断投资者非理性行为并抓住超额收益机会,资金利用率高,换手率适中[36][37][38] 多风格因子策略(不同行业相同因子) - **模型名称**:多风格因子策略(不同行业相同因子) - **模型构建思路**:从单风格因子中选取综合表现较好的因子,在所有行业中使用相同因子进行策略构建[43][44] - **模型具体构建过程**: 1. 选取因子:规模因子(流通市值)、估值因子(PB)、质量因子(长期资本负债率)、盈利因子(ROE)[43] 2. 开仓条件:与单风格因子策略相同,但需对多个因子同时进行判断,若多个因子满足开仓条件,则根据公式计算得分,选择得分最高的因子进行超配 - **公式**: $ 风格因子得分 = C1 - C2 $(负向或不定) $ 风格因子得分 = C2 - C1 $(正向或不定)[45][46] 3. 平仓条件:持仓满5天、累计超额收益率超过15%或累计超额下跌超过5%[46] 4. 资金分配:行业内等权分配个股,行业间等权分配行业[47] - **模型评价**:表现稳定,资金利用率高,回撤较小,适用于多数行业[49][51][55] 多风格因子策略(分行业选因子) - **模型名称**:多风格因子策略(分行业选因子) - **模型构建思路**:根据各行业最佳因子选择不同因子进行策略构建,解决部分行业负收益问题[70][71] - **模型具体构建过程**: 1. 选取因子:根据各行业最佳因子选择不同因子,具体因子见表3[70][71] 2. 开仓条件、平仓条件、资金分配:与多风格因子策略(不同行业相同因子)相同[72][73] - **模型评价**:表现优于不同行业相同因子策略,收益率更高,回撤更小[75][77][79] --- 模型的回测效果 单风格因子策略 - **平均年化超额收益率**:流通市值19.04%,PB19.40%,ROE21.26%,长期资本负债率23.58%等[34][36] - **胜率**:流通市值53.24%,PB50.90%,ROE52.55%,长期资本负债率53.59%等[34][36] - **最大回撤**:流通市值19.18%,PB13.96%,ROE20.78%,长期资本负债率19.87%等[34][36] - **信息比率**:流通市值1.30,PB1.11,ROE1.15,长期资本负债率1.30等[34][36] 多风格因子策略(不同行业相同因子) - **累计超额净值**:269.31%[48] - **平均年化收益率**:17.58%[48] - **胜率**:54.62%[48] - **最大回撤**:11.01%[48] - **信息比率**:1.4083[48] 多风格因子策略(分行业选因子) - **累计超额净值**:462.54%[76] - **平均年化收益率**:28.56%[76] - **胜率**:56.18%[76] - **最大回撤**:11.41%[76] - **信息比率**:1.97[76] --- 因子的回测效果 单风格因子策略 - **流通市值**:年化收益率19.04%,胜率53.24%,最大回撤19.18%,信息比率1.30[34][36] - **PB**:年化收益率19.40%,胜率50.90%,最大回撤13.96%,信息比率1.11[34][36] - **ROE**:年化收益率21.26%,胜率52.55%,最大回撤20.78%,信息比率1.15[34][36] - **长期资本负债率**:年化收益率23.58%,胜率53.59%,最大回撤19.87%,信息比率1.30[34][36] 多风格因子策略(不同行业相同因子) - **流通市值**:显著次数995[62] - **PB**:显著次数317[62] - **ROE**:显著次数594[62] - **长期资本负债率**:显著次数844[62] 多风格因子策略(分行业选因子) - **纺织服装行业**:累计超额收益率677.18%,胜率49.51%,最大回撤29.32%[79][80] - **医药生物行业**:累计超额收益率566.12%,胜率50.52%,最大回撤15.56%[79][80] - **轻工制造行业**:累计超额收益率415.62%,胜率49.42%,最大回撤38.54%[79][80] - **建筑材料行业**:累计超额收益率455.04%,胜率49.39%,最大回撤20.83%[79][80]
20150715-财信证券-量化择时研究:财富投资者情绪指数(FISI)择时模型构建
财信证券· 2015-07-15 00:00
量化模型与构建方式 1. 模型名称:财富投资者情绪指数择时模型(Fortune Investor Sentiment Index, FISI) - **模型构建思路**:借鉴EMSI方法,通过计算沪深300指数成分股的日收益率与其Beta系数的Spearman秩相关系数,结合沪深300指数的涨跌幅,定义投资者情绪并构建择时模型[6][18][19] - **模型具体构建过程**: 1. 计算沪深300指数成分股的日收益率与其Beta系数的Spearman秩相关系数,公式如下: $$ \rho = \frac{\sum\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)}{\left[\sum\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)^{2}\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)^{2}\right]^{1/2}} $$ 其中,$\mathrm{R}_{{}_{iF}}$为个股的日收益率排序,$\overline{\mathrm{R}}_{{}_{r}}$为所有股票日收益率排序的平均值[16][17] 2. 定义6种初始信号,结合Spearman秩相关系数的显著性和沪深300指数的涨跌幅,具体如下: - 显著为正且指数上涨:强有效看多Beta - 显著为正且指数下跌:弱有效看空Beta - 不显著且指数上涨:强有效中性 - 不显著且指数下跌:弱有效中性 - 显著为负且指数上涨:弱有效看多Beta - 显著为负且指数下跌:强有效看空Beta[19][20] 3. 构建财富投资者情绪指数(FISI),公式如下: $$ F_{{}_{n}}=\frac{\mathit{SUM}(O_{{}_{n+n-9}}+P_{{}_{n+n-9}})-\mathit{SUM}(V_{{}_{n+n-9}}+T_{{}_{n-n-9}})}{\mathit{SUM}(O_{{}_{n+n-9}}+P_{{}_{n-n-9}})+\mathit{SUM}(V_{{}_{n+n-9}}+T_{{}_{n-n-9}})+1},\ \ n\geq10 $$ 其中,$O$为强有效看多Beta的个数,$P$为弱有效看多Beta的个数,$V$为强有效看空Beta的个数,$T$为弱有效看空Beta的个数[21] 4. 对FISI进行均值回归检验,采用ADF检验法,结果表明FISI为平稳时间序列,服从均值回归[24][25] 5. 根据FISI的变化趋势,当指标由负转正穿越0值时看多沪深300,当指标由正转负穿越0值时看空沪深300[27] - **模型评价**:模型能够有效反映市场投资者情绪,择时效果良好,但在趋势市中信号较少,震荡市中信号较频繁,整体表现出较高的实用性[30][46] 2. 策略名称:多策略与多空策略 - **策略构建思路**:基于FISI择时模型发出的看多或看空信号,分别构建多策略和多空策略[37] - **策略具体构建过程**: 1. **多策略**:当FISI择时模型发出看多信号时买入沪深300指数,当发出看空信号时卖出持仓[37] 2. **多空策略**:当FISI择时模型发出看多信号时买入沪深300指数,当发出看空信号时卖空沪深300指数,即进行双向交易[37] - **策略评价**:多空策略的累计收益率显著高于多策略,但最大回撤也更大;多策略在回撤控制方面表现更优[42] --- 模型的回测效果 财富投资者情绪指数择时模型 - **择时信号统计**: - 样本区间:2005年4月8日至2015年6月19日 - 共发出109次多空信号,其中正确信号55次,错误信号54次 - 单次最大亏损:9% - 单次最大盈利:92.31% - 平均每次亏损:1.18% - 平均每次盈利:5.67% - 单次平均期望回报:2.28% - 策略正确率:50.46%[27][30] --- 策略的回测效果 多策略 - **累计收益率**:12.22倍(1221.56%) - **最大回撤**:27.45%[42][45] 多空策略 - **累计收益率**:23.82倍(2381.66%) - **最大回撤**:37.64%[42][45]
多因子ALPHA系列报告之(二十四):财报因子使用方法新探
广发证券· 2015-07-06 00:00
量化模型与构建方式 模型名称:新多因子ALPHA模型 - **模型构建思路**:结合事件驱动的时效性和因子打分的资金规划可控性,形成具有行业中性、分段操作和资金规划特点的新多因子ALPHA模型[3][42] - **模型具体构建过程**: - **行业中性**:以报告期结束后的第一个交易日全市场A股(剔除ST和创业板)为股票池,根据申万一级行业分类进行划分,分行业选股;行业内排序打分,超低配前后5%的个股,持有一个月[42] - **分段操作**:每日监测各行业最新财报披露比例,各行业披露比例达到一定阈值即可分别操作;阈值每次增加10%,披露占比达到下一阈值再次操作;最晚披露日期默认再次操作,提前披露完毕的除外[42][44] - **资金规划**:以报告期结束后的第一个交易日中证800成分股权重中各行业占比作为当次财报数据使用中各行业分配的资金比例;闲置资金进行无风险投资,获得年4%的无风险利率[42] - **模型评价**:增强了因子的有效性,同时保持买入组合的稳定性,使资金规划更加可控[42] 模型名称:财报因子与非财报因子融合策略 - **模型构建思路**:结合财报因子和非财报因子,全年持仓,既使用新数据也使用旧数据,提升资金使用效率[96][82] - **模型具体构建过程**: - **因子选择**: - 财报因子:销售毛利率、ROE同比增长率、总资产对数、速动比率、流动负债率、销售费用比例[74] - 非财报因子:一个月成交金额、最近三个月平均成交量、市盈率、三个月股价反转、流通市值对数、一个月股价反转[96] - **操作步骤**:在财报披露月提前操作,分行业分阶段进行选股;非披露月按照原始策略进行选股;新披露财报的个股因子数据与非财报因子一起参与多因子排序打分[96][83] - **模型评价**:能够很好地与现有策略融合,带来更多收益回报,同时胜率更高、最大回撤更小[117][96] --- 模型的回测效果 新多因子ALPHA模型 - **多对800**:信息比1.49,超额收益21.93%,胜率58.50%,最大回撤5.34%[74] - **多对500**:信息比0.80,超额收益8.84%,胜率54.08%,最大回撤6.08%[78] - **多对300**:信息比1.39,超额收益26.64%,胜率58.84%,最大回撤7.08%[79] 财报因子与非财报因子融合策略 - **多对800**:信息比2.01,超额收益127.33%,胜率61.28%,最大回撤20.40%[109] - **多对500**:信息比1.78,超额收益72.34%,胜率55.74%,最大回撤6.34%[114] - **多对300**:信息比1.75,超额收益147.43%,胜率61.36%,最大回撤26.29%[117] --- 量化因子与构建方式 因子名称:销售毛利率 - **因子构建思路**:通过财报数据计算,反映企业盈利能力[21][74] - **因子具体构建过程**:直接从财报中提取销售毛利率数据,进行排序打分[21][74] - **因子评价**:在披露月表现优于非披露月,提前操作效果更佳[36][45] 因子名称:ROE同比增长率 - **因子构建思路**:通过财报数据计算,反映企业盈利能力的同比变化[21][74] - **因子具体构建过程**:从财报中提取ROE数据,计算同比增长率,进行排序打分[21][74] - **因子评价**:提前操作改善了因子效果,由无效变为有效[45][62] 因子名称:总资产对数 - **因子构建思路**:通过财报数据计算,反映企业规模[21][74] - **因子具体构建过程**:从财报中提取总资产数据,取对数后进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] 因子名称:速动比率 - **因子构建思路**:通过财报数据计算,反映企业短期偿债能力[21][74] - **因子具体构建过程**:从财报中提取速动比率数据,进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] 因子名称:流动负债率 - **因子构建思路**:通过财报数据计算,反映企业负债结构[21][74] - **因子具体构建过程**:从财报中提取流动负债率数据,进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] 因子名称:销售费用比例 - **因子构建思路**:通过财报数据计算,反映企业销售费用占比[21][74] - **因子具体构建过程**:从财报中提取销售费用比例数据,进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] --- 因子的回测效果 不考虑快报情况下 - **销售毛利率**:信息比1.64,提前操作效果优于截止日操作[63] - **ROE同比增长率**:信息比-1.77,提前操作改善了因子效果[63] - **总资产对数**:信息比2.69,提前操作显著提高因子有效性[63] - **速动比率**:信息比1.31,提前操作显著提高因子有效性[63] - **流动负债率**:信息比2.59,提前操作显著提高因子有效性[63] - **销售费用比例**:信息比2.22,提前操作显著提高因子有效性[63] 考虑快报情况下 - **销售毛利率**:信息比1.64,快报数据进一步提高因子有效性[64] - **ROE同比增长率**:信息比-1.77,快报数据进一步提高因子有效性[64] - **总资产对数**:信息比2.91,快报数据进一步提高因子有效性[64] - **速动比率**:信息比1.25,快报数据进一步提高因子有效性[64] - **流动负债率**:信息比2.96,快报数据进一步提高因子有效性[64] - **销售费用比例**:信息比1.85,快报数据进一步提高因子有效性[64]
多因子ALPHA系列报告之(十九):笑看北雁南飞南雁北归
广发证券· 2013-09-02 00:00
量化模型与构建方式 1. 模型名称:多因子动态调整策略 - **模型构建思路**:通过对多因子组合进行特征归因,动态剔除失效因子并逐步优化因子组合,以提升多因子策略的有效性[3][4][40] - **模型具体构建过程**: 1. **因子挑选**:根据过去一年的因子IC表现,挑选IC大于1%且有效性最高的因子,或当IC大于5%时直接入选[3][25] 2. **特征归因**:对多因子组合进行归因,分析组合中各因子的有效性。假设组合在因子i上的平均暴露为Fi,全部个股在因子i上的暴露中Fi位于第N档(假设分档数量为M),则组合归因后因子i的实际分档为N/M[26][31] 3. **因子有效分档计算**:将股票根据因子排序分为N档,计算过去一年第i个分界线之前所有股票组合的超额收益信息比IR(i)。有效分档定义为: $F_{i} = \text{argmax}_{IR(i) > 0.8 \, \text{or} \, IR(i) > 0.5 \cdot IR(1)}$ 其中,IR(1)为第一档的因子信息比,0.8和0.5为经验值[27][30] 4. **动态调整策略**: - 计算因子有效得分:$S_i = G_i / F_i$,其中$G_i$为归因后实际分档,$F_i$为因子有效分档 - 若$S_i \geq 1$,因子有效;否则为失效因子 - 剔除失效因子后,逐个将剔除的因子重新纳入组合,若因子纳入后提升组合平均因子有效得分,则保留该因子[43][44] 5. **优化目标函数**: $$\operatorname*{max}\{h^{\prime}X_{\alpha}-{\frac{1}{2}}\lambda h^{\prime}V h\}$$ $$s.t.\quad h^{\prime}X_{\sigma}=0$$ 其中,$h$为组合权重,$X_{\alpha}$为因子收益,$V$为因子协方差矩阵,$\lambda$为风险厌恶系数[37][38] - **模型评价**:动态调整策略能够有效改善多因子对冲策略的表现,避免因子误删或因子数量过少的问题[4][42] --- 模型的回测效果 1. 初始因子策略 - 信息比(多-指数):1.47[58] - 信息比(多空):1.59[58] - 年化收益率:10%(多-指数),23%(多空)[58] - 累计最大回撤:5.3%(多-指数),11.4%(多空)[58] - 月度胜率:65.6%(多-指数),71.9%(多空)[58] 2. 简单优化策略 - 信息比(多-指数):1.49[58] - 信息比(多空):1.49[58] - 年化收益率:10%(多-指数),23%(多空)[58] - 累计最大回撤:5.8%(多-指数),13.4%(多空)[58] - 月度胜率:67.2%(多-指数),73.4%(多空)[58] 3. 逐步优化策略 - 信息比(多-指数):1.65[58] - 信息比(多空):1.63[58] - 年化收益率:11%(多-指数),24%(多空)[58] - 累计最大回撤:5.3%(多-指数),11.8%(多空)[58] - 月度胜率:71.9%(多-指数),76.6%(多空)[58] --- 量化因子与构建方式 1. 因子名称:IC动量因子 - **因子的构建思路**:根据因子过去一年的IC表现,挑选IC大于1%且有效性最高的因子,或当IC大于5%时直接入选[3][25] - **因子具体构建过程**: 1. 计算因子IC:$IC = \text{corr}(F_i, R_i)$,其中$F_i$为因子暴露,$R_i$为个股下期收益[14][22] 2. 按照IC值排序,选择IC值最高的因子作为初始因子[3][25] - **因子评价**:IC动量因子能够有效刻画因子的线性单调性,适用于多因子策略的初始因子筛选[14][25] 2. 因子名称:因子有效分档 - **因子的构建思路**:通过分档计算因子在不同分组中的超额收益信息比,确定因子的有效分档范围[27][30] - **因子具体构建过程**: 1. 将股票根据因子暴露排序分为N档 2. 计算每档的超额收益信息比:$IR(i) = \text{信息比}(i)$ 3. 确定有效分档:$F_{i} = \text{argmax}_{IR(i) > 0.8 \, \text{or} \, IR(i) > 0.5 \cdot IR(1)}$[27][30] - **因子评价**:因子有效分档能够有效识别因子的单调性和有效性,为因子筛选提供了重要依据[27][30] --- 因子的回测效果 1. IC动量因子 - 信息比:IC值大于1%的因子被选为有效因子[25] - 超额收益:IC值显著的因子能够带来显著的超额收益[14][25] 2. 因子有效分档 - 信息比:有效分档的因子信息比大于0.8[27][30] - 超额收益:有效分档的因子能够显著提升组合的超额收益[27][30]