Workflow
多因子ALPHA系列报告之三十:个股配对思想在因子策略中的应用
广发证券· 2017-03-30 00:00
量化模型与构建方式 1. 模型名称:配对反转因子 - **模型构建思路**:配对反转因子捕捉行业内个股之间的反转机会,其核心思想与配对交易一致,但将配对交易的止盈止损条件改为定期平仓[22][47] - **模型具体构建过程**: 1. **协整回归**:对资产A和资产B的对数价格序列进行协整检验,假设两者满足协整关系,协整系数为$\gamma$,价差公式为: $$ ln(P_{t}^{A})-\gamma ln(P_{t}^{B})=\mu+Spread_{t} $$ 剔除均值后的价差序列为: $$ Spread_{t}/\sigma_{t}=(log(P_{t}^{A})-\gamma log(P_{t}^{B})-\mu)/\sigma_{t} $$ 其中$\sigma_{t}$为学习期的标准差[43][46] 2. **开仓规则**:当价差序列超出开仓阈值时,进行多空配对交易,具体规则为: - 情形一:当$Spread_{t}/\sigma_{t} > T1$,做空资产A,做多资产B - 情形二:当$Spread_{t}/\sigma_{t} < -T1$,做多资产A,做空资产B[49] 3. **平仓规则**:不设置止盈止损条件,统一在每月最后一个交易日平仓[51] - **模型评价**:配对反转因子能够在个股层面捕捉股价反转和价差的均值回复特性,具有较强的超额收益能力[69] 2. 模型名称:基于个股配对思想的指数增强方法 - **模型构建思路**:通过调整中证800成分股的权重实现指数增强,避免传统配对交易中融券的高成本问题[71] - **模型具体构建过程**: 1. **权重调整**:根据个股配对思想,调整中证800成分股的权重 2. **调仓频率**:每月末按照配对系数对个股权重进行调整 3. **参数设置**:资产相关性阈值C=0.7,学习期长度和开仓阈值取最优参数[75][78] - **模型评价**:该方法在测试期内实现了显著的超额收益,且换手率较为平稳[79] 3. 模型名称:基于个股配对思想的多因子组合配对调仓 - **模型构建思路**:将个股配对思想应用于多因子组合的周度调仓,通过加入或剔除股票优化组合收益[87] - **模型具体构建过程**: 1. **基准多因子组合**:选取12个因子(如1个月成交金额、换手率、一个月股价反转等),按等权加权构建基准组合[83] 2. **配对调仓**:基于个股配对思想,按周度频率调整组合,加入或剔除股票[87] 3. **参数优化**:通过分行业或全行业统一参数优化,选择学习期长度和开仓阈值的最优组合[90][97] - **模型评价**:配对调仓策略在大多数年份均显著提升了收益水平,且对参数变化不敏感[101] --- 模型的回测效果 配对反转因子 - 年化收益:1246.06%(全样本)[63] - 最大回撤:5.48%(全样本)[63] - 胜率:58.27%(全样本)[63] 基于个股配对思想的指数增强方法 - 超额收益:216.24%(全样本)[78] - 最大回撤:17.38%(全样本)[78] - 胜率:57.09%(全样本)[78] - 信息比率:0.97(全样本)[79] 基于个股配对思想的多因子组合配对调仓 - 年化超额收益:501.59%(全样本)[102] - 月胜率:77.78%(全样本)[102] - 换手率:约30%(月度平均)[105]
多因子ALPHA系列报告之(二十八):基于因子及事件的智能替换策略
广发证券· 2016-07-25 00:00
- 多因子策略结合事件驱动策略,通过智能替换策略控制风险并加强收益[2][3][4] - 多因子策略通过综合打分优选个股,避免单一风格依赖,利用股指期货对冲市场风险,获取alpha绝对收益[18] - 事件驱动策略通过捕捉上市公司特定事件进行短期投资获利,常见事件包括业绩预增、业绩快报、高管增持、股权激励和定增破发[21] - 智能替换策略的基本步骤包括期初按照多因子策略构建组合,监测事件驱动机会进行个股替换,并在组合持有期内反复进行替换[25][27][29] - 业绩快报事件替换策略在每个月第5个交易日开始替换,剔除与事件个股"一个月股价反转"因子最为接近的个股[56][57] - 高管增持事件替换策略在每个月第1个交易日开始替换,剔除与事件个股"一个月股价反转"因子最为接近的个股[61][62] - 股权激励事件替换策略在每个月第1个交易日开始替换,剔除与事件个股"CFP"估值因子最为接近的个股[65][66] - 业绩预增事件替换策略在每个月第10个交易日开始替换,在行业内进行剔除[69][70] - 定增破发事件替换策略在每个月第1个交易日开始替换,在行业内进行剔除[73][74] - 多事件替换策略结合各单事件的最优替换规则,监测多事件同时进行替换,最高调仓比例限制放宽至40%[77][80] 模型的回测效果 - 业绩快报事件替换策略:累计净值521.60%,年化收益率26.60%,胜率76.30%,最大回撤5.77%,信息比2.39[59][60] - 高管增持事件替换策略:累计净值535.70%,年化收益率27.00%,胜率77.40%,最大回撤5.75%,信息比2.40[63][64] - 股权激励事件替换策略:累计净值464.30%,年化收益率25.00%,胜率75.30%,最大回撤5.77%,信息比2.31[67][68] - 业绩预增事件替换策略:累计净值462.40%,年化收益率25.00%,胜率74.20%,最大回撤5.86%,信息比2.27[71][72] - 定增破发事件替换策略:累计净值467.60%,年化收益率25.10%,胜率75.30%,最大回撤6.05%,信息比2.28[75][76] - 多事件替换策略:累计净值577.70%,年化收益率28.00%,胜率75.30%,最大回撤9.13%,信息比2.51[81][82]
SVM 算法选股以及 Adaboost 增强
国信证券· 2016-05-31 00:00
量化模型与构建方式 支持向量机(SVM)模型 1. **模型名称**:支持向量机(SVM)模型 2. **模型构建思路**:SVM通过将非线性问题转化为高维空间的线性问题,利用核函数替代高维空间中的内积运算,从而解决复杂计算问题,并有效克服维数灾难和局部极小问题[1][9] 3. **模型具体构建过程**: - **线性分类问题**:SVM算法通过寻找最优超平面,将训练样本分成两类。优化问题为: $$ \operatorname*{max}\sum_{j=1}^{l}\alpha_{j}-\frac{1}{2}\sum_{i=1}^{l}\sum_{j=1}^{l}y_{i}y_{j}\alpha_{i}\alpha_{j}(x_{i}\cdot x_{j}) $$ $$ \begin{array}{c c c}{{s u b j e c t\;t o}}&{{\sum_{i=1}^{l}y_{i}\alpha_{i}=0}}&{{}}&{{c\geq\alpha_{i}\geq0}}&{{}}&{{i=1,...,l}}\end{array} $$ 其中,$x_i$是输入,$y_i$是$x_i$对应的输出值,$l$是样本个数,$\alpha_i$是拉格朗日系数,$c$是正则化参数[15] - **非线性分类问题**:通过核函数将数据映射到高维空间,使数据线性可分。优化问题为: $$ \frac{1}{2}\sum_{i=1}^{l}y_{i}y_{j}\alpha_{i}\alpha_{j}Ker(x_{i},x_{j}) $$ $$ \begin{array}{r l r l}{s u b j e c t\ to}&{{}\sum_{i=1}^{l}y_{i}\alpha_{i}=0}&{}&{{}c\geq\alpha_{i}\geq0}&{}&{{}i=1,...,l}\end{array} $$ 其中,$Ker(x_i, x_j)$是核函数[17] 4. **模型评价**:SVM模型具有很好的泛化能力,能够有效处理非线性问题,克服维数灾难和局部极小问题[1][9] Adaboost-SVM 组合算法 1. **模型名称**:Adaboost-SVM 组合算法 2. **模型构建思路**:利用Adaboost算法对每个月的数据的SVM分类算法进行增强,提高分类效果[3][28] 3. **模型具体构建过程**: - 提取12个月股票数据,设置初始权重$D1(i)=1/N$,N为样本个数 - 在样本t上训练SVM分类器$h_t$,并用$h_t$对全部样本进行分类 - 分类误差$\varepsilon_t$计算公式: $$ \alpha_{i}=\frac{1}{2}\ln\frac{1-\varepsilon_{i}}{\varepsilon_{i}} $$ - 更新全部样本的权值: $$ D_{t+1}(i)=\frac{D_{t}(i)}{Z_{t}}\times\{\begin{array}{l l}{{e^{-\alpha_{i}}}}&{{\quad\mathrm{if}\quad h_{t}(x_{i})=y_{i}}}\\ {{e^{\alpha_{t}}}}&{{\quad\mathrm{otherwise}}}\end{array} $$ - 最终的Adaboost-SVM分类算法表示为: $$ H(x)=\sum_{t=1}^{12}\alpha_{t}h_{t}(x) $$ 利用新一期样本数据代入$H(x)$,得到每一只股票的信任得分,并分为十档,选择收尾两档进行观察[34] 4. **模型评价**:Adaboost-SVM组合算法相比单月SVM效果显著增强,但整体效果不如传统SVM模型[3][36][39] 模型的回测效果 1. **SVM模型**: - **净值**:SVM算法的净值最高,波动程度小于传统回归方法[25] - **多空策略净值**:SVM算法的多空策略净值显著高于传统回归方法和Adaboost算法[26] 2. **Adaboost-SVM模型**: - **净值**:Adaboost-SVM算法相比单月SVM效果显著增强,但整体效果不如传统SVM模型[36][39] - **多空策略净值**:Adaboost-SVM算法的多空策略净值显著高于传统回归方法和Adaboost算法[38][42] 量化因子与构建方式 1. **因子名称**:盈利收益率(Earnings Yield)、盈利波动率(Earnings Variability)、成长(Growth)、杠杆(Leverage)、流动性(Liquidity)、动量(Momentum)、规模(Size)、价值(Value)、波动(Volatility)、股利收益率(Dividend Yield)、财务质量(Financial Quality) 2. **因子的构建思路**:根据指标构造的经济含义,以及参考BARRA模型的因子分类,将68个指标划分为11个因子[19] 3. **因子具体构建过程**:计算每个股票按某因子的排序然后除以总股票数,这样因子的值归到(0,1]。对下一期收益率从大到小排序,取前30%作为强势股,后30%作为弱势股,强势股划分类标为+1,弱势股划分类标为-1;中间40%的股票排出训练集[19][20] 因子的回测效果 1. **盈利收益率因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 2. **盈利波动率因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 3. **成长因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 4. **杠杆因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 5. **流动性因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 6. **动量因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 7. **规模因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 8. **价值因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 9. **波动因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 10. **股利收益率因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22] 11. **财务质量因子**: - **净值**:强势组合显著跑赢弱势组合[21] - **多空策略净值**:多空策略的超额收益显著[22]
多因子ALPHA系列报告之(二十六):牛股归因下的风格动量策略
广发证券· 2016-01-27 00:00
量化模型与构建方式 单风格因子策略 - **模型名称**:单风格因子策略 - **模型构建思路**:通过单一风格因子判断行业是否形成稳定风格,并超配具有上涨空间的个股[27][28][30] - **模型具体构建过程**: 1. 对行业内所有个股的风格因子值进行排序,风格因子值最小的20%个股集合记为A1,风格因子值最大的20%个股集合记为A2,收益率最大的20%个股集合记为B[27][28] 2. 开仓条件: - **反向开仓**:若风格因子与收益率相关系数显著为负,且A1与B的重叠比例远大于A2与B的重叠比例,同时A1中的个股超额收益率为正,则筛选A1中未涨停或停牌的个股进行超配[27][28] - **正向开仓**:若风格因子与收益率相关系数显著为正,且A2与B的重叠比例远大于A1与B的重叠比例,同时A2中的个股超额收益率为正,则筛选A2中未涨停或停牌的个股进行超配[29][30] 3. 平仓条件:持仓满5天、累计超额收益率超过15%或累计超额下跌超过5%[30] 4. 资金分配:行业内等权分配个股,行业间等权分配行业[31] - **模型评价**:能够有效判断投资者非理性行为并抓住超额收益机会,资金利用率高,换手率适中[36][37][38] 多风格因子策略(不同行业相同因子) - **模型名称**:多风格因子策略(不同行业相同因子) - **模型构建思路**:从单风格因子中选取综合表现较好的因子,在所有行业中使用相同因子进行策略构建[43][44] - **模型具体构建过程**: 1. 选取因子:规模因子(流通市值)、估值因子(PB)、质量因子(长期资本负债率)、盈利因子(ROE)[43] 2. 开仓条件:与单风格因子策略相同,但需对多个因子同时进行判断,若多个因子满足开仓条件,则根据公式计算得分,选择得分最高的因子进行超配 - **公式**: $ 风格因子得分 = C1 - C2 $(负向或不定) $ 风格因子得分 = C2 - C1 $(正向或不定)[45][46] 3. 平仓条件:持仓满5天、累计超额收益率超过15%或累计超额下跌超过5%[46] 4. 资金分配:行业内等权分配个股,行业间等权分配行业[47] - **模型评价**:表现稳定,资金利用率高,回撤较小,适用于多数行业[49][51][55] 多风格因子策略(分行业选因子) - **模型名称**:多风格因子策略(分行业选因子) - **模型构建思路**:根据各行业最佳因子选择不同因子进行策略构建,解决部分行业负收益问题[70][71] - **模型具体构建过程**: 1. 选取因子:根据各行业最佳因子选择不同因子,具体因子见表3[70][71] 2. 开仓条件、平仓条件、资金分配:与多风格因子策略(不同行业相同因子)相同[72][73] - **模型评价**:表现优于不同行业相同因子策略,收益率更高,回撤更小[75][77][79] --- 模型的回测效果 单风格因子策略 - **平均年化超额收益率**:流通市值19.04%,PB19.40%,ROE21.26%,长期资本负债率23.58%等[34][36] - **胜率**:流通市值53.24%,PB50.90%,ROE52.55%,长期资本负债率53.59%等[34][36] - **最大回撤**:流通市值19.18%,PB13.96%,ROE20.78%,长期资本负债率19.87%等[34][36] - **信息比率**:流通市值1.30,PB1.11,ROE1.15,长期资本负债率1.30等[34][36] 多风格因子策略(不同行业相同因子) - **累计超额净值**:269.31%[48] - **平均年化收益率**:17.58%[48] - **胜率**:54.62%[48] - **最大回撤**:11.01%[48] - **信息比率**:1.4083[48] 多风格因子策略(分行业选因子) - **累计超额净值**:462.54%[76] - **平均年化收益率**:28.56%[76] - **胜率**:56.18%[76] - **最大回撤**:11.41%[76] - **信息比率**:1.97[76] --- 因子的回测效果 单风格因子策略 - **流通市值**:年化收益率19.04%,胜率53.24%,最大回撤19.18%,信息比率1.30[34][36] - **PB**:年化收益率19.40%,胜率50.90%,最大回撤13.96%,信息比率1.11[34][36] - **ROE**:年化收益率21.26%,胜率52.55%,最大回撤20.78%,信息比率1.15[34][36] - **长期资本负债率**:年化收益率23.58%,胜率53.59%,最大回撤19.87%,信息比率1.30[34][36] 多风格因子策略(不同行业相同因子) - **流通市值**:显著次数995[62] - **PB**:显著次数317[62] - **ROE**:显著次数594[62] - **长期资本负债率**:显著次数844[62] 多风格因子策略(分行业选因子) - **纺织服装行业**:累计超额收益率677.18%,胜率49.51%,最大回撤29.32%[79][80] - **医药生物行业**:累计超额收益率566.12%,胜率50.52%,最大回撤15.56%[79][80] - **轻工制造行业**:累计超额收益率415.62%,胜率49.42%,最大回撤38.54%[79][80] - **建筑材料行业**:累计超额收益率455.04%,胜率49.39%,最大回撤20.83%[79][80]
20150715-财信证券-量化择时研究:财富投资者情绪指数(FISI)择时模型构建
财信证券· 2015-07-15 00:00
量化模型与构建方式 1. 模型名称:财富投资者情绪指数择时模型(Fortune Investor Sentiment Index, FISI) - **模型构建思路**:借鉴EMSI方法,通过计算沪深300指数成分股的日收益率与其Beta系数的Spearman秩相关系数,结合沪深300指数的涨跌幅,定义投资者情绪并构建择时模型[6][18][19] - **模型具体构建过程**: 1. 计算沪深300指数成分股的日收益率与其Beta系数的Spearman秩相关系数,公式如下: $$ \rho = \frac{\sum\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)}{\left[\sum\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)^{2}\left(\mathrm{R}_{{}_{iF}}-\overline{\mathrm{R}}_{{}_{r}}\right)^{2}\right]^{1/2}} $$ 其中,$\mathrm{R}_{{}_{iF}}$为个股的日收益率排序,$\overline{\mathrm{R}}_{{}_{r}}$为所有股票日收益率排序的平均值[16][17] 2. 定义6种初始信号,结合Spearman秩相关系数的显著性和沪深300指数的涨跌幅,具体如下: - 显著为正且指数上涨:强有效看多Beta - 显著为正且指数下跌:弱有效看空Beta - 不显著且指数上涨:强有效中性 - 不显著且指数下跌:弱有效中性 - 显著为负且指数上涨:弱有效看多Beta - 显著为负且指数下跌:强有效看空Beta[19][20] 3. 构建财富投资者情绪指数(FISI),公式如下: $$ F_{{}_{n}}=\frac{\mathit{SUM}(O_{{}_{n+n-9}}+P_{{}_{n+n-9}})-\mathit{SUM}(V_{{}_{n+n-9}}+T_{{}_{n-n-9}})}{\mathit{SUM}(O_{{}_{n+n-9}}+P_{{}_{n-n-9}})+\mathit{SUM}(V_{{}_{n+n-9}}+T_{{}_{n-n-9}})+1},\ \ n\geq10 $$ 其中,$O$为强有效看多Beta的个数,$P$为弱有效看多Beta的个数,$V$为强有效看空Beta的个数,$T$为弱有效看空Beta的个数[21] 4. 对FISI进行均值回归检验,采用ADF检验法,结果表明FISI为平稳时间序列,服从均值回归[24][25] 5. 根据FISI的变化趋势,当指标由负转正穿越0值时看多沪深300,当指标由正转负穿越0值时看空沪深300[27] - **模型评价**:模型能够有效反映市场投资者情绪,择时效果良好,但在趋势市中信号较少,震荡市中信号较频繁,整体表现出较高的实用性[30][46] 2. 策略名称:多策略与多空策略 - **策略构建思路**:基于FISI择时模型发出的看多或看空信号,分别构建多策略和多空策略[37] - **策略具体构建过程**: 1. **多策略**:当FISI择时模型发出看多信号时买入沪深300指数,当发出看空信号时卖出持仓[37] 2. **多空策略**:当FISI择时模型发出看多信号时买入沪深300指数,当发出看空信号时卖空沪深300指数,即进行双向交易[37] - **策略评价**:多空策略的累计收益率显著高于多策略,但最大回撤也更大;多策略在回撤控制方面表现更优[42] --- 模型的回测效果 财富投资者情绪指数择时模型 - **择时信号统计**: - 样本区间:2005年4月8日至2015年6月19日 - 共发出109次多空信号,其中正确信号55次,错误信号54次 - 单次最大亏损:9% - 单次最大盈利:92.31% - 平均每次亏损:1.18% - 平均每次盈利:5.67% - 单次平均期望回报:2.28% - 策略正确率:50.46%[27][30] --- 策略的回测效果 多策略 - **累计收益率**:12.22倍(1221.56%) - **最大回撤**:27.45%[42][45] 多空策略 - **累计收益率**:23.82倍(2381.66%) - **最大回撤**:37.64%[42][45]
多因子ALPHA系列报告之(二十四):财报因子使用方法新探
广发证券· 2015-07-06 00:00
量化模型与构建方式 模型名称:新多因子ALPHA模型 - **模型构建思路**:结合事件驱动的时效性和因子打分的资金规划可控性,形成具有行业中性、分段操作和资金规划特点的新多因子ALPHA模型[3][42] - **模型具体构建过程**: - **行业中性**:以报告期结束后的第一个交易日全市场A股(剔除ST和创业板)为股票池,根据申万一级行业分类进行划分,分行业选股;行业内排序打分,超低配前后5%的个股,持有一个月[42] - **分段操作**:每日监测各行业最新财报披露比例,各行业披露比例达到一定阈值即可分别操作;阈值每次增加10%,披露占比达到下一阈值再次操作;最晚披露日期默认再次操作,提前披露完毕的除外[42][44] - **资金规划**:以报告期结束后的第一个交易日中证800成分股权重中各行业占比作为当次财报数据使用中各行业分配的资金比例;闲置资金进行无风险投资,获得年4%的无风险利率[42] - **模型评价**:增强了因子的有效性,同时保持买入组合的稳定性,使资金规划更加可控[42] 模型名称:财报因子与非财报因子融合策略 - **模型构建思路**:结合财报因子和非财报因子,全年持仓,既使用新数据也使用旧数据,提升资金使用效率[96][82] - **模型具体构建过程**: - **因子选择**: - 财报因子:销售毛利率、ROE同比增长率、总资产对数、速动比率、流动负债率、销售费用比例[74] - 非财报因子:一个月成交金额、最近三个月平均成交量、市盈率、三个月股价反转、流通市值对数、一个月股价反转[96] - **操作步骤**:在财报披露月提前操作,分行业分阶段进行选股;非披露月按照原始策略进行选股;新披露财报的个股因子数据与非财报因子一起参与多因子排序打分[96][83] - **模型评价**:能够很好地与现有策略融合,带来更多收益回报,同时胜率更高、最大回撤更小[117][96] --- 模型的回测效果 新多因子ALPHA模型 - **多对800**:信息比1.49,超额收益21.93%,胜率58.50%,最大回撤5.34%[74] - **多对500**:信息比0.80,超额收益8.84%,胜率54.08%,最大回撤6.08%[78] - **多对300**:信息比1.39,超额收益26.64%,胜率58.84%,最大回撤7.08%[79] 财报因子与非财报因子融合策略 - **多对800**:信息比2.01,超额收益127.33%,胜率61.28%,最大回撤20.40%[109] - **多对500**:信息比1.78,超额收益72.34%,胜率55.74%,最大回撤6.34%[114] - **多对300**:信息比1.75,超额收益147.43%,胜率61.36%,最大回撤26.29%[117] --- 量化因子与构建方式 因子名称:销售毛利率 - **因子构建思路**:通过财报数据计算,反映企业盈利能力[21][74] - **因子具体构建过程**:直接从财报中提取销售毛利率数据,进行排序打分[21][74] - **因子评价**:在披露月表现优于非披露月,提前操作效果更佳[36][45] 因子名称:ROE同比增长率 - **因子构建思路**:通过财报数据计算,反映企业盈利能力的同比变化[21][74] - **因子具体构建过程**:从财报中提取ROE数据,计算同比增长率,进行排序打分[21][74] - **因子评价**:提前操作改善了因子效果,由无效变为有效[45][62] 因子名称:总资产对数 - **因子构建思路**:通过财报数据计算,反映企业规模[21][74] - **因子具体构建过程**:从财报中提取总资产数据,取对数后进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] 因子名称:速动比率 - **因子构建思路**:通过财报数据计算,反映企业短期偿债能力[21][74] - **因子具体构建过程**:从财报中提取速动比率数据,进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] 因子名称:流动负债率 - **因子构建思路**:通过财报数据计算,反映企业负债结构[21][74] - **因子具体构建过程**:从财报中提取流动负债率数据,进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] 因子名称:销售费用比例 - **因子构建思路**:通过财报数据计算,反映企业销售费用占比[21][74] - **因子具体构建过程**:从财报中提取销售费用比例数据,进行排序打分[21][74] - **因子评价**:提前操作显著提高因子有效性[45][62] --- 因子的回测效果 不考虑快报情况下 - **销售毛利率**:信息比1.64,提前操作效果优于截止日操作[63] - **ROE同比增长率**:信息比-1.77,提前操作改善了因子效果[63] - **总资产对数**:信息比2.69,提前操作显著提高因子有效性[63] - **速动比率**:信息比1.31,提前操作显著提高因子有效性[63] - **流动负债率**:信息比2.59,提前操作显著提高因子有效性[63] - **销售费用比例**:信息比2.22,提前操作显著提高因子有效性[63] 考虑快报情况下 - **销售毛利率**:信息比1.64,快报数据进一步提高因子有效性[64] - **ROE同比增长率**:信息比-1.77,快报数据进一步提高因子有效性[64] - **总资产对数**:信息比2.91,快报数据进一步提高因子有效性[64] - **速动比率**:信息比1.25,快报数据进一步提高因子有效性[64] - **流动负债率**:信息比2.96,快报数据进一步提高因子有效性[64] - **销售费用比例**:信息比1.85,快报数据进一步提高因子有效性[64]
多因子ALPHA系列报告之(十八):基于风格特征归因的动态因子策略
广发证券· 2013-09-02 00:00
量化模型与构建方式 1. 模型名称:基于特征归因的因子逐步调整策略 - **模型构建思路**:通过对多因子组合进行特征归因,动态剔除"失效"因子,并逐步调整因子组合,以优化多因子对冲策略的效果[4][40][42] - **模型具体构建过程**: 1. **因子挑选**:根据过去一年的因子IC表现,从各类因子中挑选IC大于1%且有效性最高的两个,或当IC大于5%的因子作为初始因子[3][25] 2. **特征归因**:对多因子组合进行归因,分析组合中各因子的有效性。假设组合在因子i上的平均暴露为Fi,全部个股在因子i上的暴露中,Fi位于第N档(假设全部个股的分档数量为M),则组合归因后因子i的实际分档为N/M[26][31] 3. **因子有效分档计算**:将股票根据因子排序分为N档,计算过去一年第i个分界线之前所有股票组合相对全部股票超额收益信息比IR(i)。有效分档定义为: $$ F_{i} = \text{argmax} \{ IR(i) > 0.8 \text{ 或 } IR(i) > 0.5 \times IR(1) \} $$ 其中,参数0.8和0.5为经验值,用于衡量因子有效性[27][30] 4. **动态调整策略**:定义因子有效得分$S_i = G_i / F_i$,其中$G_i$为归因后实际分档,$F_i$为因子有效分档。当$S_i \geq 1$时,因子有效;否则为无效。剔除无效因子后,逐个将剔除的因子重新纳入组合,若组合的平均因子有效得分提高,则保留该因子,反之剔除[43][44] 5. **最终优化**:循环上述步骤,直到多因子组合趋于稳定[43][49] - **模型评价**:逐步调整因子的策略能够有效改善多因子对冲策略的效果,避免因子误删或因子数量过少的问题[4][42] 2. 模型名称:主成分方法 - **模型构建思路**:通过对多个因子进行合成降维,解决因子之间可能存在的多重共线性问题[35] - **模型具体构建过程**: 1. 对因子进行主成分分析,提取主要成分 2. 合并相似因子,避免因子雷同导致的组合归因不清问题 3. 因子合并的依据可以是基于因子之间的统计结果或对因子的主观理解[35] - **模型评价**:主成分方法能够有效解决因子相关性问题,但可能弱化对单个因子特征的分析[35] 3. 模型名称:优化模型 - **模型构建思路**:通过优化模型对因子之间的相关性进行权重优化,使得组合在风险与收益之间达到平衡[36] - **模型具体构建过程**: 1. 构建优化目标函数: $$ \operatorname*{max}\{h^{\prime}X_{\alpha}-{\frac{1}{2}}\lambda h^{\prime}V h\} $$ 其中,$h$为组合权重,$X_{\alpha}$为因子收益,$V$为因子协方差矩阵,$\lambda$为风险厌恶系数[37] 2. 约束条件: $$ s.t.\quad h^{\prime}X_{\sigma}=0 $$ 其中,$X_{\sigma}$为因子风险暴露[37] 3. 求解优化问题,得到组合权重[37] - **模型评价**:优化模型注重风险控制,但相对弱化了对组合中Alpha来源的分析和识别[38] --- 模型的回测效果 1. 基于特征归因的因子逐步调整策略 - 信息比率(IR):多-指数1.65,多空1.63[4][58] - 年化收益率:多-指数11%,多空24%[4][58] - 累计最大回撤:多-指数5.3%,多空11.8%[4][58] - 月度胜率:多-指数71.9%,多空76.6%[4][58] 2. 主成分方法 - 无具体回测结果 3. 优化模型 - 无具体回测结果 --- 量化因子与构建方式 1. 因子名称:IC动量因子 - **因子构建思路**:根据因子过去一年的IC表现,挑选IC大于1%且有效性最高的因子[3][25] - **因子具体构建过程**: 1. 计算因子IC值:$IC = corr(F_i, R_i)$,其中$F_i$为因子暴露,$R_i$为个股下期收益[22] 2. 按照IC值排序,选择IC大于1%且有效性最高的因子[25] - **因子评价**:IC动量因子能够有效刻画因子的线性单调性,适用于因子筛选[14][25] 2. 因子名称:有效分档因子 - **因子构建思路**:通过分档计算因子有效性,确定因子在组合中的有效分档范围[27] - **因子具体构建过程**: 1. 将股票根据因子排序分为N档 2. 计算过去一年第i个分界线之前所有股票组合相对全部股票超额收益信息比IR(i) 3. 定义因子有效分档为: $$ F_{i} = \text{argmax} \{ IR(i) > 0.8 \text{ 或 } IR(i) > 0.5 \times IR(1) \} $$ 4. 根据有效分档结果,剔除无效因子[27][30] - **因子评价**:有效分档因子能够动态调整因子组合,确保因子在组合中的有效性[27][30] --- 因子的回测效果 1. IC动量因子 - 无具体回测结果 2. 有效分档因子 - 无具体回测结果
多因子ALPHA系列报告之(十九):笑看北雁南飞南雁北归
广发证券· 2013-09-02 00:00
量化模型与构建方式 1. 模型名称:多因子动态调整策略 - **模型构建思路**:通过对多因子组合进行特征归因,动态剔除失效因子并逐步优化因子组合,以提升多因子策略的有效性[3][4][40] - **模型具体构建过程**: 1. **因子挑选**:根据过去一年的因子IC表现,挑选IC大于1%且有效性最高的因子,或当IC大于5%时直接入选[3][25] 2. **特征归因**:对多因子组合进行归因,分析组合中各因子的有效性。假设组合在因子i上的平均暴露为Fi,全部个股在因子i上的暴露中Fi位于第N档(假设分档数量为M),则组合归因后因子i的实际分档为N/M[26][31] 3. **因子有效分档计算**:将股票根据因子排序分为N档,计算过去一年第i个分界线之前所有股票组合的超额收益信息比IR(i)。有效分档定义为: $F_{i} = \text{argmax}_{IR(i) > 0.8 \, \text{or} \, IR(i) > 0.5 \cdot IR(1)}$ 其中,IR(1)为第一档的因子信息比,0.8和0.5为经验值[27][30] 4. **动态调整策略**: - 计算因子有效得分:$S_i = G_i / F_i$,其中$G_i$为归因后实际分档,$F_i$为因子有效分档 - 若$S_i \geq 1$,因子有效;否则为失效因子 - 剔除失效因子后,逐个将剔除的因子重新纳入组合,若因子纳入后提升组合平均因子有效得分,则保留该因子[43][44] 5. **优化目标函数**: $$\operatorname*{max}\{h^{\prime}X_{\alpha}-{\frac{1}{2}}\lambda h^{\prime}V h\}$$ $$s.t.\quad h^{\prime}X_{\sigma}=0$$ 其中,$h$为组合权重,$X_{\alpha}$为因子收益,$V$为因子协方差矩阵,$\lambda$为风险厌恶系数[37][38] - **模型评价**:动态调整策略能够有效改善多因子对冲策略的表现,避免因子误删或因子数量过少的问题[4][42] --- 模型的回测效果 1. 初始因子策略 - 信息比(多-指数):1.47[58] - 信息比(多空):1.59[58] - 年化收益率:10%(多-指数),23%(多空)[58] - 累计最大回撤:5.3%(多-指数),11.4%(多空)[58] - 月度胜率:65.6%(多-指数),71.9%(多空)[58] 2. 简单优化策略 - 信息比(多-指数):1.49[58] - 信息比(多空):1.49[58] - 年化收益率:10%(多-指数),23%(多空)[58] - 累计最大回撤:5.8%(多-指数),13.4%(多空)[58] - 月度胜率:67.2%(多-指数),73.4%(多空)[58] 3. 逐步优化策略 - 信息比(多-指数):1.65[58] - 信息比(多空):1.63[58] - 年化收益率:11%(多-指数),24%(多空)[58] - 累计最大回撤:5.3%(多-指数),11.8%(多空)[58] - 月度胜率:71.9%(多-指数),76.6%(多空)[58] --- 量化因子与构建方式 1. 因子名称:IC动量因子 - **因子的构建思路**:根据因子过去一年的IC表现,挑选IC大于1%且有效性最高的因子,或当IC大于5%时直接入选[3][25] - **因子具体构建过程**: 1. 计算因子IC:$IC = \text{corr}(F_i, R_i)$,其中$F_i$为因子暴露,$R_i$为个股下期收益[14][22] 2. 按照IC值排序,选择IC值最高的因子作为初始因子[3][25] - **因子评价**:IC动量因子能够有效刻画因子的线性单调性,适用于多因子策略的初始因子筛选[14][25] 2. 因子名称:因子有效分档 - **因子的构建思路**:通过分档计算因子在不同分组中的超额收益信息比,确定因子的有效分档范围[27][30] - **因子具体构建过程**: 1. 将股票根据因子暴露排序分为N档 2. 计算每档的超额收益信息比:$IR(i) = \text{信息比}(i)$ 3. 确定有效分档:$F_{i} = \text{argmax}_{IR(i) > 0.8 \, \text{or} \, IR(i) > 0.5 \cdot IR(1)}$[27][30] - **因子评价**:因子有效分档能够有效识别因子的单调性和有效性,为因子筛选提供了重要依据[27][30] --- 因子的回测效果 1. IC动量因子 - 信息比:IC值大于1%的因子被选为有效因子[25] - 超额收益:IC值显著的因子能够带来显著的超额收益[14][25] 2. 因子有效分档 - 信息比:有效分档的因子信息比大于0.8[27][30] - 超额收益:有效分档的因子能够显著提升组合的超额收益[27][30]
多因子ALPHA系列报告之(十四):基于情景分析的多因子ALPHA策略
广发证券· 2012-11-16 00:00
量化因子与构建方式 1. **因子名称**:ROE、总资产增长率、一个月成交金额、一个月股价反转、流通市值、EP - **因子的构建思路**:通过因子的分层效应来区分不同股票的特征情景,并根据情景下因子IC的绝对值来决定其权重[1][2][3] - **因子具体构建过程**: - **分层效应分析**:通过对风格因子进行层次分解,解决因子的非线性问题。假设第i个因子作为分层因子Fi,基于Fi对每个Alpha因子fj测算其不同样本下的有效性,ICj代表Alpha因子fj因子在全样本中的有效性,ICij+代表Alpha因子fj在高Fi样本中的有效性,ICij-代表Alpha因子fj因子在低Fi样本中的有效性。以[ICj, ICj+, ICj-]的离差DEVij代表Fi对fj的分层效应强度: $$ DEV_{ij} = std([IC_{j}, IC_{ij}^{+}, IC_{ij}^{-}]) $$ DEVi表示分层因子Fi的分层强度: $$ DEV_{i} = \sum_{j=1}^{j=N} DEV_{ij} / N $$ 其中,N为alpha因子的数量[17][18][19] - **因子情景加权矩阵**:根据每个因子的分层强度,挑选分层强度最高的6个因子,并根据因子IC的绝对值对各个因子进行配权,形成因子情景加权矩阵[21][39][40] - **因子评价**:因子情景加权模型显著提高了多因子Alpha策略的收益,同时模型在各阶段的表现更加具有稳定性[4][5][6] 因子的回测效果 1. **ROE因子**,**总资产增长率因子**,**一个月成交金额因子**,**一个月股价反转因子**,**流通市值因子**,**EP因子** - **信息比率(IR)**:样本内1.60,样本外0.77[68][71] - **年化收益率**:样本内34.9%,样本外9.9%[71] - **年化波动率**:样本内21.8%,样本外12.8%[71] - **最大回撤**:样本内15.4%,样本外11.0%[71] - **年度表现**: - 2007年:年化收益率10.6%,年化波动率28.4%,IR 0.37,最大回撤15.4%[71] - 2008年:年化收益率41.8%,年化波动率23.9%,IR 1.75,最大回撤7.8%[71] - 2009年:年化收益率45.7%,年化波动率19.6%,IR 2.33,最大回撤9.9%[71] - 2010年:年化收益率35.5%,年化波动率17.3%,IR 2.05,最大回撤5.6%[71] - 2011年:年化收益率6.2%,年化波动率12.2%,IR 0.50,最大回撤8.5%[71] - 2012年(截止10月底):年化收益率14.3%,年化波动率13.9%,IR 1.03,最大回撤4.7%[71]
多因子ALPHA系列报告之(十三):考虑因子非线性特征的多因子ALPHA策略
广发证券· 2012-09-19 00:00
量化模型与构建方式 1. 模型名称:基于因子多项式形式的Alpha模型 - **模型构建思路**:通过构造因子的多项式形式(如二阶或三阶多项式)来替代因子的线性形式,以改善因子与股票收益之间的非线性关系[3][24][25] - **模型具体构建过程**: - 因子的三次多项式模型公式为: $ r_{i}=aF^{3}+bF^{2}+cF+d $ 其中,$a$、$b$、$c$、$d$为多项式系数,通过最小二乘法拟合得到[24][25] - 对因子进行非线性转化后,重新计算因子与股票收益的关系,并验证其改善效果[27][28] - **模型评价**:该方法原理简单,操作性强,但依赖于历史数据的挖掘,缺乏严谨的经济逻辑解释[23][99] 2. 模型名称:引入附加因子的Alpha模型 - **模型构建思路**:通过引入附加因子(如流通市值)来解释因子的非线性特征,并构造虚拟变量以改善因子与股票收益的关系[4][75][78] - **模型具体构建过程**: - 以换手率因子为例: - 首先发现换手率因子在不同市值样本中与股票收益的关系显著不同[4][75] - 引入流通市值作为附加因子,构造虚拟变量$dhigh\_cap$,在高市值和低市值样本中分别取值为0和1[4][75] - 调整后的因子模型公式为: $ r_{i}=v_{i0}+v_{i1}F_{i}+v_{i2}dhigh\_cap \cdot F_{i}+\varepsilon_{i} $ 其中,$v_{i0}$、$v_{i1}$、$v_{i2}$为回归系数,$F_{i}$为原始因子暴露值[78] - 对其他因子(如EP、成交金额等)采用类似方法,引入附加因子并验证改善效果[82][85][88] - **模型评价**:该方法具有较强的经济解释力,改善效果显著,但需要大量因子配对比较,工作量较大[4][99] --- 模型的回测效果 1. 基于因子多项式形式的Alpha模型 - **非线性多因子策略(不考虑线性变换)**: - 样本内(2007-2011):年化收益率12.46%,年化波动率14.44%,IR为0.86,最大回撤14.62%[63] - 样本外(2012):年化收益率17.93%,年化波动率11.19%,IR为1.60,最大回撤2.36%[63] - **非线性多因子策略(考虑线性变换)**: - 样本内(2007-2011):年化收益率19.36%,年化波动率13.07%,IR为1.48,最大回撤15.33%[67] - 样本外(2012):年化收益率19.19%,年化波动率8.97%,IR为2.14,最大回撤2.26%[67] 2. 引入附加因子的Alpha模型 - **多因子策略(不考虑附加因子)**: - 样本内(2007-2011):年化收益率28.25%,年化波动率17.16%,IR为1.65,最大回撤9.66%[97] - 样本外(2012):年化收益率12.91%,年化波动率10.42%,IR为1.24,最大回撤1.77%[97] - **多因子策略(考虑附加因子)**: - 样本内(2007-2011):年化收益率30.90%,年化波动率15.43%,IR为2.00,最大回撤8.23%[96] - 样本外(2012):年化收益率17.20%,年化波动率11.01%,IR为1.56,最大回撤1.70%[96] --- 量化因子与构建方式 1. 因子名称:资产负债率因子 - **因子的构建思路**:资产负债率因子在高低两端表现较差,中间表现较好,需通过多项式调整改善其线性特征[27][28] - **因子具体构建过程**: - 对资产负债率因子进行三次多项式拟合,调整因子暴露值[24][27] - 调整后重新计算因子与股票收益的关系,并验证改善效果[27][28] - **因子评价**:调整后因子的线性特征显著改善[27] 2. 因子名称:换手率因子 - **因子的构建思路**:换手率因子在低换手率区间存在非线性特征,需通过多项式调整或引入附加因子改善[30][79] - **因子具体构建过程**: - 多项式调整:对换手率因子进行三次多项式拟合,改善其线性特征[30] - 引入附加因子:将流通市值作为附加因子,构造虚拟变量并调整因子模型[75][78] - **因子评价**:调整后因子的单调性和有效性显著提高[30][79] 3. 因子名称:EP因子 - **因子的构建思路**:EP因子在低EP区间存在非线性特征,需通过多项式调整或引入附加因子改善[34][82] - **因子具体构建过程**: - 多项式调整:对EP因子进行三次多项式拟合,改善其线性特征[34] - 引入附加因子:将流通市值作为附加因子,调整因子模型[82] - **因子评价**:调整后因子的单调性和有效性显著提高[34][82] --- 因子的回测效果 1. 资产负债率因子 - 调整前:年化收益率-0.5%[27] - 调整后:年化收益率3%[27] 2. 换手率因子 - 调整前:年化收益率21.7%[30] - 调整后:年化收益率28.4%[30] 3. EP因子 - 调整前:年化收益率11%[34] - 调整后:年化收益率13.5%[34]