量化模型与构建方式 支持向量机(SVM)模型 1. 模型名称:支持向量机(SVM)模型 2. 模型构建思路:SVM通过将非线性问题转化为高维空间的线性问题,利用核函数替代高维空间中的内积运算,从而解决复杂计算问题,并有效克服维数灾难和局部极小问题[1][9] 3. 模型具体构建过程: - 线性分类问题:SVM算法通过寻找最优超平面,将训练样本分成两类。优化问题为: 其中,是输入,是对应的输出值,是样本个数,是拉格朗日系数,是正则化参数[15] - 非线性分类问题:通过核函数将数据映射到高维空间,使数据线性可分。优化问题为: 其中,是核函数[17] 4. 模型评价:SVM模型具有很好的泛化能力,能够有效处理非线性问题,克服维数灾难和局部极小问题[1][9] Adaboost-SVM 组合算法 1. 模型名称:Adaboost-SVM 组合算法 2. 模型构建思路:利用Adaboost算法对每个月的数据的SVM分类算法进行增强,提高分类效果[3][28] 3. 模型具体构建过程: - 提取12个月股票数据,设置初始权重,N为样本个数 - 在样本t上训练SVM分类器,并用对全部样本进行分类 - 分类误差计算公式: - 更新全部样本的权值: - 最终的Adaboost-SVM分类算法表示为: 利用新一期样本数据代入,得到每一只股票的信任得分,并分为十档,选择收尾两档进行观察[34] 4. 模型评价:Adaboost-SVM组合算法相比单月SVM效果显著增强,但整体效果不如传统SVM模型[3][36][39] 模型的回测效果 1. SVM模型: - 净值:SVM算法的净值最高,波动程度小于传统回归方法[25] - 多空策略净值:SVM算法的多空策略净值显著高于传统回归方法和Adaboost算法[26] 2. Adaboost-SVM模型: - 净值:Adaboost-SVM算法相比单月SVM效果显著增强,但整体效果不如传统SVM模型[36][39] - 多空策略净值:Adaboost-SVM算法的多空策略净值显著高于传统回归方法和Adaboost算法[38][42] 量化因子与构建方式 1. 因子名称:盈利收益率(Earnings Yield)、盈利波动率(Earnings Variability)、成长(Growth)、杠杆(Leverage)、流动性(Liquidity)、动量(Momentum)、规模(Size)、价值(Value)、波动(Volatility)、股利收益率(Dividend Yield)、财务质量(Financial Quality) 2. 因子的构建思路:根据指标构造的经济含义,以及参考BARRA模型的因子分类,将68个指标划分为11个因子[19] 3. 因子具体构建过程:计算每个股票按某因子的排序然后除以总股票数,这样因子的值归到(0,1]。对下一期收益率从大到小排序,取前30%作为强势股,后30%作为弱势股,强势股划分类标为+1,弱势股划分类标为-1;中间40%的股票排出训练集[19][20] 因子的回测效果 1. 盈利收益率因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 2. 盈利波动率因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 3. 成长因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 4. 杠杆因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 5. 流动性因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 6. 动量因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 7. 规模因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 8. 价值因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 9. 波动因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 10. 股利收益率因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22] 11. 财务质量因子: - 净值:强势组合显著跑赢弱势组合[21] - 多空策略净值:多空策略的超额收益显著[22]
SVM 算法选股以及 Adaboost 增强
国信证券·2016-05-31 00:00