量化模型与构建方式 1. 模型名称:LSTMtech - 模型构建思路:直接使用LSTM模型对股价数据(开、高、低、收、成交量)及技术指标进行因子挖掘[15] - 模型具体构建过程:输入层为原始量价数据及talib生成的技术指标,采用6年训练集+2年验证集的滚动训练方式,每年更新模型参数[15] - 模型评价:多头分组效果不够单调,但整体选股能力稳定[15] 2. 模型名称:LSTMdeap_tech - 模型构建思路:先通过遗传算法挖掘有效技术因子,再与原始数据共同输入LSTM模型[24][26] - 模型具体构建过程: 1. 使用遗传算法在2010-2016年数据中挖掘有效因子(框架见图4)[20][22] 2. 将遗传算法因子与原始技术指标合并作为LSTM输入[26] 3. 保持相同的滚动训练机制(6年训练+2年验证)[26] - 模型评价:绩效显著优于纯LSTM模型,且能覆盖原始LSTM因子的alpha信息[26] 3. 模型名称:LSTMgraph - 模型构建思路:将技术指标转化为人为定义的状态变量后输入LSTM[33][41] - 模型具体构建过程: 1. 对K线形态(实体/影线)和技术指标(如均线相对位置)进行状态编码[33] 2. 合成1-20日K线状态变量作为输入[41] 3. 采用相同LSTM框架训练[41] - 模型评价:解决了CNN图形识别耗时耗资源的问题,同时保留形态特征[32][41] 4. 复合模型名称:LSTMdeap_tech_graph - 模型构建思路:等权合成LSTMdeap_tech与LSTMgraph因子[47][49] - 模型具体构建过程: 1. 验证两因子相关性(51.48%)及残差选股效果(见图16)[47][49] 2. 直接等权加权合成[49] - 模型评价:多维度技术信号互补,绩效进一步提升[49] 5. 复合模型名称:LSTMdeap_tech_graph_pro - 模型构建思路:将LSTMdeap_tech_graph与交易行为因子LSTMpro等权合成[54] - 模型具体构建过程:基于38.61%的低相关性直接合成[54] - 模型评价:多头超额收益显著提升,收益波动比优化[54] --- 量化因子与构建方式 1. 因子名称:Tech_similarity - 构建思路:基于技术指标状态匹配历史相似形态[35] - 具体构建过程: 1. 按月回看5个交易日,匹配股价/MACD/涨跌停/成交量状态[35] 2. 计算匹配日后续20天超额收益均值[35] 2. 因子名称:K_similarity - 构建思路:基于K线形态匹配历史相似模式[39] - 具体构建过程: 1. 对日/周/月K线及成交量状态编码[39] 2. 采用与Tech_similarity相同的计算逻辑[39] 3. 复合因子名称:Tech_K_similarity - 构建思路:等权合成Tech_similarity与K_similarity[40] - 具体构建过程:验证两因子25.49%相关性后直接合成[40] --- 模型的回测效果 | 模型名称 | RankIC(2019-) | RankICIR | 多空年化收益 | 多头超额年化 | |------------------------|---------------|----------|--------------|--------------| | LSTMtech | 7.42% | 4.25 | 24.02% | - | [15] | LSTMdeap_tech | 9.27% | 4.54 | 32.44% | - | [26] | LSTMgraph | 9.01% | 4.70 | 32.25% | - | [41][44] | LSTMdeap_tech_graph | 10.89% | 4.99 | 37.28% | 9.40% | [49] | LSTMdeap_tech_graph_pro | 11.93% | - | 39.85% | 11.34% | [54] --- 因子的回测效果 | 因子名称 | RankIC(2013-) | RankICIR | 多空年化收益 | |-------------------|---------------|----------|--------------| | Tech_similarity | 4.97% | 3.05 | 20.22% | [35][37] | K_similarity | 5.10% | 3.09 | 19.25% | [39][42] | Tech_K_similarity | 5.89% | 3.25 | 25.97% | [40][43]
开源量化评论(109):深度学习赋能技术分析
开源证券·2025-06-25 21:22