量化模型与构建方式 1. 模型名称:多元CNN-LSTM预测模型 - 模型构建思路:结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的优势,通过多元时间序列分析技术对并行金融时间序列(如行业指数)进行联合预测,考虑序列间的动态相关性[11][12] - 模型具体构建过程: 1. 输入层:对齐多个时间序列数据并按时间顺序排列[14] 2. 卷积层:使用64个过滤器(卷积核大小=2)提取特征,激活函数为ReLU[20] 3. 池化层:窗口大小为(2,2)[20] 4. LSTM层:两层隐含单元(各128个),处理时序依赖关系[20] 5. 全连接层:输出预测值,损失函数为均方根误差(RMSE): [20] - 模型评价:对TMT行业预测精度较高,消费类行业误差较大;分组训练后预测效果提升[25][32] 2. 模型名称:分组多元CNN-LSTM - 模型构建思路:将申万一级行业按投资属性分为6组(如消费及医药、大科技等),每组独立训练子模型以降低复杂度[26][27] - 模型具体构建过程: 1. 行业分组:消费及医药(9行业)、上游资源及材料(5行业)、高端制造(6行业)、地产及基建(4行业)、大科技(4行业)、大金融(2行业)[27] 2. 子模型结构:每组采用与主模型相同的CNN-LSTM架构,但参数独立训练[28] 3. 预测整合:各子模型输出组内行业预测值,最终合并为全行业预测结果[28] --- 量化因子与构建方式 1. 因子名称:T+5行业收益率预测因子 - 因子构建思路:基于多元CNN-LSTM模型对行业指数未来5日收益率的预测值,作为行业轮动信号的输入[35] - 因子具体构建过程: 1. 调整模型超参数:时序回看窗口扩展至20天,LSTM隐含单元增至256个[34] 2. 使用扩展窗口训练(2014年3月至调仓时点前数据),每季度重新训练[35] 3. 对T+5预测值排序,选取前5名行业作为多头组合[35] --- 模型的回测效果 1. 多元CNN-LSTM(全行业): - 测试集预测误差范围:1.56%~3.30%(T+1)[23] - TMT行业误差最低(如电子1.56%),消费类较高(如食品饮料3.25%)[23] 2. 分组多元CNN-LSTM: - 分组后测试误差改善:电子从1.56%降至1.78%,食品饮料从3.25%降至2.68%[32][33] - T+5预测误差较T+1显著上升,但仍在可接受范围[37] 3. 行业轮动策略: - 年化收益:15.6%(基准3.6%),年化超额收益11.6%[38] - 最大回撤:-27.1%(基准-36.3%),夏普比率0.7(基准0.27)[38] --- 因子的回测效果 1. T+5收益率预测因子: - 行业轮动组合IR:1.01,最长回撤修复时间248天[38] - 分组后因子稳定性提升,但T+5预测误差波动增大[37]
金融工程研究报告:多元时序预测在行业轮动中的应用