多元时序预测

搜索文档
金融工程研究报告:多元时序预测在行业轮动中的应用
浙商证券· 2025-08-11 18:16
量化模型与构建方式 1. **模型名称**:多元CNN-LSTM预测模型 - **模型构建思路**:结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的优势,通过多元时间序列分析技术对并行金融时间序列(如行业指数)进行联合预测,考虑序列间的动态相关性[11][12] - **模型具体构建过程**: 1. **输入层**:对齐多个时间序列数据并按时间顺序排列[14] 2. **卷积层**:使用64个过滤器(卷积核大小=2)提取特征,激活函数为ReLU[20] 3. **池化层**:窗口大小为(2,2)[20] 4. **LSTM层**:两层隐含单元(各128个),处理时序依赖关系[20] 5. **全连接层**:输出预测值,损失函数为均方根误差(RMSE): $$R M S E={\sqrt{\frac{1}{n}\sum_{i}({\hat{y_{i}}}-y_{i}\,)^{2}}}$$ [20] - **模型评价**:对TMT行业预测精度较高,消费类行业误差较大;分组训练后预测效果提升[25][32] 2. **模型名称**:分组多元CNN-LSTM - **模型构建思路**:将申万一级行业按投资属性分为6组(如消费及医药、大科技等),每组独立训练子模型以降低复杂度[26][27] - **模型具体构建过程**: 1. **行业分组**:消费及医药(9行业)、上游资源及材料(5行业)、高端制造(6行业)、地产及基建(4行业)、大科技(4行业)、大金融(2行业)[27] 2. **子模型结构**:每组采用与主模型相同的CNN-LSTM架构,但参数独立训练[28] 3. **预测整合**:各子模型输出组内行业预测值,最终合并为全行业预测结果[28] --- 量化因子与构建方式 1. **因子名称**:T+5行业收益率预测因子 - **因子构建思路**:基于多元CNN-LSTM模型对行业指数未来5日收益率的预测值,作为行业轮动信号的输入[35] - **因子具体构建过程**: 1. 调整模型超参数:时序回看窗口扩展至20天,LSTM隐含单元增至256个[34] 2. 使用扩展窗口训练(2014年3月至调仓时点前数据),每季度重新训练[35] 3. 对T+5预测值排序,选取前5名行业作为多头组合[35] --- 模型的回测效果 1. **多元CNN-LSTM(全行业)**: - 测试集预测误差范围:1.56%~3.30%(T+1)[23] - TMT行业误差最低(如电子1.56%),消费类较高(如食品饮料3.25%)[23] 2. **分组多元CNN-LSTM**: - 分组后测试误差改善:电子从1.56%降至1.78%,食品饮料从3.25%降至2.68%[32][33] - T+5预测误差较T+1显著上升,但仍在可接受范围[37] 3. **行业轮动策略**: - 年化收益:15.6%(基准3.6%),年化超额收益11.6%[38] - 最大回撤:-27.1%(基准-36.3%),夏普比率0.7(基准0.27)[38] --- 因子的回测效果 1. **T+5收益率预测因子**: - 行业轮动组合IR:1.01,最长回撤修复时间248天[38] - 分组后因子稳定性提升,但T+5预测误差波动增大[37]