金融时序预测
搜索文档
【固收】基于堆叠LSTM模型的十年期国债收益率预测——量化学习笔记之一(张旭)
光大证券研究· 2025-12-16 07:07
金融时序预测模型发展 - 金融时间序列预测经历了从传统计量模型、传统机器学习模型到深度学习模型三个主要发展阶段[4] - 深度学习模型能较好适应金融时间序列的非平稳、非线性、高噪声和长记忆性等复杂特征,是当前主流方法之一[4] 神经网络模型在金融时序中的应用 - 神经网络是模仿人脑神经元连接结构设计的机器学习模型,也是深度学习的基础结构[4] - 循环神经网络及其变种如长短期记忆神经网络专为处理序列数据设计,具备记忆性和参数共享优势[4] - LSTM模型通过引入“门控机制”和记忆单元,有效缓解了传统RNN的梯度消失/爆炸问题,并能过滤序列噪声,增强对不规则数据的鲁棒性[4] - LSTM的优势使其能够有效处理长时期时间序列,过滤噪声,精准捕捉如债券收益率等金融数据的动态变化规律[4] 基于堆叠LSTM的国债收益率预测模型 - 报告采用三层堆叠LSTM加Dropout正则化的经典稳健架构构建十年期国债收益率预测模型[5] - 模型数据标的为2021年初至2025年12月12日的十年期国债收益率,以过去60个交易日的收益率一阶差分作为输入特征,未来一周的收益率一阶差分作为预测目标[5] - 最终构建的模型包含约13万个可调参数,于第27轮训练迭代出最优模型,针对测试集预测的平均绝对误差为1.43BP[5] - 最优模型预测2025年12月15日至19日当周十年期国债收益率整体呈下行趋势,2025年12月19日的预测值为1.8330%,相比2025年12月12日的1.8396%有小幅下降[5] 模型后续优化方向 - 模型设计优化:针对时间窗口、数据处理、网络架构和训练策略等相关设计进行调整优化[6] - 输入多维度变量:将输入变量从单一的收益率序列扩展至宏观、市场、情绪等多维度变量,使模型预测更符合经济逻辑,捕捉信息更全面[6] - 构建混合模型:将LSTM模型与传统计量模型或其他机器学习模型相结合,构建如ARIMAX-LSTM、CNN-LSTM-ATT等混合模型,以发挥不同模型优势,弥补单一LSTM模型缺陷,提升预测精度[7] - 引入滚动回测机制:采用滚动时间窗口回测机制,固定样本时间窗口并随时间推移实现模型的动态更新和持续预测,使模型能更好适应市场变化,提升其稳健性[7]
——量化学习笔记之一:基于堆叠LSTM模型的十年期国债收益率预测
光大证券· 2025-12-15 15:56
报告行业投资评级 未提及 报告的核心观点 报告系统梳理金融时间序列预测模型的演进,基于LSTM神经网络构建中国十年期国债收益率预测模型,初步探索其在固收量化领域的应用,模型预测本周十年期国债收益率呈下行趋势,后续可从多方面优化模型 [10][2][3] 根据相关目录分别进行总结 金融时序预测和神经网络模型 - 金融时间序列预测模型经历传统计量模型、传统机器学习模型、深度学习模型三个发展阶段,深度学习模型能适应金融时间序列复杂特征,RNN及其变种是主流方法之一 [11][12] - 神经网络模型模仿人脑神经元连接结构,是深度学习基础结构,LSTM为解决传统RNN长期依赖问题而设计,在债券收益率预测上有优势 [13][18][22] 基于堆叠LSTM模型的国债收益率预测 - 堆叠LSTM将多个LSTM层连接,在长序列处理和多维特征提取上更具优势,适配金融场景复杂时序预测 [23] - 采用三层堆叠LSTM+Dropout正则化架构构建十年期国债收益率预测模型,仅用收益率历史序列作单一变量,可输入更多变量提升效果 [24] - 数据标的为中债十年期国债到期收益率,对数据进行一阶差分和标准化处理,以过去60个交易日差分作输入特征,未来一周差分作预测目标构建样本,按时间顺序划分训练集、验证集、测试集 [27] - 模型架构由LSTM、Dropout和Dense层组成,迭代200轮,设早停机制优化,以MSE、MAE、RMSE评估模型 [28][29] - 构建含约13万个可调参数的模型,第27轮迭代出最优模型,第77轮触发早停机制,测试集平均绝对误差1.43BP,本周十年期国债收益率呈下行趋势 [30] 后续优化方向 - 对现有模型的时间窗口、数据处理、网络架构和训练策略等设计进行调整优化 [3] - 将输入变量从单一收益率序列扩展至宏观、市场、情绪等多维度变量 [3] - 将LSTM模型与传统计量模型或其他机器学习模型结合构建混合模型 [3] - 采用滚动时间窗口回测机制,实现模型动态更新和持续预测 [3]
量化学习笔记之一:基于堆叠LSTM模型的十年期国债收益率预测
光大证券· 2025-12-15 14:53
报告行业投资评级 未提及 报告的核心观点 - 对金融时间序列预测模型的演进进行系统梳理,基于LSTM神经网络,构建以历史时间序列为单一输入变量的中国十年期国债收益率预测模型,初步探索深度学习模型在固收量化领域的应用[10] 根据相关目录分别进行总结 金融时序预测和神经网络模型 - 金融时间序列预测经历传统计量模型、传统机器学习模型、深度学习模型三个阶段,深度学习模型能适应金融时间序列复杂特征,是主流预测方法之一[1][11][12] - 神经网络模型是深度学习的基础结构,RNN及其变种模型如LSTM是处理序列数据的网络,LSTM解决了传统RNN的长期依赖问题,能过滤噪声,增强对不规则数据的鲁棒性,适合债券收益率预测[1][12][18] 基于堆叠LSTM模型的国债收益率预测 - 堆叠LSTM是多个LSTM层连接形成的深度神经网络结构,在长序列处理、多维特征提取上更具优势,适配金融场景的复杂时序预测[23] - 采用三层堆叠LSTM+Dropout正则化架构构建十年期国债收益率预测模型,仅使用十年期国债收益率自身历史时间序列作为单一变量,后续可输入更多相关变量提升预测效果[2][24] - 数据标的为中债十年期国债到期收益率,样本时间区间为2021年初至2025年12月12日,对收益率数据进行一阶差分和标准化处理,以过去60个交易日的收益率一阶差分作为输入特征,以未来一周的收益率一阶差分作为预测目标构建时间序列样本,按时间顺序划分为训练集、验证集、测试集[27] - 模型架构由LSTM、Dropout和Dense层组成,训练策略为迭代200轮,以降低验证集损失为优化目标,设置早停机制,以最优模型针对测试集的第一天收益率预测结果的均方误差、平均绝对误差和均方根误差作为模型评估指标[28][29] - 最终构建出包含约13万个可调参数的中等复杂度LSTM神经网络模型,第27轮训练迭代出最优模型,第77轮触发早停机制,针对测试集预测的平均绝对误差为1.43BP,本周(2025年12月15日 - 2025年12月19日)10年期国债收益率呈现下行趋势,2025年12月19日的预测值为1.8330%,相比2025年12月12日的1.8396%有小幅下降[2][30] 后续优化方向 - 对现有模型的时间窗口、数据处理、网络架构和训练策略等相关设计进行调整优化[3][36] - 将输入变量从单一收益率序列扩展至宏观、市场、情绪等多维度变量,使模型预测更符合经济逻辑,捕捉信息更全面[3][36] - 将LSTM模型与传统计量模型或其他机器学习模型相结合,构建混合模型,发挥不同模型优势,提升预测精度[3][36] - 引入滚动回测机制,固定样本时间窗口并随时间推移实现模型的动态更新和持续预测,提升模型稳健性[3][36]