LSTM模型
搜索文档
国债期货跨期价差系列专题五:基于LSTM的时序预测与策略改进研究
广发期货· 2025-12-31 16:35
报告行业投资评级 未提及 报告的核心观点 - 引入LSTM时序模型改进国债期货跨期价差预测问题,考察时间依赖信息对预测及策略表现的边际贡献 [38] - 部分品种引入时序建模可改善收益稳定性与风险控制,但不同合约对时序信息敏感程度有差异 [38] - LSTM模型在T与TF合约上样本外表现优于DNN,TS合约上DNN预测能力强,TL合约两类模型表现有限 [39] - 概率加权方案在T、TF与TS合约多数情况下可提升策略收益风险特征,TL合约效果不明显 [39] - 跨期价差预测与交易中,引入时序模型结合连续概率信号仓位管理有应用潜力,但效果依赖品种特性等因素 [40] 根据相关目录分别进行总结 跨期价差影响因素与指标选取 - 传统机器学习模型与DNN建模假设样本时间维度独立,核心是对“当前状态”的静态映射,引入时间信息依赖特征工程设计,且无法区分不同历史路径差异,表达能力受限 [7] - LSTM引入记忆单元传递信息,解耦“长期信息存储”与“当前状态输出”,通过门控结构控制信息流,能兼顾短期波动与中长期演化特征 [7][8][10] - 国债期货跨期价差部分阶段有持续性与方向性特征,引入LSTM等时序模型可增强对跨期价差时序结构的刻画能力 [12] 循环神经网络测试流程 数据处理与样本构造流程 - 数据获取使用国债期货T、TF、TS、TL四类合约基本面因子 [16] - 特征构造引入资金面指标、构造派生利差变量,标签以跨期价差一阶差分划分样本类别,二分类仅保留涨跌样本 [17] - 特征预处理剔除上市初期样本、去除季月末交易日、过滤极小价差变动,填充缺失值并标准化 [18] - 以5个交易日为历史窗口构造时序样本,过滤末端标签为中性的样本 [19] - 按时间切分样本,2024年及以前为训练候选样本,2025年为样本外测试集,训练候选样本7:3划分为训练集与交叉验证集 [20] - 模型训练采用加权交叉熵损失函数和Adam优化器,基于验证集损失设置学习率衰减与早停机制 [22] - 用2025年数据进行样本外测试,通过准确率等评估方向预测能力,保留概率分布结果用于仓位回测 [23] 参数设定与LSTM网络结构 - 任务为二分类预测,输入连续5日因子序列,输出二分类logits [24] - LSTM层3层,隐藏状态维度8,Dropout比例0.3,仅用最后时间步隐藏状态表示序列,分类层用Dropout + Linear映射至2维分类空间 [25] - 损失函数为加权交叉熵,基于训练集样本比例自动计算类别权重以缓解样本分布不均衡问题 [26] - 优化器为Adam,初始学习率0.001并进行学习率衰减 [27] 模型测试结果 LSTM模型与DNN模型样本外测试对比 - T与TF合约上,LSTM模型概率加权回测累积收益和夏普比率更高,最大回撤更低;TS合约上DNN表现更优;TL合约两类模型表现有限 [28] - 不同合约对时序信息敏感程度不同,LSTM未在所有品种形成全面优势 [30] LSTM模型概率加权回测 - 用模型输出预测概率刻画信号强弱,以概率减0.5为仓位信号,对仓位归一化并设置最大仓位限制 [33] - 概率加权机制在多数合约上改善样本外绩效,提升收益与夏普比率,未显著放大回撤水平;TL合约表现提升有限 [35] 结论 - 引入LSTM时序模型改进跨期价差预测,部分品种引入时序建模有改善,但不同合约对时序信息敏感程度不同 [38] - LSTM在T与TF合约表现优,TS合约DNN强,TL合约两类模型表现有限;概率加权在T、TF、TS合约多数情况提升策略收益风险特征,TL合约效果不明显 [39] - 跨期价差预测与交易中引入时序模型结合概率信号仓位管理有应用潜力,效果依赖品种特性等因素 [40]
AI赋能资产配置(二十九):AI预测股价指南:以TrendIQ为例
国信证券· 2025-12-03 19:12
核心观点 - 报告以TrendIQ开源平台为例,探讨了AI大模型在股价预测领域的应用,展示了从传统LSTM模型到结合Transformer等新架构的迭代过程,并详细解析了本地部署与线上平台两种实现路径,旨在为投资者呈现AI技术在股价预测上的能力圈与未来进化方向[3][4] 一、深度学习与LLM在股价预测中的迭代演绎 - 过往学界与工业界倾向于使用LSTM作为股价预测的基础模型,因其能处理非线性问题并适应时间序列特性[5] - LSTM模型存在局限性:模态单一性,难以理解文本新闻等非结构化信息;解释性相对弱,被视为“黑盒”模型;泛化鲁棒性弱,难以跨市场或跨行业迁移[6][7] - Transformer架构为金融时序预测提供了新出路,其优势在于全局上下文感知、零样本与少样本学习能力以及思维链推理,能提供更好的可解释性[8][10] 二、“AI股价预言家”如何炼成:本地化部署与代码解读 - TrendIQ项目的运行框架由四个Python程序文件构成,形成“离线训练+诊断+在线服务”的闭环[12] - **训练阶段** (`train_multiple.py` 和 `quick_train.py`):使用`yfinance`收集历史股票数据,预处理后训练LSTM模型并保存,是链条的起点[12][14] - `quick_train.py`预设了五只热门股票(AAPL、GOOGL、MSFT、TSLA、AMZN)进行快速训练,耗时约10-15分钟[14][16] - `train_multiple.py`支持批量训练,列表扩展至十只股票(包括META、NVDA等),并允许用户自定义股票列表和日期范围[17] - **检查阶段** (`check_models.py`):验证训练生成的文件(CSV、.npy、.joblib、.h5)是否存在及完整,充当质量把关者[18][19] - **运行阶段** (`app.py`):基于Flask框架启动Web应用,用户输入股票代码后,加载预训练模型进行预测,并显示预测价格、图表和置信度[13][20] 三、轻量化VS易用性:本地部署与线上平台如何选择 - **本地部署TrendIQ**适合跟踪特定个股、注重安全性和速度的投资者,流程分为四步[21] 1. **软件包下载**:从GitHub获取开源数据包[21] 2. **安装依赖**:通过pip一次性安装Flask、TensorFlow、NumPy、Pandas、Scikit-learn、YFinance、Joblib等库[23] 3. **股票数据训练**:运行`python quick_train.py`为五只热门股票训练LSTM模型,耗时约10-15分钟[24] 4. **本地运行**:运行`python app.py`启动服务器,用户可通过浏览器访问`http://127.0.0.1:5000`进行预测[28] - **线上平台TrendIQ**适合追求易用性、对预测精度要求相对较低的投资者[32] 1. 通过Google账号或邮箱登录网页版[32] 2. 在Swing Trading(针对60分钟线及以上趋势)或Scalp Trading(针对五分钟及以内趋势)界面,上传K线截图进行预测[33][34] 3. 预测结果包括:多空趋势研判、具体的止盈止损位置以及AI给出的判断理由[36] - **本地版与线上版对比**:两者在数据输入、模型、预测功能和实际效果上存在差异[41] - **数据输入**:本地版使用股价序列(高、低、开、收、成交量);线上版使用不同级别的蜡烛图[41] - **模型**:本地版为LSTM;线上版为LSTM+LLM或LSTM+VAE[41] - **预测功能**:本地版提供目标价和置信区间;线上版提供多空建议、止盈止损线及判断理由[41] - **实际效果**:本地版对走势标准化程度高、成交量大的海外大票预测效果更好;线上版在多头排列上涨环境的主升阶段判定相对准确,但在震荡市胜率一般,且对顶部提示和大幅回撤后的“抄底”判断能力有限[41] 四、总结展望:“AI预言家”成色几何?未来如何再进化? - 模型结构持续迭代,Transformer架构与图神经网络正逐步取代LSTM,成为股价预测领域新的技术基准[39] - 未来进化方向在于多模态融合与“阅读市场”的能力,例如Time-VLM等框架尝试结合视觉Transformer分析K线图、LLM理解财经新闻以及数值模型分析价格序列[40] - 实时检索增强生成技术将赋能AI预言家,通过实时连接外部知识库获取最新动态,缓解市场非平稳性导致的模型过时问题[40]
J.P. Morgan机器学习卓越中心高管亲述,华尔街AI实战心法
机器之心· 2025-09-04 15:04
人工智能在金融行业的应用现状 - 人工智能和机器学习正成为金融行业的重要推动力 应用场景从量化交易扩展到风险管理[1] - 算法模型从学术研究走向华尔街实际应用时暴露出一系列现实挑战[1] 金融AI实践中的核心问题 - 金融机构更关注支持"What-if"分析的决策工具 而非单纯预测模型 例如利率变动影响分析[5] - 金融数据中存在相关性不等于因果关系的统计误区 需避免对撞机问题等建模陷阱[5] - 金融数据结构复杂 包括收益率曲线(函数时间序列) 支付网络(动态图)和多频率宏观数据[5] - 传统LSTM模型在处理复杂金融数据结构时存在先天不足[5] 技术实施与人才挑战 - Jupyter Notebook在快速迭代环境中可能成为工程管理障碍[5] - TensorFlow与PyTorch的兼容性问题增加了可复用组件建设的难度[5] - 行业急需兼顾金融 机器学习与系统工程的复合型人才[5] JPMorgan的AI实践与招聘 - MLCOE团队构建可复用AI组件库 分享五年实践经验与教训[2][11] - 全球招聘涵盖博士 博士后和金融科技求职者 工作地点可选香港 伦敦或纽约[11] - TSRL团队正在开展前沿项目 招聘链接已公开[12] - 王泽基教授将系统解析AI/ML在金融机构的全流程应用 包括模型工程 数据处理 特征构建 决策分析 因果推断和风险管理[10] 嘉宾背景 - 王泽基现任JPMorgan机器学习卓越中心MD兼全球TSRL负责人 香港科技大学数学系实践教授[12] - 曾任平安资管量化投资负责人 法国兴业银行亚洲金融机构与主权业务主管[12] - 在香港中文大学 香港中文大学(深圳)担任金融科技教授 并在高盛 瑞银 巴克莱资本担任过高管职务[12]