量化模型与构建方式 1. 模型名称:多模态多尺度股价预测模型 - 模型构建思路:基于AI看图初始版本模型,结合多模态(图表数据与时序数据)和多尺度(不同频率的价量数据)特征,采用深度学习方法进行改进,提升股价预测能力[14][17][18] - 模型具体构建过程: 1. 多模态特征提取:结合卷积模型和时序模型,分别处理价量数据图表和时序数据,融合两种模态的特征[17] 2. 多尺度特征提取:引入1分钟频、日频、周频三种频率的价量数据,构建55组高频因子特征,并通过时序模型提取多日特征[18] 3. 轻量化设计:对每个子模型的参数量进行大幅度压缩,卷积模块的特征维度仅为初始模型的1/4,降低过拟合风险并提升计算效率[18] 4. 多头输出:模型输出包括未来股价的绝对收益和涨跌分类,分别采用均方误差和交叉熵作为损失函数,进行端到端训练[19] 5. 训练与验证:训练样本为2008-2016年数据,验证样本为2017-2019年数据,回测样本为2020-2024年数据[23][117] - 模型评价:通过多模态、多尺度特征提取和轻量化设计,显著提升了模型的预测能力和计算效率[14][18][19] --- 模型的回测效果 1. 多模态多尺度股价预测模型 - RankIC均值: - 全市场:8.7% - 沪深300:7.9% - 中证500:6.6% - 中证800:6.9% - 中证1000:8.2% - 国证2000:8.7% - 创业板:10.4%[21][116] - RankIC胜率: - 全市场:86.7% - 沪深300:69.0% - 中证500:73.5% - 中证800:75.2% - 中证1000:84.8% - 国证2000:86.1% - 创业板:89.2%[21][116] - 超额年化收益率: - 全市场:12.97% - 沪深300:9.17% - 中证500:5.30% - 中证800:8.38% - 中证1000:7.47% - 国证2000:7.47% - 创业板:11.52%[21][117] --- 量化因子与构建方式 1. 因子名称:多模态多尺度因子 - 因子构建思路:基于多模态(图表数据与时序数据)和多尺度(不同频率价量数据)特征提取,结合深度学习模型的预测结果生成因子[14][17][18] - 因子具体构建过程: 1. 高频因子:从1分钟频价量数据中提取55组特征,构建日度因子[18] 2. 时序因子:基于日频和周频数据,利用时序模型提取历史走势特征[18] 3. 卷积因子:基于标准化价量数据图表,利用卷积模型提取形态走势特征[17] 4. 因子融合:将时序因子和卷积因子进行特征融合,生成最终因子[17][18] - 因子评价:与Barra风格因子的相关性较低,具有较强的独立性,相关性最高的三个因子为流动性因子(-18%)、波动率因子(-16%)和市值因子(-8%)[22][23] --- 因子的回测效果 1. 多模态多尺度因子 - RankIC均值: - 全市场:8.7% - 沪深300:7.9% - 中证500:6.6% - 中证800:6.9% - 中证1000:8.2% - 国证2000:8.7% - 创业板:10.4%[21][116] - RankIC胜率: - 全市场:86.7% - 沪深300:69.0% - 中证500:73.5% - 中证800:75.2% - 中证1000:84.8% - 国证2000:86.1% - 创业板:89.2%[21][116] - 超额年化收益率: - 全市场:12.97% - 沪深300:9.17% - 中证500:5.30% - 中证800:8.38% - 中证1000:7.47% - 国证2000:7.47% - 创业板:11.52%[21][117]
深度学习研究报告:股价预测之多模态多尺度
广发证券·2024-11-18 17:19