量化模型与构建方式 1. 模型名称:民生金工深度学习股票收益预测模型 - 模型构建思路:基于民生金工历史研究框架,结合日频和分钟频输入数据,通过深度学习预测股票收益,并利用滚动阈值生成交易信号[1][10]。 - 模型具体构建过程: 1. 输入端: - 日频特征:51个技术面/情绪面日频特征 + 7个日频基础量价指标 + 10个强化风格因子(通过PPO强化学习生成)[12][22]。 - 分钟频特征:52个分钟频特征(合成至日频)[22]。 2. 基分类器: - 使用2个GRU分别对日频和分钟频特征解码[22]。 3. 市场信息嵌入: - 指数量价数据 + 强化风格偏好生成权重嵌入[22]。 4. 损失函数: - 多期股票收益作为预测目标,多期MSE均值作为损失函数: 其中,( y_i )为实际收益,( \hat{y}i )为预测收益[22][26]。 5. 信号生成: - 预测值滚动阈值:过去一年预测值的70%分位数作为买入信号,30%分位数作为卖出信号,至少持有10个交易日[30]。 - 模型评价:模型信号分布集中于0轴附近,右偏且尾部极窄,适合波段择时[27][29]。 2. 模型名称:SimStock股票相似度模型 - 模型构建思路:通过自监督学习预测股票相似度,结合静态(行业/风格)和动态(量价规律)相关性,生成股票属性向量[47][52]。 - 模型具体构建过程: 1. 输入数据: - 个股过去40日量价数据 + Barra风格因子 + 资金流指标(形状为( N \times 40 \times 20 ))[52]。 2. 样本构建: - 正样本:( X{\text{正}} = 0.75X + 0.25X_{\text{随机}} ) - 负样本:随机抽取不相关特征[52]。 3. 训练目标: - 最大化正样本相似度,最小化负样本相似度,使用余弦相似度衡量: 其中,( \mathbf{v}_i )为股票属性向量[52][53]。 4. 输出:个股属性向量用于初始化GRU隐状态,提升收益预测稳定性[57][59]。 - 模型评价:相似度预测更关注行业而非市值,动态性更强[56]。 3. 复合模型:改进后的收益预测模型 - 构建思路:将SimStock输出的股票属性向量初始化GRU隐状态,结合原有日频和分钟频输入[57][59]。 - 评价:改进后模型显著提升预测稳定性,尤其在高波行业中效果突出[60][64]。 --- 模型的回测效果 1. 民生金工深度学习模型: - 全A股平均年化收益:27%,累积超额收益77%(2019-2025)[33]。 - 沪深300成分股:年化收益17.2%,夏普比率1.24,最大回撤8%[38][41]。 - 中证500成分股:年化收益18.8%,夏普比率1.58,最大回撤10.3%[41][43]。 - 中证1000成分股:年化收益18.1%,夏普比率1.24,最大回撤21.3%[43][46]。 2. 改进后模型(加入SimStock): - 全A股平均年化收益:30%,累积超额收益109%[60]。 - 沪深300成分股:年化收益20.7%,夏普比率1.88,最大回撤8.5%[64][67]。 - 中证500成分股:年化收益23.4%,夏普比率1.97,最大回撤10.8%[68][71]。 - 中证1000成分股:年化收益22.5%,夏普比率1.56,最大回撤20.5%[71][73]。 3. 指数择时效果: - 沪深300:年化收益5.1%,超额收益5.6%[79]。 - 中证500:年化收益12.4%,超额收益12.2%[82]。 - 中证1000:年化收益15.1%,超额收益14.9%[84]。 - 电力设备及新能源行业:年化收益36%,超额收益31.1%[101][103]。 --- 量化因子与构建方式 1. 因子名称:分钟频因子 - 构建思路:从日内分钟级数据中提取量价相关性、波动率、动量等特征[109]。 - 具体因子示例: - 分钟收益率与成交量相关系数 - 尾盘半小时动量 - 下行波动率占比 - 开盘成交占比[109]。 --- 因子的回测效果 1. 择时因子RankIC:周度平均RankIC 4.5%,双周调仓多头年化收益23.2%(费后)[36]。 2. 改进后因子RankIC:周度平均RankIC 4.2%,年化收益21.7%[74][75]。
DeepTiming:日内信息与相似度学习驱动择时
民生证券·2025-07-31 17:02