根据研报内容,总结如下: 量化模型与构建方式 1. 模型名称:GAN_GRU模型[4][13] * 模型构建思路:该模型是一个深度学习选股模型,其核心思路是利用生成式对抗网络(GAN)对量价时序特征进行增强处理,然后再利用门控循环单元(GRU)网络对处理后的时序特征进行编码,以预测股票的未来收益[4][13]。 * 模型具体构建过程: * 基础特征:模型输入为18个量价特征,包括日频特征(如开盘价、收盘价、成交量等)和月频特征(如月涨跌幅、月换手率等)[17][19]。 * 特征预处理:每次采样的40天内,每个特征在时序上去极值并标准化;每个特征在个股层面上进行截面标准化[18]。 * GAN特征生成: * 生成器(G):采用LSTM模型,输入原始量价时序特征(形状为4018),输出经处理后的量价时序特征(形状仍为4018)[33][37]。其损失函数为: 其中,(z) 是随机噪声,(G(z)) 是生成的数据,(D(G(z))) 是判别器判断生成数据为真的概率[24]。 * 判别器(D):采用CNN模型,用于区分真实量价特征和生成器生成的特征。其损失函数为: 其中,(x) 是真实数据,(D(x)) 是判别器对真实数据的输出概率[27]。 * 训练过程:生成器和判别器交替训练,直至模型收敛[29][30]。 * GRU收益预测:将GAN中生成器输出的增强后特征,输入到一个两层GRU网络(GRU(128, 128))中,后面再接一个多层感知机MLP(MLP(256, 64, 64))。模型最终输出的预测收益(pRet)即作为选股因子[22]。 * 训练与预测设置: * 使用过去400天内的数据,每5个交易日采样一次,采样形状为40*18,用以预测未来20个交易日的累计收益[18]。 * 训练集与验证集比例为80%:20%[18]。 * 采用半年滚动训练,每年6月30日和12月31日进行模型训练,用于未来半年的预测[18]。 * 回测中,因子经过行业和市值中性化以及标准化处理[22]。 模型的回测效果 1. GAN_GRU模型,IC均值0.1136[41][42],ICIR(未年化)0.89[42],换手率0.83[42],年化收益率37.41%[42],年化波动率23.59%[42],信息比率(IR)1.59[42],最大回撤率27.29%[42],年化超额收益率22.58%[41][42] 量化因子与构建方式 1. 因子名称:GAN_GRU因子[4][13] * 因子构建思路:该因子是GAN_GRU模型输出的股票未来收益预测值,直接作为选股依据[4][13][22]。 * 因子具体构建过程:因子构建过程与上述GAN_GRU模型的构建过程完全一致,因子值即为模型的最终输出(pRet)[22]。 因子的回测效果 1. GAN_GRU因子,IC均值0.1136[41][42],近期IC值(2025年9月)0.1053[41][42],近一年IC均值0.0982[41][42]
机器学习因子选股月报(2025年10月)-20250930