量化模型与构建方式 1. 模型名称:GAN_GRU模型[4][13] * 模型构建思路:这是一个结合了生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习选股模型。首先利用GAN模型对量价时序特征进行增强和预处理,以挖掘更有效的特征表示;然后将处理后的特征输入GRU模型进行时序编码,最终预测股票未来收益并形成因子[4][13]。 * 模型具体构建过程: 1. 数据准备:选取所有个股过去400个交易日内的18个量价特征(包括收盘价、开盘价、成交量、换手率等日频和月频特征)[14][17][19]。每5个交易日进行一次特征采样,采样形状为(40, 18),即使用过去40天的特征来预测未来20个交易日的累计收益[18]。训练集与验证集比例为80%:20%[18]。 2. 数据处理:对每次采样的40天内的每个特征,在时序上进行去极值和标准化处理;同时,每个特征在个股截面上也进行标准化处理[18]。 3. GAN特征生成:构建一个GAN模型用于处理原始量价时序特征。生成器(G)采用LSTM模型,以保留输入特征的时序性;判别器(D)采用CNN模型,将量价时序特征视为二维“图片”进行识别[33]。GAN的训练过程是生成器和判别器的交替对抗训练[29]。 * 生成器的损失函数为: 其中,(z) 表示随机噪声,(G(z)) 表示生成器生成的数据,(D(G(z))) 表示判别器判断生成数据为真实数据的概率[24][25]。 * 判别器的损失函数为: 其中,(x) 是真实数据,(D(x)) 是判别器对真实数据的输出概率[27]。 4. GRU时序编码:将经过GAN生成器处理后的特征(形状仍为(40, 18))[37],输入到一个两层GRU网络(GRU(128, 128))中进行时序特征编码[22]。 5. 收益预测:在GRU层后接入一个多层感知机(MLP(256, 64, 64)),将模型最终输出的预测收益(pRet)作为选股因子[22]。 6. 模型训练与更新:采用半年滚动训练方式,每年6月30日和12月31日各训练一次模型,用于未来半年的预测[18]。训练时使用Adam优化器,学习率为1e-4,损失函数为IC,并设置早停机制[18]。 7. 因子处理:在测试和使用因子前,会对因子进行行业和市值中性化处理,并进行标准化[22]。 量化因子与构建方式 1. 因子名称:GAN_GRU因子[4][13] * 因子构建思路:该因子是GAN_GRU模型的直接输出。具体而言,是利用GAN模型增强后的量价时序特征,通过GRU模型编码后,由MLP层预测出的股票未来20个交易日的累计收益,将此预测值作为选股因子[4][13][18][22]。 * 因子具体构建过程: 1. 按照上述GAN_GRU模型流程,输入个股过去40个交易日的18个量价特征[18]。 2. 模型经过GAN特征生成、GRU时序编码和MLP预测后,输出一个标量值,即该股票未来20个交易日的预测累计收益(pRet)[22]。 3. 对所有股票计算该预测值,即得到截面上的GAN_GRU因子值[22]。 4. 在回测和分析前,对原始因子值进行行业和市值中性化处理,并进行标准化[22]。 模型的回测效果 1. GAN_GRU模型(因子)全市场表现(月频调仓,2019年2月至2026年2月)[41][42] * IC均值:0.1096*** * ICIR(未年化):0.87 * 年化收益率:38.13% * 年化波动率:23.18% * 信息比率(IR):1.64 * 最大回撤率:27.29% * 年化超额收益率:22.32% * 换手率:0.82X * 近期IC(2026年2月):-0.0105*** * 近一年IC均值:0.0517*** 因子的回测效果 1. GAN_GRU因子行业IC表现(截至2026年2月)[4][42] * 2月当期IC排名前五的行业(除综合)及IC值: * 电力及公用事业:0.1257*** * 商贸零售:0.1196*** * 房地产:0.1151*** * 建筑:0.1130*** * 基础化工:0.1063*** * 近一年IC均值排名前五的行业(除综合)及IC均值: * 钢铁:0.1404*** * 计算机:0.1175*** * 传媒:0.1132*** * 商贸零售:0.1014*** * 食品饮料:0.0989*** 2. GAN_GRU因子行业多头组合表现(截至2026年2月25日)[2][45][46] * 2月当期多头组合超额收益前五的行业(除综合)及超额收益: * 石油石化:7.91% * 通信:3.11% * 电子:3.06% * 有色金属:2.78% * 计算机:2.78% * 近一年月平均超额收益前五的行业(除综合)及超额收益: * 房地产:3.83% * 商贸零售:2.04% * 汽车:1.93% * 建筑:1.50% * 消费者服务:1.49%
机器学习因子选股月报(2026年3月)
西南证券·2026-02-26 15:09