Workflow
机器学习因子选股月报(2025年6月)
西南证券·2025-05-29 14:10

量化模型与构建方式 1. 模型名称:GAN_GRU模型 - 模型构建思路:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10]。 - 模型具体构建过程: 1. 数据输入:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14]。 2. 预处理:时序去极值+标准化,截面标准化[14]。 3. GAN部分: - 生成器(G):LSTM结构,输入噪声生成逼真量价特征,损失函数为: LG=EzPz(z)[log(D(G(z)))]L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))] - 判别器(D):CNN结构,区分真实与生成特征,损失函数为: LD=ExPdata(x)[log ⁣D(x)]EzPz(z)[log(1D(G(z)))]L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))] - 交替训练G和D直至收敛[20][21][23][26]。 4. GRU部分:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18]。 - 模型评价:有效捕捉量价时序特征的非线性关系,生成因子具有较高区分度[9][18]。 --- 量化因子与构建方式 1. 因子名称:GAN_GRU因子 - 因子构建思路:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37]。 - 因子具体构建过程: 1. 模型训练:半年滚动训练(每年6月30日、12月31日更新),预测未来20日收益[14]。 2. 因子生成:对全A股(剔除ST及上市不足半年股票)输出pRet,中性化处理[14][18]。 --- 模型的回测效果 1. GAN_GRU模型: - IC均值:11.57% | ICIR:0.89 | 年化超额收益率:25.01% - 年化波动率:24.02% | IR:1.66 | 最大回撤:27.29%[37][38]。 --- 因子的回测效果 1. GAN_GRU因子: - 全A表现: - 近一年IC均值:11.54% | 最新一期IC:-0.28%[37][38]。 - 行业表现: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39]。 - 近一年超额收益前五行业:石油石化(5.60%)、建筑材料(5.29%)、家用电器(5.06%)[42]。 - 多头组合: - 当期超额收益最高行业:商贸零售(8.22%)、国防军工(7.15%)[42]。 - 最新前十个股:顺威股份、博深股份、九典制药等[44][48]。