Workflow
机器学习因子选股月报(2025年6月)-20250529
西南证券·2025-05-29 13:15

量化模型与构建方式 1. 模型名称:GAN_GRU模型 - 模型构建思路:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - 模型具体构建过程: 1. 数据输入:18个量价特征(如收盘价、成交量等),过去400天的数据,每5天采样一次,形成40×18的特征矩阵[13][14] 2. GAN部分: - 生成器(G):LSTM结构,输入噪声生成模拟量价特征,损失函数为: LG=EzPz(z)[log(D(G(z)))]L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))] - 判别器(D):CNN结构,区分真实与生成特征,损失函数为: LD=ExPdata(x)[log ⁣D(x)]EzPz(z)[log(1D(G(z)))]L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))] - 交替训练G和D直至收敛[20][23][26] 3. GRU部分:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[18] 4. 数据处理:时序去极值+标准化,截面标准化[14] - 模型评价:通过对抗训练提升特征生成质量,保留时序特性,适配金融数据的高噪声环境[29][33] --- 量化因子与构建方式 1. 因子名称:GAN_GRU因子 - 因子构建思路:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37] - 因子具体构建过程: 1. 模型每半年滚动训练(6月30日/12月31日),预测未来半年收益[14] 2. 剔除ST股及上市不足半年的股票,保留有效样本[14] 3. 因子值=模型输出的pRet,截面排序后取前10%作为多头组合[37][44] --- 模型的回测效果 1. GAN_GRU模型: - IC均值:11.57%(全A股,2019/01-2025/05)[37] - ICIR:0.89[38] - 年化超额收益率:25.01%[37] - 信息比率(IR):1.66[38] - 最大回撤:27.29%[38] --- 因子的回测效果 1. GAN_GRU因子: - 近期IC(2025/05):-0.28%,近一年IC均值11.54%[37][38] - 行业表现: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39] - 近一年IC均值前五行业:建筑装饰(18.54%)、公用事业(18.14%)[39] - 多头组合超额收益: - 当期最高行业:商贸零售(8.22%)、国防军工(7.15%)[42] - 近一年月均最高行业:石油石化(5.60%)、建筑材料(5.29%)[42] --- 多头组合示例(2025/05) - 前十个股:顺威股份(家用电器)、博深股份(机械设备)、九典制药(医药生物)等[44][48] - 行业排名第一个股:如顺威股份(家用电器)、盛剑科技(环保)等[44]