量化模型与构建方式 1. 模型名称:GAN_GRU模型 - 模型构建思路:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - 模型具体构建过程: 1. 数据输入:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14] 2. GAN部分: - 生成器(LSTM):输入原始量价特征(40,18),输出生成的特征(40,18)[29][32] - 判别器(CNN):处理二维时序特征,损失函数为: 生成器损失函数为: [20][23] 3. GRU部分:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18] 4. 训练细节:半年度滚动训练,Adam优化器,学习率1e-4,损失函数为IC[14] - 模型评价:通过对抗训练提升特征生成能力,保留时序性质的同时增强特征逼真度[26][29] --- 模型的回测效果 1. GAN_GRU模型 - IC均值:11.54%(全A股,2019-2025)[36] - ICIR:0.89[37] - 年化超额收益率:24.95%[37] - 信息比率(IR):1.56[37] - 最大回撤:27.29%[37] - 最新一期IC:8.34%(2025年6月)[36] - 行业表现:建筑装饰、公用事业等行业IC均值最高(19.68%、17.15%)[37][39] --- 量化因子与构建方式 1. 因子名称:GAN_GRU因子 - 因子构建思路:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][36] - 因子具体构建过程: 1. 模型输出预测收益pRet 2. 截面标准化+行业市值中性化处理[18] - 因子评价:在全A股范围内表现稳定,行业适应性较强[36][40] --- 因子的回测效果 1. GAN_GRU因子 - 多头组合超额收益: - 家用电器行业最高(7.27%单月,5.90%近一年)[40][41] - 全行业近一年均跑赢基准[40] - 行业IC排名:建筑装饰(26.10%单月)、基础化工(25.43%)[37][39] - 换手率:0.83[37] --- 多头组合示例(2025年6月) - 前十个股:凤凰传媒、川投能源、海尔智家等[42][44] - 行业排名第一个股:中国电建(建筑装饰)、宝信软件(计算机)等[42]
机器学习因子选股月报(2025年7月)-20250630