量化模型与构建方式 1. 模型名称:GAN_GRU模型 - 模型构建思路:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,用于挖掘量价时序特征并生成选股因子[4][13] - 模型具体构建过程: 1. 数据输入:使用18个量价特征(如收盘价、成交量、换手率等),采样形状为40*18(过去40天的特征)[17][18] 2. GAN部分: - 生成器(G):采用LSTM结构,输入原始量价时序特征(40×18),输出生成的特征(40×18)[33][37] - 判别器(D):采用CNN结构,通过卷积层处理二维量价时序特征,输出真假概率[33][35] - 损失函数: - 生成器损失:[24] - 判别器损失:[27] 3. GRU部分:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[22] 4. 训练方式:半年滚动训练,每半年更新模型参数,训练集与验证集比例80%:20%[18] - 模型评价:通过对抗训练提升特征生成能力,保留时序特性,适配金融数据的高噪声和非线性特点[33][37] 2. 因子名称:GAN_GRU因子 - 因子构建思路:利用GAN_GRU模型输出的预测收益pRet作为选股因子,经行业市值中性化+标准化处理[22][41] - 因子具体构建过程: 1. 模型输出的pRet截面排序,取前10%股票构成多头组合[46] 2. 因子值计算:[22] --- 模型的回测效果 1. GAN_GRU模型 - IC均值:11.43% | ICIR:0.89 | 年化超额收益率:24.86%[41][42] - 年化收益率:38.52% | 最大回撤率:27.29% | 信息比率(IR):1.62[42] 2. GAN_GRU因子(行业表现) - 当期IC最高行业:家用电器(27.00%)、非银金融(23.08%)[42] - 近一年IC均值最高行业:公用事业(14.43%)、商贸零售(13.33%)[42] - 多头组合超额收益:纺织服饰(5.19%)、公用事业(3.62%)[2][43] --- 量化因子与构建方式 1. 因子名称:GAN_GRU衍生行业因子 - 构建思路:在申万一级行业内部分层测试GAN_GRU因子表现,生成行业特异性选股信号[42][43] - 具体构建过程: 1. 按行业分组计算因子IC和多头组合超额收益[42] 2. 行业中性化处理:[22] --- 因子的回测效果 1. GAN_GRU衍生行业因子 - 全A股多头组合年化超额收益:24.86% | 换手率:0.82[42] - 近一年IC均值:10.97% | 最新一期IC:9.27%[41][42] 2. 行业多头组合 - 近一年月均超额收益:家用电器(5.44%)、建筑材料(4.70%)[2][43] - 全行业跑赢基准比例:30个行业中21个跑赢(70%)[43] --- 其他关键点 - 数据预处理:量价特征在时序上去极值+标准化,个股截面标准化[18] - 超参数:batch_size=截面股票数,优化器Adam,学习率1e-4,损失函数IC[18] - 最新多头组合:裕同科技、青山纸业等(2025年8月前十个股)[5][48]
机器学习因子选股月报(2025年8月)-20250730
西南证券·2025-07-30 13:43