深度学习 - 财报，业绩电话会，研报，新闻

深度学习

搜索文档

机器学习因子选股月报（2025年8月）-20250730

西南证券· 2025-07-30 13:43

量化模型与构建方式 1. **模型名称：GAN_GRU模型** - **模型构建思路**：结合生成式对抗网络（GAN）和门控循环单元（GRU）的深度学习模型，用于挖掘量价时序特征并生成选股因子[4][13] - **模型具体构建过程**： 1. **数据输入**：使用18个量价特征（如收盘价、成交量、换手率等），采样形状为40*18（过去40天的特征）[17][18] 2. **GAN部分**： - 生成器（G）：采用LSTM结构，输入原始量价时序特征（40×18），输出生成的特征（40×18）[33][37] - 判别器（D）：采用CNN结构，通过卷积层处理二维量价时序特征，输出真假概率[33][35] - 损失函数： - 生成器损失：$$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$[24] - 判别器损失：$$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$[27] 3. **GRU部分**：两层GRU（128,128）提取时序特征，后接MLP（256,64,64）输出预测收益pRet作为因子[22] 4. **训练方式**：半年滚动训练，每半年更新模型参数，训练集与验证集比例80%:20%[18] - **模型评价**：通过对抗训练提升特征生成能力，保留时序特性，适配金融数据的高噪声和非线性特点[33][37] 2. **因子名称：GAN_GRU因子** - **因子构建思路**：利用GAN_GRU模型输出的预测收益pRet作为选股因子，经行业市值中性化+标准化处理[22][41] - **因子具体构建过程**： 1. 模型输出的pRet截面排序，取前10%股票构成多头组合[46] 2. 因子值计算：$$Factor_{GAN\_GRU} = pRet_{标准化} + 行业市值中性化残差$$[22] --- 模型的回测效果 1. **GAN_GRU模型** - IC均值：11.43% | ICIR：0.89 | 年化超额收益率：24.86%[41][42] - 年化收益率：38.52% | 最大回撤率：27.29% | 信息比率（IR）：1.62[42] 2. **GAN_GRU因子（行业表现）** - 当期IC最高行业：家用电器（27.00%）、非银金融（23.08%）[42] - 近一年IC均值最高行业：公用事业（14.43%）、商贸零售（13.33%）[42] - 多头组合超额收益：纺织服饰（5.19%）、公用事业（3.62%）[2][43] --- 量化因子与构建方式 1. **因子名称：GAN_GRU衍生行业因子** - **构建思路**：在申万一级行业内部分层测试GAN_GRU因子表现，生成行业特异性选股信号[42][43] - **具体构建过程**： 1. 按行业分组计算因子IC和多头组合超额收益[42] 2. 行业中性化处理：$$Factor_{行业} = Factor_{原始} - \beta_{行业} \times Industry_{哑变量}$$[22] --- 因子的回测效果 1. **GAN_GRU衍生行业因子** - 全A股多头组合年化超额收益：24.86% | 换手率：0.82[42] - 近一年IC均值：10.97% | 最新一期IC：9.27%[41][42] 2. **行业多头组合** - 近一年月均超额收益：家用电器（5.44%）、建筑材料（4.70%）[2][43] - 全行业跑赢基准比例：30个行业中21个跑赢（70%）[43] --- 其他关键点 - **数据预处理**：量价特征在时序上去极值+标准化，个股截面标准化[18] - **超参数**：batch_size=截面股票数，优化器Adam，学习率1e-4，损失函数IC[18] - **最新多头组合**：裕同科技、青山纸业等（2025年8月前十个股）[5][48]