Workflow
GRU因子
icon
搜索文档
机器学习因子选股月报(2025年7月)-20250630
西南证券· 2025-06-30 12:35
量化模型与构建方式 1. **模型名称:GAN_GRU模型** - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14] 2. **GAN部分**: - 生成器(LSTM):输入原始量价特征(40,18),输出生成的特征(40,18)[29][32] - 判别器(CNN):处理二维时序特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 生成器损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$[20][23] 3. **GRU部分**:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18] 4. **训练细节**:半年度滚动训练,Adam优化器,学习率1e-4,损失函数为IC[14] - **模型评价**:通过对抗训练提升特征生成能力,保留时序性质的同时增强特征逼真度[26][29] --- 模型的回测效果 1. **GAN_GRU模型** - **IC均值**:11.54%(全A股,2019-2025)[36] - **ICIR**:0.89[37] - **年化超额收益率**:24.95%[37] - **信息比率(IR)**:1.56[37] - **最大回撤**:27.29%[37] - **最新一期IC**:8.34%(2025年6月)[36] - **行业表现**:建筑装饰、公用事业等行业IC均值最高(19.68%、17.15%)[37][39] --- 量化因子与构建方式 1. **因子名称:GAN_GRU因子** - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][36] - **因子具体构建过程**: 1. 模型输出预测收益pRet 2. 截面标准化+行业市值中性化处理[18] - **因子评价**:在全A股范围内表现稳定,行业适应性较强[36][40] --- 因子的回测效果 1. **GAN_GRU因子** - **多头组合超额收益**: - 家用电器行业最高(7.27%单月,5.90%近一年)[40][41] - 全行业近一年均跑赢基准[40] - **行业IC排名**:建筑装饰(26.10%单月)、基础化工(25.43%)[37][39] - **换手率**:0.83[37] --- 多头组合示例(2025年6月) - **前十个股**:凤凰传媒、川投能源、海尔智家等[42][44] - **行业排名第一个股**:中国电建(建筑装饰)、宝信软件(计算机)等[42]
中邮因子周报:低估值风格显著,小市值占优-20250609
中邮证券· 2025-06-09 16:49
证券研究报告:金融工程报告 发布时间:2025-06-09 研究所 研究所 分析师:肖承志 SAC 登记编号:S1340524090001 Email:xiaochengzhi@cnpsec.com 研究助理:金晓杰 SAC 登记编号:S1340124100010 E研ma究il所:jinxiaojie@cnpsec.com 近期研究报告 近期研究报告 《结合基本面和量价特征的 GRU 模型》 - 2025.06.05 《DeepSeek-R1 完成小版本更新,阿里 开源自主搜索 AI 智能体——AI 动态汇 总 20250602》 - 2025.06.03 《Claude 4 系列发布,谷歌上线编程智 能体 Jules——AI 动态汇总 20250526》 - 2025.05.27 《谷歌发布智能体白皮书,Manus 全面 开放注册——AI 动态汇总 20250519》 - 2025.05.20 《证监会修改《重组办法》,深化并购重 组改革——微盘股指数周报 20250518》 - 2025.05.19 《通义千问发布Qwen-3模型,DeepSeek 发布数理证明大模型——AI 动态汇总 20250505 ...
机器学习因子选股月报(2025年6月)
西南证券· 2025-05-29 14:10
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10]。 - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14]。 2. **预处理**:时序去极值+标准化,截面标准化[14]。 3. **GAN部分**: - 生成器(G):LSTM结构,输入噪声生成逼真量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - 判别器(D):CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][21][23][26]。 4. **GRU部分**:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18]。 - **模型评价**:有效捕捉量价时序特征的非线性关系,生成因子具有较高区分度[9][18]。 --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37]。 - **因子具体构建过程**: 1. 模型训练:半年滚动训练(每年6月30日、12月31日更新),预测未来20日收益[14]。 2. 因子生成:对全A股(剔除ST及上市不足半年股票)输出pRet,中性化处理[14][18]。 --- 模型的回测效果 1. **GAN_GRU模型**: - IC均值:11.57% | ICIR:0.89 | 年化超额收益率:25.01% - 年化波动率:24.02% | IR:1.66 | 最大回撤:27.29%[37][38]。 --- 因子的回测效果 1. **GAN_GRU因子**: - **全A表现**: - 近一年IC均值:11.54% | 最新一期IC:-0.28%[37][38]。 - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39]。 - 近一年超额收益前五行业:石油石化(5.60%)、建筑材料(5.29%)、家用电器(5.06%)[42]。 - **多头组合**: - 当期超额收益最高行业:商贸零售(8.22%)、国防军工(7.15%)[42]。 - 最新前十个股:顺威股份、博深股份、九典制药等[44][48]。
机器学习因子选股月报(2025年6月)-20250529
西南证券· 2025-05-29 13:15
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),过去400天的数据,每5天采样一次,形成40×18的特征矩阵[13][14] 2. **GAN部分**: - **生成器(G)**:LSTM结构,输入噪声生成模拟量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - **判别器(D)**:CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][23][26] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[18] 4. **数据处理**:时序去极值+标准化,截面标准化[14] - **模型评价**:通过对抗训练提升特征生成质量,保留时序特性,适配金融数据的高噪声环境[29][33] --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37] - **因子具体构建过程**: 1. 模型每半年滚动训练(6月30日/12月31日),预测未来半年收益[14] 2. 剔除ST股及上市不足半年的股票,保留有效样本[14] 3. 因子值=模型输出的pRet,截面排序后取前10%作为多头组合[37][44] --- 模型的回测效果 1. **GAN_GRU模型**: - **IC均值**:11.57%(全A股,2019/01-2025/05)[37] - **ICIR**:0.89[38] - **年化超额收益率**:25.01%[37] - **信息比率(IR)**:1.66[38] - **最大回撤**:27.29%[38] --- 因子的回测效果 1. **GAN_GRU因子**: - **近期IC(2025/05)**:-0.28%,近一年IC均值11.54%[37][38] - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39] - 近一年IC均值前五行业:建筑装饰(18.54%)、公用事业(18.14%)[39] - **多头组合超额收益**: - 当期最高行业:商贸零售(8.22%)、国防军工(7.15%)[42] - 近一年月均最高行业:石油石化(5.60%)、建筑材料(5.29%)[42] --- 多头组合示例(2025/05) - **前十个股**:顺威股份(家用电器)、博深股份(机械设备)、九典制药(医药生物)等[44][48] - **行业排名第一个股**:如顺威股份(家用电器)、盛剑科技(环保)等[44]
机器学习因子选股月报(2025年5月)-20250430
西南证券· 2025-04-30 16:14
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,用于挖掘量价时序特征并预测股票收益[9][10] - **模型具体构建过程**: 1. **数据预处理**:使用过去400天的18个量价特征(如收盘价、成交量等),每5天采样一次,形成40×18的时序特征矩阵[14] 2. **GAN部分**: - 生成器(LSTM):输入噪声生成模拟量价特征,损失函数为判别器对生成数据的判别概率: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z))))]$$ [20] - 判别器(CNN):区分真实与生成数据,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ [23] 3. **GRU部分**:将GAN生成的特征输入GRU(128,128)层,接MLP(256,64,64)输出预测收益pRet作为选股因子[18] 4. **训练方式**:半年滚动训练,行业市值中性化处理[14][18] - **模型评价**:通过对抗训练提升特征生成能力,保留时序特性,适配金融数据的高噪声特点[29][33] --- 模型的回测效果 1. **GAN_GRU模型** - **IC均值**:11.73%(全A股,2019-2025)[37] - **ICIR**:0.90[38] - **年化超额收益率**:24.89%[38] - **信息比率(IR)**:1.66[38] - **最大回撤**:27.29%[38] - **最新一期IC**:0.22%(2025年4月)[37] - **行业表现**: - 当期IC最高行业:银行(33.46%)、钢铁(30.85%)[39] - 近一年超额收益最高行业:家用电器(5.56%)、石油石化(5.39%)[41] --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化后作为选股因子[18][37] - **因子具体构建过程**: 1. 输入原始量价时序特征(40天×18维)[14] 2. 通过GAN生成增强特征,GRU编码后输出预测收益[34] 3. 截面标准化并剔除ST股及上市不足半年的股票[14] --- 因子的回测效果 1. **GAN_GRU因子** - **多头组合年化收益**:36.06%[38] - **年化波动率**:23.80%[38] - **换手率**:0.83[38] - **近一年IC均值**:11.44%[37] - **行业多头超额收益**:纺织服饰(6.78%)、基础化工(5.61%)[41] --- 多头组合示例(2025年4月) - **前十个股**:国网英大、海容冷链、陕西能源等[44][46] - **行业排名第一个股**:非银金融(国网英大)、机械设备(海容冷链)[44]