Workflow
GRU模型
icon
搜索文档
量化专题报告:“机器学习”选股模型系列研究(一):量价指纹模型的构建与应用初探
国盛证券· 2026-01-16 21:34
量化模型与构建方式 1. 量价指纹生成模型 * **模型名称**:量价指纹生成模型[1][8] * **模型构建思路**:借鉴大语言模型的语义理解思想,将市场分钟级交易数据视为一种特殊“语言”,通过自监督学习框架,迫使模型理解日内量价行为中蕴含的动态语义与因果结构,最终生成一个低维、高信息密度的日度语义表征向量(即“量价指纹”)[1][8][9]。 * **模型具体构建过程**: 1. **输入数据**:每只股票每日的分钟级特征序列 $X \in \mathbb{R}^{T \times D}$,其中 $T=237$(交易分钟数),$D=32$(特征维度,包括4维价格特征和28维交易特征)[16]。 2. **特征预处理**: * **价格特征标准化**:除价格位置外,其余价格特征用当日开盘价进行标准化。$$ \tilde{p}_{t,d} = \frac{p_{t,d}}{p_{\mathrm{open}}} - 1 $$[16] * **交易特征标准化**:将每分钟特征值除以该特征过去20日所有分钟数值之和的均值。$$ {\tilde{f}}_{t,d} = {\frac{f_{t,d}}{S_{d}}}, \quad S_{d} = {\frac{1}{N_{\mathrm{hist}}}} \sum_{i=1}^{N_{\mathrm{hist}}} \sum_{t=1}^{T} f_{t,d}^{(i)} $$[17] 3. **模型架构**:采用编码器-双分支解码器架构的因果Transformer模型[26]。 * **固定正交投影层**:将输入 $X$ 投影到隐藏维度 $d_{\mathrm{model}}=128$,投影权重 $W_p$ 正交初始化并永久冻结。$$ H^{(0)} = X W_{p}, \quad W_{p}^{T}W_{p}=I $$[27][28] * **因果Transformer编码器**:共4层($L=4$),每层包含带因果掩码的多头自注意力机制和前馈网络[30][33]。 * 多头注意力($h=4$头):$$ \mathrm{MultiHead}(Q,K,V) = \mathrm{Concat}(\mathrm{head}_{1}, \mathrm{head}_{2}, \ldots, \mathrm{head}_{h}) W_{O} $$ $$ \mathrm{head}_{i} = \mathrm{softmax}\left( \frac{Q_{i}K_{i}^{T}}{\sqrt{d_{k}}} + M \right) V_{i} $$ 其中因果掩码矩阵 $M$ 确保只能关注过去信息[30][31]。 * 前馈网络:$$ \mathrm{FFN}(x) = \mathrm{GELU}(xW_1 + b_1)W_2 + b_2 $$[33] * **双分支输出**: * **日度指纹生成分支**:提取编码器最后一层最后一个时间步的输出作为128维日度指纹向量 $e$。$$ e = H_{:,T}^{(L)} \in \mathbb{R}^{B \times d_{\mathrm{model}}} $$[35] * **序列重建分支**:对编码器输出进行层归一化后,通过线性层重建原始输入序列 $\widehat{X}$[37]。 4. **损失函数设计**:采用双任务自监督学习损失与防坍缩正则项相结合的总损失函数[42][47]。 * **前向损失(价格特征因果预测)**:$$ {\mathcal{L}}_{\mathrm{forward}} = {\frac{1}{N_{forward}}} \sum_{b=1}^{B} \sum_{t=1}^{T} \sum_{k=1}^{D_{r}} M_{f}[b,t,k] \cdot {\frac{(r_{b,t,k} - {\hat{r}}_{b,t,k})^{2}}{\sigma_{k}^{2}}} $$[42] * **后向损失(交易特征重建)**:$$ {\mathcal{L}}_{\mathrm{backward}} = {\frac{1}{N_{backward}}} \sum_{b=1}^{B} \sum_{t=1}^{T} \sum_{k=1}^{D_{f}} M_{b}[b,t,k] \cdot {\frac{(x_{b,t,k} - {\hat{x}}_{b,t,k})^{2}}{\sigma_{k}^{2}}} $$[42] * **防坍缩正则化**: * **多样性损失**:鼓励嵌入向量在特征空间中分散。$$ {\mathcal{L}}_{\mathrm{diversity}} = \lambda_{d} \cdot \mathbb{I}(\sigma_{e} < 0.1) \cdot (-\mathrm{log}(\sigma_{e} + \epsilon)) $$[44] * **正交性约束**:防止特征维度间冗余。$$ \mathcal{L}_{\mathrm{orthogonality}} = \lambda_{o} \cdot \parallel C - I \parallel_{F} $$[45] * **均匀性损失**:避免嵌入向量过度相似。$$ \mathcal{L}_{\mathrm{uniformity}} = \lambda_{u} \cdot \mathbb{I}(\bar{s} > \tau) \cdot \bar{s} $$[46] * **总损失**:$$ {\mathcal{L}}_{\mathrm{total}} = \lambda_{f}{\mathcal{L}}_{\mathrm{forward}} + \lambda_{b}{\mathcal{L}}_{\mathrm{backward}} + {\mathcal{L}}_{\mathrm{diversity}} + {\mathcal{L}}_{\mathrm{orthogonality}} + {\mathcal{L}}_{\mathrm{uniformity}} $$[47] 5. **训练细节**:采用滚动训练框架,每年年初使用过去三年的数据对模型进行微调,以维持嵌入空间的连续性[48]。具体参数如batch_size=512,学习率1e-4,使用Adam优化器等[49]。 2. 单流GRU预测模型 (模型1与模型2) * **模型名称**:单流GRU预测模型[51] * **模型构建思路**:使用过去20个交易日的日频特征(基础价量特征+量价因子或量价指纹),通过双层GRU网络捕捉时序依赖,预测股票未来5日的收益率,以生成选股因子[51][52]。 * **模型具体构建过程**: 1. **输入特征**: * **模型1(量价因子)**:过去20个交易日的每日高开低收、成交量、成交额(共6个基础特征)以及137个量价因子[51][52]。 * **模型2(量价指纹)**:过去20个交易日的每日高开低收、成交量、成交额(共6个基础特征)以及128维量价指纹[52]。 2. **特征预处理**: * **价格类特征**:采用对数变化率的时序标准化(样本内每个价格除以最新价格取对数)[52]。 * **成交量/额**:每日值除以20日均值[52]。 * **量价因子**:进行时序标准化、MAD去极值、截面zscore标准化[52]。 * **量价指纹**:作为预训练生成的语义表征,无需标准化[52]。 3. **模型结构**:双层GRU + 全连接层 + LayerNorm + ReLU激活 + dropout + 全连接输出层[53]。 4. **训练细节**:使用可微分RankIC作为损失函数,每年年初使用过去数据训练,并行训练3个不同随机种子的模型并集成预测,以提升稳健性[53]。 3. 双流GRU融合预测模型 (模型3) * **模型名称**:双流GRU融合预测模型[67] * **模型构建思路**:为了融合量价因子和量价指纹两类异构特征,采用双流GRU设计,让两个GRU流分别处理各自擅长的特征,最后将两个流的隐藏状态进行加权融合,再通过全连接层预测收益率,以充分利用信息的互补性[67]。 * **模型具体构建过程**: 1. **输入特征**:两个独立的数据流,一流输入基础特征+量价因子,另一流输入基础特征+量价指纹[67]。 2. **模型结构**:两个独立的单流GRU模块(结构与上述单流GRU相同)并行处理两个特征流,将两个GRU的最终隐藏状态通过可配置的权重进行融合,然后将融合后的特征输入全连接预测层[67][69]。 3. **训练与集成**:训练策略与单流GRU模型一致,每年训练3个集成模型[68]。 量化因子与构建方式 1. 模型1因子 * **因子名称**:基于量价因子的GRU预测因子[51] * **因子构建思路**:将预处理后的历史量价因子序列输入单流GRU预测模型,模型输出的预测值即为该因子[51][52]。 * **因子具体构建过程**:如上述“单流GRU预测模型 (模型1)”所述,模型每日根据过去20日数据生成的预测信号即为因子值[52]。 2. 模型2因子 * **因子名称**:基于量价指纹的GRU预测因子[52] * **因子构建思路**:将历史量价指纹序列输入单流GRU预测模型,模型输出的预测值即为该因子[52]。 * **因子具体构建过程**:如上述“单流GRU预测模型 (模型2)”所述,模型每日根据过去20日数据生成的预测信号即为因子值[52]。 * **因子评价**:该因子与市值风格因子的相关性极低,表明其捕捉的市场语义信息与传统市值维度存在差异,可能更多与日内资金节奏、多空博弈等动态特征相关[54][55]。 3. 模型3因子 (融合因子) * **因子名称**:量价因子与量价指纹融合预测因子[67] * **因子构建思路**:将量价因子和量价指纹分别输入双流GRU融合模型,模型融合两类信息后输出的预测值即为该因子[67]。 * **因子具体构建过程**:如上述“双流GRU融合预测模型 (模型3)”所述,模型每日生成的预测信号即为因子值[67]。 * **因子评价**:融合因子结合了量价因子的显式统计规律与量价指纹的隐式语义模式,提升了预测能力和模型稳定性[68][86]。 模型的回测效果 (回测期:2017/01/01-2025/12/31,全市场A股,周度换仓,暂不考虑交易费用)[59][68] | 模型 | 周度RankIC均值 | 年化RankICIR | 多空对冲年化收益 | 多空对冲年化波动率 | 多空对冲IR | 多空对冲周度胜率 | 多空对冲最大回撤率 | 多头超额年化收益 | 多头超额年化波动率 | 多头超额IR | 多头超额周度胜率 | 多头超额最大回撤率 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | **模型1 (量价因子)** | 0.106[65] | 6.64[65] | 81.23%[65] | 15.25%[65] | 5.33[65] | 74.95%[65] | 12.66%[65] | 19.00%[65] | 8.46%[65] | 2.24[65] | 65.01%[65] | 15.09%[65] | | **模型2 (量价指纹)** | 0.106[65] | 6.62[65] | 83.88%[65] | 15.50%[65] | 5.41[65] | 73.87%[65] | 11.65%[65] | 21.35%[65] | 7.45%[65] | 2.87[65] | 69.76%[65] | 12.09%[65] | | **模型3 (融合因子)** | 0.109[68] | 6.85[68] | 90.89%[68] | 15.27%[68] | 5.95[68] | 76.46%[68] | 11.54%[68] | 28.09%[74] | 不适用 | 不适用 | 不适用 | 不适用 | 因子的回测效果 (回测期:2017/01/01-2025/12/31,全市场A股,周度换仓,暂不考虑交易费用)[59][68] | 因子 | 周度RankIC均值 | 年化RankICIR | 多空对冲年化收益 | 多空对冲年化波动率 | 多空对冲IR | 多空对冲周度胜率 | 多空对冲最大回撤率 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | **模型3融合因子** | 0.109[68] | 6.85[68] | 90.89%[68] | 15.27%[68] | 5.95[68] | 76.46%[68] | 11.54%[68] | 指数增强组合表现 (基于模型3融合因子构建,回测期:2017/01/01-2025/12/31)[75][78][82] | 指数增强组合 | 超额年化收益 | 跟踪误差 | IR | 月度胜率 | 最大回撤 | | :--- | :--- | :--- | :--- | :--- | :--- | | **沪深300指数增强** | 7.12%[75] | 1.74%[75] | 4.10[75] | 86.11%[75] | 1.85%[75] | | **中证500指数增强** | 11.38%[78] | 3.47%[78] | 3.28[78] | 83.33%[78] | 4.76%[78] | | **中证1000指数增强** | 14.84%[82] | 3.45%[82] | 4.30[82] | 83.33%[82] | 2.95%[82] |
机器学习因子选股月报(2026年1月)-20251231
西南证券· 2025-12-31 10:04
量化模型与构建方式 1. **模型名称**:GAN_GRU模型[4][13] **模型构建思路**:利用生成式对抗网络(GAN)模型对量价时序特征进行增强处理,再利用门控循环单元(GRU)模型对处理后的时序特征进行编码,最终输出股票的未来收益预测值作为选股因子[4][13] **模型具体构建过程**: * **数据准备**:使用18个量价特征,包括日频特征(如前收盘价、开盘价、收盘价、最高价、最低价、成交量、成交金额、涨跌幅、振幅、换手率、均价)和月频特征(如月成交金额、月涨跌幅、月振幅、月换手率、月收盘最高价、月收盘最低价、月日均换手率)[17][19] * **特征采样**:对每只个股,取过去400天内的18个量价特征,每5个交易日进行一次采样,采样形状为40(天)* 18(特征),用以预测未来20个交易日的累计收益[18] * **数据处理**:每次采样的40天内,每个特征在时序上进行去极值和标准化处理;同时,每个特征在个股层面上进行截面标准化[18] * **GAN特征生成**: * **生成器(G)**:采用LSTM模型,输入原始量价时序特征(形状为(40, 18)),输出增强后的时序特征(形状仍为(40, 18))[33][37] * **判别器(D)**:采用CNN模型,用于区分真实量价特征与生成器生成的特征[33] * **对抗训练**:生成器与判别器交替训练。生成器的目标是让判别器无法区分其生成的特征与真实特征,其损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 表示随机噪声,\(G(z)\) 表示生成器生成的数据,\(D(G(z))\) 表示判别器判断生成数据为真实数据的概率[24][25] 判别器的目标是准确区分真实数据与生成数据,其损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 表示真实数据,\(D(x)\) 表示判别器对真实数据的输出概率[27] * **GRU收益预测**:将GAN生成器输出的增强特征,输入到一个两层GRU网络(GRU(128, 128))中,后面再接一个多层感知机(MLP(256, 64, 64)),模型最终输出的预测收益(pRet)即为GAN_GRU因子[22] * **模型训练**:采用半年滚动训练方式,训练时间点为每年的6月30日及12月31日,使用过去数据训练模型并用于未来半年的预测[18] * **股票筛选**:选取全市场股票,剔除ST及上市不足半年的股票[18] **模型评价**:该模型结合了GAN的数据增强能力和GRU的时序建模能力,旨在挖掘更深层次的量价时序规律以预测股票收益[4][13] 量化因子与构建方式 1. **因子名称**:GAN_GRU因子[4][13] **因子构建思路**:GAN_GRU模型最终输出的股票未来收益预测值,直接作为选股因子使用[4][13][22] **因子具体构建过程**:如上述模型构建过程所述,经过GAN特征生成和GRU模型预测后,得到每只股票的未来收益预测值(pRet),即为因子值[22]。在因子测试前,会对该因子值进行行业和市值中性化处理,并进行标准化[22] 模型的回测效果 1. GAN_GRU模型(因子)[41][42] * IC均值:0.1119***[41][42] * ICIR(未年化):0.89[42] * 年化收益率:37.40%[42] * 年化波动率:23.39%[42] * 信息比率(IR):1.60[42] * 最大回撤率:27.29%[42] * 年化超额收益率:22.42%[41][42] * 换手率:0.83X[42] * 最新一期IC(截至2025年12月29日):0.0331***[41][42] * 近一年IC均值(截至2025年12月29日):0.0669***[41][42] 因子的回测效果 1. GAN_GRU因子[41][42] * IC均值:0.1119***[41][42] * ICIR(未年化):0.89[42] * 年化收益率:37.40%[42] * 年化波动率:23.39%[42] * 信息比率(IR):1.60[42] * 最大回撤率:27.29%[42] * 年化超额收益率:22.42%[41][42] * 换手率:0.83X[42] * 最新一期IC(截至2025年12月29日):0.0331***[41][42] * 近一年IC均值(截至2025年12月29日):0.0669***[41][42]
机器学习因子选股月报(2025年12月)-20251128
西南证券· 2025-11-28 15:02
根据提供的研报内容,总结如下: 量化模型与构建方式 1. **模型名称:GAN_GRU模型**[4][13] * **模型构建思路**:该模型是一种深度学习选股模型,首先利用生成式对抗网络(GAN)对量价时序特征进行增强处理,然后再利用门控循环单元(GRU)网络对处理后的时序特征进行编码,最终输出股票的预测收益作为选股因子[4][13]。 * **模型具体构建过程**: * **基础特征**:模型使用18个量价特征,包括日频特征(如前收盘价、开盘价、收盘价、最高价、最低价、成交量、成交金额、涨跌幅、振幅、换手率、均价)和月频特征(如月成交金额、月涨跌幅、月振幅、月换手率、月收盘最高价、月收盘最低价、月日均换手率)[14][17][19]。 * **数据预处理与采样**:使用所有个股过去400天内的18个量价特征,每5个交易日进行一次特征采样。每次采样的特征形状为40天*18个特征,用以预测未来20个交易日的累计收益[18]。在时序上对每个特征进行去极值和标准化处理,并在个股截面上进行标准化处理[18]。训练集与验证集的比例为80%:20%[18]。 * **基础模型(GRU+MLP)**:构建一个包含两层GRU层(GRU(128, 128))和后续多层感知机(MLP(256, 64, 64))的神经网络。模型最终输出的预测收益(pRet)作为选股因子[22]。 * **GAN特征增强**:为了提升特征质量,引入GAN模型对原始量价时序特征(Input_Shape=(40,18))进行增强[33][37]。 * **生成器(G)**:采用长短期记忆网络(LSTM)作为生成器,以保留输入特征的时序性质。其目标是生成逼真的量价时序特征。生成器的损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 是随机噪声,\(G(z)\) 是生成器生成的数据,\(D(G(z))\) 是判别器判断生成数据为真实数据的概率[24][25]。 * **判别器(D)**:采用卷积神经网络(CNN)作为判别器,将量价时序特征视为二维图像进行处理。其目标是区分真实数据与生成数据。判别器的损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 是真实数据,\(D(x)\) 是判别器对真实数据的输出概率,\(D(G(z))\) 是判别器对生成数据的输出概率[27]。 * **训练过程**:生成器和判别器交替训练。先训练判别器,再训练生成器,循环迭代直至模型收敛[29][30][34]。 * **GAN_GRU整合**:将训练好的GAN模型中的生成器(G)用于处理原始量价时序特征,生成增强后的特征。然后将增强后的特征输入到前述的GRU+MLP基础模型中进行训练和预测[38]。 * **训练与预测设置**:采用半年滚动训练方式,每年6月30日和12月31日进行模型训练,用于未来半年的预测。回测采用月频调仓。选股范围为全A股,剔除ST股及上市不足半年的股票。训练超参数包括:batch_size为截面股票数量、优化器为Adam、学习速率为1e-4、损失函数为IC、早停轮数为10、最大训练轮数为50[15][18]。 量化因子与构建方式 1. **因子名称:GAN_GRU因子**[4][13] * **因子构建思路**:GAN_GRU因子是GAN_GRU模型最终输出的股票预测收益(pRet)[22]。该因子在用于测试前,会经过行业和市值中性化处理,并进行标准化[22]。 * **因子具体构建过程**:因子值直接来源于GAN_GRU模型的输出,即模型对每只股票未来20个交易日收益的预测值[18][22]。构建过程与上述GAN_GRU模型的构建过程完全一致。 模型的回测效果 1. **GAN_GRU模型**(基于其输出的因子进行回测,回测期间:2019年1月至2025年11月,月频调仓)[41][42] * IC均值:0.1131*** * ICIR(未年化):0.90 * 换手率:0.83 * 年化收益率:37.52% * 年化波动率:23.52% * 信息比率(IR):1.59 * 最大回撤率:27.29% * 年化超额收益率:23.14% 因子的回测效果 1. **GAN_GRU因子**[41][42] * 最新一期IC(截至2025年11月27日):0.1241*** * 近一年IC均值(截至2025年11月27日):0.0867*** * 近期行业IC表现(2025年10月当期,申万一级行业除综合):社会服务(0.2198***)、房地产(0.2027***)、钢铁(0.1774***)、非银金融(0.1754***)、煤炭(0.1537***)[42] * 近一年行业IC均值(申万一级行业除综合):非银金融(0.1401***)、钢铁(0.1367***)、商贸零售(0.1152***)、纺织服饰(0.1124***)、公用事业(0.1092***)[42] * 近期行业多头组合超额收益(2025年11月当期,相对行业指数):环保(7.24%)、机械设备(4.37%)、房地产(4.03%)、纺织服饰(3.89%)、建筑材料(2.91%)[2][45] * 近一年行业多头组合月平均超额收益(相对行业指数):建筑材料(2.15%)、房地产(1.97%)、社会服务(1.77%)、纺织服饰(1.71%)、商贸零售(1.62%)[2][46]
行业轮动周报:融资资金持续净流入电子,主板趋势上行前需耐住寂寞-20250928
中邮证券· 2025-09-28 16:59
量化模型与构建方式 1 模型名称:扩散指数行业轮动模型[3][23][24];模型构建思路:基于价格动量原理,通过计算行业扩散指数来捕捉行业趋势,选择扩散指数排名靠前的行业进行配置[24][36];模型具体构建过程:首先,计算每个中信一级行业的扩散指数,该指数反映了行业内个股价格走势的强弱程度;然后,每周或每月跟踪各行业扩散指数的数值及其变化,并选择扩散指数排名前六的行业作为当期配置建议[25][28];模型评价:该模型在趋势性行情中表现较好,能有效捕捉行业动量,但在市场风格切换至反转行情时可能面临失效风险[24][36] 2 模型名称:GRU因子行业轮动模型[3][6][31];模型构建思路:基于分钟频量价数据,利用GRU(门控循环单元)深度学习网络生成行业因子,以把握短期交易信息并进行行业轮动[31][37];模型具体构建过程:首先,收集各行业的分钟频量价数据;然后,将这些数据输入到GRU深度学习网络中进行训练,以生成GRU行业因子;最后,根据GRU行业因子的数值进行排序,选择因子排名靠前的行业进行配置[6][32][34];模型评价:该模型对短周期行情有较好的自适应能力,但在长周期表现一般,且可能因极端行情而失效[31][37] 模型的回测效果 1 扩散指数行业轮动模型,2025年以来超额收益3.68%[3][23][28] 2 GRU因子行业轮动模型,2025年以来超额收益-7.53%[3][31][34] 量化因子与构建方式 1 因子名称:行业扩散指数[3][5][25];因子的构建思路:通过量化行业内个股价格走势的强弱来构建一个综合指标,用以衡量行业的整体趋势强度[24][36];因子具体构建过程:对于每个中信一级行业,计算其成分股中价格处于上涨趋势的股票比例或使用其他类似方法合成一个0到1之间的指数,数值越高代表行业趋势越强[25][26] 2 因子名称:GRU行业因子[3][6][32];因子的构建思路:利用GRU深度学习模型处理高频量价数据,提取能够预测行业短期表现的因子[31][37];因子具体构建过程:使用各行业的分钟频量价数据作为输入特征,通过训练好的GRU网络模型输出一个因子得分,该得分反映了模型对该行业未来表现的预测[32][37] 因子的回测效果 1 行业扩散指数因子,截至2025年9月26日,在通信行业的取值为0.949,在有色金属行业的取值为0.927,在银行业的取值为0.897,在电子行业的取值为0.864,在汽车行业的取值为0.859,在综合行业的取值为0.811[5][25] 2 GRU行业因子,截至2025年9月26日,在钢铁行业的取值为3.15,在房地产行业的取值为2.6,在建材行业的取值为2.08,在石油石化行业的取值为1.85,在交通运输行业的取值为0.81,在电力及公用事业的取值为0.01[6][32]
国泰海通|金工:基于GRU、TCN模型的深度学习因子选股效果研究
模型效果比较 - GRU模型效果略优于TCN+GRU和TCN模型[1] - 预测10日收益模型表现优于预测5日收益模型[1] - 深度学习因子与低波动、低流动性因子呈现较高相关性[1] 模型训练细节 - 输入数据包括30日行情、60日行情、30周行情,以及6个特征(高、开、低、收、均价、换手率)[2] - 预测标签为t+1日至t+6日的5日均价涨跌幅和t+1日至t+11日的10日均价涨跌幅[2] - 训练过程采用2017年以来数据,每年训练一个模型供下一年使用,前9年数据为训练集,第10年数据为验证集[2] 单因子选股效果 - 多头组在中小市值股票池(中证1000、中证2000)超额收益更高[2] - 沪深300中因子原始值效果优于市值行业中性化后因子值[2] - 市值行业中性化后因子超额收益减少,说明深度学习因子捕捉到风格轮动和行业轮动规律[2] 复合因子选股效果 - 深度学习因子与反转因子有一定相关性,与分钟高频因子、快照因子和基本面因子相关性较低[3] - 等权加权后的复合因子效果优于单因子[3] - 构建指数增强策略时,控制市值行业无暴露条件下,沪深300增强年化超额11.8%,中证500增强年化超额13.6%,中证1000增强年化超额21.7%,中证2000增强年化超额27.1%[3] 策略表现 - 截至2025年6月30日,沪深300增强本年超额-0.4%,中证500增强本年超额2.7%,中证1000增强本年超额9.9%,中证2000增强本年超额9.3%[3] - 允许市值行业适当暴露后,沪深300增强年化超额8.8%,中证500增强年化超额14.6%,中证1000增强年化超额22.3%,中证2000增强年化超额26.2%[3] - 考虑双边0.3%交易费用后,每年收益减少约3%[3]
行业轮动周报:ETF资金净流入红利流出高位医药,指数与大金融回调有明显托底-20250721
中邮证券· 2025-07-21 18:13
量化模型与构建方式 1. **模型名称:扩散指数行业轮动模型** - **模型构建思路**:基于价格动量原理,通过计算行业扩散指数来捕捉行业趋势,选择趋势向上的行业进行配置[25] - **模型具体构建过程**: 1. 计算各中信一级行业的扩散指数,反映行业价格趋势强度 2. 扩散指数公式: $$ DI_t = \frac{N_{up}}{N_{up} + N_{down}} $$ 其中,\( N_{up} \)为行业成分股中价格上涨的股票数量,\( N_{down} \)为价格下跌的股票数量[26] 3. 选择扩散指数排名前六的行业作为配置标的[26] - **模型评价**:在趋势性行情中表现优异,但在市场反转时可能失效[25] 2. **模型名称:GRU因子行业轮动模型** - **模型构建思路**:基于GRU(门控循环单元)深度学习网络,利用分钟频量价数据生成行业因子,捕捉短期交易信号[33] - **模型具体构建过程**: 1. 输入分钟级行业量价数据(如成交量、收益率等) 2. 通过GRU网络提取时序特征,输出行业因子得分 3. 根据因子得分排名选择前六的行业配置(如银行、交通运输等)[34] - **模型评价**:短周期自适应能力强,但长周期表现不稳定,极端行情可能失效[38] --- 量化因子与构建方式 1. **因子名称:行业扩散指数因子** - **因子构建思路**:通过统计行业内个股价格变动方向的比例,量化行业趋势强度[26] - **因子具体构建过程**: 1. 对每个中信一级行业,计算当日上涨股票数量占比 2. 标准化为0-1区间,1表示全部成分股上涨,0表示全部下跌[26] 2. **因子名称:GRU行业因子** - **因子构建思路**:利用GRU网络从高频量价数据中提取行业动量特征[34] - **因子具体构建过程**: 1. 对行业分钟频数据(如收益率、波动率)进行归一化 2. 输入GRU网络训练,输出因子得分(如银行因子得分为2.68)[34] --- 模型的回测效果 1. **扩散指数行业轮动模型** - 2025年累计超额收益:1.48%[25] - 周度超额收益(2025/7/18):-1.61%[29] - 7月以来超额收益:-1.62%[29] 2. **GRU因子行业轮动模型** - 2025年累计超额收益:-5.75%[33] - 周度超额收益(2025/7/18):-1.27%[36] - 7月以来超额收益:-0.30%[36] --- 因子的回测效果 1. **行业扩散指数因子** - 当前排名前六行业得分:综合金融(1.0)、综合(0.998)、非银行金融(0.996)[26] - 周度环比提升最大行业:消费者服务(+0.224)、食品饮料(+0.208)[28] 2. **GRU行业因子** - 当前排名前六行业得分:银行(2.68)、交通运输(2.42)、有色金属(-0.87)[34] - 周度环比提升最大行业:建材、银行、综合金融[34]
中金:一种结合自注意力机制的GRU模型
中金点睛· 2025-07-15 07:39
时间序列模型的核心架构演进 - 时间序列模型(如LSTM、GRU、Transformer)通过门控机制或自注意力结构解决长期依赖问题,其中GRU通过精简的更新门与重置门提升运算效率,更适合实时预测场景 [1][2] - Transformer通过自注意力机制和位置编码实现序列建模革新,在多维时序数据分析中展现并行化优势,但参数量大易导致过拟合 [2][5] - 公司提出AttentionGRU(Res)模型,结合轻量化自注意力、残差结构和GRU,兼顾序列学习能力与样本外稳定性,全市场年化超额收益超30% [6][40] 时序因子与截面因子的模型表现对比 - 测试159个截面因子和158个时序因子(Alpha158)显示:截面因子单因子表现更优(多头超额11% vs 时序因子1%),但时序因子在RNN/LSTM/GRU模型中样本外表现更佳(ICIR均值1.02,为截面因子模型两倍) [4][21] - 时序因子模型样本外多头超额收益达7.6%,显著高于截面因子模型的1.3%,且时序因子ICIR分布更集中 [4][21] - 时序模型的结构特性(如循环连接、门控机制)与时序因子的动态关联性高度匹配,增强了对历史序列特征的保留能力 [8][9] 时序模型优化方向与效果 - 对GRU的门结构优化(如BiGRU、GLU)提升有限:BiGRU样本外ICIR仅提升0.01,多头超额收益增加2个百分点 [27][28] - Transformer样本内效果显著但样本外过拟合,因其参数量过大;AttentionGRU(Res)通过简化自注意力结构和残差连接,样本外年化超额收益达12.6%,中证1000泛化测试超额10.8% [33][34][46] - 残差结构(Res)改善梯度传递问题,自注意力机制动态聚焦核心时序节点,两者结合使模型参数减少50%仍保持长期依赖捕捉能力 [35][36][38] 关键模型性能数据 - AttentionGRU(Res)在全市场测试中IC均值7.38%、ICIR 1.09,多头超额收益12.64%,最大回撤8.41%,胜率80.21% [41] - 传统GRU模型对比:IC均值6.51%、多头超额7.18%,最大回撤5.36%,显示优化结构显著提升收益稳定性 [34][41] - 中证1000泛化测试中,AttentionGRU(Res)多头超额10.8%,优于Transformer(9.0%)和基础GRU(3.47%) [46][47]
行业轮动周报:融资资金持续大幅净流入医药,GRU行业轮动调出银行-20250616
中邮证券· 2025-06-16 17:37
根据提供的研报内容,以下是量化模型和因子的总结: 量化模型与构建方式 1. **模型名称:扩散指数行业轮动模型** - **模型构建思路**:基于价格动量原理,通过跟踪行业扩散指数来捕捉行业趋势[6][26] - **模型具体构建过程**: 1. 计算各中信一级行业的扩散指数,反映行业价格趋势强度 2. 选择扩散指数排名靠前的行业作为配置标的 3. 每月进行行业轮动调整[26][30] - **模型评价**:在趋势性行情中表现较好,但在市场反转时可能失效[26][36] 2. **模型名称:GRU因子行业轮动模型** - **模型构建思路**:利用GRU神经网络处理分钟频量价数据,捕捉行业短期交易特征[7][32] - **模型具体构建过程**: 1. 使用GRU深度学习网络处理行业量价数据 2. 生成GRU行业因子得分 3. 选择因子得分高的行业进行配置[32][35] - **模型评价**:在短周期表现较好,但对极端行情适应性有限[32][37] 量化因子与构建方式 1. **因子名称:行业扩散指数** - **因子构建思路**:衡量行业价格趋势强度的标准化指标[6][26] - **因子具体构建过程**: 1. 计算行业价格序列的扩散指标 2. 进行标准化处理得到0-1区间的扩散指数[26][27] 2. **因子名称:GRU行业因子** - **因子构建思路**:通过GRU网络提取行业量价特征[7][32] - **因子具体构建过程**: 1. 输入行业分钟频量价数据到GRU网络 2. 输出行业因子得分[32][33] 模型的回测效果 1. **扩散指数行业轮动模型** - 2025年6月超额收益:1.20%[30] - 2025年以来超额收益:-0.44%[26][30] 2. **GRU因子行业轮动模型** - 2025年6月超额收益:0.00%[35] - 2025年以来超额收益:-4.13%[32][35] 因子的回测效果 1. **行业扩散因子** - 最新排名前六行业得分:综合金融(1.0)、非银行金融(0.997)、银行(0.97)[27] - 环比提升最大行业:有色金属(+0.167)、农林牧渔(+0.164)[27][29] 2. **GRU行业因子** - 最新排名前六行业得分:钢铁(2.42)、建筑(1.47)、交通运输(0.85)[33] - 环比提升最大行业:电力设备及新能源、电子、机械[33]
机器学习因子选股月报(2025年5月)-20250430
西南证券· 2025-04-30 16:14
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,用于挖掘量价时序特征并预测股票收益[9][10] - **模型具体构建过程**: 1. **数据预处理**:使用过去400天的18个量价特征(如收盘价、成交量等),每5天采样一次,形成40×18的时序特征矩阵[14] 2. **GAN部分**: - 生成器(LSTM):输入噪声生成模拟量价特征,损失函数为判别器对生成数据的判别概率: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z))))]$$ [20] - 判别器(CNN):区分真实与生成数据,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ [23] 3. **GRU部分**:将GAN生成的特征输入GRU(128,128)层,接MLP(256,64,64)输出预测收益pRet作为选股因子[18] 4. **训练方式**:半年滚动训练,行业市值中性化处理[14][18] - **模型评价**:通过对抗训练提升特征生成能力,保留时序特性,适配金融数据的高噪声特点[29][33] --- 模型的回测效果 1. **GAN_GRU模型** - **IC均值**:11.73%(全A股,2019-2025)[37] - **ICIR**:0.90[38] - **年化超额收益率**:24.89%[38] - **信息比率(IR)**:1.66[38] - **最大回撤**:27.29%[38] - **最新一期IC**:0.22%(2025年4月)[37] - **行业表现**: - 当期IC最高行业:银行(33.46%)、钢铁(30.85%)[39] - 近一年超额收益最高行业:家用电器(5.56%)、石油石化(5.39%)[41] --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化后作为选股因子[18][37] - **因子具体构建过程**: 1. 输入原始量价时序特征(40天×18维)[14] 2. 通过GAN生成增强特征,GRU编码后输出预测收益[34] 3. 截面标准化并剔除ST股及上市不足半年的股票[14] --- 因子的回测效果 1. **GAN_GRU因子** - **多头组合年化收益**:36.06%[38] - **年化波动率**:23.80%[38] - **换手率**:0.83[38] - **近一年IC均值**:11.44%[37] - **行业多头超额收益**:纺织服饰(6.78%)、基础化工(5.61%)[41] --- 多头组合示例(2025年4月) - **前十个股**:国网英大、海容冷链、陕西能源等[44][46] - **行业排名第一个股**:非银金融(国网英大)、机械设备(海容冷链)[44]