Workflow
GRU模型
icon
搜索文档
结合基本面和量价特征的GRU模型
中邮证券· 2025-06-05 15:20
根据研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:日行情GRU模型** - 构建思路:基于股票过去240个交易日的量价信息预测次月收益率[15] - 具体构建过程: - 输入数据:开盘价、最高价、最低价、收盘价、成交量、成交额、换手率(7个字段) - 数据标准化:对每个字段的240个值进行z-score标准化[16] - 预测目标:截面标准化的次月收益率(月初开盘价至月末收盘价) - 训练方式:滚动6年样本,按4:1划分训练集/验证集,连续10轮早停训练[16] - 模型评价:超额收益稳定,但2024年后表现有所减弱[19] 2. **模型名称:日行情+基本面GRU模型** - 构建思路:在日行情模型基础上拼接20个财务指标TTM值[25] - 具体构建过程: - 财务数据处理:直接使用最新季报TTM值拼接至量价矩阵[26] - 输入矩阵标准化后输入GRU网络[26] - 模型评价:2022年前表现与基准相近,2023年后显著弱于纯量价模型[34] 3. **模型名称:日行情+调整基本面GRU模型** - 构建思路:对财务指标进行日频化处理以解决数据频率不匹配问题[35] - 具体构建过程: - 调整公式: $$\mathrm{DFTTM}_{\mathrm{q1}}={\frac{\mathrm{FactorTTM}_{\mathrm{q1}}-\mathrm{FactorTTM}_{\mathrm{q0}}}{a b s\big(\mathrm{FactorTTM}_{\mathrm{q0}}\big)}}$$ $$Factort = FactorTTMq + abs(FactorTTMq ) ( 90 1)$$[36] - 按财报期增速每日调整TTM值[36] - 模型评价:2022年前表现显著增强,2023年后仍弱于基准[42] 4. **模型名称:barra5d+日行情+精简基本面GRU模型** - 构建思路:混频模型结合长期预测(日行情)与短期预测(分钟数据)能力[65] - 具体构建过程: - 分钟数据模型输入:日内240分钟数据预测未来5日收益率[56] - 精简基本面:仅保留净利润TTM和市值因子[45] - 模型叠加:相关性较低的两类GRU模型输出加权组合[65] - 模型评价:解决单一模型周期性问题,年度超额分布更均匀[80] 模型的回测效果 1. **日行情GRU模型** - 年化超额收益:8.75% - 信息比率(IR):2.25 - 最大回撤:4.71%[23] 2. **日行情+基本面GRU模型** - 年化超额收益:6.86% - 信息比率(IR):1.46 - 最大回撤:6.14%[33] 3. **日行情+调整基本面GRU模型** - 年化超额收益:7.76% - 信息比率(IR):1.65 - 最大回撤:5.40%[44] 4. **barra5d+日行情+精简基本面GRU模型** - 中证1000增强组合: - 年化超额收益:11.82% - 信息比率(IR):2.39 - 最大回撤:5.70%[78] - 其他指数增强表现: - 沪深300年化超额:5.70%[82] - 中证500年化超额:6.46%[86] - 科创综指年化超额:6.28%[88] 关键创新点 - 财务数据日频化处理通过增速平滑实现[36] - 混频模型有效结合不同时间尺度预测能力(分钟级+日级)[65] - 精简基本面因子可提升模型稳定性(净利润TTM+市值)[45]
金工专题报告:结合基本面和量价特征的GRU模型
中邮证券· 2025-06-05 14:23
量化模型与构建方式 1. GRU基准模型 - **模型名称**:日行情GRU因子[3] - **构建思路**:基于股票过去240个交易日的量价信息(开盘价、最高价、最低价、收盘价、成交量、成交额、换手率)预测次月收益率[15][16] - **具体构建过程**: 1. 输入数据标准化:对每个字段的240个历史值进行z-score标准化[16] 2. 预测目标:截面标准化的次月收益率(月初开盘价至月末收盘价)[16] 3. 训练方式:滚动6年样本,按4:1划分训练集/验证集,早停机制(连续10轮损失未下降)[16] 4. 组合构建参数:中证1000成分股80%、个股权重偏离1%、行业偏离1%、月频调仓[18] - **模型评价**:量价信息挖掘能力稳定,但财务信息融合需优化[14] 2. 财务信息增强模型 - **模型名称**:日行情+基本面GRU因子[26] - **构建思路**:在基准模型基础上拼接20个财务指标TTM值(如净利润、营业收入等)[24][25] - **具体构建过程**: 1. 财务数据日频化调整公式: $$\mathrm{DFTTM}_{\mathrm{q1}}={\frac{\mathrm{FactorTTM}_{\mathrm{q1}}-\mathrm{FactorTTM}_{\mathrm{q0}}}{a b s\big(\mathrm{FactorTTM}_{\mathrm{q0}}\big)}}$$ $$\mathrm{Factort} = \mathrm{FactorTTMq} + \mathrm{abs}(\mathrm{FactorTTMq}) \times \left(\frac{\mathrm{DFTTM}_{\mathrm{q1}}}{90}\right)$$[36] 2. 精简后保留核心指标:净利润TTM+市值因子[45] - **模型评价**:2022年前财务信息提升显著,2023年后量价因子主导[44][45] 3. 混频融合模型 - **模型名称**:barra5d+日行情+精简基本面GRU[55][73] - **构建思路**:结合分钟级barra5d模型(预测未来5日收益)与日行情GRU模型[56][65] - **具体构建过程**: 1. barra5d模型:基于240分钟数据预测风格中性化后的5日收益率[56] 2. 混频叠加:通过低相关性组合提升稳定性(日行情GRU与barra5d相关性0.23)[55][65] - **模型评价**:解决单一频率模型周期局限性,2024年后表现显著改善[73][79] --- 模型回测效果 1. 日行情GRU因子 - 年化超额收益:8.75% - 信息比率(IR):2.25 - 最大回撤:4.71% - 分年度超额收益:2020年7.88%、2021年7.54%、2022年12.35%[20][23] 2. 日行情+调整基本面GRU因子 - 年化超额收益:7.76% - 信息比率(IR):1.65 - 最大回撤:5.40% - 分年度超额收益:2020年14.69%、2021年7.59%[42][44] 3. barra5d+日行情+精简基本面GRU - 年化超额收益:11.82%(中证1000) - 信息比率(IR):2.39 - 最大回撤:5.70% - 其他指数增强表现: - 沪深300增强年化超额5.70%[82] - 中证500增强年化超额6.46%[86] - 科创综指增强年化超额6.28%[88]