Workflow
深度学习因子
icon
搜索文档
高频选股因子周报(20251110- 20251114):高频因子走势分化,多粒度因子持续战胜市场。AI 增强组合继续表现亮眼,多数组合创年内新高。-20251116
国泰海通证券· 2025-11-16 19:40
根据研报内容,以下是关于量化因子和模型的总结。 量化因子与构建方式 1. **因子名称:日内高频偏度因子** 因子构建思路:通过分析股票日内收益的分布特征,捕捉其偏度信息以预测未来表现[12] 因子具体构建过程:具体计算方式请参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》[12] 2. **因子名称:日内下行波动占比因子** 因子构建思路:将已实现波动率分解,计算下行波动部分在总波动中的占比[17] 因子具体构建过程:具体计算方式请参考专题报告《选股因子系列研究(二十五)——高频因子之已实现波动分解》[17] 3. **因子名称:开盘后买入意愿占比因子** 因子构建思路:基于开盘后一段时间内的高频交易数据,衡量买入意愿的相对强度[22] 因子具体构建过程:具体计算方式请参考专题报告《选股因子系列研究(六十四)——基于直观逻辑和机器学习的高频数据低频化应用》[22] 4. **因子名称:开盘后买入意愿强度因子** 因子构建思路:在买入意愿占比的基础上,进一步衡量买入意愿的绝对强度[25] 因子具体构建过程:具体计算方式请参考专题报告《选股因子系列研究(六十四)——基于直观逻辑和机器学习的高频数据低频化应用》[25] 5. **因子名称:开盘后大单净买入占比因子** 因子构建思路:分析开盘后大单净买入金额在总成交额中的占比,捕捉大资金动向[30] 6. **因子名称:开盘后大单净买入强度因子** 因子构建思路:衡量开盘后大单净买入的绝对强度[34] 7. **因子名称:改进反转因子** 因子构建思路:对传统反转因子进行改进,以更好地捕捉价格反转效应[40] 8. **因子名称:尾盘成交占比因子** 因子构建思路:通过分析尾盘成交额在日总成交额中的占比,捕捉资金在尾盘的动向[44] 9. **因子名称:平均单笔流出金额占比因子** 因子构建思路:计算平均单笔流出金额在总流出金额中的占比,分析资金流出特征[49] 10. **因子名称:大单推动涨幅因子** 因子构建思路:衡量由大单交易推动的股价上涨幅度[54] 11. **因子名称:改进 GRU(50,2)+NN(10)因子** 因子构建思路:使用改进的门控循环单元(GRU)神经网络结合全连接网络(NN)从高频数据中提取预测信号[58] 12. **因子名称:残差注意力 LSTM(48,2)+NN(10)因子** 因子构建思路:使用结合了残差连接和注意力机制的长短期记忆网络(LSTM)结合全连接网络(NN)进行深度学习因子构建[59] 13. **因子名称:多颗粒度模型-5日标签因子** 因子构建思路:基于双向A-GRU网络,使用5日收益作为预测标签进行训练,从多时间颗粒度数据中学习[64] 14. **因子名称:多颗粒度模型-10日标签因子** 因子构建思路:基于双向A-GRU网络,使用10日收益作为预测标签进行训练[65] 因子的回测效果 1. **日内高频偏度因子**,历史IC 0.019[9],2025年IC 0.023[9],历史 e^(-rank mae) 0.324[9],2025年 e^(-rank mae) 0.327[9],上周多空收益 -0.26%[9],11月多空收益 0.49%[9],2025YTD多空收益 22.76%[9],2025年周胜率 30/46[9],上周多头超额收益 0.42%[9],11月多头超额收益 1.46%[9],2025YTD多头超额收益 6.14%[9],2025年多头周胜率 25/46[9] 2. **日内下行波动占比因子**,历史IC 0.016[9],2025年IC 0.020[9],历史 e^(-rank mae) 0.323[9],2025年 e^(-rank mae) 0.325[9],上周多空收益 0.38%[9],11月多空收益 1.35%[9],2025YTD多空收益 20.32%[9],2025年周胜率 32/46[9],上周多头超额收益 0.41%[9],11月多头超额收益 1.08%[9],2025YTD多头超额收益 3.54%[9],2025年多头周胜率 26/46[9] 3. **开盘后买入意愿占比因子**,历史IC 0.025[9],2025年IC 0.024[9],历史 e^(-rank mae) 0.321[9],2025年 e^(-rank mae) 0.321[9],上周多空收益 0.28%[9],11月多空收益 -0.01%[9],2025YTD多空收益 19.33%[9],2025年周胜率 36/46[9],上周多头超额收益 0.47%[9],11月多头超额收益 0.28%[9],2025YTD多头超额收益 8.78%[9],2025年多头周胜率 29/46[9] 4. **开盘后买入意愿强度因子**,历史IC 0.030[9],2025年IC 0.027[9],历史 e^(-rank mae) 0.326[9],2025年 e^(-rank mae) 0.326[9],上周多空收益 0.27%[9],11月多空收益 0.57%[9],2025YTD多空收益 26.36%[9],2025年周胜率 35/46[9],上周多头超额收益 -0.22%[9],11月多头超额收益 -0.55%[9],2025YTD多头超额收益 10.06%[9],2025年多头周胜率 33/46[9] 5. **开盘后大单净买入占比因子**,历史IC 0.035[9],2025年IC 0.020[9],历史 e^(-rank mae) 0.322[9],2025年 e^(-rank mae) 0.317[9],上周多空收益 -0.20%[9],11月多空收益 -0.44%[9],2025YTD多空收益 20.50%[9],2025年周胜率 32/46[9],上周多头超额收益 -0.21%[9],11月多头超额收益 -0.63%[9],2025YTD多头超额收益 9.22%[9],2025年多头周胜率 29/46[9] 6. **开盘后大单净买入强度因子**,历史IC 0.024[9],2025年IC 0.014[9],历史 e^(-rank mae) 0.320[9],2025年 e^(-rank mae) 0.316[9],上周多空收益 -0.88%[9],11月多空收益 -1.89%[9],2025YTD多空收益 10.71%[9],2025年周胜率 27/46[9],上周多头超额收益 -0.66%[9],11月多头超额收益 -1.23%[9],2025YTD多头超额收益 7.50%[9],2025年多头周胜率 31/46[9] 7. **改进反转因子**,历史IC 0.031[9],2025年IC 0.022[9],历史 e^(-rank mae) 0.330[9],2025年 e^(-rank mae) 0.330[9],上周多空收益 0.27%[9],11月多空收益 -0.09%[9],2025YTD多空收益 21.93%[9],2025年周胜率 35/46[9],上周多头超额收益 -0.43%[9],11月多头超额收益 -0.68%[9],2025YTD多头超额收益 7.79%[9],2025年多头周胜率 26/46[9] 8. **尾盘成交占比因子**,历史IC 0.026[9],2025年IC 0.016[9],历史 e^(-rank mae) 0.322[9],2025年 e^(-rank mae) 0.319[9],上周多空收益 0.81%[9],11月多空收益 0.25%[9],2025YTD多空收益 16.02%[9],2025年周胜率 30/46[9],上周多头超额收益 0.77%[9],11月多头超额收益 0.31%[9],2025YTD多头超额收益 5.33%[9],2025年多头周胜率 25/46[9] 9. **平均单笔流出金额占比因子**,历史IC 0.008[11],2025年IC -0.005[11],历史 e^(-rank mae) 0.317[11],2025年 e^(-rank mae) 0.315[11],上周多空收益 -1.33%[11],11月多空收益 -2.74%[11],2025YTD多空收益 -5.80%[11],2025年周胜率 21/46[11],上周多头超额收益 -0.07%[11],11月多头超额收益 -0.48%[11],2025YTD多头超额收益 -1.93%[11],2025年多头周胜率 18/46[11] 10. **大单推动涨幅因子**,历史IC 0.018[11],2025年IC 0.010[11],历史 e^(-rank mae) 0.325[11],2025年 e^(-rank mae) 0.326[11],上周多空收益 0.36%[11],11月多空收益 0.71%[11],2025YTD多空收益 9.32%[11],2025年周胜率 30/46[11],上周多头超额收益 -0.17%[11],11月多头超额收益 -0.43%[11],2025YTD多头超额收益 2.17%[11],2025年多头周胜率 25/46[11] 11. **改进 GRU(50,2)+NN(10)因子**,历史IC 0.066[11],2025年IC 0.047[11],历史 e^(-rank mae) 0.336[11],2025年 e^(-rank mae) 0.333[11],上周多空收益 -1.32%[11],11月多空收益 -0.71%[11],2025YTD多空收益 44.83%[11],2025年周胜率 38/46[11],上周多头超额收益 -0.77%[11],11月多头超额收益 -1.01%[11],2025YTD多头超额收益 7.21%[11],2025年多头周胜率 26/46[11] 12. **残差注意力 LSTM(48,2)+NN(10)因子**,历史IC 0.063[11],2025年IC 0.046[11],历史 e^(-rank mae) 0.334[11],2025年 e^(-rank mae) 0.331[11],上周多空收益 -1.50%[11],11月多空收益 -1.23%[11],2025YTD多空收益 44.56%[11],2025年周胜率 42/46[11],上周多头超额收益 -0.83%[11],11月多头超额收益 -0.92%[11],2025YTD多头超额收益 7.90%[11],2025年多头周胜率 27/46[11] 13. **多颗粒度模型-5日标签因子**,历史IC 0.080[11],2025年IC 0.068[11],历史 e^(-rank mae) 0.344[11],2025年 e^(-rank mae) 0.341[11],上周多空收益 0.75%[11],11月多空收益 2.56%[11],2025YTD多空收益 63.15%[11],2025年周胜率 42/46[11],上周多头超额收益 1.07%[11],11月多头超额收益 2.36%[11],2025YTD多头超额收益 24.44%[11],2025年多头周胜率 38/46[11] 14. **多颗粒度模型-10日标签因子**,历史IC 0.074[11],2025年IC 0.062[11],历史 e^(-rank mae) 0.342[11],2025年 e^(-rank mae) 0.342[11],上周多空收益 0.91%[11],11月多空收益 2.55%[11],2025YTD多空收益 57.70%[11],2025年周胜率 41/46[11],上周多头超额收益 0.98%[11],11月多头超额收益 2.27%[11],2025YTD多头超额收益 24.14%[11],2025年多头周胜率 36/46[11] 量化模型与构建方式 1. **模型名称:中证500 AI增强宽约束组合** 模型构建思路:基于深度学习因子(多颗粒度模型-10日标签)构建中证500指数增强组合,采用较宽的约束条件控制风险[69] 模型具体构建过程:组合优化目标为最大化预期收益,目标函数为 $$max\sum\mu_{i}w_{i}$$,其中 $$w_i$$ 为股票i的权重,$$\mu_i$$ 为股票i的预期超额收益[70] 风险控制约束包括:个股权重偏离1%,行业偏离1%,市值因子暴露0.3,市净率(PB)因子暴露0.3,市值三次方因子暴露0.3,换手率约束0.3[70] 测试中假定以次日均价成交,并扣除双边3‰的交易成本[71] 2. **模型名称:中证500 AI增强严约束组合** 模型构建思路:基于深度学习因子(多颗粒度模型-10日标签)构建中证500指数增强组合,采用更严格的约束条件控制风险[69] 模型具体构建过程:组合优化目标为最大化预期收益,目标函数为 $$max\sum\mu_{i}w_{i}$$[70] 风险控制约束包括:个股权重偏离1%,行业偏离1%,市值因子暴露0.1,市净率(PB)因子暴露0.3,市值二次方因子暴露0.1,ROE因子暴露0.3,SUE因子暴露0.3,波动率因子暴露0.3,成份股权重约束0.8,换手率约束0.3[70] 测试中假定以次日均价成交,并扣除双边3‰的交易成本[71] 3. **模型名称:中证1000 AI增强宽约束组合** 模型构建思路:基于深度学习因子(多颗粒度模型-10日标签)构建中证1000指数增强组合,采用较宽的约束条件控制风险[69] 模型具体构建过程:组合优化目标为最大化预期收益,目标函数为 $$max\sum\mu_{i}w_{i}$$[70] 风险控制约束包括:个股权重偏离1%,行业偏离1%,市值因子暴露0.3,市净率(PB)因子暴露0.3,市值三次方因子暴露0.3,换手率约束0.3[70] 测试中假定以次日均价成交,并扣除双边3‰的交易成本[71] 4. **模型名称:中证1000 AI增强严约束组合** 模型构建思路:基于深度学习因子(多颗粒度模型-10日标签)构建中证1000指数增强组合,采用更严格的约束条件控制风险[69] 模型具体构建过程:组合优化目标为最大化预期收益,目标函数为 $$max\sum\mu_{i}w_{i}$$[70] 风险控制约束包括:个股权重偏离1%,行业偏离1%,市值因子暴露0.1,市净率(PB)因子暴露0.3,市值二次方因子暴露0.1,ROE因子暴露0.3,SUE因子暴露0.3,波动率因子暴露0.3,成份股权重约束0.8,换手率约束0.3[70] 测试中假定以次日均价成交,并扣除双边3‰的交易成本[71] 模型的回测效果 1. **中证500 AI增强宽约束组合**,上周超额收益 2.02%[12],11月超额收益 3.38%[12],2025YTD超额收益 7.31%[12],2025年周胜率 27/46[12] 2. **中证500 AI增强严约束组合**,上周超额收益 0.73%[12],11月超额收益 2.35%[12],2025YTD超额收益 10.58%[12],2025年周胜率 30/46[12] 3. **中证1000 AI增强宽约束组合**,上周超额收益 2.41%[12],11月超额收益 4.46%[12],2025YTD超额收益 18.45%[12],2025年周胜率 31/46[12] 4. **中证1000 AI增强严约束组合**,上周超额收益 1.00%[12],11月超额收益 1.83%[12],2025YTD超额收益 20.66%[12],
市场情绪监控周报(20251027-20251031):深度学习因子10月超额-0.07%,本周热度变化最大行业为有石油石化、综合-20251103
华创证券· 2025-11-03 20:54
量化模型与构建方式 1. 模型名称:DecompGRU模型 **模型构建思路**:在GRU基线模型的基础上,通过两个简单的去均值模块实现时序和截面的信息交互上的改进[18] **模型具体构建过程**:模型分别基于IC、加权MSE损失函数训练两个模型[18] 2. 模型名称:多头TOP组合 **模型构建思路**:基于DecompGRU模型得分构建周度多头选股组合[9] **模型具体构建过程**:等权持有集成打分最高的200只股票;每周首个交易日根据上周五收盘后更新的因子值进行周频调仓;选股范围为中证全指;买入时剔除涨跌停、停牌股票,不考虑交易成本;对比基准为WIND全A等权指数[9] 3. 模型名称:ETF轮动组合 **模型构建思路**:将端到端模型的个股得分聚合至ETF,构建ETF轮动组合[12] **模型具体构建过程**:ETF池限定在行业、主题型ETF;若多个ETF跟踪同一指数相同,则保留5日成交额均值最大的一只ETF;调仓时要求ETF最近5日的日均成交额大于2000万,最近20日日均成交额大于1000万;周度不定期调仓,每期持仓ETF数量在2-6只;对比基准为万得ETF指数[12] 模型的回测效果 1. 多头TOP组合 累计绝对收益41.11%,相对全A等权超额13.98%,最大回撤10.08%,周度胜率64.52%,月度胜率100%,10月绝对收益1.78%,10月超额-0.07%[11] 2. ETF轮动组合 累计绝对收益19.06%,相对基准超额-2.00%,最大回撤7.82%,周度胜率62.50%,月度胜率57.14%,10月绝对收益-2.04%,10月超额-1.18%[14][15] 量化因子与构建方式 1. 因子名称:个股总热度指标 **因子构建思路**:从行为的角度探讨在个股层面因有限注意力导致的过度定价与反应不足现象,使用同花顺基于用户行为数据得到的个股热度指标[19] **因子具体构建过程**:股票的浏览、自选与点击次数之和,以同一日在全市场占比的方式进行归一化,将归一化后的数值乘以10000,指标取值区间为[0,10000][19] **因子计算公式**:$$个股总热度 = \frac{浏览次数+自选次数+点击次数}{全市场总次数} \times 10000$$[19] 2. 因子名称:宽基热度变化率 **因子构建思路**:将全A样本按照主流宽基指数分组,对每组成分股总热度指标进行求和,计算周度热度变化率[20][22] **因子具体构建过程**:将全A样本按照沪深300、中证500、中证1000、中证2000以及"其他"来进行分组,对每一组中的成分股总热度指标进行求和处理,得到4个主流宽基指数的热度以及"其他"组热度,计算不同组股票周度热度变化率,并取MA2进行平滑处理[20][22] 3. 因子名称:行业热度变化率 **因子构建思路**:采用相同方法获得行业层面的热度,计算申万一级、二级行业热度的周度变化率MA2[31] **因子具体构建过程**:对每个申万一级、二级行业中的成分股总热度指标进行求和处理,计算每个行业热度的周度变化率,并取MA2进行平滑处理[31] 4. 因子名称:概念热度变化率 **因子构建思路**:采用相同方法获得概念层面的热度,计算每个概念热度的周度变化率[36] **因子具体构建过程**:对每个概念中的成分股总热度指标进行求和处理,计算每个概念热度的周度变化率[36] 因子的回测效果 1. 宽基热度动量组合 2017年来年化收益率8.74%,最大回撤23.5%,2025年组合收益为38.5%,对比基准宽基等权组合收益为32.9%[28] 2. 高热度概念+低热度个股组合 BOTTOM组年化收益15.71%,最大回撤28.89%,2025年来BOTTOM组收益42.1%[41] 3. 本周宽基热度变化率 热度变化率最大的为中证2000,相比上周提高1.55%,最小的为沪深300,相比上周降低2.03%[28][30] 4. 本周行业热度变化率 一级行业中正向变化前5的行业分别为石油石化(提高48.6%)、综合、农林牧渔、建筑材料、煤炭,负向变化前5的行业分别为食品饮料、银行、纺织服饰、商贸零售、有色金属(降低-14.2%);二级行业中热度正向变化率最大的5个行业是油服工程、航天装备Ⅱ、冶钢原料、文娱用品、元件[35] 5. 本周概念热度变化率 热度变化最大的5个概念为科创次新股(360.2%)、中韩自贸区(183.3%)、青蒿素(82.8%)、家庭医生(74.1%)、云办公(72.7%)[35][36][44]
机器学习因子选股月报(2025年10月)-20250930
西南证券· 2025-09-30 12:03
根据研报内容,总结如下: 量化模型与构建方式 1. **模型名称:GAN_GRU模型**[4][13] * **模型构建思路**:该模型是一个深度学习选股模型,其核心思路是利用生成式对抗网络(GAN)对量价时序特征进行增强处理,然后再利用门控循环单元(GRU)网络对处理后的时序特征进行编码,以预测股票的未来收益[4][13]。 * **模型具体构建过程**: * **基础特征**:模型输入为18个量价特征,包括日频特征(如开盘价、收盘价、成交量等)和月频特征(如月涨跌幅、月换手率等)[17][19]。 * **特征预处理**:每次采样的40天内,每个特征在时序上去极值并标准化;每个特征在个股层面上进行截面标准化[18]。 * **GAN特征生成**: * **生成器(G)**:采用LSTM模型,输入原始量价时序特征(形状为40*18),输出经处理后的量价时序特征(形状仍为40*18)[33][37]。其损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 是随机噪声,\(G(z)\) 是生成的数据,\(D(G(z))\) 是判别器判断生成数据为真的概率[24]。 * **判别器(D)**:采用CNN模型,用于区分真实量价特征和生成器生成的特征。其损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 是真实数据,\(D(x)\) 是判别器对真实数据的输出概率[27]。 * **训练过程**:生成器和判别器交替训练,直至模型收敛[29][30]。 * **GRU收益预测**:将GAN中生成器输出的增强后特征,输入到一个两层GRU网络(GRU(128, 128))中,后面再接一个多层感知机MLP(MLP(256, 64, 64))。模型最终输出的预测收益(pRet)即作为选股因子[22]。 * **训练与预测设置**: * 使用过去400天内的数据,每5个交易日采样一次,采样形状为40*18,用以预测未来20个交易日的累计收益[18]。 * 训练集与验证集比例为80%:20%[18]。 * 采用半年滚动训练,每年6月30日和12月31日进行模型训练,用于未来半年的预测[18]。 * 回测中,因子经过行业和市值中性化以及标准化处理[22]。 模型的回测效果 1. **GAN_GRU模型**,IC均值0.1136[41][42],ICIR(未年化)0.89[42],换手率0.83[42],年化收益率37.41%[42],年化波动率23.59%[42],信息比率(IR)1.59[42],最大回撤率27.29%[42],年化超额收益率22.58%[41][42] 量化因子与构建方式 1. **因子名称:GAN_GRU因子**[4][13] * **因子构建思路**:该因子是GAN_GRU模型输出的股票未来收益预测值,直接作为选股依据[4][13][22]。 * **因子具体构建过程**:因子构建过程与上述GAN_GRU模型的构建过程完全一致,因子值即为模型的最终输出(pRet)[22]。 因子的回测效果 1. **GAN_GRU因子**,IC均值0.1136[41][42],近期IC值(2025年9月)0.1053[41][42],近一年IC均值0.0982[41][42]
高频选股因子周报:高频因子表现分化,深度学习因子依然强势。AI 增强组合分化,500 增强依然大幅回撤,1000 增强回撤收窄。-20250928
国泰海通证券· 2025-09-28 20:37
根据研报内容,以下是关于量化因子和模型的总结: 量化因子与构建方式 **1 因子名称:日内高频偏度因子** - 因子构建思路:基于股票日内高频收益的分布特征构建,捕捉收益分布的非对称性[13] - 因子具体构建过程:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》[13] **2 因子名称:日内下行波动占比因子** - 因子构建思路:通过分解已实现波动,衡量下行波动在总波动中的占比[18] - 因子具体构建过程:参考专题报告《选股因子系列研究(二十五)——高频因子之已实现波动分解》[18] **3 因子名称:开盘后买入意愿占比因子** - 因子构建思路:基于开盘后的交易行为数据,衡量买入意愿的强度[22] - 因子具体构建过程:参考专题报告《选股因子系列研究(六十四)——基于直观逻辑和机器学习的高频数据低频化应用》[22] **4 因子名称:开盘后买入意愿强度因子** - 因子构建思路:进一步量化开盘后买入意愿的强度水平[26] - 因子具体构建过程:参考专题报告《选股因子系列研究(六十四)——基于直观逻辑和机器学习的高频数据低频化应用》[26] **5 因子名称:开盘后大单净买入占比因子** - 因子构建思路:分析开盘后大单净买入在总交易中的占比[30] **6 因子名称:开盘后大单净买入强度因子** - 因子构建思路:衡量开盘后大单净买入的强度水平[35] **7 因子名称:改进反转因子** - 因子构建思路:对传统反转因子进行改进优化[40] **8 因子名称:尾盘成交占比因子** - 因子构建思路:分析尾盘成交在当日总成交中的占比[45] **9 因子名称:平均单笔流出金额占比因子** - 因子构建思路:衡量平均单笔流出金额的相对占比[51] **10 因子名称:大单推动涨幅因子** - 因子构建思路:分析大单交易对股价涨幅的推动作用[56] **11 因子名称:改进GRU(50,2)+NN(10)因子** - 因子构建思路:基于门控循环单元(GRU)和神经网络(NN)的深度学习模型[61] **12 因子名称:残差注意力LSTM(48,2)+NN(10)因子** - 因子构建思路:结合残差注意力机制的长短期记忆网络(LSTM)模型[62] **13 因子名称:多颗粒度模型-5日标签因子** - 因子构建思路:基于多时间颗粒度数据,使用5日收益标签训练[67] - 因子具体构建过程:因子基于双向AGRU训练得到[67] **14 因子名称:多颗粒度模型-10日标签因子** - 因子构建思路:基于多时间颗粒度数据,使用10日收益标签训练[68] - 因子具体构建过程:因子基于双向AGRU训练得到[68] 量化模型与构建方式 **1 模型名称:中证500 AI增强宽约束组合** - 模型构建思路:基于深度学习因子构建指数增强组合,采用相对宽松的约束条件[72] - 模型具体构建过程:优化目标为最大化预期收益,目标函数为$$max\sum\mu_{i}w_{i}$$,其中$w_i$为股票权重,$\mu_i$为预期超额收益[73] **2 模型名称:中证500 AI增强严约束组合** - 模型构建思路:基于深度学习因子构建指数增强组合,采用严格的约束条件[72] **3 模型名称:中证1000 AI增强宽约束组合** - 模型构建思路:基于深度学习因子构建指数增强组合,采用相对宽松的约束条件[72] **4 模型名称:中证1000 AI增强严约束组合** - 模型构建思路:基于深度学习因子构建指数增强组合,采用严格的约束条件[72] 因子的回测效果 **1 日内高频偏度因子**:历史IC 0.027,2025年IC 0.042,历史e^(-rank mae) 0.324,2025年e^(-rank mae) 0.329,9月多空收益3.82%,2025YTD多空收益16.22%,2025年月胜率6/9,9月多头超额1.74%,2025YTD多头超额5.14%[9] **2 日内下行波动占比因子**:历史IC 0.025,2025年IC 0.036,历史e^(-rank mae) 0.324,2025年e^(-rank mae) 0.326,9月多空收益2.86%,2025YTD多空收益13.58%,2025年月胜率7/9,9月多头超额0.55%,2025YTD多头超额1.41%[9] **3 开盘后买入意愿占比因子**:历史IC 0.032,2025年IC 0.030,历史e^(-rank mae) 0.322,2025年e^(-rank mae) 0.324,9月多空收益0.68%,2025YTD多空收益10.39%,2025年月胜率6/9,9月多头超额0.54%,2025YTD多头超额4.07%[9] **4 开盘后买入意愿强度因子**:历史IC 0.035,2025年IC 0.030,历史e^(-rank mae) 0.326,2025年e^(-rank mae) 0.329,9月多空收益0.65%,2025YTD多空收益11.29%,2025年月胜率7/9,9月多头超额0.60%,2025YTD多头超额4.52%[9] **5 开盘后大单净买入占比因子**:历史IC 0.041,2025年IC 0.035,历史e^(-rank mae) 0.324,2025年e^(-rank mae) 0.324,9月多空收益1.49%,2025YTD多空收益15.60%,2025年月胜率8/9,9月多头超额0.35%,2025YTD多头超额7.93%[9] **6 开盘后大单净买入强度因子**:历史IC 0.033,2025年IC 0.028,历史e^(-rank mae) 0.323,2025年e^(-rank mae) 0.322,9月多空收益0.88%,2025YTD多空收益11.30%,2025年月胜率8/9,9月多头超额0.80%,2025YTD多头超额6.14%[9] **7 改进反转因子**:历史IC 0.032,2025年IC 0.016,历史e^(-rank mae) 0.324,2025年e^(-rank mae) 0.331,9月多空收益-0.81%,2025YTD多空收益4.07%,2025年月胜率5/9,9月多头超额-0.63%,2025YTD多头超额3.61%[9] **8 尾盘成交占比因子**:历史IC 0.049,2025年IC 0.030,历史e^(-rank mae) 0.332,2025年e^(-rank mae) 0.323,9月多空收益2.13%,2025YTD多空收益14.11%,2025年月胜率7/9,9月多头超额0.58%,2025YTD多头超额6.10%[9] **9 平均单笔流出金额占比因子**:历史IC 0.020,2025年IC 0.009,历史e^(-rank mae) 0.317,2025年e^(-rank mae) 0.318,9月多空收益-0.48%,2025YTD多空收益3.59%,2025年月胜率5/9,9月多头超额0.80%,2025YTD多头超额3.67%[9] **10 大单推动涨幅因子**:历史IC 0.016,2025年IC 0.010,历史e^(-rank mae) 0.322,2025年e^(-rank mae) 0.327,9月多空收益2.23%,2025YTD多空收益7.36%,2025年月胜率7/9,9月多头超额1.19%,2025YTD多头超额3.34%[9] 模型的回测效果 **1 中证500 AI增强宽约束组合**:上周超额收益-1.36%,9月超额收益-3.85%,2025YTD超额收益0.94%,2025年周胜率23/39[13] **2 中证500 AI增强严约束组合**:上周超额收益-1.35%,9月超额收益-1.33%,2025YTD超额收益3.70%,2025年周胜率24/39[13] **3 中证1000 AI增强宽约束组合**:上周超额收益0.40%,9月超额收益0.42%,2025YTD超额收益9.15%,2025年周胜率26/39[13] **4 中证1000 AI增强严约束组合**:上周超额收益-0.19%,9月超额收益0.67%,2025YTD超额收益14.01%,2025年周胜率25/39[13]
深度学习因子月报:Meta因子今年已实现超额收益36.8%-20250818
民生证券· 2025-08-18 16:55
量化模型与因子总结 量化因子与构建方式 1. **因子名称:DL_EM_Dynamic因子** * **因子构建思路**:采用矩阵分解算法从基金选股网络中提取股票的内在属性,并将其与LSTM生成的因子表示结合,构建动态市场状态因子以增强模型表现[19]。 * **因子具体构建过程**: 1. 利用基金年报、半年报的持仓数据,采用矩阵分解方法,将基金-股票的投资网络矩阵分解为基金内在属性矩阵和股票内在属性矩阵。 2. 使用LSTM模型处理量价等时序数据,生成股票的动态因子表示。 3. 将矩阵分解得到的静态股票内在属性,通过计算其与当日市场热度风格的相似度,转化为动态市场状态因子。 4. 将LSTM生成的动态因子表示与动态市场状态因子进行拼接。 5. 将拼接后的特征共同输入到多层感知机(MLP)中进行训练,最终输出因子预测值[19]。 2. **因子名称:Meta_RiskControl因子** * **因子构建思路**:在深度学习模型中引入风格暴露控制,通过修改损失函数加入风格偏离惩罚,并结合元增量学习框架使模型快速适应市场变化,以控制策略回撤风险[26]。 * **因子具体构建过程**: 1. 模型基础架构为加入了风格因子输入的ALSTM(Attention LSTM)模型。 2. 将模型的预测输出乘以对应股票的因子暴露(即风格暴露)。 3. 设计新的损失函数,在RankIC的基础上,添加对于风格偏离与风格动量的惩罚项。具体地,用预测标签的多头部分风格暴露减去空头部分风格暴露,作为惩罚项的一部分。 4. 在外层训练框架上,沿用元增量学习(Meta Incremental Learning)框架,根据近期市场数据分布对模型进行快速调整和更新[26]。 3. **因子名称:Meta_Master因子** * **因子构建思路**:改进MASTER模型,通过引入由深度风险模型计算的新市场状态特征,并替换损失函数和采用元增量学习训练框架,以提升模型对市场状态的自适应能力和预测准确性[36]。 * **因子具体构建过程**: 1. 市场状态构建:利用深度风险模型(相比Barra风格因子对收益解释度提升5%)计算市场状态;利用近期上涨最好股票的风格来衡量近期市场偏好,共计构建120个新特征来代表市场状态。 2. 模型基础:基于改进的MASTER(Market-Guided Stock Transformer)模型,该模型旨在捕获股票间瞬时和跨时间的相关性,并利用市场信息进行自动特征选择。 3. 损失函数:将损失函数替换为加权均方误差(Weighted MSE),通过放大多头端的预测误差来提高模型在多头端预测的准确率。 4. 训练框架:利用在线的元增量学习(Online Meta Incremental Learning)对模型进行定期更新,使模型能快速适应动态变化的市场[36]。 4. **因子名称:深度学习可转债因子** * **因子构建思路**:针对可转债特性,利用GRU神经网络学习其非线性定价逻辑,通过引入可转债特有的时序因子并与截面属性因子结合,以提升传统可转债投资策略的效果[50]。 * **因子具体构建过程**: 1. 使用门控循环单元(GRU)神经网络作为基础模型,处理可转债的时序数据。 2. 将可转债特有的时序因子(如溢价率、波动率等)引入到GRU模型中。 3. 将GRU模型的输出与可转债的截面属性因子(如转债规模、评级、行业等)进行拼接。 4. 将拼接后的综合特征输入到预测层,用于预测可转债的未来收益[50]。 因子回测效果 1. **DL_EM_Dynamic因子** * 最近一月(4周)表现(中证1000):RankIC 11.3%, 多空收益 1.4%, 多头超额收益 0.4%[7] * 最近一季(12周)表现(中证1000):RankIC 9.5%, 多空收益 0.1%, 多头超额收益 -0.9%[7] * 今年表现(中证1000):RankIC 10.6%, 多空收益 22.3%, 多头超额收益 4.9%[9] * 全历史表现(2019年至今,中证1000):RankIC 8.3%, 多空收益 65.8%, 多头超额收益 12.2%[9] * 指数增强组合(中证1000,2019年以来):年化收益 29.7%, 年化超额收益 23.4%, 信息比率(IR) 2.03, 超额收益累计最大回撤 -10.1%[23] 2. **Meta_RiskControl因子** * **全A域表现**: * 最近一月(4周):RankIC 15.5%, 多空收益 5.2%, 多头超额收益(vs中证800)2.7%[7] * 最近一季(12周):RankIC 12.2%, 多空收益 9.1%, 多头超额收益(vs中证800)8.9%[7] * 今年表现:RankIC 12.3%, 多空收益 41.0%, 多头超额收益(vs中证800)29.0%[9] * 全历史表现(2019年至今):RankIC 10.6%, 多空收益 90.3%, 多头超额收益(vs中证800)25.0%[9] * **沪深300增强组合**(2019年以来):年化收益 20.1%, 年化超额收益 15.0%, 信息比率(IR) 1.58, 超额收益累计最大回撤 -5.8%[31] * **中证500增强组合**(2019年以来):年化收益 26.1%, 年化超额收益 19.2%, 信息比率(IR) 1.97, 超额收益累计最大回撤 -9.3%[33] * **中证1000增强组合**(2019年以来):年化收益 34.1%, 年化超额收益 27.0%, 信息比率(IR) 2.36, 超额收益累计最大回撤 -10.2%[35] 3. **Meta_Master因子** * **全A域表现**: * 最近一月(4周):RankIC 18.9%, 多空收益 5.4%, 多头超额收益(vs中证800)5.1%[7] * 最近一季(12周):RankIC 14.6%, 多空收益 20.3%, 多头超额收益(vs中证800)19.0%[7] * 今年表现:RankIC 13.5%, 多空收益 64.0%, 多头超额收益(vs中证800)36.8%[9] * 全历史表现(2019年至今):RankIC 11.7%, 多空收益 90.4%, 多头超额收益(vs中证800)35.6%[9] * **沪深300增强组合**(2019年以来):年化收益 22.0%, 年化超额收益 17.5%, 信息比率(IR) 2.09, 超额收益累计最大回撤 -7.2%[39] * **中证500增强组合**(2019年以来):年化收益 23.8%, 年化超额收益 18.2%, 信息比率(IR) 1.9, 超额收益累计最大回撤 -5.8%[45] * **中证1000增强组合**(2019年以来):年化收益 30.7%, 年化超额收益 25.2%, 信息比率(IR) 2.33, 超额收益累计最大回撤 -8.8%[47] 4. **深度学习可转债因子** * **中证转债域**: * 最近一月(4周):RankIC 10.1%, 多头超额收益(vs中证转债)0.9%[7] * 最近一季(12周):RankIC 7.5%, 多头超额收益(vs中证转债)1.2%[7] * 今年表现:RankIC 7.1%, 多头超额收益(vs中证转债)0.3%[9] * 全历史表现(2021年至今):RankIC 12.0%, 多头超额收益(vs中证转债)9.9%[9] * **分类型表现(2021年以来Top50组合年化超额收益)**: * 偏债型:4.4%[55] * 平衡型:4.0%[55] * 偏股型:5.8%[55] * 偏债+平衡混合策略:10.9%[55]
市场情绪监控周报(20250728-20250801):深度学习因子7月超额1.59%,本周热度变化最大行业为建筑材料、建筑装饰-20250804
华创证券· 2025-08-04 19:44
根据研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称**:DecompGRU模型 - **模型构建思路**:基于趋势分解的时序+截面端到端模型,通过改进GRU基线模型实现时序和截面信息交互[8] - **模型具体构建过程**: 1. 使用两个去均值模块处理时序和截面数据 2. 基于IC和加权MSE损失函数分别训练两个子模型(DecompGRU_IC、DecompGRU_MSE)[14] 3. 输出个股得分并构建组合: - 选股范围:中证全指 - 调仓频率:周频(每周首个交易日调仓) - 组合构建:等权持有得分TOP200股票,剔除涨跌停/停牌股[8] - **模型评价**:通过分解模块增强模型对市场趋势的捕捉能力,实现端到端预测[14] 2. **ETF轮动模型** - **构建思路**:将DecompGRU个股得分聚合至行业/主题ETF[10] - **具体构建**: 1. ETF池筛选标准: - 行业/主题型ETF - 5日成交额均值>2000万,20日日均成交额>1000万 - 同指数ETF保留成交额最大者 2. 持仓规则:每期持有3-6只ETF,周度不定期调仓[10] --- 量化因子与构建方式 1. **情绪热度因子** - **构建思路**:通过同花顺用户行为数据(浏览/自选/点击)构建市场情绪代理指标[18] - **具体构建**: 1. 个股热度计算: $$总热度 = \frac{浏览+自选+点击次数}{全市场总和} \times 10000$$ 取值区间[0,10000][18] 2. 聚合方法: - 宽基热度:按成分股分组(沪深300/中证500/中证1000/中证2000/其他)求和[19] - 行业热度:按申万一级/二级行业分组求和[30] - 概念热度:按概念成分股分组求和[39] - **因子评价**:有效捕捉市场有限注意力导致的定价偏差[17] 2. **热度变化率因子** - **构建过程**: 1. 计算周度热度变化率: $$\Delta H_t = \frac{H_t - H_{t-1}}{H_{t-1}}$$ 2. 取MA2平滑处理[22] 3. 应用场景: - 宽基轮动:买入变化率最大的宽基(排除"其他"组)[24] - 概念组合:筛选变化率TOP5概念中的低热度个股[42] 3. **估值分位数因子** - **构建方法**: 1. 计算滚动5年PE/PB历史分位数[50] 2. 行业分位数回溯至2015年[53] 3. 输出: - 宽基分位数(沪深300/中证500/中证1000)[52] - 申万一级/二级行业分位数[54] --- 模型回测效果 | 模型/组合 | 累计收益 | 超额收益 | 最大回撤 | 周胜率 | 月胜率 | 测试周期 | |---------------------|----------|----------|----------|--------|--------|----------------| | DecompGRU TOP200 | 24.54% | 9.80% | 10.08% | 72.22% | 100% | 2025/3/31-8/1 [10] | | ETF轮动组合 | 12.97% | 8.65% | 6.16% | 68.42% | 75% | 2025/3/18-8/1 [12] | | 宽基热度轮动策略 | 18.8%* | 1.7%* | 23.5% | - | - | 2017-2025 [27] | | 概念BOTTOM组合 | 27%** | - | 28.89% | - | - | 2025年内 [44] | (*相对宽基等权基准 **年化15.71%) --- 因子回测效果 1. **宽基热度变化率**(2025/8/1): - 中证500:+10.21% - 中证2000:-6.02% [29] 2. **行业热度变化率**(2025/8/1): - 正向TOP5:建筑材料(+83.5%)、建筑装饰、社会服务、钢铁、食品饮料 - 负向TOP5:公用事业(-32.5%)、轻工制造、纺织服饰、汽车、房地产 [38] 3. **估值分位数**: - 宽基:中证500(95%) > 中证1000(84%) > 沪深300(70%) [52] - 一级行业高估:电力设备/计算机/银行(>80%) - 一级行业低估:农林牧渔/家电(<20%) [53]
高频选股因子周报:高频因子上周表现分化,日内收益与尾盘占比因子强势。深度学习因子依然稳健, AI 增强组合上周表现有所分化。-20250629
国泰海通证券· 2025-06-29 19:24
量化因子与构建方式 1. **因子名称:日内高频偏度因子** - 构建思路:衡量股票日内收益分布的偏度特征[4] - 具体构建过程:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》,对常规因子进行正交化处理[10] 2. **因子名称:日内下行波动占比因子** - 构建思路:分解已实现波动中的下行波动部分占比[4] - 具体构建过程:参考《选股因子系列研究(二十五)——高频因子之已实现波动分解》[14] 3. **因子名称:开盘后买入意愿占比因子** - 构建思路:捕捉开盘后市场买入意愿的占比特征[4] - 具体构建过程:基于高频数据低频化方法,参考《选股因子系列研究(六十四)》[17] 4. **因子名称:开盘后买入意愿强度因子** - 构建思路:量化开盘后买入意愿的强度[4] - 具体构建过程:同开盘后买入意愿占比因子,但侧重强度计算[21] 5. **因子名称:开盘后大单净买入占比因子** - 构建思路:分析开盘后大单净买入的占比[4] - 具体构建过程:未披露详细公式,但需正交化处理[25] 6. **因子名称:改进反转因子** - 构建思路:优化传统反转因子的计算逻辑[4] - 具体构建过程:未披露具体公式[36] 7. **因子名称:尾盘成交占比因子** - 构建思路:衡量尾盘成交量在总成交中的占比[4] - 具体构建过程:未披露详细公式[37] 8. **因子名称:深度学习因子(改进GRU(50,2)+NN(10))** - 构建思路:结合GRU神经网络与全连接层预测收益[4] - 具体构建过程:使用GRU(50,2)提取时序特征,NN(10)输出预测值[52] 9. **因子名称:多颗粒度模型(5日标签)** - 构建思路:基于双向AGRU训练多时间颗粒度标签[57] - 具体构建过程:采用5日收益标签训练模型[60] 10. **因子名称:多颗粒度模型(10日标签)** - 构建思路:同5日标签模型,但标签周期延长至10日[60] 因子回测效果 1. **日内高频偏度因子** - 上周多空收益:-0.51% - 6月多空收益:1.48% - 2025年多空收益:14.73%[4] 2. **日内下行波动占比因子** - 上周多空收益:-0.04% - 6月多空收益:1.86% - 2025年多空收益:12.84%[4] 3. **开盘后买入意愿占比因子** - 上周多空收益:0.77% - 6月多空收益:1.85% - 2025年多空收益:11.44%[4] 4. **改进GRU(50,2)+NN(10)因子** - 上周多空收益:0.70% - 6月多空收益:3.58% - 2025年多空收益:19.78%[4] 5. **多颗粒度模型(5日标签)** - 上周多空收益:1.56% - 6月多空收益:5.97% - 2025年多空收益:35.45%[4] 量化模型与构建方式 1. **模型名称:中证500 AI增强宽约束组合** - 构建思路:基于多颗粒度模型因子,最大化预期收益[61] - 具体构建过程:目标函数为$$ \max \sum w_i \mu_i $$,其中$w_i$为权重,$\mu_i$为预期超额收益[67] - 约束条件:个股权重≤1%,行业偏离≤1%,市值暴露≤0.3[62] 2. **模型名称:中证1000 AI增强严约束组合** - 构建思路:同中证500模型,但约束更严格[61] - 具体构建过程:增加ROE、SUE等基本面约束[62] 模型回测效果 1. **中证500 AI增强宽约束组合** - 上周超额收益:-0.25% - 6月超额收益:-0.36% - 2025年超额收益:7.95%[10] 2. **中证1000 AI增强严约束组合** - 上周超额收益:-0.21% - 6月超额收益:0.60% - 2025年超额收益:12.99%[10]
高频选股因子周报(20250519- 20250523):高频因子表现有所分化,大单与买入意愿因子明显反弹, AI 增强组合继续强势表现-20250525
国泰海通证券· 2025-05-25 19:37
量化模型与构建方式 1. 高频因子 1. **因子名称**:日内高频偏度因子 **因子构建思路**:通过分析股票日内收益的偏度特征来捕捉市场情绪和价格波动异常[3][6] **因子具体构建过程**:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》,对常规因子进行正交化处理[11] **因子评价**:长期多空收益稳定,但5月表现较弱[3][6] 2. **因子名称**:日内下行波动占比因子 **因子构建思路**:衡量股票下跌波动在总波动中的占比,反映风险特征[3][6] **因子具体构建过程**:基于专题报告《选股因子系列研究(二十五)——高频因子之已实现波动分解》方法构建[17] 3. **因子名称**:开盘后买入意愿占比因子 **因子构建思路**:通过开盘后买入交易量占比捕捉资金流向[3][6] **因子具体构建过程**:采用《选股因子系列研究(六十四)——基于直观逻辑和机器学习的高频数据低频化应用》方法[21] 4. **因子名称**:开盘后大单净买入占比因子 **因子构建思路**:分析大单资金在开盘后的净流入情况[3][6] **因子评价**:2025年月胜率达100%,稳定性突出[7] 2. 深度学习因子 1. **因子名称**:改进GRU(50,2)+NN(10)因子 **因子构建思路**:结合门控循环单元和神经网络提取高频数据时序特征[3][14] **因子评价**:多空收益持续为正但多头超额收益为负[10] 2. **因子名称**:多颗粒度模型(5日标签) **因子构建思路**:基于双向AGRU训练,融合不同时间颗粒度的市场信息[15][66] **因子评价**:2025年多空收益达28.86%,表现最佳[10] 3. AI增强组合模型 **模型名称**:中证500/1000 AI增强组合 **模型构建思路**:以多颗粒度模型因子为核心,通过优化约束条件构建增强组合[69] **模型具体构建过程**: - 目标函数:$$max\sum\mu_{i}w_{i}$$,其中μi为股票预期超额收益[70] - 风险控制模块包含个股/行业约束、市值约束、财务指标约束等[70] - 交易成本假设为双边3‰[71] 回测效果 1. 高频因子 | 因子名称 | 上周多空收益 | 5月多空收益 | 2025年多空收益 | IC(2025) | RankMAE(2025) | |--------------------------|--------------|-------------|-----------------|----------|---------------| | 日内高频偏度因子 | 0.18% | -1.42% | 14.35% | 0.057 | 0.331 | | 开盘后大单净买入占比因子 | 0.31% | -0.33% | 12.32% | 0.039 | 0.324 | | 大单推动涨幅因子 | 0.36% | -0.53% | 4.26% | 0.005 | 0.322 | 2. 深度学习因子 | 因子名称 | 上周多空收益 | 5月多空收益 | 2025年多空收益 | 多头超额(2025) | |--------------------------|--------------|-------------|-----------------|----------------| | GRU(50,2)+NN(10) | 0.09% | 0.11% | 16.01% | -1.81% | | 多颗粒度模型(5日标签) | 0.56% | 0.81% | 28.86% | 9.83% | 3. AI增强组合 | 组合名称 | 上周超额收益 | 5月超额收益 | 2025年超额收益 | |------------------------------|--------------|-------------|----------------| | 中证500 AI增强宽约束组合 | 1.19% | 3.50% | 7.44% | | 中证1000 AI增强严约束组合 | 0.98% | 3.33% | 11.98% |