深度学习因子

搜索文档
高频选股因子周报:高频因子上周表现分化,日内收益与尾盘占比因子强势。深度学习因子依然稳健, AI 增强组合上周表现有所分化。-20250629
国泰海通证券· 2025-06-29 19:24
量化因子与构建方式 1. **因子名称:日内高频偏度因子** - 构建思路:衡量股票日内收益分布的偏度特征[4] - 具体构建过程:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》,对常规因子进行正交化处理[10] 2. **因子名称:日内下行波动占比因子** - 构建思路:分解已实现波动中的下行波动部分占比[4] - 具体构建过程:参考《选股因子系列研究(二十五)——高频因子之已实现波动分解》[14] 3. **因子名称:开盘后买入意愿占比因子** - 构建思路:捕捉开盘后市场买入意愿的占比特征[4] - 具体构建过程:基于高频数据低频化方法,参考《选股因子系列研究(六十四)》[17] 4. **因子名称:开盘后买入意愿强度因子** - 构建思路:量化开盘后买入意愿的强度[4] - 具体构建过程:同开盘后买入意愿占比因子,但侧重强度计算[21] 5. **因子名称:开盘后大单净买入占比因子** - 构建思路:分析开盘后大单净买入的占比[4] - 具体构建过程:未披露详细公式,但需正交化处理[25] 6. **因子名称:改进反转因子** - 构建思路:优化传统反转因子的计算逻辑[4] - 具体构建过程:未披露具体公式[36] 7. **因子名称:尾盘成交占比因子** - 构建思路:衡量尾盘成交量在总成交中的占比[4] - 具体构建过程:未披露详细公式[37] 8. **因子名称:深度学习因子(改进GRU(50,2)+NN(10))** - 构建思路:结合GRU神经网络与全连接层预测收益[4] - 具体构建过程:使用GRU(50,2)提取时序特征,NN(10)输出预测值[52] 9. **因子名称:多颗粒度模型(5日标签)** - 构建思路:基于双向AGRU训练多时间颗粒度标签[57] - 具体构建过程:采用5日收益标签训练模型[60] 10. **因子名称:多颗粒度模型(10日标签)** - 构建思路:同5日标签模型,但标签周期延长至10日[60] 因子回测效果 1. **日内高频偏度因子** - 上周多空收益:-0.51% - 6月多空收益:1.48% - 2025年多空收益:14.73%[4] 2. **日内下行波动占比因子** - 上周多空收益:-0.04% - 6月多空收益:1.86% - 2025年多空收益:12.84%[4] 3. **开盘后买入意愿占比因子** - 上周多空收益:0.77% - 6月多空收益:1.85% - 2025年多空收益:11.44%[4] 4. **改进GRU(50,2)+NN(10)因子** - 上周多空收益:0.70% - 6月多空收益:3.58% - 2025年多空收益:19.78%[4] 5. **多颗粒度模型(5日标签)** - 上周多空收益:1.56% - 6月多空收益:5.97% - 2025年多空收益:35.45%[4] 量化模型与构建方式 1. **模型名称:中证500 AI增强宽约束组合** - 构建思路:基于多颗粒度模型因子,最大化预期收益[61] - 具体构建过程:目标函数为$$ \max \sum w_i \mu_i $$,其中$w_i$为权重,$\mu_i$为预期超额收益[67] - 约束条件:个股权重≤1%,行业偏离≤1%,市值暴露≤0.3[62] 2. **模型名称:中证1000 AI增强严约束组合** - 构建思路:同中证500模型,但约束更严格[61] - 具体构建过程:增加ROE、SUE等基本面约束[62] 模型回测效果 1. **中证500 AI增强宽约束组合** - 上周超额收益:-0.25% - 6月超额收益:-0.36% - 2025年超额收益:7.95%[10] 2. **中证1000 AI增强严约束组合** - 上周超额收益:-0.21% - 6月超额收益:0.60% - 2025年超额收益:12.99%[10]
因子选股系列之一一六:NeuralODE:时序动力系统重构下深度学习因子挖掘模型
东方证券· 2025-05-27 16:43
量化模型与构建方式 1. **模型名称**:RNN+Neural ODE+MLP融合模型 **模型构建思路**:通过RNN进行时序数据压缩和降维,利用Neural ODE学习时序演化规律重构数据,最后通过MLP捕捉alpha信息以提升选股鲁棒性[3][6]。 **模型具体构建过程**: - **Encoder层(RNN)**:对时序数据降维和特征提取。 - **Decoder层(Neural Jump SDE)**:拟合时序数据的微分动力系统,重构数据。公式: $$\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t),t\in[0,T]\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.$$ 其中$v$和$\sigma$为全连接层加激活函数构成[22][26]。 - **MLP层**:对重构数据提取特征预测收益率。损失函数包括重构损失、KL散度和MSE损失: $$\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}$$[31][32] **模型评价**:通过数据重构降低噪声影响,提升样本外泛化能力[3][34]。 2. **模型名称**:Baseline模型(ABCM模型) **模型构建思路**:基于神经网络的alpha和beta因子协同挖掘,生成选股因子[37]。 **模型评价**:作为对比基准,新模型在多头超额和抗风险能力上显著优于Baseline[39][43]。 3. **衍生模型**: - **Model1**:Neural ODE生成因子与Baseline因子等权组合[42]。 - **Model2**:Neural SDE生成因子与Baseline因子等权组合[42]。 - **Model3**:Model1因子剥离短期风险后的残差因子[42]。 --- 量化因子与构建方式 1. **因子名称**:Model1因子 **因子构建思路**:基于RNN+Neural ODE+MLP模型生成的alpha因子,通过数据重构增强稳定性[6][26]。 **因子评价**:多头超额显著提升,换手率降低,抗极端市场能力更强[39][43]。 2. **因子名称**:行业轮动因子 **因子构建思路**:将选股因子按行业流通市值加权聚合,生成行业得分[50][51]。 **因子评价**:Model1因子行业RankIC达12.55%,Top组年化超额25.27%,优于Baseline[52][53]。 --- 模型的回测效果 1. **RNN+Neural ODE+MLP模型(Model1)**: - **RankIC均值**:16.33%(中证全指)[39] - **Top组年化超额**:54.54%[39] - **最大回撤**:-6.63%(2024年)[43] - **换手率**:59.73%(较Baseline下降)[39] 2. **Baseline模型**: - **RankIC均值**:16.39%[39] - **Top组年化超额**:52.63%[39] - **最大回撤**:-5.25%[43] 3. **行业轮动表现**: - **Model1因子**:RankIC 12.55%,Top组超额25.27%[52] - **Baseline因子**:RankIC 12.20%,Top组超额23.05%[52] --- 因子的回测效果 1. **指数增强策略**: - **沪深300指增**:Model1年化超额16.67%,夏普比率3.14[65]。 - **中证500指增**:Model1年化超额21.37%,夏普比率3.21[72]。 - **中证1000指增**:Model1年化超额32.41%,夏普比率4.37[80]。 2. **Top组合绝对收益**: - **Model1**:年化收益43.80%,最大回撤-40.84%[59]。 - **Baseline**:年化收益40.15%,最大回撤-42.41%[59]。 --- 关键公式总结 1. **Neural SDE前向传播**: $$\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t)\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.$$[22] 2. **总损失函数**: $$\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}$$[32]
高频选股因子周报(20250519- 20250523):高频因子表现有所分化,大单与买入意愿因子明显反弹, AI 增强组合继续强势表现-20250525
国泰海通证券· 2025-05-25 19:37
| 高频选股因子周报(20250519- | [Table_Authors] | 郑雅斌(分析师) | | --- | --- | --- | | 20250523) | 登记编号 | 021-38676666 S0880525040105 | | 高频因子表现有所分化,大单与买入意愿因子明显反弹, AI | | | | 增强组合继续强势表现 | | 余浩淼(分析师) | | 本报告导读: | | 021-38676666 | | 上周(特指 20250519-20250523,下同)高频因子表现有所分化,大单与买入意愿因 子明显反弹。深度学习因子多头弱势,多空维持正收益。AI 增强组合继续强势表现。 | 登记编号 | S0880525040013 | 投资要点: 请务必阅读正文之后的免责条款部分 金 融 工 程 金 融 工 程 [Table_Summary] 高频因子表现有所分化,大单与买入意愿因子明显反弹:日内高频 偏度因子上周、5 月、2025 年多空收益为 0.18%,-1.42%,14.35%。 日内下行波动占比因子上周、5 月、2025 年多空收益为 0.14%,- 0.81%,11.77%。开盘 ...