深度学习因子挖掘模型

搜索文档
因子选股系列之一一六:NeuralODE:时序动力系统重构下深度学习因子挖掘模型
东方证券· 2025-05-27 16:43
量化模型与构建方式 1. **模型名称**:RNN+Neural ODE+MLP融合模型 **模型构建思路**:通过RNN进行时序数据压缩和降维,利用Neural ODE学习时序演化规律重构数据,最后通过MLP捕捉alpha信息以提升选股鲁棒性[3][6]。 **模型具体构建过程**: - **Encoder层(RNN)**:对时序数据降维和特征提取。 - **Decoder层(Neural Jump SDE)**:拟合时序数据的微分动力系统,重构数据。公式: $$\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t),t\in[0,T]\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.$$ 其中$v$和$\sigma$为全连接层加激活函数构成[22][26]。 - **MLP层**:对重构数据提取特征预测收益率。损失函数包括重构损失、KL散度和MSE损失: $$\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}$$[31][32] **模型评价**:通过数据重构降低噪声影响,提升样本外泛化能力[3][34]。 2. **模型名称**:Baseline模型(ABCM模型) **模型构建思路**:基于神经网络的alpha和beta因子协同挖掘,生成选股因子[37]。 **模型评价**:作为对比基准,新模型在多头超额和抗风险能力上显著优于Baseline[39][43]。 3. **衍生模型**: - **Model1**:Neural ODE生成因子与Baseline因子等权组合[42]。 - **Model2**:Neural SDE生成因子与Baseline因子等权组合[42]。 - **Model3**:Model1因子剥离短期风险后的残差因子[42]。 --- 量化因子与构建方式 1. **因子名称**:Model1因子 **因子构建思路**:基于RNN+Neural ODE+MLP模型生成的alpha因子,通过数据重构增强稳定性[6][26]。 **因子评价**:多头超额显著提升,换手率降低,抗极端市场能力更强[39][43]。 2. **因子名称**:行业轮动因子 **因子构建思路**:将选股因子按行业流通市值加权聚合,生成行业得分[50][51]。 **因子评价**:Model1因子行业RankIC达12.55%,Top组年化超额25.27%,优于Baseline[52][53]。 --- 模型的回测效果 1. **RNN+Neural ODE+MLP模型(Model1)**: - **RankIC均值**:16.33%(中证全指)[39] - **Top组年化超额**:54.54%[39] - **最大回撤**:-6.63%(2024年)[43] - **换手率**:59.73%(较Baseline下降)[39] 2. **Baseline模型**: - **RankIC均值**:16.39%[39] - **Top组年化超额**:52.63%[39] - **最大回撤**:-5.25%[43] 3. **行业轮动表现**: - **Model1因子**:RankIC 12.55%,Top组超额25.27%[52] - **Baseline因子**:RankIC 12.20%,Top组超额23.05%[52] --- 因子的回测效果 1. **指数增强策略**: - **沪深300指增**:Model1年化超额16.67%,夏普比率3.14[65]。 - **中证500指增**:Model1年化超额21.37%,夏普比率3.21[72]。 - **中证1000指增**:Model1年化超额32.41%,夏普比率4.37[80]。 2. **Top组合绝对收益**: - **Model1**:年化收益43.80%,最大回撤-40.84%[59]。 - **Baseline**:年化收益40.15%,最大回撤-42.41%[59]。 --- 关键公式总结 1. **Neural SDE前向传播**: $$\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t)\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.$$[22] 2. **总损失函数**: $$\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}$$[32]