Workflow
因子选股系列之一一六:NeuralODE:时序动力系统重构下深度学习因子挖掘模型
东方证券·2025-05-27 16:43

量化模型与构建方式 1. 模型名称:RNN+Neural ODE+MLP融合模型 模型构建思路:通过RNN进行时序数据压缩和降维,利用Neural ODE学习时序演化规律重构数据,最后通过MLP捕捉alpha信息以提升选股鲁棒性[3][6]。 模型具体构建过程: - Encoder层(RNN):对时序数据降维和特征提取。 - Decoder层(Neural Jump SDE):拟合时序数据的微分动力系统,重构数据。公式: {dx(t)=v(x(t),t)dt+σ(x(t),t)dB(t),t[0,T]y^=F(x(T))x(0)=x^\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t),t\in[0,T]\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right. 其中vvσ\sigma为全连接层加激活函数构成[22][26]。 - MLP层:对重构数据提取特征预测收益率。损失函数包括重构损失、KL散度和MSE损失: αlog(p(xθ))+βKL(N(μ,exp(σ/2))N(0,δI))+(σ^y)2\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}[31][32] 模型评价:通过数据重构降低噪声影响,提升样本外泛化能力[3][34]。 2. 模型名称:Baseline模型(ABCM模型) 模型构建思路:基于神经网络的alpha和beta因子协同挖掘,生成选股因子[37]。 模型评价:作为对比基准,新模型在多头超额和抗风险能力上显著优于Baseline[39][43]。 3. 衍生模型: - Model1:Neural ODE生成因子与Baseline因子等权组合[42]。 - Model2:Neural SDE生成因子与Baseline因子等权组合[42]。 - Model3:Model1因子剥离短期风险后的残差因子[42]。 --- 量化因子与构建方式 1. 因子名称:Model1因子 因子构建思路:基于RNN+Neural ODE+MLP模型生成的alpha因子,通过数据重构增强稳定性[6][26]。 因子评价:多头超额显著提升,换手率降低,抗极端市场能力更强[39][43]。 2. 因子名称:行业轮动因子 因子构建思路:将选股因子按行业流通市值加权聚合,生成行业得分[50][51]。 因子评价:Model1因子行业RankIC达12.55%,Top组年化超额25.27%,优于Baseline[52][53]。 --- 模型的回测效果 1. RNN+Neural ODE+MLP模型(Model1): - RankIC均值:16.33%(中证全指)[39] - Top组年化超额:54.54%[39] - 最大回撤:-6.63%(2024年)[43] - 换手率:59.73%(较Baseline下降)[39] 2. Baseline模型: - RankIC均值:16.39%[39] - Top组年化超额:52.63%[39] - 最大回撤:-5.25%[43] 3. 行业轮动表现: - Model1因子:RankIC 12.55%,Top组超额25.27%[52] - Baseline因子:RankIC 12.20%,Top组超额23.05%[52] --- 因子的回测效果 1. 指数增强策略: - 沪深300指增:Model1年化超额16.67%,夏普比率3.14[65]。 - 中证500指增:Model1年化超额21.37%,夏普比率3.21[72]。 - 中证1000指增:Model1年化超额32.41%,夏普比率4.37[80]。 2. Top组合绝对收益: - Model1:年化收益43.80%,最大回撤-40.84%[59]。 - Baseline:年化收益40.15%,最大回撤-42.41%[59]。 --- 关键公式总结 1. Neural SDE前向传播{dx(t)=v(x(t),t)dt+σ(x(t),t)dB(t)y^=F(x(T))x(0)=x^\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t)\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.[22] 2. 总损失函数αlog(p(xθ))+βKL(N(μ,exp(σ/2))N(0,δI))+(σ^y)2\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}[32]