Workflow
RSAP-DFM:基于连续状态的动态因子模型
华安证券·2024-09-11 00:00

量化模型与构建方式 1. 模型名称:RSAP-DFM(Regime-Shifting Adaptive Posterior Dynamic Factor Model) - 模型构建思路:RSAP-DFM 是一种基于连续状态的动态因子模型,旨在通过双重状态转换对股票收益进行动态显式映射,同时引入对抗学习思想的后验因子以纠正因子映射偏差[3][4][15] - 模型具体构建过程: 1. 特征嵌入提取器:利用GRU模型从股票时间序列数据中提取隐藏特征,公式如下: zt=σ(Wxx+Uzht1+bz),rt=σ(Wrx+Urht1+br),hˉt=tanh(Whx+Uh(rtht1)+bh),ht=ztht1+(1zt)hˉt \begin{array}{c} z_{t}=\sigma(W_{x}x+U_{z}h_{t-1}+b_{z}), \\ r_{t}=\sigma(W_{r}x+U_{r}h_{t-1}+b_{r}), \\ \bar{h}_{t}=\operatorname{tanh}(W_{h}x+U_{h}(r_{t}\odot h_{t-1})+b_{h}), \\ h_{t}=z_{t}\odot h_{t-1}+(1-z_{t})\odot\bar{h}_{t} \end{array} 其中,为哈达玛乘积,WW∗UU∗为可训练的权重和偏差[33][34] 2. 双重状态转换编码器:动态提取宏观经济特征mm,并通过状态转换跳跃编码器和加载编码器分别描述因子收益和因子暴露的状态转换,公式如下: hri=LeakyReLU(wrim+bri) h^{\mathrm{ri}}={\mathrm{LeakyReLU}}(\mathbf{w}^{\mathrm{ri}}m+b^{\mathrm{ri}}) lα=ϕpiα(hri),lβ=ϕpiβ(hri) l_{\alpha}=\phi_{\mathrm{pi}}^{\alpha}(h^{\mathrm{ri}}),\quad l_{\beta}=\phi_{\mathrm{pi}}^{\beta}(h^{\mathrm{ri}}) [35][36][40] 3. 基于多头注意力的因子编码器:通过多头注意力机制和变分编码器生成先验因子λprior\lambda_{\mathrm{prior}},公式如下: [μprior,σprior]=πprior(hmulti,eπi) [\mu_{\mathrm{prior}},\sigma_{\mathrm{prior}}]=\pi_{\mathrm{prior}}(h_{\mathrm{multi}},e^{\pi\mathrm{i}}) λpriorN(μprior,diag(σprior2)) \lambda_{\mathrm{prior}}\sim{\mathcal{N}}(\mu_{\mathrm{prior}},\mathrm{diag}(\sigma_{\mathrm{prior}}^{2})) [42][45] 4. 双动态因子模型:结合因子收益和因子暴露,输出预测收益率r^\hat{r},公式如下: ϕDDF(e,m,λ)=lαα(e)+lββ(e)λ \phi_{\mathrm{DDF}}(e,m,\lambda)=l_{\alpha}\alpha(e)+l_{\beta}\beta(e)\lambda μr(i)=lα(i)μα(i)+k=1Klβ(i,k)β(i,k)μprior(k) \mu_{r}^{(i)}=l_{\alpha}^{(i)}\mu_{\alpha}^{(i)}+\sum_{k=1}^{K}l_{\beta}^{(i,k)}\beta^{(i,k)}\mu_{\mathrm{prior}}^{(k)} [46][50] 5. 自适应因子后验模块:基于梯度的对抗学习思想,通过扰动λG\lambda_{G}增强因子的鲁棒性,公式如下: λG=λprior+ϵg g ,g=l(r,r^)λprior \lambda_{G}=\lambda_{\mathrm{prior}}+\epsilon\frac{g^{*}}{\|\ g^{*}\ \|},\quad g^{*}=\frac{\partial l(r,\hat{r})}{\partial\lambda_{\mathrm{prior}}} [51] 6. 双层优化算法:通过主任务和辅助任务的交替优化提升模型性能,公式如下: M=MSE(r^,r) \ell_{M}=\text{MSE}(\hat{r},r) A=MSE(ϕDDF(e,m,λG),r)+MSE(r^,r) \ell_{A}=\text{MSE}(\phi_{\text{DDF}}(e,m,\lambda_{G}),r)+\text{MSE}(\hat{r},r) [53][54] - 模型评价:RSAP-DFM 在捕捉宏观经济状态、动态因子建模和预测股票收益方面表现出色,具有较高的鲁棒性和可解释性[4][15][77] --- 模型的回测效果 1. RSAP-DFM 模型 - IC:CSI100为0.0768,CSI300为0.0855,CSI500为0.0854[66] - ICIR:CSI100为0.4260,CSI300为0.6194,CSI500为0.7317[66] - Rank IC:CSI100为0.0870,CSI300为0.0961,CSI500为0.1025[66] - Rank ICIR:CSI100为0.4852,CSI300为0.6849,CSI500为0.8770[66] 2. 多空策略投资表现 - 累计多空收益率:RSAP-DFM 在CSI100、CSI300和CSI500数据集上的表现均优于基线模型[74] - 夏普比率:RSAP-DFM 在三个数据集上的夏普比率显著高于其他模型[74] --- 量化因子与构建方式 1. 因子名称:后验因子(Posterior Factor) - 因子的构建思路:通过基于梯度的对抗学习方法,动态调整因子以增强其鲁棒性和预测能力[51][69] - 因子具体构建过程: 1. 构建PP个投资组合,并根据股票潜在特征ee动态分配权重wpw_{p},公式如下: wp=Softmax(Linear(e,P)) w_{p}=\mathrm{Softmax(Linear(e,P))} 2. 计算投资组合收益率RRR=wpTr R=w_{p}^{T}r 3. 将RR映射到KK个高斯分布,生成后验因子λR\lambda_{R},公式如下: μpost=wpostR+bpost \mu_{\rm post}=w_{\rm post}R+b_{\rm post} σpost=log(1+exp(wpostR+bpost)) \sigma_{\rm post}=log(1+exp(w_{\rm post}R+b_{\rm post})) λRN(μpost,diag(σpost2)) \lambda_{R}\sim N(\mu_{\rm post},{\rm diag}(\sigma_{\rm post}^{2})) [69][72] - 因子评价:后验因子通过动态调整权重和对抗学习增强了模型的鲁棒性和预测能力[51][71] --- 因子的回测效果 1. 后验因子 - IC:CSI100为0.0768,CSI300为0.0855,CSI500为0.0854[66] - ICIR:CSI100为0.4260,CSI300为0.6194,CSI500为0.7317[66] - Rank IC:CSI100为0.0870,CSI300为0.0961,CSI500为0.1025[66] - Rank ICIR:CSI100为0.4852,CSI300为0.6849,CSI500为0.8770[66]