Workflow
金工专题报告20240927:提升技术分析的品格
东吴证券·2024-09-27 14:03

量化模型与构建方式 1. ARMA-GARCH 模型 - 模型名称:ARMA-GARCH 模型 - 模型构建思路:捕捉市场中的线性关系,处理时间序列中的线性依赖结构与波动性特征[4][5] - 模型具体构建过程: 1. ARMA 模型: - 公式:rt=β0+i=1pβirti+j=1qθjatj+ϵtr_{t}=\beta_{0}+\sum_{i=1}^{p}\beta_{i}r_{t-i}+\sum_{j=1}^{q}\theta_{j}a_{t-j}+\epsilon_{t}[20] - 参数说明:rtr_{t}为对数收益率,β0\beta_{0}为常数项,β\beta为自回归系数,θ\theta为移动平均项系数,ϵt\epsilon_{t}为误差项[21] 2. GARCH 模型: - 公式:σt2=α0+i=1qαiϵti2+j=1pβjσtj2\sigma_{t}^{2}=\alpha_{0}+\sum_{i=1}^{q}\alpha_{i}\epsilon_{t-i}^{2}+\sum_{j=1}^{p}\beta_{j}\sigma_{t-j}^{2}[22] - 参数说明:σt2\sigma_{t}^{2}为条件异方差,α0\alpha_{0}为常数项,α\alpha为滞后期残差平方项的系数,β\beta为滞后期条件方差项的系数[23] 3. 模型训练: - 数据划分为训练集和测试集,训练集用于确定模型参数,测试集用于回测和验证[24] - 使用 AIC 信息准则确定 ARMA 模型参数为(5,3)[27] - 对 ARMA 模型残差进行 LB 检验和 ARCH 效应检验,确定残差存在异方差现象,使用 GARCH(1,1)模型处理残差[30][31][32] - 模型评价:ARMA-GARCH 模型在预测准确率、精确率、召回率和 F1 值上均优于"抛硬币"预测法,特别是召回率的提升表明模型在捕捉上涨趋势上更具优势[35] 2. LSTM 模型 - 模型名称:LSTM 模型 - 模型构建思路:捕捉市场中的非线性关系,处理和预测时间序列数据中的长期依赖性[5][47] - 模型具体构建过程: 1. LSTM 模型介绍: - 通过遗忘门、输入门和输出门机制处理时间序列数据[47][49][50] - 公式: - 遗忘门:ft=σ(Wf[ht1,xt]+bf)\mathbf{f}_{\mathbf{t}}=\sigma\left(\mathbf{W}_{\mathbf{f}}\cdot\,[\mathbf{h}_{\mathbf{t-1}},\mathbf{x}_{\mathbf{t}}]+b_{f}\right)[47] - 输入门:it=σ(Wi[ht1,xt]+bi)i_{t}=\sigma(W_{i}\cdot\,[h_{t-1},x_{t}]+b_{i})C~t=tanh(Wc [ht1,xt]+bc){\tilde{C}}_{t}=\operatorname{tanh}(W_{c}\cdot\ [h_{t-1},x_{t}]+b_{c})[49] - 输出门:=σ([h1,]+)= σ( ⋅ [ℎ−1, ] + )h=h()ℎ = ∗ ℎ( )[50] - 单元状态:Ct=ftCt1+itC^tC_{t}=f_{t}*C_{t-1}+i_{t}*{\widehat{C}}_{t}[51] 2. 数据处理: - 使用价格指标和技术指标,收盘价进行二元分类处理,其他数据采用 Z-score 标准化处理[53] 3. 模型训练: - 多重交叉验证,分为训练集和测试集,优化模型表现[55][56] - 关键参数:神经元个数、随机断开输入神经元比例、训练批次、损失函数、学习率[56][57][60] - 模型评价:LSTM 模型在预测准确率上显著优于"抛硬币"预测法,特别是20步长的表现最佳,预测准确率稳定维持在52%附近[62] 模型的回测效果 1. ARMA-GARCH 模型: - 准确率:51.61%[34] - 精确率:52.06%[34] - 召回率:58.96%[34] - F1 值:55.30%[34] - 年化收益率:4.89%[40] - 年化波动率:21.54%[40] - 夏普比:0.227[40] - 最大回撤:55.58%[40] 2. LSTM 模型: - 准确率:52.33%(20步长)[62] - 年化收益率:14.71%[64] - 日度胜率:52.33%[64]