量化模型与构建方式 1. 模型名称:基于深度学习的行业轮动策略模型 - 模型构建思路:利用深度学习模型预测ETF的未来价格走势,并结合波段交易策略动态调整投资组合,以获取超额收益[2][9][10] - 模型具体构建过程: 1. 数据处理: - 数据时间范围为2015年1月1日至2024年6月14日,剔除非交易日数据,仅保留周五收盘价作为训练数据[12][15] - 输入数据矩阵 的维度为 ,其中 为ETF市场表现因子数量, 为宏观经济因子数量,目标标签 为二进制向量,表示下一周价格是否上涨[12] - 数据归一化处理,均值为零,方差为单位值[15] 2. 行业分类: - 使用DBSCAN算法对ETF进行行业分类,自动识别数据中的噪声点并排除,避免传统k-means算法对非线性分布数据的局限性[16][17][19] 3. 模型搭建: - 使用循环神经网络(RNN)构建模型,包含四个内部层,采用ReLU激活函数和dropout技术缓解梯度消失和过拟合问题[22] - 模型通过捕捉时间序列数据的动态变化,预测ETF下一周的价格走势,预测结果通过Sigmoid函数转化为概率值[22] - 自定义损失函数结合近期资本收益和亏损,优化动态模型[22] 4. 波段交易策略: - 生成“买入”信号:基于深度学习模型预测结果,使用ROC曲线分析中的Youden's J指数优化门限,计算公式为: 其中, 为真阳性, 为假阴性, 为真阴性, 为假阳性[25][26] - 清空组合:每周清算所有持仓,记录资本利得,用于后续模型迭代[26] - 使用蒙特卡罗dropout技术量化交易信号置信度,通过多次预测生成分布,分析预测值的统计分布,确保高置信度资产优先交易[29] 5. 动态权重分配: - 根据基金的历史表现(如胜率、动量)动态调整权重,公式为: 通过动态调整权重,提升策略的灵活性和适应性[38] - 模型评价: - 模型在2024年表现优异,主要得益于动态权重分配和能源板块的良好行情[43] - 但模型在某些行业(如医药ETF)预测表现较差,原因是宏观因子与行业相关性不足,未来可通过引入行业特定因子优化[34][36] --- 模型的回测效果 1. 基于深度学习的行业轮动策略模型 - 年化收益: - 平均年化收益率为4.26%[40] - 2024年年化收益率为24.23%,超额收益为17.58%(相较沪深300)[41] - 2024年年化收益率为24.23%,超额收益为34.11%(相较中证500)[43] - 信息比率(IR): - 2024年相较沪深300的IR为1.12,相较中证500的IR为1.95[41][43] - 最大回撤: - 2024年最大回撤为5.46%(相较沪深300),1.15%(相较中证500)[41][43] --- 量化因子与构建方式 1. 因子名称:ETF市场表现因子 - 因子构建思路:通过价格、成交量、价格波动等指标反映ETF的市场表现[11] - 因子具体构建过程: - 提取每只ETF的价格、成交量、每日价格波动等数据[11] - 数据在离散时间点采样,仅保留周五收盘价,剔除非交易日数据[12][15] - 数据归一化处理,确保均值为零,方差为单位值[15] 2. 因子名称:宏观经济因子 - 因子构建思路:通过国债收益率、人民币货币指数、存款利率等宏观经济指标反映市场环境[11] - 因子具体构建过程: - 提取10年期国债收益率、人民币货币指数、存款利率等数据[11] - 对因子进行T检验,评估其对行业预测的显著性[36][37] - 动力煤价格因子在能源行业中表现显著,但未被纳入框架以避免增加运行时间[38] - 因子评价: - 宏观因子对部分行业(如能源)预测效果较差,未来可引入更多行业特定因子优化模型[36][38] --- 因子的回测效果 1. ETF市场表现因子 - T检验结果:未提供具体数值 2. 宏观经济因子 - 国债利率因子: - 2017-2019年间对能源行业预测有一定帮助,T检验值分别为2.68、4.16、-1.76,P值分别为0.71、0.00、0.08[37] - 其他年份无显著性[37] - 存款利率因子: - 所有年份均无显著性,P值均大于0.5[37] - 动力煤价格因子: - 对能源行业预测显著,2017年T检验值为-1.99,P值为0.046;2023年T检验值为2.06,P值为0.040[38]
基于神经网络的模型框架:机器学习量化模型
山西证券·2024-07-02 13:27