Workflow
时序数据增强
icon
搜索文档
【广发金工】面向通用模型的时序数据增强方法
实证分析: 对于固定概率p的训练模式而言,所得因子并未有明显的提升;而在线性衰减概率p的训练模式下,各数据增强因子对比原始因子在RankIC及 年化收益率等指标上均有一定程度的提升。这是由于在该训练模式下数据增强的概率p在N个epoch后即衰减为0,在随后的epoch内则完全使用未增强的原 始数据进行训练,因此模型既能够在训练过程中使用增强后的数据提高泛化性能,同时又能够让模型的最终收敛与真实数据比较贴近,从而在信噪比较低 的量价数据中也能够发挥数据增强的作用。将数据增强因子与原始数据因子等权合成后,其RankIC均值提升了1.2%、RankIC胜率提升了1.7%,多头及多 空年化收益率分别提升了2.81%和7.65%。 风险提示: (1)本文所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时存在失效风险;(2)本文策 略在市场结构及交易行为改变时有可能存在失效风险;(3)因量化模型不同,本文提出的观点可能与其他量化模型结论存在差异。 一、时序数据增强 数据是一切量化模型的根本,但不同投资者所能获取的数据源通常都是大同小异,尤其是量价数据。面对日益同质化的数据源,如何对有 ...