【广发金工】强化学习与价格择时
择时策略: 本文以DDQN作为核心模型,采用10分钟频的量价数据作为模型输入,择时策略的目标是让 模型学会在各个时间节点给出买入/卖出/继续持有/继续空仓等信号,并使得期末收益最大化。在回测环 节,强化学习模型每10分钟输出择时信号,并遵循t+1规则进行交易。若当天出现多个买入/卖出信号,则 仅选择每天出现的第一个买入/卖出信号进行交易,且当日买入的无法在当日卖出。 实证分析: 本文策略是对单一标的进行择时,其中包括流动性较好的某沪深300ETF、中证500ETF、中证 1000ETF以及某个股。在样本外2023/01/01~2025/05/31期间,按照t+1交易规则,本文策略在上述4个择时 标的中分别产生了72、30、73、188次择时信号(一买一卖算一次),平均胜率分别为52.8%、53.3%、 54.8%、51.6%,期末累计收益分别跑赢基准标的10.9%、35.5%、64.9%、37.8%。 广发证券首席金工分析师 安宁宁 anningning@gf.com.cn 广发证券联席首席金工分析师 陈原文 chenyuanwen@gf.com.cn 联系人:广发证券金工研究员 林涛 gflintao@gf ...