文章核心观点 - 量化投资在股票市场博弈中胜出的关键在于对数据的全面收集和深度分析,结合数学模型与算法从海量数据中挖掘隐藏的市场规律[1] - 文章提出使用更精细的Level 2逐笔订单数据来改进传统的基于分钟频数据构建的Alpha因子,通过识别日内重点时段(KeyPeriod)的量价特征,构建了4大类共123个新的Level 2因子[1][12] - 新构建的重点时段因子在历史回测中表现出显著的选股能力,多个因子的RankIC均值和胜率均处于较高水平,并在主要宽基指数上展现出稳定的增强收益[2][20] Level 1与Level 2行情数据介绍 - 股票行情数据主要分为Level 1和Level 2两类,Level 1数据为3秒一笔的快照数据,包含5档买卖价量等基础信息[6] - Level 2数据不仅提供频率相同但更丰富的快照数据(如10档买卖价量、前50笔委托等),还包含了Level 1所没有的逐笔订单数据[6] - 逐笔订单数据是行情数据的根源,记录了精确到毫秒的每一笔订单的详细信息,包括时间、价格、数量、金额及买卖方向等,不同频率的快照数据均由逐笔数据聚合而成[6][9] 相关研究工作 - 该团队此前已发布多篇“海量Level 2数据因子挖掘”系列研究报告,从不同维度挖掘了数百个有效因子[10] - 相关研究包括:基于“大小订单”维度构建的94个大小单因子,其精选组合历史RankIC均值为9.2%,胜率为76.0%[10];基于“订单成交完成时长”维度构建的22个长短单因子,其精选组合历史RankIC均值为13.1%,胜率为80.3%[10];结合“大小”和“长短”维度构建的240个订单因子,其精选组合历史RankIC均值为13.3%,胜率为78.3%[10];基于集合竞价数据构建的15个因子;以及基于市价订单构建的若干因子[10] - 部分绩优因子已纳入广发金工Alpha因子数据库超过一年,跟踪表现优异,在2020年1月1日至2025年11月28日期间的全市场月度换仓测试中,多个因子显示出较高的RankIC和胜率[10][11] 用逐笔订单数据改进分钟频因子 - 研究核心是采用Level 2逐笔订单数据对传统的分钟频Alpha因子进行改进,其逻辑基础是识别基于成交量、涨跌幅、股价等指标划分出的日内重点分钟时段,并统计这些时段内的量价特征[12] - 基于此方法,构建了名为“KeyPeriod”的4大类共123个Level 2因子,包括涨跌类、价格类、成交金额类和量价协同类,并进一步区分了不同阈值标准以及主买/主卖方向[12] 新构建因子的表现摘要 - 涨跌类因子(33个):横盘时段因子KeyPeriod_ret_zero的20日换仓历史RankIC均值为-5.36%,胜率为85.1%;下跌时段因子KeyPeriod_ret_low5pct的20日换仓历史RankIC均值为5.47%,胜率为84.1%[2] - 价格类因子(30个):低价时段因子KeyPeriod_price_low5pct的20日换仓历史RankIC均值为5.59%,胜率为85.3%[2] - 成交金额类因子(30个):大成交金额时段因子KeyPeriod_amount_top30pct的20日换仓历史RankIC均值为11.23%,胜率为84.8%;小成交金额时段因子KeyPeriod_amount_low50pct的20日换仓历史RankIC均值为-10.50%,胜率为75.0%[2] - 量价协同类因子(30个):量价背离时段因子KeyPeriod_sync_low50pct的20日换仓历史RankIC均值为6.00%,胜率为81.5%[2] 选股表现(以6个优选因子为例) - 研究从123个因子中挑选了6个表现较优的因子进行详细测试,测试期为2020年1月1日至2025年11月28日,采用月度换仓方式[20] - KeyPeriod_ret_zero(横盘时段因子):在中证全指上,2020-2025年总超额收益为26.50%,年化超额收益率为4.10%,信息比率为1.94[40];在中证1000上,同期总超额收益为25.49%,年化超额收益率为3.96%[35] - KeyPeriod_ret_low5pct(下跌时段因子):在中证全指上,2020-2025年总超额收益为32.39%,年化超额收益率为4.92%,信息比率为1.90[57];在中证1000上,同期总超额收益为36.79%,年化超额收益率为5.50%[48] - KeyPeriod_price_low5pct(低价时段因子):在中证全指上,2020-2025年总超额收益为40.87%,年化超额收益率为6.04%,信息比率为2.71[67] - KeyPeriod_amount_top30pct(大成交金额时段因子):在中证全指上,2020-2025年总超额收益为33.03%,年化超额收益率为5.00%[89] - KeyPeriod_amount_low50pct(小成交金额时段因子):在沪深300上,2020-2025年总超额收益为21.84%,年化超额收益率为3.44%[94] - KeyPeriod_sync_low50pct(量价背离时段因子):在中证500上,2020-2025年总超额收益为16.48%,年化超额收益率为2.64%[108]
【广发金工】用逐笔订单数据改进分钟频因子:海量Level 2数据因子挖掘系列(六)
广发金融工程研究·2025-12-05 15:08