Workflow
Level 2因子
icon
搜索文档
【广发金工】用逐笔订单数据改进分钟频因子:海量Level 2数据因子挖掘系列(六)
文章核心观点 - 量化投资在股票市场博弈中胜出的关键在于对数据的全面收集和深度分析,结合数学模型与算法从海量数据中挖掘隐藏的市场规律[1] - 文章提出使用更精细的Level 2逐笔订单数据来改进传统的基于分钟频数据构建的Alpha因子,通过识别日内重点时段(KeyPeriod)的量价特征,构建了4大类共123个新的Level 2因子[1][12] - 新构建的重点时段因子在历史回测中表现出显著的选股能力,多个因子的RankIC均值和胜率均处于较高水平,并在主要宽基指数上展现出稳定的增强收益[2][20] Level 1与Level 2行情数据介绍 - 股票行情数据主要分为Level 1和Level 2两类,Level 1数据为3秒一笔的快照数据,包含5档买卖价量等基础信息[6] - Level 2数据不仅提供频率相同但更丰富的快照数据(如10档买卖价量、前50笔委托等),还包含了Level 1所没有的逐笔订单数据[6] - 逐笔订单数据是行情数据的根源,记录了精确到毫秒的每一笔订单的详细信息,包括时间、价格、数量、金额及买卖方向等,不同频率的快照数据均由逐笔数据聚合而成[6][9] 相关研究工作 - 该团队此前已发布多篇“海量Level 2数据因子挖掘”系列研究报告,从不同维度挖掘了数百个有效因子[10] - 相关研究包括:基于“大小订单”维度构建的94个大小单因子,其精选组合历史RankIC均值为9.2%,胜率为76.0%[10];基于“订单成交完成时长”维度构建的22个长短单因子,其精选组合历史RankIC均值为13.1%,胜率为80.3%[10];结合“大小”和“长短”维度构建的240个订单因子,其精选组合历史RankIC均值为13.3%,胜率为78.3%[10];基于集合竞价数据构建的15个因子;以及基于市价订单构建的若干因子[10] - 部分绩优因子已纳入广发金工Alpha因子数据库超过一年,跟踪表现优异,在2020年1月1日至2025年11月28日期间的全市场月度换仓测试中,多个因子显示出较高的RankIC和胜率[10][11] 用逐笔订单数据改进分钟频因子 - 研究核心是采用Level 2逐笔订单数据对传统的分钟频Alpha因子进行改进,其逻辑基础是识别基于成交量、涨跌幅、股价等指标划分出的日内重点分钟时段,并统计这些时段内的量价特征[12] - 基于此方法,构建了名为“KeyPeriod”的4大类共123个Level 2因子,包括涨跌类、价格类、成交金额类和量价协同类,并进一步区分了不同阈值标准以及主买/主卖方向[12] 新构建因子的表现摘要 - **涨跌类因子(33个)**:横盘时段因子`KeyPeriod_ret_zero`的20日换仓历史RankIC均值为-5.36%,胜率为85.1%;下跌时段因子`KeyPeriod_ret_low5pct`的20日换仓历史RankIC均值为5.47%,胜率为84.1%[2] - **价格类因子(30个)**:低价时段因子`KeyPeriod_price_low5pct`的20日换仓历史RankIC均值为5.59%,胜率为85.3%[2] - **成交金额类因子(30个)**:大成交金额时段因子`KeyPeriod_amount_top30pct`的20日换仓历史RankIC均值为11.23%,胜率为84.8%;小成交金额时段因子`KeyPeriod_amount_low50pct`的20日换仓历史RankIC均值为-10.50%,胜率为75.0%[2] - **量价协同类因子(30个)**:量价背离时段因子`KeyPeriod_sync_low50pct`的20日换仓历史RankIC均值为6.00%,胜率为81.5%[2] 选股表现(以6个优选因子为例) - 研究从123个因子中挑选了6个表现较优的因子进行详细测试,测试期为2020年1月1日至2025年11月28日,采用月度换仓方式[20] - **`KeyPeriod_ret_zero`(横盘时段因子)**:在中证全指上,2020-2025年总超额收益为26.50%,年化超额收益率为4.10%,信息比率为1.94[40];在中证1000上,同期总超额收益为25.49%,年化超额收益率为3.96%[35] - **`KeyPeriod_ret_low5pct`(下跌时段因子)**:在中证全指上,2020-2025年总超额收益为32.39%,年化超额收益率为4.92%,信息比率为1.90[57];在中证1000上,同期总超额收益为36.79%,年化超额收益率为5.50%[48] - **`KeyPeriod_price_low5pct`(低价时段因子)**:在中证全指上,2020-2025年总超额收益为40.87%,年化超额收益率为6.04%,信息比率为2.71[67] - **`KeyPeriod_amount_top30pct`(大成交金额时段因子)**:在中证全指上,2020-2025年总超额收益为33.03%,年化超额收益率为5.00%[89] - **`KeyPeriod_amount_low50pct`(小成交金额时段因子)**:在沪深300上,2020-2025年总超额收益为21.84%,年化超额收益率为3.44%[94] - **`KeyPeriod_sync_low50pct`(量价背离时段因子)**:在中证500上,2020-2025年总超额收益为16.48%,年化超额收益率为2.64%[108]
海量Level2数据因子挖掘系列(六):用逐笔订单数据改进分钟频因子
广发证券· 2025-12-04 22:05
根据提供的研报内容,以下是关于量化因子与模型的总结。 量化因子与构建方式 1. **因子名称**:涨跌类因子 (KeyPeriod_ret) [7][25][26] - **因子构建思路**:基于分钟频因子构建逻辑的改进,采用逐笔订单数据,通过识别日内不同涨跌幅表现的重点时段(如横盘、下跌、上涨时段),并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:首先,根据分钟线的涨跌幅对交易日内的分钟时段进行分类,例如,将涨跌幅接近于零的时段定义为横盘时段 (ret_zero),将涨跌幅处于最低5%的时段定义为下跌时段 (ret_low5pct),将涨跌幅处于最高5%的时段定义为上涨时段 (ret_top5pct)。然后,在这些定义出的关键时段内,使用Level 2逐笔订单数据计算特定的量价指标。构建过程还包含了主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_ret_low5pct_buy 和 KeyPeriod_ret_low5pct_sell,分别代表在下跌时段内的主买和主卖相关特征[26][27][30] 2. **因子名称**:价格类因子 (KeyPeriod_price) [7][25][31] - **因子构建思路**:通过识别日内股价相对高低的关键时段,并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:根据分钟线的价格水平对交易日内的分钟时段进行分类,例如,将价格处于最低5%的时段定义为低价时段 (price_low5pct),将价格处于最高5%的时段定义为高价时段 (price_top5pct)。然后,在这些关键时段内使用Level 2逐笔订单数据计算量价指标。同样包含主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_price_low5pct_buy 和 KeyPeriod_price_low5pct_sell[32] 3. **因子名称**:成交金额类因子 (KeyPeriod_amount) [7][25][34] - **因子构建思路**:通过识别日内成交金额相对大小的关键时段,并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:根据分钟线的成交金额对交易日内的分钟时段进行分类,例如,将成交金额处于最高30%的时段定义为大成交金额时段 (amount_top30pct),将成交金额处于最低50%的时段定义为小成交金额时段 (amount_low50pct)。然后,在这些关键时段内使用Level 2逐笔订单数据计算量价指标。构建过程也包含了主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_amount_top30pct_buy 和 KeyPeriod_amount_top30pct_sell[35] 4. **因子名称**:量价协同类因子 (KeyPeriod_sync) [7][25][37] - **因子构建思路**:通过识别日内量价关系(协同或背离)的关键时段,并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:首先需要定义一个量价协同指标(具体公式未在提供内容中明确给出,但逻辑是衡量价格变动与成交量变动的一致性),然后根据该指标对交易日内的分钟时段进行分类,例如,将量价协同度处于最低50%的时段定义为量价背离时段 (sync_low50pct),将量价协同度处于最高5%的时段定义为量价协同时段 (sync_top5pct)。接着,在这些关键时段内使用Level 2逐笔订单数据计算量价指标。构建过程同样包含主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_sync_low50pct_buy 和 KeyPeriod_sync_low50pct_sell[38] 因子的回测效果 1. **KeyPeriod_ret_zero 因子** (20日换仓,5日平滑因子),RankIC均值: -5.36%,胜率: 85.1% [7][27] 2. **KeyPeriod_ret_low5pct 因子** (20日换仓,5日平滑因子),RankIC均值: 5.47%,胜率: 84.1% [7][27] 3. **KeyPeriod_price_low5pct 因子** (20日换仓,5日平滑因子),RankIC均值: 5.59%,胜率: 85.3% [7][32] 4. **KeyPeriod_amount_top30pct 因子** (20日换仓,5日平滑因子),RankIC均值: 11.23%,胜率: 84.8% [7][35] 5. **KeyPeriod_amount_low50pct 因子** (20日换仓,5日平滑因子),RankIC均值: -10.50%,胜率: 75.0% [7][35] 6. **KeyPeriod_sync_low50pct 因子** (20日换仓,5日平滑因子),RankIC均值: 6.00%,胜率: 81.5% [7][38]