Workflow
因子簇
icon
搜索文档
“量价淘金”选股因子系列研究(十四):基于流动性冲击事件的逐笔羊群效应因子
国盛证券· 2025-11-13 15:47
量化模型与构建方式 1. 分钟羊群效应因子簇 **因子构建思路**:将事件研究的想法融入选股因子构建,在分钟数据维度上挖掘羊群效应因子,关注市场中的重要资金(趋势资金)行动后其跟随者的交易行为[13] **因子具体构建过程**:围绕三个关键因素构建因子: 1. 事件识别:通过观测成交量、价格涨跌幅、价格波动率、量价相关性是否发生异常变化,对趋势资金是否行动进行判断,得到上千种不同的识别方式[13] 2. 因子定义:考察趋势资金行动的时间点后紧跟着的量价特征,包括价格、成交量、价量相关性、大小单资金流、主买单、主卖单等指标,这些指标可以是本身数值、与趋势资金对应时间点相比的变化或与趋势资金事件发生之前相比的变化,提出上千种不同的因子构造方式[14] 3. 数据频率:在1分钟数据集上讨论羊群效应[14] **因子评价**:通过体系化思路批量生产选股因子[13] 2. 逐笔羊群效应因子簇 **因子构建思路**:将离散化的因子定义应用在原始的逐笔数据上,基于羊群效应研究思路,在逐笔委托、逐笔成交数据层面构建因子簇[11][20] **因子具体构建过程**:围绕事件识别、因子定义、数据频率三个关键因素展开: 1. 事件识别:通过观测逐笔委托、逐笔成交数据的流动性冲击事件识别趋势资金行动[21] - 基于逐笔委托数据:引入"激进程度"概念,将委托单划分为10种类型[22][23][25][27] - 类型1买单:挂单价≥卖一价且挂单量≥卖一挂单量[22] - 类型2买单:挂单价≥卖一价但挂单量<卖一挂单量[23] - 类型3买单:挂单价>买一价但<卖一价[23] - 类型4买单:挂单价=买一价[25] - 类型5买单:挂单价<买一价[25] - 类型6-10卖单划分方式类似[27] - 基于逐笔成交数据:关注成交量较大或引起价格变动较大的成交单[27] - 共得到10种事件识别方法[29] 2. 因子定义:在事件发生后考察未来窗口内的量价特征[30] - 各种维度的委托量:通过未来窗口选取、订单类型、订单方向、订单指标等维度构建1680种因子[32][36][38] - 各种维度的成交量:逻辑与委托量类似,用"超大单"、"大单"、"中单"、"小单"替换激进程度,得到1200种因子[41][44] - 关键量价数据发生的间隔:通过未来窗口选取、量价数据类型、关键定义、间隔定义等维度构建432种因子[45][48][50] - 各种维度的不平衡指标:通过未来窗口选取、订单类型、不平衡定义等维度构建360种因子[51][52] - 量价相关性:通过逐笔量价指标的相关性计算构建2862种因子[55][56] - 共得到6000多种不同的因子构造方式[61] **因子评价**:展示了如何将离散化的因子定义应用在原始的逐笔数据层面挖掘有效因子[11] 3. 逐笔羊群效应综合因子 **因子构建思路**:在逐笔羊群效应因子簇中选取效果最优的因子合成综合因子[3] **因子具体构建过程**:在逐笔羊群效应因子簇中选取样本内(2016-2021年)信息比率最高的10个因子等权合成[3][67] **因子评价**:选股效果不错的综合因子[70] 4. 纯净逐笔羊群效应综合因子 **因子构建思路**:剔除市场常用风格和行业影响的纯净因子[71] **因子具体构建过程**:每月月底将逐笔羊群效应综合因子对Barra风格因子和中信一级行业虚拟变量进行回归,取残差作为纯净因子[71] 模型的回测效果 1. 分钟羊群效应因子簇 - 50个因子的年化ICIR绝对值都能达到2以上[18] - 分钟羊群效应综合因子(2016/01/01-2025/10/31): - 月度IC均值:0.085 - 年化ICIR:3.18 - 月度RankIC均值:0.116 - 年化RankICIR:4.10 - 10分组多空对冲年化收益:41.59% - 年化波动:12.56% - 信息比率:3.31 - 月度胜率:82.91% - 最大回撤:10.06%[18] 2. 逐笔羊群效应因子簇 - 50个因子的年化ICIR绝对值都能达到2以上[2][65] - 因子16具体构建示例: - 根据逐笔成交数据,将"成交量大于当日所有主卖成交量90%分位数"的主卖成交视为趋势资金事件点 - 提取标准化后的主买成交量序列 - 计算未来20笔成交中的标准化主买成交量的偏度 - 以事件强度为权重对跟随行为强度求加权平均值 - 滚动回看过去20个交易日求算术平均值[66] 3. 逐笔羊群效应综合因子 - 月度IC均值:0.080[67] - 年化ICIR:3.49[67] - 月度RankIC均值:0.101[3][67] - 年化RankICIR:3.74[3][67] - 10分组多空对冲年化收益:44.26%[3][67] - 年化波动:10.90%[67] - 信息比率:4.06[3][67] - 月度胜率:89.74%[3][67] - 最大回撤:10.66%[3][67] 4. 纯净逐笔羊群效应综合因子 - 月度IC均值:0.044[71] - 年化ICIR:3.33[71] - 月度RankIC均值:0.046[71] - 年化RankICIR:3.03[71] - 10分组多空对冲年化收益:19.53%[71] - 年化波动:6.36%[71] - 信息比率:3.07[71] - 月度胜率:78.63%[71] - 最大回撤:5.13%[71] 5. 指数增强组合表现 **沪深300指数增强组合**: - 超额年化收益:8.89%[4][75] - 跟踪误差:3.50%[4][75] - 信息比率:2.54[4][75] - 月度胜率:77.78%[4][75] - 最大回撤:2.96%[4][75] **中证500指数增强组合**: - 超额年化收益:13.46%[4][78] - 跟踪误差:5.31%[4][78] - 信息比率:2.54[4][78] - 月度胜率:79.49%[4][78] - 最大回撤:5.15%[4][78] **中证1000指数增强组合**: - 超额年化收益:17.23%[4][80] - 跟踪误差:4.78%[4][80] - 信息比率:3.61[4][80] - 月度胜率:84.62%[4][80] - 最大回撤:4.14%[4][80]
以趋势资金入场信号为例:事件簇:量价事件驱动信号的规模化生产
国盛证券· 2025-08-03 11:20
量化模型与构建方式 1. **模型名称**:趋势资金事件驱动策略 **模型构建思路**:通过多维度识别趋势资金入场信号,批量生成事件信号并合成综合信号,构建稳定的事件驱动策略[1][2] **模型具体构建过程**: - **事件识别**:通过成交量、价格涨跌幅、波动率、量价相关性等指标的异常变化识别趋势资金行动,包括: - 成交量维度:基于大小单、主买/主卖方向、成交量/金额/笔数等168种组合[18][26] - 价格涨跌幅:极端放大或缩小(日内或滚动对比)[29][30] - 波动率:振幅或滚动标准差极端放大[31][32] - 量价相关性:超过2000种组合,包括量价对齐、错位等[33][34] - **信号定义**:计算趋势资金均价指标和净支撑量指标: - 均价指标:$$ \text{趋势资金分钟的VWAP}/\text{当日所有分钟的VWAP}-1 $$[11][39] - 净支撑量指标:$$ \text{支撑成交量}-\text{阻力成交量} $$(支撑/阻力成交量按分钟收盘价与均值的比较划分)[11][42] - 触发条件:均价指标<0或净支撑量指标>0[39] - **信号合成**:筛选低相关且有效的信号(如事件1-5),等权合成综合信号[40][44] **模型评价**:综合信号显著提升单一信号的稳定性和收益表现,持股数量更合理[44] 2. **模型名称**:负向信号风险股票池 **模型构建思路**:利用事件簇中提供负向超额的信号构建风险股票池[49] **模型具体构建过程**: - 筛选稳定提供负向超额的信号(如胜率低于50%)[49] - 合成负向综合信号并构建通道策略[49][53] **模型评价**:触发负向信号的股票持续跑输基准,适合作为风险剔除池[49][52] 3. **模型名称**:趋势资金择时策略 **模型构建思路**:基于触发信号股票数量的极端放大预测市场上涨[55] **模型具体构建过程**: - 当触发信号股票数>过去240日95%分位数时开仓,连续20日无信号则平仓[55] - 回测开仓胜率60.61%,平均收益2.49%[56][59] **模型评价**:信号对指数择时具有参考意义[55] --- 模型的回测效果 1. **趋势资金综合信号**: - 年化收益率:8.32% - 年化超额收益(vs中证800等权):10.31% - IR:2.41 - 最大回撤:6.44% - 周均持股数:40只[44][47] 2. **负向综合信号**: - 年化收益率:-12.07% - 年化超额收益(vs基准):7.49% - IR:0.43 - 最大回撤:77.02% - 周均持股数:16只[53][55] 3. **择时策略**: - 年化收益率:8.67%(vs基准-0.40%) - 开仓胜率:60.61% - 平均持仓收益:2.49%[56][59] --- 量化因子与构建方式 1. **因子名称**:趋势资金均价指标 **因子构建思路**:通过趋势资金交易时段的VWAP与全日的VWAP比较判断资金方向[11] **因子具体构建过程**: - 识别趋势资金交易分钟(如成交量>阈值)[9] - 计算$$ \text{均价指标}=\frac{\text{趋势资金分钟VWAP}}{\text{全日VWAP}}-1 $$[11][39] **因子评价**:反映趋势资金“高抛低吸”行为[11] 2. **因子名称**:趋势资金净支撑量指标 **因子构建思路**:通过支撑/阻力成交量差异判断资金净流入方向[11] **因子具体构建过程**: - 计算全日分钟收盘价均值,划分支撑/阻力成交量[11] - 计算$$ \text{净支撑量}=\text{支撑成交量}-\text{阻力成交量} $$[42] **因子评价**:捕捉资金内部结构变化[11] --- 因子的回测效果 1. **趋势资金均价指标(单信号)**: - 年化超额收益:3.36% - IR:1.37 - 周均持股数:650只[10][13] 2. **趋势资金净支撑量指标(单信号)**: - 年化超额收益:3.25% - IR:1.30 - 周均持股数:650只[10][13] 3. **事件簇信号(如事件1)**: - 年化超额收益:4.60% - IR:2.36 - 周均持股数:533只[43]