量化模型与因子总结 量化因子与构建方式 1. 基础资金流因子 1.1 因子名称:大单成交单数占比因子 - 因子构建思路:合并特大单与大单,统计其买入或卖出成交笔数占总成交笔数的比例,以20日平滑值作为因子值,旨在捕捉机构资金的交易动向[18]。 - 因子具体构建过程: 1. 根据Wind资金流分类,将每笔成交划分为特大单、大单、中单和小单。 2. 合并特大单与大单,统称为“大单”。 3. 分别计算每日大单买入成交笔数、大单卖出成交笔数以及市场总成交笔数。 4. 计算每日的大单买入单数占比和大单卖出单数占比: 5. 对上述日度占比序列取20日移动平均,得到最终的因子值[18]。 - 因子评价:相比成交金额占比,成交单数占比更能剔除极端单笔成交的噪音,更真实地反映机构投资者的共识性动作[20]。大单的买入与卖出行为因子绩效接近[20]。 1.2 因子名称:小单成交单数占比因子 - 因子构建思路:统计小单买入或卖出成交笔数占总成交笔数的比例,以20日平滑值作为因子值,旨在捕捉散户资金的交易行为[24]。 - 因子具体构建过程: 1. 根据Wind资金流分类,识别“小单”成交。 2. 分别计算每日小单买入成交笔数、小单卖出成交笔数以及市场总成交笔数。 3. 计算每日的小单买入单数占比和小单卖出单数占比: 4. 对上述日度占比序列取20日移动平均,得到最终的因子值[24]。 - 因子评价:成交单数占比绩效全面优于金额占比[25]。小单卖出行为的因子绩效显著优于买入行为,具有极强的反向领先意义[25]。 1.3 因子名称:相对量资金流因子 (小单卖出/小单买入、大单买入/大单卖出) - 因子构建思路:使用平滑后的小单卖出与买入笔数之比、大单买入与卖出笔数之比作为因子,旨在通过相对变化增强信号的稳健性[28]。 - 因子具体构建过程: 1. 分别计算“小单卖出单数占比”和“小单买入单数占比”的20日平滑序列。 2. 构建小单相对量因子: 3. 分别计算“大单买入单数占比”和“大单卖出单数占比”的20日平滑序列。 4. 构建大单相对量因子: 其中,smoothed表示经过20日移动平均处理后的值[28]。 2. 情境匹配衍生因子 2.1 因子名称:涨跌情境匹配因子 - 因子构建思路:根据股票过去一段时间的价格走势划分“上涨”和“下跌”情境,并在不同情境下分别计算资金流因子,以提升因子的信噪比[33]。 - 因子具体构建过程: 1. 情境划分:对每只股票,回溯过去40个交易日,根据日收益率区分上涨日和下跌日[33]。 2. 因子计算: - 大单因子:仅在股票上涨区间,统计“大单买入笔数/大单卖出笔数”[37]。 - 小单因子:仅在股票下跌区间,统计“小单卖出笔数/小单买入笔数”[38]。 3. 衍生处理:基于过去40个交易日的滚动窗口,从上述情境化因子序列中进一步衍生出三类统计特征:均值(mean)、90分位值(quantile90) 以及 标准差(std)[44]。 - 因子评价:大单因子在不同涨跌区间的绩效较为均衡,有效性对价格走势情境依赖不高[37]。小单因子在下跌情境下表现极佳,在上涨情境下失效甚至为负,其有效性主要来源于对下跌阶段市场负面情绪的刻画[38]。 2.2 因子名称:市值情境匹配因子 - 因子构建思路:在不同市值分域(如中证800、中证1000、国证2000)中分别测试资金流因子的有效性,观察其选股能力的差异[39]。 - 因子具体构建过程: 1. 将股票池按市值划分为不同子域(例如,中证800代表大市值,国证2000代表小市值)[39]。 2. 在各市值子域内,分别计算“大单买入/大单卖出”和“小单卖出/小单买入”等基础或相对量因子[40][43]。 3. 分别评估各因子在不同子域内的绩效[40][43]。 - 因子评价:2021年以前,大单因子在大市值股票中选股能力更优;2021年以后,其在小市值股票中表现更稳健,反映出大市值股票中算法拆单行为对传统大单因子干扰增强[42]。小单因子在不同市值分域中的表现则保持了高度的一致性[43]。 3. 复合因子 3.1 因子名称:IRCF因子 (机构与散户逆向资金流因子) - 因子构建思路:核心思路为“下跌日看小单卖出、上涨日看大单买入,大单只作用于小票”。通过分情境捕捉“主力吸筹”与“散户恐慌”的背离行为,构建复合因子[3][48]。 - 因子具体构建过程: 1. 基础信号生成: - 小单信号:在股票下跌区间,计算“小单卖出单数/小单买入单数”[48]。 - 大单信号:在股票上涨区间,计算“大单买入单数/大单卖出单数”[48]。 2. 信号衍生:以40个交易日为窗口,分别从小单和大单的基础信号序列中计算均值(mean)、标准差(std) 和 90分位值(quantile90) 三类衍生指标,共得到6个指标[48]。 3. 市值过滤:为避免大市值股票中算法拆单的干扰,对衍生出的大单指标(3个)施加过滤条件:若个股日均成交额处于市场最高的前1/3,则将该股票的大单指标值设为空[49]。 4. 因子合成:将上述6个衍生指标分别进行横截面标准化,然后等权求平均,得到最终的IRCF因子值[49]。 - 因子评价:该因子通过情境匹配和时序平滑,有效捕捉了未被算法平滑的微观博弈规律,表现出极强的预测持续性和稳定性[52][53]。 3.2 因子名称:“情境-特征”资金流综合因子 - 因子构建思路:基于“情境(Regime)-行为(Behavior)”框架,通过多种情境刻画(涨跌、成交额、振幅等)与多种资金流行为特征(小单/大单买卖笔数)的组合,挖掘并构建数十个有效因子,最后等权合成综合因子[3][60]。 - 因子具体构建过程: 1. 框架定义:遵循范式 ,其中情境(Regime)包括涨跌状态、成交额分布、振幅水平等;行为(Behavior)包括小单/大单的买入与卖出笔数;聚合方式(Aggregation)包括均值、标准差、分位值等[60]。 2. 因子挖掘:按照上述框架,生成大量“情境-特征”组合的衍生因子。例如,mean_down_day_s_sell_t_1 表示在下跌情境(down_day=1)下,小单卖出相对笔数(s_sell_t)的均值(mean)因子[64]。 3. 因子合成:将挖掘出的数十个有效因子(如表15所列)进行简单等权合成,得到“资金流综合因子”[64]。 - 因子评价:该因子体系通过捕捉不同的“情境-行为”组合,弥补了单一逻辑的不足,即便在市场风格剧烈切换的年份也能保持高稳定性[67]。 3.3 因子名称:等权复合因子 (IRCF + 资金流综合因子) - 因子构建思路:将IRCF因子与“情境-特征”资金流综合因子进行等权复合,以结合两者的优势,获取边际增量[3][67]。 - 因子具体构建过程:将标准化后的IRCF因子值与资金流综合因子值进行等权相加,得到最终的等权复合因子值[67]。 - 因子评价:复合后的因子绩效相比单一的IRCF因子有进一步提升,表明“情境-特征”体系挖掘的因子能提供有效的边际增量[3][67]。 因子的回测效果 (注:以下绩效数据若无特别说明,均为2017年以来的整体表现,回测空间多为中证全指) 1. 基础资金流因子绩效 - 大单卖出单数占比因子:多空年化收益8.0%,多头超额年化收益1.3%,多空IR 0.66,多头IR 0.11,IC均值-4.2%,ICIR -1.95[19]。 - 小单卖出单数占比因子:多空年化收益15.7%,多头超额年化收益5.4%,多空IR 1.36,多头IR 1.00,IC均值5.8%,ICIR 2.44[25]。 - 小单卖出/小单买入因子 (中证全指):多空年化收益11.8%,多头超额年化收益7.0%,IC均值3.0%,ICIR 1.43[29]。 - 大单买入/大单卖出因子 (中证全指):多空年化收益12.2%,多头超额年化收益6.9%,IC均值3.7%,ICIR 1.97[29]。 2. 情境匹配衍生因子绩效 - 下跌情境小单卖出/买入因子 (均值):多头超额年化收益7.8%,IC均值6.3%[38][47]。 - 下跌情境小单卖出/买入因子 (90分位值):多头超额年化收益8.6%,IC均值7.4%[46][47]。 3. 复合因子绩效 - IRCF因子:多空年化收益25.8%,多头超额年化收益9.6%,多头IR 2.13,IC均值7.1%,ICIR 3.29,IC胜率85.2%[50][53]。 - 资金流综合因子:多头超额年化收益9.9%,IC均值7.7%[65][67]。 - 等权复合因子 (IRCF+综合):多头超额年化收益10.9%,IC均值7.7%[65][67]。
金融工程专题报告:股票涨跌情境中机构与散户的逆向资金流
财通证券·2026-03-29 19:52