Workflow
K线聚合
icon
搜索文档
高频因子(十八):收益来源基础的因子挖掘方法论:维度匹配因子
长江证券· 2026-02-27 15:28
量化因子与构建方式 1. **因子名称:高频残差波动率** * **因子构建思路**:从经典价格稳定性因子“残差波动率”出发,通过提升频率(至30分钟)来构建高频衍生因子[31][35]。 * **因子具体构建过程**:在30分钟频率下,对个股收益率与三因子(通常为市场、规模、价值因子)收益率进行时间序列回归,计算回归残差的波动率[35]。公式可表示为: $$残差_i = r_i - (\alpha + \beta_m r_m + \beta_s SMB + \beta_v HML)$$ $$高频残差波动率 = Std(残差_i)$$ 其中,$r_i$ 为个股收益率,$r_m$、$SMB$、$HML$ 分别为市场、规模、价值因子收益率,$Std(\cdot)$ 表示计算标准差。 2. **因子名称:残差成交量波动率** * **因子构建思路**:从残差波动率的逻辑出发,通过扩充维度(将价格维度替换为成交量占比维度)来构建衍生因子[31][35]。 * **因子具体构建过程**:对个股成交占比(个股成交量/全市场成交量)与全市场成交占比进行时间序列回归,计算回归残差的波动率[35]。公式可表示为: $$残差_{vol\_share} = Share_i - (\alpha + \beta \cdot Share_m)$$ $$残差成交量波动率 = Std(残差_{vol\_share})$$ 其中,$Share_i$ 为个股成交占比,$Share_m$ 为全市场成交占比。 3. **因子名称:残差振幅波动率** * **因子构建思路**:从残差波动率的逻辑出发,通过扩充维度(将收益率维度替换为振幅维度)来构建衍生因子[31][35]。 * **因子具体构建过程**:对个股振幅与市场(如中证全指)振幅进行时间序列回归,计算回归残差的波动率[35]。公式可表示为: $$残差_{amplitude} = Amp_i - (\alpha + \beta \cdot Amp_m)$$ $$残差振幅波动率 = Std(残差_{amplitude})$$ 其中,$Amp_i$ 为个股振幅,$Amp_m$ 为市场振幅。 4. **因子名称:成交匹配波动因子** * **因子构建思路**:基于“维度匹配”方法论,通过匹配K线算子(回归残差波动率)对两个相关但不同的成交量维度(每笔成交量与成交量占比)进行聚合,以挖掘增量信息[8][55][57]。 * **因子具体构建过程**:构建过程分为四步[59]: 1. **计算每笔成交量**:使用匹配变换算子——除法,用成交量除以成交笔数。$$每笔成交量 = \frac{成交量}{成交笔数}$$ 2. **计算成交量和**:使用时序K线算子——求和,对成交量进行聚合。$$成交量和 = Sum(成交量)$$ 3. **计算成交量占比**:使用匹配变换算子——除法,用成交量除以上一步的成交量和。$$成交量占比 = \frac{成交量}{成交量和}$$ 4. **计算成交匹配波动**:使用匹配K线算子——回归残差波动率,对“每笔成交量”和“成交量占比”两个维度进行回归并计算残差波动。$$残差_{match} = 每笔成交量 - (\alpha + \beta \cdot 成交量占比)$$ $$成交匹配波动因子 = Std(残差_{match})$$ 因子的回测效果 **测试区间**:2009年12月31日至2025年12月10日[34]。IC为月度IC。 1. **高频残差波动率因子** * **原始IC**:沪深300: 4.55%, 中证500: 5.98%, 中证1000: 7.94%, 中证全指: 7.71%[42]。 * **市值行业中性后IC**:沪深300: 3.84%, 中证500: 5.55%, 中证1000: 7.32%, 中证全指: 7.94%[42]。 * **量价中性后IC**:沪深300: 1.16%, 中证500: 1.41%, 中证1000: 1.95%, 中证全指: 2.40%[42]。 * **模型评价**:该因子主要收益来源为低波,在量价中性(剥离波动率、换手率)后IC衰减显著[43]。 2. **残差成交量波动率因子** * **原始IC**:沪深300: 3.04%, 中证500: 4.04%, 中证1000: 5.56%, 中证全指: 4.43%[42]。 * **市值行业中性后IC**:沪深300: 3.06%, 中证500: 4.13%, 中证1000: 5.49%, 中证全指: 5.76%[42]。全市场区间年化超额收益4.65%[48]。 * **量价中性后IC**:沪深300: 2.01%, 中证500: 2.96%, 中证1000: 4.10%, 中证全指: 4.02%[42]。全市场区间超额收益2.74%[54]。 * **模型评价**:与风格因子相关性较低,在沪深300内有一定信息增量;但简单逻辑复制的信息增量有限,在量价中性后超额收益稳定性下降[7][43][54]。 3. **残差振幅波动率因子** * **原始IC**:沪深300: 5.08%, 中证500: 6.08%, 中证1000: 7.78%, 中证全指: 6.75%[42]。 * **市值行业中性后IC**:沪深300: 4.34%, 中证500: 5.51%, 中证1000: 7.19%, 中证全指: 7.55%[42]。全市场区间年化超额收益5.25%[48]。 * **量价中性后IC**:沪深300: 2.39%, 中证500: 2.19%, 中证1000: 2.72%, 中证全指: 2.67%[42]。全市场区间超额收益0.45%[54]。 * **模型评价**:简单逻辑复制的信息增量有限,在量价中性后超额收益稳定性显著下降[7][54]。 4. **成交匹配波动因子** * **原始IC**:沪深300: 6.82%, 中证500: 6.40%, 中证1000: 7.33%, 中证全指: 5.94%[65]。 * **市值行业中性后IC**:沪深300: 5.35%, 中证500: 6.01%, 中证1000: 7.31%, 中证全指: 7.55%[65]。 * **量价中性后IC**:沪深300: 3.81%, 中证500: 3.63%, 中证1000: 4.25%, 中证全指: 4.15%[65]。 * **量价中性后分组年化超额收益**:沪深300: 5.05%, 中证500: 3.53%, 中证1000: 5.00%, 中证全指: 5.77%[71][75][77][81]。 * **模型评价**:属于低波收益来源,偏小市值;相比简单逻辑复制的因子,该因子通过多维度匹配构建,提供了更明显的信息增量,在多数板块和年份能获得较稳定的超额收益[8][57][72][76][82]。