量化模型与因子总结 量化因子与构建方式 1. 因子名称:估值百分位[10] * 因子构建思路:通过计算板块、主题或行业的估值指标(如市盈率PE、市净率PB)在其历史序列中的百分位,来判断当前估值水平的高低。百分位越高,表明当前板块可能处于相对高位。[10] * 因子具体构建过程: 1. 确定待监控的板块、主题或行业。 2. 统计该板块内所有成分股,剔除ST股及上市时间小于180个交易日的股票。[10] 3. 计算板块的整体估值指标。以市盈率(PE)为例,计算方法为:板块所有成分股的总市值之和除以板块的TTM净利润总额。[10] 4. 在选定的历史统计区间内(例如2005/01/01~2026/01/16),计算该估值指标的滚动或固定时间窗口下的历史百分位。[10] 2. 因子名称:Amihud非流动性指标[11][12][13] * 因子构建思路:通过衡量单位成交额所引起的价格波动幅度来刻画资产的流动性水平。指标值越大,表明流动性越差。[11][13] * 因子具体构建过程: 1. 对于证券i,在设定的窗口期D个交易日内,计算每个交易日d的收益率绝对值与当日成交额的比值:[12][13] 2. 将窗口期内所有交易日的该比值求平均,即得到Amihud非流动性指标:[12] 其中,为证券i在第d日的收益率,为对应交易日的成交额。[13] 3. 因子名称:Pastor-Stambaugh流动性指标[14] * 因子构建思路:基于资产收益率反转的特征来度量流动性。流动性越差的资产,其超额收益在下一个交易日越容易发生反转。[14] * 因子具体构建过程: 1. 对于证券i,使用其日度收益率数据。 2. 构建如下回归模型:[14] 其中,为证券i在第d日的超额收益率,为成交额。[14] 3. 回归系数即为所求的流动性代理变量。若该系数显著为负,则表明证券i在区间内流动性较差。[14] 4. 因子名称:换手率指标[15] * 因子构建思路:采用整体法计算换手率,反映资产交易的活跃程度。数值越高,表明市场流动性相对越好。[15] * 因子具体构建过程:计算交易日成交额除以总市值。[15] 5. 因子名称:成分股扩散指标[16] * 因子构建思路:从行业内部个股的趋势一致性角度衡量拥挤度。计算行业内满足多头排列的个股数量占比,占比越高,表明资金集中涌入,交易可能越拥挤。[16] * 因子具体构建过程:计算行业内所有成分股中,满足收盘价 > 短期均线 > 中期均线 > 长期均线(即多头排列)的个股数量占总成分股数量的比例。[16] 6. 因子名称:成分股配对相关性指标[17] * 因子构建思路:通过量化行业内个股走势的同质性来评估拥挤度。计算行业内成分股两两之间收益率相关系数的平均值,平均值越高,说明投资者行为趋同,市场拥挤程度越高。[17] * 因子具体构建过程:在设定的窗口期内,计算行业所有成分股两两之间的日收益率相关系数,然后对所有配对相关系数取平均值。[17] 7. 因子名称:成分股收益率峰度指标[18] * 因子构建思路:从收益率分布的尾部特征来捕捉交易极端性,进而判断拥挤度。较高的峰度值意味着出现极端收益的个股较多,可能暗示市场情绪亢奋或恐慌,交易趋于拥挤。[18] * 因子具体构建过程:在窗口期中,计算每个交易日截面个股收益率的峰度,然后对所有交易日的截面峰度值取平均。[18] 8. 因子名称:热度指标[21][22] * 因子构建思路:基于主成分分析(PCA)来衡量单一行业对市场系统性风险的贡献度,从而反映其交易热度。该指标越高,表明该行业对解释市场共同风险的主导因素贡献越大,交易越集中和拥挤。[21][22] * 因子具体构建过程: 1. 设定行业总数量为N,选取前n个主成分。 2. 计算第m个主成分的吸收比率(Absorption Ratio, AR):[21] 其中,为第m个主成分的方差,为第j个行业自身的收益率方差。[22] 3. 计算行业i的交易热度指标:[21] 其中,为第j个主成分对应的特征向量在行业i上的暴露。[22] 9. 因子名称:羊群效应指标[23][24] * 因子构建思路:旨在捕捉市场参与者行为的一致性。若回归系数显著为负,表明市场存在明显的羊群效应,通常被视为市场情绪极端化和交易拥挤的信号。[24] * 因子具体构建过程: 1. 计算当日所有个股收益率与市场收益率绝对偏差的均值。[24] 2. 构建如下回归模型:[23] 其中,为市场收益率。[24] 3. 回归系数即为羊群效应指标。[24] 10. 因子名称:收盘价-成交额相关性指标[25] * 因子构建思路:通过分析价格与交易量之间关系的稳定性来预判趋势反转的可能。在健康上涨趋势中价量通常正相关;持续的负相关往往被视为趋势动能衰竭、交易过度拥挤的预警信号。[25] * 因子具体构建过程:计算指数收盘价序列与成交额序列的相关系数。[25] 11. 因子名称:成交额占比指标[26] * 因子构建思路:直观反映市场对特定板块或行业的交易集中度。该指标越大,反映板块交易集中度越高,过度炒作的风险可能越大。[26] * 因子具体构建过程:计算单个板块或行业每个交易日的成交额占全市场总成交额的比例。[26] 12. 模型名称:历史相似片段横向对比模型[41][42] * 模型构建思路:针对成分股数量不多的主题、概念板块,通过寻找历史可比板块的行情走势,为当前板块的未来走势提供参考。核心思想是只有同等“体量”的概念、主题的历史走势横向对比才具有参考价值。[41] * 模型具体构建过程: 1. 确定当前板块特征:以目标板块(例如万得卫星指数)在特定时点的数据为基准,包括:成分股数量、过去一段时间(如20个交易日)的累计涨幅、成交额占全市场比例、流通市值等。[42] 2. 寻找历史相似片段:从历史数据(如2010年开始)中,遍历其他概念、主题板块指数,寻找与当前板块在上述多个维度上特征相似的行情片段。[41][42] 3. 统计相似片段后续表现:对于找到的每个历史相似片段,统计其未来一段时间(如60个交易日)内的关键表现指标,包括:未来最大涨幅、行情持续至见顶所经历的时间长度、见顶时的成交额占全市场比例等。[42][46] 4. 提供参考:通过分析历史相似片段后续表现的统计特征(如平均值、分位数),为判断当前板块可能的未来走势提供参考依据。[46] 模型的回测效果 1. 历史相似片段横向对比模型,未来60个交易日最大涨幅平均值12.79%[48],未来60个交易日见顶经历时间长度平均值33日[48],见顶成交额占全市场占比平均值4.48%[49]
量化基本面系列之二:交易热度监控体系探讨