文章核心观点 - 该研究构建并改进了基于资金流数据的筹码结构因子,通过引入投资者分层视角(机构与散户)来挖掘传统量价因子之外的增量信息,为选股提供新的分析维度 [4][6][19] - 研究发现,传统的筹码成本因子具有与反转因子相似的收益特征,但分组单调性较弱;通过构建机构与散户的筹码成本差因子,并与传统因子进行正交合成,可以显著提升因子的预测能力和排序稳定性,实现“1+1>2”的效果 [10][31][32] - 筹码类因子的有效性具有显著的市值分域特征,在中小市值股票(如中证1000及以外)中表现突出,而在大盘股(如沪深300)中表现较弱甚至为负,这与其刻画的投资者博弈行为逻辑一致 [41][42][45] 筹码平均成本的构建与应用 - 筹码结构反映了投资者在不同价格水平上的资金持仓分布,可用于识别股价的支撑位、压力位及市场平均持仓成本,从而刻画多空博弈状态 [4][6] - 研究采用简化假设构建筹码成本:新增筹码以当日成交均价作为成本;卖出筹码假设历史各价格区间筹码按当日换手率均匀减少;超过252个交易日的早期筹码影响有限,予以忽略 [7] - 筹码加权平均成本的计算公式为:所有历史交易日平均价格与该日留存筹码规模的乘积之和,再除以总留存筹码规模 [7] - 将筹码平均成本与最新收盘价对比,可衡量市场整体持仓的浮盈或浮亏状态,该指标被称为筹码成本因子 [8][9] - 全市场测试显示,筹码成本因子呈现出与反转因子相似的收益特征:空头端(Q1,浮亏最严重)分离效果明显,但多头端(Q5)分离能力弱,收益最高的分组出现在中间组(Q3) [10][11][17] 基于资金分类的筹码结构改进 - 传统筹码构建未区分投资者类型,而机构与散户在交易行为上存在显著差异,仅用总体数据可能掩盖重要信息 [19] - 研究根据挂单金额划分投资者类别:小于4万元为散户,4万至20万元为中户,20万至100万元为大户,大于100万元为机构 [19][21] - 分别用机构买入总量和散户买入总量替代总成交量,构建各自的筹码成本指标。机构筹码成本因子的Rank IC均值(4.36%)和ICIR(28.78%)仅较传统因子(4.31%, 28.22%)有微小改善,增量信息有限 [20][23] - 为刻画两类资金的博弈关系,构建了“机构-散户筹码成本差”因子。该因子在分组收益上单调性显著(尤其多头端Q5收益达3.36%),但Rank IC均值较低(1.58%),单独使用效果不足 [24][26][27] - 机构散户筹码成本差因子与传统筹码成本因子相关性较低(0.33),为因子合成提供了良好基础 [29][31] 因子合成与表现分析 - 筹码成本因子(高IC、弱单调性)与筹码成本差因子(低IC、强单调性)具有良好互补性,研究采用正交化方法将两者合成为新的筹码因子 [31][32][34] - 合成因子的Rank IC均值达4.35%,ICIR提升至29.12%,分组单调性(尤其多头端)也得到改善,Q5分组收益为2.08%,实现了预测能力与排序稳定性的共同提升 [32][35][40] - 合成因子的有效性存在明显市值分域差异:在沪深300中Rank IC均值为-0.71%,表现最弱;在中证500中为0.42%;在中证1000中为4.26%;在中证800以外的小市值股票中表现最优,达5.66% [37][41][42] - 针对中证800成分股筹码博弈特征弱的情况,对合成因子进行反向应用优化。优化后,该分域内因子IC由负转正,ICIR大幅提升至54.40%,分组收益单调性也进一步增强 [43][44] - 相关性分析显示,合成因子与反转因子(Reverse)负相关性最高(-0.59),与动量因子(Momentum)也呈负相关(-0.25),印证了其反转特性 [48] - 进一步探讨使用“净买入量差”(买入-卖出)替代“买入总量”来构建机构筹码成本。以此方法构建的“量差机构筹码成本”因子Rank IC提升至5.14%,且与传统筹码成本相关性更低(0.73),为因子组合提供了额外增量信息 [56][58][60]
基于资金流数据的筹码结构因子构建——投资者分层视角下的信息增量
申万宏源金工·2026-03-18 09:01