Workflow
市场微观结构系列(32):深度学习赋能因子挖掘2.0:综合应用方案
开源证券· 2026-01-28 17:14
量化模型与构建方式 1. **模型名称:因子挖掘2.0模型框架(GRU+GAT_SA加权_考虑财务)**[2][18] * **模型构建思路**:在1.0版本(LSTM+MLP)基础上进行升级,通过GRU网络挖掘时序信息,通过GAT网络挖掘股票间的截面关联信息,并使用自注意力(SA)加权方式融合不同关联网络(行业、财务、资金流)的GAT输出,最后拼接财务指标以增强多头表现。[2][18][24][25][32][35] * **模型具体构建过程**: 1. **输入**:使用不同的特征集(如PV、G、C等)作为模型输入。[19] 2. **时序信息提取**:输入特征首先通过GRU(门控循环单元)网络,提取时间序列上的隐藏信息。[24] 3. **截面信息提取**:将GRU的输出作为GAT(图注意力网络)的输入。GAT网络根据预定义的股票关联图(如行业关联、财务关联、资金流关联)聚合邻居节点的信息。[25][27] 4. **多网络融合**:对于三种不同关联网络(行业、财务、资金流)的GAT输出,不采用简单等权合成,而是引入一个可学习的MLP层进行SA加权。该MLP层的输入为过去20日的Barra风格因子收益,输出经Softmax归一化后得到各网络的动态权重。[7][32] 5. **财务信息融合**:将SA加权融合后的GAT输出,与截面标准化后的财务指标(9大类,含原始值、同比、环比)进行拼接。[35][36][37] 6. **输出**:拼接后的特征通过一个全连接层(MLP),输出最终的因子预测值。[35] 2. **模型名称:收益率牵引因子模型**[27] * **模型构建思路**:基于资金流关联网络,通过聚合同状态股票集的收益率信息来构建选股因子,是GAT网络思想的雏形。[27] * **模型具体构建过程**: 1. **构建关联状态**:在每个交易日,回看过去20个交易日,根据小单净流入强度将股票分为20种状态。[27] 2. **计算同状态股票集收益**:对于股票A,找到与其处于相同状态的所有股票,计算该股票集合的收益平均值。[27] 3. **计算因子值**:将股票A自身的收益对同状态股票集收益平均值进行回归,所得的残差即为股票A的因子值。[27] $$因子值_A = 残差(收益_A \sim 同状态股票集平均收益)$$ 3. **因子名称:ML_C(综合深度学习因子)**[7][69] * **因子构建思路**:将多个单一特征集(PV, G, C, HF, DP)以及二维度交叉挖掘出的因子,按照其多头收益表现进行加权合成,得到最终的综合因子。[69] * **因子具体构建过程**: 1. **单一维度挖掘**:使用“GRU+GAT_SA加权_考虑财务”模型,分别对PV、G、C、HF、DP五个特征集进行训练,得到五个基础因子。[68] 2. **二维度交叉挖掘**:尝试将任意两个特征维度放在一起进行联合挖掘,维度间使用SA加权,得到一系列二维因子。[69] 3. **合成**:将步骤1得到的基础因子和步骤2得到的二维因子,按照各自的多头收益表现进行加权,合成最终的ML_C因子。[69] 4. **因子名称:G(技术指标和K线状态变量)**[7][19][45] * **因子构建思路**:从图形识别思路出发,基于基础行情(开、高、低、收、成交量)计算技术指标和合成K线,并通过状态变量编码进行特征拓展。[45] * **因子具体构建过程**:报告未提供具体计算的技术指标列表和K线状态变量编码公式,但指出其转化思路来源于《深度学习赋能技术分析》报告。[45][46] 5. **因子名称:C(大小单资金流)**[7][19][52] * **因子构建思路**:基于大小单资金流原始数据,通过计算衍生指标和状态变量来增强特征。[52][54] * **因子具体构建过程**: 1. **原始数据**:使用AshareMoneyFlow基础表中的资金流数据。[52] 2. **衍生指标**:计算如资金流过去250日的分位点等特征。[54] 3. **状态变量转化**:针对每类资金流(如买入、卖出、主动买入、主动卖出),每日判断四个问题:净买入>0?主动净买入>0?主动买入比例>0.5?主动卖出比例>0.5?将答案转化为状态变量。[54][55] 6. **因子名称:HF(高频特征)**[7][19][59] * **因子构建思路**:将高频数据降维至日度特征进行挖掘。[59] * **因子具体构建过程**:输入特征包括两部分:1) 分钟收益率和分钟成交量相关衍生指标;2) 逐笔成交数据降频至分钟频后计算的相关衍生指标,具体指标来源于前期相关报告。[59] 7. **因子名称:DP(遗传算法有效因子)**[7][19][60] * **因子构建思路**:将前期通过遗传算法挖掘出的有效因子(Alpha185因子集)作为特征,输入深度学习模型进行“再掘金”。[60][65] * **因子具体构建过程**:从Alpha185因子集中,筛选在2017年之前表现较好且缺失度较低的48个因子作为输入特征。在挖掘时,由于输入已是有效因子,不再使用时序网络(GRU),而直接采用GAT网络进行截面信息挖掘。[60][65] 8. **模型名称:行业轮动因子合成模型**[89][91][92] * **模型构建思路**:采用自下而上的方法,将个股因子通过多种方式聚合至行业层面,构建行业轮动因子。[89] * **模型具体构建过程**: 1. **聚合方法**:对个股因子采用5种聚合方式生成行业因子:(1)因子值均值(等权);(2)因子值市值加权;(3)因子值分域后等权(前1/3标1,后2/3标-1,其余0,取均值);(4)因子值分域后市值加权;(5)选取因子值前20%的股票,统计其数量占行业股票总数的比例。[89] 2. **因子选取与合成**:选取“综合因子ML_C”等5个特定因子在特定聚合方式下生成的行业轮动因子,进行等权合成,得到最终的行业轮动因子。[91][92] 9. **模型名称:强化学习风格优选模型**[5][76][77] * **模型构建思路**:针对深度学习因子风格倾向性强的问题,结合强化学习进行风格轮动,实现Alpha与Beta的协同优选,以降低极端市场环境下的回撤。[5][76] * **模型具体构建过程**:基于《深度学习赋能风格轮动和多策略融合》中的方案,将风格轮动转化为截面标的优选问题,使用强化学习SAC方法进行日度决策。在调仓日,汇总过去20个交易日的风格action值进行排序,选取排名靠前的10种风格。[77][80] 模型的回测效果 *测试区间均为2020年1月1日至2025年11月28日,双周频调仓,因子经市值行业中性化处理。多头超额基准:全市场为中证全指,宽基内为对应宽基指数。[24]* 1. **GRU+GAT_SA加权_考虑财务模型 (基于PV特征集)**,10日RankIC 11.7%,年化RankICIR 5.7,多空对冲年化收益 58.9%,多空对冲信息比率 5.1,多空对冲最大回撤 -4.8%,多空对冲胜率 82.7%,多头超额年化收益 24.1%,多头超额信息比率 3.0,多头超额最大回撤 -5.4%,多头超额胜率 72.0%。[39][44] 2. **GRU+GAT_SA加权_考虑财务模型 (基于G特征集)**,10日RankIC 11.0%,年化RankICIR 5.8,多空对冲年化收益 59.9%,多空对冲信息比率 6.2,多空对冲最大回撤 -2.5%,多空对冲胜率 82.7%,多头超额年化收益 23.3%,多头超额信息比率 3.3,多头超额最大回撤 -5.4%,多头超额胜率 75.3%。[47][49] 3. **GRU+GAT_SA加权_考虑财务模型 (基于C特征集)**,10日RankIC 10.6%,年化RankICIR 5.1,多空对冲年化收益 56.4%,多空对冲信息比率 5.2,多空对冲最大回撤 -4.4%,多空对冲胜率 81.3%,多头超额年化收益 19.5%,多头超额信息比率 2.8,多头超额最大回撤 -5.6%,多头超额胜率 70.0%。[56][58] 4. **GRU+GAT_SA加权_考虑财务模型 (基于HF特征集)**,10日RankIC 11.6%,年化RankICIR 5.9,多空对冲年化收益 57.5%,多空对冲信息比率 5.8,多空对冲最大回撤 -5.2%,多空对冲胜率 82.0%,多头超额年化收益 19.1%,多头超额信息比率 2.6,多头超额最大回撤 -7.4%,多头超额胜率 73.3%。[59][62] 5. **GRU+GAT_SA加权_考虑财务模型 (基于DP特征集)**,10日RankIC 11.4%,年化RankICIR 6.2,多空对冲年化收益 49.2%,多空对冲信息比率 4.4,多空对冲最大回撤 -4.7%,多空对冲胜率 76.0%,多头超额年化收益 20.3%,多头超额信息比率 2.8,多头超额最大回撤 -4.6%,多头超额胜率 70.0%。[65][66] 6. **PV和G因子合成 (基于GRU+GAT_SA加权_考虑财务模型)**,全市场10日RankIC 12.4%,年化RankICIR 6.0,多空对冲年化收益 66.7%,多空对冲信息比率 6.0,多空对冲最大回撤 -4.5%,多空对冲胜率 82.7%,多头超额年化收益 24.5%,多头超额信息比率 3.3,多头超额最大回撤 -3.9%,多头超额胜率 75.3%。[50][51] 7. **ML_C (综合深度学习因子)**,全市场10日RankIC 14.2%,年化RankICIR 6.3,多空对冲年化收益 72.7%,多空对冲信息比率 6.1,多空对冲最大回撤 -4.8%,多空对冲胜率 82.0%,多头超额年化收益 26.1%,多头超额信息比率 3.1,多头超额最大回撤 -5.0%,多头超额胜率 74.0%。[7][72] 8. **ML_C因子在沪深300样本空间**,10日RankIC 8.6%,年化RankICIR 2.7,多空对冲年化收益 26.4%,多空对冲信息比率 1.9,多空对冲最大回撤 -14.6%,多空对冲胜率 60.7%,多头超额年化收益 12.4%,多头超额信息比率 1.3,多头超额最大回撤 -6.3%,多头超额胜率 57.3%。[73][75] 9. **ML_C因子在中证500样本空间**,10日RankIC 9.4%,年化RankICIR 3.5,多空对冲年化收益 37.9%,多空对冲信息比率 2.8,多空对冲最大回撤 -15.5%,多空对冲胜率 70.0%,多头超额年化收益 13.7%,多头超额信息比率 2.0,多头超额最大回撤 -5.3%,多头超额胜率 66.7%。[73][75] 10. **ML_C因子在中证1000样本空间**,10日RankIC 11.8%,年化RankICIR 4.7,多空对冲年化收益 57.0%,多空对冲信息比率 4.1,多空对冲最大回撤 -12.4%,多空对冲胜率 78.0%,多头超额年化收益 17.3%,多头超额信息比率 2.3,多头超额最大回撤 -8.1%,多头超额胜率 65.3%。[74][75] 11. **行业轮动因子 (5因子等权合成)**,10日RankIC 9.21%,多头年化收益 17.93%,多头年化波动率 25.44%,多头最大回撤 -20.23%,多头胜率 54.67%,夏普比率 0.70,多空对冲年化收益 22.41%,多空对冲信息比率 1.70,多空对冲最大回撤 -9.96%,多空对冲胜率 60.00%。[92][94] 12. **上证50增强 (行业轮动方案)**,超额年化收益 4.95%,超额年化波动率 2.17%,超额信息比率 2.28,超额最大回撤 -1.98%。[5][95][97] 13. **上证50增强 (Barra优化框架)**,超额年化收益 5.82%,超额年化波动率 2.78%,超额信息比率 2.09,超额最大回撤 -3.03%。[99][101] 14. **沪深300增强 (Barra优化框架)**,超额年化收益 6.77%,超额年化波动率 3.29%,超额信息比率 2.06,超额最大回撤 -3.81%。[5][103][106] 15. **中证500增强 (Barra优化框架)**,超额年化收益 10.72%,超额年化波动率 3.78%,超额信息比率 2.83,超额最大回撤 -3.31%。[5][103][109] 16. **中证1000增强 (Barra优化框架)**,超额年化收益 14.41%,超额年化波动率 4.42%,超额信息比率 3.26,超额最大回撤 -3.34%。[5][103][112] 量化因子与构建方式 1. **因子名称:收益率牵引因子**[27] * **因子构建思路**:基于资金流关联网络,通过聚合同状态股票集的收益率信息来构建选股因子。[27] * **因子具体构建过程**: 1. **构建关联状态**:在每个交易日,回看过去20个交易日,根据小单净流入强度将股票分为20种状态。[27] 2. **计算同状态股票集收益**:对于股票A,找到与其处于相同状态的所有股票,计算该股票集合的收益平均值。[27] 3. **计算因子值**:将股票A自身的收益对同状态股票集收益平均值进行回归,所得的残差即为股票A的因子值。[27] $$因子值_A = 残差(收益_A \sim 同状态股票集平均收益)$$ * **因子评价**:该因子具备一定的选股效果,是GAT网络挖掘因子思想的雏形。[27] 2. **因子名称:开源金工特色大小单资金流人工因子(大单残差、小单残差、主动买卖、散户羊群效应、超大单关注度)**[52][53] * **因子构建思路**:基于AshareMoneyFlow基础表,从不同角度人工构建的交易行为因子。[52] * **因子具体构建过程**:报告未提供具体公式,仅列出因子名称及来源报告。[53] 因子的回测效果 *测试区间均为2020年1月1日至2025年11月28日,双周频调仓。[53]* 1. **收益率牵引因子**,10日RankIC 2.3%。[27] 2. **大单残差因子**,10日RankIC 2.1%,RankICIR 1.6。[53] 3. **小单残差因子**,10日RankIC -2.2%,RankICIR -1.9。[53] 4. **主动买卖因子**,10日RankIC 4.8%,RankICIR 3.5。[53] 5. **散户羊群效应因子**,10日RankIC -3.0%,RankICIR -2.3。[53] 6. **超大单关注度因子**,10日RankIC 5.3%,RankICIR 3.9。[53]
融资融券周报:主要指数多数上涨,两融余额继续上升-20260128
渤海证券· 2026-01-28 16:09
量化模型与构建方式 本报告为融资融券周报,主要描述市场两融数据概况,未涉及具体的量化预测模型或用于选股的量化因子构建。报告内容侧重于对融资融券相关指标的统计、计算和排名展示[2][10][13]。 报告中使用了一系列基于融资融券数据的统计指标,这些指标可以视为描述性因子,用于观察市场情绪和资金流向。以下是报告中出现的核心指标(因子)及其构建方式: **1. 因子名称:融资净买入额** * **因子构建思路**:衡量特定时间段内(如一周)融资买入资金与偿还资金的净差额,反映投资者通过融资加码看多的净力度[31]。 * **因子具体构建过程**:计算周期内每日融资买入额与融资偿还额的差值,并对周期内的日度差值进行求和。对于个股、行业或ETF,分别汇总其对应的融资交易数据。 $$融资净买入额 = \sum_{t=1}^{T}(融资买入额_t - 融资偿还额_t)$$ 其中,$t$ 代表周期内的交易日,$T$ 为周期总交易日数。报告中使用“上周”即2026年1月21日至1月27日作为计算周期[31][45][48]。 **2. 因子名称:融券净卖出额** * **因子构建思路**:衡量特定时间段内融券卖出量与偿还量的净差额,反映投资者通过融券表达看空观点的净力度[32]。 * **因子具体构建过程**:计算周期内每日融券卖出量与融券偿还量的差值,并对周期内的日度差值进行求和。对于个股、行业或ETF,分别汇总其对应的融券交易数据。 $$融券净卖出额 = \sum_{t=1}^{T}(融券卖出量_t - 融券偿还量_t)$$ 报告中将此指标用于行业和个股分析[32][51]。 **3. 因子名称:融资买入额占成交额比例** * **因子构建思路**:衡量融资买入交易在总市场交易中的活跃度或占比,比例越高通常表示该标的的短线杠杆资金关注度越高[36]。 * **因子具体构建过程**:对于单个标的(个股、行业或整体市场),计算其特定周期内的总融资买入额,除以同期的总成交金额。 $$融资买入额占成交额比例 = \frac{\sum_{t=1}^{T}融资买入额_t}{\sum_{t=1}^{T}成交额_t} \times 100\%$$ 报告分别计算了行业和个股的该比例值[36][49]。 **4. 因子名称:融资余额占流通市值比例** * **因子构建思路**:衡量融资负债规模相对于标的可交易市值的大小,反映杠杆资金的整体持仓比重和潜在风险[36]。 * **因子具体构建过程**:使用期末(如上周末)的融资余额,除以对应标的的流通市值。 $$融资余额占流通市值比例 = \frac{期末融资余额}{期末流通市值} \times 100\%$$ 报告在行业分析中展示了该指标[36]。 **5. 因子名称:融券卖出额占成交额比例** * **因子构建思路**:衡量融券卖出交易在总市场交易中的活跃度,比例越高表示市场空方力量或套保需求越活跃[40]。 * **因子具体构建过程**:对于单个行业,计算其特定周期内的总融券卖出额,除以同期的总成交金额。 $$融券卖出额占成交额比例 = \frac{\sum_{t=1}^{T}融券卖出额_t}{\sum_{t=1}^{T}成交额_t} \times 100\%$$ 报告在行业分析中展示了该指标[40]。 **6. 因子名称:融券余额占流通市值比例** * **因子构建思路**:衡量融券未平仓头寸相对于标的可交易市值的大小,反映市场现存空头力量的规模[40]。 * **因子具体构建过程**:使用期末(如上周末)的融券余额,除以对应标的的流通市值。 $$融券余额占流通市值比例 = \frac{期末融券余额}{期末流通市值} \times 100\%$$ 报告在行业分析中展示了该指标[40]。 量化因子的回测效果 本报告为周度数据统计报告,未提供基于历史数据的因子回测结果(如IC、IR、多空收益等)。报告主要展示了截至2026年1月27日当周(1月21日-1月27日)各类因子的截面数据排名和取值,属于数据快照,而非回测绩效[2][31][48]。 **1. 融资净买入额因子取值(上周)** * **行业层面**:融资净买入额前三的行业为有色金属、非银金融、通信;后三的行业为汽车、传媒、国防军工[31]。 * **ETF层面**:融资净买入额前五的ETF为华夏上证50ETF (37,182.76万元)、华泰柏瑞沪深300ETF (34,295.16万元)、广发中证港股通非银ETF (27,444.49万元)、华安黄金易(ETF) (25,647.19万元)、嘉实沪深300ETF (23,956.65万元)[45][46]。 * **个股层面**:融资净买入额前五的个股为中国平安 (183,338.58万元)、新易盛 (151,289.62万元)、紫金矿业 (136,437.13万元)、天孚通信 (94,120.44万元)、兴业银行 (92,861.61万元)[48][50]。 **2. 融券净卖出额因子取值(上周)** * **行业层面**:融券净卖出额前三的行业为有色金属、石油石化、通信;后三的行业为公用事业、银行、计算机[32]。 * **个股层面**:融券净卖出额前五的个股为比亚迪 (1,647.18万元)、赤峰黄金 (1,474.71万元)、蓝色光标 (1,145.91万元)、贵州茅台 (1,104.75万元)、工业富联 (1,068.38万元)[51][52]。 **3. 融资买入额占成交额比例因子取值(上周)** * **行业层面**:比例最高的三个行业为非银金融 (11.49%)、通信 (10.73%)、电子 (10.08%);比例最低的三个行业为轻工制造 (4.61%)、纺织服饰 (4.80%)、建筑材料 (5.94%)[36][37]。 * **个股层面**:比例最高的五只个股为中金公司 (24.42%)、浙商银行 (22.23%)、众鑫股份 (21.66%)、上声电子 (21.65%)、深圳机场 (21.15%)[49][50]。 **4. 融资余额占流通市值比例因子取值(上周末)** * **行业层面**:比例最高的三个行业为计算机 (4.00%)、通信 (3.60%)、国防军工 (3.28%);比例最低的三个行业为石油石化 (0.69%)、银行 (0.86%)、煤炭 (0.92%)[36][37]。 **5. 融券卖出额占成交额比例因子取值(上周)** * **行业层面**:比例最高的三个行业为食品饮料 (0.05%)、石油石化 (0.05%)、银行 (0.05%);比例最低的三个行业为综合 (0.01%)、轻工制造 (0.01%)、美容护理 (0.01%)[40][41]。 **6. 融券余额占流通市值比例因子取值(上周末)** * **行业层面**:比例最高的三个行业为传媒 (0.02%)、有色金属 (0.02%)、国防军工 (0.01%);比例最低的三个行业为银行 (0.00%)、石油石化 (0.00%)、纺织服饰 (0.00%)[40][41]。
A股市场快照:宽基指数每日投资动态2026.01.28-20260128
江海证券· 2026-01-28 14:29
量化模型与因子总结 量化模型与构建方式 本报告未涉及具体的量化预测或选股模型,主要是对市场宽基指数的多维度指标进行跟踪和统计分析[1][6]。报告中使用了一系列量化指标(因子)来刻画市场状态。 量化因子与构建方式 1. **因子名称**:连阴连阳天数[12] * **因子构建思路**:通过计算指数K线连续为阴线或阳线的天数,来反映市场的短期趋势强度和持续性[12]。 * **因子具体构建过程**:从当前交易日开始向前追溯,若当日收益率为正则计数加1(连阳),若为负则计数减1(连阴),连续同向则累计,方向改变则重新从±1开始计数[12]。正数表示连阳天数,负数表示连阴天数[12]。 2. **因子名称**:指数与均线比较[15] * **因子构建思路**:通过比较指数收盘价与不同周期移动平均线(MA)的位置关系,判断指数所处的短期、中期趋势状态[15]。 * **因子具体构建过程**:计算指数收盘价相对于各周期均线(如MA5, MA10, MA20, MA60, MA120, MA250)的百分比偏离度,公式为: $$ vsMA = (Close / MA_n - 1) \times 100\% $$ 其中,$Close$为当日收盘价,$MA_n$为n日移动平均线[17]。根据偏离度的正负和大小判断指数是突破、站上还是位于均线之下[15]。 3. **因子名称**:交易金额占比[19] * **因子构建思路**:计算特定宽基指数成交额占全市场(以中证全指为代表)成交额的比例,用以观察资金在不同板块或风格间的流向和集中度[19]。 * **因子具体构建过程**:对于指数$i$,在交易日$t$,其交易金额占比计算公式为: $$ 交易金额占比_{i, t} = \frac{成交额_{i, t}}{成交额_{中证全指, t}} \times 100\% $$ [19] 4. **因子名称**:指数换手率[19] * **因子构建思路**:衡量指数成分股整体的交易活跃度,高换手率通常意味着高关注度和高流动性[19]。 * **因子具体构建过程**:采用流通市值加权平均的方式计算指数换手率,公式为: $$ 指数换手率_t = \frac{\sum (成分股流通股本 \times 成分股换手率)_t}{\sum (成分股流通股本)_t} $$ [19] 5. **因子名称**:收益率分布形态(偏度与峰度)[25] * **因子构建思路**:通过计算指数日收益率序列的偏度和超额峰度,分析收益率分布的不对称性和尖峰肥尾特征,以评估市场极端风险[25][26]。 * **因子具体构建过程**: * **偏度 (Skewness)**:衡量分布的不对称性。正偏态表示极端正收益情形更多[25]。 * **峰度 (Kurtosis)**:报告中计算的是超额峰度,即原始峰度减去正态分布峰度3,用以衡量分布相比正态分布的尖峭或扁平程度[26]。峰度越大,说明收益率分布更集中[25]。 6. **因子名称**:风险溢价[28] * **因子构建思路**:以十年期国债即期收益率作为无风险利率的代理,计算股票指数收益率与其之差,衡量股票市场相对于无风险资产的超额回报和投资价值[28]。 * **因子具体构建过程**:风险溢价通常计算为指数市盈率倒数(E/P)与无风险利率之差。报告中的具体计算未明确给出公式,但根据上下文,其数值可能来源于此概念[28][32]。同时,报告计算了风险溢价的近1年及近5年历史分位值,以判断当前风险溢价在历史中所处的位置[30][32]。 7. **因子名称**:PE-TTM(滚动市盈率)及其分位值[40] * **因子构建思路**:使用最近十二个月(TTM)的净利润计算市盈率,作为衡量指数估值水平的核心指标,并通过历史分位值判断当前估值的相对高低[40][43]。 * **因子具体构建过程**: * **PE-TTM**:$$ PE\text{-}TTM = \frac{指数总市值}{\sum (成分股最近12个月净利润)} $$ * **历史分位值**:将当前PE-TTM值放入过去一段时间(如近1年、近5年)的估值序列中,计算其百分位排名[43][44]。 8. **因子名称**:股债性价比[47] * **因子构建思路**:计算股票市场潜在收益率(以PE-TTM的倒数表示)与债券市场收益率(十年期国债即期收益率)的差值,用于在资产配置中比较股票和债券的相对吸引力[47]。 * **因子具体构建过程**:公式为: $$ 股债性价比 = \frac{1}{PE\text{-}TTM} - 十年期国债即期收益率 $$ [47] 9. **因子名称**:股息率[48] * **因子构建思路**:衡量指数成分股现金分红的回报率,是高股息、红利投资风格的核心指标,尤其在市场波动或利率下行期受到关注[48]。 * **因子具体构建过程**:$$ 股息率 = \frac{\sum (成分股近12个月现金分红总额)}{指数总市值} \times 100\% $$ 报告同样计算了其近1年及近5年历史分位值[49][54]。 10. **因子名称**:破净率[55] * **因子构建思路**:统计指数中市净率(PB)小于1的个股数量占比,反映市场整体或特定板块的估值低迷程度,破净率越高通常意味着市场情绪越悲观[55][57]。 * **因子具体构建过程**:对于指数$i$,在交易日$t$,其破净率计算公式为: $$ 破净率_{i, t} = \frac{市净率(PB) < 1的成分股数量_{i, t}}{指数总成分股数量_{i, t}} \times 100\% $$ [55][58] 因子的回测效果 本报告为市场数据跟踪报告,未提供因子在选股或预测模型中的分层测试、多空组合收益、信息比率(IR)等传统因子回测绩效指标。报告主要展示了各因子在**当前时点(2026年1月27日)** 对于不同宽基指数的截面取值和与历史均值的比较[11][17][32][44][54][58]。 1. **连阴连阳天数因子**:当日,上证50连阳2天,沪深300连阴3天,中证2000和中证全指连阳5天,其余指数连阳2天[12]。 2. **指数与均线比较因子**:当日,上证50收盘价高于MA5约0.1%,创业板指高于MA10约0.3%,沪深300低于MA5约0.1%[15][17]。 3. **交易金额占比因子**:当日,沪深300交易金额占比最高,为24.92%,其次为中证1000(21.96%)和中证500(21.29%)[19]。 4. **指数换手率因子**:当日,中证2000换手率最高,为4.7,创业板指为4.13,上证50最低,为0.45[19]。 5. **收益率分布形态因子**:当前数据 vs. 近5年均值,创业板指峰度负偏离最大(-2.69),中证500最小(-1.52);创业板指负偏态最大(-0.65),中证500最小(-0.41)[25][26]。 6. **风险溢价因子**:当前值,创业板指最高(0.70%),沪深300为负(-0.03%);近5年分位值,创业板指(69.68%)和中证500(67.94%)较高,沪深300(49.60%)较低[30][32]。 7. **PE-TTM及其分位值因子**:当前值,中证2000最高(172.09),上证50最低(11.63);近5年分位值,中证500和中证1000极高(99.92%),创业板指较低(64.21%)[43][44]。 8. **股债性价比因子**:当日,没有指数高于其近5年80%分位(机会值),中证500和中证全指低于其近5年20%分位(危险值)[47]。 9. **股息率因子**:当前值,上证50最高(3.24%),中证2000最低(0.69%);近5年分位值,创业板指(55.95%)和沪深300(35.12%)较高,中证500(0.91%)和中证2000(0.50%)极低[52][54]。 10. **破净率因子**:当日,上证50破净率最高(24.0%),中证2000最低(2.35%)[58]。
锚点重塑(一):基准新规落地,当前基准格局如何变?
长江证券· 2026-01-28 13:42
根据提供的研报内容,这是一份关于基金业绩比较基准新规的点评报告,主要分析了政策要点和当前市场基准的构成情况。报告**没有**涉及任何量化模型或量化因子的构建、测试与评价。 因此,根据任务要求,本次总结无法提供关于“量化模型”或“量化因子”的任何具体内容(包括名称、构建思路、构建过程、评价及测试结果)。报告的核心内容集中于政策解读和现状描述[7][11][15][16][18][19][20]。
公募基金2025年四季报全景解析
华福证券· 2026-01-27 22:25
量化模型与构建方式 1. **模型/因子名称**:主动权益基金筛选模型 * **构建思路**:从普通股票型、偏股混合型、平衡混合型和灵活配置型基金中,筛选出长期保持较高股票仓位的基金,定义为主动权益基金,以分析其整体特征[26]。 * **具体构建过程**: 1. 选取普通股票型、偏股混合型、平衡混合型和灵活配置型基金作为初始样本。 2. 计算每只基金过去四个季度的平均持股比例。 3. 将过去四个季度平均持股比例大于60%的基金筛选出来,定义为“主动权益类基金产品”[26]。 2. **模型/因子名称**:固收+基金分类与弹性分组模型 * **构建思路**:为研究“固收+”基金市场,首先定义“固收+”基金,然后根据其历史权益仓位均值进行分组,以区分不同风险收益特征的产品[40]。 * **具体构建过程**: 1. **定义固收+基金**:计算基金过去4个季度的权益仓位均值,权益仓位 = 股票仓位 + 50% * 可转债仓位。将权益仓位均值小于40%,或权益仓位均值大于等于40%但股票仓位均值小于20%的基金,定义为固收+基金产品[40]。 2. **弹性分组**:在固收+基金样本内,根据过去4个季度的权益仓位均值进行分组: * 低弹性组:权益仓位均值 <= 10%[42] * 中弹性组:权益仓位均值 > 10% 且 <= 25%[42] * 高弹性组:权益仓位均值 > 25%[42] 3. **模型/因子名称**:固收基金风险因子分析模型 * **构建思路**:对绩优固收基金(纯债基金)的收益进行归因分析,将其风险暴露拆解到利率曲线和信用结构相关的五个关键风险因子上,以理解其业绩来源[96]。 * **具体构建过程**: 1. 确定风险因子:共五个因子,包括利率曲线的水平因子、斜率因子、凸度因子,以及信用结构中的信用因子和信用下沉因子(违约因子)[96]。 2. 通过因子分析方法,将绩优固收基金的收益归因到这五个风险因子上,计算基金在各因子上的暴露值[96]。 模型的回测效果 (注:本报告为基金市场季度数据总结,未提供模型或因子在历史序列上的系统化回测指标,如年化收益率、夏普比率、最大回撤、信息比率(IR)等。报告主要展示了特定季度末的截面数据或季度内的业绩表现。) 量化因子与构建方式 1. **因子名称**:权益仓位因子 * **构建思路**:用于衡量混合型基金(特别是“固收+”基金)对权益类资产的配置程度,是评估基金风险弹性的核心指标[40]。 * **具体构建过程**:对于单季度,权益仓位 = 股票占基金资产净值比例 + 50% * 可转债占基金资产净值比例[40]。对于多期,可计算其均值,如过去4个季度的权益仓位均值[40]。 2. **因子名称**:债券仓位因子 * **构建思路**:用于衡量纯债型基金的杠杆运作程度和资产配置集中度[91]。 * **具体构建过程**:债券仓位 = 债券市值 / 基金资产净值。报告分别统计了短期纯债基金和中长期纯债基金的平均债券仓位[92]。 3. **因子名称**:利率风险因子(水平、斜率、凸度) * **构建思路**:用于分析纯债基金收益受利率曲线形态变化的影响程度[96]。 * **具体构建过程**:通过因子分析模型,从债券市场数据中提取出代表利率曲线水平、斜率、凸度变化的三个独立风险因子,并计算基金收益对这些因子的敏感度(暴露值)[96]。 4. **因子名称**:信用风险因子(信用因子、违约因子) * **构建思路**:用于分析纯债基金收益受信用利差变化和信用下沉(承担违约风险)影响的程度[96]。 * **具体构建过程**:通过因子分析模型,从信用债市场数据中提取出代表整体信用利差变化(信用因子)和低评级信用债特定风险(信用下沉/违约因子)的两个独立风险因子,并计算基金收益对这些因子的敏感度(暴露值)[96]。 因子的回测效果 (注:本报告未提供上述因子在选股或择基上的有效性检验结果,如IC值、IR、多空收益等。报告中的因子主要用于基金分类和业绩归因的描述性分析。)
金融工程专题研究:公募FOF基金2025年四季报解析
国信证券· 2026-01-27 22:18
量化模型与构建方式 1. **模型/因子名称**:FOF穿透后权益资产占比计算模型[12] * **构建思路**:为了更准确地评估FOF产品的风险收益特征,需要穿透其持有的基金资产,计算其最终投资于股票等权益资产的真实比例[12]。 * **具体构建过程**:根据FOF披露的定期报告(年报/半年报),通过其持仓的基金和股票比例来估算穿透后的权益仓位[12]。具体计算公式为: $$W=\sum_{i}Fund_{i}\times Fund\_Stock_{i}+Stock$$ 其中,`Fund_i` 表示FOF持有的基金i的规模占其自身净值的比例,`Fund_Stock_i` 表示基金i的股票投资市值占其自身净值的比例,`Stock` 表示FOF直接投资的股票市值占其自身净值的比例[12]。对于成立不足3个月的FOF,使用其基准指数对应的权益仓位作为穿透后的权益资产占比[12]。 2. **模型/因子名称**:FOF分类模型[13] * **构建思路**:基于计算出的穿透后权益资产占比,对FOF产品进行标准化分类,以便于比较和分析[13]。 * **具体构建过程**:依据穿透后的权益资产占比 `W`,将FOF分为三类[13]: * 偏债型FOF:定义为 `W < 30%` 的FOF[13]。 * 平衡型FOF:定义为 `30% ≤ W < 60%` 的FOF[13]。 * 偏股型FOF:定义为 `W ≥ 60%` 的FOF[13]。 3. **模型/因子名称**:FOF预估净增持数量因子 (ΔN)[44][45] * **构建思路**:追踪FOF基金经理对某只重仓基金的投资动态,通过计算净增持该基金的FOF数量来反映其受青睐程度的变化[43]。 * **具体构建过程**:对比相邻两个报告期(如2025Q3和2025Q4)FOF的重仓基金数据[43]。单只基金的FOF预估净增持数量计算公式为: $$\Delta N=\sum_{i}I_{i}$$ 其中,相比上一报告期,本报告期第 `i` 只FOF对重仓基金的投资份额变化大于0时 `I_i = 1`;投资份额变化小于0时 `I_i = -1`;投资份额变化等于0时 `I_i = 0`[44][45]。 4. **模型/因子名称**:FOF预估净增持规模因子 (ΔMV)[46][48] * **构建思路**:在净增持数量的基础上,进一步考虑规模因素,以衡量FOF资金流入/流出某只重仓基金的绝对量[43]。 * **具体构建过程**:对于FOF重仓的某只基金,其FOF预估净增持规模的计算公式为: $$\Delta MV=\sum_{i}\Delta uv\times\Delta Share_{i}$$ 其中,`Δuv` 表示两个报告期间重仓基金的日度单位净值均值,`ΔShare_i` 表示相比上一报告期,本报告期第 `i` 只FOF对重仓基金的投资份额变化[46][48]。 5. **模型/因子名称**:FOF预估股票调仓市值因子 (ΔMV)[69][70] * **构建思路**:追踪FOF基金经理对直接投资股票标的的买卖动态,通过计算预估调仓市值来反映其股票投资策略的变化[64]。 * **具体构建过程**:对比相邻两个报告期FOF的重仓股票数据[64]。对于FOF重仓的某只股票,其FOF预估股票调仓市值的计算公式为: $$\Delta MV=\sum_{i}Close\times\Delta Share_{i}$$ 其中,`Close` 表示两个报告期间重仓股票的日度收盘价均值,`ΔShare_i` 表示相比上一报告期,本报告期第 `i` 只FOF对重仓股票的投资股数变化[69][70]。 模型的回测效果 (注:本报告为FOF市场数据统计与观察报告,未提供量化模型或因子在历史数据上的系统性回测结果,如年化收益率、夏普比率、信息比率(IR)、最大回撤等指标。报告内容主要为各类统计榜单和规模、数量、收益中位数等描述性数据。) 量化因子与构建方式 (注:本报告主要涉及对FOF市场及持仓的统计分析,并定义了用于统计分析的几个关键指标(如上述的ΔN和ΔMV)。这些指标更接近于用于观察和排序的统计量,而非传统意义上用于选股或择时的阿尔法因子。因此,本部分内容已合并至“量化模型与构建方式”中。) 因子的回测效果 (注:同上,报告未提供因子的IC、IR、多空收益等传统因子测试结果。)
金融工程日报:沪指震荡收涨,培育钻石概念拉升、黄金股再度大涨-20260127
国信证券· 2026-01-27 22:02
量化模型与构建方式 1. **模型名称**:封板率计算模型[16] **模型构建思路**:通过计算当日最高价涨停且收盘涨停的股票数量与最高价涨停股票总数的比例,来衡量市场涨停板的封板强度,反映市场追涨情绪和资金封板意愿[16] **模型具体构建过程**:首先,筛选出上市满3个月以上的股票。然后,识别出在当日交易中最高价达到涨停价的股票。最后,计算这些股票中收盘价仍为涨停的股票所占的比例。具体公式为: $$封板率=\frac{最高价涨停且收盘涨停的股票数}{最高价涨停的股票数}$$[16] 2. **模型名称**:连板率计算模型[16] **模型构建思路**:通过计算连续两日收盘涨停的股票数量占前一日所有涨停股票数量的比例,来衡量市场涨停效应的持续性,反映市场炒作热度的延续性[16] **模型具体构建过程**:首先,筛选出上市满3个月以上的股票。然后,找出前一日(T-1日)收盘涨停的股票。最后,计算这些股票中在当日(T日)收盘也涨停的股票所占的比例。具体公式为: $$连板率=\frac{连续两日收盘涨停的股票数}{昨日收盘涨停的股票数}$$[16] 3. **模型名称**:大宗交易折价率计算模型[25] **模型构建思路**:通过计算大宗交易成交总额与按当日市价计算的成交份额总市值的差异比例,来反映大资金通过大宗交易平台交易的折价水平,可用于观察机构或大股东的交易情绪和流动性折价[25] **模型具体构建过程**:首先,获取当日所有大宗交易的成交数据,包括每笔交易的成交股数和成交价格。然后,计算所有大宗交易的总成交金额。接着,根据当日股票的收盘价(或成交均价)计算这些成交份额对应的总市值。最后,计算折价率。具体公式为: $$折价率=\frac{大宗交易总成交金额}{当日成交份额的总市值}-1$$[25] 4. **模型名称**:股指期货年化贴水率计算模型[27] **模型构建思路**:通过计算股指期货价格与现货指数价格之间的基差,并将其年化,以标准化衡量不同期限合约的升贴水程度,用于评估市场情绪、对冲成本及期现套利机会[27] **模型具体构建过程**:首先,获取股指期货主力合约的结算价和对应的现货指数收盘价,计算基差(期货价格 - 现货价格)。然后,获取该期货合约的剩余交易日数。最后,将基差率进行年化处理。具体公式为: $$年化贴水率=\frac{基差}{指数价格} \times \frac{250}{合约剩余交易日数}$$[27] **模型评价**:年化贴水率是衡量股指期货市场情绪和对冲成本的关键指标,升水通常代表市场情绪乐观或对冲需求低,贴水则相反[27] 模型的回测效果 1. 封板率计算模型,2026年1月27日封板率取值71%[16] 2. 封板率计算模型,较前日变化提升10%[16] 3. 连板率计算模型,2026年1月27日连板率取值19%[16] 4. 连板率计算模型,较前日变化提升3%[16] 5. 大宗交易折价率计算模型,近半年以来平均折价率取值6.84%[25] 6. 大宗交易折价率计算模型,2026年1月26日折价率取值5.41%[25] 7. 股指期货年化贴水率计算模型(上证50),近一年以来年化贴水率中位数取值0.68%[27] 8. 股指期货年化贴水率计算模型(上证50),2026年1月27日年化升水率取值2.97%[27] 9. 股指期货年化贴水率计算模型(沪深300),近一年以来年化贴水率中位数取值3.79%[27] 10. 股指期货年化贴水率计算模型(沪深300),2026年1月27日年化升水率取值2.08%[27] 11. 股指期货年化贴水率计算模型(中证500),近一年以来年化贴水率中位数取值11.11%[27] 12. 股指期货年化贴水率计算模型(中证500),2026年1月27日年化贴水率取值0.12%[27] 13. 股指期货年化贴水率计算模型(中证1000),近一年以来年化贴水率中位数取值13.61%[27] 14. 股指期货年化贴水率计算模型(中证1000),2026年1月27日年化贴水率取值2.33%[27] 量化因子与构建方式 1. **因子名称**:昨日涨停股今日收益因子[13] **因子构建思路**:通过计算前一日收盘涨停的股票在次日的平均收益率,来捕捉涨停板后的动量效应或反转效应,用于观察短线资金的行为模式[13] **因子具体构建过程**:首先,筛选出上市满3个月以上且在前一日(T-1日)收盘涨停的股票。然后,计算这些股票在当日(T日)的收盘收益率。最后,计算所有符合条件的股票收益率的平均值(或等权平均)。该因子是事件驱动型因子,直接观测涨停事件后的股价表现[13] 2. **因子名称**:昨日跌停股今日收益因子[13] **因子构建思路**:通过计算前一日收盘跌停的股票在次日的平均收益率,来捕捉跌停板后的反转效应或恐慌情绪的延续,用于观察市场极端抛压后的修复能力[13] **因子具体构建过程**:首先,筛选出上市满3个月以上且在前一日(T-1日)收盘跌停的股票。然后,计算这些股票在当日(T日)的收盘收益率。最后,计算所有符合条件的股票收益率的平均值(或等权平均)。该因子是事件驱动型因子,直接观测跌停事件后的股价表现[13] 3. **因子名称**:机构调研热度因子[30] **因子构建思路**:通过统计近一段时间内(如一周)对上市公司进行调研的机构数量,来衡量机构投资者对公司的关注度,通常认为关注度越高可能隐含更多未公开信息或投资机会[30] **因子具体构建过程**:首先,收集上市公司披露的投资者关系活动记录。然后,统计每家公司在一定时间窗口内(报告中为近7天)被调研的机构家数。最后,将该数量作为该公司的因子值。这是一个基于公开信息的舆情类因子[30] 4. **因子名称**:龙虎榜机构净流入因子[35] **因子构建思路**:通过计算龙虎榜披露的机构专用席位在特定股票上的净买入金额,来捕捉机构资金的短期流向,用于识别受到机构资金青睐或抛弃的个股[35] **因子具体构建过程**:首先,获取当日龙虎榜数据。然后,对于每只上榜股票,汇总其所有机构专用席位的买入总额和卖出总额。最后,计算净流入金额(买入总额 - 卖出总额)。该因子值即为股票的机构资金净流入额,是一个资金流因子[35] 5. **因子名称**:龙虎榜陆股通净流入因子[36] **因子构建思路**:通过计算龙虎榜披露的陆股通席位在特定股票上的净买入金额,来观察北向资金的短期交易动向,用于跟踪外资对A股个股的偏好变化[36] **因子具体构建过程**:首先,获取当日龙虎榜数据。然后,对于每只上榜股票,汇总其所有陆股通席位的买入总额和卖出总额。最后,计算净流入金额(买入总额 - 卖出总额)。该因子值即为股票的陆股通资金净流入额,是一个资金流因子[36] 因子的回测效果 1. 昨日涨停股今日收益因子,2026年1月27日因子取值2.58%[13] 2. 昨日跌停股今日收益因子,2026年1月27日因子取值-0.43%[13] 3. 机构调研热度因子,近一周因子取值示例:神工股份被71家机构调研[30] 4. 龙虎榜机构净流入因子,2026年1月27日因子取值示例:宏景科技、协鑫集成等位于净流入前十[35] 5. 龙虎榜机构净流出因子,2026年1月27日因子取值示例:中国铀业、拉普拉斯等位于净流出前十[35] 6. 龙虎榜陆股通净流入因子,2026年1月27日因子取值示例:东芯股份、斯迪克等位于净流入前十[36] 7. 龙虎榜陆股通净流出因子,2026年1月27日因子取值示例:东方日升、中超控股等位于净流出前十[36]
大额买入与资金流向跟踪(20260119-20260123)
国泰海通证券· 2026-01-27 18:59
量化因子与构建方式 1. **因子名称:大买单成交金额占比**[7] * **因子构建思路**:该因子旨在刻画大资金的买入行为。通过逐笔成交数据还原买卖单,筛选出大单,并计算其中大买单的成交金额占总成交额的比例。[7] * **因子具体构建过程**: 1. 数据准备:获取股票的逐笔成交数据,数据中包含“叫买序号”和“叫卖序号”字段。[7] 2. 还原买卖单:根据逐笔成交数据中的叫买和叫卖序号,将逐笔成交数据还原为原始的买卖单数据。[7] 3. 筛选大单:对还原后的买卖单,按照每单的成交量设定阈值,筛选出符合条件的大额订单(大单)。[7] 4. 计算指标:针对每个交易日,计算属于大买单的成交金额总和,然后除以该股票当日的总成交金额,得到大买单成交金额占比。[7] $$大买单成交金额占比 = \frac{当日大买单成交金额总和}{当日总成交金额}$$ * **因子评价**:该因子直接反映了机构或大户等大资金的买入意愿和强度,是监测资金动向的高频指标。 2. **因子名称:净主动买入金额占比**[7] * **因子构建思路**:该因子旨在刻画投资者的主动买入行为。通过逐笔成交数据判断交易的主动性,计算主动买入与主动卖出的净额占比。[7] * **因子具体构建过程**: 1. 数据准备:获取股票的逐笔成交数据,数据中包含“买卖标志”字段。[7] 2. 界定主动方向:根据逐笔成交数据中的买卖标志,判断每一笔成交是属于主动买入(以卖一价成交)还是主动卖出(以买一价成交)。[7] 3. 计算净额:将当日所有主动买入的成交金额相加,减去所有主动卖出的成交金额,得到净主动买入金额。[7] 4. 计算指标:将计算得到的净主动买入金额除以该股票当日的总成交金额,得到净主动买入金额占比。[7] $$净主动买入金额占比 = \frac{当日主动买入成交金额总和 - 当日主动卖出成交金额总和}{当日总成交金额}$$ * **因子评价**:该因子反映了市场交易中买方主动发起的攻击性力量,是衡量资金流向和投资者情绪的重要指标。 因子的回测效果 (注:本报告为跟踪周报,主要展示特定时间窗口内因子的截面排序结果和时序分位数,而非长期历史回测的统计指标。因此,以下“指标值”为报告期内计算的具体数值。) 1. **大买单成交金额占比因子**,在个股层面,近5日(20260119-20260123)指标值排名前列的包括:江化微 (96.1%)、锋龙股份 (94.9%)、宁波港 (86.4%)、红塔证券 (86.4%)、重庆钢铁 (86.1%)[9]。在宽基指数层面,近5日指标值分别为:上证指数 (73.2%)、上证50 (70.4%)、沪深300 (72.2%)、中证500 (74.0%)、创业板指 (71.4%)[12]。在行业层面,近5日指标值排名前五的中信一级行业为:钢铁 (78.6%)、煤炭 (77.7%)、传媒 (77.6%)、综合 (77.5%)、有色金属 (77.4%)[13]。在ETF层面,近5日指标值排名前列的包括:华泰柏瑞中证A500ETF (93.0%)、嘉实沪深300ETF (92.3%)、易方达沪深300ETF (92.1%)等[15]。 2. **净主动买入金额占比因子**,在个股层面,近5日(20260119-20260123)指标值排名前列的包括:辽港股份 (25.5%)、荣安地产 (22.8%)、北辰实业 (21.2%)、鞍钢股份 (20.6%)、安阳钢铁 (20.3%)[10]。在宽基指数层面,近5日指标值分别为:上证指数 (-0.6%)、上证50 (-9.0%)、沪深300 (-7.4%)、中证500 (4.9%)、创业板指 (-1.2%)[12]。在行业层面,近5日指标值排名前五的中信一级行业为:钢铁 (7.1%)、有色金属 (5.0%)、医药 (4.1%)、综合金融 (3.4%)、综合 (3.3%)[13]。在ETF层面,近5日指标值排名前列的包括:鹏华中证细分化工产业主题ETF (22.7%)、富国中证细分化工产业主题ETF (18.2%)、华夏创业板人工智能ETF (16.9%)等[16]。
高频因子跟踪:近期level2高频因子全面回暖
国金证券· 2026-01-27 15:18
量化因子与构建方式 1. **因子名称:高频价格区间因子**[3][11] * **因子构建思路**:衡量股票在日内不同价格区间成交的活跃程度,以体现投资者对未来走势的预期[3]。研究发现,高价格区间成交越不活跃,或低价格区间大单越活跃,股票未来上涨可能性越大[11]。 * **因子具体构建过程**:该因子由三个细分因子加权合成。 * **细分因子1:高价格80%区间成交量因子 (VH80TAW)**。利用三秒快照数据,计算股票在日内高价格80%区间的成交量,该因子值与未来收益呈负相关[11]。 * **细分因子2:高价格80%区间成交笔数因子 (MIH80TAW)**。计算股票在日内高价格80%区间的成交笔数,该因子值与未来收益呈负相关[11]。 * **细分因子3:低价格10%区间每笔成交量因子 (VPML10TAW)**。计算股票在日内低价格10%区间的平均每笔成交量,该因子值与未来收益呈正相关[11]。 * **合成方法**:对上述三个细分因子,分别赋予25%、25%和50%的权重进行合成[14]。然后对合成后的因子进行行业和市值中性化处理[14]。 * **因子评价**:该因子展现出了较强的预测效果,今年以来表现比较稳定[3]。在样本外表现出色,超额净值曲线稳定向上[16]。 2. **因子名称:高频量价背离因子**[3][19] * **因子构建思路**:衡量股票价格与成交量的相关性,当量价出现背离时(相关性低),无论股价处于上升或下降通道,未来上涨的可能性均较高[19]。 * **因子具体构建过程**:该因子由两个细分因子等权合成。 * **细分因子1:价格与成交笔数相关性因子 (CorrPM)**。利用高频快照数据,计算快照成交价(或收益率)与快照成交笔数的相关性[19]。 * **细分因子2:价格与成交量相关性因子 (CorrPV)**。利用高频快照数据,计算快照成交价(或收益率)与快照成交量的相关性[19]。 * **合成方法**:对上述两个细分因子进行等权合成[19]。然后对合成后的因子进行行业和市值中性化处理[19]。 * **因子评价**:该因子近几年表现一直不太稳定,多空净值曲线趋近走平[3]。自2020年以来,收益呈现下降趋势,可能与高频因子被广泛使用有关[23]。但今年以来表现良好,能相对稳定获取正的超额收益[23]。 3. **因子名称:遗憾规避因子**[3][24] * **因子构建思路**:基于行为金融学的遗憾规避理论,考察投资者卖出股票后股价反弹的比例和程度。卖出后反弹占比越高或反弹程度越大,股票的预期收益会更低[24]。 * **因子具体构建过程**:该因子由两个细分因子等权合成。 * **细分因子1:卖出反弹占比因子 (LCVOLESW)**。利用逐笔成交数据区分主动买卖方向,计算卖出后股价反弹的交易占比[24]。 * **细分因子2:卖出反弹偏离因子 (LCPESW)**。利用逐笔成交数据区分主动买卖方向,计算卖出后股价反弹的程度[24]。 * **合成方法**:对上述两个细分因子进行等权合成[28]。然后对合成后的因子进行行业和市值中性化处理[28]。 * **因子评价**:该因子展现了较好的预测效果,样本外超额收益稳定,表明A股投资者的遗憾规避情绪会显著影响股价预期收益[3][31]。 4. **因子名称:斜率凸性因子**[3][32] * **因子构建思路**:从投资者耐心与供求关系弹性的角度出发,利用限价订单簿数据计算买卖双方的订单簿斜率,刻画其对股票预期收益的影响[3][32]。买方斜率越大(需求弹性小)或卖方斜率越小(供给弹性大),股票预期收益越高[32]。 * **因子具体构建过程**:该因子由两个细分因子等权合成。 * **细分因子1:低档斜率因子 (Slope_abl)**。将委托量数据按档位累加,用委托价和累计委托量计算低档位的订单簿斜率[32]。 * **细分因子2:高档位卖方凸性因子 (Slope_alh)**。将委托量数据按档位累加,用委托价和累计委托量计算高档位的卖方订单簿凸性[32]。 * **合成方法**:对上述两个细分因子进行等权合成[35]。然后对合成后的因子进行行业和市值中性化处理[35]。 * **因子评价**:该因子自2016年以来收益保持平稳趋势,但在样本外整体表现比较平淡[35]。 量化模型与构建方式 1. **模型名称:高频“金”组合中证1000指数增强策略**[4][38] * **模型构建思路**:将上述三类高频因子(价格区间、量价背离、遗憾规避)等权合成,构建纯高频因子的指数增强策略[4]。 * **模型具体构建过程**: * **因子合成**:将价格区间因子、量价背离因子、遗憾规避因子进行等权合成[4]。 * **策略设置**:以中证1000指数为基准,进行周频调仓[38]。手续费率为单边千分之二[38]。加入换手率缓冲机制以降低调仓成本[38]。 2. **模型名称:高频&基本面共振组合中证1000指数增强策略**[4][43] * **模型构建思路**:将高频因子与有效的传统基本面因子结合,以提升多因子投资组合的表现[43]。 * **模型具体构建过程**: * **因子池**:高频因子包括上述三类因子(价格区间、量价背离、遗憾规避);基本面因子包括一致预期、成长和技术因子[43]。 * **因子合成**:将所有高频因子和基本面因子进行等权合成[4]。 * **策略设置**:以中证1000指数为基准,构建指数增强策略[43]。 因子的回测效果 (注:以下因子表现数据均基于中证1000指数成分股,并经过行业市值中性化处理[10]。超额收益基准为所有成分股等权配置[10]。) 1. **价格区间因子**,上周多空收益率2.18%[10],本月以来多空收益率4.25%[12],今年以来多空收益率4.25%[12];上周多头超额收益率1.24%[10],本月以来多头超额收益率1.60%[12],今年以来多头超额收益率1.60%[12]。 2. **量价背离因子**,上周多空收益率3.60%[10],本月以来多空收益率3.71%[12],今年以来多空收益率3.71%[12];上周多头超额收益率1.80%[10],本月以来多头超额收益率2.41%[12],今年以来多头超额收益率2.41%[12]。 3. **遗憾规避因子**,上周多空收益率0.02%[10],本月以来多空收益率-0.91%[12],今年以来多空收益率-0.91%[12];上周多头超额收益率0.17%[10],本月以来多头超额收益率-0.82%[12],今年以来多头超额收益率-0.82%[12]。 4. **斜率凸性因子**,上周多头超额收益率-0.40%[2],本月以来多头超额收益率-2.01%[2],今年以来多头超额收益率-2.01%[2]。 模型的回测效果 1. **高频“金”组合中证1000指数增强策略**,年化收益率10.56%[39],年化波动率23.75%[39],Sharpe比率0.44[39],最大回撤率47.77%[39],双边换手率(周度)14.66%[39],年化超额收益率9.58%[39],跟踪误差4.36%[39],信息比率(IR)2.20[39],超额最大回撤6.53%[39];上周超额收益0.68%[4],本月以来超额收益-1.74%[4],今年以来超额收益-1.34%[4]。 2. **高频&基本面共振组合中证1000指数增强策略**,年化收益率14.80%[45],年化波动率23.39%[45],Sharpe比率0.63[45],最大回撤率39.60%[45],双边换手率(周度)22.54%[45],年化超额收益率13.70%[45],跟踪误差4.23%[45],信息比率(IR)3.24[45],超额最大回撤4.97%[45];上周超额收益0.18%[4],本月以来超额收益-1.05%[4],今年以来超额收益率-0.92%[4]。
金融工程日报:沪指震荡微跌,黄金、疫苗概念逆势大涨-20260127
国信证券· 2026-01-27 14:18
量化模型与构建方式 1. **模型名称**:封板率计算模型[16] **模型构建思路**:通过计算当日最高价涨停且收盘涨停的股票数量与最高价涨停股票总数的比例,来衡量市场涨停板的封板质量[16] **模型具体构建过程**:首先,筛选出上市满3个月以上的股票。然后,找出在当日盘中最高价达到涨停价的股票。最后,计算这些股票中收盘价仍为涨停的股票所占的比例。具体公式为: $$封板率=最高价涨停且收盘涨停的股票数/最高价涨停的股票数$$[16] 2. **模型名称**:连板率计算模型[16] **模型构建思路**:通过计算连续两日收盘涨停的股票数量占前一日收盘涨停股票总数的比例,来衡量市场涨停板的延续性[16] **模型具体构建过程**:首先,筛选出上市满3个月以上的股票。然后,找出在前一日收盘涨停的股票。最后,计算这些股票中在当日收盘也涨停的股票所占的比例。具体公式为: $$连板率=连续两日收盘涨停的股票数/昨日收盘涨停的股票数$$[16] 3. **模型名称**:大宗交易折价率计算模型[25] **模型构建思路**:通过比较大宗交易成交金额与按市价计算的成交份额总市值,计算折价率,以反映大资金交易的折让程度和市场情绪[25] **模型具体构建过程**:首先,获取当日所有大宗交易的成交总金额。然后,计算这些成交份额按当日市场价格计算的总市值。最后,用成交总金额除以总市值再减1,得到折价率。具体公式为: $$折价率=大宗交易总成交金额/当日成交份额的总市值-1$$[25] 4. **模型名称**:股指期货年化贴水率计算模型[27] **模型构建思路**:通过计算股指期货主力合约价格与现货指数价格的基差,并进行年化处理,来衡量股指期货的升贴水程度,反映市场预期和对冲成本[27] **模型具体构建过程**:首先,计算基差(股指期货价格 - 现货指数价格)。然后,将基差除以现货指数价格,得到未年化的贴水率。最后,乘以年化因子(250除以合约剩余交易日数),得到年化贴水率。具体公式为: $$年化贴水率=基差/指数价格*(250/合约剩余交易日数)$$[27] **模型评价**:年化贴水率的大小会影响股指对冲的成本,其变化一定程度上能反映市场对于未来的预期[27] 模型的回测效果 1. 封板率计算模型,2026年1月26日封板率取值61%[16] 2. 封板率计算模型,较前日封板率变化-22%[16] 3. 连板率计算模型,2026年1月26日连板率取值16%[16] 4. 连板率计算模型,较前日连板率变化-7%[16] 5. 大宗交易折价率计算模型,近半年以来平均折价率取值6.86%[25] 6. 大宗交易折价率计算模型,2026年1月23日折价率取值9.23%[25] 7. 股指期货年化贴水率计算模型,近一年上证50股指期货年化贴水率中位数取值0.68%[27] 8. 股指期货年化贴水率计算模型,近一年沪深300股指期货年化贴水率中位数取值3.79%[27] 9. 股指期货年化贴水率计算模型,近一年中证500股指期货年化贴水率中位数取值11.11%[27] 10. 股指期货年化贴水率计算模型,近一年中证1000股指期货年化贴水率中位数取值13.61%[27] 11. 股指期货年化贴水率计算模型,2026年1月26日上证50股指期货年化升水率取值2.14%[27] 12. 股指期货年化贴水率计算模型,2026年1月26日沪深300股指期货年化升水率取值2.00%[27] 13. 股指期货年化贴水率计算模型,2026年1月26日中证500股指期货年化贴水率取值3.27%[27] 14. 股指期货年化贴水率计算模型,2026年1月26日中证1000股指期货年化贴水率取值6.90%[27] 量化因子与构建方式 1. **因子名称**:昨日涨停股今日收益因子[13] **因子构建思路**:统计前一日收盘涨停的股票在次日的平均收益表现,用于观察涨停股的短期动量或反转效应[13] **因子具体构建过程**:首先,筛选出上市满3个月以上且在前一日收盘涨停的股票。然后,计算这些股票在当日的收盘收益,并求其平均值。该因子即为这个平均收益值[13] 2. **因子名称**:昨日跌停股今日收益因子[13] **因子构建思路**:统计前一日收盘跌停的股票在次日的平均收益表现,用于观察跌停股的短期动量或反转效应[13] **因子具体构建过程**:首先,筛选出上市满3个月以上且在前一日收盘跌停的股票。然后,计算这些股票在当日的收盘收益,并求其平均值。该因子即为这个平均收益值[13] 3. **因子名称**:两融余额占比因子[21] **因子构建思路**:计算融资融券余额占A股市场总流通市值的比重,用于衡量杠杆资金在市场中的整体规模和参与度[21] **因子具体构建过程**:首先,获取当前市场的融资余额与融券余额,相加得到两融余额。然后,获取A股市场的总流通市值。最后,计算两融余额占总流通市值的百分比[21] 4. **因子名称**:两融交易占比因子[21] **因子构建思路**:计算融资买入额与融券卖出额之和占市场总成交额的比例,用于衡量杠杆资金交易的活跃程度[21] **因子具体构建过程**:首先,获取当日的融资买入总额与融券卖出总额,相加得到两融交易总额。然后,获取当日市场的总成交额。最后,计算两融交易总额占总成交额的百分比[21] 因子的回测效果 1. 昨日涨停股今日收益因子,2026年1月26日因子取值0.23%[13] 2. 昨日跌停股今日收益因子,2026年1月26日因子取值-5.26%[13] 3. 两融余额占比因子,2026年1月26日因子取值2.6%[21] 4. 两融交易占比因子,2026年1月26日因子取值9.5%[21]