Workflow
——量化组合跟踪周报20260228:Beta因子表现良好,量化选股组合超额收益显著-20260228
光大证券· 2026-02-28 20:06
量化模型与构建方式 1. PB-ROE-50 组合 * **模型名称**: PB-ROE-50 组合[23] * **模型构建思路**: 基于市净率(PB)和净资产收益率(ROE)两个核心指标构建的选股模型,旨在筛选估值合理且盈利能力强的股票[23]。 * **模型具体构建过程**: 报告未详细描述该组合的具体构建公式和步骤,仅提及其为基于PB和ROE的选股模型[23]。 2. 机构调研组合 * **模型名称**: 机构调研组合[25] * **模型构建思路**: 利用公募基金和私募基金的调研活动信息构建选股策略,认为被机构密集调研的股票可能蕴含投资机会[25]。 * **模型具体构建过程**: 报告未详细描述该组合的具体构建公式和步骤,仅提及分为“公募调研选股策略”和“私募调研跟踪策略”[25]。 3. 大宗交易组合 * **模型名称**: 大宗交易组合[29] * **模型构建思路**: 基于“高成交、低波动”原则,从发生大宗交易的股票中筛选后续表现更佳的标的[29]。 * **模型具体构建过程**: 通过统计分析发现,“大宗交易成交金额比率”越高、“6 日成交金额波动率”越低的股票后续表现更佳。根据此规律,以月频调仓方式构造组合[29]。具体公式未在本文中给出,需参考其2023年8月5日的专题报告[29]。 4. 定向增发组合 * **模型名称**: 定向增发组合[35] * **模型构建思路**: 以定向增发的股东大会公告日为事件节点,构建事件驱动选股策略[35]。 * **模型具体构建过程**: 综合考虑市值因素、调仓周期以及对仓位的控制来构造组合[35]。具体公式未在本文中给出,需参考其2023年11月26日的专题报告[35]。 模型的回测效果 1. PB-ROE-50 组合业绩表现 * **中证500股票池**: 本周超越基准收益率0.70%,今年以来超额收益率-0.92%,本周绝对收益率5.06%,今年以来绝对收益率14.91%[24]。 * **中证800股票池**: 本周超越基准收益率2.32%,今年以来超额收益率6.74%,本周绝对收益率4.39%,今年以来绝对收益率12.72%[24]。 * **全市场股票池**: 本周超越基准收益率2.25%,今年以来超额收益率6.22%,本周绝对收益率5.06%,今年以来绝对收益率14.82%[24]。 2. 机构调研组合业绩表现 * **公募调研选股策略**: 本周超越基准收益率1.38%,今年以来超额收益率1.36%,本周绝对收益率3.43%,今年以来绝对收益率7.04%[26]。 * **私募调研跟踪策略**: 本周超越基准收益率1.51%,今年以来超额收益率11.63%,本周绝对收益率3.56%,今年以来绝对收益率17.88%[26]。 3. 大宗交易组合业绩表现 * **大宗交易组合**: 本周超越基准收益率1.06%,今年以来超额收益率7.79%,本周绝对收益率3.84%,今年以来绝对收益率16.52%[30]。 4. 定向增发组合业绩表现 * **定向增发组合**: 本周超越基准收益率0.97%,今年以来超额收益率1.97%,本周绝对收益率3.75%,今年以来绝对收益率10.23%[36]。 量化因子与构建方式 1. 大类风格因子 * **因子名称**: Beta因子、盈利因子、流动性因子、市值因子等[18]。 * **因子构建思路**: 将众多单因子归类为几个具有明确经济含义的大类风格,以观察市场整体风格动向[18]。 * **因子具体构建过程**: 报告未详细描述大类因子的具体合成方法。 2. 单因子(列举部分) 报告提及了数十个单因子,以下按类别列举部分因子名称及其方向: * **盈利与增长类**: 净利润断层(正向)[12]、单季度ROA(正向)[12]、单季度ROA同比(正向)[12]、单季度ROE同比(正向)[13]、标准化预期外盈利(正向)[13]、单季度净利润同比增长率(正向)[13]、单季度营业收入同比增长率(正向)[13]、总资产增长率(正向)[13]、ROIC增强因子(正向)[13]、营业利润率TTM(正向)[13]、净利润率TTM(正向)[13]、毛利率TTM(正向)[13]。 * **估值类**: 市净率因子(正向)[14]、市销率TTM倒数(正向)[14]、市盈率因子(正向)[13]、市盈率TTM倒数(正向)[13]、EPTTM分位点(正向)[13]、BP因子(正向)[21]、EP因子(正向)[21]。 * **市值与流动性类**: 对数市值因子(负向)[13]、5日平均换手率(负向)[13]、成交量的5日指数移动平均(负向)[13]、6日成交金额的移动平均值(负向)[13]、6日成交金额的标准差(负向)[13]、换手率相对波动率(负向)[13]。 * **动量与反转类**: 动量弹簧因子(正向)[13]、5日反转(负向)[16]、5日动量[22]、1月动量[22]。 * **交易与资金流类**: 早盘收益因子(正向)[13]、早盘后收益因子(负向)[13]、大单净流入(正向)[13]、小单净流入(负向)[16]、动量调整大单(正向)[13]、动量调整小单(负向)[13]。 * **波动与质量类**: 下行波动率占比(负向)[13]、5分钟收益率偏度(负向)[13]、日内波动率与成交金额的相关性(负向)[13]、残差波动率(正向)[21]、ROA稳定性(正向)[13]、ROE稳定性(正向)[13]、经营现金流比率(正向)[12]、总资产毛利率TTM(正向)[12]、单季度总资产毛利率(正向)[12]。 * **基本面类 (行业内)**: 每股净资产[21]、每股经营利润TTM[21]、净资产增长率[22]、净利润增长率[22]。 * **因子具体构建过程**: 报告未提供各个单因子的具体计算公式,仅列出了因子名称、方向和表现。 因子的回测效果 **注**:以下因子表现数据均为“最近1周”(2026.02.24-2026.02.27)在对应股票池中,剔除行业与市值影响后的多空收益[12]。 1. 沪深300股票池因子表现(部分) * **净利润断层**: 4.93%[12] * **单季度ROA**: 2.93%[12] * **单季度ROA同比**: 2.83%[12] * **单季度ROE同比**: 2.68%[13] * **标准化预期外盈利**: 2.62%[13] * **总资产毛利率TTM**: -0.77%[12] * **单季度总资产毛利率**: -0.66%[12] * **经营现金流比率**: -0.66%[12] 2. 中证500股票池因子表现(部分) * **市净率因子**: 0.83%[14] * **市销率TTM倒数**: 0.72%[14] * **对数市值因子**: 0.23%[14] * **总资产毛利率TTM**: -3.84%[14] * **毛利率TTM**: -3.51%[14] * **单季度总资产毛利率**: -3.46%[14] 3. 流动性1500股票池因子表现(部分) * **5日反转**: 0.76%[16] * **净利润断层**: 0.31%[16] * **市净率因子**: 0.29%[16] * **毛利率TTM**: -2.50%[16] * **小单净流入**: -2.24%[16] * **单季度总资产毛利率**: -2.14%[16] 4. 大类因子表现(全市场股票池) * **Beta因子**: 1.04%[18] * **盈利因子**: 0.57%[18] * **流动性因子**: 0.55%[18] * **市值因子**: -0.39%[18]
多因子选股周报:估值因子表现出色,中证A500增强组合年内超额3.78%-20260228
国信证券· 2026-02-28 16:23
量化模型与构建方式 1. **模型名称:国信金工多因子指数增强模型**[13] * **模型构建思路**:以多因子选股为主体,通过收益预测、风险控制和组合优化三个主要流程,构建对标不同宽基指数的增强组合,旨在稳定战胜基准[12][13]。 * **模型具体构建过程**: 1. **收益预测**:基于多因子模型对股票未来收益进行预测[13]。 2. **风险控制**:在组合优化中施加多种约束条件以控制风险[13]。 3. **组合优化**:在满足风险约束的条件下,通过优化算法求解最优的股票权重,以最大化预期收益或控制跟踪误差[13]。 2. **模型名称:单因子MFE组合模型**[16][40] * **模型构建思路**:为了在更贴近实际投资约束的条件下检验单因子的有效性,采用组合优化的方式,构建最大化单因子暴露组合,通过该组合相对于基准的收益表现来判断因子有效性[40]。 * **模型具体构建过程**: 1. **设定优化目标**:目标函数为最大化组合在目标单因子上的加权暴露[40]。 其数学形式为: $$\begin{array}{ll}max&f^{T}\ w\\ s.t.&s_{l}\leq X(w-w_{b})\leq s_{h}\\ &h_{l}\leq H(w-w_{b})\leq h_{h}\\ &w_{l}\leq w-w_{b}\leq w_{h}\\ &b_{l}\leq B_{b}w\leq b_{h}\\ &\mathbf{0}\leq w\leq l\\ &\mathbf{1}^{T}\ w=1\end{array}$$ 其中,$f$ 为单因子取值向量,$w$ 为待求解的股票权重向量,$w_b$ 为基准指数成分股权重向量[40][41]。 2. **施加约束条件**:约束条件包括[40][41][44]: * 风格暴露约束:限制组合相对于基准在市值等风格因子上的偏离($X$ 为风格因子暴露矩阵,$s_l$, $s_h$ 为上下限)。 * 行业暴露约束:限制组合相对于基准的行业偏离($H$ 为行业暴露矩阵,$h_l$, $h_h$ 为上下限)。 * 个股权重偏离约束:限制个股相对于其在基准中权重的偏离幅度($w_l$, $w_h$ 为上下限,通常设为0.5%-1%)[40][44]。 * 成分股权重占比约束:限制组合在基准成分股内的权重占比($B_b$ 为成分股标识向量,$b_l$, $b_h$ 为上下限,常设为100%)。 * 卖空与权重上限约束:禁止卖空($w \ge 0$),并设置个股权重上限 $l$。 * 满仓约束:组合权重之和为1($\mathbf{1}^{T} w = 1$)。 3. **组合构建与回测**:在每月末,根据上述优化模型求解得到各单因子的MFE组合权重。在回测期内定期换仓,计算组合收益并扣除交易费用(双边0.3%),最后计算相对于基准的各项收益风险指标[44]。 3. **模型名称:公募重仓指数**[16][42] * **模型构建思路**:为了测试因子在公募基金持仓风格下的有效性,通过汇总公募基金持仓信息,构建一个代表公募基金整体重仓股构成的指数,作为新的因子测试样本空间[42]。 * **模型具体构建过程**: 1. **确定基金样本**:选取普通股票型和偏股混合型基金,剔除规模小于五千万且上市不足半年的基金。若基金转型,则使用转型后半年以上的数据[43]。 2. **获取持仓数据**:从基金的定期报告(年报、半年报、季报)中获取持股信息。若最新报告为季报,需结合前期的年报或半年报信息来构建完整的持仓数据[43]。 3. **计算平均持仓**:将所有符合条件的基金持仓合并,计算每只股票在所有基金中的平均权重[43]。 4. **筛选成分股**:将股票按平均权重降序排列,选取累计权重达到90%的股票作为成分股,以此构建公募重仓指数[43]。 模型的回测效果 1. **国信金工多因子指数增强模型**[15] * 沪深300指数增强组合:本周超额收益-0.04%,本年超额收益3.07%[15]。 * 中证500指数增强组合:本周超额收益-1.72%,本年超额收益-2.50%[15]。 * 中证1000指数增强组合:本周超额收益-1.58%,本年超额收益1.63%[15]。 * 中证A500指数增强组合:本周超额收益0.26%,本年超额收益3.78%[15]。 量化因子与构建方式 (注:报告提供了详细的因子库列表,以下按类别和名称列出,构建思路和过程均来源于因子库表格中的“因子计算方式”[18]) 1. **估值类因子** * **因子名称**:BP * **因子构建思路**:衡量市净率的倒数,即净资产与总市值的比率,属于估值因子[18]。 * **因子具体构建过程**:净资产 / 总市值[18]。 * **因子名称**:单季EP * **因子构建思路**:衡量单季度市盈率的倒数,即单季度净利润与总市值的比率[18]。 * **因子具体构建过程**:单季度归母净利润 / 总市值[18]。 * **因子名称**:单季SP * **因子构建思路**:衡量单季度市销率的倒数,即单季度营业收入与总市值的比率[18]。 * **因子具体构建过程**:单季度营业收入 / 总市值[18]。 * **因子名称**:EPTTM * **因子构建思路**:衡量滚动市盈率(TTM)的倒数,即过去12个月净利润与总市值的比率[18]。 * **因子具体构建过程**:归母净利润 TTM / 总市值[18]。 * **因子名称**:SPTTM * **因子构建思路**:衡量滚动市销率(TTM)的倒数,即过去12个月营业收入与总市值的比率[18]。 * **因子具体构建过程**:营业收入 TTM / 总市值[18]。 * **因子名称**:EPTTM分位点 * **因子构建思路**:衡量当前EPTTM值在过去一年中所处的相对位置[18]。 * **因子具体构建过程**:EPTTM在过去一年中的分位点[18]。 * **因子名称**:股息率 * **因子构建思路**:衡量公司的现金分红回报率[18]。 * **因子具体构建过程**:最近四个季度预案分红金额 / 总市值[18]。 2. **反转与动量类因子** * **因子名称**:一个月反转 * **因子构建思路**:捕捉短期价格反转效应[18]。 * **因子具体构建过程**:过去20个交易日涨跌幅[18]。 * **因子名称**:三个月反转 * **因子构建思路**:捕捉中期价格反转效应[18]。 * **因子具体构建过程**:过去60个交易日涨跌幅[18]。 * **因子名称**:一年动量 * **因子构建思路**:捕捉长期价格动量效应,通常排除最近一个月的表现以避免与短期反转混淆[18]。 * **因子具体构建过程**:近一年除近一月后动量[18]。 3. **成长类因子** * **因子名称**:单季净利同比增速 * **因子构建思路**:衡量单季度净利润的同比增长速度[18]。 * **因子具体构建过程**:单季度净利润同比增长率[18]。 * **因子名称**:单季营收同比增速 * **因子构建思路**:衡量单季度营业收入的同比增长速度[18]。 * **因子具体构建过程**:单季度营业收入同比增长率[18]。 * **因子名称**:单季营利同比增速 * **因子构建思路**:衡量单季度营业利润的同比增长速度[18]。 * **因子具体构建过程**:单季度营业利润同比增长率[18]。 * **因子名称**:SUE * **因子构建思路**:标准化预期外盈利,衡量实际净利润超出分析师一致预期的程度,并经过预期标准差标准化[18]。 * **因子具体构建过程**:(单季度实际净利润 - 预期净利润)/ 预期净利润标准差[18]。 * **因子名称**:SUR * **因子构建思路**:标准化预期外收入,衡量实际营业收入超出分析师一致预期的程度,并经过预期标准差标准化[18]。 * **因子具体构建过程**:(单季度实际营业收入 - 预期营业收入)/ 预期营业收入标准差[18]。 * **因子名称**:单季超预期幅度 * **因子构建思路**:衡量财报净利润相对于预期净利润的比例[18]。 * **因子具体构建过程**:预期单季度净利润 / 财报单季度净利润[18]。 4. **盈利类因子** * **因子名称**:单季ROE * **因子构建思路**:衡量单季度净资产收益率[18]。 * **因子具体构建过程**:单季度归母净利润 * 2 / (期初归母净资产 + 期末归母净资产)[18]。 * **因子名称**:单季ROA * **因子构建思路**:衡量单季度总资产收益率[18]。 * **因子具体构建过程**:单季度归母净利润 * 2 / (期初归母总资产 + 期末归母总资产)[18]。 * **因子名称**:DELTAROE * **因子构建思路**:衡量净资产收益率的同比变化[18]。 * **因子具体构建过程**:单季度净资产收益率 - 去年同期单季度净资产收益率[18]。 * **因子名称**:DELTAROA * **因子构建思路**:衡量总资产收益率的同比变化[18]。 * **因子具体构建过程**:单季度总资产收益率 - 去年同期单季度总资产收益率[18]。 5. **流动性类因子** * **因子名称**:非流动性冲击 * **因子构建思路**:衡量单位成交金额引起的价格冲击,值越大表示流动性越差[18]。 * **因子具体构建过程**:过去20个交易日的日涨跌幅绝对值 / 成交额的均值[18]。 * **因子名称**:一个月换手 * **因子构建思路**:衡量过去一个月的平均换手率[18]。 * **因子具体构建过程**:过去20个交易日换手率均值[18]。 * **因子名称**:三个月换手 * **因子构建思路**:衡量过去三个月的平均换手率[18]。 * **因子具体构建过程**:过去60个交易日换手率均值[18]。 6. **波动类因子** * **因子名称**:特异度 * **因子构建思路**:衡量公司特质波动,即不能被市场常见风险因子(如Fama-French三因子)解释的波动部分[18]。 * **因子具体构建过程**:1 - 过去20个交易日 Fama-French三因子回归的拟合度[18]。 * **因子名称**:一个月波动 * **因子构建思路**:衡量短期股价波动率[18]。 * **因子具体构建过程**:过去20个交易日日内真实波幅均值[18]。 * **因子名称**:三个月波动 * **因子构建思路**:衡量中期股价波动率[18]。 * **因子具体构建过程**:过去60个交易日日内真实波幅均值[18]。 7. **公司治理类因子** * **因子名称**:高管薪酬 * **因子构建思路**:衡量公司高管的薪酬水平[18]。 * **因子具体构建过程**:前三高管报酬总额取对数[18]。 8. **分析师类因子** * **因子名称**:预期EPTTM * **因子构建思路**:基于分析师一致预期的滚动市盈率(TTM)倒数[18]。 * **因子具体构建过程**:一致预期滚动EP[18]。 * **因子名称**:预期BP * **因子构建思路**:基于分析师一致预期的市净率倒数[18]。 * **因子具体构建过程**:一致预期滚动BP[18]。 * **因子名称**:预期PEG * **因子构建思路**:基于分析师一致预期的PEG比率[18]。 * **因子具体构建过程**:一致预期PEG[18]。 * **因子名称**:预期净利润环比 * **因子构建思路**:衡量分析师对未来净利润预期的环比变化[18]。 * **因子具体构建过程**:一致预期净利润 / 3个月前一致预期净利润[18]。 * **因子名称**:三个月盈利上下调 * **因子构建思路**:衡量过去三个月内分析师盈利预测上调与下调的家数净差额[18]。 * **因子具体构建过程**:过去3个月内分析师(上调家数 - 下调家数)/ 总家数[18]。 * **因子名称**:三个月机构覆盖 * **因子构建思路**:衡量过去三个月内覆盖该公司的机构(分析师)数量[18]。 * **因子具体构建过程**:过去3个月内机构覆盖数量[18]。 因子的回测效果 (注:以下因子表现数据均来源于各样本空间下的单因子MFE组合表现跟踪表格,指标包括“最近一周”、“最近一月”、“今年以来”和“历史年化”超额收益[20][22][24][26]) 1. **在沪深300样本空间中表现突出的因子**(最近一周)[20] * 标准化预期外收入(SUR):超额收益0.97% * 预期PEG:超额收益0.52% * DELTAROE:超额收益0.48% 2. **在中证500样本空间中表现突出的因子**(最近一周)[22] * 预期BP:超额收益1.58% * BP:超额收益1.39% * SPTTM:超额收益0.80% 3. **在中证1000样本空间中表现突出的因子**(最近一周)[24] * SPTTM:超额收益0.85% * 一年动量:超额收益0.83% * 单季SP:超额收益0.79% 4. **在中证A500样本空间中表现突出的因子**(最近一周)[26] * 特异度:超额收益0.77% * 标准化预期外收入(SUR):超额收益0.67% * 预期PEG:超额收益0.51% 5. **在公募重仓指数样本空间中表现突出的因子**(最近一周)[28] * 一年动量:表现较好 * 单季SP:表现较好 * 单季营利同比增速:表现较好
PB-ROE模型周度仓位观点-20260228
华西证券· 2026-02-28 13:57
量化模型与构建方式 1. **模型名称:时间序列PB-ROE模型**[1][8][14] * **模型构建思路**:基于公司基本面(ROE)与市场估值(PB)的理论线性关系,引入实际利率和通胀等宏观变量,构建时间序列回归模型,以衡量市场整体估值相对于其基本面合理水平的偏离程度[1][8][14]。 * **模型具体构建过程**:采用Wilcox & Philips(2005)提出的时间序列模型,对全市场指数(或代表性指数)的周度数据进行回归分析。模型的具体形式为: $$Ln(P/B)=a+b\cdot ROE+C\cdot RealInterest+d\cdot Inflation$$[8][14][15] 其中,`P/B` 代表市场指数的市净率,`ROE` 代表市场指数的净资产收益率,`RealInterest` 代表实际利率,`Inflation` 代表通胀率。`a`, `b`, `c`, `d` 为回归系数。通过该模型计算得到的回归残差,即为“PB-ROE估值偏离度”[1][8][15]。 * **模型评价**:该模型能够有效刻画市场情绪和风险偏好的变化。当估值偏离度为正时,表明市场情绪高涨;为负时,表明市场情绪低迷[1][9][15]。在A股市场的实证检验表明,该估值偏离度与未来短期(如下一周)的市场指数涨幅存在显著正相关性[2][9][15]。 2. **模型名称:基于PB-ROE估值偏离度的周度仓位择时模型**[2][10][19] * **模型构建思路**:利用时间序列PB-ROE模型计算出的估值偏离度,根据其相对于历史统计分布的位置,生成周度的战术仓位配置信号[2][10][19]。 * **模型具体构建过程**: 1. 首先,计算“PB-ROE估值偏离度”的历史均值和标准差[2][10]。 2. 然后,以“历史均值 ± 1倍标准差”作为阈值,将估值偏离度划分为四个区间,并对应四档仓位建议[10][19]: * 当 `估值偏离度 > 均值 + 1倍标准差` 时,发出 **高仓位(80%-100%)** 信号[3][10][19]。 * 当 `均值 < 估值偏离度 ≤ 均值 + 1倍标准差` 时,发出 **低仓位** 信号[19]。 * 当 `均值 - 1倍标准差 < 估值偏离度 ≤ 均值` 时,发出 **中等仓位** 信号[19]。 * 当 `估值偏离度 ≤ 均值 - 1倍标准差` 时,发出 **中高仓位** 信号[19]。 * **模型评价**:该模型旨在捕捉市场情绪高涨带来的动量效应,同时在估值较低时利用安全边际。历史回测显示,该仓位择时策略能够有效降低回撤、提高收益[18][19]。 模型的回测效果 1. 时间序列PB-ROE模型,PB-ROE估值偏离度与未来第1周指数涨幅正相关且统计显著[9][15] 2. 基于PB-ROE估值偏离度的周度仓位择时模型,历史回测显示能够有效降低回撤、提高收益[19] 量化因子与构建方式 1. **因子名称:PB-ROE估值偏离度**[1][8][15] * **因子构建思路**:作为时间序列PB-ROE模型的输出,该因子代表了市场整体实际估值(PB)与由基本面(ROE)及宏观变量(实际利率、通胀)所决定的合理估值之间的差异,即估值偏离[1][8][15]。 * **因子具体构建过程**:通过对市场指数应用时间序列PB-ROE模型进行回归,将实际观测到的 `Ln(P/B)` 与模型拟合值相减,所得残差即为该因子[8][15]。公式表示为: `PB-ROE估值偏离度 = 实际 Ln(P/B) - 模型预测的 Ln(P/B)`[1][8] 其中模型预测的 `Ln(P/B)` 由公式 $$Ln(P/B)=a+b\cdot ROE+C\cdot RealInterest+d\cdot Inflation$$ 计算得出[8][14][15]。 * **因子评价**:该因子是市场情绪和风险偏好的量化指标。正值表示市场情绪高涨,负值表示市场情绪低迷[1][9][15]。其与未来市场短期表现存在非线性但显著的正向关系,高偏离度组合有显著动量效应,低偏离度组合则体现安全边际[18]。 因子的回测效果 1. PB-ROE估值偏离度因子,与未来第1周指数涨幅总体显著正相关[2][9][15] 2. PB-ROE估值偏离度因子,按升序分为4组后,估值偏离度最高的第4组未来涨幅显著最高[18][21]
港股投资周报:资源股反弹,港股精选组合年内相对恒指超额 4.08%-20260228
国信证券· 2026-02-28 13:42
量化模型与构建方式 1. **模型名称:港股精选组合模型**[13] * **模型构建思路**:该模型旨在对分析师推荐的股票池进行基本面和技术面的双层优选,挑选出同时具备基本面支撑和技术面共振的超预期股票,构建港股精选股票组合[14]。 * **模型具体构建过程**: 1. **构建分析师推荐股票池**:以分析师上调盈利预测、分析师首次关注、分析师研报标题超预期事件作为分析师推荐事件,构建初始股票池[14]。 2. **基本面与技术面精选**:对分析师推荐股票池中的股票,从基本面和技术面两个维度进行进一步筛选,具体筛选标准未在本文中详细说明,但提及了“分析师推荐视角”的专题报告[13]。 * **模型评价**:该模型在历史回测区间(2010年1月1日至2025年12月31日)内表现优异,获得了显著的超额收益[14]。 2. **因子/筛选方法名称:平稳创新高股票筛选方法**[21] * **因子/筛选方法构建思路**:从过去一段时间内创出新高的股票中,根据分析师关注度、股价相对强弱、股价路径平稳性、创新高连续性等多个角度,筛选出“平稳”创新高的股票,以捕捉有效的动量或趋势跟踪信号[19][21]。 * **因子/筛选方法具体构建过程**: 1. **定义创新高距离**:首先计算股票的250日新高距离,用于衡量股价距离其过去250日最高点的回落幅度[21]。 $$250日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ 其中,`Closet`为最新收盘价,`ts_max(Close, 250)`为过去250个交易日收盘价的最大值。当该值为0时,表示股价创出新高[21]。 2. **设定筛选步骤**:在过去20个交易日内创出过250日新高的股票池基础上,按顺序进行以下筛选[21][22]: * **样本池**:全部港股,但剔除成立时间不超过15个月的股票[22]。 * **分析师关注度**:要求过去6个月内获得“买入”或“增持”评级的分析师研报不少于5份[22]。 * **股价相对强弱**:要求过去250日涨跌幅位于样本池前20%[22]。 * **股价平稳性**:在满足上述条件的股票池内,使用“价格路径平滑性”(股价位移路程比)和“创新高持续性”(过去120日的250日新高距离在时间序列上的均值)两个指标进行综合打分,取排名在前50%的股票(最少取50只)[22]。 * **趋势延续性**:最后,使用“过去5日的250日新高距离在时间序列上的均值”进行排序,取排序靠前的50只股票作为最终的“平稳创新高股票”[22]。 模型的回测效果 1. **港股精选组合模型**[18] * 绝对收益(全样本):19.08% * 恒生指数收益(全样本):1.02% * 超额收益(全样本):18.06% * 相对最大回撤(全样本):23.73% * 信息比(IR)(全样本):1.19 * 跟踪误差(全样本):14.60% * 收益回撤比(全样本):0.76 * 最大回撤起始日(全样本):2022年10月25日 * 最大回撤截止日(全样本):2023年6月16日 量化因子与构建方式 1. **因子名称:250日新高距离**[21] * **因子构建思路**:用于量化股票价格距离其过去一年(250个交易日)最高点的回落幅度,是识别创新高状态和趋势强度的基础指标[21]。 * **因子具体构建过程**: * 计算最新收盘价与过去250个交易日最高收盘价的比值,并用1减去该比值[21]。 * 公式: $$250日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ * 其中,`Closet`为最新收盘价,`ts_max(Close, 250)`为过去250个交易日收盘价的最大值。该值越小(特别是为0时),表明股价越接近或创出新高[21]。 2. **因子名称:价格路径平滑性(股价位移路程比)**[22] * **因子构建思路**:通过比较股价的净变动(位移)与总变动(路程)来衡量股价上涨路径的平稳性。比值越高,说明上涨过程越流畅,回撤越小[22]。 * **因子具体构建过程**:报告中未给出具体计算公式,但明确指出该指标用于衡量股价路径的平滑性,是“平稳创新高”筛选体系中的关键打分指标之一[22]。 3. **因子名称:创新高持续性**[22] * **因子构建思路**:通过计算过去一段时间内“250日新高距离”的均值,来衡量股票维持接近新高状态的能力。均值越小,说明股票在考察期内越能持续保持在接近新高的位置[22]。 * **因子具体构建过程**:计算过去120个交易日的“250日新高距离”在时间序列上的平均值[22]。 4. **因子名称:趋势延续性**[22] * **因子构建思路**:通过计算近期(过去5日)“250日新高距离”的均值,来捕捉股票短期内的趋势强度。该值越小,说明近期股价越强势,越有可能延续创新高趋势[22]。 * **因子具体构建过程**:计算过去5个交易日的“250日新高距离”在时间序列上的平均值[22]。
金融工程定期:开源交易行为因子绩效月报(2026年2月)-20260227
开源证券· 2026-02-27 21:44
量化因子与构建方式 1. **因子名称:理想反转因子** [4][10][13] * **因子构建思路**:A股反转效应的微观来源是大单成交,通过每日平均单笔成交金额的大小,可以切割出反转属性最强的交易日[4][13]。 * **因子具体构建过程**: * 对选定股票,回溯取其过去20个交易日的数据[42]。 * 计算该股票每日的平均单笔成交金额(成交金额 / 成交笔数)[42]。 * 将单笔成交金额高的10个交易日的涨跌幅加总,记作 M_high[42]。 * 将单笔成交金额低的10个交易日的涨跌幅加总,记作 M_low[42]。 * 理想反转因子 M = M_high – M_low[42]。 * 对所有股票重复以上步骤,计算各自的理想反转因子 M[42]。 2. **因子名称:聪明钱因子** [4][10][13] * **因子构建思路**:从分钟行情数据的价量信息中,识别出机构参与交易(聪明钱)的多寡,进而构造跟踪聪明钱的因子[4][13]。 * **因子具体构建过程**: * 对选定股票,回溯取其过去10日的分钟行情数据[41]。 * 构造指标 $$S_t = |R_t| / (V_t)^{0.25}$$,其中 $$R_t$$ 为第t分钟涨跌幅,$$V_t$$ 为第t分钟成交量[41]。 * 将分钟数据按照指标 $$S_t$$ 从大到小排序,取成交量累积占比前20%的分钟,视为聪明钱交易[41]。 * 计算聪明钱交易的成交量加权平均价 VWAP_smart[43]。 * 计算所有交易的成交量加权平均价 VWAP_all[43]。 * 聪明钱因子 Q = VWAP_smart / VWAP_all[41]。 3. **因子名称:APM因子** [4][10][13] * **因子构建思路**:在日内的不同时段,交易者的行为模式不同,反转强度也相应有所不同[4][13]。 * **因子具体构建过程**: * 对选定股票,回溯取其过去20日数据,记逐日隔夜的股票收益率为 $$r_{night}$$,隔夜的指数收益率为 $$R_{night}$$;逐日下午的股票收益率为 $$r_{afternoon}$$,下午的指数收益率为 $$R_{afternoon}$$[42]。 * 将得到的40组隔夜与下午的收益率数据 $$(r, R)$$ 进行回归:$$r = \alpha + \beta R + \epsilon$$,得到残差项 $$\epsilon$$[42]。 * 在得到的40个残差中,隔夜残差记为 $$\epsilon_{night}$$,下午残差记为 $$\epsilon_{afternoon}$$,计算每日隔夜与下午残差的差值 $$\delta_t = \epsilon_{night} - \epsilon_{afternoon}$$[42]。 * 构造统计量 stat 来衡量隔夜与下午残差的差异程度,计算公式为:$$\mathrm{stat}={\frac{\mu(\delta_{t})}{\sigma(\delta_{t})/{\sqrt{N}}}}$$,其中 $$\mu$$ 为均值,$$\sigma$$ 为标准差[44]。 * 为消除动量因子影响,将统计量 stat 对动量因子进行横截面回归:$$stat = \alpha + \beta \cdot Ret20 + \epsilon$$,其中 Ret20 为股票过去20日的收益率,代表动量因子[45]。 * 将回归得到的残差值 $$\epsilon$$ 作为 APM 因子[45]。 4. **因子名称:理想振幅因子** [4][10][13] * **因子构建思路**:基于股价维度对振幅进行切割,不同价态下振幅因子所蕴含的信息存在结构性差异[4][13]。 * **因子具体构建过程**: * 对选定股票,回溯取其最近20个交易日数据,计算股票每日振幅(最高价/最低价 - 1)[47]。 * 选取收盘价较高的25%有效交易日,计算其振幅均值,得到高价振幅因子 V_high[47]。 * 选取收盘价较低的25%有效交易日,计算其振幅均值,得到低价振幅因子 V_low[47]。 * 将高价振幅因子 V_high 与低价振幅因子 V_low 作差,得到理想振幅因子 V = V_high - V_low[47]。 5. **因子名称:交易行为合成因子** [5][10][31] * **因子构建思路**:将上述四个交易行为因子(理想反转、聪明钱、APM、理想振幅)进行合成,以获取更稳健的选股信号。 * **因子具体构建过程**: * **因子值处理**:将上述四个交易行为因子在行业内进行因子去极值与因子标准化[31]。 * **因子权重**:滚动选取过去12期各因子的ICIR值作为权重,加权形成交易行为合成因子[31]。 因子的回测效果 1. **理想反转因子** [5][6][14] * 全历史区间IC均值:-0.048 * 全历史区间rankIC均值:-0.060 * 全历史区间信息比率(IR):2.39 * 全历史区间多空对冲月度胜率:77.5% * 2026年2月多空对冲收益:-0.40% * 近12个月多空对冲月度胜率:58.3% 2. **聪明钱因子** [5][6][19] * 全历史区间IC均值:-0.037 * 全历史区间rankIC均值:-0.062 * 全历史区间信息比率(IR):2.69 * 全历史区间多空对冲月度胜率:80.4% * 2026年2月多空对冲收益:-0.76% * 近12个月多空对冲月度胜率:66.7% 3. **APM因子** [5][6][23] * 全历史区间IC均值:0.028 * 全历史区间rankIC均值:0.034 * 全历史区间信息比率(IR):2.25 * 全历史区间多空对冲月度胜率:75.8% * 2026年2月多空对冲收益:-0.45% * 近12个月多空对冲月度胜率:41.7% 4. **理想振幅因子** [5][6][26] * 全历史区间IC均值:-0.053 * 全历史区间rankIC均值:-0.073 * 全历史区间信息比率(IR):2.99 * 全历史区间多空对冲月度胜率:82.6% * 2026年2月多空对冲收益:-0.67% * 近12个月多空对冲月度胜率:66.7% 5. **交易行为合成因子** [5][6][31] * 全历史区间IC均值:0.065 * 全历史区间rankIC均值:0.093 * 全历史区间多空对冲信息比率(IR):3.23 * 全历史区间多空对冲月度胜率:79.1% * 2026年2月多空对冲收益:-0.60% * 近12个月多空对冲月度胜率:58.3% * 全历史区间多头对冲组均值年化收益率:8.03% * 全历史区间多头对冲组均值收益波动比:2.56 * 全历史区间多头对冲组均值月度胜率:77.7% * 全历史区间信息比率(IR)(国证2000):2.83 * 全历史区间信息比率(IR)(中证1000):2.59 * 全历史区间信息比率(IR)(中证800):0.89
热点追踪周报:由创新高个股看市场投资热点(第232期)-20260227
国信证券· 2026-02-27 17:58
量化模型与构建方式 1. **模型/因子名称:250日新高距离**[11] * **构建思路**:该指标用于衡量当前价格相对于过去一段时间内最高价格的回落幅度,是判断个股、行业或指数是否处于强势趋势或接近突破状态的关键指标[11]。其理论基础源于动量效应和趋势跟踪策略,研究表明股价接近历史高点的股票未来表现可能更优[11]。 * **具体构建过程**:计算最新收盘价与过去250个交易日最高收盘价之间的相对差距。 * 公式为: $$250 日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ * 其中,`Closet` 为最新收盘价,`ts_max(Close,250)` 为过去250个交易日收盘价的最大值[11]。 * 若最新收盘价创出历史新高,则该值为0;若价格从高点回落,则该值为正,数值越大表示回落幅度越大[11]。 2. **模型名称:平稳创新高股票筛选模型**[22][27] * **构建思路**:该模型旨在从近期创出新高的股票中,进一步筛选出趋势更为稳健、持续性更强的“平稳创新高”股票。其思路结合了分析师关注度、股价相对强度、价格路径的平滑性以及创新高的持续性等多个维度,旨在规避波动剧烈或趋势脆弱的“彩票型”股票,寻找具有更强动量延续性的标的[22][27]。 * **具体构建过程**:采用多步骤条件筛选法。 1. **初选股票池**:首先筛选出上市满15个月,且在过去20个交易日内创出过250日新高的所有股票[19]。 2. **多维度筛选**:在初选池中,依次应用以下条件进行筛选[27]: * **分析师关注度**:过去3个月内,获得“买入”或“增持”评级的分析师研报数量不少于5份。 * **股价相对强弱**:过去250日涨跌幅位于全市场所有股票的前20%。 * **股价平稳性**:在满足以上两个条件的股票池内,使用两个子指标综合打分,并选取排名在前50%的股票。 * **价格路径平滑性**:使用“股价位移路程比”指标,计算公式为 `过去120日涨跌幅的绝对值 / 过去120日日涨跌幅绝对值加总`[22]。该值越接近1,表明价格路径越平滑。 * **创新高持续性**:计算股票过去120个交易日的“250日新高距离”在时间序列上的均值,该均值越小,表明在考察期内越持续地接近或创出新高。 * **趋势延续性**:计算股票过去5个交易日的“250日新高距离”在时间序列上的均值,并选取该值排序最靠前的50只股票(即近期最接近新高的股票)。 模型的回测效果 *本报告为市场状态监测与个股筛选报告,未提供模型或因子在历史回测中的量化绩效指标(如年化收益率、夏普比率、信息比率IR、最大回撤等)。报告主要展示了在特定时点(2026年2月27日)应用上述模型/因子得到的截面筛选结果和市场状态描述[12][13][15][19][20][28]。* 量化因子与构建方式 1. **因子名称:股价位移路程比**[22] * **构建思路**:该因子用于度量股价走势的平滑程度。研究表明,遵循平滑价格路径的高动量股票,其后续收益可能优于价格路径跳跃(波动大)的高动量股票[22]。该因子旨在捕捉“温水煮青蛙”效应,即平滑的动量可能未被市场充分关注,因而持续性更强[22]。 * **具体构建过程**:计算一定期间内(报告中为120日)股价净变动幅度(位移)与期间内每日价格变动幅度绝对值总和(路程)的比值。 * 公式为: $$股价位移路程比 = \frac{|过去120日涨跌幅|}{ \sum_{t=1}^{120} |日涨跌幅_t| }$$ * 分子为考察期初到期末的总收益率绝对值,分母为考察期内每日收益率绝对值的累计和[22]。该比值介于0到1之间,值越大表明价格路径越直接、回撤越小,走势越平稳。 2. **因子名称:创新高持续性(均值)**[27] * **构建思路**:该因子通过计算股票在一段时间内“250日新高距离”的时序均值,来评估其维持强势状态(接近或创出新高)的持久性,而不仅仅是单点突破。 * **具体构建过程**:对于每只股票,计算其在过去120个交易日中,每日的“250日新高距离”的算术平均值[27]。均值越低,表明股票在考察期内越长时间地保持在历史高点附近,创新高行为更具持续性。 3. **因子名称:趋势延续性(近期均值)**[27] * **构建思路**:该因子聚焦于股票最新的趋势强度,通过计算近期(如过去5日)“250日新高距离”的均值,来捕捉股价是否在持续逼近新高,即短期趋势的强弱。 * **具体构建过程**:对于每只股票,计算其在过去5个交易日中,每日的“250日新高距离”的算术平均值[27]。该值越小,表明股票在近期越接近创出新高,短期上升趋势越强劲。 因子的回测效果 *本报告为市场状态监测与个股筛选报告,未提供因子在历史回测中的量化绩效指标(如因子IC值、IR、多空收益等)。报告中因子主要用于构建“平稳创新高股票筛选模型”,并展示了在特定时点(2026年2月27日)的截面应用结果[28]。*
热点追踪周报:由创新高个股看市场投资热点(第 232 期)-20260227
国信证券· 2026-02-27 17:55
量化模型与构建方式 1. **模型/因子名称**:250日新高距离[11] * **构建思路**:用于量化个股、行业或指数当前价格相对于其过去一段时间内最高价格的回落幅度或创新高状态,以此捕捉市场趋势和动量效应[11]。 * **具体构建过程**:计算最新收盘价与过去250个交易日最高收盘价之间的相对距离。 * 公式为: $$250 日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ * 其中,`Closet` 为最新收盘价,`ts_max(Close, 250)` 为过去250个交易日收盘价的最大值[11]。 * 若最新收盘价创出新高,则该值为0;若价格从高点回落,则该值为正,数值越大表示回落幅度越大[11]。 2. **模型名称**:平稳创新高股票筛选模型[23][27] * **构建思路**:在近期创出250日新高的股票池中,进一步筛选出具有分析师关注、股价相对强势、价格路径平稳、创新高持续且趋势延续性好的股票,旨在识别更具持续性的“领头羊”股票[23][27]。 * **具体构建过程**:采用多步骤条件筛选法。 1. **初选股票池**:筛选出过去20个交易日内创出过250日新高的股票[19]。 2. **分析师关注度筛选**:要求过去3个月内,获得“买入”或“增持”评级的分析师研报不少于5份[27]。 3. **股价相对强弱筛选**:要求过去250日涨跌幅位于全市场前20%[27]。 4. **股价平稳性筛选**:在满足上述条件的股票池内,使用“价格路径平滑性”和“创新高持续性”两个指标进行综合打分,并选取排名在前50%的股票[27]。 * **价格路径平滑性**:使用股价位移路程比衡量,公式可能为 `过去120日涨跌幅的绝对值 / 过去120日日涨跌幅绝对值加总`[23]。 * **创新高持续性**:使用过去120日的250日新高距离在时间序列上的均值衡量[27]。 5. **趋势延续性筛选**:计算过去5日的250日新高距离在时间序列上的均值,并选取该值排序靠前的50只股票作为最终结果[27]。 模型的回测效果 *本报告未提供量化模型(如250日新高距离因子或平稳创新高筛选模型)在历史回测中的具体绩效指标(如年化收益率、夏普比率、最大回撤、信息比率IR等)。报告内容主要为截至特定时点(2026年2月27日)的截面数据统计和应用结果展示[12][13][15][19][20][28]。* 量化因子与构建方式 *本报告核心内容为基于“250日新高距离”这一核心指标构建的监测与筛选模型,并未独立介绍除该基础指标外的其他量化因子。报告中的“股价相对强弱”、“股价平稳性”等是作为筛选条件的一部分,未以独立因子的形式详细阐述其构建公式。* 因子的回测效果 *本报告未提供任何独立量化因子(如价值、成长、动量等)的历史回测绩效指标。*
A股市场快照:宽基指数每日投资动态-20260227
江海证券· 2026-02-27 15:35
量化模型与因子总结 量化模型与构建方式 本报告主要对市场宽基指数进行多维度数据跟踪与统计,未涉及具体的预测性或选股量化模型。报告的核心内容是对一系列市场观测指标(因子)的构建与计算。 量化因子与构建方式 1. **因子名称:风险溢价**[26][27] * **因子构建思路**:以十年期国债即期收益率为无风险利率的参考,计算各宽基指数收益率与其的差值,用以衡量指数相对于无风险利率的额外回报(风险溢价),评估其相对投资价值和偏离情况[26]。 * **因子具体构建过程**:计算指数市盈率倒数(E/P)与十年期国债即期收益率之差。 $$风险溢价 = \frac{1}{PE_{TTM}} - R_f$$ 其中,$PE_{TTM}$ 为指数的滚动市盈率,$R_f$ 为十年期国债即期收益率[26][30]。 2. **因子名称:股债性价比**[45] * **因子构建思路**:将各指数PE-TTM的倒数与十年期国债即期收益率之差定义为股债性价比,通过观察其历史分位来判断股票资产相对于债券资产的吸引力[45]。 * **因子具体构建过程**:其计算方式与“风险溢价”因子相同,均为市盈率倒数与无风险收益率之差。在报告中,该因子主要用于观察其相对于历史分位数(如80%分位为机会值,20%分位为危险值)的位置[45]。 3. **因子名称:股息率**[47][52] * **因子构建思路**:股息率反映现金分红回报率,是红利投资风格的核心指标。跟踪各指数的股息率,观察其走势和变化趋势[47]。 * **因子具体构建过程**:报告中使用指数整体的股息率数据,计算公式通常为指数成分股总现金分红除以指数总市值。报告展示了各指数的当前股息率及其历史分位值[52]。 4. **因子名称:破净率**[53][55] * **因子构建思路**:破净率表示市净率小于1的个股数量占比。该指标反映市场整体的估值态度,破净率越高,表明市场低估的情况越普遍[53][55]。 * **因子具体构建过程**:对于每个宽基指数,计算其成分股中市净率(PB)小于1的股票数量,再除以该指数的成分股总数。 $$破净率 = \frac{破净个股数}{指数成分股总数}$$ 报告展示了各指数的当前破净率[53][56]。 5. **因子名称:指数换手率**[16][17] * **因子构建思路**:衡量指数整体交易的活跃程度。 * **因子具体构建过程**:报告采用流通市值加权的方式计算指数换手率。 $$指数换手率 = \frac{\Sigma(成分股流通股本 \times 成分股换手率)}{\Sigma(成分股流通股本)}$$ 其中,成分股换手率通常为日度数据[17]。 6. **因子名称:收益分布形态指标(峰度与偏度)**[23][24] * **因子构建思路**:通过计算指数日收益率分布的峰度和偏度,来描述收益分布的集中程度和形态偏向(如是否具有“尖峰厚尾”特征,分布是否对称)[23]。 * **因子具体构建过程**: * **峰度**:计算指数日收益率序列的四阶中心矩,报告中在计算时减去了3(正态分布的峰度值),因此“峰度负偏离”表示当前分布比正态分布更平坦[24]。 * **偏度**:计算指数日收益率序列的三阶中心矩。正偏态表示收益率分布右侧有长尾,极端正收益情形增加;负偏态则表示左侧有长尾[23]。 模型的回测效果 报告未涉及具体量化模型的回测结果。 因子的回测效果 报告展示了各宽基指数在特定时点(2026年2月26日)的因子取值及部分历史统计指标,而非因子的预测性回测表现。以下为各因子在主要宽基指数上的具体取值: 1. **风险溢价因子**[30] * 上证50,当前风险溢价:-0.66%,近5年分位值:22.22% * 沪深300,当前风险溢价:-0.20%,近5年分位值:42.54% * 中证500,当前风险溢价:0.34%,近5年分位值:61.75% * 中证1000,当前风险溢价:0.76%,近5年分位值:72.22% * 中证2000,当前风险溢价:0.78%,近5年分位值:69.05% * 中证全指,当前风险溢价:0.20%,近5年分位值:58.73% * 创业板指,当前风险溢价:-0.30%,近5年分位值:43.57% 2. **股债性价比因子**[45] * 报告指出,在观察时点,没有指数高于其近5年80%分位(机会值),中证500和中证全指低于其近5年20%分位(危险值)[45]。 3. **股息率因子**[52] * 上证50,当前值:3.36%,近5年历史分位值:37.93% * 沪深300,当前值:2.78%,近5年历史分位值:38.68% * 中证500,当前值:1.23%,近5年历史分位值:2.31% * 中证1000,当前值:0.97%,近5年历史分位值:21.24% * 中证2000,当前值:0.68%,近5年历史分位值:0.25% * 中证全指,当前值:1.93%,近5年历史分位值:25.79% * 创业板指,当前值:0.86%,近5年历史分位值:54.63% 4. **破净率因子**[56] * 上证50,当前破净率:24.0% * 沪深300,当前破净率:16.67% * 中证500,当前破净率:10.0% * 中证1000,当前破净率:6.7% * 中证2000,当前破净率:2.3% * 中证全指,当前破净率:5.32% 5. **指数换手率因子**[16] * 上证50,当前换手率:0.26 * 沪深300,当前换手率:0.71 * 中证500,当前换手率:2.27 * 中证1000,当前换手率:3.35 * 中证2000,当前换手率:4.22 * 中证全指,当前换手率:2.01 * 创业板指,当前换手率:3.33 6. **收益分布形态指标**[24] * **峰度变化(当前vs.近5年)**:创业板指的峰度负偏离最大(-2.63),中证500的峰度负偏离最小(-1.37)[23][24]。 * **偏度变化(当前vs.近5年)**:创业板指的负偏态最大(-0.62),中证500的负偏态最小(-0.38)[23][24]。
高频因子(十八):收益来源基础的因子挖掘方法论:维度匹配因子
长江证券· 2026-02-27 15:28
量化因子与构建方式 1. **因子名称:高频残差波动率** * **因子构建思路**:从经典价格稳定性因子“残差波动率”出发,通过提升频率(至30分钟)来构建高频衍生因子[31][35]。 * **因子具体构建过程**:在30分钟频率下,对个股收益率与三因子(通常为市场、规模、价值因子)收益率进行时间序列回归,计算回归残差的波动率[35]。公式可表示为: $$残差_i = r_i - (\alpha + \beta_m r_m + \beta_s SMB + \beta_v HML)$$ $$高频残差波动率 = Std(残差_i)$$ 其中,$r_i$ 为个股收益率,$r_m$、$SMB$、$HML$ 分别为市场、规模、价值因子收益率,$Std(\cdot)$ 表示计算标准差。 2. **因子名称:残差成交量波动率** * **因子构建思路**:从残差波动率的逻辑出发,通过扩充维度(将价格维度替换为成交量占比维度)来构建衍生因子[31][35]。 * **因子具体构建过程**:对个股成交占比(个股成交量/全市场成交量)与全市场成交占比进行时间序列回归,计算回归残差的波动率[35]。公式可表示为: $$残差_{vol\_share} = Share_i - (\alpha + \beta \cdot Share_m)$$ $$残差成交量波动率 = Std(残差_{vol\_share})$$ 其中,$Share_i$ 为个股成交占比,$Share_m$ 为全市场成交占比。 3. **因子名称:残差振幅波动率** * **因子构建思路**:从残差波动率的逻辑出发,通过扩充维度(将收益率维度替换为振幅维度)来构建衍生因子[31][35]。 * **因子具体构建过程**:对个股振幅与市场(如中证全指)振幅进行时间序列回归,计算回归残差的波动率[35]。公式可表示为: $$残差_{amplitude} = Amp_i - (\alpha + \beta \cdot Amp_m)$$ $$残差振幅波动率 = Std(残差_{amplitude})$$ 其中,$Amp_i$ 为个股振幅,$Amp_m$ 为市场振幅。 4. **因子名称:成交匹配波动因子** * **因子构建思路**:基于“维度匹配”方法论,通过匹配K线算子(回归残差波动率)对两个相关但不同的成交量维度(每笔成交量与成交量占比)进行聚合,以挖掘增量信息[8][55][57]。 * **因子具体构建过程**:构建过程分为四步[59]: 1. **计算每笔成交量**:使用匹配变换算子——除法,用成交量除以成交笔数。$$每笔成交量 = \frac{成交量}{成交笔数}$$ 2. **计算成交量和**:使用时序K线算子——求和,对成交量进行聚合。$$成交量和 = Sum(成交量)$$ 3. **计算成交量占比**:使用匹配变换算子——除法,用成交量除以上一步的成交量和。$$成交量占比 = \frac{成交量}{成交量和}$$ 4. **计算成交匹配波动**:使用匹配K线算子——回归残差波动率,对“每笔成交量”和“成交量占比”两个维度进行回归并计算残差波动。$$残差_{match} = 每笔成交量 - (\alpha + \beta \cdot 成交量占比)$$ $$成交匹配波动因子 = Std(残差_{match})$$ 因子的回测效果 **测试区间**:2009年12月31日至2025年12月10日[34]。IC为月度IC。 1. **高频残差波动率因子** * **原始IC**:沪深300: 4.55%, 中证500: 5.98%, 中证1000: 7.94%, 中证全指: 7.71%[42]。 * **市值行业中性后IC**:沪深300: 3.84%, 中证500: 5.55%, 中证1000: 7.32%, 中证全指: 7.94%[42]。 * **量价中性后IC**:沪深300: 1.16%, 中证500: 1.41%, 中证1000: 1.95%, 中证全指: 2.40%[42]。 * **模型评价**:该因子主要收益来源为低波,在量价中性(剥离波动率、换手率)后IC衰减显著[43]。 2. **残差成交量波动率因子** * **原始IC**:沪深300: 3.04%, 中证500: 4.04%, 中证1000: 5.56%, 中证全指: 4.43%[42]。 * **市值行业中性后IC**:沪深300: 3.06%, 中证500: 4.13%, 中证1000: 5.49%, 中证全指: 5.76%[42]。全市场区间年化超额收益4.65%[48]。 * **量价中性后IC**:沪深300: 2.01%, 中证500: 2.96%, 中证1000: 4.10%, 中证全指: 4.02%[42]。全市场区间超额收益2.74%[54]。 * **模型评价**:与风格因子相关性较低,在沪深300内有一定信息增量;但简单逻辑复制的信息增量有限,在量价中性后超额收益稳定性下降[7][43][54]。 3. **残差振幅波动率因子** * **原始IC**:沪深300: 5.08%, 中证500: 6.08%, 中证1000: 7.78%, 中证全指: 6.75%[42]。 * **市值行业中性后IC**:沪深300: 4.34%, 中证500: 5.51%, 中证1000: 7.19%, 中证全指: 7.55%[42]。全市场区间年化超额收益5.25%[48]。 * **量价中性后IC**:沪深300: 2.39%, 中证500: 2.19%, 中证1000: 2.72%, 中证全指: 2.67%[42]。全市场区间超额收益0.45%[54]。 * **模型评价**:简单逻辑复制的信息增量有限,在量价中性后超额收益稳定性显著下降[7][54]。 4. **成交匹配波动因子** * **原始IC**:沪深300: 6.82%, 中证500: 6.40%, 中证1000: 7.33%, 中证全指: 5.94%[65]。 * **市值行业中性后IC**:沪深300: 5.35%, 中证500: 6.01%, 中证1000: 7.31%, 中证全指: 7.55%[65]。 * **量价中性后IC**:沪深300: 3.81%, 中证500: 3.63%, 中证1000: 4.25%, 中证全指: 4.15%[65]。 * **量价中性后分组年化超额收益**:沪深300: 5.05%, 中证500: 3.53%, 中证1000: 5.00%, 中证全指: 5.77%[71][75][77][81]。 * **模型评价**:属于低波收益来源,偏小市值;相比简单逻辑复制的因子,该因子通过多维度匹配构建,提供了更明显的信息增量,在多数板块和年份能获得较稳定的超额收益[8][57][72][76][82]。
量化角度看可转债(十):回测代码框架构建
长江证券· 2026-02-26 21:41
量化模型与构建方式 1. **模型名称:BS定价模型**[5][9][16][19][20][49] * **模型构建思路**:将可转债视为纯债价值与一份欧式看涨期权的组合,通过Black-Scholes期权定价公式计算其理论价格[49]。 * **模型具体构建过程**: 1. 模型将可转债价值 (V) 分解为纯债价值 (B) 和期权价值 (C) 之和:$$V = B + C$$[49] 2. 其中,期权价值 (C) 采用标准的欧式看涨期权BS公式计算:$$C = S N(d_1) - K e^{-r(T-t)} N(d_2)$$[49] 3. 公式中的参数定义如下: * $$d_1 = \frac{ln\left(\frac{S}{K}\right)+(r+\frac{\sigma^{2}}{2})(T-t)}{\sigma\sqrt{T-t}}$$[51] * $$d_2 = \frac{ln\left(\frac{S}{K}\right)+(r-\frac{\sigma^{2}}{2})(T-t)}{\sigma\sqrt{T-t}}$$[51] * $$S$$ 为正股价格[52] * $$K$$ 为执行价(即转股价)[52] * $$r$$ 为无风险收益率(使用10年期国债到期收益率)[28][52] * $$T-t$$ 为剩余到期时间[52] * $$\sigma$$ 为正股波动率(通常使用历史波动率代替,报告中采用一个月区间的年化波动率)[31][52] * **模型评价**:该模型适用于不考虑可转债特殊条款(如赎回、回售)的简化定价场景[20]。 2. **模型名称:二叉树定价模型**[5][9][16][19][20][54] * **模型构建思路**:将可转债视为一个整体,通过构建正股价格的二叉树路径,并在每个节点考虑转股、赎回、回售等条款,采用后向递推的方法计算转债的理论价格[20][54]。 * **模型具体构建过程**: 1. **构建正股价格二叉树**:假设正股价格在每一时间步长 $$\Delta t$$ 内,以概率 $$p$$ 上涨至原来的 $$u$$ 倍,或以概率 $$1-p$$ 下跌至原来的 $$d$$ 倍[54][55]。参数通过以下方程组求解:$$\begin{cases}E(S_{t+\Delta t})=Se^{r\Delta t}=pSu+(1-p)Sd\\ V(S_{t+\Delta t})=S^{2}\sigma^{2}\Delta t=pS^{2}u^{2}+(1-p)S^{2}d^{2}-S^{2}[p u+(1-p)d]^{2}\\ ud=1\end{cases}$$[55] 2. **计算节点股价**:对于第 $$i$$ 步、第 $$j$$ 次上涨的节点,其正股价格为:$$S_{i,j}=S u^{j}d^{i-j}$$[55] 3. **后向递推计算转债价值**:从到期日(二叉树末端)开始,向前倒推每个节点的转债价值[20][57]。 * **期末**:转债价值取转股价值与到期赎回价值的最大值[57]。 * **转股期(非期末)**:转债价值为持有价值(下一节点价值的贴现)与转股价值的最大值,同时需考虑赎回和回售条款的触发条件[57]。 * **非转股期**:转债价值仅为持有价值(下一节点价值的贴现)[57]。 4. 最终,树根节点的价值即为当前可转债的二叉树理论定价[20]。 量化因子与构建方式 1. **因子名称:双低因子**[5][21][67] * **因子构建思路**:结合可转债价格和转股溢价率两个维度,筛选价格较低且转股溢价率较低的转债,旨在平衡债底保护与股性弹性[67]。 * **因子具体构建过程**:因子值为可转债收盘价 (`BondClose`) 与转股溢价率 (`BondZGYJL`) 的简单加总。在策略回测中,按照该因子值升序排列,选取排名靠前的标的构建组合[67]。 2. **衍生指标(因子)组**[9][19][31][46][47] * **构建思路**:在数据预处理阶段计算一系列常用估值指标,为后续策略筛选和因子构建提供基础数据[19][46]。 * **具体构建过程**: 1. **纯债溢价率 (`BondCZYJL`)**:衡量转债价格相对于其纯债价值的溢价程度。$$BondCZYJL = \frac{BondClose}{BondCZJZ} - 1$$[31][47] 2. **转股价值 (`BondZHJZ`)**:每张转债立即转换为股票所能获得的价值。$$BondZHJZ = 100 \times \frac{StockClose}{BondZGJ}$$[31][47] 3. **转股溢价率 (`BondZGYJL`)**:衡量转债价格相对于其转股价值的溢价程度。$$BondZGYJL = \frac{BondClose}{BondZHJZ} - 1$$[31][47] 4. **平价溢价率 (`BondPJDJYJL`)**:衡量转股价值相对于纯债价值的溢价程度,反映了内含期权的价值。$$BondPJDJYJL = \frac{BondZHJZ}{BondCZJZ} - 1$$[31][47] 5. **剩余到期年限 (`BondEndterm`)**:转债距离到期日的剩余时间(年)。$$BondEndterm = \frac{BondEndTermlist - Datelist}{365}$$[31][48] 模型的回测效果 *(注:报告内容主要介绍框架构建,未提供具体模型的回测绩效指标,如年化收益率、夏普比率、最大回撤等。因此,此部分无相关内容可总结。)* 因子的回测效果 *(注:报告内容主要介绍框架构建,虽然提及“双低策略”作为示例,但未提供该因子或策略的具体回测绩效指标,如年化收益率、信息比率(IR)、胜率等。因此,此部分无相关内容可总结。)*