Workflow
量化角度看可转债(十):回测代码框架构建
长江证券· 2026-02-26 21:41
量化模型与构建方式 1. **模型名称:BS定价模型**[5][9][16][19][20][49] * **模型构建思路**:将可转债视为纯债价值与一份欧式看涨期权的组合,通过Black-Scholes期权定价公式计算其理论价格[49]。 * **模型具体构建过程**: 1. 模型将可转债价值 (V) 分解为纯债价值 (B) 和期权价值 (C) 之和:$$V = B + C$$[49] 2. 其中,期权价值 (C) 采用标准的欧式看涨期权BS公式计算:$$C = S N(d_1) - K e^{-r(T-t)} N(d_2)$$[49] 3. 公式中的参数定义如下: * $$d_1 = \frac{ln\left(\frac{S}{K}\right)+(r+\frac{\sigma^{2}}{2})(T-t)}{\sigma\sqrt{T-t}}$$[51] * $$d_2 = \frac{ln\left(\frac{S}{K}\right)+(r-\frac{\sigma^{2}}{2})(T-t)}{\sigma\sqrt{T-t}}$$[51] * $$S$$ 为正股价格[52] * $$K$$ 为执行价(即转股价)[52] * $$r$$ 为无风险收益率(使用10年期国债到期收益率)[28][52] * $$T-t$$ 为剩余到期时间[52] * $$\sigma$$ 为正股波动率(通常使用历史波动率代替,报告中采用一个月区间的年化波动率)[31][52] * **模型评价**:该模型适用于不考虑可转债特殊条款(如赎回、回售)的简化定价场景[20]。 2. **模型名称:二叉树定价模型**[5][9][16][19][20][54] * **模型构建思路**:将可转债视为一个整体,通过构建正股价格的二叉树路径,并在每个节点考虑转股、赎回、回售等条款,采用后向递推的方法计算转债的理论价格[20][54]。 * **模型具体构建过程**: 1. **构建正股价格二叉树**:假设正股价格在每一时间步长 $$\Delta t$$ 内,以概率 $$p$$ 上涨至原来的 $$u$$ 倍,或以概率 $$1-p$$ 下跌至原来的 $$d$$ 倍[54][55]。参数通过以下方程组求解:$$\begin{cases}E(S_{t+\Delta t})=Se^{r\Delta t}=pSu+(1-p)Sd\\ V(S_{t+\Delta t})=S^{2}\sigma^{2}\Delta t=pS^{2}u^{2}+(1-p)S^{2}d^{2}-S^{2}[p u+(1-p)d]^{2}\\ ud=1\end{cases}$$[55] 2. **计算节点股价**:对于第 $$i$$ 步、第 $$j$$ 次上涨的节点,其正股价格为:$$S_{i,j}=S u^{j}d^{i-j}$$[55] 3. **后向递推计算转债价值**:从到期日(二叉树末端)开始,向前倒推每个节点的转债价值[20][57]。 * **期末**:转债价值取转股价值与到期赎回价值的最大值[57]。 * **转股期(非期末)**:转债价值为持有价值(下一节点价值的贴现)与转股价值的最大值,同时需考虑赎回和回售条款的触发条件[57]。 * **非转股期**:转债价值仅为持有价值(下一节点价值的贴现)[57]。 4. 最终,树根节点的价值即为当前可转债的二叉树理论定价[20]。 量化因子与构建方式 1. **因子名称:双低因子**[5][21][67] * **因子构建思路**:结合可转债价格和转股溢价率两个维度,筛选价格较低且转股溢价率较低的转债,旨在平衡债底保护与股性弹性[67]。 * **因子具体构建过程**:因子值为可转债收盘价 (`BondClose`) 与转股溢价率 (`BondZGYJL`) 的简单加总。在策略回测中,按照该因子值升序排列,选取排名靠前的标的构建组合[67]。 2. **衍生指标(因子)组**[9][19][31][46][47] * **构建思路**:在数据预处理阶段计算一系列常用估值指标,为后续策略筛选和因子构建提供基础数据[19][46]。 * **具体构建过程**: 1. **纯债溢价率 (`BondCZYJL`)**:衡量转债价格相对于其纯债价值的溢价程度。$$BondCZYJL = \frac{BondClose}{BondCZJZ} - 1$$[31][47] 2. **转股价值 (`BondZHJZ`)**:每张转债立即转换为股票所能获得的价值。$$BondZHJZ = 100 \times \frac{StockClose}{BondZGJ}$$[31][47] 3. **转股溢价率 (`BondZGYJL`)**:衡量转债价格相对于其转股价值的溢价程度。$$BondZGYJL = \frac{BondClose}{BondZHJZ} - 1$$[31][47] 4. **平价溢价率 (`BondPJDJYJL`)**:衡量转股价值相对于纯债价值的溢价程度,反映了内含期权的价值。$$BondPJDJYJL = \frac{BondZHJZ}{BondCZJZ} - 1$$[31][47] 5. **剩余到期年限 (`BondEndterm`)**:转债距离到期日的剩余时间(年)。$$BondEndterm = \frac{BondEndTermlist - Datelist}{365}$$[31][48] 模型的回测效果 *(注:报告内容主要介绍框架构建,未提供具体模型的回测绩效指标,如年化收益率、夏普比率、最大回撤等。因此,此部分无相关内容可总结。)* 因子的回测效果 *(注:报告内容主要介绍框架构建,虽然提及“双低策略”作为示例,但未提供该因子或策略的具体回测绩效指标,如年化收益率、信息比率(IR)、胜率等。因此,此部分无相关内容可总结。)*
量化点评报告:中证转债指数调整后修复——二月可转债量化月报
国盛证券· 2026-02-26 18:24
量化模型与构建方式 1. **模型名称:CCBA定价模型** [7] * **模型构建思路**:用于可转债定价,并计算市场整体估值偏离度[7]。 * **模型具体构建过程**:该模型为专题报告《可转债的赎回概率调整定价模型》中提出的可转债定价模型。基于此模型计算每只可转债的理论定价,进而计算其定价偏离度,用以衡量市场估值水平[7]。定价偏离度公式为: $$定价偏离度 = \frac{转债价格}{CCBA模型定价} - 1$$ 其中,`转债价格`为市场交易价格,`CCBA模型定价`为根据该模型计算出的理论价格[7]。 2. **模型名称:CCB定价模型** [22] * **模型构建思路**:用于可转债定价及收益分解[17][22]。 * **模型具体构建过程**:该模型为专题报告《可转债定价模型与应用》中介绍的可转债定价模型。在CCB模型基础上,加入退市风险调整后得到CCB_out模型,用于计算定价偏离度以构建低估值策略[22]。定价偏离度公式为: $$定价偏离度 = \frac{转债价格}{CCB\_out模型定价} - 1$$ 其中,`转债价格`为市场交易价格,`CCB_out模型定价`为考虑退市风险后的理论价格[22]。此外,该模型还可用于收益分解,将转债收益拆解为债底收益、股票拉动收益和转债估值收益三部分[17]。 3. **策略/模型名称:转债&股债组合轮动策略** [11] * **模型构建思路**:基于转债市场整体估值(定价偏离度)的高低,在可转债和股债组合之间进行择时轮动配置[2][11]。 * **模型具体构建过程**: 1. 构建股债组合:采用50%的7-10年期国债加上50%的中证1000全收益指数[2][11]。 2. 计算估值分数:首先计算市场整体定价偏离度在过去3年标准差基础上的Z值(`Z值 = 定价偏离度 / 过去3年标准差`),并按照±1.5倍标准差进行截尾处理。然后将截尾后的Z值除以-1.5得到分数[11]。 3. 确定权重:转债权重 = 50% + 50% × 分数,剩余仓位配置股债组合。通过该规则,在转债市场低估时超配转债,高估时超配股债组合[11]。 量化因子与构建方式 1. **因子名称:定价偏离度因子(基于CCB_out模型)** [22] * **因子构建思路**:衡量单只可转债市场价格相对于其理论价值的偏离程度,偏离度越低代表估值越低,作为价值因子使用[22]。 * **因子具体构建过程**:使用CCB_out模型计算每只转债的理论价格,然后计算定价偏离度[22]。公式为: $$定价偏离度 = \frac{转债价格}{CCB\_out模型定价} - 1$$ 该值越小,表明转债相对其理论价值越便宜[22]。 2. **因子名称:正股动量因子** [25][28] * **因子构建思路**:通过正股过去一段时间的历史表现来预测未来走势,作为动量因子使用[25]。 * **因子具体构建过程**:使用正股过去1个月、3个月、6个月的动量进行等权打分构建综合动量因子[25][28]。 3. **因子名称:转债高换手因子** [27][31] * **因子构建思路**:衡量可转债的市场交易活跃度,高换手可能代表市场关注度高或流动性好[27]。 * **因子具体构建过程**:综合使用转债换手率(计算周期为5日和21日)以及转债与股票换手率的比率(计算周期为5日和21日)来构建[31]。 4. **复合因子/策略:低估值+强动量** [25] * **构建思路**:将定价偏离度因子(价值)与正股动量因子相结合,旨在选取既便宜又具备上涨势头的转债[25]。 * **具体构建过程**:在低估值策略的基础上,引入正股动量因子(过去1、3、6个月动量等权打分)进行综合筛选[25][28]。 5. **复合因子/策略:低估值+高换手** [27] * **构建思路**:在估值较低的转债池中,进一步筛选交易活跃的个券,结合价值和流动性[27]。 * **具体构建过程**:首先使用定价偏离度因子筛选出市场上估值较低的50%的转债,然后在该低估池中使用转债高换手因子选择成交热度较高的个券进行配置[27][31]。 模型的回测效果 (注:以下策略基准均为“等权指数”,回测区间为2018年至2026年2月13日,指标为全样本年化值) 1. **低估值策略** * 区间收益:20.9% [25] * 年化波动:13.1% [25] * 最大回撤:18.0% [25] * 区间超额收益(相对基准):8.8% [25] * 信息比率(IR):1.48 [25] 2. **低估值+强动量策略** * 区间收益:25.2% [29] * 年化波动:13.8% [29] * 最大回撤:13.2% [29] * 区间超额收益(相对基准):12.7% [29] * 信息比率(IR):2.19 [29] 3. **低估值+高换手策略** * 区间收益:23.6% [32] * 年化波动:15.0% [32] * 最大回撤:15.9% [32] * 区间超额收益(相对基准):11.3% [32] * 信息比率(IR):1.82 [32] 4. **平衡偏债增强策略**(绝对收益型,无明确对比基准) * 区间(年化)收益:22.8% [35] * 年化波动:12.1% [35] * 最大回撤:13.9% [35] 5. **信用债替代策略**(绝对收益型,对比信用债净值) * 区间(年化)收益:7.1% [38] * 年化波动:2.1% [38] * 最大回撤:2.8% [38] 6. **波动率控制策略**(绝对收益型,对比信用债净值) * 区间(年化)收益:9.7% [42] * 年化波动:4.4% [42] * 最大回撤:4.4% [42] 因子的回测效果 (注:报告中未提供单一因子的独立回测绩效指标,所有因子均作为组成部分融入上述策略中进行测试。因此,本部分无具体指标值可总结。)
量化可转债研究之十三:可转债组合的风险中性方法对比
广发证券· 2026-02-26 16:25
量化模型与构建方式 1. **模型名称:分层抽样法(风险中性组合构建模型)** * **模型构建思路:** 通过先精确匹配基准的行业权重,再在行业内进行市值分档,并在每个“行业-市值档”网格内根据因子选债,以实现对行业和市值的离散化、近似中性控制[26]。 * **模型具体构建过程:** 1. **行业中性:** 确保投资组合的行业权重与基准指数(如中证转债指数)完全一致[27]。 2. **市值分档:** 在每个行业内,将所有可转债按市值从大到小排序,并等分为N档(例如5档),形成“行业-市值档”网格[27]。 3. **行业内选债:** 在每个网格单元内,使用量化因子(如双低因子)对可转债进行打分排序,选取排名靠前的标的[27]。 4. **权重分配:** 组合的最终权重由三部分决定:该行业的基准权重、该市值档在该行业内的基准权重、以及所选可转债在该网格单元内的权重(通常采用市值加权以匹配市值中性)[27]。 * **模型评价:** 过程透明直观,可解释性极高,能严格保证行业中性。但由于可转债市场尾部行业成分券数量稀少,实际能满足市值分层条件的行业非常有限,导致其在市值中性化目标上可能存在偏离[45]。 2. **模型名称:回归残差法(因子纯化模型)** * **模型构建思路:** 将原始Alpha因子(如可转债价格和转股溢价率)作为因变量,将风险变量(市值、行业虚拟变量)作为自变量进行横截面线性回归,用得到的残差作为“纯净”的Alpha因子来选债,以实现平均意义上的统计中性[28][30]。 * **模型具体构建过程:** 1. 在每月底的横截面数据上,分别对可转债收盘价和转股溢价率进行线性回归,自变量为可转债剩余规模和行业虚拟变量[50]。 2. 回归方程形式为:原始因子 = β1 * 市值 + β2 * 行业1 + β3 * 行业2 + ... + 残差[31]。 3. 分别得到价格和转股溢价率的两组回归残差,将这两列残差相加,得到风险中性化后的“纯净”双低因子[50]。 4. 在每个截面上,选取该“纯净”因子最小的20%的可转债,并以剩余规模作为权重构建组合[50]。 * **模型评价:** 方法简单直观,计算速度快。但其行业中性是在全样本横截面上“平均”意义上的,对于特定组合可能仍存在微小敞口,且无法保证选到所有行业的可转债,导致无法实现绝对的行业中性[31][54]。 3. **模型名称:优化器法(组合优化模型)** * **模型构建思路:** 将风险中性要求作为约束条件,融入马科维茨均值-方差优化框架,以最大化风险调整后的预期收益为目标,求解最优的权重分配,实现精确的数学中性[32][36]。 * **模型具体构建过程:** 1. **定义目标函数:** 最大化风险调整后的预期收益,公式为: $$W' * E - λ / 2 * W' * Σ * W$$ 其中,W是待求解的权重向量,E是预期收益率向量,Σ是收益率的协方差矩阵,λ是风险厌恶系数(报告中设为2.5)[32][57]。 2. **设置约束条件:** 包括行业偏离基准不超过5%,市值偏离基准不超过10%,权重非负且和为1($$0<=W<=1$$)等[34][35][57]。由于可转债样本数量限制,约束条件不能设置过紧[57]。 3. **求解:** 每月末使用过去100个交易日的数据计算预期收益率与协方差矩阵,通过数值优化算法(如二次规划)求解最优权重向量W[57]。 * **模型评价:** 可以在组合层面实现精确的市值和行业中性,且扩展性强,可方便添加各种复杂约束。但计算复杂,对输入(预期收益和协方差矩阵估计)敏感,且优化过程像黑箱,可解释性较低[36][38][40]。 量化因子与构建方式 1. **因子名称:双低因子** * **因子构建思路:** 同时筛选价格低与转股溢价率低的可转债,利用这两个指标的叠加效应,实现防守性(债性)与进攻性(股性)的平衡[41]。 * **因子具体构建过程:** 双低因子为可转债价格与转股溢价率(乘以100)的简单加和[41]。公式为: $$双低因子 = 可转债价格 + 可转债转股溢价率 * 100$$ * **因子评价:** 是可转债投资中常用的经典因子,旨在平衡债底保护与股性弹性[41]。 模型的回测效果 **回测设置统一为:** 周期2019年1月至2025年12月,月频调仓,选债池数量的20%,基准为中证转债指数[42]。 1. **分层抽样法模型** * 年化收益:13.9%[45] * 年化波动率:11.4%[45] * 收益风险比(年化收益/年化波动率):1.22[45] * 最大回撤:-17.2%[45] * 年化超额收益:7.2%[70] * 超额收益年化波动率:6.9%[70] * 夏普比率(Sharpe):0.83[70] * 超额收益最大回撤:-8.8%[70] 2. **回归残差法模型** * 年化收益:10.9%[53] * 年化波动率:11.9%[53] * 收益风险比:0.92[53] * 最大回撤:-17.1%[53] * 年化超额收益:2.7%[70] * 超额收益年化波动率:7.6%[70] * 夏普比率(Sharpe):0.16[70] * 超额收益最大回撤:-15.9%[70] 3. **优化器法模型** * 年化收益:23.1%[61] * 年化波动率:16.7%[61] * 收益风险比:1.38[61] * 最大回撤:-18.4%[61] * 年化超额收益:19.0%[70] * 超额收益年化波动率:15.4%[70] * 夏普比率(Sharpe):1.13[70] * 超额收益最大回撤:-16.6%[70] 因子的回测效果 **(注:报告未单独提供未经风险中性处理的原始双低因子构建的组合绩效,而是将其作为等权组合和市值加权组合的构建基础进行对比)** 1. **基于双低因子构建的等权组合** * 年化超额收益:15.1%[70] * 超额收益年化波动率:11.3%[70] * 夏普比率(Sharpe):1.21[70] * 超额收益最大回撤:-21.1%[70] 2. **基于双低因子构建的市值加权组合** * 年化超额收益:9.3%[70] * 超额收益年化波动率:8.8%[70] * 夏普比率(Sharpe):0.88[70] * 超额收益最大回撤:-18.6%[70]
A股市场快照:宽基指数每日投资动态-20260226
江海证券· 2026-02-26 16:25
量化模型与构建方式 1. **模型/因子名称**:风险溢价[24] * **构建思路**:以十年期国债即期收益率为无风险利率参考,计算各宽基指数相对于无风险利率的溢价,用以衡量其相对投资价值和偏离情况[24]。 * **具体构建过程**:风险溢价的计算公式为: $$风险溢价 = 指数收益率 - 十年期国债即期收益率$$ 报告中具体展示了各指数的当前风险溢价、历史分位值、均值及波动率等统计指标[28]。 2. **模型/因子名称**:股债性价比[43] * **构建思路**:将股票估值指标(PE-TTM的倒数)与无风险利率(十年期国债即期收益率)进行比较,以衡量股票相对于债券的吸引力[43]。 * **具体构建过程**:股债性价比的计算公式为: $$股债性价比 = \frac{1}{PE-TTM} - 十年期国债即期收益率$$ 报告中将此指标与历史分位值(如80%分位的机会值和20%分位的危险值)进行比较分析[43]。 3. **模型/因子名称**:股息率[45] * **构建思路**:通过计算指数成分股的现金分红回报率,反映红利投资的收益水平,并作为市场估值和投资风格的观察指标[45]。 * **具体构建过程**:指数股息率通常基于成分股的股息和市值进行加权计算。报告展示了各指数的当前股息率及其历史分位值、均值和波动率[50]。 4. **模型/因子名称**:破净率[51] * **构建思路**:计算指数中市净率(PB)小于1的个股占比,用以反映市场整体的估值态度和悲观/乐观程度[51][53]。 * **具体构建过程**:破净率的计算公式为: $$破净率 = \frac{指数中市净率(PB) < 1的个股数量}{指数成分股总数量}$$ 报告统计了各宽基指数当前的破净率数值[54]。 5. **模型/因子名称**:指数换手率[15] * **构建思路**:衡量指数整体的交易活跃程度,计算基于成分股流通股本加权的平均换手率[15]。 * **具体构建过程**:指数换手率的计算公式为: $$指数换手率 = \frac{\sum (成分股流通股本 \times 成分股换手率)}{\sum (成分股流通股本)}$$ 报告计算并比较了各宽基指数的当前换手率[15]。 6. **模型/因子名称**:收益分布形态指标(峰度与偏度)[21] * **构建思路**:通过计算指数日收益率分布的峰度和偏度,分析收益分布的集中程度和不对称性(偏向正收益或负收益)[21]。 * **具体构建过程**:计算近一年及近五年(基准期)日收益率序列的峰度(报告中减去了正态分布的峰度值3)和偏度,并进行对比[22]。峰度负偏离越大,说明当前分布比历史基准更分散;负偏态越大,说明极端负收益情形增加的程度更高[21]。 模型的回测效果 (本报告为市场数据跟踪报告,未提供基于历史数据的模型策略回测绩效指标,如年化收益率、夏普比率、最大回撤等。因此,此部分无相关内容。) 量化因子与构建方式 (本报告主要对市场指数进行多维度的指标跟踪和分析,所涉及的“风险溢价”、“股债性价比”等更接近于用于评价市场的综合指标或模型,而非用于选股的阿尔法因子。报告未涉及具体的股票选股因子构建,如价值、动量、质量等因子的构建与测试。因此,此部分无相关内容。) 因子的回测效果 (同上,报告未涉及股票选股因子的测试,因此无相关因子IC值、IR、多空收益等测试结果。)
机器学习因子选股月报(2026年3月)
西南证券· 2026-02-26 15:09
量化模型与构建方式 1. **模型名称:GAN_GRU模型**[4][13] * **模型构建思路**:这是一个结合了生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习选股模型。首先利用GAN模型对量价时序特征进行增强和预处理,以挖掘更有效的特征表示;然后将处理后的特征输入GRU模型进行时序编码,最终预测股票未来收益并形成因子[4][13]。 * **模型具体构建过程**: 1. **数据准备**:选取所有个股过去400个交易日内的18个量价特征(包括收盘价、开盘价、成交量、换手率等日频和月频特征)[14][17][19]。每5个交易日进行一次特征采样,采样形状为(40, 18),即使用过去40天的特征来预测未来20个交易日的累计收益[18]。训练集与验证集比例为80%:20%[18]。 2. **数据处理**:对每次采样的40天内的每个特征,在时序上进行去极值和标准化处理;同时,每个特征在个股截面上也进行标准化处理[18]。 3. **GAN特征生成**:构建一个GAN模型用于处理原始量价时序特征。生成器(G)采用LSTM模型,以保留输入特征的时序性;判别器(D)采用CNN模型,将量价时序特征视为二维“图片”进行识别[33]。GAN的训练过程是生成器和判别器的交替对抗训练[29]。 * 生成器的损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 表示随机噪声,\(G(z)\) 表示生成器生成的数据,\(D(G(z))\) 表示判别器判断生成数据为真实数据的概率[24][25]。 * 判别器的损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 是真实数据,\(D(x)\) 是判别器对真实数据的输出概率[27]。 4. **GRU时序编码**:将经过GAN生成器处理后的特征(形状仍为(40, 18))[37],输入到一个两层GRU网络(GRU(128, 128))中进行时序特征编码[22]。 5. **收益预测**:在GRU层后接入一个多层感知机(MLP(256, 64, 64)),将模型最终输出的预测收益(pRet)作为选股因子[22]。 6. **模型训练与更新**:采用半年滚动训练方式,每年6月30日和12月31日各训练一次模型,用于未来半年的预测[18]。训练时使用Adam优化器,学习率为1e-4,损失函数为IC,并设置早停机制[18]。 7. **因子处理**:在测试和使用因子前,会对因子进行行业和市值中性化处理,并进行标准化[22]。 量化因子与构建方式 1. **因子名称:GAN_GRU因子**[4][13] * **因子构建思路**:该因子是GAN_GRU模型的直接输出。具体而言,是利用GAN模型增强后的量价时序特征,通过GRU模型编码后,由MLP层预测出的股票未来20个交易日的累计收益,将此预测值作为选股因子[4][13][18][22]。 * **因子具体构建过程**: 1. 按照上述GAN_GRU模型流程,输入个股过去40个交易日的18个量价特征[18]。 2. 模型经过GAN特征生成、GRU时序编码和MLP预测后,输出一个标量值,即该股票未来20个交易日的预测累计收益(pRet)[22]。 3. 对所有股票计算该预测值,即得到截面上的GAN_GRU因子值[22]。 4. 在回测和分析前,对原始因子值进行行业和市值中性化处理,并进行标准化[22]。 模型的回测效果 1. **GAN_GRU模型(因子)全市场表现(月频调仓,2019年2月至2026年2月)**[41][42] * IC均值:0.1096*** * ICIR(未年化):0.87 * 年化收益率:38.13% * 年化波动率:23.18% * 信息比率(IR):1.64 * 最大回撤率:27.29% * 年化超额收益率:22.32% * 换手率:0.82X * 近期IC(2026年2月):-0.0105*** * 近一年IC均值:0.0517*** 因子的回测效果 1. **GAN_GRU因子行业IC表现(截至2026年2月)**[4][42] * **2月当期IC排名前五的行业(除综合)及IC值**: * 电力及公用事业:0.1257*** * 商贸零售:0.1196*** * 房地产:0.1151*** * 建筑:0.1130*** * 基础化工:0.1063*** * **近一年IC均值排名前五的行业(除综合)及IC均值**: * 钢铁:0.1404*** * 计算机:0.1175*** * 传媒:0.1132*** * 商贸零售:0.1014*** * 食品饮料:0.0989*** 2. **GAN_GRU因子行业多头组合表现(截至2026年2月25日)**[2][45][46] * **2月当期多头组合超额收益前五的行业(除综合)及超额收益**: * 石油石化:7.91% * 通信:3.11% * 电子:3.06% * 有色金属:2.78% * 计算机:2.78% * **近一年月平均超额收益前五的行业(除综合)及超额收益**: * 房地产:3.83% * 商贸零售:2.04% * 汽车:1.93% * 建筑:1.50% * 消费者服务:1.49%
机器学习因子选股月报(2026年3月)-20260226
西南证券· 2026-02-26 14:25
量化模型与构建方式 1. **模型名称:GAN_GRU模型**[4][13] * **模型构建思路**:该模型是一个深度学习选股模型,其核心思路是首先利用生成式对抗网络(GAN)对量价时序特征进行处理和增强,然后利用GRU模型对处理后的时序特征进行编码,最终输出股票的预测收益作为选股因子[4][13]。 * **模型具体构建过程**: 1. **数据准备与特征**:使用18个量价特征,包括日频特征(如前收盘价、开盘价、收盘价、最高价、最低价、成交量、成交金额、涨跌幅、振幅、换手率、均价)和月频特征(如月成交金额、月涨跌幅、月振幅、月换手率、月收盘最高价、月收盘最低价、月日均换手率)[17][19]。选取所有股票,剔除ST及上市不足半年的股票[18]。 2. **特征采样与处理**:对于每只股票,取过去400天内的18个量价特征,每5个交易日进行一次采样,采样形状为40*18(即过去40天的特征)[18]。每次采样的40天内,每个特征在时序上进行去极值和标准化处理,同时每个特征在个股截面上进行标准化处理[18]。 3. **标签设定**:利用过去40天的量价特征来预测未来20个交易日的累计收益[18]。 4. **GAN特征生成**:为了增强量价时序特征,构建了一个GAN模型。其中,生成器(G)采用能够保留时序性质的LSTM模型,输入原始量价时序特征(形状为(40,18)),输出处理后的特征(形状仍为(40,18))[33][37]。判别器(D)采用适用于二维图像处理的CNN模型,用于区分真实特征与生成特征[33]。GAN的训练过程是生成器和判别器交替对抗训练,其损失函数分别为: * 生成器损失函数:$$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\)为随机噪声,\(G(z)\)为生成数据,\(D(G(z))\)为判别器判断生成数据为真的概率[24]。 * 判别器损失函数:$$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\)为真实数据,\(D(x)\)为判别器判断真实数据为真的概率[27]。 5. **GRU收益预测**:将经过GAN生成器处理后的特征(或原始特征?报告指出GAN_GRU因子是利用GAN处理后再用GRU编码,但具体流程图中可能包含原始特征与生成特征的结合)输入到一个两层GRU网络(GRU(128, 128))中进行时序特征编码[14][22]。随后连接一个多层感知机(MLP(256, 64, 64))[22]。模型最终输出预测收益(pRet)作为选股因子[22]。 6. **训练与预测**:采用半年滚动训练方式,训练时间点为每年的6月30日及12月31日,用训练好的模型预测未来半年的收益[18]。训练集与验证集比例为80%:20%[18]。训练时使用Adam优化器,学习速率为1e-4,损失函数为IC,设置早停轮数为10,最大训练轮数为50[18]。 * **模型评价**:该模型结合了GAN的数据增强能力和GRU的时序建模能力,旨在挖掘量价数据中更深层次的时序特征以预测股票收益。 2. **因子名称:GAN_GRU因子**[4][13] * **因子构建思路**:GAN_GRU因子即为GAN_GRU模型最终输出的股票预测收益(pRet)[22]。该因子在用于选股测试前,会经过行业和市值中性化处理,并进行标准化[22]。 * **因子具体构建过程**: 1. 运行上述GAN_GRU模型,获得每只股票在调仓时点的预测收益值。 2. 对得到的原始因子值进行行业和市值中性化处理。 3. 对中性化后的因子值进行标准化处理,得到最终的GAN_GRU因子[22]。 模型的回测效果 (注:报告主要提供了GAN_GRU因子的回测效果,未单独提供GAN_GRU模型的回测效果指标。模型效果通过其输出的因子表现来体现。) 量化因子与构建方式 (注:本报告核心因子即为GAN_GRU因子,其构建方式已包含在“GAN_GRU模型”的构建过程中,并作为单独因子列出如上。) 因子的回测效果 1. **GAN_GRU因子** * **全市场表现(2019年2月至2026年2月,月频调仓)**: * IC均值:0.1096***[41][42] * ICIR(未年化):0.87[42] * 年化收益率:38.13%[42] * 年化波动率:23.18%[42] * 信息比率(IR):1.64[42] * 最大回撤率:27.29%[42] * 年化超额收益率:22.32%[41][42] * 换手率:0.82X[42] * **近期表现(截至2026年2月25日)**: * 最新一期IC:-0.0105***[41][42] * 近一年IC均值:0.0517***[41][42] * **行业IC表现(截至2026年2月)**: * **当月IC排名前五行业**:电力及公用事业 (0.1257***)、商贸零售 (0.1196***)、房地产 (0.1151***)、建筑 (0.1130***)、基础化工 (0.1063***)[4][42] * **近一年IC均值排名前五行业**:钢铁 (0.1404***)、计算机 (0.1175***)、传媒 (0.1132***)、商贸零售 (0.1014***)、食品饮料 (0.0989***)[4][42] * **行业多头组合表现**: * **当月超额收益前五行业(截至2026年2月25日)**:石油石化 (7.91%)、通信 (3.11%)、电子 (3.06%)、有色金属 (2.78%)、计算机 (2.78%)[2][45] * **近一年月均超额收益前五行业**:房地产 (3.83%)、商贸零售 (2.04%)、汽车 (1.93%)、建筑 (1.50%)、消费者服务 (1.49%)[2][46] * **近一年未跑赢行业指数的行业数量**:7个(交通运输、建材、煤炭、非银金融、传媒、有色、通信)[2][46]
金融工程定期:2月转债配置:转债估值偏贵,看好平衡低估风格
开源证券· 2026-02-26 11:05
量化模型与构建方式 1. **模型名称**:转债综合估值因子 * **模型构建思路**:从估值视角对转债的配置价值进行系统性增强,通过融合两个在不同转债类型上表现优异的估值因子,构建一个综合性的估值评价指标[18] * **模型具体构建过程**: 1. 首先构建两个基础估值因子:转股溢价率偏离度因子和理论价值偏离度(蒙特卡洛模型)因子[18]。 2. 对每个因子在截面上的所有转债进行排名(Rank)[19]。 3. 将两个因子的排名值相加,得到转债综合估值因子[19]。 * **公式**: $$转债综合估值因子 = Rank(转股溢价率偏离度) + Rank(理论价值偏离度(蒙特卡洛模拟))$$ [19] * **模型评价**:该综合因子在全域、平衡型和偏债型转债上表现较优[18] 2. **模型名称**:转债风格轮动模型 * **模型构建思路**:通过识别转债市场的情绪指标,在三种低估风格指数(偏股、平衡、偏债)之间进行动态轮动配置,以获取超额收益[17] * **模型具体构建过程**: 1. **构建风格指数**:首先根据平底溢价率将转债划分为偏股型(>15%)、偏债型(<-15%)和平衡型(其余),并分别构建对应的等权指数[19]。然后,在各自风格内,分别使用转债综合估值因子(平衡、偏债)或理论价值偏离度因子(偏股)筛选排名前1/3的转债,构建对应的低估风格指数,并限制成分债上限为30只[20]。 2. **计算市场情绪指标**:在单个转债层面计算“转债20日动量”和“波动率偏离度”两个因子[26]。然后,在每个低估风格指数内部,取这两个因子值的中位数,作为该指数的市场情绪捕捉指标[26]。 3. **确定轮动仓位**:对三个低估风格指数的市场情绪捕捉指标进行逆序排名(指标值越小排名越靠前,如第1名),并将每个指数在两个指标上的排名相加,得到“市场情绪捕捉指标”总分[26][27]。选择总分较低的指数进行配置。若排名相等则等权配置,若同时选中三种风格则100%投资于平衡低估风格[17][26]。模型为双周频调仓[26]。 模型的回测效果 *注:以下为各风格低估指数及轮动模型的长期回测表现,回测区间为2018-02-14至2026-01-09或2026-02-13[22][30]* 1. **偏股转债低估指数**,年化收益率27.22%,年化波动率20.75%,最大回撤0.23,信息比率(IR)1.31,卡玛比率1.19[22] 2. **平衡转债低估指数**,年化收益率16.09%,年化波动率12.03%,最大回撤0.16,信息比率(IR)1.34,卡玛比率1.01[22] 3. **偏债转债低估指数**,年化收益率12.60%,年化波动率9.79%,最大回撤0.18,信息比率(IR)1.29,卡玛比率0.71[22] 4. **转债风格轮动模型**,年化收益25.91%,年化波动16.99%,最大回撤15.89%,信息比率(IR)1.52,卡玛比率1.63[30] 量化因子与构建方式 1. **因子名称**:转股溢价率偏离度 * **因子构建思路**:衡量单只转债的转股溢价率相对于其理论拟合值的偏离程度,以消除不同平价水平带来的不可比性[19] * **因子具体构建过程**:计算转债的实际转股溢价率与通过截面数据拟合得到的理论转股溢价率(拟合值)之间的差值[19] * **公式**: $$转股溢价率偏离度 = 转股溢价率 − 拟合转股溢价率$$ [19] 2. **因子名称**:理论价值偏离度(蒙特卡洛模型) * **因子构建思路**:通过蒙特卡洛模拟充分考虑转债的各类条款(转股、赎回、下修、回售),计算其理论价值,并用市场价格与理论价值的比值来衡量价格预期差[19] * **因子具体构建过程**: 1. 在每个时点,使用蒙特卡洛方法模拟正股价格路径(通常为10000条),并考虑转债的转股、赎回、下修、回售等条款,以同信用、同期限的利率作为贴现率,计算转债的理论价值[19]。 2. 用转债的收盘价除以该理论价值,再减去1,得到偏离度[19]。 * **公式**: $$理论价值偏离度(蒙特卡洛模型) = 转债收盘价 / 理论价值(蒙特卡洛模型) - 1$$ [19] 3. **因子名称**:转债20日动量 * **因子构建思路**:用于捕捉转债市场的趋势情绪,作为风格轮动的输入指标之一[26] * **因子具体构建过程**:报告未详细说明具体计算方法,但指出是在单个转债层面计算的因子,并取中位数代表整个风格指数的情绪[26] 4. **因子名称**:波动率偏离度 * **因子构建思路**:用于捕捉转债市场的波动情绪,作为风格轮动的另一个输入指标[26] * **因子具体构建过程**:报告未详细说明具体计算方法,但指出是在单个转债层面计算的因子,并取中位数代表整个风格指数的情绪[26] 辅助指标与构建方式 *注:以下为用于衡量市场整体估值水平的指标,非直接用于选股的Alpha因子* 1. **指标名称**:百元转股溢价率 * **指标构建思路**:构建一个在时间序列上可比的估值指标,用于衡量转债市场整体相对于正股的估值高低[3] * **指标具体构建过程**: 1. 在每个时点,使用截面上的所有转债数据,拟合转股溢价率(y)与转股价值(x)的关系曲线[42]。 2. 将转股价值固定为100元代入拟合公式,计算得到的转股溢价率即为“百元转股溢价率”[3][42]。 * **拟合公式**: $$y_{i}=\alpha_{0}+\,\alpha_{1}\cdot\,{\frac{1}{x_{i}}}+\epsilon_{i}$$ [43] 其中,$y_i$为第i只转债的转股溢价率,$x_i$为第i只转债的转股价值[42]。 2. **指标名称**:修正YTM – 信用债YTM中位数 * **指标构建思路**:针对偏债型转债,剥离其转股条款对到期收益率(YTM)的影响,使其能与同期限信用债的YTM进行直接比较,以衡量偏债型转债相对于信用债的配置价值[4] * **指标具体构建过程**: 1. **计算修正YTM**:对每只偏债型转债,使用Black-Scholes模型计算其转股概率$N(d_2)$[44]。然后,根据以下公式计算修正YTM[44]: $$修正 YTM = 转债 YTM × (1 – 转股概率) + 预期转股的到期年化收益率 × 转股概率$$ [44] 2. **计算差值**:计算每只偏债型转债的修正YTM与同等级、同期限的企业债(信用债)YTM之差$X_i$[44]。 3. **取中位数**:计算截面上所有偏债型转债$X_i$值的中位数,得到“修正YTM – 信用债YTM中位数”[4][44]。 $$“修正 YTM – 信用债 YTM”中位数 = median\{X_1, X_2, ... , X_n\}$$ [44]
股指分红点位监控周报:小盘股表现占优,IC主力合约升水-20260226
国信证券· 2026-02-26 09:12
量化模型与构建方式 1. **模型名称:股指分红点位测算模型**[12][42] * **模型构建思路**:为了准确计算股指期货的升贴水,需要剔除指数成分股分红除息对价格指数造成的自然滑落影响,因此构建模型对从当前时刻到期货合约到期日之间指数所包含的分红点数进行预测[12][42]。 * **模型具体构建过程**:模型的核心是预测每只成分股在特定期间内的分红金额和除息日,然后汇总计算对指数点位的总影响[42][43]。 * **总体公式**:假设当前日期为t,期货合约到期日为T,指数有N个成分股,第n个成分股的除息日为τ_n (满足 t < τ_n ≤ T),则期间的分红点数计算公式为: $$分红点数 = \sum_{n=1}^{N} \frac{成分股分红金额}{成分股总市值} \times 成分股权重 \times 指数收盘价$$[42] * **实施流程**:首先获取精确的日度成分股权重[46][47]。然后对每只成分股: * **情况A**:若公司已公布分红金额,则直接采用;若同时公布除息日,则直接采用,否则进入除息日预测流程[43]。 * **情况B**:若公司未公布分红金额,则需预测。分红金额 = 净利润 × 股息支付率[48]。 * **净利润预测**:采用基于历史净利润分布的动态预测法。若公司已公布年报、快报或业绩预告,则直接采用(业绩预告取上下限均值)。若未披露,则根据其历史季度盈利分布的稳定性进行分类预测:对于盈利分布稳定的公司,按历史规律预测;对于不稳定的公司,使用上年同期利润作为预测值[50]。 * **股息支付率预测**: * 若公司去年分红,则以去年股息支付率作为今年预测值[54]。 * 若公司去年不分红,则以最近3年股息支付率平均值作为预测值[54]。 * 若公司过去从未分红,则默认今年不分红[54]。 * 若预测股息支付率>100%,则进行截尾处理[54]。 * **除息日预测**:采用基于历史间隔天数稳定性的线性外推法[52]。 * 若公司已公布除息日,则直接采用[57]。 * 若未公布,则判断公司是否已公布分红预案[57]。 * **未公布预案**:参考去年或前年的分红日期进行估计,并检查合理性(如日期是否在当前时间之前、距离太短或在股东大会之前)。若不合理,则采用默认日期(根据预测时间点,分别设为7月31日、8月31日或9月30日)[57]。 * **已公布预案**:根据公司处于“预案”或“决案”阶段,分别判断其历史“预案公告日到除息日”或“股东大会公告日到除息日”的间隔天数是否稳定。若稳定,则用该历史平均间隔天数与今年对应公告日进行线性外推;若不稳定,则参考历史分红日期判断[57]。 * 若公司过去两年未分红,则采用默认日期[57]。 2. **因子名称:已实现股息率与剩余股息率**[17] * **因子构建思路**:为了衡量指数成分股在当年已经完成的分红和尚未完成但预期会发生的分红情况,分别构建已实现股息率和剩余股息率因子[17]。 * **因子具体构建过程**: * **已实现股息率**:计算指数中本年度已完成现金分红的公司,其分红总额相对于总市值的加权占比。 $$全年已实现股息率 = \sum_{i=1}^{N_1} \frac{个股已分红金额}{个股总市值} \times 个股权重$$[17] 其中,N1表示指数成分股中今年已现金分红的公司数量[17]。 * **剩余股息率**:计算指数中本年度尚未现金分红但预期会分红的公司,其预测分红总额相对于总市值的加权占比。 $$剩余股息率 = \sum_{i=1}^{N_2} \frac{个股预测分红金额}{个股总市值} \times 个股权重$$[17] 其中,N2表示指数成分股中尚未现金分红的公司数量,预测分红金额来自上述股指分红点位测算模型[17]。 3. **因子名称:年化升贴水**[13] * **因子构建思路**:为了衡量股指期货合约价格相对于其标的指数价格(已剔除预期分红影响)的偏离程度,并统一不同期限合约的比较口径,构建年化升贴水因子[13]。 * **因子具体构建过程**: * 首先计算“含分红价差” = 期货合约收盘价 - (指数收盘价 - 预测的次日分红点数)[13]。 * 然后计算升贴水幅度 = 含分红价差 / 指数收盘价[13]。 * 最后将升贴水幅度年化: $$年化升贴水 = \frac{升贴水}{合约到期天数} \times 365$$[13] 模型的回测效果 1. **股指分红点位测算模型** * **预测误差(2024年)**:对上证50和沪深300指数的预测误差基本在5个点左右;对中证500和中证1000指数的预测误差基本在10个点左右[62]。 * **预测误差(2025年)**:对上证50和沪深300指数的预测误差基本在5个点左右;对中证500和中证1000指数的预测误差基本在10个点左右[62]。 * **预测准确性评价**:模型对于上证50、沪深300、中证500及中证1000股指期货合约的股息点预测整体效果较好,具有较好的预测准确性[62]。 因子的回测效果 1. **已实现股息率与剩余股息率因子(截至2026年2月25日)**[3][17] * **上证50指数**:已实现股息率 0.00%,剩余股息率 2.73% * **沪深300指数**:已实现股息率 0.00%,剩余股息率 2.08% * **中证500指数**:已实现股息率 0.00%,剩余股息率 1.11% * **中证1000指数**:已实现股息率 0.00%,剩余股息率 0.87% 2. **年化升贴水因子(截至2026年2月25日主力合约)**[4][13] * **IH主力合约**:年化升水 1.70% * **IF主力合约**:年化贴水 -1.50% * **IC主力合约**:年化升水 0.28% * **IM主力合约**:年化贴水 -3.90% 3. **行业股息率中位数因子(基于已公布分红预案)**[2][15] * **排名前三行业**:银行、煤炭、钢铁。
开源量化评论(122):分钟主动资金流中的选股信息
开源证券· 2026-02-25 22:42
量化模型与因子总结 量化因子与构建方式 基础因子 1. **因子名称:大单分钟主动资金流因子**[2][13][14] * **因子构建思路:** 利用逐笔成交数据,区分主动成交和被动成交,汇总大单的分钟主动买入和卖出金额,构建衡量主动资金净流入强度的因子[2][12][13]。 * **因子具体构建过程:** 1. 对选定股票,取最近20个交易日的1分钟大单主动资金流数据[21]。 2. 计算每1分钟的大单主动净流入方向指标:$$sign(大单主动买入金额 - 大单主动卖出金额)$$,净流入方向为正取1,为负取-1[14][21]。 3. 选择20个交易日所有1分钟的sign指标,计算其均值,得到20日大单分钟主动资金流强度指标S[14][21]。 4. 将指标S在股票截面上对20日涨跌幅进行回归,取其残差作为最终因子[21]。 2. **因子名称:小单分钟主动资金流因子**[2][13][14] * **因子构建思路:** 构建思路与大单因子相同,但资金流数据来源于小单[2][13]。 * **因子具体构建过程:** 同“大单分钟主动资金流因子”,仅将数据源由“大单”替换为“小单”[2][13]。 改进与衍生因子 3. **因子名称:大单分钟主动资金流切割因子**[3][22][25] * **因子构建思路:** 在基础因子的构建过程中,引入切割步骤,仅使用特定市场状态(由切割指标定义,如低涨跌幅时段)下的分钟数据来计算资金流强度,以提取更有效的信息[3][22]。 * **因子具体构建过程:** 1. 对选定股票,取最近20个交易日的1分钟大单主动资金流数据[25]。 2. 计算每1分钟的大单主动净流入方向指标sign[25]。 3. 选择20个交易日所有1分钟的sign指标,按选定的分钟切割指标(如1分钟涨跌幅)排序,选择切割指标较低(或较高)的λ比例(如60%)的交易分钟[22][25]。 4. 计算筛选后分钟数据的sign指标均值,得到切割后的大单分钟主动资金流强度指标S[22][25]。 5. 将指标S在截面上回归20日涨跌幅,残差即为切割因子[22][25]。 * **因子评价:** 采用1分钟涨跌幅作为切割指标,并选择低涨跌幅部分(60%)的分钟数据,构造的因子选股效果显著更优[3][28]。 4. **因子名称:大单分钟主动资金流时段因子**[3][32] * **因子构建思路:** 仅使用日内特定交易时段(如开盘后第1小时)的分钟主动资金流数据来构建因子,以捕捉不同时段资金流信息的差异[3][31]。 * **因子具体构建过程(以第1小时为例):** 1. 对选定股票,取最近20个交易日“第1小时”的1分钟大单主动资金流数据[32]。 2. 计算该时段内每1分钟的大单主动净流入方向指标sign[32]。 3. 选择上述时段的所有1分钟sign指标,计算其均值,得到时段资金流强度指标S[32]。 4. 将指标S在截面上回归20日涨跌幅,残差即为时段因子[33]。 * **因子评价:** 使用第1小时的分钟主动资金流信息构造的因子选股效果整体更优[3][33]。 5. **因子名称:大单分钟主动资金流情景因子**[4][37][39] * **因子构建思路:** 根据市场整体状态(情景指标,如上证指数的符号成交额)筛选出特定的交易时刻,对所有股票在这些相同时刻的主动资金流数据进行汇总构建因子[4][37]。 * **因子具体构建过程(以符号成交额为例):** 1. 对选定股票,取最近20个交易日第1小时的1分钟大单主动资金流数据[39]。 2. 计算该时段内每1分钟的大单主动净流入方向指标sign[39]。 3. 取最近20个交易日第1小时上证指数的1分钟数据,计算符号成交额等情景指标,选出指标较高的50%交易分钟[37][39]。 4. 选择上述筛选出的交易时段对应的个股1分钟sign指标,计算其均值,得到情景资金流强度指标S[39]。 5. 将指标S在截面上回归20日涨跌幅,残差即为情景因子[41]。 * **因子评价:** 采用符号成交额作为情景指标构造的因子选股效果整体更优[4][41]。 合成因子 6. **因子名称:大单资金流合成切割因子**[5][60] * **因子构建思路:** 将“资金流-切割”因子(来自前期报告,未区分主动成交)与“主动资金流-切割”因子进行合成,以结合两类信息[5][55][60]。 7. **因子名称:大单资金流合成时段因子**[5][60] * **因子构建思路:** 将“资金流-时段”因子与“主动资金流-时段”因子进行合成[5][55][60]。 8. **因子名称:大单资金流合成情景因子**[5][60] * **因子构建思路:** 将“资金流-情景”因子与“主动资金流-情景”因子进行合成[5][55][60]。 * **因子评价:** 合成后的因子选股效果较合成前的两类单因子均有提升[5][60]。 其他相关指标/因子 9. **指标名称:主动资金流强度S指标**[14][48] * **构建思路:** 通过计算股票主动净流入方向指标sign的均值来衡量主动资金净流入强度[14][48]。 * **具体构建过程:** $$S = mean(sign(主动买入金额 - 主动卖出金额))$$,其中sign函数在净流入为正时取1,为负时取-1[14]。 * **指标评价:** 与ACT指标相比,S指标构造得到的大单分钟主动资金流因子选股效果更优,是衡量主动资金流强度的更好选择[5][48]。 10. **指标名称:主动资金流强度ACT指标**[48] * **构建思路:** 通过主动买入金额和主动卖出金额的定量比较来计算主动净流入强度[48]。 * **具体构建过程:** $$ACT = \frac{主动买入金额 - 主动卖出金额}{主动买入金额 + 主动卖出金额}$$[48]。 因子的回测效果 (数据区间:2013年4月26日 - 2025年11月28日)[20][31][38] 1. **大单分钟主动资金流因子**,IC均值0.039,rankIC均值0.045,ICIR 2.96,rankICIR 3.10,多空对冲年化收益16.8%,信息比率3.18[16][20]。 2. **小单分钟主动资金流因子**,IC均值-0.009,rankIC均值-0.006,ICIR -0.60,rankICIR -0.39,多空对冲年化收益3.1%,信息比率0.56[16][20]。 3. **大单分钟主动资金流切割因子(1分钟涨跌幅切割)**,IC均值0.040,rankIC均值0.053,ICIR 3.05,rankICIR 3.41,多空对冲年化收益17.2%,信息比率3.34[28][31]。 4. **大单分钟主动资金流切割因子(5分钟涨跌幅切割)**,IC均值0.029,rankIC均值0.035,ICIR 2.61,rankICIR 2.72,多空对冲年化收益11.1%,信息比率2.61[28][31]。 5. **大单分钟主动资金流切割因子(1分钟振幅切割)**,IC均值0.028,rankIC均值0.036,ICIR 2.09,rankICIR 2.29,多空对冲年化收益10.6%,信息比率1.90[28][31]。 6. **大单分钟主动资金流时段因子(前半小时)**,IC均值0.040,rankIC均值0.042,ICIR 3.46,rankICIR 3.22,多空对冲年化收益15.7%,信息比率3.26[33][35]。 7. **大单分钟主动资金流时段因子(第1小时)**,IC均值0.041,rankIC均值0.043,ICIR 3.58,rankICIR 3.23,多空对冲年化收益15.5%,信息比率3.28[33][35]。 8. **大单分钟主动资金流时段因子(第2小时)**,IC均值0.024,rankIC均值0.027,ICIR 2.16,rankICIR 2.41,多空对冲年化收益8.6%,信息比率1.91[33][35]。 9. **大单分钟主动资金流时段因子(第3小时)**,IC均值0.022,rankIC均值0.022,ICIR 1.85,rankICIR 1.81,多空对冲年化收益7.8%,信息比率1.62[33][35]。 10. **大单分钟主动资金流时段因子(第4小时)**,IC均值0.018,rankIC均值0.022,ICIR 1.60,rankICIR 1.82,多空对冲年化收益6.0%,信息比率1.46[33][35]。 11. **大单分钟主动资金流情景因子(振幅)**,IC均值0.036,rankIC均值0.042,ICIR 3.56,rankICIR 3.53,多空对冲年化收益14.8%,信息比率3.63[41][45]。 12. **大单分钟主动资金流情景因子(1分钟涨跌幅)**,IC均值0.037,rankIC均值0.046,ICIR 4.17,rankICIR 4.41,多空对冲年化收益15.5%,信息比率4.22[41][45]。 13. **大单分钟主动资金流情景因子(5分钟涨跌幅)**,IC均值0.038,rankIC均值0.050,ICIR 3.86,rankICIR 4.11,多空对冲年化收益15.7%,信息比率3.92[41][45]。 14. **大单分钟主动资金流情景因子(符号成交额)**,IC均值0.037,rankIC均值0.049,ICIR 4.22,rankICIR 4.42,多空对冲年化收益15.8%,信息比率4.36[41][47]。 15. **大单资金流合成切割因子**,IC均值0.047,rankIC均值0.056,ICIR 3.45,rankICIR 3.60,多空对冲年化收益18.2%,信息比率3.85[5][62]。 16. **大单资金流合成时段因子**,IC均值0.050,rankIC均值0.053,ICIR 4.00,rankICIR 3.83,多空对冲年化收益19.1%,信息比率3.89[5][62]。 17. **大单资金流合成情景因子**,IC均值0.043,rankIC均值0.050,ICIR 4.48,rankICIR 4.54,多空对冲年化收益17.5%,信息比率4.95[5][62]。
基金投资价值分析:一键布局有色全赛道:南方中证申万有色金属ETF投资价值分析
国信证券· 2026-02-25 19:02
量化模型与构建方式 1. **模型名称**:中证申万有色金属指数编制模型[31][32] **模型构建思路**:构建一个能够反映沪深市场有色金属行业上市公司证券整体表现的指数[31] **模型具体构建过程**: * **样本空间**:中证全指指数样本空间中的沪深市场证券[32] * **流动性筛选**:对样本空间内证券按照过去一年的日均成交金额由高到低排名,剔除排名后20%的证券[32] * **行业筛选**:对样本空间内剩余证券,按照申万行业分类,选取有色金属及非金属材料行业的上市公司证券作为待选样本[32] * **市值选样**:将上述待选样本按照过去一年日均总市值由高到低排名,选取排名靠前的50只证券作为指数样本[32] * **调整规则**:指数样本每半年调整一次,样本调整实施时间分别为每年6月和12月的第二个星期五的下一交易日。当指数样本自由流通市值之和/申万有色金属行业自由流通市值之和<70%时,可以增加指数样本数量以提高指数行业代表性[32] 模型的回测效果 1. **中证申万有色金属指数**,2020年收益率36.31%[51],2021年收益率31.31%[51],2022年收益率-21.69%[51],2023年收益率-12.67%[51],2024年收益率2.19%[51],2025年收益率97.48%[51],2026年以来(截至报告日)收益率17.24%[51],过去5年收益91.42%[51],过去1年收益112.18%[51],过去6个月收益98.55%[51],过去3个月收益30.05%[51],过去1个月收益8.12%[51],过去5年年化波动率30.63%[51],过去5年最大回撤-54.27%[51] 量化因子与构建方式 1. **因子名称**:市盈率(PE)[37] **因子构建思路**:衡量指数估值水平 **因子具体构建过程**:指数成分股的总市值之和除以净利润之和。截至2026年2月11日,中证申万有色金属指数的市盈率为30.79,处于历史41.26%分位点[37] 2. **因子名称**:市净率(PB)[37] **因子构建思路**:衡量指数估值水平 **因子具体构建过程**:指数成分股的总市值之和除以净资产之和。截至2026年2月11日,中证申万有色金属指数的市净率为4.33,处于历史较高分位点[37] 3. **因子名称**:净利润增速预测[40] **因子构建思路**:基于Wind一致预期,衡量指数未来盈利增长潜力 **因子具体构建过程**:采用Wind盈利预测数据。中证申万有色金属指数2025E年净利润增速为55.23%,2026E年净利润增速为27.81%[40] 4. **因子名称**:营业收入增速预测[40] **因子构建思路**:基于Wind一致预期,衡量指数未来收入增长潜力 **因子具体构建过程**:采用Wind盈利预测数据。中证申万有色金属指数2025E年营业收入增速为8.61%,2026E年营业收入增速为5.02%[40] 5. **因子名称**:平均市值[43] **因子构建思路**:衡量指数成分股的平均规模 **因子具体构建过程**:计算指数所有成分股总市值的算术平均值。截至2026年2月11日,中证申万有色金属指数的平均市值为1017.31亿元[43] 6. **因子名称**:前十大权重股集中度[46] **因子构建思路**:衡量指数持股的集中程度 **因子具体构建过程**:计算指数前十大权重股的权重占比之和。截至2026年2月11日,中证申万有色金属指数前十大权重股占比合计为47.89%[46] 因子的回测效果 *(本报告未提供上述因子在选股或择时策略中的独立回测绩效指标,如IC、IR、多空收益等。所提供的因子取值均为指数在特定时点的截面数据或预测值。)*