Workflow
市场环境因子跟踪周报(2026.04.10):外部局势缓和,A股反弹修复-20260416
华宝证券· 2026-04-16 21:14
量化模型与因子总结 量化因子与构建方式 股票市场因子 1. **因子名称**:大小盘风格[10] * **因子构建思路**:衡量市场整体在市值维度上的风格偏向,即市场资金是更偏好大盘股还是小盘股[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式,仅通过定性分析判断风格偏向。根据上下文,通常基于不同市值指数(如沪深300与中证1000)的相对表现或市值因子收益率来度量[10]。 2. **因子名称**:价值成长风格[10] * **因子构建思路**:衡量市场整体在估值与成长性维度上的风格偏向,即市场资金是更偏好价值股还是成长股[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式,仅通过定性分析判断风格偏向。通常基于价值因子(如BP、EP)与成长因子(如营收增长率、净利润增长率)的相对表现来度量[10]。 3. **因子名称**:大小盘风格波动[10] * **因子构建思路**:衡量市值风格(大小盘)的波动剧烈程度,反映风格切换的频繁度与不确定性[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常可计算市值风格因子收益率在特定窗口期(如20日或60日)的标准差或平均绝对偏差[10]。 4. **因子名称**:价值成长风格波动[10] * **因子构建思路**:衡量价值成长风格的波动剧烈程度,反映风格切换的频繁度与不确定性[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常可计算价值成长风格因子收益率在特定窗口期(如20日或60日)的标准差或平均绝对偏差[10]。 5. **因子名称**:行业指数超额收益离散度[10] * **因子构建思路**:衡量不同行业指数相对于市场基准的超额收益的分散程度,用于刻画市场行业结构的集中度或分化程度[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常计算各一级行业指数日度或周度超额收益(相对于全市场指数)在截面上的标准差或分位数差(如极差)[10]。 6. **因子名称**:行业轮动度量[10] * **因子构建思路**:衡量行业排名或领涨行业变化的快慢速度,用于判断市场热点是否具有持续性[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。常见构建方法包括计算相邻两期行业收益率排名的斯皮尔曼秩相关系数,或计算领涨行业(如前3名)的留存率[10]。 7. **因子名称**:成分股上涨比例[10] * **因子构建思路**:衡量市场整体的赚钱效应广度,即上涨股票数量占全体股票数量的比例[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常针对特定宽基指数(如上证指数、沪深300、中证500、中证1000等),计算其成分股中当日或当周收益率为正的股票数量占总成分股数量的比例[10]。 8. **因子名称**:指数波动率[10] * **因子构建思路**:衡量市场整体的价格波动风险水平[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常基于市场主要指数(如沪深300、万得全A)的日收益率序列,计算特定窗口期(如20日或60日)的年化波动率[10]。 9. **因子名称**:指数换手率[10] * **因子构建思路**:衡量市场整体的交易活跃度和流动性水平[10]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常计算全市场或主要指数的日均成交金额与流通市值的比值[10]。 商品市场因子 1. **因子名称**:趋势强度[19][23] * **因子构建思路**:衡量商品期货价格趋势的明确性和持续性,用于判断市场处于趋势行情还是震荡行情[19][23]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常可基于南华商品指数或其各板块指数,计算其价格与移动平均线的距离,或使用如ADX(平均趋向指数)等技术指标[19][23]。 2. **因子名称**:基差动量[19][23] * **因子构建思路**:衡量商品期货期限结构(近月合约与远月合约价差)的变化方向和速度,反映市场对未来供需预期的变化[19][23]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常计算主力合约与次主力合约的价差(基差)在一段时间内的变化率[19][23]。 3. **因子名称**:市场波动水平[19][23] * **因子构建思路**:衡量商品期货市场整体的价格波动风险[19][23]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常基于南华商品指数或其各板块指数的日收益率序列,计算特定窗口期的年化波动率[19][23]。 4. **因子名称**:市场流动性[19][23] * **因子构建思路**:衡量商品期货市场的交易活跃度和资金参与深度[19][23]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常使用成交量、持仓量或其变化率作为代理指标[19][23]。 可转债市场因子 1. **因子名称**:百元转股溢价率[22] * **因子构建思路**:衡量可转债市场整体的估值水平,即转债价格相对于其转股价值的溢价程度[22]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常计算市场中所有可转债的转股溢价率的中位数或平均值。单个转债的转股溢价率计算公式为:$$转股溢价率 = (转债价格 / 转股价值 - 1) \times 100\%$$ 其中,转股价值 = (正股价格 / 转股价格) \times 100[22]。 2. **因子名称**:纯债溢价率(按平价底价溢价率分组)[22] * **因子构建思路**:针对偏债型可转债,衡量其价格相对于纯债价值的溢价程度,反映其债性部分的估值和信用风险溢价[22]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常将转债按平价底价溢价率(或转股溢价率)分组,计算各组内转债的纯债溢价率。单个转债的纯债溢价率计算公式为:$$纯债溢价率 = (转债价格 / 纯债价值 - 1) \times 100\%$$ 其中,纯债价值为将转债视为普通债券,用相同信用等级的企业债到期收益率对其未来现金流进行折现所得的价值[22]。 3. **因子名称**:低转股溢价率转债占比[22] * **因子构建思路**:衡量市场中股性较强、进攻性较强的转债标的比例,反映市场对正股上涨预期的强弱[22]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常设定一个转股溢价率阈值(如20%或30%),统计转股溢价率低于该阈值的转债数量占全市场转债总数的比例[22]。 4. **因子名称**:可转债市场成交额[22] * **因子构建思路**:衡量可转债市场的交易活跃度和流动性水平[22]。 * **因子具体构建过程**:报告未提供具体的计算方法和公式。通常统计全市场可转债的日成交总金额[22]。 因子的回测效果 > **注意**:本报告为市场环境跟踪周报,主要展示各因子在特定报告期(2026.04.06-2026.04.10)的观察值和定性状态,并未提供基于长期历史数据的标准化回测指标(如IC、IR、多空收益、夏普比率等)。以下为报告期内各因子的具体表现描述。 股票市场因子表现(截至2026.04.10) 1. **大小盘风格因子**:风格偏向小盘[10]。 2. **价值成长风格因子**:风格偏向成长[10]。 3. **大小盘风格波动因子**:波动水平较高[10]。 4. **价值成长风格波动因子**:波动水平下降[10]。 5. **行业指数超额收益离散度因子**:离散度维持在极高水平,行业间收益差距较大[10]。 6. **行业轮动度量因子**:轮动速度继续下降,优势行业延续性较好[10]。 7. **成分股上涨比例因子**:各宽基指数中上涨股票占比较低[10]。 8. **指数波动率因子**:市场波动率上升至较高水平[10]。 9. **指数换手率因子**:市场换手率水平整体维持稳定[10]。 商品市场因子表现(截至2026.04.10) 1. **趋势强度因子**: * 黑色板块:趋势强度反弹上升[19][23]。 * 能化板块:趋势强度回落[19][23]。 * 农产品板块:趋势强度回落[19][23]。 * 金属板块:趋势强度仍在低位[19]。 2. **基差动量因子**: * 贵金属板块:基差动量上升[19][23]。 * 有色板块:基差动量上升[19][23]。 * 其他板块(黑色、能化、农产品):基差动量呈下降趋势[19][23]。 3. **市场波动水平因子**: * 黑色板块:波动率大幅上升[19][23]。 * 其他板块(能化、农产品、金属):波动率变化较小,基本持平[19][23]。 4. **市场流动性因子**: * 农产品板块:流动性上升[19][23]。 * 其他板块(黑色、能化、金属):流动性均有所走低[19][23]。 可转债市场因子表现(截至2026.04.10) 1. **百元转股溢价率因子**:企稳后开始上升[22]。 2. **纯债溢价率因子**:偏债型转债的纯债溢价率同步上涨[22]。 3. **低转股溢价率转债占比因子**:占比并未回落[22]。 4. **可转债市场成交额因子**:重新站上中位数水平[22]。
全球多资产跟踪月报2026.04:跨资产相关性上升,资配产品业绩分化-20260416
招商证券· 2026-04-16 19:15
量化模型与因子总结 量化模型与构建方式 1. **模型名称:风险平价/风险预算模型**[51] * **模型构建思路:** 以风险因子作为配置基础,通过调整各类资产权重,使组合中各类资产的风险贡献相等或按预设预算分配,以实现更优的风险分散[51]。 * **模型具体构建过程:** 报告提及的量化型产品(如Fidelity Risk Parity Fund和Invesco Balanced-Risk Allocation Fund)使用基于风险因子的风险平价框架[51]。具体构建过程未详细描述,但通常包括以下步骤:首先定义核心风险因子(如增长、通胀、利率、流动性或增长、防御、实际收益)[51];其次,选择与这些因子相关的资产类别(如股票、债券、商品及其衍生品)作为投资标的[51];然后,通过优化算法计算各资产权重,使得每个风险因子对投资组合整体风险的贡献度达到均衡(风险平价)或符合预设比例(风险预算)[51]。 2. **模型名称:多因子宏观/基本面量化框架**[50] * **模型构建思路:** 结合宏观、基本面和另类数据,通过量化模型生成资产配置信号,为投资决策提供基础框架[50]。 * **模型具体构建过程:** 报告提及的混合型策略产品(如Blackrock Tactical Opportunities Fund和PIMCO的产品)使用此类框架[50]。构建过程包括:数据收集,涵盖传统的宏观数据(GDP、通胀、就业)、资产基本面数据(债券到期收益率、信用风险、股票盈利增长、估值)以及另类数据(气候变化、央行会议纪要等)[50];使用自然语言处理等技术将非结构化数据转换为量化信号[50];搭建多因子模型,综合各类信号形成对资产类别的观点,并据此确定基础配置权重[50]。 3. **模型名称:Covered Call(备兑看涨期权)策略**[49] * **模型构建思路:** 通过持有股票现货并同时卖出该股票的看涨期权,在获得股票潜在上涨收益(部分)的同时,赚取权利金收入,旨在增强组合收益或降低波动[49]。 * **模型具体构建过程:** 报告提及生息策略产品会使用此策略[49]。具体构建过程为:投资组合持有某公司的股票现货[49];同时,卖出以该公司股票为标的、特定行权价和到期日的看涨期权合约[49];组合通过权利金获得额外收入,但牺牲了股票价格超过行权价部分的潜在收益[49]。 模型的回测效果 *注:报告未提供统一口径下各量化模型独立的回测指标(如年化收益、波动率、夏普比率、最大回撤等)。所提供的业绩数据均为应用了不同模型或策略的具体基金产品的表现,而非模型本身在历史数据上的测试结果。* 量化因子与构建方式 1. **因子名称:宏观风险因子**[51] * **因子构建思路:** 识别并量化驱动资产价格变动的核心宏观经济风险源,作为风险平价等模型进行资产配置的基础[51]。 * **因子具体构建过程:** 报告提及了两种因子集合:Fidelity使用的增长、通胀、利率、流动性因子[51];Invesco使用的增长、防御、实际收益因子[51]。具体构建方法未详细说明,通常这类因子可通过主成分分析从一系列宏观经济时间序列中提取,或直接使用市场公认的代理指标(如工业产出增速代表增长,CPI同比代表通胀,国债收益率代表利率等)来构建[51]。 2. **因子名称:基本面因子**[50] * **因子构建思路:** 基于资产自身的基本面信息(如估值、盈利、质量等)构建指标,用于评估资产的内在价值与投资吸引力[50]。 * **因子具体构建过程:** 报告提到PIMCO的框架中会引入资产类别的基本面指标,例如股票的盈利增长、估值水平,债券的到期收益率、信用风险等[50]。这些通常是标准化后的财务或市场指标,例如市盈率(P/E)、市净率(P/B)、盈利增长率、股息率、信用利差等[50]。 因子的回测效果 *注:报告未提供上述量化因子在选股或资产配置中的独立测试结果(如IC值、IR、多空组合收益等)。*
因子选股系列之一一八:DFQ-TimesNet:捕捉量价特征周期规律,提升股票收益预测效果
东方证券· 2026-04-16 17:41
量化模型与构建方式 1. **模型名称**:DFQ-TimesNet [2][4] **模型构建思路**:针对A股量价时序存在的显著多周期结构,基于TimesNet二维时序建模框架,将一维量价序列转为二维结构以解耦周期内波动与跨周期关联,从而提升周期特征捕捉能力和收益率预测的稳定性[3][4][20]。 **模型具体构建过程**:模型主要分为三个模块[34]。 * **输入特征嵌入模块**:将原始输入序列 `[batch, seq_len, C_in]` 映射到统一的高维特征表示空间 `[B, T, d_model]`。经实证测试,仅使用TokenEmbedding(采用核大小为3的1D卷积沿时间轴滑动)效果最优,不使用位置编码和时间戳编码[37][38][39]。 * **时序特征提取模块(TimesBlock)**:这是模型的核心,具体流程如下[39][41]: 1. **周期发现**:放弃不稳定的FFT自动周期识别方法,采用人为确定的5日(短周期,对应交易周)和60日(长周期,对应季度)双周期设定[42][44][46]。 2. **序列重塑**:对每个选定周期 `period`,将输入 `[batch, seq_len, d_model]` 填充至长度 `pad_len`(满足 `pad_len % period = 0`),然后重塑为 `[batch, num_period, period, d_model]`,其中 `num_period = pad_len / period`。最后将维度交换为 `[batch, d_model, num_period, period]` 以适配后续2D卷积[50]。 3. **Inception卷积**:对重塑后的二维张量,采用两层串联的Inception模块进行特征提取。每层模块并行使用多个不同大小的2D卷积核(如1x1, 3x3, 5x5等),以同时捕捉不同尺度的周期特征。第一层将通道数由 `d_model` 提升至 `d_ff`,经GELU激活后,第二层将通道数映射回 `d_model`,输出维度仍为 `[batch, d_model, num_period, period]`[51][53][54]。 4. **融合输出**:将每个周期经Inception处理后的输出 `[batch, d_model, num_period, period]` 置换并展开回 `[batch, seq_len, d_model]`。将不同周期的输出合并后 `[batch, seq_len, d_model, K]`(K为周期个数),采用直接平均的方式融合,得到 `[batch, seq_len, d_model]`。最后,将该输出与TimesBlock的原始输入相加,构成残差连接[56][58][59]。 * **预测输出模块**:从TimesBlock的最终输出 `[batch, seq_len, d_model]` 中,选取最后一个时间步得到 `[batch, d_model]`,再通过一个全连接层 `nn.Linear(d_model, c_out)` 投影到预测目标维度 `c_out`,得到最终预测值 `[batch, c_out]`[36][60][61]。 **模型评价**:该模型通过二维多周期建模有效挖掘A股量价周期规律,具备强周期感知能力,且规避了Transformer的计算瓶颈,更适配长时序量价数据[4][8][64][65]。 模型的回测效果 (注:以下所有模型测试结果均基于中证全指股票池,测试区间为2020.01.01-2025.08.29,预测标签为未来20日收益率[88]。指标“信息比率”的英文是IR。) 1. **DFQ-TimesNet模型**,IC 12.50%,IC_IR 1.24,rankIC 14.51%,rankIC_IR 1.33,多头月度胜率 77.94%,多头日超额收益夏普比 3.07,多头日超额年化收益 30.05%,多头日超额收益最大回撤 -7.09%,多头月均单边换手率 77.49%[89][90]。 量化因子与构建方式 1. **因子名称**:TimesNet因子 [88] **因子的构建思路**:将DFQ-TimesNet模型对个股未来收益的预测值作为选股因子[88]。 **因子具体构建过程**:使用经过最优配置训练的DFQ-TimesNet模型进行推断。模型输入为经过处理的60个基础量价特征序列,输出即为每个样本(股票)的预测收益率,该值被用作因子得分[71][72][88]。具体数据处理和模型配置如下: * **样本空间**:中证全指同期成分股[67]。 * **数据区间**:训练集(2014-2018)、验证集(2019)、测试集(2020-2025.6.30),数据集间设有隔离间隙[67]。 * **解释变量X处理**:按每日截面做Z-score标准化 + clip(-3,3),用0填充缺失值[68]。 * **预测标签Y**:个股未来20日收益率,按每日截面做Z-score标准化[68][73]。 * **输入特征**:60个基础量价特征(包括原始日线行情、基于分钟线和level2数据提取的日频特征)[71]。 * **关键超参**:序列长度 `seq_len=60`,隐藏层大小 `hidden_size=128`,周期 `periods=[5,60]`,TimesBlock层数 `e_layers=1`,Inception中间通道数 `hidden_size2=128`等[76]。 因子的回测效果 (注:以下因子测试结果涵盖多个股票池,测试区间为2020.01.01-2025.08.29[88]。不同股票池的分组数不同:中证全指20组,沪深300和中证500为5组,中证1000为10组[88]。) 1. **TimesNet因子(中证全指股票池)**,IC 12.50%,IC_IR 1.24,rankIC 14.51%,rankIC_IR 1.33,多头月度胜率 77.94%,多头日超额收益夏普比 3.07,多头日超额年化收益 30.05%,多头日超额收益最大回撤 -7.09%,多头月均单边换手率 77.49%[89][90]。 2. **TimesNet因子(沪深300股票池)**,IC 6.23%,IC_IR 0.72,rankIC 7.69%,rankIC_IR 0.81,多头月度胜率 70.59%,多头日超额收益夏普比 1.70,多头日超额年化收益 9.10%,多头日超额收益最大回撤 -7.31%,多头月均单边换手率 68.10%[29]。 3. **TimesNet因子(中证500股票池)**,IC 9.13%,IC_IR 1.10,rankIC 10.70%,rankIC_IR 1.18,多头月度胜率 77.94%,多头日超额收益夏普比 2.42,多头日超额年化收益 18.47%,多头日超额收益最大回撤 -6.30%,多头月均单边换手率 74.70%[32]。 4. **TimesNet因子(中证1000股票池)**,IC 11.71%,IC_IR 1.40,rankIC 13.68%,rankIC_IR 1.50,多头月度胜率 83.82%,多头日超额收益夏普比 2.99,多头日超额年化收益 25.63%,多头日超额收益最大回撤 -5.37%,多头月均单边换手率 77.49%[35]。
学海拾珠系列之二百七十一:基于时间序列推理的金融技术分析
华安证券· 2026-04-16 16:58
量化模型与构建方式 1. 模型名称:语言化技术分析 (VTA) - **模型构建思路**:为了解决LLM在金融时间序列预测中可解释性与精度难以兼顾的问题,提出一个融合语言推理与时间序列预测的框架[4][19]。该框架旨在将股价历史数据转换为可解释的语言推理链,并以此条件化调节预测输出,实现准确且可解释的股票预测[4][19]。 - **模型具体构建过程**:VTA框架包含三个核心组件[4][25]: 1. **时间序列推理模块**:将股价时间序列数据通过文本标注器转换为包含统计信息和金融技术指标的文本描述[30]。使用提出的Time-GRPO方法训练LLM,使其基于这些文本标注生成语言推理链[19][30]。Time-GRPO的训练目标结合了格式奖励和基于预测精度的逆MSE奖励[32]。训练流水线分为三个阶段:冷启动RL微调、基于拒绝采样的监督微调(SFT)、以及为技术分析任务优化的RL微调[33]。 2. **时间序列预测模块**:采用基于LLM的骨干模型进行跨模态对齐[35]。具体过程为:将时间序列输入X通过嵌入层和多头注意力层,获得投影时间token $F_{time}$[35]。对LLM的词嵌入进行PCA降维获得主要词嵌入 $\hat{E}_{text}$[35]。将 $F_{time}$ 和 $\hat{E}_{text}$ 通过多头交叉注意力层进行对齐,得到对齐后的文本token $X_{text}$,计算公式为: $$X_{t e x t}=\,S o f t m a x(\,Q K^{\mathsf{T}}\,/\,\sqrt{C}\,)\,V,$$ 其中 $Q = F_{time}W_Q$, $K = \hat{E}_{text}W_K$, $V = \hat{E}_{text}W_V$[35]。$F_{time}$ 和 $X_{text}$ 被送入连续的Transformer模块,并通过特征正则化损失 $\mathcal{L}_{feature}$ 和输出匹配损失 $\mathcal{L}_{output}$ 来引导模态对齐[35]。 3. **联合条件训练模块**:以推理模型输出的描述性属性类别c(如最大值、最小值、均值)为条件,对时间序列预测模型的输出进行调节[38]。模型同时训练条件预测和无条件预测,损失函数为: $${\mathcal{L}}_{\mathrm{forecast}}(\phi)=\mathbb{E}\mathbf{x},\mathbf{y},\mathbf{c}\left[\left\|{\hat{\mathbf{y}}}_{\psi}(\mathbf{X},{\bar{\mathbf{c}}})-\mathbf{y}\right\|^{2}\right],$$ 其中 $\tilde{\bf c}$ 以概率 $p_{uncond}$ 被替换为无条件标识符[38]。最终预测为条件预测与无条件预测的加权组合: $${\hat{\mathbf{y}}}=s\cdot{\hat{\mathbf{y}}}_{\psi}(\mathbf{X},\mathbf{c})+(1-s)\cdot{\hat{\mathbf{y}}}_{\theta}(\mathbf{X})$$ 其中s为引导尺度超参数[38]。 - **模型评价**:VTA框架成功地将语言推理与时间序列预测有效结合,在保持预测精度的同时提供了可解释性[5][47]。其多阶段微调流水线和联合条件训练设计被证明对提升性能至关重要[48]。 2. 模型/方法名称:Time-GRPO - **构建思路**:为优化LLM在时间序列推理任务中的表现,在分组相对策略优化(GRPO)的基础上进行改进,提出专门用于时间序列推理的强化学习训练目标Time-GRPO[19][30]。其目的是教会LLM生成能够提高时间序列预测精度的语言推理链[32]。 - **具体构建过程**:Time-GRPO的训练目标结合了两种奖励[32]: 1. **格式奖励**:强制模型在生成推理链时使用特定的标签(如`<think>`和`</think>`)来包裹思考过程[32]。 2. **逆MSE奖励**:旨在最大化时间序列预测的期望精度,奖励函数定义为: $$R(\hat{y}) = 1 / ( \lambda \cdot ||\hat{y} - y||_2^2 )$$ 其中 $\lambda$ 是超参数,$\hat{y}$ 是模型预测的时间序列,$y$ 是真实值。使用逆MSE是因为奖励分数需要被最大化[32]。 模型通过多阶段强化学习流水线(冷启动RL、SFT、任务优化RL)使用该目标进行优化[33]。 3. 因子/指标名称:技术分析指标(用于文本标注) - **构建思路**:为了给LLM提供可解释的金融信号作为推理依据,从股价数据中提取经典的技术分析指标,并将其转化为文本描述[30][31]。这些指标是金融从业者广泛使用的分析工具,蕴含了预测信号[17]。 - **具体构建过程**:通过文本标注函数f,将时间序列输入X转换为包含以下指标的文本标注 $X'$[30]。报告中列举了部分指标及其计算公式[31]: - **简单移动平均(SMA)**:$$SMA = (1/n) \Sigma Price_i$$ - **指数移动平均(EMA)**:$$EMA_t = Price_t \cdot \alpha + EMA_{t-1} \cdot (1-\alpha)$$ - **动量(Momentum)**:$$Momentum = Close_t - Close_{t-n}$$ - **相对强弱指数(RSI)**:$$RSI = 100 - 100/ (1+AvgGain/AvgLoss)$$ - **MACD线**:$$MACD = EMA_{12} - EMA_{26}$$ - **威廉指标(%R)**:$$Williams \%R = (HH-Close) / (HH-LL) \times (-100)$$ - **布林带(Bollinger Bands)**:上轨=$MA+k\cdot\sigma$、下轨=$MA-k\cdot\sigma$ - **随机振荡指标(Stochastic Oscillator)**:$$\%K = (Close-LL) / (HH-LL) \times 100$$ - **因子评价**:这些指标为LLM提供了结构化的、可解释的金融领域先验知识,是模型能够进行高质量语言推理的基础[31][57]。消融实验表明,移除这些指标会导致预测性能下降,证明了其有效性[52][53]。 模型的回测效果 1. VTA模型 - **预测精度指标 (All Data 平均值)**:MSE为0.1178,MAE为0.2122[47]。 - **投资组合指标 (各数据集平均值)**:年化收益率为0.2409,波动率为0.1185,最大回撤为-0.0883,夏普比率(IR)为1.7190[70]。 2. 基准模型(部分列举) 以下为报告中部分表现较好的基准模型在“All Data”上的平均预测精度及投资组合夏普比率[47][70]: - **CALF**:MSE为0.1235,MAE为0.2180;夏普比率为1.4566[47][70]。 - **TimeLLM**:MSE为0.1262,MAE为0.2210;夏普比率为1.5230[47][70]。 - **TimesNet**:MSE为0.1286,MAE为0.2229;夏普比率为1.2748[47][70]。 - **Autoformer**:MSE为0.1290,MAE为0.2297;夏普比率为1.4736[47][70]。 - **Non-stationary Transformer**:MSE为0.1380,MAE为0.2300;夏普比率为1.4430[47][70]。 - **FiLM**:MSE为0.1449,MAE为0.2385;夏普比率为1.4421[47][70]。 - **DeepSeek-R1**:MSE为0.1428,MAE为0.2323;夏普比率为1.4074[47][70]。 - **GPT-4.1 mini**:MSE为0.2014,MAE为0.2376;夏普比率为1.3096[47][70]。 因子的回测效果 (注:报告未提供单个技术分析因子独立的选股或预测能力测试结果,因子作为整体被用于VTA模型的文本标注输入,其效果体现在VTA模型的整体性能提升中[30][47][53]。)
融资融券周报:主要指数全部上涨,两融余额大幅上升-20260416
渤海证券· 2026-04-16 16:48
量化模型与构建方式 本报告为融资融券周报,主要描述市场数据、行业及标的券的融资融券特征,并未涉及用于预测或选股的量化模型或量化因子的构建、测试与评价。报告内容集中于对历史交易数据的统计与展示[1][9][12][28][29][32][35][42][48][49][52]。 量化因子与构建方式 报告未构建或测试任何用于量化投资的因子。文中提及的指标均为对市场融资融券交易行为的直接统计描述,并非用于预测未来收益的阿尔法因子。 模型的回测效果 报告未涉及任何量化模型的回测。 因子的回测效果 报告未涉及任何量化因子的回测。
股指分红点位监控周报:4月合约临近到期,各主力合约均小幅贴水-20260415
国信证券· 2026-04-15 23:02
量化模型与构建方式 1. **模型名称:股指分红点位测算模型**[12][40][42] * **模型构建思路**:为了准确计算股指期货的升贴水,必须剔除指数成分股分红除息对价格指数造成的自然滑落影响,因此构建模型来预测从当前时刻到期货合约到期日之间,指数成分股分红所导致的点位下降总和[12][40][42]。 * **模型具体构建过程**:模型的核心是计算在特定时间窗口内,所有成分股分红对指数点位的总影响。具体流程如下[42][43][45]: 1. **确定计算范围**:设当前日期为 `t`,股指期货合约到期日为 `T`。对于指数中第 `n` 只成分股,其除权除息日为 `d_n`。只有当 `t < d_n ≤ T` 时,该股票的分红才被计入[42]。 2. **计算单只股票的分红影响点数**:对于满足条件的成分股,其分红导致的指数点位下降计算公式为: $$分红点数 = \sum_{n=1}^{N} [\frac{成分股分红金额}{成分股总市值} \times 成分股权重 \times 指数收盘价]$$ 其中,`N` 为指数成分股数量[42]。 3. **数据获取与预测**:计算上述公式需要四个核心数据:成分股权重、成分股分红金额、成分股总市值、指数收盘价[47]。总市值和指数收盘价可直接获取,而成分股权重和分红金额(尤其是对于尚未公布具体方案的公司)需要进行精细化估计[47]。 * **成分股权重**:采用中证指数公司每日披露的日度收盘权重数据,以确保权重准确性,避免使用月末权重估算带来的偏差[48][49]。 * **分红金额预测**:若公司已公布分红金额,则直接采用;若未公布,则需预测。分红金额可分解为 **净利润 × 股息支付率**,因此预测转化为对这两个指标的预测[50]。 * **净利润预测**:采用基于历史净利润分布的动态预测法[52]。若公司已公布年报、快报或业绩预告,则直接采用(业绩预告取上下限均值);若未公布,则根据公司历史季度盈利分布的稳定性进行分类预测:对于盈利分布稳定的公司,按历史规律预测;对于不稳定的公司,使用上年同期利润作为预测值[52]。 * **股息支付率预测**:采用历史股息率代替[53]。具体规则为:若公司去年分红,则用去年股息支付率;若去年不分红,则用最近3年平均股息支付率;若从未分红,则默认今年不分红;当预测值大于100%时进行截尾处理[56]。 * **除息日预测**:采用基于历史间隔天数稳定性的线性外推法[54][59]。 * 若公司已公布除息日,则直接采用。 * 若未公布,则根据公司是否已公布分红预案、所处阶段(预案/决案)以及历史分红日期间隔的稳定性,选择使用历史日期或基于公告日进行线性外推。 * 若无可靠历史日期或预测日期不合理,则根据大多数公司分红集中在7月底前的规律,设置一个默认日期(如7月31日、8月31日或9月30日)作为预测除息日[59]。 2. **因子名称:已实现股息率与剩余股息率**[3][17] * **因子构建思路**:为了监控指数成分股分红的实施进度,将全年股息率拆分为已实现部分和待实现部分,分别反映已分红和待分红股票对指数股息率的贡献[17]。 * **因子具体构建过程**: 1. **已实现股息率**:计算本年度内**已完成现金分红**的成分股,其分红总额相对于其总市值的加权占比[17]。 $$已实现股息率 = \sum_{i=1}^{N_1} [\frac{个股已分红金额}{个股总市值} \times 个股权重]$$ 其中,`N1` 表示指数中今年已现金分红的公司数量[17]。 2. **剩余股息率**:计算本年度内**尚未进行现金分红**的成分股,其**预计**分红总额相对于其总市值的加权占比[17]。 $$剩余股息率 = \sum_{i=1}^{N_2} [\frac{个股待分红金额}{个股总市值} \times 个股权重]$$ 其中,`N2` 表示指数中尚未现金分红的公司数量,`个股待分红金额` 使用预测值(参见分红点位测算模型)[17]。 3. **因子名称:行业股息率中位数**[2][15] * **因子构建思路**:为了横向比较不同行业的分红吸引力,统计行业内已公布分红预案股票的股息率中位数[15]。 * **因子具体构建过程**:对于每个行业,筛选出当前已披露分红预案的个股,计算每只个股的预案股息率(预案分红金额 / 当前总市值),然后取该行业所有股票股息率的中位数[15]。 模型的回测效果 * **股指分红点位测算模型**:模型在2024年和2025年对主要股指的全年分红点位预测误差基本稳定。对于上证50和沪深300指数,预测误差基本在5个指数点左右;对于中证500和中证1000指数,预测误差稍大,基本稳定在10个指数点左右[64]。对于股指期货合约(从当前至到期日)的分红点位预测,模型对各合约也具有较好的预测准确性[64]。 因子的回测效果 * **已实现股息率与剩余股息率因子**(截至2026年4月15日数据)[3]: * **上证50指数**:已实现股息率 0.00%,剩余股息率 2.43% * **沪深300指数**:已实现股息率 0.01%,剩余股息率 1.93% * **中证500指数**:已实现股息率 0.01%,剩余股息率 1.12% * **中证1000指数**:已实现股息率 0.00%,剩余股息率 0.89% * **行业股息率中位数因子**(基于已公布分红预案的股票统计):煤炭、银行和钢铁行业的股息率排名前三[2][15]。
金融工程日报:沪指震荡微涨,创新药概念爆发-20260415
国信证券· 2026-04-15 21:12
量化模型与构建方式 1. **模型名称**:封板率计算模型[16] **模型构建思路**:通过计算当日最高价涨停且收盘涨停的股票数量与最高价涨停股票总数的比例,来衡量市场涨停板的封板质量[16] **模型具体构建过程**: 首先筛选上市满3个月以上的股票,然后识别出在当日交易中最高价达到涨停价的股票,最后计算这些股票中收盘价也维持在涨停价的比例[16] 具体公式为: $$封板率=最高价涨停且收盘涨停的股票数/最高价涨停的股票数$$[16] 2. **模型名称**:连板率计算模型[16] **模型构建思路**:通过计算连续两日收盘涨停的股票数量占前一日收盘涨停股票总数的比例,来衡量市场涨停股的持续性和赚钱效应[16] **模型具体构建过程**: 首先筛选上市满3个月以上的股票,然后识别出前一日收盘涨停的股票,最后计算这些股票中在当日收盘也涨停的比例[16] 具体公式为: $$连板率=连续两日收盘涨停的股票数/昨日收盘涨停的股票数$$[16] 3. **模型名称**:大宗交易折价率计算模型[25] **模型构建思路**:通过比较大宗交易成交金额与按当日市价计算的市值,来衡量大额交易相对于市场价格的折价或溢价水平,反映大资金的投资偏好和情绪[25] **模型具体构建过程**: 首先获取当日大宗交易的总成交金额和成交份额,然后计算这些成交份额按当日市场价格计算的总市值,最后计算折价率[25] 具体公式为: $$折价率=大宗交易总成交金额/当日成交份额的总市值-1$$[25] 4. **模型名称**:股指期货年化贴水率计算模型[27] **模型构建思路**:通过计算股指期货价格与现货指数价格之间的基差,并将其年化,以标准化衡量不同合约的期货升贴水程度,反映市场对未来预期和套利成本[27] **模型具体构建过程**: 首先计算基差(股指期货价格 - 现货指数价格),然后除以现货指数价格得到相对基差,再根据合约剩余交易日数进行年化处理[27] 具体公式为: $$年化贴水率=基差/指数价格*(250/合约剩余交易日数)$$[27] 量化因子与构建方式 1. **因子名称**:两融余额占比因子[21] **因子构建思路**:通过计算融资融券余额占市场总流通市值的比重,来反映杠杆资金在市场中的整体规模和参与度[21] **因子具体构建过程**:使用截至统计日的两融余额数据,除以市场总流通市值[21] 2. **因子名称**:两融交易占比因子[21] **因子构建思路**:通过计算融资买入额与融券卖出额之和占市场总成交额的比例,来反映杠杆交易的活跃程度和市场情绪[21] **因子具体构建过程**:使用统计日内的融资买入额与融券卖出额之和,除以市场总成交额[21] 3. **因子名称**:ETF折溢价因子[23] **因子构建思路**:通过计算ETF场内交易价格与其IOPV(基金份额参考净值)或场外净值的差异,来捕捉市场短期情绪和套利机会[23] **因子具体构建过程**:筛选日成交额超过100万的境内交易股票型ETF,计算其交易价格与IOPV(或净值)的百分比差异[23] 4. **因子名称**:机构调研热度因子[29] **因子构建思路**:通过统计近7天内对上市公司进行调研的机构数量,来反映机构投资者对特定公司的关注度[29] **因子具体构建过程**:汇总近一周内(7天)对某家上市公司进行调研或参加其分析师会议的机构总数[29] 5. **因子名称**:龙虎榜机构净流入因子[35] **因子构建思路**:通过统计龙虎榜上“机构专用”席位对某只股票的净买入金额,来捕捉机构资金对个股的短期态度和动向[35] **因子具体构建过程**:从龙虎榜数据中提取“机构专用”席位对特定股票的买入总额与卖出总额,计算其差额(净买入额)[35] 6. **因子名称**:龙虎榜陆股通净流入因子[36] **因子构建思路**:通过统计龙虎榜上“陆股通”席位对某只股票的净买入金额,来反映北向资金对A股个股的短期交易偏好[36] **因子具体构建过程**:从龙虎榜数据中提取“陆股通”席位对特定股票的买入总额与卖出总额,计算其差额(净买入额)[36] 模型的回测效果 1. **封板率计算模型**,2026年4月15日封板率值为69%[16] 2. **连板率计算模型**,2026年4月15日连板率值为22%[16] 3. **大宗交易折价率计算模型**,近半年平均折价率值为7.14%,2026年4月14日折价率值为6.82%[25] 4. **股指期货年化贴水率计算模型**,近一年中位数年化贴水率值:上证50为1.39%,沪深300为4.85%,中证500为10.84%,中证1000为13.28%[27]。2026年4月15日年化贴水率值:上证50为5.15%(分位点24%),沪深300为7.28%(分位点36%),中证500为9.89%(分位点58%),中证1000为14.13%(分位点42%)[27] 因子的回测效果 1. **两融余额占比因子**,截至2026年4月14日,两融余额占流通市值比重值为2.6%[21] 2. **两融交易占比因子**,截至2026年4月14日,两融交易占市场成交额比重值为10.3%[21] 3. **ETF折溢价因子**,2026年4月14日,溢价最高的大湾区ETF平安溢价值为0.94%,折价最高的国证2000ETF博时折价值为0.89%[23] 4. **机构调研热度因子**,近一周内,调研机构数量最多的晶盛机电,机构调研数量值为179家[29] 5. **龙虎榜机构净流入/流出因子**,2026年4月15日,机构专用席位净流入前十与净流出前十的股票名单已列出[35] 6. **龙虎榜陆股通净流入/流出因子**,2026年4月15日,陆股通席位净流入前十与净流出前十的股票名单已列出[36]
金融工程日报:沪指重返4000点,创业板指涨超2%创逾4年新高-20260415
国信证券· 2026-04-15 10:26
量化模型与构建方式 1. **模型名称**:封板率模型[16] **模型构建思路**:通过计算当日最高价涨停且收盘涨停的股票数量与最高价涨停股票总数的比例,来衡量市场涨停板的封板强度[16] **模型具体构建过程**: 1. 筛选上市满3个月以上的股票[16] 2. 识别在当日盘中最高价达到涨停的股票[16] 3. 从这些股票中,进一步识别收盘价也涨停的股票[16] 4. 计算封板率,公式为: $$封板率=最高价涨停且收盘涨停的股票数/最高价涨停的股票数$$[16] 2. **模型名称**:连板率模型[16] **模型构建思路**:通过计算连续两日收盘涨停的股票数量与昨日收盘涨停股票总数的比例,来衡量市场涨停板的连续性[16] **模型具体构建过程**: 1. 筛选上市满3个月以上的股票[16] 2. 识别昨日收盘涨停的股票[16] 3. 从这些股票中,进一步识别今日收盘也涨停的股票[16] 4. 计算连板率,公式为: $$连板率=连续两日收盘涨停的股票数/昨日收盘涨停的股票数$$[16] 3. **模型名称**:大宗交易折价率模型[25] **模型构建思路**:通过计算大宗交易成交金额与当日成交份额总市值的比例来反映大资金交易的折价情况,以观察大资金的投资偏好和市场情绪[25] **模型具体构建过程**: 1. 获取当日大宗交易的总成交金额[25] 2. 计算当日大宗交易成交份额按市场价格计算的总市值[25] 3. 计算折价率,公式为: $$折价率=大宗交易总成交金额/当日成交份额的总市值-1$$[25] 4. **模型名称**:股指期货年化贴水率模型[27] **模型构建思路**:通过计算股指期货主力合约价格与现货指数价格之差(基差)的年化值,来衡量市场对未来走势的预期和股指对冲的成本[27] **模型具体构建过程**: 1. 计算基差:基差 = 股指期货价格 - 现货指数价格[27] 2. 计算年化贴水率,公式为: $$年化贴水率=基差/指数价格*(250/合约剩余交易日数)$$[27] 模型的回测效果 1. 封板率模型,2026年4月14日封板率值为73%[16] 2. 封板率模型,2026年4月14日封板率较前日变化为下降7%[16] 3. 连板率模型,2026年4月14日连板率值为21%[16] 4. 连板率模型,2026年4月14日连板率较前日变化为下降6%[16] 5. 大宗交易折价率模型,近半年以来平均折价率值为7.15%[25] 6. 大宗交易折价率模型,2026年4月13日折价率值为3.49%[25] 7. 股指期货年化贴水率模型,近一年以来上证50股指期货主力合约年化贴水率中位数为1.39%[27] 8. 股指期货年化贴水率模型,近一年以来沪深300股指期货主力合约年化贴水率中位数为4.85%[27] 9. 股指期货年化贴水率模型,近一年以来中证500股指期货主力合约年化贴水率中位数为10.86%[27] 10. 股指期货年化贴水率模型,近一年以来中证1000股指期货主力合约年化贴水率中位数为13.28%[27] 11. 股指期货年化贴水率模型,2026年4月14日上证50股指期货主力合约年化贴水率值为4.90%[27] 12. 股指期货年化贴水率模型,2026年4月14日上证50股指期货主力合约年化贴水率近一年分位点为26%[27] 13. 股指期货年化贴水率模型,2026年4月14日沪深300股指期货主力合约年化贴水率值为7.29%[27] 14. 股指期货年化贴水率模型,2026年4月14日沪深300股指期货主力合约年化贴水率近一年分位点为36%[27] 15. 股指期货年化贴水率模型,2026年4月14日中证500股指期货主力合约年化贴水率值为10.31%[27] 16. 股指期货年化贴水率模型,2026年4月14日中证500股指期货主力合约年化贴水率近一年分位点为56%[27] 17. 股指期货年化贴水率模型,2026年4月14日中证1000股指期货主力合约年化贴水率值为15.81%[27] 18. 股指期货年化贴水率模型,2026年4月14日中证1000股指期货主力合约年化贴水率近一年分位点为32%[27]
ETF投资者画像更新,机构投资者偏好有何变化?
长江证券· 2026-04-15 07:44
量化模型与构建方式 1. **模型/因子名称**:穿透修正后的机构投资者持有比例模型[8][17] * **构建思路**:为了更准确地反映ETF中机构投资者的实际持仓占比,避免因联接基金中个人投资者的存在而导致机构持有比例被高估,需要对ETF年报公布的原始机构投资者持有比例进行算法修正[8][17]。 * **具体构建过程**:该模型通过穿透联接基金的底层数据,从ETF公布的机构投资者持有份额中,剔除掉联接基金所持份额中属于个人投资者的部分。具体修正公式如下: $$修正后的机构投资者持有份额占比 = ETF公布的机构投资者持有份额占比 - 联接基金持有份额占比 × (1 - 联接基金中机构投资者持有比例)$$ 其中,“ETF公布的机构投资者持有份额占比”为原始数据,“联接基金持有份额占比”为联接基金持有该ETF的份额比例,“联接基金中机构投资者持有比例”为联接基金自身的机构投资者持有比例[8][17]。 2. **模型/因子名称**:ETF机构投资者精细化分类体系[25][27] * **构建思路**:为了更精准地把握不同类型机构的投资偏好与市场行为,基于ETF基金半年报披露的前十大持有人信息,构建一个多层次的机构投资者分类体系,以创建精细化的投资者画像[25]。 * **具体构建过程**:该分类体系通过对前十大持有人信息进行梳理分析,将机构投资者划分为多个层级[25]。 1. **一级分类**:首先,在联接基金之外,将机构持有人分为国资机构、保险机构、公募机构、外资机构、证券机构等共14个一级类别[25]。 2. **二级与三级分类**:在此基础上,根据账户类型、归属地和资金属性等维度进一步下沉,设置了19个二级分类和39个三级分类,以实现更精细的刻画[25][27]。例如,保险机构一级分类下,二级分类包括保险和保险资管;保险二级分类下,三级分类可细分为保险公司、保险集团、财产险、寿险等[27]。 模型的回测效果 *本报告为描述性统计分析报告,未提供模型或因子在历史数据上的量化回测绩效指标(如年化收益率、夏普比率、信息比率IR、最大回撤等)。报告主要通过统计图表展示了各类机构投资者的持仓占比及其历史变化趋势[7][8][17][28][30][32][34]。* 量化因子与构建方式 *本报告未涉及用于预测资产价格或收益的传统量化因子(如价值、动量、质量等因子)的构建。报告核心内容是投资者结构分析,而非因子模型。* 因子的回测效果 *本报告未涉及量化因子的回测效果。*
基金经理研究系列:华商基金伍文友,立足景气发现价值,行业比较个股精选
太平洋证券· 2026-04-14 23:20
量化模型与构建方式 **注:** 该研报为对主动管理型基金经理的定性及业绩分析报告,未涉及具体的量化模型或量化因子的构建、测试与评价。报告内容主要围绕基金经理的投资框架、历史业绩、仓位、行业配置、风格轮动、集中度等定性及描述性统计分析展开[1][11][14][15][19][23][32][37][40][45][46]。 量化因子与构建方式 **注:** 该研报未涉及任何量化因子的构建、测试与评价。 模型的回测效果 **注:** 该研报未涉及量化模型,因此无模型回测效果数据。 因子的回测效果 **注:** 该研报未涉及量化因子,因此无因子回测效果数据。