量化专题报告总结 量化模型与构建方式 1. 模型名称:基于XGBoost的因子配置模型[4] 模型构建思路:将量化大势研判框架中的市场环境特征与Barra因子、Alpha因子结合,利用XGBoost模型捕捉非线性关系和条件依赖,以提升因子选股效果[4][82] 模型具体构建过程: * 数据准备:选取A股非新股、非ST、非一字涨停、未停牌的股票[93]。自变量包括10个Barra CNE5因子、85个Alpha因子以及10个市场环境特征[82]。因变量为股票下个月的收益率[89]。 * 数据处理:对因子进行截面zscore标准化,并用3倍标准差进行截尾处理[89]。 * 模型训练与验证:采用滚动窗口(后改为扩展窗口)训练[89][110]。初始设置为使用5年数据(前4年训练,后1年验证),预测未来1年,从2019年滚动至2025年[89]。损失函数为MSE,并设置早停机制(连续10轮验证集损失无改善即停止)[89]。 * 关键改进:发现XGBoost难以自动学习市场环境特征与Alpha因子之间的条件依赖关系后,显式构造了交互因子[105]。具体方法为:将10个市场环境特征分别与85个Alpha因子相乘,生成850个一阶交互因子[106]。随后进行筛选,仅保留在训练集和验证集上ICIR显著高于对应原始Alpha因子的交互因子,以控制维度[106]。 * 最终方案:模型最终采用扩展窗口训练,并输入Barra因子、市场环境特征、Alpha因子以及筛选后的显式交互因子[110]。 2. 模型名称:国联民生金工量化大势研判框架(行业配置策略)[70] 模型构建思路:基于产业周期与资产特征的系统性映射定义风格资产,根据市场风险偏好对风格优先级进行分层判断,用于行业配置[70][72] 模型具体构建过程:框架定义了五类风格资产:预期成长(gf)、实际成长(g)、盈利能力(ROE)、高股息(D)、破净/并购(B/P)[70]。在市场风险偏好存在 g > ROE > D > BP 的基本假设下,对市场风格的优先级进行分层判断[72]。核心是构建五个市场环境特征指标[78]: * Δgf(预期成长边际变化):中信细分行业分析师预期增速(fttm)排序后等分五组,取Top组中位数与Bottom组中位数的差值,经平滑后再进行差分[78]。 * Δg(实际成长边际变化):中信细分行业财报实际利润增速(ttm)排序后等分五组,取Top组中位数与Bottom组中位数的差值,经平滑后再进行差分[78]。 * ΔROE(盈利能力边际变化):中信细分行业ROE(ttm)排序后等分五组,取Top组中位数平滑后差分[81]。 * Crowd_ROE(ROE资产拥挤度):中信细分行业ROE(ttm)排序后等分五组,计算Top组的Beta因子暴露水平[81]。 * Crowd_DP(红利资产拥挤度):中信细分行业股息率排序后等分五组,计算Top组近1月成交量/近3月成交量的因子暴露水平[81]。 模型的回测效果 1. 基于XGBoost的因子配置模型(最终版),样本外测试期(2019-2025年)[110]: * IC均值:0.08[110] * ICIR:0.66[110] * RankIC均值:0.11[110] * RankICIR:0.88[110] * IC>0占比:71.43%[110] * G10(多头)年化收益率:28.36%[110] 2. 国联民生金工量化大势研判框架(行业配置策略),历史回测期(2009年以来)[72]: * 年化收益:27.81%[72] 量化因子与构建方式 1. 因子类别:市场环境特征(10个)[82] 因子构建思路:部分源自量化大势研判框架,用于刻画市场整体风格与状态,作为因子择时的条件变量[78][82] 因子具体构建过程: * Δgf, Δg, ΔROE, Crowd_ROE, Crowd_DP:构建方法同上述大势研判框架[78][81]。 * Market_vol20:万得全A指数20日波动率[85]。 * Market_vol60:万得全A指数60日波动率[85]。 * Position_52w:万得全A指数价格处于过去52周的分位水平[85]。 * Market_mom:万得全A指数价格3个月动量[85]。 * Market_amt:万得全A指数成交量200日均线的趋势差分[85]。 2. 因子类别:Barra CNE5因子(10个)[82] 因子构建思路:采用经典的Barra风险模型因子,作为模型的基础输入[82] 3. 因子类别:Alpha因子(85个)[82] 因子构建思路:涵盖价格、情绪、成长、质量、价值、动量等多个维度的月频选股因子[83] 因子具体构建过程:报告列出了85个因子的名称和类型,例如价格类的clo_5d_60d、return_std_1m,情绪类的ivol、turnover_mean_1m,成长类的roe_q_report、yoy_eps_q,质量类的roe_q_adv、sp_adj,价值类的bp、ep_fttm,动量类的mom_1y、reverse_1m等[83]。具体计算方式未在报告中详细说明。 4. 因子类别:显式交互因子(最多850个,经筛选后保留)[106] 因子构建思路:为了捕捉市场环境特征对Alpha因子有效性的条件影响,显式构造两者的一阶交互项[105][106] 因子具体构建过程:将10个市场环境特征分别与85个Alpha因子逐元素相乘,生成850个交互因子[106]。公式可表示为: 其中,i 取1到10,j 取1到85[106]。随后进行筛选,仅保留那些在训练集和验证集上ICIR显著高于对应原始Alpha因子的交互因子[106]。 因子的回测效果 注:报告未提供单个因子的独立测试结果,仅提供了整合所有因子后的模型整体表现。
VibeCoding:打造一人量化团队
国联民生证券·2026-03-20 13:34