量化模型与构建方式 1. 模型名称:高维环境下的最优因子择时模型[7] * 模型构建思路:将因子择时这一动态调仓问题,转化为对一组固定“择时组合”的静态均值方差优化问题,并通过三层收缩机制控制高维环境下的估计误差和过拟合风险[7][13][14]。 * 模型具体构建过程: 1. 因子与预测信号准备:使用三档因子集合(Fama-French四因子、大盘版因子、Jensen等131因子)和两类预测信号(5个宏观变量、6个因子特有变量,均进行标准化处理)[15][16]。 2. 构造择时组合:对于每个因子 i 和每个预测信号 k,构造一个择时组合,其第 t 月的收益为 ,其中 是 t-1 月末标准化的预测信号值, 是因子 i 在第 t 月的收益[21][22]。常数项信号恒为1,对应的择时组合收益即为因子原始收益[24]。 3. 静态均值方差优化:将所有择时组合的收益视为普通资产收益,估计其均值向量 和协方差矩阵 ,然后求解最优权重 w 以最大化夏普比率,理论最优解为 [24][25]。 4. 引入三层收缩机制: * 第一层(协方差收缩):采用 Ledoit-Wolf 方法将样本协方差矩阵向一个稳定的对角矩阵收缩,提升估计稳定性[30]。 * 第二层(权重收缩):核心收缩机制,通过惩罚项将择时信号的权重向零压缩,修正后的最优权重为 。其中 是收缩超参数,T 是训练期长度, 是择时组合(不含原始因子)的方差对角矩阵[30][31]。 * 第三层(因子轮动约束):将每月计算出的因子配置权重按绝对值归一化,使总绝对敞口恒为1,避免极端杠杆,明确策略为纯粹的因子轮动[28][32]。 5. 还原因子配置:将优化得到的择时组合权重 w 还原为每月对各个因子的实际配置权重。对于因子 i 在 t 月的权重,计算公式为 ,或等价于矩阵形式 [26][27]。 6. 样本外滚动实施:采用扩展窗口训练和累积式验证集滚动调优收缩参数 ,严格避免前瞻偏差[34]。 模型的回测效果 (样本外区间:1986年1月至2022年12月) 1. Fama-French四因子择时模型,样本外夏普比率 0.81,评估比率 0.79,最差12个月收益 -5.62%[46] 2. 大盘版Fama-French因子择时模型,样本外夏普比率 0.56,最差12个月收益 -13.70%[52] 3. Jensen等131因子择时模型(小预测集),样本外夏普比率 1.48,年化双边换手率 2.50,扣费后夏普比率 1.35[55][56][59] 4. Jensen等131因子择时模型(大预测集),样本外夏普比率 1.43,年化双边换手率 2.36,扣费后夏普比率 1.31[55][57][59] 量化因子与构建方式 (注:本报告主要介绍择时模型框架,未详细定义新的底层选股因子。报告涉及的因子主要来自经典文献。) 1. 因子集合:Fama-French (2015) 非市场因子[15] * 因子构建思路:基于公司特征构建多空组合,代表不同的风险溢价或异象收益。 * 因子具体构建过程:包括规模(SMB,小市值减大市值)、价值(HML,高账面市值比减低账面市值比)、盈利能力(RMW,高盈利减低盈利)、投资(CMA,保守投资减激进投资)四个因子[15][17]。 2. 因子集合:大盘版因子[15][41] * 因子构建思路:检验择时收益是否依赖于小盘股,仅使用NYSE市值中位数以上的股票构建因子。 * 因子具体构建过程:构建方法与Fama-French因子类似,但股票池限定为大盘股,报告中主要使用了价值、盈利能力和投资三个因子[41][52]。 3. 因子集合:Jensen等 (2023) 因子库[15][24] * 因子构建思路:代表高维大规模因子设定,包含学术界发现的众多异象因子。 * 因子具体构建过程:报告直接引用了Jensen, Kelly and Pedersen (2023) 因子库中的131个因子,未详述每个因子的构建细节[15][24]。 因子的回测效果 (作为模型输入的原始因子表现) 1. Fama-French四因子(等权组合),夏普比率 0.42[42][46] 2. Fama-French四因子(静态最优组合),夏普比率 0.52[46] 3. 大盘版Fama-French因子(等权组合),夏普比率 0.26[52] 4. 大盘版Fama-French因子(静态最优组合),夏普比率 0.30[52] 5. Jensen等131因子(静态最优组合),夏普比率 1.22[32][55]
量化研究参考系列之三:高维环境下的最优因子择时