量化研究参考系列之三：高维环境下的最优因子择时

量化模型与构建方式 1. 模型名称：高维环境下的最优因子择时模型[7] * 模型构建思路：将因子择时这一动态调仓问题，转化为对一组固定“择时组合”的静态均值方差优化问题，并通过三层收缩机制控制高维环境下的估计误差和过拟合风险[7][13][14]。 * 模型具体构建过程： 1. 因子与预测信号准备：使用三档因子集合（Fama-French四因子、大盘版因子、Jensen等131因子）和两类预测信号（5个宏观变量、6个因子特有变量，均进行标准化处理）[15][16]。 2. 构造择时组合：对于每个因子 i 和每个预测信号 k，构造一个择时组合，其第 t 月的收益为 $g_{i k,t}\;=\;z_{k,t-1}\;\cdot\;f_{i,t}$ ，其中 $z_{k,t-1}$ 是 t-1 月末标准化的预测信号值， $f_{i,t}$ 是因子 i 在第 t 月的收益[21][22]。常数项信号恒为1，对应的择时组合收益即为因子原始收益[24]。 3. 静态均值方差优化：将所有择时组合的收益视为普通资产收益，估计其均值向量 $\hat{\mu}$ 和协方差矩阵 $\hat{\Sigma}$ ，然后求解最优权重 w 以最大化夏普比率，理论最优解为 $w\ \propto\ \hat{\Sigma}^{-1}\ \hat{\mu}$ [24][25]。 4. 引入三层收缩机制： * 第一层（协方差收缩）：采用 Ledoit-Wolf 方法将样本协方差矩阵向一个稳定的对角矩阵收缩，提升估计稳定性[30]。 * 第二层（权重收缩）：核心收缩机制，通过惩罚项将择时信号的权重向零压缩，修正后的最优权重为 $w\;=\;\left(\widehat{\Sigma}\,+\,\frac{\lambda}{T}\,\cdot\,\left[0_{K},0;\,0,\widehat{D}\right]\right)^{-1}\ \widehat{\mu}$ 。其中 $\lambda$ 是收缩超参数，T 是训练期长度， $\widehat{D}$ 是择时组合（不含原始因子）的方差对角矩阵[30][31]。 * 第三层（因子轮动约束）：将每月计算出的因子配置权重按绝对值归一化，使总绝对敞口恒为1，避免极端杠杆，明确策略为纯粹的因子轮动[28][32]。 5. 还原因子配置：将优化得到的择时组合权重 w 还原为每月对各个因子的实际配置权重。对于因子 i 在 t 月的权重，计算公式为 $h_{i,t}\;=\;\sum_{k}\,w_{i k}\;\cdot\;z_{k,t-1}$ ，或等价于矩阵形式 $h_{t}\;=\;B\;z_{t-1}$ [26][27]。 6. 样本外滚动实施：采用扩展窗口训练和累积式验证集滚动调优收缩参数 $\lambda$ ，严格避免前瞻偏差[34]。模型的回测效果（样本外区间：1986年1月至2022年12月） 1. Fama-French四因子择时模型，样本外夏普比率 0.81，评估比率 0.79，最差12个月收益 -5.62%[46] 2. 大盘版Fama-French因子择时模型，样本外夏普比率 0.56，最差12个月收益 -13.70%[52] 3. Jensen等131因子择时模型（小预测集），样本外夏普比率 1.48，年化双边换手率 2.50，扣费后夏普比率 1.35[55][56][59] 4. Jensen等131因子择时模型（大预测集），样本外夏普比率 1.43，年化双边换手率 2.36，扣费后夏普比率 1.31[55][57][59] 量化因子与构建方式（注：本报告主要介绍择时模型框架，未详细定义新的底层选股因子。报告涉及的因子主要来自经典文献。） 1. 因子集合：Fama-French (2015) 非市场因子[15] * 因子构建思路：基于公司特征构建多空组合，代表不同的风险溢价或异象收益。 * 因子具体构建过程：包括规模（SMB，小市值减大市值）、价值（HML，高账面市值比减低账面市值比）、盈利能力（RMW，高盈利减低盈利）、投资（CMA，保守投资减激进投资）四个因子[15][17]。 2. 因子集合：大盘版因子[15][41] * 因子构建思路：检验择时收益是否依赖于小盘股，仅使用NYSE市值中位数以上的股票构建因子。 * 因子具体构建过程：构建方法与Fama-French因子类似，但股票池限定为大盘股，报告中主要使用了价值、盈利能力和投资三个因子[41][52]。 3. 因子集合：Jensen等 (2023) 因子库[15][24] * 因子构建思路：代表高维大规模因子设定，包含学术界发现的众多异象因子。 * 因子具体构建过程：报告直接引用了Jensen, Kelly and Pedersen (2023) 因子库中的131个因子，未详述每个因子的构建细节[15][24]。因子的回测效果（作为模型输入的原始因子表现） 1. Fama-French四因子（等权组合），夏普比率 0.42[42][46] 2. Fama-French四因子（静态最优组合），夏普比率 0.52[46] 3. 大盘版Fama-French因子（等权组合），夏普比率 0.26[52] 4. 大盘版Fama-French因子（静态最优组合），夏普比率 0.30[52] 5. Jensen等131因子（静态最优组合），夏普比率 1.22[32][55]