随机森林模型

搜索文档
“风起云涌”风格轮动系列研究(一):从微观出发的风格轮动—找到风格切换的领先特征
东吴证券· 2025-08-20 20:31
核心观点 - 报告构建了基于微观多因子的风格择时+轮动模型,通过80个微观特征和随机森林算法对估值、市值、动量、波动率四种风格进行择时和打分,最终形成月频风格轮动策略 [1][6][7][25] - 策略在2014-2025年回测期间年化收益率达20.90%,超额基准13.53%,信息比率0.80,月度胜率61.15%,最大回撤-40.57% [1][57] - 模型创新性地采用宽基指数替代全A股票池构建风格标签,解决了传统方法样本过大、风格划分极端等问题 [17][18][19][20] 模型构建 - **底层特征**:选取80个微观特征,分为量价(20个)、基本面(21个)、一致预期(39个)三大类,包括ROIC、PE、STR等代表性因子 [7][8][9] - **标签构造**:通过小盘-大盘、高估值-低估值等指数差值计算风格收益,替代传统十分组方法 [18][20][22] - **算法选择**:采用随机森林模型,默认参数减少过拟合风险,滚动24期数据预测下一期风格方向 [23][24] 风格择时表现 - **估值因子**:择后年化收益提升至15.19%(原7.90%),信息比率0.60(原0.27),最大回撤改善至-42.03% [30][31][34] - **市值因子**:择后年化收益11.72%(原4.36%),超额基准4.98%,胜率提升至57.86% [36][38] - **动量因子**:择后年化收益15.73%(原10.11%),信息比率0.63,最大回撤-35.34% [42][43][47] - **波动率因子**:择后年化收益13.83%(原10.93%),超额信息比率0.59,胜率58.57% [48][51][53] 合成因子表现 - **等权合成**:年化收益20.05%,信息比率0.78,超额基准12.67%,最大回撤-41.97% [52][54][55] - **加权合成**:根据预测准确度动态调整权重,最终策略年化收益20.90%,超额13.53%,信息比率1.05 [56][57][59] - **样本外表现**:2024年收益率55.36%(超额35.72%),2025年至今收益率4.63% [1][60]
随机森林模型在REITs基金中的应用
民生证券· 2025-08-06 16:45
量化模型与构建方式 1. **模型名称**:REITs随机森林模型 - **模型构建思路**:通过构建多个决策树并集成其预测结果,筛选未来一周涨跌幅最高的REITs基金进行等权配置[7][15][30] - **模型具体构建过程**: 1. **数据准备**:样本内训练区间(2021年7月1日至2024年6月30日),样本外测试区间(2024年7月1日至2025年7月18日),覆盖68只未停牌REITs基金[39] 2. **特征处理**:每周计算因子暴露度并标准化(z-score),缺失值用前值填充[39] 3. **决策树构建**: - 使用信息增益选择最佳特征(如市场情绪、公司财报等),计算公式: $$H(D)=-\sum\nolimits_{i=1}^{m}p_{i}l o g_{2}(p_{i})$$ $$H\left(D|\,\nexists\,\,\nexists_{\mathcal{D}}\,\nexists\,\,\nexists_{\mathcal{D}}^{\pm}\,\nexists_{\mathcal{D}}^{\pm}\right)=\sum_{v\in\left\{\,\nexists\,\,\,\nexists_{\mathcal{D}}^{\pm}\,\setminus\,\mathcal{D}\,\right\}}\frac{|D_{v}|}{|D|}H(D_{v})$$ $$G a i n{\big(}D,{\vec{\mp}}^{\mathrm{\scriptsize{\scriptsize{\it~19}}}}{\vec{\gamma}}_{\vec{19}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{24}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{39}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{19}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{24}}^{\mathrm{\scriptsize{\it~18}}}\big)}$$ [20][22][24] - 递归划分数据直至叶节点纯度达标[25][27] 4. **随机森林集成**: - 通过自助采样(bootstrap sampling)生成子数据集,每棵树随机选择特征子集分裂[30][31] - 参数优化:树数量(n_estimators=100)、最大深度(max_depth=15)、叶节点最小样本数(min_samples_leaf=15)[49][51][58] - **模型评价**: - 优点:泛化能力强,可处理高维/缺失数据,提供特征重要性评估[37][66][68] - 缺点:计算成本高,对收益率变化敏感度不足[71] 模型的回测效果 1. **REITs随机森林模型**: - 年化收益率39.76%,超额收益率40.01%,夏普比率2.82[11] - 样本外测试期(2025年)组合收益率73.81%,超额收益率60.49%,IR 6.12[65] - 样本内拟合指标:MSE=0.00044,RMSE=0.021,R²=0.501[59][61] 量化因子与构建方式 1. **因子筛选标准**: - 选取IC绝对值>2.5%的因子,共27个有效因子[44][45] - 关键因子示例: - 正向影响:流通市值(IC=22.02%)、涨跌幅(IC=21.92%)、P/NAV(IC=17.21%)[45] - 负向影响:预期分派率(IC=-23.87%)、开盘价(IC=-10.81%)[45] 因子的回测效果 1. **IC显著因子**: - 前收盘价(IC=-9.95%)、日波动率(IC=4.14%)、净买入量占比(机构,IC=2.54%)[45] 关键图表引用 - 决策树构造示例(图表2)[28] - 随机森林参数敏感性分析(图表5-7)[50][56][57] - 策略净值与超额收益(图表9-10)[65][67]
从微观出发的风格轮动月度跟踪-20250801
东吴证券· 2025-08-01 11:34
量化模型与构建方式 1. **模型名称**:基于微观的风格轮动模型 - **模型构建思路**:从基础风格因子(估值、市值、波动率、动量)出发,通过80个底层微观因子构造640个微观特征,并利用常用指数作为风格股票池替代传统因子划分,生成风格收益标签。通过随机森林模型进行风格择时与打分,最终形成月频轮动策略[9][4] - **模型具体构建过程**: 1. **特征构造**:80个底层因子(如估值、动量等)衍生出640个微观特征,通过标准化和滚动窗口处理[9] 2. **标签生成**:以指数(如ESG 300、央视50等)代表风格收益,替代传统因子分位数划分[9][21] 3. **模型训练**:滚动训练随机森林模型,优选特征并输出风格推荐得分,结合择时信号生成最终持仓[9][4] - **模型评价**:有效规避过拟合,兼顾风格择时与评分,但依赖历史数据且需结合风控管理[9][4] 模型的回测效果 1. **基于微观的风格轮动模型**(2017/01-2025/07): - 年化收益率:16.66% - 年化波动率:19.57% - 信息比率(IR):0.85 - 月度胜率:56.31% - 对冲基准年化收益率:11.40% - 对冲基准最大回撤:9.73%[10][11] 量化因子与构建方式 1. **因子名称**:估值因子 - **因子构建思路**:从个股层面提取估值类指标(如PE、PB等),标准化后加权合成[9] 2. **因子名称**:市值因子 - **因子构建思路**:基于个股流通市值构造,区分大/小市值风格[9][18] 3. **因子名称**:动量因子 - **因子构建思路**:计算个股过去N个月收益率,区分正/负动量[9][18] 4. **因子名称**:波动率因子 - **因子构建思路**:通过历史波动率或换手率指标衡量个股波动特征[9][18] 因子的回测效果 1. **2025年风格因子多空对冲收益**: - 动量因子:区间收益-6.00%至4.00%(2025/1-2025/5) - 波动率因子:区间收益-4.00%至6.00% - 估值因子:区间收益-2.00%至8.00% - 市值因子:区间收益0.00%至6.00%[13][20] 2. **近一年风格因子权重**: - 市值因子:占比约40% - 估值因子:占比约30% - 动量因子:占比约20% - 波动率因子:占比约10%[24]