Workflow
随机森林模型在REITs基金中的应用
民生证券·2025-08-06 16:45

量化模型与构建方式 1. 模型名称:REITs随机森林模型 - 模型构建思路:通过构建多个决策树并集成其预测结果,筛选未来一周涨跌幅最高的REITs基金进行等权配置[7][15][30] - 模型具体构建过程: 1. 数据准备:样本内训练区间(2021年7月1日至2024年6月30日),样本外测试区间(2024年7月1日至2025年7月18日),覆盖68只未停牌REITs基金[39] 2. 特征处理:每周计算因子暴露度并标准化(z-score),缺失值用前值填充[39] 3. 决策树构建: - 使用信息增益选择最佳特征(如市场情绪、公司财报等),计算公式: H(D)=i=1mpilog2(pi)H(D)=-\sum\nolimits_{i=1}^{m}p_{i}l o g_{2}(p_{i}) H(DDD±D±)=v{D±D}DvDH(Dv)H\left(D|\,\nexists\,\,\nexists_{\mathcal{D}}\,\nexists\,\,\nexists_{\mathcal{D}}^{\pm}\,\nexists_{\mathcal{D}}^{\pm}\right)=\sum_{v\in\left\{\,\nexists\,\,\,\nexists_{\mathcal{D}}^{\pm}\,\setminus\,\mathcal{D}\,\right\}}\frac{|D_{v}|}{|D|}H(D_{v}) G a i n{\big(}D,{\vec{\mp}}^{\mathrm{\scriptsize{\scriptsize{\it~19}}}}{\vec{\gamma}}_{\vec{19}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{24}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{39}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{19}}^{\mathrm{\scriptsize{\it~18}}}{\vec{\gamma}}_{\vec{24}}^{\mathrm{\scriptsize{\it~18}}}\big)} [20][22][24] - 递归划分数据直至叶节点纯度达标[25][27] 4. 随机森林集成: - 通过自助采样(bootstrap sampling)生成子数据集,每棵树随机选择特征子集分裂[30][31] - 参数优化:树数量(n_estimators=100)、最大深度(max_depth=15)、叶节点最小样本数(min_samples_leaf=15)[49][51][58] - 模型评价: - 优点:泛化能力强,可处理高维/缺失数据,提供特征重要性评估[37][66][68] - 缺点:计算成本高,对收益率变化敏感度不足[71] 模型的回测效果 1. REITs随机森林模型: - 年化收益率39.76%,超额收益率40.01%,夏普比率2.82[11] - 样本外测试期(2025年)组合收益率73.81%,超额收益率60.49%,IR 6.12[65] - 样本内拟合指标:MSE=0.00044,RMSE=0.021,R²=0.501[59][61] 量化因子与构建方式 1. 因子筛选标准: - 选取IC绝对值>2.5%的因子,共27个有效因子[44][45] - 关键因子示例: - 正向影响:流通市值(IC=22.02%)、涨跌幅(IC=21.92%)、P/NAV(IC=17.21%)[45] - 负向影响:预期分派率(IC=-23.87%)、开盘价(IC=-10.81%)[45] 因子的回测效果 1. IC显著因子: - 前收盘价(IC=-9.95%)、日波动率(IC=4.14%)、净买入量占比(机构,IC=2.54%)[45] 关键图表引用 - 决策树构造示例(图表2)[28] - 随机森林参数敏感性分析(图表5-7)[50][56][57] - 策略净值与超额收益(图表9-10)[65][67]