Workflow
金工ETF点评:跨境ETF单日净流入66.57亿元,医药拥挤持续满位,钢铁建材高位
太平洋证券· 2025-07-31 21:13
根据研报内容,以下是量化模型与因子的详细总结: --- 量化模型与构建方式 1. **模型名称:行业拥挤度监测模型** - **模型构建思路**:通过监测申万一级行业指数的拥挤度,识别行业过热或过冷状态[4] - **模型具体构建过程**: 1. 计算行业指数的滚动历史分位数(如30日窗口) 2. 结合主力资金流动数据(净流入/流出)辅助判断 3. 输出拥挤度排名及变动方向(如医药、钢铁、建材拥挤度靠前,汽车、家电较低)[4][14] - **模型评价**:能够动态捕捉行业资金博弈状态,但对极端市场事件的适应性未明确说明 2. **模型名称:溢价率 Z-score 模型** - **模型构建思路**:通过滚动计算ETF溢价率的Z-score,筛选存在套利机会的标的[5] - **模型具体构建过程**: 1. 计算标的ETF的溢价率:$$ \text{溢价率} = \frac{\text{ETF市价} - \text{净值}}{\text{净值}} \times 100\% $$ 2. 滚动计算溢价率的均值(μ)和标准差(σ) 3. 标准化为Z-score:$$ Z = \frac{\text{当前溢价率} - μ}{σ} $$ 4. 设定阈值触发关注信号(如Z-score超过±2)[5][15] - **模型评价**:依赖历史统计规律,需警惕市场流动性不足导致的模型失效 --- 模型的回测效果 1. **行业拥挤度监测模型**: - 拥挤度高位行业:医药、钢铁、建材(具体数值未披露)[4] - 拥挤度低位行业:汽车、家电(具体数值未披露)[4] - 主力资金流向验证:计算机、电子、电力设备持续流出,银行增配[14] 2. **溢价率 Z-score 模型**: - 触发关注信号标的:智能消费ETF(515920)、生物科技ETF(516500)等[15] - 未披露IR或胜率等指标 --- 量化因子与构建方式 1. **因子名称:主力资金净流动因子** - **因子构建思路**:通过主力资金净流入/流出金额衡量行业或ETF的资金动向[4][14] - **因子具体构建过程**: 1. 按日统计申万行业或ETF的主力资金净额(买入-卖出) 2. 滚动计算3日/5日累计净流动(如近3日银行净流入10.96亿元)[14] - **因子评价**:高频数据敏感性高,但易受短期噪音干扰 --- 因子的回测效果 1. **主力资金净流动因子**: - 近3日净流入TOP1行业:银行(+10.96亿元)[14] - 近3日净流出TOP1行业:计算机(-188.00亿元)[14] --- 注:报告中未涉及复合模型或衍生因子,测试结果的指标口径(如年化收益率、IR)未明确披露[4][5][14][15]
金融工程定期:资产配置月报(2025年8月)-20250731
开源证券· 2025-07-31 20:43
根据研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **高频宏观因子模型** - 构建思路:通过资产组合模拟构建高频宏观因子体系,观察市场交易的宏观预期变化[12] - 具体构建过程: 1. 对利率、汇率、信用等因子直接通过相关指数多空组合构建 2. 对高频经济增长和通胀因子: - 合成低频宏观指标(如工业增加值同比、CPI同比等) - 筛选领先于低频指标的资产(如恒生指数、CRB金属现货等) - 通过滚动多元回归确定资产权重,构建投资组合模拟宏观因子走势[12][13] - 评价:高频指标对低频宏观数据具有领先性,能有效捕捉市场预期变化[13] 2. **债券久期择时模型** - 构建思路:基于改进的Diebold2006模型预测收益率曲线变化[20] - 具体构建过程: - 水平因子预测:结合宏观变量预判和政策利率跟随 - 斜率/曲率因子预测:采用AR(1)模型 - 映射不同久期债券的预期收益[20] - 评价:能动态捕捉利率曲线形态变化 3. **黄金预期收益模型** - 构建思路:将黄金与TIPS实际回报关联[32] - 具体公式: $$E[Real\_Return^{gold}]=k\times E[Real\_Return^{Tips}]$$ $$E[R^{gold}]=\pi^{e}+k\times E[Real\_Return^{Tips}]$$ 其中k通过扩展窗口OLS估计,π^e取美联储2%通胀目标[32] - 评价:模型对黄金长期趋势有较强解释力 4. **主动风险预算模型** - 构建思路:将风险平价与主动信号结合动态调整股债配置[37][38] - 具体构建过程: 1. 多维度信号生成: - 股债比价(ERP):$$ERP=\frac{1}{PE_{ttm}}-YTM_{TB}^{10Y}$$[39] - 股票估值分位数 - 市场流动性(M2-M1剪刀差)[42] 2. 信号通过softmax函数转化为风险预算权重: $$softmax(x)=\frac{\exp(\lambda x)}{\exp(\lambda x)+\exp(-\lambda x)}$$[47] - 评价:相比传统风险平价模型具有更好的动态适应性 5. **行业轮动3.0模型** - 构建思路:从交易行为、景气度等6维度构建子模型并动态合成[53] - 具体构建过程: - 交易行为模型:捕捉日内动量+隔夜反转效应 - 景气度模型:捕捉盈余动量 - 资金流模型:识别主动抢筹行为 - 其他维度包括筹码结构、宏观驱动、技术分析[53][55] - 评价:多维度合成有效提升行业轮动胜率 量化因子与构建方式 1. **转债估值因子** - 百元转股溢价率:衡量转债与正股相对估值[25] - 修正YTM-信用债YTM:剥离转股条款影响,比较偏债转债与信用债价值[25] 2. **转债风格因子** - 转股溢价率偏离度:识别高估值转债 - 理论价值偏离度:结合定价模型识别定价偏差[27] - 20日动量+波动率偏离度:捕捉市场情绪[27] 3. **基金选基因子** - 高质量因子:基于财务质量指标 - 高成长因子:基于盈利增长指标 - 低估值因子:基于估值分位数[86] 模型回测效果 1. **高频宏观因子** - 高频经济增长因子:7月同比上行[13] - 高频消费通胀因子:7月同比下行[17] - 高频生产通胀因子:7月同比上行[17] 2. **债券久期择时** - 7月策略超额收益32.4bp[21][24] - 近一年超额收益-2.11%[21] 3. **黄金预期模型** - 未来一年预期收益率22.4%[32][33] - 过去一年策略绝对回报39.77%[34][35] 4. **主动风险预算** - 全样本年化收益6.54%,收益波动比1.64[52][54] - 8月股票仓位7.44%,债券仓位92.56%[51] 5. **行业轮动3.0** - 7月多空收益3.07%[61][64] - 动态合成模型中景气度/资金流模型权重较高[67] 6. **转债风格轮动** - 2018-2025年化收益24.54%,IR 1.47[29] - 2025年收益35.17%[29] 7. **ETF轮动组合** - 7月超额收益1.83%[71][74] 8. **FOF组合** - 7月收益5.45%,超额-1.81%[83][84]
大类资产配置模型周报第 34 期:权益资产稳步上涨,资产配置模型7月均录正收益-20250731
国泰海通证券· 2025-07-31 20:38
量化模型与构建方式 1. **模型名称:国内资产BL模型1** - 模型构建思路:BL模型是均值-方差模型的改进,通过贝叶斯理论将主观观点与量化模型结合,优化资产配置权重[14] - 模型具体构建过程: 1) 选择国内资产标的(沪深300、中证1000、国债总财富指数等)[15] 2) 计算资产预期收益与协方差矩阵 3) 结合投资者主观观点调整收益预期 4) 通过优化算法求解最优权重 - 模型评价:有效解决均值-方差模型对预期收益敏感的问题,兼具主观投资的灵活性和量化模型的稳定性[14] 2. **模型名称:全球资产BL模型2** - 模型构建思路:同国内资产BL模型1,但覆盖全球资产(标普500、COMEX黄金等)[15] - 模型具体构建过程: 1) 选择全球资产标的(标普500、企业债指数等)[15] 2) 其余步骤与国内BL模型1一致 3. **模型名称:国内资产风险平价模型** - 模型构建思路:使每类资产对组合风险的贡献相等,穿越经济周期[19] - 模型具体构建过程: 1) 选择8类国内资产(沪深300、中证转债等)[21] 2) 计算资产波动率与相关性矩阵 3) 优化权重使各资产风险贡献均衡 公式: $$ w_i = \frac{1/\sigma_i}{\sum_{j=1}^n 1/\sigma_j} $$ 其中$\sigma_i$为资产i的年化波动率[20] 4. **模型名称:基于宏观因子的资产配置模型** - 模型构建思路:通过增长、通胀等6大宏观因子构建配置框架[23] - 模型具体构建过程: 1) 构造宏观因子Mimicking Portfolio[24] 2) 计算资产因子暴露水平 3) 结合主观宏观判断调整因子暴露目标 4) 反解得到资产配置权重[24] 模型的回测效果 1. **国内资产BL模型1** - 上周收益:0.02% - 7月收益:0.61% - 2025年收益:2.46% - 年化波动:2.16% - 最大回撤:1.31%[17][18] 2. **全球资产BL模型2** - 上周收益:-0.07% - 7月收益:0.51% - 2025年收益:1.59% - 年化波动:1.70% - 最大回撤:1.28%[17][18] 3. **国内资产风险平价模型** - 上周收益:-0.02% - 7月收益:0.36% - 2025年收益:2.70% - 年化波动:1.46% - 最大回撤:0.76%[22][29] 4. **基于宏观因子的资产配置模型** - 上周收益:-0.03% - 7月收益:0.38% - 2025年收益:2.76% - 年化波动:1.36% - 最大回撤:0.64%[28][29] 当前持仓分布(2025年7月) - **国内资产BL模型1**:中证1000(10.51%)、国债(65.14%)、企业债(19.13%)、商品(5.22%)[13] - **全球资产风险平价模型**:标普500(1.54%)、企业债(93.11%)、黄金(2.13%)[13]
DeepTiming:日内信息与相似度学习驱动择时
民生证券· 2025-07-31 17:02
量化模型与构建方式 1. **模型名称:民生金工深度学习股票收益预测模型** - **模型构建思路**:基于民生金工历史研究框架,结合日频和分钟频输入数据,通过深度学习预测股票收益,并利用滚动阈值生成交易信号[1][10]。 - **模型具体构建过程**: 1. **输入端**: - 日频特征:51个技术面/情绪面日频特征 + 7个日频基础量价指标 + 10个强化风格因子(通过PPO强化学习生成)[12][22]。 - 分钟频特征:52个分钟频特征(合成至日频)[22]。 2. **基分类器**: - 使用2个GRU分别对日频和分钟频特征解码[22]。 3. **市场信息嵌入**: - 指数量价数据 + 强化风格偏好生成权重嵌入[22]。 4. **损失函数**: - 多期股票收益作为预测目标,多期MSE均值作为损失函数: $$ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$ 其中,\( y_i \)为实际收益,\( \hat{y}_i \)为预测收益[22][26]。 5. **信号生成**: - 预测值滚动阈值:过去一年预测值的70%分位数作为买入信号,30%分位数作为卖出信号,至少持有10个交易日[30]。 - **模型评价**:模型信号分布集中于0轴附近,右偏且尾部极窄,适合波段择时[27][29]。 2. **模型名称:SimStock股票相似度模型** - **模型构建思路**:通过自监督学习预测股票相似度,结合静态(行业/风格)和动态(量价规律)相关性,生成股票属性向量[47][52]。 - **模型具体构建过程**: 1. **输入数据**: - 个股过去40日量价数据 + Barra风格因子 + 资金流指标(形状为\( N \times 40 \times 20 \))[52]。 2. **样本构建**: - 正样本:\( X_{\text{正}} = 0.75X + 0.25X_{\text{随机}} \) - 负样本:随机抽取不相关特征[52]。 3. **训练目标**: - 最大化正样本相似度,最小化负样本相似度,使用余弦相似度衡量: $$ \text{相似度} = \frac{\mathbf{v}_i \cdot \mathbf{v}_j}{\|\mathbf{v}_i\| \|\mathbf{v}_j\|} $$ 其中,\( \mathbf{v}_i \)为股票属性向量[52][53]。 4. **输出**:个股属性向量用于初始化GRU隐状态,提升收益预测稳定性[57][59]。 - **模型评价**:相似度预测更关注行业而非市值,动态性更强[56]。 3. **复合模型:改进后的收益预测模型** - **构建思路**:将SimStock输出的股票属性向量初始化GRU隐状态,结合原有日频和分钟频输入[57][59]。 - **评价**:改进后模型显著提升预测稳定性,尤其在高波行业中效果突出[60][64]。 --- 模型的回测效果 1. **民生金工深度学习模型**: - 全A股平均年化收益:27%,累积超额收益77%(2019-2025)[33]。 - 沪深300成分股:年化收益17.2%,夏普比率1.24,最大回撤8%[38][41]。 - 中证500成分股:年化收益18.8%,夏普比率1.58,最大回撤10.3%[41][43]。 - 中证1000成分股:年化收益18.1%,夏普比率1.24,最大回撤21.3%[43][46]。 2. **改进后模型(加入SimStock)**: - 全A股平均年化收益:30%,累积超额收益109%[60]。 - 沪深300成分股:年化收益20.7%,夏普比率1.88,最大回撤8.5%[64][67]。 - 中证500成分股:年化收益23.4%,夏普比率1.97,最大回撤10.8%[68][71]。 - 中证1000成分股:年化收益22.5%,夏普比率1.56,最大回撤20.5%[71][73]。 3. **指数择时效果**: - 沪深300:年化收益5.1%,超额收益5.6%[79]。 - 中证500:年化收益12.4%,超额收益12.2%[82]。 - 中证1000:年化收益15.1%,超额收益14.9%[84]。 - 电力设备及新能源行业:年化收益36%,超额收益31.1%[101][103]。 --- 量化因子与构建方式 1. **因子名称:分钟频因子** - **构建思路**:从日内分钟级数据中提取量价相关性、波动率、动量等特征[109]。 - **具体因子示例**: - 分钟收益率与成交量相关系数 - 尾盘半小时动量 - 下行波动率占比 - 开盘成交占比[109]。 --- 因子的回测效果 1. **择时因子RankIC**:周度平均RankIC 4.5%,双周调仓多头年化收益23.2%(费后)[36]。 2. **改进后因子RankIC**:周度平均RankIC 4.2%,年化收益21.7%[74][75]。
ETF风险预算风险平价模型
长江证券· 2025-07-31 09:03
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:普通风险平价模型** - 模型构建思路:通过使组合中每个资产的风险贡献相等来实现风险分散[18] - 模型具体构建过程: 1. 计算资产协方差矩阵 $$\Sigma$$ 2. 求解权重向量 $$w$$ 满足 $$w_i \cdot (\Sigma w)_i = w_j \cdot (\Sigma w)_j$$ 对所有资产 $$i,j$$[14] 3. 当资产不相关时,权重与波动率倒数成正比[18] - 模型评价:适用于低相关资产,但对中国股债等属性差异大的资产需调整权重[21][23] 2. **模型名称:调整风险预算的风险平价模型** - 模型构建思路:通过动态调整不同资产的风险预算倍数来优化配置[27][36] - 模型具体构建过程: 1. 静态调整:权益风险预算设为25,商品/黄金设为36(资产数量开方倍数)[29][36] 2. 动态调整:基于过去6个月夏普比,最高预算为静态值的1.5倍[36] 3. 权重计算:$$w_i = \frac{b_i/\sigma_i}{\sum_j b_j/\sigma_j}$$,其中 $$b_i$$ 为风险预算[28] 3. **模型名称:宏观风险平价模型** - 模型构建思路:引入宏观因子分解资产收益,调整风险预算[38][42] - 模型具体构建过程: 1. 资产收益分解:$$r_{t,i} = \beta_i \cdot F_t + \epsilon_{t,i}$$,其中 $$F_t$$ 为宏观因子[39] 2. 计算宏观因子相关性矩阵 $$\rho_{macro}$$[38] 3. 结合微观风险预算:$$b_i' = b_i \cdot (1 + \frac{Sharpe_i}{max(Sharpe)})$$[38][42] 模型的回测效果 1. **普通风险平价模型** - 年化收益:6.47% | 最大回撤:-2.84% | 波动率:2.79% | 夏普比:2.25 | 月度胜率:74.76%[55] 2. **宏观风险平价模型** - 年化收益:7.99% | 最大回撤:-4.01% | 波动率:3.79% | 夏普比:2.03 | 月度胜率:71.84%[55] 3. **调整风险预算的宏观风险平价模型** - 年化收益:9.11% | 最大回撤:-3.64% | 波动率:3.62% | 夏普比:2.41 | 月度胜率:71.84%[61] 量化因子与构建方式 1. **因子名称:夏普比动态调整因子** - 因子构建思路:根据资产近期夏普比动态调整风险预算[36][59] - 因子具体构建过程: 1. 权益资产:比较1个月夏普比与阈值0.5,高于则预算设为64[59] 2. 可转债资产:比较1个月夏普比与阈值0.6,高于则预算设为36[59] 2. **因子名称:宏观状态权益择时因子** - 因子构建思路:基于宏观信号放大/缩小权益风险预算[59][60] - 因子具体构建过程: 1. 配置信号:权益预算乘以4 2. 非配置信号:权益预算除以4[59] 因子的回测效果 1. **夏普比动态调整因子** - 年化收益提升:+1.12%(宏观模型) | 最大回撤改善:-0.37%[61] 2. **宏观状态权益择时因子** - 年化收益提升:+2.45%(普通模型) | 月度胜率提升:+4.85%[60][61] ETF资产配置实施 - **子类资产调整规则**: 1. 债券:根据10年期国债收益率与20日均线关系切换久期[67] 2. 权益:价值风格时配置70%红利ETF,否则50%;大盘风格时配置80%沪深300ETF[67] - **回测结果**: 年化收益9.43% | 最大回撤-4.16% | 夏普比2.36 | 月度胜率72.15%[69]
金融工程日报:沪指冲高回落,创业板全天走弱-20250730
国信证券· 2025-07-30 23:20
根据提供的金融工程日报内容,以下是量化模型与因子的总结: 量化模型与构建方式 1. **封板率模型** - 模型构建思路:通过统计涨停股票在收盘时仍保持涨停的比例,反映市场情绪强度[15] - 具体构建过程: $$封板率=\frac{最高价涨停且收盘涨停的股票数}{最高价涨停的股票数}$$ 筛选上市满3个月的股票,计算当日同时满足盘中最高价涨停与收盘涨停的股票占比[15] - 模型评价:高频指标能有效捕捉短期资金博弈情绪 2. **连板率模型** - 模型构建思路:衡量涨停行情的持续性,反映市场热点延续性[15] - 具体构建过程: $$连板率=\frac{连续两日收盘涨停的股票数}{昨日收盘涨停的股票数}$$ 基于前一日涨停股票池,计算次日仍涨停的比例[15] 3. **股指期货贴水率模型** - 模型构建思路:通过期货与现货价差反映市场预期[28] - 具体构建过程: $$年化贴水率=\frac{基差}{指数价格} \times \frac{250}{合约剩余交易日数}$$ 分别计算上证50、沪深300、中证500、中证1000主力合约的基差年化值[28] 量化因子与构建方式 1. **大宗交易折价因子** - 因子构建思路:通过大宗交易折价幅度反映机构交易情绪[26] - 具体构建过程: $$折价率=\frac{大宗交易总成交金额}{当日成交份额的总市值}-1$$ 统计全市场大宗交易成交价相对于市价的偏离度[26] 2. **ETF折溢价因子** - 因子构建思路:捕捉资金套利行为引发的定价偏差[23] - 具体构建过程:筛选日成交额超100万的股票型ETF,计算场内价格与IOPV净值偏差[23] 3. **龙虎榜机构净流入因子** - 因子构建思路:跟踪机构席位资金动向识别主力行为[36] - 具体构建过程:汇总龙虎榜中"机构专用"席位净买入金额前十个股[36] 模型的回测效果 1. 封板率模型: - 当日封板率71%(较前日+8%)[15] - 近一月均值65%[15] 2. 连板率模型: - 当日连板率27%(较前日+9%)[15] - 近一月均值22%[15] 3. 股指期货贴水率模型: - 上证50年化升水0.16%(61%分位)[28] - 中证1000年化贴水11.49%(51%分位)[28] 因子的回测效果 1. 大宗交易折价因子: - 当日折价率4.21%(近半年均值5.8%)[26] 2. ETF折溢价因子: - 创新药ETF最高溢价0.63%[23] - 科创芯片ETF最大折价1.13%[23] 3. 龙虎榜机构净流入因子: - 西藏天路单日净流入1.2亿元[36] - 北方长龙单日净流出0.8亿元[36]
股指分红点位监控周报:微盘股稳健上涨,IC及IM主力合约持续深贴水-20250730
国信证券· 2025-07-30 23:03
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:股指分红点位测算模型** - **模型构建思路**:通过精细化处理指数成分股的分红数据,预测股指期货合约的升贴水情况,考虑分红对指数点位的影响[12][39] - **模型具体构建过程**: 1. **成分股权重计算**:采用中证指数公司每日披露的日度收盘权重数据,确保权重准确性。若成分股发生调整或特殊事件(如解禁),直接使用官方数据替代估算[45][46] 2. **分红金额预测**: - 若公司已公布分红金额,直接采用披露值;否则通过净利润×股息支付率估算[47] - **净利润预测**:分为两类公司处理: - 盈利分布稳定的公司:按历史盈利分布规律预测[50] - 盈利分布不稳定的公司:采用上年同期盈利作为预测值[50] - **股息支付率预测**: - 去年分红公司:采用去年股息支付率[53] - 去年不分红公司:采用最近3年平均股息支付率[53] - 从未分红公司:默认不分红[53] 3. **除息日预测**: - 已公布除息日:直接采用[56] - 未公布时:根据预案/决案阶段,结合历史间隔天数稳定性线性外推;若无稳定性,采用默认日期(7月31日、8月31日或9月30日)[56] 4. **分红点数计算**: $$分红点数 = \sum_{n=1}^{N} \left( \frac{成分股分红金额}{成分股总市值} \times 成分股权重 \times 指数收盘价 \right)$$ 其中要求除息日在当前日期至期货合约到期日之间(t < τ ≤ T)[39] - **模型评价**:对上证50和沪深300指数的预测准确度较高(误差约5点),中证500指数误差稍大(约10点)[61] 2. **模型名称:股指期货升贴水跟踪模型** - **模型构建思路**:通过扣除分红影响后的基差计算,跟踪主力合约升贴水幅度、期限结构及历史分位点[12][28] - **模型具体构建过程**: 1. **含分红价差计算**: $$含分红价差 = 合约收盘价 - 指数收盘价 + 分红点数$$ 其中分红点数来自分红点位测算模型[13] 2. **年化升贴水计算**: $$年化升贴水 = \left( \frac{含分红价差}{指数收盘价} \right) \times \left( \frac{365}{到期天数} \right) \times 100\%$$ 用于比较不同期限合约的升贴水水平[13] 3. **历史分位点计算**:基于历史基差数据统计当前升贴水幅度所处百分位[28] --- 量化因子与构建方式 1. **因子名称:股息率因子** - **因子构建思路**:通过已实现股息率和剩余股息率衡量指数成分股分红吸引力[16][17] - **因子具体构建过程**: - **已实现股息率**: $$已实现股息率 = \sum_{i=1}^{N1} \left( \frac{个股已分红金额}{个股总市值} \times 个股权重 \right)$$ N1为已分红公司数量[17] - **剩余股息率**:对未分红公司按相同方法计算预期分红贡献[17] - **因子评价**:煤炭、银行、钢铁行业股息率显著高于其他行业[15] 2. **因子名称:行业股息率中位数因子** - **因子构建思路**:统计各行业已公布分红预案股票的股息率中位数,横向比较行业分红水平[15] - **因子具体构建过程**: - 按行业分组计算股息率中位数: $$行业股息率中位数 = \text{Median}\left( \frac{预案分红金额}{当前总市值} \right)$$ 数据来源为已披露分红预案的个股[15] --- 模型的回测效果 1. **股指分红点位测算模型** - 上证50指数:预测误差约5点[61] - 沪深300指数:预测误差约5点[61] - 中证500指数:预测误差约10点[61] 2. **股指期货升贴水跟踪模型** - IH主力合约年化升水2.67%,历史分位点63%[13][28] - IF主力合约年化贴水0.70%,历史分位点51%[13][28] - IC主力合约年化贴水14.35%,历史分位点22%[13][28] - IM主力合约年化贴水14.12%,历史分位点21%[13][28] --- 因子的回测效果 1. **股息率因子** - 上证50指数:已实现股息率2.10%,剩余股息率0.10%[17] - 沪深300指数:已实现股息率1.65%,剩余股息率0.19%[17] - 中证500指数:已实现股息率1.12%,剩余股息率0.10%[17] - 中证1000指数:已实现股息率0.89%,剩余股息率0.04%[17] 2. **行业股息率中位数因子** - 煤炭行业:股息率中位数最高[15] - 银行行业:股息率中位数次高[15] - 钢铁行业:股息率中位数第三[15]
华创金工基本面研究(四):基本面因子的收益来源实证
华创证券· 2025-07-30 18:14
量化模型与构建方式 1. **模型名称:PB-ROE选股策略** - **模型构建思路**:通过整合企业的盈利能力(ROE)与市场定价水平(PB),选取“低估值高盈利”的优质公司[24] - **模型具体构建过程**: 1. 在调仓日将个股按BP(市净率倒数)排序,前20%构成低估组合 2. 按季度ROE排序,前20%构成质量组合 3. 取两者交集作为最终组合[24] 4. 交易规则:买入费用0.1%,卖出费用0.3%,以信号次日开盘价成交[24] - **模型评价**:收益主要来源于因子有效性而非调仓频率优化[24] 2. **模型名称:GARP选股策略** - **模型构建思路**:以合理价格(EP)买入成长性(净利润增长率)突出的股票[53] - **模型具体构建过程**: 1. 调仓日按EP(市盈率倒数)排序,前20%为低估组合 2. 按季度净利润增长率排序,前20%为成长组合 3. 取两者交集构成组合[53] 4. 交易规则同PB-ROE策略[53] 3. **模型名称:超预期选股策略** - **模型构建思路**:结合基本面超预期(SUE)与市场反应超预期(JOR)捕捉PEAD效应[86] - **模型具体构建过程**: 1. 调仓日按SUE(净利润偏离度)排序,前10%为基本面超预期组合 2. 按JOR(公告日股价超额收益)排序,前10%为市场反应超预期组合 3. 取两者交集构成组合[86] *SUE公式*: $$ SUE = \frac{当期净利润同比 - 过去8季均值}{过去8季标准差} $$ *JOR公式*:公告日个股超额收益相对市场基准[86] 模型的回测效果 1. **PB-ROE模型** - 年化收益:15.71%(4/8/10月调仓)[26] - 年化波动:24.18%[26] - 夏普比率:0.73[26] - 最大回撤:-37.06%[26] - 策略容量:1.28亿(平均持股77只)[41] 2. **GARP模型** - 年化收益:21.22%(月度调仓)[56] - 年化波动:27.98%[56] - 夏普比率:0.83[56] - 最大回撤:-42.85%[56] - 策略容量:1.89亿(平均持股173只)[69] 3. **超预期模型** - 年化收益:25.00%(月度调仓)[87] - 年化波动:29.48%[87] - 夏普比率:0.91[87] - 最大回撤:-45.69%[87] - 策略容量:1.01亿(平均持股70只)[100] 量化因子与构建方式 1. **因子名称:BP(市净率倒数)** - **构建思路**:衡量估值水平的反向指标[25] - **测试结果**:IC均值5.0%,IR 0.486[25] 2. **因子名称:EP(市盈率倒数)** - **构建思路**:估值水平代理指标[25] - **测试结果**:IC均值6.5%,IR 0.836[25] 3. **因子名称:SUE** - **构建思路**:量化净利润超预期程度[86] - **测试结果**:IC均值3.6%,IR 0.799[25] 4. **因子名称:JOR** - **构建思路**:捕捉公告日市场反应强度[86] - **测试结果**:IC均值3.4%,IR 0.829[25] 收益来源分析 1. **市场反应滞后** - PB-ROE:公告后12交易日超额累加2.3%[49] - GARP:公告后8交易日超额累加3%[77] - 超预期:公告后8交易日超额累加9%[103] 2. **市场反应不足** - 仅超预期策略在未来20交易日仍有1%超额收益[103] 3. **滞后调仓影响** - PB-ROE年化收益衰减3.74%(15.71%→11.97%)[50] - GARP年化收益衰减8.37%(21.22%→12.85%)[79] - 超预期年化收益衰减9.13%(25.00%→15.87%)[113]
机器学习因子选股月报(2025年8月)-20250730
西南证券· 2025-07-30 13:43
量化模型与构建方式 1. **模型名称:GAN_GRU模型** - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,用于挖掘量价时序特征并生成选股因子[4][13] - **模型具体构建过程**: 1. **数据输入**:使用18个量价特征(如收盘价、成交量、换手率等),采样形状为40*18(过去40天的特征)[17][18] 2. **GAN部分**: - 生成器(G):采用LSTM结构,输入原始量价时序特征(40×18),输出生成的特征(40×18)[33][37] - 判别器(D):采用CNN结构,通过卷积层处理二维量价时序特征,输出真假概率[33][35] - 损失函数: - 生成器损失:$$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$[24] - 判别器损失:$$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$[27] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[22] 4. **训练方式**:半年滚动训练,每半年更新模型参数,训练集与验证集比例80%:20%[18] - **模型评价**:通过对抗训练提升特征生成能力,保留时序特性,适配金融数据的高噪声和非线性特点[33][37] 2. **因子名称:GAN_GRU因子** - **因子构建思路**:利用GAN_GRU模型输出的预测收益pRet作为选股因子,经行业市值中性化+标准化处理[22][41] - **因子具体构建过程**: 1. 模型输出的pRet截面排序,取前10%股票构成多头组合[46] 2. 因子值计算:$$Factor_{GAN\_GRU} = pRet_{标准化} + 行业市值中性化残差$$[22] --- 模型的回测效果 1. **GAN_GRU模型** - IC均值:11.43% | ICIR:0.89 | 年化超额收益率:24.86%[41][42] - 年化收益率:38.52% | 最大回撤率:27.29% | 信息比率(IR):1.62[42] 2. **GAN_GRU因子(行业表现)** - 当期IC最高行业:家用电器(27.00%)、非银金融(23.08%)[42] - 近一年IC均值最高行业:公用事业(14.43%)、商贸零售(13.33%)[42] - 多头组合超额收益:纺织服饰(5.19%)、公用事业(3.62%)[2][43] --- 量化因子与构建方式 1. **因子名称:GAN_GRU衍生行业因子** - **构建思路**:在申万一级行业内部分层测试GAN_GRU因子表现,生成行业特异性选股信号[42][43] - **具体构建过程**: 1. 按行业分组计算因子IC和多头组合超额收益[42] 2. 行业中性化处理:$$Factor_{行业} = Factor_{原始} - \beta_{行业} \times Industry_{哑变量}$$[22] --- 因子的回测效果 1. **GAN_GRU衍生行业因子** - 全A股多头组合年化超额收益:24.86% | 换手率:0.82[42] - 近一年IC均值:10.97% | 最新一期IC:9.27%[41][42] 2. **行业多头组合** - 近一年月均超额收益:家用电器(5.44%)、建筑材料(4.70%)[2][43] - 全行业跑赢基准比例:30个行业中21个跑赢(70%)[43] --- 其他关键点 - **数据预处理**:量价特征在时序上去极值+标准化,个股截面标准化[18] - **超参数**:batch_size=截面股票数,优化器Adam,学习率1e-4,损失函数IC[18] - **最新多头组合**:裕同科技、青山纸业等(2025年8月前十个股)[5][48]
金融工程专题研究:风险模型全攻略:恪守、衍进与实践
国信证券· 2025-07-29 23:17
量化模型与因子总结 量化模型 1. 基于启发式风格划分的认知风险控制模型 模型构建思路:通过结合启发式方法和因子打分法识别市场认知与个体认知差异,控制认知风险[4][15] 模型具体构建过程: 1) 采用时间序列回归划分个股风格: $$r_{t,t}\sim\beta_{\mathit{Value}}\cdot r_{\mathit{Value},t}+\beta_{\mathit{Growth}}\cdot r_{\mathit{Growth},t}+\varepsilon_{t}$$ 约束条件: $$0\leq\beta_{\mathit{Value}}\leq1$$ $$0\leq\beta_{\mathit{Growth}}\leq1$$ $$\beta_{\mathit{Value}}+\beta_{\mathit{Growth}}=1$$ 2) 计算行业风险贡献: $$RiskContribution_{i}=w_{i}\times{\frac{\partial\sigma_{p}}{\partial w_{i}}}=w_{i}\times{\frac{\sum_{j=1}^{n}w_{i}\cdot Cov\left(r_{i},r_{j}\right)}{\sigma_{p}}}$$ 3) 对高风险行业中的认知差异个股偏离置为0[4][15][81] 2. 基于个股收益聚类的隐性风险识别模型 模型构建思路:采用Louvain社区发现算法对个股超额收益相关性进行聚类,识别传统风险模型无法捕捉的隐性风险[4][15][117] 模型具体构建过程: 1) 计算个股超额收益相关性矩阵 2) 应用Louvain算法最大化模块度进行聚类 3) 对近期走势趋同的股票聚类结果进行风险控制[117] 3. 动态风格因子控制模型 模型构建思路:针对风格因子波动率聚集现象,对近期波动率排名靠前、波动率显著放大的风格因子进行严格控制[4][15][81] 模型具体构建过程: 1) 计算风格因子滚动3个月收益率年化波动率 2) 识别波动率显著放大的风格因子 3) 在组合优化中约束高波动风格因子暴露[27][28] 4. 目标跟踪误差下的自适应个股偏离模型 模型构建思路:根据过去跟踪误差动态调整个股偏离幅度[4][15][81] 模型具体构建过程: 1) 计算组合相对基准的滚动3个月跟踪误差 2) 当跟踪误差超过阈值时自动缩小个股偏离 3) 形成跟踪误差-偏离幅度的动态调整机制[31][32] 量化因子 1. 黑天鹅指数因子 因子构建思路:通过风格因子收益率偏离度衡量市场极端程度[24][25] 因子具体构建过程: 1) 计算风格因子日度收益率偏离度: $$\sigma_{s,t}=\frac{\bar{r}_{s,t}-\bar{r}_{s}}{\sigma_{s}}$$ 2) 计算黑天鹅指数: $$BlackSwan_{t}=\frac{1}{N}\times\sum_{s\in S}\left|\sigma_{s,t}\right|$$ 因子评价:有效捕捉市场极端风险事件[24][25] 2. 成长价值风格因子 因子构建思路:综合估值和成长指标构建风格因子[82][83] 因子具体构建过程: 1) 价值因子包含股息率、BP、EPTTM、OCFPTTM四个子因子,权重各1/4 2) 成长因子包含DeltaROEQ、NPQYOY、SUE、AOG四个子因子,权重各1/4[82][83] 因子评价:传统因子打分法可能无法完全捕捉市场实际交易风格[88][93] 模型回测效果 1. 传统中证500指数增强组合 年化超额收益18.77%,相对最大回撤9.68%,信息比3.56,收益回撤比1.94,年化跟踪误差4.88%[5][16] 2. 引入全流程风控的中证500指数增强组合 年化超额收益16.51%,相对最大回撤4.90%,信息比3.94,收益回撤比3.37,年化跟踪误差3.98%[5][16]