Workflow
因子选股
icon
搜索文档
因子手工作坊系列(4):当大单不再可靠:基于撤单行为的机构交易识别
西部证券· 2026-02-24 19:21
核心观点 - 报告提出了一种从算法交易视角识别机构行为的新方法,即通过分析“下单-撤单时间差”的规律性来定位算法交易驱动的撤单行为,并以此构建了具有稳定选股能力的因子[1] - 报告认为,在算法交易已成为机构主流执行方式的市场环境下,基于交易机制和时间结构识别机构行为,比单纯依赖订单金额的传统方法更具合理性与研究价值[1] - 报告构建的买单算法交易撤单占比因子(BABR)选股表现优异,且与公募基金整体的投资风格有较强一致性,提供了一种高频跟踪公募行为的方式[1] 研究背景与问题提出 - 传统的基于挂单金额大小(如大单、小单)来识别机构行为的方法在实践中存在明显缺陷,因为挂单金额与股价直接相关,高价股一手委托金额可能远超“小单”阈值[10] - 数据显示,每笔交易的平均金额持续下降,而小单中机构订单的占比自2017年以来呈现明显、持续的上升趋势,严重动摇了“小单为散户,大单为机构”的传统假设[11][12] - 小单中机构订单占比上升与算法交易在机构投资者中的普及密切相关,算法交易会将大订单拆分执行,因此识别思路应从订单大小转向对算法交易行为的定位[12] 算法交易撤单的识别方法 - 研究发现,撤单行为比下单行为更易暴露算法交易的规则化特征,人工撤单的“下单-撤单时间差”应呈现随机特征,而实际数据在若干离散时点出现了显著的脉冲式集中[17][18] - 通过分析下单后10秒内的撤单时间分布,发现撤单高度集中于0秒附近、1秒、5秒及1分钟内3秒整数倍(如3秒、6秒、9秒)等时点[22] - 报告将连续竞价阶段,下单-撤单时间差落在1秒、5秒或1分钟内3秒整数倍前后20毫秒内的撤单,识别为由算法交易驱动的行为[24] 算法交易撤单占比因子的构建与测试 - 首先构建了两个基础因子:算法交易撤单量占比(ACVR)和算法交易撤单笔数占比(ACCR),逻辑是算法交易撤单占比高可能意味着机构参与积极,该股票应有更高预期收益[28] - 回测区间为2017年至2025年,ACCR因子的全区间RankIC为0.051,双周度胜率67.3%,多空组合年化收益率25.1%,表现优于ACVR因子(RankIC 0.026,年化收益15.9%)[30][32] - 使用撤单笔数构建的ACCR因子表现优于撤单量,因为撤单量不对应真实成交,且大额限价单的反复报撤会扭曲因子值,而撤单笔数能更好地抑制噪音[35] - 全市场ACCR因子均值从2017-2018年初的1%-2%,上升至2022年后的6%-8%区间波动,反映了算法交易在机构投资者中从初步应用到普及并趋于稳定的过程[39] 买单算法交易撤单占比因子(BABR)的表现 - 在ACCR基础上加入买单方向,构建了买单算法交易撤单笔数占全部买单撤单笔数的因子(BABR),逻辑是买入方向的算法撤单占比高更能表征机构建仓意愿和信心[42] - BABR因子表现优异,全区间RankIC为0.058,ICIR接近0.55,双周度胜率超过70%,多空组合年化收益率达27.8%[2][43] - BABR因子多头组(组5)扣费后净值与万得偏股混合型基金指数(885001.WI)净值走势较为一致,日收益率相关性达到0.59,表明该因子能在一定程度上捕捉公募机构的行为[45] 因子的风格特征与独立性 - BABR因子的风格暴露不同于传统量价因子,其多头组偏好高估值、高弹性(与Beta正相关)、低财务杠杆的股票[49] - 全区间内,BABR因子与账面市值比、盈利及杠杆等Barra风格因子保持稳定负相关,与市值因子相关性较弱(全区间-2.39%)[47] - 对BABR因子进行市值中性化处理后,其全区间RankIC微升至0.059,ICIR升至0.568,胜率升至72.14%,表明市值影响有限,因子能提供独立信息增益[50][52] - BABR因子与基于逐笔成交数据开发的深度学习因子的相关系数为-0.25,提供了相对独立的信息增益[3][57] 因子拓展分析 - BABR因子在不同指数成分股内的选股效果存在差异,在中证1000和中证2000成分股内的IC(分别为0.046和0.068)显著优于在沪深300和中证500内的表现[58] - 报告认为,大盘股中可能包含大量ETF被动资金交易或机构出于配置目的的算法交易,削弱了因子的选股信号;而小盘股中出现较高的算法撤单占比,更可能是机构持有积极观点的信号[60] - 卖单算法撤单占比因子同样有效,其IC也为正,但略弱于买单因子,表明算法交易撤单占比可能更多刻画了机构对股票的整体关注和参与强度,而非买卖方向[61][62] - 因子在流动性高的股票中选股效果更佳,双重排序检验显示,在流动性最高的股票组中,BABR因子的RankIC达到0.088,多空收益率为50.61%;而在流动性最差的组中,RankIC仅0.013,几乎失效[67][68]
量化组合跟踪周报 20260117:Beta 因子表现良好,量化选股组合超额收益显著-20260117
光大证券· 2026-01-17 19:25
量化模型与构建方式 1. **模型名称:PB-ROE-50组合** **模型构建思路:** 基于市净率(PB)和净资产收益率(ROE)两个核心估值与盈利指标,构建选股组合[23]。 **模型具体构建过程:** 报告未详细描述该组合的具体构建公式和步骤,仅提及其为基于PB和ROE的选股策略[23]。 2. **模型名称:公募调研选股策略** **模型构建思路:** 基于公募基金调研活动的事件驱动选股策略[25]。 **模型具体构建过程:** 报告未详细描述该策略的具体构建公式和步骤,仅提及其为公募调研选股策略[25]。 3. **模型名称:私募调研跟踪策略** **模型构建思路:** 基于私募基金调研活动的事件驱动选股策略[25]。 **模型具体构建过程:** 报告未详细描述该策略的具体构建公式和步骤,仅提及其为私募调研跟踪策略[25]。 4. **模型名称:大宗交易组合** **模型构建思路:** 根据“高成交、低波动”原则,从发生大宗交易的股票中筛选后续表现更佳的股票[29]。 **模型具体构建过程:** 通过统计分析发现,“大宗交易成交金额比率”越高、“6日成交金额波动率”越低的股票后续表现更佳[29]。根据此原则,通过月频调仓方式构造组合[29]。具体计算公式未在本文中给出。 5. **模型名称:定向增发组合** **模型构建思路:** 以定向增发的股东大会公告日为事件节点,进行事件驱动选股[35]。 **模型具体构建过程:** 综合考虑市值因素、调仓周期以及对仓位的控制来构造组合[35]。具体计算公式和权重分配未在本文中给出。 模型的回测效果 1. **PB-ROE-50组合**,本周超越基准收益率(中证500) -0.20%[24],本周超越基准收益率(中证800) 1.98%[24],本周超越基准收益率(全市场) 2.85%[24],今年以来超额收益率(中证500) -2.37%[24],今年以来超额收益率(中证800) 3.37%[24],今年以来超额收益率(全市场) 4.12%[24],本周绝对收益率(中证500) 1.98%[24],本周绝对收益率(中证800) 2.19%[24],本周绝对收益率(全市场) 3.34%[24],今年以来绝对收益率(中证500) 7.66%[24],今年以来绝对收益率(中证800) 7.91%[24],今年以来绝对收益率(全市场) 9.88%[24] 2. **公募调研选股策略**,本周超越基准收益率 3.24%[26],今年以来超额收益率 2.92%[26],本周绝对收益率 3.45%[26],今年以来绝对收益率 7.44%[26] 3. **私募调研跟踪策略**,本周超越基准收益率 2.59%[26],今年以来超额收益率 4.93%[26],本周绝对收益率 2.80%[26],今年以来绝对收益率 9.53%[26] 4. **大宗交易组合**,本周超越基准收益率 3.94%[30],今年以来超额收益率 4.66%[30],本周绝对收益率 4.43%[30],今年以来绝对收益率 10.46%[30] 5. **定向增发组合**,本周超越基准收益率 1.16%[36],今年以来超额收益率 -0.57%[36],本周绝对收益率 1.64%[36],今年以来绝对收益率 4.94%[36] 量化因子与构建方式 1. **因子名称:6日成交金额的移动平均值** **因子构建思路:** 衡量股票近期成交活跃度的趋势[12]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为负向[13]。 2. **因子名称:5日平均换手率** **因子构建思路:** 衡量股票短期流动性[12]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为负向[13]。 3. **因子名称:净利润断层** **因子构建思路:** 事件驱动因子,捕捉公司净利润超预期增长带来的股价跳空上涨效应[12]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为正向[13]。 4. **因子名称:总资产增长率** **因子构建思路:** 衡量公司资产规模扩张速度的基本面因子[14]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为正向[15]。 5. **因子名称:早盘后收益因子** **因子构建思路:** 捕捉特定交易时段(早盘后)的股价行为模式[14]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为负向[15]。 6. **因子名称:单季度ROA同比** **因子构建思路:** 衡量公司单季度资产盈利能力同比变化的基本面因子[14]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为正向[15]。 7. **因子名称:单季度ROE** **因子构建思路:** 衡量公司单季度净资产盈利能力的基本面因子[16]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为正向[17]。 8. **因子名称:总资产毛利率TTM** **因子构建思路:** 衡量公司过去十二个月总资产毛利创造能力的基本面因子[16]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为正向[17]。 9. **因子名称:单季度ROA** **因子构建思路:** 衡量公司单季度资产盈利能力的基本面因子[16]。 **因子具体构建过程:** 报告未给出具体计算公式,因子方向为正向[17]。 10. **因子名称:Beta因子** **因子构建思路:** 衡量股票相对于市场整体波动性的风格因子[1]。 **因子具体构建过程:** 报告未给出具体计算公式。 11. **因子名称:市值因子** **因子构建思路:** 衡量公司规模大小的风格因子[1]。 **因子具体构建过程:** 报告未给出具体计算公式。 12. **因子名称:残差波动率因子** **因子构建思路:** 衡量股票特异性风险的风格因子[1]。 **因子具体构建过程:** 报告未给出具体计算公式。 13. **因子名称:流动性因子** **因子构建思路:** 衡量股票交易便利程度的风格因子[1]。 **因子具体构建过程:** 报告未给出具体计算公式。 14. **因子名称:净资产增长率因子** **因子构建思路:** 行业内分析使用的基本面因子,衡量公司净资产增长[21]。 **因子具体构建过程:** 报告未给出具体计算公式。 15. **因子名称:净利润增长率因子** **因子构建思路:** 行业内分析使用的基本面因子,衡量公司净利润增长[21]。 **因子具体构建过程:** 报告未给出具体计算公式。 16. **因子名称:每股净资产因子** **因子构建思路:** 行业内分析使用的基本面因子,衡量公司每股账面价值[21]。 **因子具体构建过程:** 报告未给出具体计算公式。 17. **因子名称:每股经营利润TTM因子** **因子构建思路:** 行业内分析使用的基本面因子,衡量公司每股经营利润[21]。 **因子具体构建过程:** 报告未给出具体计算公式。 18. **因子名称:BP因子** **因子构建思路:** 行业内分析使用的估值类因子,即市净率(PB)的倒数[21]。 **因子具体构建过程:** 报告未给出具体计算公式。 19. **因子名称:EP因子** **因子构建思路:** 行业内分析使用的估值类因子,即市盈率(PE)的倒数[21]。 **因子具体构建过程:** 报告未给出具体计算公式。 20. **因子名称:5日动量因子** **因子构建思路:** 行业内分析使用的动量类因子[22]。 **因子具体构建过程:** 报告未给出具体计算公式。 21. **因子名称:1月动量因子** **因子构建思路:** 行业内分析使用的动量类因子[22]。 **因子具体构建过程:** 报告未给出具体计算公式。 22. **因子名称:对数市值因子** **因子构建思路:** 行业内分析使用的规模风格因子[22]。 **因子具体构建过程:** 报告未给出具体计算公式。 *(注:报告中还提及了大量其他因子,如ROIC增强因子、标准化预期外盈利、市净率因子、大单净流入等,均未提供具体构建过程,此处不一一列举。)* 因子的回测效果 *(以下因子表现数据均为“最近1周”的收益,为剔除行业与市值影响后多头组合相对于基准指数的超额收益[12])* 1. **6日成交金额的移动平均值因子**,最近1周收益 3.60%[13] 2. **5日平均换手率因子**,最近1周收益 3.53%[13] 3. **净利润断层因子**,最近1周收益 3.35%[13] 4. **总资产增长率因子**,最近1周收益 1.23%[15] 5. **早盘后收益因子**,最近1周收益 1.12%[15] 6. **单季度ROA同比因子**,最近1周收益 1.02%[15] 7. **单季度ROE因子**,最近1周收益 1.67%[17] 8. **总资产毛利率TTM因子**,最近1周收益 1.47%[17] 9. **单季度ROA因子**,最近1周收益 1.33%[17] 10. **Beta因子**,最近1周收益 1.22%[18] 11. **市值因子**,最近1周收益 -0.79%[18] 12. **残差波动率因子**,最近1周收益 -0.77%[18] 13. **流动性因子**,最近1周收益 -0.56%[18]
业绩高增速组合构建全攻略
申万宏源金工· 2026-01-12 16:01
业绩高增速组合的构建 - 构建方法基于分析师一致预期,首先在中证全指样本空间内,于每年4、8、10月底,筛选出总市值和过去一年日均成交金额排名前80%的样本,并剔除去年归母净利润为负的样本,最后根据分析师一致预期业绩增速筛选出前50%的样本,形成预期当年利润高增股票池 [7] - 在2011年8月31日至2025年10月31日的回测期间,该股票池平均每期包含571只股票 [9][11] - 为构建最终组合,在股票池基础上,进一步根据“一致预期业绩变化”因子(定义为当前一致预期净利润除以3个月前一致预期净利润再减1)进行筛选,每月选取该因子排名前50的股票等权构建组合,并考虑仓位因素以9成仓位进行业绩比较 [13][14][15] 业绩高增速组合的历史表现 - 在2012年至2025年10月31日的回测期间,9成仓位的业绩高增速组合年化收益为38.87%,同期万得偏股混合型基金指数年化收益为32.47%,组合年化超额收益为6.40% [16] - 组合在多数年份跑赢基准,例如2013年超额收益36.56%,2014年超额收益47.58%,2021年超额收益30.89% [16] - 组合市值特征与中证500指数相当,每期市值中位数平均为158亿元,可定义为中盘成长组合;月度单边换手率为53.45%,在1、4、7、8、10月因分析师盈利预测集中更新而调仓较高 [21] 组合实现的业绩增速 - 在2012年4月27日至2024年10月31日期间,业绩高增速组合实现的当年利润增速中位数的时序均值达到99%,显著高于预期当年利润高增股票池的36.86% [24] - 从时间序列看,组合的利润增速基本稳定位于全市场利润增速十分组中的第一组(G1)和第二组(G2)之间 [28][31] - 组合落在全市场利润增速前三组(G1至G3)的股票数量占比较为稳定,表明其持续实现了相对市场的高增长 [29][32] 预测利润增速的有效因子 - 研究采用多因子框架预测股票当年利润增速,在2011年12月30日至2024年12月31日回测期间,分析师、成长、盈利、市值因子的预测效果较为突出 [36][37] - 具体来看,分析师因子的RankIC均值为37.81%,成长因子为30.22%,盈利因子为33.46%,市值因子为15.70% [36] - 因子分组测试显示,分析师因子和成长因子能够筛选出当年利润增速更高的多头组合 [37][39] 因子选股方法比较:递进选股 vs. 并列选股 - 业绩高增速组合采用“递进选股”方法:先按一致预期业绩增速筛选股票池(前50%),再按分析师盈利预测变化因子选股(前50只) [43] - 作为对比的“并列选股”组合(高增速组合3)将两个因子等权打分后综合筛选 [46] - 在2011年12月30日至2025年10月31日回测期间,递进选股组合(年化收益24.29%,夏普比率0.86)整体表现优于并列选股组合(年化收益21.03%,夏普比率0.72),在过去14年中有9年跑赢 [45][47] - 研究指出,递进选股顺序对结果有影响,且由于分析师盈利预测变化因子(RankIC均值3.77%)的选股效果强于一致预期业绩增速因子(RankIC均值1.93%),将其作为最终选股标准效果更佳 [54][57] 附录:分析师因子的改进方法 - 传统方法使用固定时间窗口(如过去6个月)内的所有分析师预测数据,可能包含已失效的旧预测 [70] - 提出基于“业绩披露时点”的改进方法:在计算因子时,以最近一次业绩报告(预告、快报或正式财报)披露日为起点,仅使用该时点至当前月末期间分析师发布的最新盈利预测数据,以确保数据的及时性和有效性 [70][75] - 以“一致预期净利润变化”因子为例,改进后因子在中证全指样本空间的RankIC均值从3.22%提升至3.85%,RankIC IR从0.40提升至0.45 [77] - 以“分析师盈利上调比例”因子为例,改进后因子在中证全指样本空间的RankIC均值从2.92%提升至3.45%,RankIC IR从0.38提升至0.45 [81]
量化组合跟踪周报 20251227:市场大市值风格占优,机构调研组合超额明显-20251227
光大证券· 2025-12-27 19:06
量化模型与构建方式 1. **模型名称:PB-ROE-50组合** * **模型构建思路:** 基于PB(市净率)和ROE(净资产收益率)两个核心指标进行选股,旨在寻找估值合理且盈利能力强的公司[24]。 * **模型具体构建过程:** 研报未详细描述该模型的构建公式和具体步骤,仅提及其为基于PB和ROE的选股组合[24]。 2. **模型名称:机构调研组合** * **模型构建思路:** 利用机构调研事件信息构建选股策略,分为公募调研选股策略和私募调研跟踪策略[27]。 * **模型具体构建过程:** 研报未详细描述该模型的构建公式和具体步骤,仅提及其为基于机构调研事件的选股策略[27]。 3. **模型名称:大宗交易组合** * **模型构建思路:** 基于“高成交、低波动”原则,从发生大宗交易的股票中筛选后续表现更佳的标的[31]。 * **模型具体构建过程:** 根据“大宗交易成交金额比率”和“6日成交金额波动率”两个指标进行筛选。“大宗交易成交金额比率”越高、“6日成交金额波动率”越低的股票,其后续表现更佳。组合采用月频调仓方式构造[31]。 4. **模型名称:定向增发组合** * **模型构建思路:** 以定向增发(定增)的股东大会公告日为事件节点,构建事件驱动选股组合[37]。 * **模型具体构建过程:** 综合考虑市值因素、调仓周期以及对仓位的控制来构造组合,但研报未提供具体的构建公式和详细步骤[37]。 量化因子与构建方式 1. **因子名称:早盘收益因子** * **因子构建思路:** 捕捉股票在早盘时段的收益表现[12]。 * **因子具体构建过程:** 研报未提供具体构建公式。 2. **因子名称:单季度净利润同比增长率** * **因子构建思路:** 衡量公司最新单季度净利润相对于去年同期的增长情况,反映盈利能力的短期变化[12]。 * **因子具体构建过程:** 研报未提供具体构建公式。 3. **因子名称:单季度ROA同比** * **因子构建思路:** 衡量公司最新单季度总资产收益率相对于去年同期的变化[12]。 * **因子具体构建过程:** 研报未提供具体构建公式。 4. **因子名称:标准化预期外盈利** * **因子构建思路:** 衡量公司实际盈利与市场预期之间的差异,并进行标准化处理[12]。 * **因子具体构建过程:** 研报未提供具体构建公式。 5. **因子名称:5日反转** * **因子构建思路:** 捕捉股票在短期(5日)内的价格反转效应[18]。 * **因子具体构建过程:** 研报未提供具体构建公式。 6. **因子名称:动量弹簧因子** * **因子构建思路:** 一种结合了动量和反转特性的因子,具体逻辑未详细说明[18]。 * **因子具体构建过程:** 研报未提供具体构建公式。 7. **因子名称:对数市值因子** * **因子构建思路:** 使用公司市值的对数作为因子,代表规模风格[13]。 * **因子具体构建过程:** 研报未提供具体构建公式。 8. **因子名称:下行波动率占比** * **因子构建思路:** 衡量股价下行波动风险在总波动风险中的比例[13]。 * **因子具体构建过程:** 研报未提供具体构建公式。 9. **因子名称:大类因子(风格因子)** * **因子构建思路:** 将多个底层因子归类为具有共同经济含义的风格大类,用于描述市场整体风格暴露[20]。 * **因子具体构建过程:** 报告中提到了beta因子、规模因子、非线性市值因子和杠杆因子,但未给出具体的构建方法[20]。 10. **因子名称:行业内因子** * **因子构建思路:** 在行业内部计算并比较因子的表现,以观察因子在不同行业内的有效性差异[22]。 * **因子具体构建过程:** 报告中列举了每股经营利润TTM、净资产增长率、净利润增长率、5日动量、1月动量、每股净资产、BP因子、EP因子、残差波动率、流动性、对数市值等因子在行业内的表现,但未给出具体的行业内因子构建方法[22]。 模型的回测效果 (数据统计区间:2025年1月2日至2025年12月26日[25][28][32][38]) 1. **PB-ROE-50组合** * 本周超越基准收益率(中证500): -0.62%[25] * 本周超越基准收益率(中证800): 1.31%[25] * 本周超越基准收益率(全市场): 1.36%[25] * 今年以来超额收益率(中证500): 2.48%[25] * 今年以来超额收益率(中证800): 18.55%[25] * 今年以来超额收益率(全市场): 20.81%[25] * 本周绝对收益率: 3.39%(中证500)/ 3.85%(中证800)/ 4.18%(全市场)[25] * 今年以来绝对收益率: 33.50%(中证500)/ 43.89%(中证800)/ 51.01%(全市场)[25] 2. **机构调研组合** * **公募调研选股策略:** * 本周超越基准收益率(中证800): 1.88%[28] * 今年以来超额收益率(中证800): 20.80%[28] * 本周绝对收益率: 4.44%[28] * 今年以来绝对收益率: 46.62%[28] * **私募调研跟踪策略:** * 本周超越基准收益率(中证800): 2.14%[28] * 今年以来超额收益率(中证800): 19.55%[28] * 本周绝对收益率: 4.69%[28] * 今年以来绝对收益率: 45.10%[28] 3. **大宗交易组合** * 本周超越基准收益率(中证全指): -1.94%[32] * 今年以来超额收益率(中证全指): 34.11%[32] * 本周绝对收益率: 0.79%[32] * 今年以来绝对收益率: 67.63%[32] 4. **定向增发组合** * 本周超越基准收益率(中证全指): -1.79%[38] * 今年以来超额收益率(中证全指): -8.91%[38] * 本周绝对收益率: 0.95%[38] * 今年以来绝对收益率: 13.86%[38] 因子的回测效果 (数据统计区间:最近1周为2025年12月22日至2025年12月26日[12][14][18][20]) 1. **大类因子(全市场股票池)本周表现:** * Beta因子收益: 1.31%[20] * 规模因子收益: 0.62%[20] * 非线性市值因子收益: 0.58%[20] * 杠杆因子收益: -0.13%[20] 2. **单因子近期表现(示例,详细列表见报告原文):** * **沪深300股票池本周表现前三因子:** * 早盘收益因子: 2.16%[12] * 单季度净利润同比增长率: 1.75%[12] * 单季度ROA同比: 1.68%[12] * **中证500股票池本周表现前三因子:** * 单季度营业利润同比增长率: 1.16%[14] * 单季度净利润同比增长率: 1.11%[14] * 标准化预期外盈利: 1.08%[14] * **流动性1500股票池本周表现前三因子:** * 5日反转: 3.33%[18] * 单季度净利润同比增长率: 1.58%[18] * 动量弹簧因子: 1.43%[18]
业绩高增速组合构建全攻略
申万宏源证券· 2025-12-05 17:43
组合构建方法与绩效 - 业绩高增速组合构建方法为:在中证全指内,于每年4、8、10月底筛选市值与成交额前80%、剔除去年归母净利润为负的样本,再选取分析师一致预期业绩增速前50%的股票[6] - 在2011/8/31至2025/10/31回测期间,预期当年利润高增股票池平均包含571只股票[11] - 业绩高增速组合(9成仓位)在2011/12/30至2025/10/31期间年化收益为24.29%,年化波动28.27%,夏普比率0.86,最大回撤-54.63%[19][56] - 组合每期市值中位数平均为158亿元,与中证500指数市值相当,定义为中盘成长组合;月度单边换手率为53.45%[20] 组合业绩验证 - 在2012/4/27至2024/10/31期间,业绩高增速组合实现的当年利润增速中位数时序均值高达99%,显著高于预期股票池的36.86%[29] - 组合利润增速在时间序列上基本位于全市场利润增速十分组的第一组与第二组之间[32] 有效预测因子分析 - 对股票当年利润增速预测效果突出的因子包括:分析师因子(RankIC均值37.81%,IR 2.91)、成长因子(RankIC均值30.22%,IR 3.08)、盈利因子(RankIC均值33.46%,IR 2.71)和市值因子(RankIC均值15.70%,IR 2.97)[42] - 分析师盈利预测变化因子的选股效果(RankIC均值3.77%,IR 0.41)强于一致预期业绩增速因子(RankIC均值1.93%,IR 0.14)[70] 选股方法比较 - 因子递进选股(先一致预期业绩增速筛选,后分析师盈利预测变化选股)组合年化收益24.29%,优于因子并列选股组合的年化收益21.03%,在14年中有9年跑赢[56][59] - 改变递进选股顺序(先分析师盈利预测变化筛选,后一致预期业绩增速选股)的组合年化收益为20.38%,低于原业绩高增速组合[63][66] - 使用历史业绩增速(成长因子)替代分析师预期增速筛选股票池,构建的组合年化收益24.49%,与原组合24.29%表现接近[75][77] 因子改进与风险 - 改进后的分析师因子(如一致预期净利润变化因子)在多个样本空间(如中证全指)的RankIC均值(3.85%)和IR(0.45)均优于初始因子(RankIC均值3.22%,IR 0.40)[90] - 报告结果基于历史数据,未来市场结构变化或分析师盈利预测出现系统性偏差可能影响策略稳定性[115]
东方因子周报:Beta风格领衔,一个月UMR因子表现出色,建议关注市场敏感度高的资产-20250810
东方证券· 2025-08-10 20:43
量化模型与构建方式 1. **模型名称**:DFQ-FactorGCL - **模型构建思路**:基于超图卷积神经网络和时间残差对比学习的股票收益预测模型[6] - **模型具体构建过程**:未详细描述 2. **模型名称**:DFQ-FactorVAE-pro - **模型构建思路**:加入特征选择与环境变量模块的FactorVAE模型[6] - **模型具体构建过程**:未详细描述 3. **模型名称**:Neural ODE - **模型构建思路**:时序动力系统重构下深度学习因子挖掘模型[6] - **模型具体构建过程**:未详细描述 量化因子与构建方式 1. **因子名称**:Beta风格因子 - **因子构建思路**:衡量股票对市场波动的敏感性,基于贝叶斯压缩后的市场Beta[16] - **因子具体构建过程**:$$Beta = \text{贝叶斯压缩后的市场Beta}$$[16] - **因子评价**:近期表现突出,市场对高Beta股票偏好稳定[11][13] 2. **因子名称**:UMR因子(一个月UMR) - **因子构建思路**:风险调整后的动量因子,基于一个月窗口计算[21] - **因子具体构建过程**:未详细描述 - **因子评价**:在中证全指样本空间中表现最佳[47] 3. **因子名称**:DELTAROA - **因子构建思路**:单季总资产收益率同比变化[21] - **因子具体构建过程**:$$DELTAROA = \text{单季总资产收益率} - \text{去年同期总资产收益率}$$[21] - **因子评价**:在中证1000样本空间中表现最佳[36] 4. **因子名称**:非流动性冲击 - **因子构建思路**:衡量股票流动性风险,基于过去20个交易日日度涨跌幅绝对值比成交额的均值[21] - **因子具体构建过程**:$$ILLIQ\_1M = \frac{\sum_{t=1}^{20} |r_t|}{V_t}$$[21] - **因子评价**:在国证2000样本空间中表现最佳[39] 5. **因子名称**:预期PEG - **因子构建思路**:一致预期滚动PE与个股滚动净利复合增长率的比值[21] - **因子具体构建过程**:$$TTM\_FPEG = \frac{\text{一致预期滚动PE}}{\text{个股滚动净利复合增长率}}$$[21] - **因子评价**:在沪深300样本空间中表现最佳[24] 6. **因子名称**:一年动量 - **因子构建思路**:剔除近1个月的过去一年涨跌幅[21] - **因子具体构建过程**:$$MOMENTUM\_1Y = \sum_{t=2}^{12} r_t$$[21] - **因子评价**:在中证500样本空间中表现最佳[28] 模型的回测效果 1. **DFQ-FactorGCL模型**:未提供具体回测数据 2. **DFQ-FactorVAE-pro模型**:未提供具体回测数据 3. **Neural ODE模型**:未提供具体回测数据 因子的回测效果 1. **Beta风格因子**: - 近一周收益:0.88%[13] - 近一月收益:5.18%[13] - 今年以来收益:21.07%[13] 2. **一个月UMR因子**: - 近一周收益:1.82%[47] - 近一月收益:1.49%[47] - 今年以来收益:6.19%[47] 3. **DELTAROA因子**: - 近一周收益:0.63%[36] - 近一月收益:1.57%[36] - 今年以来收益:8.06%[36] 4. **非流动性冲击因子**: - 近一周收益:1.26%[39] - 近一月收益:1.99%[39] - 今年以来收益:12.11%[39] 5. **预期PEG因子**: - 近一周收益:0.75%[24] - 近一月收益:2.07%[24] - 今年以来收益:7.23%[24] 6. **一年动量因子**: - 近一周收益:0.84%[28] - 近一月收益:2.33%[28] - 今年以来收益:3.83%[28] 附录 - **MFE组合构建方式**:通过线性规划最大化单因子暴露,控制行业、风格等约束[63] - 目标函数:$$max\ f^{T}w$$[63] - 约束条件:风格偏离、行业偏离、换手率等[63]
机器学习因子选股月报(2025年7月)-20250630
西南证券· 2025-06-30 12:35
量化模型与构建方式 1. **模型名称:GAN_GRU模型** - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14] 2. **GAN部分**: - 生成器(LSTM):输入原始量价特征(40,18),输出生成的特征(40,18)[29][32] - 判别器(CNN):处理二维时序特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 生成器损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$[20][23] 3. **GRU部分**:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18] 4. **训练细节**:半年度滚动训练,Adam优化器,学习率1e-4,损失函数为IC[14] - **模型评价**:通过对抗训练提升特征生成能力,保留时序性质的同时增强特征逼真度[26][29] --- 模型的回测效果 1. **GAN_GRU模型** - **IC均值**:11.54%(全A股,2019-2025)[36] - **ICIR**:0.89[37] - **年化超额收益率**:24.95%[37] - **信息比率(IR)**:1.56[37] - **最大回撤**:27.29%[37] - **最新一期IC**:8.34%(2025年6月)[36] - **行业表现**:建筑装饰、公用事业等行业IC均值最高(19.68%、17.15%)[37][39] --- 量化因子与构建方式 1. **因子名称:GAN_GRU因子** - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][36] - **因子具体构建过程**: 1. 模型输出预测收益pRet 2. 截面标准化+行业市值中性化处理[18] - **因子评价**:在全A股范围内表现稳定,行业适应性较强[36][40] --- 因子的回测效果 1. **GAN_GRU因子** - **多头组合超额收益**: - 家用电器行业最高(7.27%单月,5.90%近一年)[40][41] - 全行业近一年均跑赢基准[40] - **行业IC排名**:建筑装饰(26.10%单月)、基础化工(25.43%)[37][39] - **换手率**:0.83[37] --- 多头组合示例(2025年6月) - **前十个股**:凤凰传媒、川投能源、海尔智家等[42][44] - **行业排名第一个股**:中国电建(建筑装饰)、宝信软件(计算机)等[42]
东方因子周报:Growth风格登顶,EPTTM一年分位点因子表现出色
东方证券· 2025-06-02 18:30
报告行业投资评级 未提及 报告的核心观点 本周市场正收益风格集中在Growth风格上,负收益风格表现在Size风格上;EPTTM一年分位点是中证全指成分股中本周表现最好的因子 [1] 各部分总结 风格因子近期表现 - Growth因子本周正收益2.17%,较上一周0.79%显著提升,市场对成长型股票偏好增强;Trend因子本周收益1.39%,较上一周3.09%有所回落但仍为正收益,市场对趋势投资策略认可较高;Beta因子本周收益0.49%,较上一周 -2.86%显著回升,市场对高Beta股票关注恢复 [9] - Liquidity、SOE、Volatility、Certainty、Value、Cubic size、Size因子本周收益为负,市场对高流动性资产、国有企业股票、高波动性资产、确定性投资策略、价值投资策略、小盘股的关注度减弱 [10] 因子表现监控 因子库 - 指数增强因子库涵盖估值、成长、盈利、分析师预期、景气度、分红、公司治理、PEAD、流动性、波动率、反转与动量等维度 [16] 不同样本空间因子表现 - 沪深300指数选股空间:最近一周分析师认可度等因子表现较好,一个月反转等因子表现较差;最近一月预期PEG等因子表现较好,单季净利同比增速环比变化等因子表现较差 [6][21] - 中证500指数选股空间:最近一周单季营收同比增速等因子表现较好,一年动量等因子表现较差;最近一月一个月反转等因子表现较好,一个月UMR等因子表现较差 [6][25] - 中证800指数选股空间:最近一周单季EP等因子表现较好,一个月反转等因子表现较差;最近一月预期PEG等因子表现较好,单季净利同比增速环比变化等因子表现较差 [6][29] - 中证1000指数选股空间:最近一周EPTTM一年分位点等因子表现较好,盈余公告最低价跳空超额等因子表现较差;最近一月高管薪酬等因子表现较好,公募持股市值等因子表现较差 [6][33] - 国证2000指数选股空间:最近一周预期ROE环比变化等因子表现较好,三个月UMR等因子表现较差;最近一月标准化预期外盈利等因子表现较好,公募持股市值等因子表现较差 [6][38] - 创业板指选股空间:最近一周预期ROE环比变化等因子表现较好,EPTTM一年分位点等因子表现较差;最近一月标准化预期外盈利等因子表现较好,EPTTM一年分位点等因子表现较差 [6][43] - 中证全指选股空间:最近一周EPTTM一年分位点等因子表现较好,一个月反转等因子表现较差;最近一月六个月UMR等因子表现较好,一年动量等因子表现较差 [6][47] 公募基金指数增强产品表现跟踪 沪深300指数增强产品 - 最近一周超额收益最高1.42%,最低 -0.15%,中位数0.37%;前三名分别为申万菱信沪深300优选指数增强A、中欧沪深300指数量化增强A、申万菱信沪深300指数增强A [6][52] 中证500指数增强产品 - 最近一周超额收益最高0.90%,最低 -0.04%,中位数0.33%;前三名分别为华泰紫金中证500指数增强A、平安中证500指数增强A、博时中证500指数增强A [6][56] 中证1000指数增强产品 - 最近一周超额收益最高0.95%,最低 -0.24%,中位数0.18%;前三名分别为汇添富中证1000指数增强A、招商中证1000指数增强A、万家中证1000指数增强A [6][60] 附录 - 构建MFE组合可判断因子在给定基准中是否有效,采用组合优化模型构建单因子MFE组合,目标函数为最大化单因子暴露,约束条件包括风格、行业、个股偏离度、成分股权重占比、个股权重上下限、换手率等 [61]
机器学习因子选股月报(2025年6月)
西南证券· 2025-05-29 14:10
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10]。 - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14]。 2. **预处理**:时序去极值+标准化,截面标准化[14]。 3. **GAN部分**: - 生成器(G):LSTM结构,输入噪声生成逼真量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - 判别器(D):CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][21][23][26]。 4. **GRU部分**:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18]。 - **模型评价**:有效捕捉量价时序特征的非线性关系,生成因子具有较高区分度[9][18]。 --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37]。 - **因子具体构建过程**: 1. 模型训练:半年滚动训练(每年6月30日、12月31日更新),预测未来20日收益[14]。 2. 因子生成:对全A股(剔除ST及上市不足半年股票)输出pRet,中性化处理[14][18]。 --- 模型的回测效果 1. **GAN_GRU模型**: - IC均值:11.57% | ICIR:0.89 | 年化超额收益率:25.01% - 年化波动率:24.02% | IR:1.66 | 最大回撤:27.29%[37][38]。 --- 因子的回测效果 1. **GAN_GRU因子**: - **全A表现**: - 近一年IC均值:11.54% | 最新一期IC:-0.28%[37][38]。 - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39]。 - 近一年超额收益前五行业:石油石化(5.60%)、建筑材料(5.29%)、家用电器(5.06%)[42]。 - **多头组合**: - 当期超额收益最高行业:商贸零售(8.22%)、国防军工(7.15%)[42]。 - 最新前十个股:顺威股份、博深股份、九典制药等[44][48]。
因子选股系列之一一六:NeuralODE:时序动力系统重构下深度学习因子挖掘模型
东方证券· 2025-05-27 16:43
量化模型与构建方式 1. **模型名称**:RNN+Neural ODE+MLP融合模型 **模型构建思路**:通过RNN进行时序数据压缩和降维,利用Neural ODE学习时序演化规律重构数据,最后通过MLP捕捉alpha信息以提升选股鲁棒性[3][6]。 **模型具体构建过程**: - **Encoder层(RNN)**:对时序数据降维和特征提取。 - **Decoder层(Neural Jump SDE)**:拟合时序数据的微分动力系统,重构数据。公式: $$\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t),t\in[0,T]\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.$$ 其中$v$和$\sigma$为全连接层加激活函数构成[22][26]。 - **MLP层**:对重构数据提取特征预测收益率。损失函数包括重构损失、KL散度和MSE损失: $$\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}$$[31][32] **模型评价**:通过数据重构降低噪声影响,提升样本外泛化能力[3][34]。 2. **模型名称**:Baseline模型(ABCM模型) **模型构建思路**:基于神经网络的alpha和beta因子协同挖掘,生成选股因子[37]。 **模型评价**:作为对比基准,新模型在多头超额和抗风险能力上显著优于Baseline[39][43]。 3. **衍生模型**: - **Model1**:Neural ODE生成因子与Baseline因子等权组合[42]。 - **Model2**:Neural SDE生成因子与Baseline因子等权组合[42]。 - **Model3**:Model1因子剥离短期风险后的残差因子[42]。 --- 量化因子与构建方式 1. **因子名称**:Model1因子 **因子构建思路**:基于RNN+Neural ODE+MLP模型生成的alpha因子,通过数据重构增强稳定性[6][26]。 **因子评价**:多头超额显著提升,换手率降低,抗极端市场能力更强[39][43]。 2. **因子名称**:行业轮动因子 **因子构建思路**:将选股因子按行业流通市值加权聚合,生成行业得分[50][51]。 **因子评价**:Model1因子行业RankIC达12.55%,Top组年化超额25.27%,优于Baseline[52][53]。 --- 模型的回测效果 1. **RNN+Neural ODE+MLP模型(Model1)**: - **RankIC均值**:16.33%(中证全指)[39] - **Top组年化超额**:54.54%[39] - **最大回撤**:-6.63%(2024年)[43] - **换手率**:59.73%(较Baseline下降)[39] 2. **Baseline模型**: - **RankIC均值**:16.39%[39] - **Top组年化超额**:52.63%[39] - **最大回撤**:-5.25%[43] 3. **行业轮动表现**: - **Model1因子**:RankIC 12.55%,Top组超额25.27%[52] - **Baseline因子**:RankIC 12.20%,Top组超额23.05%[52] --- 因子的回测效果 1. **指数增强策略**: - **沪深300指增**:Model1年化超额16.67%,夏普比率3.14[65]。 - **中证500指增**:Model1年化超额21.37%,夏普比率3.21[72]。 - **中证1000指增**:Model1年化超额32.41%,夏普比率4.37[80]。 2. **Top组合绝对收益**: - **Model1**:年化收益43.80%,最大回撤-40.84%[59]。 - **Baseline**:年化收益40.15%,最大回撤-42.41%[59]。 --- 关键公式总结 1. **Neural SDE前向传播**: $$\left\{\begin{array}{l}dx(t)=v(x(t),t)dt+\sigma(x(t),t)dB(t)\\ \hat{y}=F(x(T))\\ x(0)=\hat{x}\end{array}\right.$$[22] 2. **总损失函数**: $$\alpha\log(p(x|\theta))+\beta\operatorname{KL}(N(\mu,e x p(\sigma/2))||N(0,\delta I))+(\hat{\sigma}-y)^{2}$$[32]