港股投资周报:医药板块领涨,港股精选组合年内上涨60.69%-20251129
国信证券· 2025-11-29 16:04
根据提供的研报内容,以下是关于量化模型和因子的总结。 量化模型与构建方式 1. **模型名称:港股精选组合模型**[13][14] * **模型构建思路**:该模型旨在对分析师推荐股票池进行基本面和技术面的双层优选,挑选出同时具备基本面支撑和技术面共振的超预期股票[13][14]。 * **模型具体构建过程**:模型构建分为两个主要步骤: 1. **构建分析师推荐股票池**:以分析师上调盈利预测、分析师首次关注、分析师研报标题超预期事件作为分析师推荐事件,构建初始股票池[14]。 2. **双层优选**:对分析师推荐股票池中的股票,从基本面和技术面两个维度进行精选,具体筛选标准未在提供内容中详细展开[13][14]。 2. **因子/筛选方法名称:平稳创新高股票筛选方法**[19][21][22] * **因子构建思路**:基于动量效应和趋势跟踪策略的有效性,从创出250日新高的股票中,根据分析师关注度、股价相对强弱、股价路径平稳性、创新高连续性等角度筛选出趋势更为稳健的股票[19][21][22]。 * **因子具体构建过程**:筛选过程包含多个步骤和因子: 1. **确定基础股票池**:样本池为全部港股,但需剔除成立时间不超过15个月的股票。在此基础上,筛选出过去20个交易日内曾创出250日新高的股票[21][22]。 2. **计算250日新高距离**:该指标用于量化股价接近新高的程度,计算公式为: $$250\ 日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ 其中,`Closet` 为最新收盘价,`ts_max(Close, 250)` 为过去250个交易日收盘价的最大值。若最新收盘价创出新高,则该值为0;若股价回落,则为正值,表示回落幅度[21]。 3. **多维度筛选**: * **分析师关注度**:过去6个月买入或增持评级的分析师研报不少于5份[22]。 * **股价相对强弱**:过去250日涨跌幅位于样本池前20%[22]。 * **股价平稳性**:在满足上述条件的股票池内,使用以下两个指标综合打分,取排名在前50%的股票(最少取50只): * **价格路径平滑性(股价位移路程比)**:具体计算公式未提供[22]。 * **创新高持续性**:过去120日的250日新高距离在时间序列上的均值[22]。 * **趋势延续性**:过去5日的250日新高距离在时间序列上的均值,取排序靠前的50只股票[22]。 模型的回测效果 1. **港股精选组合模型**[14][16][18] * 回测区间:2010年1月1日 - 2025年6月30日[14] * 年化收益:19.11%[14][18] * 相对恒生指数超额收益:18.48%[14][18] * 信息比率 (IR):1.22[18] * 跟踪误差:14.55%[18] * 最大回撤:23.73%[18] * 收益回撤比:0.78[18] * 近期表现(2025年1月2日 - 2025年11月28日): * 绝对收益:60.69%[16] * 相对恒生指数超额收益:31.78%[16] 量化因子与构建方式 1. **因子名称:250日新高距离**[21] * **因子构建思路**:量化当前股价相对于过去一段时间最高点的位置,用于识别创出新高的股票以及衡量股价趋势的强度[21]。 * **因子具体构建过程**:计算最新收盘价与过去250个交易日最高收盘价的相对距离。公式如下: $$250\ 日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ 其中,`Closet` 为最新收盘价,`ts_max(Close, 250)` 为过去250个交易日收盘价的最大值[21]。 因子的回测效果 (报告中未提供“250日新高距离”因子独立的回测绩效指标,如IC值、IR值等)
量化组合跟踪周报 20251129:小市值风格占优,机构调研组合超额显著-20251129
光大证券· 2025-11-29 15:31
量化模型与构建方式 1. **模型名称:PB-ROE-50 组合** [25] **模型构建思路:** 基于市净率(PB)和净资产收益率(ROE)这两个核心估值与盈利能力指标进行选股 [25] **模型具体构建过程:** 模型的具体构建过程未在提供的报告内容中详细描述 [25] 2. **模型名称:机构调研组合** [28] **模型构建思路:** 利用公募基金和私募基金的调研活动信息作为选股信号 [28] **模型具体构建过程:** 报告提及了公募调研选股策略和私募调研跟踪策略,但具体的组合构建细节(如如何根据调研信息筛选股票、权重分配等)未在提供的报告内容中详细说明 [28] 3. **模型名称:大宗交易组合** [32] **模型构建思路:** 基于“高成交、低波动”原则,从发生大宗交易的股票中筛选后续表现更佳的股票 [32] **模型具体构建过程:** 经过测算,选择“大宗交易成交金额比率”越高、“6 日成交金额波动率”越低的股票,通过月频调仓方式构造组合 [32] 4. **模型名称:定向增发组合** [38] **模型构建思路:** 以定向增发的股东大会公告日为事件节点,进行事件驱动选股 [38] **模型具体构建过程:** 以股东大会公告日为时间节点,综合考虑市值因素、调仓周期以及对仓位的控制来构造组合,具体构建方法可参考其专题报告 [38] 模型的回测效果 1. **PB-ROE-50 组合** [26] **本周超越基准收益率(中证500):** 0.47% **今年以来超额收益率(中证500):** 2.06% **本周绝对收益率(中证500):** 3.63% **今年以来绝对收益率(中证500):** 25.34% **本周超越基准收益率(中证800):** 1.54% **今年以来超额收益率(中证800):** 15.14% **本周绝对收益率(中证800):** 3.61% **今年以来绝对收益率(中证800):** 34.74% **本周超越基准收益率(全市场):** 1.59% **今年以来超额收益率(全市场):** 18.32% **本周绝对收益率(全市场):** 4.45% **今年以来绝对收益率(全市场):** 42.79% 2. **机构调研组合** [29] **公募调研选股策略本周超越基准收益率(中证800):** 3.63% **公募调研选股策略今年以来超额收益率(中证800):** 16.50% **公募调研选股策略本周绝对收益率:** 5.74% **公募调研选股策略今年以来绝对收益率:** 36.32% **私募调研跟踪策略本周超越基准收益率(中证800):** 3.32% **私募调研跟踪策略今年以来超额收益率(中证800):** 15.79% **私募调研跟踪策略本周绝对收益率:** 5.43% **私募调研跟踪策略今年以来绝对收益率:** 35.49% 3. **大宗交易组合** [33] **本周超越基准收益率(中证全指):** 2.93% **今年以来超额收益率(中证全指):** 39.24% **本周绝对收益率:** 5.83% **今年以来绝对收益率:** 68.03% 4. **定向增发组合** [39] **本周超越基准收益率(中证全指):** -0.01% **今年以来超额收益率(中证全指):** -3.70% **本周绝对收益率:** 2.81% **今年以来绝对收益率:** 16.21% 量化因子与构建方式 1. **因子名称:动量弹簧因子** [12][14][18] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在多个股票池中表现优异 [12][14][18] 2. **因子名称:早盘后收益因子** [12][14][18] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在多个股票池中表现优异 [12][14][18] 3. **因子名称:单季度ROA** [12] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在沪深300股票池中表现较好 [12] 4. **因子名称:5日反转** [14][18] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在中证500和流动性1500股票池中表现较好 [14][18] 5. **因子名称:单季度营业收入同比增长率** [18] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在流动性1500股票池中表现较好 [18] 6. **因子名称:beta 因子** [20] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在全市场股票池中获得正收益,显示市场动量效应显著 [20] 7. **因子名称:残差波动率因子** [20] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在全市场股票池中获得正收益,且在多数行业内表现较好 [20][23] 8. **因子名称:动量因子** [20] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在全市场股票池中获得正收益,显示市场动量效应显著 [20] 9. **因子名称:规模因子** [20] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在全市场股票池中获得负收益,显示市场小市值风格占优 [20] 10. **因子名称:非线性市值因子** [20] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在全市场股票池中获得负收益 [20] 11. **因子名称:净资产增长率因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在综合、通信行业表现较好 [23] 12. **因子名称:净利润增长率因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在美容护理、轻工制造、通信行业表现较好 [23] 13. **因子名称:5日动量因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在多数行业表现为反转效应,在农林牧渔、纺织服装行业反转效应明显 [23] 14. **因子名称:1月动量因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在美容护理、食品饮料行业表现为动量效应,在综合、纺织服装、农林牧渔、建筑材料行业反转效应显著 [23] 15. **因子名称:每股净资产因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在计算机行业表现较好 [23] 16. **因子名称:每股经营利润 TTM 因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在通信行业表现较好 [23] 17. **因子名称:BP 因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在商业贸易行业表现较好 [23] 18. **因子名称:EP 因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在综合行业表现较好 [23] 19. **因子名称:对数市值因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在通信、综合行业表现较好 [23] 20. **因子名称:流动性因子** [23] **因子构建思路:** 未在提供的报告内容中详细说明 **因子具体构建过程:** 未在提供的报告内容中详细说明 **因子评价:** 本周在多数行业表现较好 [23] 因子的回测效果 *(注:报告提供了多个股票池下众多因子在“最近1周”、“最近1个月”、“最近1年”、“最近10年”等多个时间窗口的表现数据 [13][15][19]。由于因子数量众多且指标窗口期不完全统一,此处不逐一列出,具体数值请参考报告中对应的图表 [13][15][19]。)*
金工ETF点评:宽基ETF单日净流出31.50亿元,建筑装饰、军工拥挤变幅较大
太平洋证券· 2025-11-28 22:13
根据提供的研报内容,总结如下: 量化模型与构建方式 1. **模型名称:行业拥挤度监测模型**[3] * **模型构建思路**:通过构建模型对申万一级行业指数的拥挤度进行每日监测,以识别交易过热或过冷的行业[3] * **模型具体构建过程**:报告未提供该模型的具体构建过程和公式 2. **模型名称:溢价率 Z-score 模型**[4] * **模型构建思路**:通过滚动测算ETF的溢价率Z-score,搭建ETF产品筛选信号模型,以识别存在潜在套利机会的标的[4] * **模型具体构建过程**:报告未提供该模型的具体构建过程和公式,但提及核心指标为“溢价率 Z-score”[4] 量化因子与构建方式 1. **因子名称:行业拥挤度**[3] * **因子构建思路**:用于衡量特定行业交易的热度或拥挤程度[3] * **因子具体构建过程**:报告未提供该因子的具体构建过程和公式 2. **因子名称:溢价率 Z-score**[4] * **因子构建思路**:基于ETF的IOPV溢价率计算其Z-score,用于判断当前溢价率在历史序列中的相对位置,识别异常值[4] * **因子具体构建过程**:报告未提供该因子的具体计算公式,但提及其为标准化后的溢价率指标[4] 模型的回测效果 (报告未提供相关模型的量化回测效果指标,如年化收益率、夏普比率、最大回撤等) 因子的回测效果 (报告未提供相关因子的量化测试效果指标,如IC值、IR、因子收益率等)
热点追踪周报:由创新高个股看市场投资热点(第 221 期)-20251128
国信证券· 2025-11-28 20:39
根据提供的研报内容,以下是关于量化模型和因子的总结: 量化因子与构建方式 1. **因子名称:250日新高距离**[11] * **因子构建思路**:该因子用于衡量当前股价相对于过去250个交易日最高价的回落幅度,数值越小代表股价越接近历史高点,通常与动量效应和趋势跟踪策略相关[11] * **因子具体构建过程**:计算步骤如下 * 首先,计算过去250个交易日的收盘价最大值:`ts_max(Close, 250)` * 然后,使用最新收盘价 `Closet` 与上述最大值进行比较,计算公式为: $$250日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ * 若最新收盘价创出新高,则因子值为0;若股价从高点回落,则因子值为正,代表回落幅度[11] 2. **因子/模型名称:平稳创新高股票筛选模型**[23][26] * **模型构建思路**:该模型旨在从近期创250日新高的股票中,进一步筛选出价格路径相对平滑、趋势延续性好的股票,其理论基础在于研究表明平滑的动量效应可能更强[23] * **模型具体构建过程**:这是一个多步骤的筛选流程,具体条件如下[23][26] * **初选股票池**:过去20个交易日内曾创出250日新高的股票[23] * **分析师关注度**:过去3个月内,获得“买入”或“增持”评级的分析师研报数量不少于5份[26] * **股价相对强弱**:过去250日涨跌幅位于全市场前20%[26] * **股价平稳性与创新高持续性筛选**:在满足以上条件的股票池内,使用以下两个指标综合打分,并选取排名在前50%的股票 * **价格路径平滑性**:使用股价位移路程比衡量,计算公式为 `过去120日涨跌幅的绝对值 / 过去120日日涨跌幅绝对值加总`[23][26] * **创新高持续性**:过去120日内的250日新高距离在时间序列上的均值[26] * **趋势延续性筛选**:计算过去5日的250日新高距离在时间序列上的均值,并最终选取该指标排序最靠前的50只股票[26] 模型/因子的回测效果 (注:研报中未提供模型或因子在历史数据上的系统化回测指标(如年化收益率、夏普比率、信息比率IR、最大回撤等)及其具体数值,仅展示了特定时点的筛选结果和部分描述性统计,因此本部分无具体指标取值可总结。)
攻守兼备红利策略的轮动增强
长江证券· 2025-11-28 19:11
量化模型与构建方式 1. **模型名称:攻守兼备红利策略(原策略)**[18] * **模型构建思路**:采用类指数分层选股的方式,旨在通过多维度合成防御性和进攻性得分,在稳健组合内选择进攻性好的股票组合来战胜中证红利全收益指数[18] * **模型具体构建过程**: 1. **股票池筛选**:在中证全指成份股中筛选出连续分红的高股息股票池,筛选标准包括:过去一年日均总市值和日均成交额均在前80%;过去三年连续现金分红且每年税后现金股息率均大于0;过去一年股息支付率剔除前5%和负值;过去两年现金股息均实现正增长[18][21] 2. **防御性筛选**:在高股息股票池中,使用3年平均股息率TTM、480个交易日下行波动率、3年扣非ROE均值/标准差合成防御性得分,降序排序保留前30%个股,形成高股息防御股票池[18] 3. **进攻性筛选**:在高股息防御股票池中,使用预测股息率、相对动量240_20、单季度扣非净利润同比合成进攻性得分,降序排序保留前30或50只个股[18] 4. **组合构建**:对最终选出的股票采用股息率TTM加权,并控制银行个股数量占比上限在20%,形成月频或季频调仓策略[18] 2. **模型名称:轮动增强后的攻守兼备红利策略**[11][74] * **模型构建思路**:保留原策略分层选股的第一步防御性筛选,在第二步筛选时根据宏观预期修正信号,动态调整防御性得分和进攻性得分的权重,以进行风格轮动,提升组合表现,特别是回撤控制能力[3][11][74] * **模型具体构建过程**: 1. **股票池与防御性筛选**:与原策略相同,先筛选高股息股票池,然后计算防御性得分并保留前30%个股[11][74] 2. **轮动规则**:根据宏观预期修正信号(EWMA)决定第二步筛选的得分合成方式[11][74] * 当宏观预期上修时:仍仅使用进攻性得分筛选个股(即权重为100%进攻性得分)[74] * 当宏观预期下修时:使用综合得分筛选个股,综合得分 = 0.5 × 进攻性得分 + 0.5 × 防御性得分[74] 3. **最终筛选与组合构建**:根据上述轮动规则得到的得分,降序排序保留前30只个股,保留银行股数量占比不超过20%的要求,采用月频调仓,股息率TTM加权[74] * **模型评价**:轮动增强后的方案,回撤控制角度提升较明显[3][11] 模型的回测效果 1. **攻守兼备红利策略(原策略)**[25][30] * 年度收益(全区间年化):14.88%[83] * 最大回撤(全区间):27.88%[83] * 年化波动(全区间):18.00%[83] * 胜率(全区间):未直接提供,分年数据见原文表1、表2[25][30] * 夏普比(全区间):未直接提供,分年数据见原文表1、表2[25][30] * 超额收益(相对中证红利全收益,全区间年化):未直接提供,分年数据见原文表1、表2[25][30] * 信息比率(IR)(全区间):未直接提供,分年数据见原文表1、表2[25][30] 2. **轮动增强后的攻守兼备红利策略**[80][83] * 年度收益(全区间年化):15.32%[80][83] * 最大回撤(全区间):24.37%[80][83] * 年化波动(全区间):17.66%[80][83] * 胜率(全区间):66.39%[80] * 夏普比(全区间):0.89[80] * 超额收益(相对中证红利全收益,全区间年化):6.12%[80] * 信息比率(IR)(全区间):0.88[80] 量化因子与构建方式 1. **因子名称:防御性得分**[18][75] * **因子构建思路**:综合衡量股票在分红稳定性、风险控制和盈利质量方面的防御属性[18] * **因子具体构建过程**:防御性得分由以下三个因子按指定权重合成,每个指标先进行排序分位化处理(除下行波动率降序排序外,均升序排序)[75] * 3年平均股息率TTM:权重 0.5 * 480个交易日下行波动率:权重 0.3 * 3年扣非ROE均值/标准差:权重 0.2 2. **因子名称:进攻性得分**[18][75] * **因子构建思路**:综合衡量股票在未来分红潜力、价格趋势和盈利增长方面的进攻属性[18] * **因子具体构建过程**:进攻性得分由以下三个因子按指定权重合成,每个指标先进行排序分位化处理后升序排序[75] * 预测股息率:权重 0.5 * 相对动量_240_20:权重 0.3 * 单季度扣非净利润同比:权重 0.2 3. **因子名称:预测股息率**[49] * **因子构建思路**:使用过去平均股息支付率和分析师预测净利润来估算未来的股息率[49] * **因子具体构建过程**:预测股息率 = 过去三年股息支付率均值 * 分析师一致预测净利润 / 最新总市值[49] 4. **因子名称:三年平均股息率TTM**[49] * **因子构建思路**:使用近三年的股息率TTM数据进行平滑,以反映更稳定的分红水平[49] * **因子具体构建过程**:三年平均股息率TTM = (当前股息率TTM + 12个月前股息率TTM + 24个月前股息率TTM) / 3[49] 5. **因子名称:扣非净利润Q同比**[49] * **因子构建思路**:衡量公司最新单季度的扣非净利润同比增长情况[49] * **因子具体构建过程**:扣非净利润Q同比 = (最新单季度扣非净利润 - 去年同比期单季度扣非净利润) / abs(去年同比期单季度扣非净利润)[49] 6. **因子名称:3年扣非ROE均值/标准差**[49] * **因子构建思路**:衡量公司近三年扣非ROE的稳定性,比值越高说明盈利越稳定[49] * **因子具体构建过程**:3年扣非ROE均值/标准差 = 最近三年年报扣非净利润均值 / 最近三年年报扣非净利润标准差[49] 7. **因子名称:相对动量_240_20**[49] * **因子构建思路**:衡量股票当前价格相对于过去一段时间(剔除近期)最高点的位置,反映趋势强度[49] * **因子具体构建过程**:相对动量_240_20 = 当前股价 / (最近240交易日至最近20交易日之间的220个交易日收盘价最大值 - 最近240交易日至最近20交易日之间的220个交易日收盘价最小值)[49] 公式为:$$相对动量\_240\_20 = \frac{当前股价}{Max(Close_{t-240}, ..., Close_{t-20}) - Min(Close_{t-240}, ..., Close_{t-20})}$$ 8. **因子名称:480日下行波动**[49] * **因子构建思路**:衡量股票在过去480个交易日中下跌日的波动率,反映下行风险[49] * **因子具体构建过程**:计算过去480个交易日中日跌幅数据的标准差[49] 因子的回测效果 *(注:报告中对单个因子的回测效果主要体现在多空组合的分析师预期检验和收益检验中,并未提供类似模型的综合回测指标(如年化收益、最大回撤等)。检验结果以回归系数和P值形式呈现,表明因子在不同宏观预期下的有效性,具体数值详见原文表5至表14。)*
热点追踪周报:由创新高个股看市场投资热点(第221期)-20251128
国信证券· 2025-11-28 17:45
根据提供的研报内容,以下是关于量化模型和因子的总结。 量化因子与构建方式 1. **因子名称:250日新高距离**[11] * **因子构建思路**:该因子用于衡量当前股价相对于过去250个交易日最高价的回落幅度,数值越小表示股价越接近历史高点,通常与动量效应和趋势跟踪策略相关[11] * **因子具体构建过程**:计算步骤如下 * 首先,计算过去250个交易日的收盘价最大值:`ts_max(Close, 250)` * 然后,使用最新收盘价 `Closet` 与上述最大值进行比较,计算公式为: $$250日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ * 若最新收盘价创出新高,则因子值为0;若股价从高点回落,则因子值为正,代表回落幅度[11] 2. **因子名称:平稳创新高股票筛选因子(复合因子)**[23][26] * **因子构建思路**:该复合因子旨在从创新高的股票中,进一步筛选出那些价格路径平稳、趋势延续性好的股票,其理论基础在于平滑的动量效应可能更强[23] * **因子具体构建过程**:这是一个多步骤的筛选流程,具体条件如下 * **初选股票池**:筛选出过去20个交易日内创过250日新高的股票[19] * **分析师关注度**:过去3个月内,获得“买入”或“增持”评级的分析师研究报告不少于5份[26] * **股价相对强弱**:过去250日涨跌幅位于全市场前20%[26] * **股价平稳性与创新高持续性**:在满足以上条件的股票池内,使用以下两个指标综合打分,并选取排名在前50%的股票 * **价格路径平滑性**:使用股价位移路程比衡量,计算公式为 `过去120日涨跌幅的绝对值 / 过去120日日涨跌幅绝对值加总`[23][26] * **创新高持续性**:过去120日的250日新高距离在时间序列上的均值[26] * **趋势延续性**:过去5日的250日新高距离在时间序列上的均值,最终选取此指标排序最靠前的50只股票[26] 因子回测效果 *注:研报中未提供针对单个因子的历史回测绩效指标(如IC值、IR值、多空收益等),而是展示了基于特定因子(250日新高距离)和筛选方法(平稳创新高股票筛选)在特定时点(2025年11月28日)的截面数据结果。因此,此处列出的是筛选结果的统计值,而非传统意义上的因子回测绩效。* 1. **250日新高距离因子** * 截至2025年11月28日,主要指数该因子取值:上证指数3.50%,深证成指5.40%,沪深300指数4.66%,中证500指数6.85%,中证1000指数4.10%,中证2000指数2.78%,创业板指8.17%,科创50指数13.77%[12] * 截至2025年11月28日,中信一级行业中该因子取值较小的行业(距离新高较近):家电行业0.92%,纺织服装行业2.88%,轻工制造行业1.45%,基础化工行业6.39%,通信行业5.48%[13] 2. **平稳创新高股票筛选因子** * 应用该复合因子筛选方法,在截至2025年11月28日的时点,从全市场1043只创新高股票中最终筛选出26只平稳创新高股票[27] * 这26只股票的板块分布为:周期板块10只,制造板块8只,科技板块、医药板块、消费板块、大金融板块均有股票入选[27]
机器学习因子选股月报(2025年12月)-20251128
西南证券· 2025-11-28 15:02
根据提供的研报内容,总结如下: 量化模型与构建方式 1. **模型名称:GAN_GRU模型**[4][13] * **模型构建思路**:该模型是一种深度学习选股模型,首先利用生成式对抗网络(GAN)对量价时序特征进行增强处理,然后再利用门控循环单元(GRU)网络对处理后的时序特征进行编码,最终输出股票的预测收益作为选股因子[4][13]。 * **模型具体构建过程**: * **基础特征**:模型使用18个量价特征,包括日频特征(如前收盘价、开盘价、收盘价、最高价、最低价、成交量、成交金额、涨跌幅、振幅、换手率、均价)和月频特征(如月成交金额、月涨跌幅、月振幅、月换手率、月收盘最高价、月收盘最低价、月日均换手率)[14][17][19]。 * **数据预处理与采样**:使用所有个股过去400天内的18个量价特征,每5个交易日进行一次特征采样。每次采样的特征形状为40天*18个特征,用以预测未来20个交易日的累计收益[18]。在时序上对每个特征进行去极值和标准化处理,并在个股截面上进行标准化处理[18]。训练集与验证集的比例为80%:20%[18]。 * **基础模型(GRU+MLP)**:构建一个包含两层GRU层(GRU(128, 128))和后续多层感知机(MLP(256, 64, 64))的神经网络。模型最终输出的预测收益(pRet)作为选股因子[22]。 * **GAN特征增强**:为了提升特征质量,引入GAN模型对原始量价时序特征(Input_Shape=(40,18))进行增强[33][37]。 * **生成器(G)**:采用长短期记忆网络(LSTM)作为生成器,以保留输入特征的时序性质。其目标是生成逼真的量价时序特征。生成器的损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 是随机噪声,\(G(z)\) 是生成器生成的数据,\(D(G(z))\) 是判别器判断生成数据为真实数据的概率[24][25]。 * **判别器(D)**:采用卷积神经网络(CNN)作为判别器,将量价时序特征视为二维图像进行处理。其目标是区分真实数据与生成数据。判别器的损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 是真实数据,\(D(x)\) 是判别器对真实数据的输出概率,\(D(G(z))\) 是判别器对生成数据的输出概率[27]。 * **训练过程**:生成器和判别器交替训练。先训练判别器,再训练生成器,循环迭代直至模型收敛[29][30][34]。 * **GAN_GRU整合**:将训练好的GAN模型中的生成器(G)用于处理原始量价时序特征,生成增强后的特征。然后将增强后的特征输入到前述的GRU+MLP基础模型中进行训练和预测[38]。 * **训练与预测设置**:采用半年滚动训练方式,每年6月30日和12月31日进行模型训练,用于未来半年的预测。回测采用月频调仓。选股范围为全A股,剔除ST股及上市不足半年的股票。训练超参数包括:batch_size为截面股票数量、优化器为Adam、学习速率为1e-4、损失函数为IC、早停轮数为10、最大训练轮数为50[15][18]。 量化因子与构建方式 1. **因子名称:GAN_GRU因子**[4][13] * **因子构建思路**:GAN_GRU因子是GAN_GRU模型最终输出的股票预测收益(pRet)[22]。该因子在用于测试前,会经过行业和市值中性化处理,并进行标准化[22]。 * **因子具体构建过程**:因子值直接来源于GAN_GRU模型的输出,即模型对每只股票未来20个交易日收益的预测值[18][22]。构建过程与上述GAN_GRU模型的构建过程完全一致。 模型的回测效果 1. **GAN_GRU模型**(基于其输出的因子进行回测,回测期间:2019年1月至2025年11月,月频调仓)[41][42] * IC均值:0.1131*** * ICIR(未年化):0.90 * 换手率:0.83 * 年化收益率:37.52% * 年化波动率:23.52% * 信息比率(IR):1.59 * 最大回撤率:27.29% * 年化超额收益率:23.14% 因子的回测效果 1. **GAN_GRU因子**[41][42] * 最新一期IC(截至2025年11月27日):0.1241*** * 近一年IC均值(截至2025年11月27日):0.0867*** * 近期行业IC表现(2025年10月当期,申万一级行业除综合):社会服务(0.2198***)、房地产(0.2027***)、钢铁(0.1774***)、非银金融(0.1754***)、煤炭(0.1537***)[42] * 近一年行业IC均值(申万一级行业除综合):非银金融(0.1401***)、钢铁(0.1367***)、商贸零售(0.1152***)、纺织服饰(0.1124***)、公用事业(0.1092***)[42] * 近期行业多头组合超额收益(2025年11月当期,相对行业指数):环保(7.24%)、机械设备(4.37%)、房地产(4.03%)、纺织服饰(3.89%)、建筑材料(2.91%)[2][45] * 近一年行业多头组合月平均超额收益(相对行业指数):建筑材料(2.15%)、房地产(1.97%)、社会服务(1.77%)、纺织服饰(1.71%)、商贸零售(1.62%)[2][46]
A股市场快照:宽基指数每日投资动态-20251128
江海证券· 2025-11-28 14:24
根据提供的研报内容,该报告主要对A股市场各宽基指数进行多维度数据跟踪和统计分析,并未涉及具体的量化交易模型或用于选股的量化因子构建。报告内容侧重于市场状态描述和指标展示。以下是基于报告内容的总结: 量化模型与构建方式 (报告未涉及具体的量化交易模型或选股因子,此部分无相关内容) 模型的回测效果 (报告未涉及具体的量化交易模型,此部分无相关内容) 量化因子与构建方式 (报告未涉及用于选股的量化因子构建,此部分无相关内容) 因子的回测效果 (报告未涉及用于选股的量化因子,此部分无相关内容) 市场指标与构建方式 1. **指标名称:连阴连阳天数**[12] * **指标构建思路**:用于跟踪指数K线连续为阴线或阳线的天数,反映市场短期的趋势强度[12] * **指标具体构建过程**:从1开始计数,正数表示连续阳线的天数,负数表示连续阴线的天数[12] 2. **指标名称:指数与移动平均线(MA)比较**[15][16] * **指标构建思路**:通过比较指数收盘价与不同周期移动平均线(如MA5, MA10, MA20, MA60等)的位置关系,判断指数当前相对于短期、中期和长期趋势的强弱[15][16] * **指标具体构建过程**:计算指数收盘价相对于各移动平均线的偏离百分比,公式为: $$偏离百分比 = \frac{收盘价 - 移动平均线值}{移动平均线值} \times 100\%$$ [16] 3. **指标名称:指数换手率**[18] * **指标构建思路**:衡量指数成分股整体的交易活跃度[18] * **指标具体构建过程**:采用流通股本加权平均的方式计算,公式为: $$指数换手率 = \frac{\sum(成分股流通股本 \times 成分股换手率)}{\sum(成分股流通股本)}$$ [18] 4. **指标名称:收益率分布形态(峰度与偏度)**[24][26] * **指标构建思路**:通过分析指数日收益率分布的峰度和偏度,描述收益分布的集中程度和不对称性[24][26] * **指标具体构建过程**:计算近一定时期(如近5年)和当前时期指数日收益率的峰度(计算中减去了正态分布的峰度值3)和偏度,并进行对比[26] 5. **指标名称:风险溢价**[28][32] * **指标构建思路**:以十年期国债即期收益率作为无风险利率,计算指数收益率与之差,衡量投资股票市场所要求的额外风险补偿[28][32] * **指标具体构建过程**:风险溢价 = 指数收益率 - 十年期国债即期收益率,并计算其在近1年、近5年等不同窗口期的分位值及统计特征(如均值、波动率、标准差区间)[28][32] 6. **指标名称:市盈率(PE-TTM)**[40][44][45] * **指标构建思路**:使用滚动市盈率作为估值参考,衡量指数投资价值[40][44] * **指标具体构建过程**:直接获取指数的PE-TTM值,并计算其在历史数据中的分位值,同时计算近1年的均值、波动率及标准差区间[44][45] 7. **指标名称:股债性价比**[47] * **指标构建思路**:将PE-TTM的倒数(近似代表股票的盈利收益率)与十年期国债收益率进行比较,辅助判断股票和债券资产的相对吸引力[47] * **指标具体构建过程**:股债性价比 = (1 / PE-TTM) - 十年期国债即期收益率[47] 8. **指标名称:股息率**[49][54] * **指标构建思路**:反映指数的现金分红回报水平,跟踪红利投资风格的表现[49] * **指标具体构建过程**:直接获取指数的股息率值,并计算其在历史数据中的分位值,同时计算近1年的均值、波动率及标准差区间[54] 9. **指标名称:破净率**[56] * **指标构建思路**:通过统计指数中市净率(PB)小于1的成份股占比,反映市场的整体估值态度和悲观程度[56] * **指标具体构建过程**:破净率 = (指数中破净个股数量 / 指数总成分股数量) × 100%[56] 指标的具体取值 (以下数据均为报告指定日期2025年11月27日的数值或截至该日的统计值) 1. **连阴连阳天数**[12] * 中证1000日K连阳:4天 * 中证2000周K连阴:-3天 * 其他指数日K、周K、月K、季K、年K的连阴连阳天数在报告中未显示具体数值或为空白 2. **指数与移动平均线比较**[16] * 各指数相对于MA5的偏离百分比在0.3%至1.7%之间(均在MA5之上) * 各指数相对于MA10的偏离百分比在-1.2%至0.01%之间(除创业板指外均低于MA10) * 各指数相对于MA20的偏离百分比在-3.0%至-1.3%之间(均低于MA20) * 各指数相对于MA60的偏离百分比在-3.1%至-0.5%之间(均低于MA60) 3. **指数换手率**[18] * 中证2000:3.88 * 创业板指:2.43 * 中证1000:2.17 * 中证全指:1.49 * 中证500:1.21 * 沪深300:0.46 * 上证50:0.23 4. **收益率分布形态**[26] * 当前峰度:创业板指 (1.44), 中证2000 (1.40), 中证1000 (1.35), 中证500 (0.91), 中证全指 (1.00), 沪深300 (0.61), 上证50 (0.05) * 当前偏度:中证2000 (1.67), 创业板指 (1.66), 中证1000 (1.63), 中证全指 (1.62), 中证500 (1.57), 沪深300 (1.54), 上证50 (1.33) 5. **风险溢价**[32] * 当前风险溢价:中证2000 (0.30%), 中证1000 (0.12%), 上证50 (0.01%), 中证全指 (-0.01%), 沪深300 (-0.06%), 中证500 (-0.21%), 创业板指 (-0.45%) * 近5年分位值:中证2000 (54.84%), 中证1000 (51.51%), 上证50 (51.27%), 中证全指 (49.60%), 沪深300 (48.89%), 中证500 (40.32%), 创业板指 (39.29%) 6. **PE-TTM**[45] * 当前值:中证2000 (152.46), 中证1000 (46.47), 创业板指 (39.51), 中证500 (31.81), 中证全指 (20.85), 沪深300 (13.96), 上证50 (11.88) * 近5年历史分位值:中证1000 (95.21%), 中证500 (94.63%), 中证全指 (91.65%), 上证50 (85.12%), 沪深300 (81.82%), 中证2000 (80.17%), 创业板指 (53.80%) 7. **股息率**[54] * 当前值:上证50 (3.30%), 沪深300 (2.74%), 中证全指 (2.05%), 中证500 (1.41%), 中证1000 (1.14%), 创业板指 (1.04%), 中证2000 (0.78%) * 近5年历史分位值:创业板指 (71.65%), 中证1000 (50.50%), 沪深300 (37.52%), 中证全指 (36.86%), 上证50 (35.79%), 中证2000 (19.01%), 中证500 (18.26%) 8. **破净率**[56] * 当前值:上证50 (22.0%), 沪深300 (16.0%), 中证500 (12.4%), 中证1000 (7.9%), 中证全指 (6.24%), 中证2000 (3.25%), 创业板指 (1.0%)
金融工程定期:开源交易行为因子绩效月报(2025年11月)-20251128
开源证券· 2025-11-28 14:23
量化模型与构建方式 Barra风格因子模型 1. **模型名称**:Barra风格因子模型[3][13] 2. **模型构建思路**:该模型通过多个风格维度来刻画股票的风险收益特征,例如市值规模、价值/成长等[3][13] 3. **模型具体构建过程**:报告中未详细描述Barra风格因子的具体构建过程,仅提及了部分因子在特定月份的表现[3][13] 开源交易行为因子 1. **因子名称**:理想反转因子[4][14][41] 2. **因子构建思路**:A股反转之力的微观来源是大单成交,通过每日平均单笔成交金额的大小,可以切割出反转属性最强的交易日[4][14] 3. **因子具体构建过程**: * 对选定股票,回溯取其过去20日的数据[43] * 计算该股票每日的平均单笔成交金额(成交金额/成交笔数)[43] * 单笔成交金额高的10个交易日,涨跌幅加总,记作 M_high[43] * 单笔成交金额低的10个交易日,涨跌幅加总,记作 M_low[43] * 理想反转因子 M = M_high – M_low[43] * 对所有股票,都进行以上操作,计算各自的理想反转因子 M[43] 4. **因子名称**:聪明钱因子[4][14][42] 5. **因子构建思路**:从分钟行情数据的价量信息中,可以识别出机构参与交易的多寡,进而构造出跟踪聪明钱的因子[4][14] 6. **因子具体构建过程**: * 对选定股票,回溯取其过去10日的分钟行情数据[42] * 构造指标 $$S_t = |R_t| / (V_t)^{0.25}$$,其中 $$R_t$$ 为第t分钟涨跌幅,$$V_t$$ 为第t分钟成交量[42] * 将分钟数据按照指标 $$S_t$$ 从大到小进行排序,取成交量累积占比前20%的分钟,视为聪明钱交易[42] * 计算聪明钱交易的成交量加权平均价 VWAPsmart[44] * 计算所有交易的成交量加权平均价 VWAPall[44] * 聪明钱因子 $$Q = VWAP_{smart} / VWAP_{all}$$[42] 7. **因子名称**:APM因子[4][14][43] 8. **因子构建思路**:在日内的不同时段,交易者的行为模式不同,反转强度也相应有所不同[4][14] 9. **因子具体构建过程**: * 对选定股票,回溯取其过去20日数据,记逐日隔夜的股票收益率为 $$r_{night, t}$$,隔夜的指数收益率为 $$R_{night, t}$$;逐日下午的股票收益率为 $$r_{afternoon, t}$$,下午的指数收益率为 $$R_{afternoon, t}$$[43] * 将得到的40组隔夜与下午(r,R)的收益率数据进行回归:$$r = \alpha + \beta R + \epsilon$$,得到残差项 $$\epsilon$$[43] * 以上得到的40个残差中,隔夜残差记为 $$\epsilon_{night, t}$$,下午残差记为 $$\epsilon_{afternoon, t}$$,进一步计算每日隔夜与下午残差的差值 $$\delta_t = \epsilon_{night, t} - \epsilon_{afternoon, t}$$[43] * 构造统计量 stat 来衡量隔夜与下午残差的差异程度,计算公式如下($$\mu$$ 为均值,$$\sigma$$ 为标准差):$$\mathrm{stat}={\frac{\mu(\delta_{t})}{\sigma(\delta_{t})/{\sqrt{N}}}}$$[45] * 为了消除动量因子影响,将统计量 stat 对动量因子进行横截面回归:$$stat = \alpha + \beta Ret20 + \epsilon$$,其中 Ret20 为股票过去20日的收益率,代表动量因子[46] * 将回归得到的残差值 $$\epsilon$$ 作为 APM 因子[46] 10. **因子名称**:理想振幅因子[4][14][48] 11. **因子构建思路**:基于股价维度可以对振幅进行切割,不同价态下振幅因子所蕴含的信息存在结构性差异[4][14] 12. **因子具体构建过程**: * 对选定股票,回溯取其最近20个交易日数据,计算股票每日振幅(最高价/最低价-1)[48] * 选择收盘价较高的25%有效交易日,计算振幅均值得到高价振幅因子 V_high[48] * 选择收盘价较低的25%有效交易日,计算振幅均值得到低价振幅因子 V_low[48] * 将高价振幅因子 V_high 与低价振幅因子 V_low 作差,得到理想振幅因子 V = V_high - V_low[48] 13. **因子名称**:交易行为合成因子[5][32] 14. **因子构建思路**:将多个交易行为因子进行加权合成,以综合其信息[32] 15. **因子具体构建过程**: * 因子值方面,将理想反转、聪明钱、APM、理想振幅因子在行业内进行因子去极值与因子标准化[32] * 因子权重方面,滚动选取过去12期因子ICIR值作为权重,加权形成交易行为合成因子[32] 模型的回测效果 1. **Barra风格因子模型**:2025年11月,市值因子收益-0.18%,账面市值比因子收益0.20%,成长因子收益-0.23%,盈利预期因子收益-0.35%[3][13] 因子的回测效果 1. **理想反转因子**: * 全历史区间:IC均值 -0.049,rankIC均值 -0.060,信息比率 2.44,多空对冲月度胜率 77.7%[5][15] * 2025年11月:多空对冲收益 -1.52%[6][15] * 近12个月:多空对冲月度胜率 58.3%[6][15] 2. **聪明钱因子**: * 全历史区间:IC均值 -0.037,rankIC均值 -0.062,信息比率 2.72,多空对冲月度胜率 81.3%[5][19] * 2025年11月:多空对冲收益 0.22%[6][19] * 近12个月:多空对冲月度胜率 83.3%[6][19] 3. **APM因子**: * 全历史区间:IC均值 0.028,rankIC均值 0.033,信息比率 2.23,多空对冲月度胜率 76.0%[5][23] * 2025年11月:多空对冲收益 -0.43%[6][23] * 近12个月:多空对冲月度胜率 41.7%[6][23] 4. **理想振幅因子**: * 全历史区间:IC均值 -0.054,rankIC均值 -0.074,信息比率 3.03,多空对冲月度胜率 83.4%[5][27] * 2025年11月:多空对冲收益 0.49%[6][27] * 近12个月:多空对冲月度胜率 66.7%[6][27] 5. **交易行为合成因子**: * 全历史区间:IC均值 0.066,rankIC均值 0.093,多空对冲信息比率 3.30,多空对冲月度胜率 79.4%[5][32] * 全历史区间(多头对冲组均值):年化收益率 8.26%,收益波动比 2.64,月度胜率 78.7%[32] * 2025年11月:多空对冲收益 -0.21%[6][32] * 近12个月:多空对冲月度胜率 66.7%[6][32] * 不同股票池信息比率:国证2000为2.86,中证1000为2.66,中证800为1.04[32]