小盘拥挤度偏高
华泰证券· 2026-01-25 18:37
量化模型与构建方式 1. **模型名称:A股技术打分模型**[2][9] * **模型构建思路**:通过挖掘技术面信息来刻画市场状态,并基于对当前状态的理解形成对未来走势的打分观点[2][9] * **模型具体构建过程**: 1. 将“市场状态”细分为价格、量能、波动、趋势和拥挤五个维度[9] 2. 在每个维度内筛选出有效的市场观测指标,共10个[9] 3. 每个指标独立发出多空择时信号[9] 4. 将10个指标的择时信号进行等权投票,综合形成一个介于-1至+1之间的打分结果[9] 5. 根据打分结果制定多空策略:得分 > +0.33时看多,得分在-0.33至+0.33之间时看平,得分 < -0.33时看空[11] 2. **模型名称:红利风格择时模型**[3][16] * **模型构建思路**:结合多个维度的趋势指标,对红利风格(以中证红利指数相对中证全指的收益率衡量)进行多空择时[3][16] * **模型具体构建过程**: 1. 选取三个择时指标: * 中证红利相对中证全指的动量(正向指标)[19] * 10Y-1Y期限利差(负向指标)[19] * 银行间质押式回购成交量(正向指标)[19] 2. 每个指标从趋势维度日频发出信号,取值为0(看平)、+1(看多)、-1(看空)[16] 3. 将三个维度的得分求和,根据其正负性作为最终多空观点[16] 4. 当模型看好红利风格时,全仓持有中证红利指数;不看好时,全仓持有中证全指[16] 3. **模型名称:大小盘风格择时模型**[3][20] * **模型构建思路**:采用基于拥挤度分域的趋势模型进行择时,在不同拥挤度区间采用不同参数的趋势跟踪策略[3][20] * **模型具体构建过程**: 1. **计算拥挤度**:以沪深300指数代表大盘,万得微盘股指数代表小盘[20] * **动量得分**:计算小盘与大盘的10/20/30/40/50/60日动量之差,再计算各窗长动量之差在3.0/3.5/4.0/4.5/5.0年历史分位数的均值。对6个窗长下分位数最高的3个结果取均值作为小盘动量得分,分位数最低的3个结果取均值作为大盘动量得分[25] * **成交量得分**:计算小盘与大盘的10/20/30/40/50/60日成交额之比,再计算各窗长成交额之比在3.0/3.5/4.0/4.5/5.0年历史分位数的均值。对6个窗长下分位数最高的3个结果取均值作为小盘成交量得分,分位数最低的3个结果取均值作为大盘成交量得分[25] * **拥挤度得分**:将小盘(大盘)的动量得分和成交量得分取均值,得到小盘(大盘)拥挤度得分。小盘拥挤度得分大于90%视为触发高拥挤,大盘拥挤度得分小于10%视为触发高拥挤[25] 2. **判断运行区间**:若最近20个交易日中,小盘或大盘风格曾触发过高拥挤,则模型运行在高拥挤区间,否则运行在低拥挤区间[22] 3. **趋势择时**:在高拥挤区间,采用参数较小的双均线模型以应对可能的风格反转;在低拥挤区间,采用参数较大的双均线模型以跟踪中长期趋势[22] 4. **模型名称:遗传规划行业轮动模型**[4][28] * **模型构建思路**:采用遗传规划技术,直接对行业指数的量价、估值等特征进行因子挖掘,不再依赖人工设计打分规则,以构建行业轮动策略[4][32] * **模型具体构建过程**: 1. **因子挖掘**:使用双目标遗传规划(NSGA-II算法)对底层输入变量进行挖掘[32]。底层变量包括收盘价、开盘价、最高价、最低价、成交额、换手率、市净率等原始值、标准化值及分位数[37] 2. **因子评价**:同时使用|IC|(信息系数绝对值)和NDCG@5两个目标来评价因子的分组单调性和多头组表现,旨在挖掘出兼具单调性和优秀多头表现的因子[32] 3. **因子合成**:对挖掘得到的备选因子,结合贪心策略和方差膨胀系数(VIF),将共线性较弱的多个因子合成为行业综合得分[34] 4. **组合构建**:模型周频调仓,每周末选出多因子综合得分最高的五个行业进行等权配置[4][28] 5. **模型名称:中国境内全天候增强组合**[5][39] * **模型构建思路**:采用宏观因子风险预算框架,在四象限风险平价的基础上,基于宏观预期动量的观点主动超配看好的象限,以实现风险分散下的收益增强[5][39] * **模型具体构建过程**: 1. **宏观象限划分与资产选择**:选择增长和通胀两个宏观维度,根据是否超预期划分为四个象限(增长超预期、增长不及预期、通胀超预期、通胀不及预期)。结合定量与定性方式确定各象限适配的资产[42] 2. **象限组合构建与风险度量**:在每个象限内,将适配的资产等权构建子组合,并注重刻画象限的下行风险[42] 3. **风险预算与主动超配**:每月底,根据由“宏观预期动量指标”给出的“象限观点”来调整各象限的风险预算,从而主动超配看好的象限,实现策略增强[42] 量化因子与构建方式 1. **因子名称:技术面观测指标(10个)**[9][14] * **因子构建思路**:从价格、量能、波动、趋势、拥挤五个维度选取有效的技术指标,用于刻画市场状态[9] * **因子具体构建过程**:报告中列出了10个具体指标,包括: * **价格维度**:20日布林带、20日价格乖离率[14] * **量能维度**:20日换手乖离率、60日换手乖离率[14] * **趋势维度**:20日ADX、20日新高天数占比[14] * **波动维度**:60日换手率波动、期权隐含波动率[14] * **拥挤维度**:成分股涨停家数占比5日平均、期权持仓量PCR-5日平均[14] 2. **因子名称:遗传规划挖掘的权重最高因子**[37][38] * **因子构建思路**:通过双目标遗传规划算法从量价数据中自动挖掘出的有效行业轮动因子[37] * **因子具体构建过程**: 1. 在截面上,用全体行业标准化日度成交额对当日跳空缺口开展带有常数项的一元线性回归,取残差,记作变量A[38] 2. 在过去9个交易日中,取标准化日度成交额最大的交易日索引,记作变量B[38] 3. 在过去50个交易日中,将变量A和B开展时序回归取截距项,记作变量C[38] 4. 计算过去45个交易日变量C和标准化月度开盘价的协方差,作为因子值[38] * **因子表达式**:`ts_covariance_torch(ts_regalpha_torch(xs_regres_torch(volume_st, jump_gap), ts_argmax_torch(volume_st, 9), 50), mopen_st, 45)`[37] 模型的回测效果 (回测区间:2010-01-04 至 2026-01-23,除非特别说明) 1. **A股技术打分模型**,年化收益20.78%,年化波动17.32%,最大回撤-23.74%,夏普比率1.20,Calmar比率0.88[15] 2. **红利风格择时模型**(回测区间:2017-01-03 至 2026-01-23),年化收益16.82%,最大回撤-25.52%,夏普比率0.92,Calmar比率0.66,YTD收益7.46%,上周收益1.77%[17] 3. **大小盘风格择时模型**(回测区间:2017-01-03 至 2026-01-23),年化收益28.46%,最大回撤-32.05%,夏普比率1.19,Calmar比率0.89,YTD收益11.85%,上周收益5.25%[26] 4. **遗传规划行业轮动模型**(回测区间:2022-09-30 至 2026-01-23),年化收益32.92%,年化波动17.43%,夏普比率1.89,最大回撤-19.63%,卡玛比率1.68,上周表现3.37%,YTD收益6.80%[31] 5. **中国境内全天候增强组合**(回测区间:2013-12-31 至 2026-01-23),年化收益11.93%,年化波动6.20%,夏普比率1.92,最大回撤-6.30%,卡玛比率1.89,上周表现1.54%,YTD收益3.59%[43] 因子的回测效果 (回测区间:2010-01-04 至 2026-01-23,起始日期不同者已标注) 1. **20日价格乖离率**,年化收益13.24%,年化波动23.52%,最大回撤-42.04%,夏普比率0.56,Calmar比率0.32[15] 2. **布林带**(回测起始:2015-04-09),年化收益14.82%,年化波动24.68%,最大回撤-31.45%,夏普比率0.60,Calmar比率0.47[15] 3. **20日换手率乖离率**,年化收益13.06%,年化波动23.53%,最大回撤-38.79%,夏普比率0.56,Calmar比率0.34[15] 4. **60日换手率乖离率**,年化收益17.89%,年化波动23.52%,最大回撤-29.57%,夏普比率0.76,Calmar比率0.61[15] 5. **20日ADX**,年化收益15.33%,年化波动23.52%,最大回撤-52.27%,夏普比率0.65,Calmar比率0.29[15] 6. **20日创新高占比**,年化收益8.75%,年化波动16.11%,最大回撤-32.44%,夏普比率0.54,Calmar比率0.27[15] 7. **期权隐含波动率**(回测起始:2015-03-30),年化收益11.91%,年化波动24.69%,最大回撤-50.95%,夏普比率0.48,Calmar比率0.23[15] 8. **60日换手率波动**,年化收益11.58%,年化波动14.27%,最大回撤-20.60%,夏普比率0.81,Calmar比率0.56[15] 9. **5日涨停占比平均**,年化收益14.15%,年化波动23.52%,最大回撤-34.98%,夏普比率0.60,Calmar比率0.40[15] 10. **5日持仓量PCR平均**,年化收益4.55%,年化波动23.55%,最大回撤-55.73%,夏普比率0.19,Calmar比率0.08[15]
——金融工程市场跟踪周报20260125:热点主题投资或仍占优-20260125
光大证券· 2026-01-25 18:28
量化模型与构建方式 1. **模型名称:量能择时模型**[31] * **模型构建思路**:通过分析主要宽基指数的量能(成交量或成交额)表现,判断市场短期走势,生成看多或看空的择时信号[31]。 * **模型具体构建过程**:报告未详细说明该模型的具体计算规则和信号生成阈值,仅展示了其应用结果。根据文本,该模型会对上证指数、上证50、沪深300、中证500、中证1000、创业板指、北证50等宽基指数分别生成独立的择时观点[31]。 2. **模型名称:沪深300上涨家数占比择时模型**[34][36] * **模型构建思路**:通过计算沪深300指数成分股中过去一段时间内收益为正的股票家数占比,来衡量市场情绪。当情绪由弱转强时看多市场,由强转弱时持中性态度[34][36]。 * **模型具体构建过程**: 1. 首先,计算沪深300指数N日上涨家数占比。具体公式为: $$沪深300指数N日上涨家数占比 = \frac{沪深300指数成分股过去N日收益大于0的个股数}{沪深300指数成分股总数}$$[32] 2. 然后,对该指标值进行两次不同窗口期的移动平均平滑,得到快线(短期平滑线)和慢线(长期平滑线),其中慢线窗口期N1大于快线窗口期N2[34][36]。报告中示例参数为N=230,N1=50,N2=35[34]。 3. 生成交易信号:当快线上穿慢线(即快线 > 慢线)时,看多沪深300指数;当快线下穿慢线时,对市场持中性态度[36]。 3. **模型名称:均线情绪指标择时模型**[40][44] * **模型构建思路**:基于沪深300指数收盘价与一组长期均线(八均线体系)的相对位置关系,构建情绪指标,用于判断市场趋势状态并生成择时信号[40][44]。 * **模型具体构建过程**: 1. 计算沪深300收盘价的八条均线,均线参数分别为8, 13, 21, 34, 55, 89, 144, 233[40]。 2. 计算当日沪深300指数收盘价大于这八条均线指标值的数量[44]。 3. 生成交易信号:当当前价格大于均线指标值的数量超过5条时,看多沪深300指数[44]。 4. **因子名称:横截面波动率**[45] * **因子构建思路**:计算特定指数(如沪深300、中证500、中证1000)成分股在横截面上的收益率波动率,用以衡量市场分化程度和Alpha策略的盈利环境。波动率上升通常意味着Alpha环境好转[45]。 * **因子具体构建过程**:报告未给出具体的计算公式,但根据常规理解,横截面波动率通常是指在一个特定时间点(如日度),计算指数内所有成分股当日收益率的截面标准差。 5. **因子名称:时间序列波动率**[46] * **因子构建思路**:计算特定指数成分股收益率在时间序列上的波动率,用以衡量市场的整体波动水平,其变化也会影响Alpha环境[46]。 * **因子具体构建过程**:报告未给出具体的计算公式,但根据常规理解,时间序列波动率通常是指计算指数内成分股在过去一段时间(如20日或60日)收益率的标准差,然后可能按市值或其他方式进行加权平均。 6. **因子名称:抱团基金分离度**[87] * **因子构建思路**:通过计算抱团基金组合截面收益率的标准差,来度量基金抱团的程度。标准差越小,说明抱团基金表现越趋同,抱团程度越高;反之则表示抱团正在瓦解[87]。 * **因子具体构建过程**: 1. 首先构造一个“抱团基金组合”,但报告未详细说明其具体筛选规则[87]。 2. 计算该抱团基金组合在截面上的收益率标准差,即为分离度指标[87]。 模型的回测效果 1. **沪深300上涨家数占比择时模型**,策略净值表现见历史回测图,在所示区间内策略净值显著跑赢沪深300指数[37][38] 2. **均线情绪指标择时模型**,策略净值表现见历史回测图,在所示区间内策略净值显著跑赢沪深300指数[41][42] 量化因子的回测效果 1. **横截面波动率因子**,近两年平均值:沪深300为2.00%,中证500为2.25%,中证1000为2.49%[46] **横截面波动率因子**,近一年平均值:沪深300为1.98%,中证500为2.26%,中证1000为2.51%[46] **横截面波动率因子**,近半年平均值:沪深300为1.97%,中证500为2.35%,中证1000为2.53%[46] **横截面波动率因子**,近一季度平均值:沪深300为2.12%,中证500为2.42%,中证1000为2.58%[46] 2. **时间序列波动率因子**,近两年平均值:沪深300为1.03%,中证500为1.37%,中证1000为1.55%[49] **时间序列波动率因子**,近一年平均值:沪深300为0.91%,中证500为1.14%,中证1000为1.21%[49] **时间序列波动率因子**,近半年平均值:沪深300为0.87%,中证500为1.12%,中证1000为1.08%[49] **时间序列波动率因子**,近一季度平均值:沪深300为0.97%,中证500为1.20%,中证1000为1.16%[49]
港股财务数据处理六问及因子复现手册
国联民生证券· 2026-01-25 17:14
量化模型与因子构建方式 基本面因子 市值因子 1. **因子名称**:对数总市值 (ln_mv) * **构建思路**:反映上市公司的规模特征,是基础的风格因子之一[38]。 * **具体构建过程**:使用Wind字段`S_VAL_MV`(当日总市值),计算其自然对数[39]。 $$ln\_mv = \ln(S\_VAL\_MV)$$ * **因子评价**:在港股通股票池中表现出一定的正向效应,但稳定性较弱[39]。 2. **因子名称**:对数流通市值 (ln_float_mv) * **构建思路**:反映上市公司的流通规模特征[38]。 * **具体构建过程**:使用Wind字段`S_DQ_MV`(当日流通市值),计算其自然对数[39]。 $$ln\_float\_mv = \ln(S\_DQ\_MV)$$ * **因子评价**:在两个股票池中均表现出一定的正向效应,即流通市值较大的股票长期收益略高,但稳定性较弱[39]。 3. **因子名称**:非线性市值 (nlsize) * **构建思路**:捕捉市值维度的非线性收益驱动逻辑[38]。 * **具体构建过程**:使用Wind字段`S_VAL_MV`(当日总市值),计算总市值对数的三次方对总市值对数的正交增量[39]。 * **因子评价**:在两类选股池中的有效性差异较大,在港股通中有效性较强[39]。 成长因子 1. **因子名称**:经营活动产生的现金流净额(ttm)同比增长率 (ocf_ttm_yoy) * **构建思路**:反映上市公司现金流维度的增长能力,衡量企业未来发展的持续性与确定性[42]。 * **具体构建过程**:使用Wind字段`NET_CASH_FLOWS_OPER_ACT`(经营活动产生的现金流量净额),计算其TTM值相对于去年同期的增长率[43]。 $$ocf\_ttm\_yoy = \frac{NET\_CASH\_FLOWS\_OPER\_ACT_{TTM, t}}{NET\_CASH\_FLOWS\_OPER\_ACT_{TTM, t-12m}} - 1$$ * **因子评价**:在港股市场整体具备正向选股能力,该指标表现尤为突出,符合机构投资者看重现金流支撑的真实成长的逻辑[44]。 2. **因子名称**:归母公司净利润(扣非,ttm)同比增长率 (np_deducted_yoy) * **构建思路**:反映上市公司扣除非经常性损益后的净利润增长能力[42]。 * **具体构建过程**:使用Wind字段`NONCONTINUOUS_NET_OP - MINORITY_INT_INC`(归母公司净利润(扣非)),计算其TTM值相对于去年同期的增长率[43]。 $$np\_deducted\_yoy = \frac{(NONCONTINUOUS\_NET\_OP - MINORITY\_INT\_INC)_{TTM, t}}{(NONCONTINUOUS\_NET\_OP - MINORITY\_INT\_INC)_{TTM, t-12m}} - 1$$ * **因子评价**:在港股市场整体具备正向选股能力,该指标表现突出[44]。 3. **因子名称**:归母公司净利润(ttm)同比增长率 (np_ttm_yoy) * **构建思路**:反映上市公司净利润的增长能力[42]。 * **具体构建过程**:使用Wind字段`NET_PROFIT_CS`(归母公司净利润),计算其TTM值相对于去年同期的增长率[43]。 $$np\_ttm\_yoy = \frac{NET\_PROFIT\_CS_{TTM, t}}{NET\_PROFIT\_CS_{TTM, t-12m}} - 1$$ 4. **因子名称**:利润总额(ttm)同比增长率 (ebt_ttm_yoy) * **构建思路**:反映上市公司利润总额的增长能力[42]。 * **具体构建过程**:使用Wind字段`INC_PRETAX`(利润总额),计算其TTM值相对于去年同期的增长率[43]。 $$ebt\_ttm\_yoy = \frac{INC\_PRETAX_{TTM, t}}{INC\_PRETAX_{TTM, t-12m}} - 1$$ 5. **因子名称**:净资产收益率(TTM)同比增长率 (roe_ttm_yoy) * **构建思路**:反映上市公司净资产收益率指标的增长情况[42]。 * **具体构建过程**:先计算`roe_ttm`(归母公司净利润TTM / 净资产过去一年均值),再计算该值相对于去年同期的增长率[43]。 $$roe\_ttm\_yoy = \frac{roe\_ttm_{t}}{roe\_ttm_{t-12m}} - 1$$ 6. **因子名称**:营业总收入(ttm)同比增长率 (tot_rev_ttm_yoy) * **构建思路**:反映上市公司营业总收入的增长能力[42]。 * **具体构建过程**:使用Wind字段`TOT_OPER_REV`(营业总收入),计算其TTM值相对于去年同期的增长率[43]。 $$tot\_rev\_ttm\_yoy = \frac{TOT\_OPER\_REV_{TTM, t}}{TOT\_OPER\_REV_{TTM, t-12m}} - 1$$ 7. **因子名称**:营业收入(ttm)同比增长率 (rev_ttm_yoy) * **构建思路**:反映上市公司营业收入的增长能力[42]。 * **具体构建过程**:使用Wind字段`BUS_INC`(营业收入),计算其TTM值相对于去年同期的增长率[43]。 $$rev\_ttm\_yoy = \frac{BUS\_INC_{TTM, t}}{BUS\_INC_{TTM, t-12m}} - 1$$ 8. **因子名称**:营业利润(ttm)同比增长率 (op_ttm_yoy) * **构建思路**:反映上市公司营业利润的增长能力[42]。 * **具体构建过程**:使用Wind字段`OPPROFIT`(营业利润),计算其TTM值相对于去年同期的增长率[43]。 $$op\_ttm\_yoy = \frac{OPPROFIT_{TTM, t}}{OPPROFIT_{TTM, t-12m}} - 1$$ 9. **因子名称**:基本每股收益(ttm)同比增长率 (eps_ttm_yoy) * **构建思路**:反映上市公司每股收益的增长能力[42]。 * **具体构建过程**:先计算基本每股收益(归母公司净利润TTM / 加权平均总股本),再计算该值相对于去年同期的增长率[43]。 $$eps\_ttm\_yoy = \frac{eps\_ttm_{t}}{eps\_ttm_{t-12m}} - 1$$ 10. **因子名称**:每股经营活动产生的现金流净额(ttm)同比增长率 (ocfps_ttm_yoy) * **构建思路**:反映上市公司每股现金流的增长能力[42]。 * **具体构建过程**:先计算每股经营活动现金流净额TTM(经营活动现金流净额TTM / 最新总股本),再计算该值相对于去年同期的增长率[43]。 $$ocfps\_ttm\_yoy = \frac{ocfps\_ttm_{t}}{ocfps\_ttm_{t-12m}} - 1$$ 11. **因子名称**:每股营业收入(ttm)同比增长率 (orps_ttm_yoy) * **构建思路**:反映上市公司每股营业收入的增长能力[42]。 * **具体构建过程**:先计算每股营业收入TTM(营业总收入TTM / 最新总股本),再计算该值相对于去年同期的增长率[43]。 $$orps\_ttm\_yoy = \frac{orps\_ttm_{t}}{orps\_ttm_{t-12m}} - 1$$ 12. **因子名称**:资产总计同比增长率 (tot_assets_yoy) * **构建思路**:反映上市公司资产规模的扩张能力[42]。 * **具体构建过程**:使用Wind字段`TOT_ASSETS`(资产总计),计算其期末值相对于去年同期的增长率[43]。 $$tot\_assets\_yoy = \frac{TOT\_ASSETS_{t}}{TOT\_ASSETS_{t-12m}} - 1$$ 13. **因子名称**:归母公司股东权益总计同比增长率 (tot_equity_yoy) * **构建思路**:反映上市公司股东权益的增长能力[42]。 * **具体构建过程**:使用Wind字段`PARSH_INT`(归母公司股东权益),计算其期末值相对于去年同期的增长率[43]。 $$tot\_equity\_yoy = \frac{PARSH\_INT_{t}}{PARSH\_INT_{t-12m}} - 1$$ 14. **因子名称**:每股净资产同比增长率 (bps_yoy) * **构建思路**:反映上市公司每股净资产的增长能力[42]。 * **具体构建过程**:先计算每股净资产(归母公司股东权益期末值 / 最新总股本),再计算该值相对于去年同期的增长率[43]。 $$bps\_yoy = \frac{bps_{t}}{bps_{t-12m}} - 1$$ 15. **因子名称**:归母公司净利润(ttm)过去三年复合增速 (np_ttm_cagr_3y) * **构建思路**:反映上市公司净利润的长期复合增长能力[42]。 * **具体构建过程**:使用Wind字段`NET_PROFIT_CS`(归母公司净利润),计算其TTM值过去三年的复合增长率[43]。 16. **因子名称**:总资产净利率(ROA1,TTM)同比增长率 (roa1_ttm_yoy) * **构建思路**:反映上市公司总资产净利率指标的增长情况[42]。 * **具体构建过程**:先计算`roa1_ttm`(净利润(含少数股东损益)TTM / 总资产过去一年均值),再计算该值相对于去年同期的增长率[43]。 $$roa1\_ttm\_yoy = \frac{roa1\_ttm_{t}}{roa1\_ttm_{t-12m}} - 1$$ 17. **因子名称**:总资产收益率(ROA2,TTM)同比增长率 (roa2_ttm_yoy) * **构建思路**:反映上市公司总资产收益率指标的增长情况[42]。 * **具体构建过程**:先计算`roa2_ttm`(EBIT / 总资产),再计算该值相对于去年同期的增长率[43]。 $$roa2\_ttm\_yoy = \frac{roa2\_ttm_{t}}{roa2\_ttm_{t-12m}} - 1$$ 18. **因子名称**:投入资本回报率(TTM)同比增长率 (roic_ttm_yoy) * **构建思路**:反映上市公司投入资本回报率指标的增长情况[42]。 * **具体构建过程**:先计算`roic_ttm`,再计算该值相对于去年同期的增长率[43]。 $$roic\_ttm\_yoy = \frac{roic\_ttm_{t}}{roic\_ttm_{t-12m}} - 1$$ 价值因子 1. **因子名称**:市净率倒数 (bp) * **构建思路**:反映上市公司股价与净资产(账面价值)的相对关系,是价值投资的核心指标之一[48]。 * **具体构建过程**:使用Wind字段`PARSH_INT`(归母公司股东权益)和`S_VAL_MV`(总市值),计算最新财报净资产与总市值的比值[49]。 $$bp = \frac{PARSH\_INT}{S\_VAL\_MV}$$ * **因子评价**:在两个选股池中均具有一定的有效性,选股能力较好[49]。 2. **因子名称**:市盈率倒数(TTM) (ep_ttm) * **构建思路**:反映上市公司股价与过去十二个月净利润的相对关系[48]。 * **具体构建过程**:使用Wind字段`NET_PROFIT_CS`(归母公司净利润)和`S_VAL_MV`(总市值),计算归母公司净利润TTM与总市值的比值[49]。 $$ep\_ttm = \frac{NET\_PROFIT\_CS_{TTM}}{S\_VAL\_MV}$$ * **因子评价**:在两个选股池中均具有一定的有效性,选股能力较好[49]。 3. **因子名称**:市销率倒数(TTM) (sp_ttm) * **构建思路**:反映上市公司股价与营业收入的相对关系[48]。 * **具体构建过程**:使用Wind字段`TOT_OPER_REV`(营业总收入)和`S_VAL_MV`(总市值),计算营业总收入TTM与总市值的比值[49]。 $$sp\_ttm = \frac{TOT\_OPER\_REV_{TTM}}{S\_VAL\_MV}$$ 4. **因子名称**:市盈率倒数 2(TTM) (opp_ttm) * **构建思路**:反映上市公司股价与营业利润的相对关系[48]。 * **具体构建过程**:使用Wind字段`OPPROFIT`(营业利润)和`S_VAL_MV`(总市值),计算营业利润TTM与总市值的比值[49]。 $$opp\_ttm = \frac{OPPROFIT_{TTM}}{S\_VAL\_MV}$$ 5. **因子名称**:市现率 1(TTM) (pocf_ttm) * **构建思路**:反映上市公司股价与经营性现金流的相对关系[48]。 * **具体构建过程**:使用Wind字段`NET_CASH_FLOWS_OPER_ACT`(经营活动产生的现金流量净额)和`S_VAL_MV`(总市值),计算经营性现金流净额TTM与总市值的比值[49]。 $$pocf\_ttm = \frac{NET\_CASH\_FLOWS\_OPER\_ACT_{TTM}}{S\_VAL\_MV}$$ * **因子评价**:选股能力较好[49]。 6. **因子名称**:市现率 2(TTM) (pncf_ttm) * **构建思路**:反映上市公司股价与现金净流量的相对关系[48]。 * **具体构建过程**:使用Wind字段`NET_INCR_CASH_CASH_EQU`(现金及现金等价物净增加额)和`S_VAL_MV`(总市值),计算现金净流量TTM与总市值的比值[49]。 $$pncf\_ttm = \frac{NET\_INCR\_CASH\_CASH\_EQU_{TTM}}{S\_VAL\_MV}$$ 7. **因子名称**:市盈率倒数(LYR) (ep_lyr) * **构建思路**:反映上市公司股价与上一完整会计年度净利润的相对关系[48]。 * **具体构建过程**:使用Wind字段`NET_PROFIT_CS`(归母公司净利润)和`S_VAL_MV`(总市值),计算归母公司净利润(上一完整会计年度)与总市值的比值[49]。 $$ep\_lyr = \frac{NET\_PROFIT\_CS_{LYR}}{S\_VAL\_MV}$$ 8. **因子名称**:市销率倒数(LYR) (sp_lyr) * **构建思路**:反映上市公司股价与上一完整会计年度营业收入的相对关系[48]。 * **具体构建过程**:使用Wind字段`TOT_OPER_REV`(营业总收入)和`S_VAL_MV`(总市值),计算营业总收入(上一完整会计年度)与总市值的比值[49]。 $$sp\_lyr = \frac{TOT\_OPER\_REV_{LYR}}{S\_VAL\_MV}$$ 9. **因子名称**:市盈率倒数 2(LYR) (opp_lyr) * **构建思路**:反映上市公司股价与上一完整会计年度营业利润的相对关系[48]。 * **具体构建过程**:使用Wind字段`OPPROFIT`(营业利润)和`S_VAL_MV`(总市值),计算营业利润(上一完整会计年度)与总市值的比值[49]。 $$opp\_lyr = \frac{OPPROFIT_{LYR}}{S\_VAL\_MV}$$ 10. **因子名称**:市现率 1(LYR) (pocf_lyr) * **构建思路**:反映上市公司股价与上一完整会计年度经营性现金流的相对关系[48]。 * **具体构建过程**:使用Wind字段`NET_CASH_FLOWS_OPER_ACT`(经营活动产生的现金流量净额)和`S_VAL_MV`(总市值),计算经营性现金流净额(上一完整会计年度)与总市值的比值[49]。 $$pocf\_lyr = \frac{NET\_CASH\_FLOWS\_OPER\_ACT_{LYR}}{S\_VAL\_MV}$$ 11. **因子名称**:市现率 2(LYR) (pncf_lyr) * **构建思路**:反映上市公司股价与上一完整会计年度现金净流量的相对关系[48]。 * **具体构建过程**:使用Wind字段`NET_INCR_CASH_CASH_EQU`(现金及现金等价物净增加额)和`S_VAL_MV`(总市值),计算现金净流量(上一完整会计年度)与总市值的比值[49]。 $$pncf\_lyr = \frac{NET\_INCR\_CASH\_C
中银量化大类资产跟踪:贵金属与中小微风格权益持续领涨
中银国际· 2026-01-25 16:42
量化模型与因子总结 量化因子与构建方式 1. **因子名称**:风格相对拥挤度[70][128] * **因子构建思路**:通过计算不同风格指数(如成长vs红利、小盘vs大盘等)的换手率标准化值之差的历史分位,来衡量某一风格相对于另一风格的交易拥挤程度,用于判断风格的配置风险与性价比[70][128] * **因子具体构建过程**: 1. 对于风格A和风格B的指数,分别计算其近252日的平均换手率[128] 2. 将计算出的平均换手率值,置于从2005年1月1日至今的历史时间序列中进行Z-score标准化,得到Z-score_A和Z-score_B[128] 3. 计算两个标准化值的差值:Z-score_A - Z-score_B[128] 4. 计算该差值的滚动6年历史分位数(若历史数据量满1年但不足6年,则使用全部历史数据计算),该分位数即为风格A相对于风格B的相对拥挤度[128] 2. **因子名称**:风格累计超额净值[70][129] * **因子构建思路**:以万得全A指数为基准,计算各风格指数相对于基准的累计超额收益,用于跟踪风格表现的强弱[70][129] * **因子具体构建过程**: 1. 设定基准日(报告中为2020年1月4日)[129] 2. 将各风格指数及万得全A指数的每日收盘点数除以各自在基准日的收盘点数,得到各自的累计净值[129] 3. 将各风格指数在每个交易日的累计净值,除以同一交易日的万得全A指数累计净值,得到该风格指数相对于万得全A的累计超额净值[129] 3. **因子名称**:机构调研活跃度[130] * **因子构建思路**:通过计算板块、指数或行业在特定周期内日均机构调研次数的标准化活跃度及其历史分位,来衡量市场关注度的变化[130] * **因子具体构建过程**: 1. 对于目标板块(指数、行业),计算其近n个交易日的“日均机构调研次数”[130] 2. 将该值在滚动y年的历史时间序列上进行z-score标准化[130] 3. 将上述标准化结果与万得全A指数的同期标准化结果作差,得到“机构调研活跃度”[130] 4. 最后计算该“机构调研活跃度”的滚动y年历史分位数[130] * **长期口径参数**:n取126(近半年),滚动窗口y为6年(历史数据量满3年且不足6年时,以全部历史数据计算)[130] * **短期口径参数**:n取63(近一季度),滚动窗口y为3年(历史数据量满1年且不足3年时,以全部历史数据计算)[130] 4. **因子名称**:股债风险溢价(ERP)[51] * **因子构建思路**:通过计算股票指数市盈率倒数与无风险利率(10年期国债收益率)的差值,来衡量投资股票相对于债券的额外收益补偿,即股债性价比[51] * **因子具体构建过程**: 1. 计算股票指数的市盈率倒数:1 / 指数PE_TTM[51] 2. 减去当前10年期中债国债到期收益率[51] * **公式**:$$指数 erp = 1/指数 PE\_TTM – 10 年期国债到期收益率$$[51] 5. **因子名称**:滚动季度夏普率[37][39] * **因子构建思路**:计算指数滚动季度周期的夏普比率,用于衡量经风险调整后的收益,并作为市场情绪风险的观测指标[37][39] * **因子具体构建过程**:报告中未给出详细计算过程,但提及使用万得全A指数的滚动季度夏普率来观察市场情绪是否达到极端位置[37][39] 6. **因子名称**:成交热度[26] * **因子构建思路**:使用周度日均自由流通换手率的历史分位值,来衡量指数、板块或行业的交易活跃程度[26] * **因子具体构建过程**:成交热度 = 指数(或板块、行业)的周度日均自由流通换手率在历史时间区间(如2005年1月1日至今)内的历史分位值[26][35] 因子的回测效果 *注:本报告为市场跟踪周报,主要展示各因子或风格在特定时间窗口(近一周、近一月、年初至今)的表现状态或具体数值,而非长期历史回测结果。以下为报告截至2026年1月23日当周的数据汇总。* 1. **风格相对拥挤度因子**,成长vs红利相对拥挤度历史分位:75%[70];小盘vs大盘相对拥挤度历史分位:37%[70];微盘股vs中证800相对拥挤度历史分位:0%[70] 2. **风格累计超额净值因子**,成长较红利超额收益:近一周 -1.4%,近一月 3.6%,年初至今 4.3%[61][64];小盘较大盘超额收益:近一周 4.8%,近一月 14.5%,年初至今 13.4%[61][64];微盘股较基金重仓超额收益:近一周 3.5%,近一月 3.4%,年初至今 3.1%[61][64];动量较反转超额收益:近一周 -1.2%,近一月 2.7%,年初至今 -1.4%[61][64] 3. **股债风险溢价(ERP)因子**,万得全A指数ERP百分位:54%[58][60];沪深300指数ERP百分位:61%[58][60];中证500指数ERP百分位:65%[60];创业板指数ERP百分位:85%[52][60] 4. **滚动季度夏普率因子**,万得全A指数滚动季度夏普率状态:从历史低位反弹,尚未触及预警位置[37] 5. **成交热度因子**,万得全A指数成交热度历史分位:92%[35];沪深300指数成交热度历史分位:88%[35];中证1000指数成交热度历史分位:93%[35];创业板指数成交热度历史分位:97%[35]
金融工程:AI识图关注石化、化工、机床、半导体和有色
广发证券· 2026-01-25 15:48
量化模型与构建方式 1. **模型名称:卷积神经网络趋势观察模型**[2][78] * **模型构建思路**:使用卷积神经网络(CNN)对个股历史价量数据生成的标准化图表进行深度学习,以识别图表中的特征模式,并预测未来价格走势。最终将学习到的特征映射到行业主题板块,生成行业配置建议。[2][78] * **模型具体构建过程**: 1. **数据准备**:为每个个股在特定窗口期内的价量数据构建标准化的图表。价量数据通常包括价格、成交量等时间序列。[78] 2. **图表化**:将标准化后的价量数据转换为图像格式,作为CNN的输入。图表示例可参考报告中的“标准化数据价量图表”。[79] 3. **模型训练**:使用卷积神经网络对大量的历史价量图表进行训练,学习图表特征与未来一段时间(如下一期)价格变动之间的映射关系。[2][78] 4. **特征映射**:将训练好的CNN模型学习到的有效特征,应用于行业或主题板块层面的分析,识别出当前具有相似积极特征的板块。[2][78] 5. **生成信号**:根据模型对各个板块的分析,输出看好的行业主题配置列表。[80] 2. **模型名称:宏观因子事件模型**[55][57] * **模型构建思路**:跟踪一系列关键的国内外宏观指标,通过定义和识别这些指标在特定时间窗口内的走势事件(如短期高点、连续下跌等),并基于历史回测筛选出对资产未来收益率有显著影响的“有效因子事件”,从而对权益市场未来走势进行判断。[55] * **模型具体构建过程**: 1. **因子选择**:跟踪25个国内外宏观指标,涵盖货币政策、财政政策、流动性、通胀水平及其他经济指标等多个维度。[55] 2. **事件定义**:定义四类宏观因子走势事件:短期高低点、连续上涨/下跌、创历史新高/新低、因子走势反转。[55] 3. **有效性检验**:从历史数据中回测,寻找那些对资产(如股票指数)未来收益率影响较为显著的因子事件,即“有效因子事件”。[55] 4. **趋势判断**:对于部分因子,采用历史均线(如1月、3月、12月均线)将其走势划分为趋势上行或趋势下行。[57] 5. **信号生成**:统计历史上在宏观指标处于不同趋势下,对应资产的未来平均收益,筛选出存在显著差异的情况,形成当前宏观因子趋势对权益市场的观点(如看多、震荡)。[57][58] 3. **模型名称:期权成交量看涨看跌比(CPR)模型**[48] * **模型构建思路**:通过监测上证50ETF期权成交量的看涨看跌比率(CPR),并将其与布林通道结合,判断蓝筹股是否存在短期超买或超卖风险。[48] * **模型具体构建过程**: 1. **计算CPR**:计算上证50ETF期权成交量的看涨看跌比率。[48] 2. **计算滚动指标**:计算滚动20个交易日的CPR。[50] 3. **构建通道**:计算该滚动20日CPR的60日布林通道上轨。[48] 4. **生成信号**:当滚动20日CPR高于其60日布林通道上轨时,模型认为蓝筹股短期存在超卖风险。[48] 4. **模型名称:GFTD模型**[82] * **模型评价**:报告中提及该模型历史择时成功率约为80%,但市场波动不确定性下模型信号存在失效可能。[82] 5. **模型名称:LLT模型**[82] * **模型评价**:报告中提及该模型历史择时成功率约为80%,但市场波动不确定性下模型信号存在失效可能。[82] 量化因子与构建方式 1. **因子名称:新高新低比例因子**[33] * **因子构建思路**:通过统计市场中创近期新高与新低的个股数量占比,来度量市场的极端情绪和趋势强度。[33] * **因子具体构建过程**: 1. 每日计算全市场个股中,收盘价创近60日新高的个股数量。 2. 每日计算全市场个股中,收盘价创近60日新低的个股数量。 3. 分别计算新高个股数占总股票数的比例(60日新高比例),以及新低个股数占总股票数的比例(60日新低比例)。[33][34] 2. **因子名称:个股均线结构因子**[37] * **因子构建思路**:通过计算呈现特定均线多头排列形态的个股占比,来反映市场整体的技术趋势强弱。[37] * **因子具体构建过程**: 1. 对每只个股,判断其短期、中期、长期均线(如5日、20日、60日均线)是否呈多头排列(短期>中期>长期)。 2. 判断其是否呈空头排列(短期<中期<长期)。 3. 计算当日呈多头排列的个股数量与呈空头排列的个股数量之差,再除以总股票数,得到“均线强弱指标”或“多头排列减空头排列个股占比”。[37][38] 3. **因子名称:长期均线以上比例因子**[40] * **因子构建思路**:通过统计股价位于长期均线之上的个股比例,来衡量市场整体的牛市广度。[40] * **因子具体构建过程**: 1. 对每只个股,判断其当日收盘价是否位于200日长期移动平均线之上。 2. 计算股价位于200日长期均线之上的个股数量占总股票数的比例。[40] 4. **因子名称:风险溢价因子**[66][81] * **因子构建思路**:通过计算股票市场隐含收益率(市盈率倒数)与无风险利率(十年期国债收益率)的差值,来衡量股票资产相对于债券资产的吸引力。[66][81] * **因子具体构建过程**: 1. 计算中证全指(或其它宽基指数)的静态市盈率(PE_TTM)。 2. 计算其倒数,即盈利收益率(EP)。 3. 从盈利收益率(EP)中减去十年期国债收益率,得到风险溢价。 $$风险溢价 = \frac{1}{PE\_{TTM}} - 十年期国债收益率$$[81] 5. **因子名称:指数超买超卖因子**[69][73] * **因子构建思路**:通过特定方法计算各主要宽基指数和行业指数的超跌或超买程度,用于识别市场或板块的极端状态。[69][73] * **因子具体构建过程**:报告中未详细描述具体计算公式,但展示了截至报告日(NEW)和历史上另一个时点(20181228)各指数的“超跌指标”统计结果,用于对比。[70][71][74][75] 6. **因子名称:融资余额因子**[76] * **因子构建思路**:跟踪市场融资余额的绝对规模及其占流通市值的比例,作为衡量市场杠杆资金情绪和力量的指标。[76] * **因子具体构建过程**: 1. 获取每日市场融资买入的总余额。 2. 计算融资余额占A股流通市值的百分比。[77] 7. **因子名称:市场真实换手率因子**[51] * **因子构建思路**:考虑自由流通股本后计算市场换手率,以更真实地反映市场的交易活跃程度。[51] * **因子具体构建过程**:报告中未给出具体公式,但指出其计算考虑了自由流通股本,并以中证全指和创业板指为例展示了该因子的时间序列。[51][53] 模型的回测效果 (报告中未提供具体模型的量化回测指标结果,如年化收益率、夏普比率、最大回撤等。) 因子的回测效果 (报告中未提供具体因子的IC、IR、多空收益等量化检验结果。)
A 股趋势与风格定量观察:整体维持震荡乐观,注意大小盘风格切换
招商证券· 2026-01-25 13:44
量化模型与构建方式 1. 短期择时模型 1. **模型名称**:短期择时模型[18] 2. **模型构建思路**:从宏观基本面、估值面、情绪面、流动性四个维度构建多因子综合择时模型,每个维度包含若干具体指标,通过判断各指标在历史分位数上的位置来给出乐观、谨慎或中性的信号,最终综合得出总仓位信号[18][22]。 3. **模型具体构建过程**: * **一级指标**:模型包含四个一级指标:基本面、估值面、情绪面、流动性[18][22]。 * **二级指标与信号生成**:每个一级指标下包含若干二级指标。每周计算每个二级指标的当前值,并计算其在过去5年历史数据中的分位数。根据分位数高低和指标特性,将每个二级指标转化为“乐观”(信号值1.00)、“谨慎”(信号值0.00)或“中性”(信号值0.50)的二级择时信号[18][19][22]。 * **一级信号合成**:对每个一级指标下的所有二级择时信号进行综合(具体综合方法未明确说明,可能为等权平均或投票),得到该一级指标的最终信号(乐观、谨慎或中性)[18][22]。 * **总仓位信号合成**:综合四个一级指标的信号,生成最终的总仓位信号。总仓位信号为1.00表示乐观(高仓位),0.00表示谨慎(低仓位或空仓),0.50表示中性(中等仓位)[22][28]。 * **具体指标说明**: * **基本面指标**:包括制造业PMI是否大于50、信贷脉冲环比变化分位数、M1同比增速(HP滤波去趋势)分位数[18][22]。 * **估值面指标**:包括A股整体PE分位数、A股整体PB分位数[18][22]。 * **情绪面指标**:包括A股整体Beta离散度分位数、A股整体量能情绪分位数、A股整体波动率分位数[19][22]。 * **流动性指标**:包括货币利率指标分位数、汇率预期指标分位数、沪深净融资额5日均值分位数[19][22]。 2. 成长价值风格轮动模型 1. **模型名称**:成长价值风格轮动模型[29][30] 2. **模型构建思路**:从基本面、估值面、情绪面三个维度构建多因子轮动模型,判断成长与价值风格的相对强弱,从而给出超配成长或超配价值的建议[30]。 3. **模型具体构建过程**: * **一级指标**:模型包含三个一级指标:基本面、估值面、情绪面[30][32]。 * **二级指标与信号生成**: * **基本面**:包含盈利周期斜率、利率综合周期水平、信贷综合周期变化三个指标。根据各指标水平判断其对成长或价值风格利好,并转化为具体的仓位配置建议(例如,盈利斜率周期水平为4.17,判断为“盈利周期斜率大,利好成长”,则给出成长100%、价值0%的二级仓位信号)[30][32]。 * **估值面**:包含成长价值PE差分位数、成长价值PB差分位数。根据估值差分位数的高低和均值回归方向,判断其对风格的影响(例如,PE差分位数为52.75%,判断为“估值差均值回归上行中,利好成长”,则给出成长100%、价值0%的二级仓位信号)[30][32]。 * **情绪面**:包含成长价值换手差分位数、成长价值波动差分位数。根据换手差和波动差的分位数水平判断其对风格的影响(例如,换手差分位数为70.22%,判断为“换手差偏高,利好成长”,则给出成长100%、价值0%的二级仓位信号)[30][32]。 * **一级信号与最终建议**:综合每个一级指标下的二级仓位信号,得到该一级指标的超配建议(例如,基本面整体给出“超配成长”信号)。最终结合所有一级指标信号,给出模型的综合建议(例如,当前建议“超配成长”)[30][32]。 3. 小盘大盘风格轮动模型 1. **模型名称**:小盘大盘风格轮动模型[29][34] 2. **模型构建思路**:从流动性、情绪、估值、技术等多个角度选取11个有效轮动指标,每日计算各指标看多小盘(仓位100%)或看多大盘(仓位0%)的信号,通过综合这些指标信号来构建最终的大小盘轮动信号[34][36]。 3. **模型具体构建过程**: * **指标池**:模型共使用11个轮动指标,包括:A股龙虎榜买入强度、R007、融资买入余额变化、主题投资交易情绪、等级利差、期权波动率风险溢价、Beta离散度、PB分化度、大宗交易折溢价率、中证1000 MACD(10,20,10)、中证1000交易量能[36]。 * **单指标信号**:每个指标独立产生每日信号,信号值为0%或100%。0%表示该指标看多大盘(即小盘仓位为0%),100%表示该指标看多小盘(即小盘仓位为100%)[36]。 * **综合信号生成**:每日将11个指标的小盘仓位信号值进行综合(具体综合方法未明确说明,可能为等权平均或投票),得到每日的“小盘综合信号”百分比。例如,2026-01-26日,综合信号为0%,即看多大盘(大盘仓位100%)[36]。 * **信号平滑**:为了减少噪音,对综合信号进行了“3D平滑”处理[36]。 模型的回测效果 1. 短期择时模型 1. **回测区间**:2012年底至今(全区间)及2024年以来[21][24][27] 2. **基准策略**:月度中性持仓再平衡[21] 3. **全区间表现(2012年底至今)**[24]: * 年化收益率:16.78% * 年化波动率:14.79% * 最大回撤:15.05% * 夏普比率:0.9882 * 收益回撤比:1.1155 * 月度胜率:66.46% * 基准年化收益率:5.11% * 年化超额收益率:11.67% 4. **近期表现(2024年以来)**[27]: * 年化收益率:31.59% * 年化波动率:16.52% * 最大回撤:11.04% * 夏普比率:1.6247 * 收益回撤比:2.8617 * 月度胜率:73.08% * 基准年化收益率:11.13% * 年化超额收益率:20.46%(根据年化收益率差值计算) 2. 成长价值风格轮动模型 1. **回测区间**:2012年底至今[31][33] 2. **基准策略**:月度风格均衡配置(成长和价值等权)[31][33] 3. **全区间表现**[33]: * 年化收益率:13.34% * 年化波动率:20.74% * 最大回撤:43.07% * 夏普比率:0.6119 * 收益回撤比:0.3098 * 月度胜率:58.60% * 基准年化收益率:8.35% * 年化超额收益率:4.99% 3. 小盘大盘风格轮动模型 1. **回测区间**:2014年以来[35][36] 2. **基准策略**:大小盘等权配置(沪深300和中证1000全收益指数等权)[35][36] 3. **综合信号表现**[36]: * 年化收益率:20.85%(综合信号3D平滑) * 年化超额收益率:13.11% * 最大回撤:40.70% * 平均换手间隔:20个交易日 * 胜率(按交易):50.21% 4. **单指标表现示例(年化超额收益率)**[36]: * 融资买入余额变化:5.76% * 大宗交易折溢价率:9.35% * A股龙虎榜买入强度:5.16% * R007:4.55% * 中证1000交易量能:10.06% * PB分化度:9.69% 量化因子与构建方式 (注:报告中未详细描述独立因子的构建过程,所有指标均作为模型组成部分出现,因此本部分略过) 因子的回测效果 (注:报告中未提供独立因子的测试结果,仅在小盘大盘轮动模型中列出了部分单指标的年化超额收益等表现,已归入模型回测效果部分)
AI量化的当下与未来
华泰证券· 2026-01-25 10:55
AI量化模型与因子总结 量化模型与构建方式 1. **模型名称:AI全频段量价模型** * **模型构建思路**:采用端到端建模范式,直接对原始量价数据进行学习,从低频(日、周、月频)逐步拓展至高频(逐笔成交、Level2)数据,旨在捕捉不同时间尺度下量价数据的内在联系与市场微观结构模式[3][17]。 * **模型具体构建过程**: * **低频多任务学习模型**:模型同时接收日频、周频和月频三种不同颗粒度的K线数据,采用同一个GRU模块提取时序信息,实现知识共享[19]。 * **PatchModel(长时间序列建模)**:借鉴分块思想,将长时间序列量价数据按交易日划分为多个patch,以缓解信息遗忘问题[22]。 * **PatchModel1**:使用GRU处理日内时序数据,再通过注意力机制构建日间联系[22][23]。 * **PatchModel2**:将日内时点信息拆解为不同特征,再使用GRU挖掘日间的时序规律[22][23]。 * **基于逐笔成交的深度学习模型**:从资金流和事件驱动角度构建特征,利用Transformer模型学习多维注意力规律[24]。 * **资金流模型**:根据等时间、等成交笔数、等成交量、等价格波动对逐笔成交数据进行采样,形成4种结构化K线。构建双层Transformer模型,第一层学习时序注意力,第二层学习跨K线注意力,最终输出个股未来收益预测[24][30]。 * **基于Level2数据图像的选股模型**:将高频逐笔成交与委托数据转换为标准化的三维图像格式(通道数、价格区间、成交量/委托量区间),应用Vision Transformer(ViT)及Video Vision Transformer(ViViT)进行模式识别,提取微观结构信息[27][28]。 * **模型评价**:作为一种具备长期价值的研究范式,端到端框架尝试在统一的表示空间中学习市场原始数据的内在联系,使量价研究从局部经验驱动迈向整体结构感知[17]。 2. **模型名称:Master模型** * **模型构建思路**:基于Transformer架构,通过新增变量间注意力层,实现对股票特征在时序上、股票间、特征间的关联变化进行协同建模[55]。 * **模型具体构建过程**:模型在时序注意力层的基础上,通过特定方式新增了变量间注意力层,以增强多变量协同建模能力[55]。具体网络结构可参考图表23[64]。 3. **模型名称:HIST模型** * **模型构建思路**:利用图神经网络(GNN)进行多变量相关性建模,通过多层残差图结构捕获股票间显式的行业板块关联、隐式的风格概念关联以及剩余的特征性收益[54]。 * **模型具体构建过程**:在注意力机制加持下,模型构建多层残差图结构来充分提取股票间的复杂关联信息[54]。具体网络结构可参考图表19[61]。 4. **模型名称:Crossformer模型** * **模型构建思路**:基于Transformer架构,专注于多变量协同建模,其底层模型结构在时序注意力层的基础上新增了变量间注意力层[55]。 * **模型具体构建过程**:通过改进的注意力机制实现对股票特征在时序和横截面上关联变化的协同建模[55]。具体网络结构可参考图表20[62]。 5. **模型名称:PortfolioNet系列模型** * **模型构建思路**:实现从收益预测到组合决策的端到端打通,旨在填平预测与交易之间的鸿沟,让模型直接对组合决策结果负责[5][112]。 * **模型具体构建过程**: * **PortfolioNet**:模型前端基于量价数据生成信号,随后经过可微优化层(如LinSAT)投影为合规的组合权重,组合收益直接参与损失计算并反向传播,实现一站式建模[112]。 * **PortfolioNet 2.0**:在前期模型基础上,对组合约束项赋予可微性能,让AI量价因子在追求高收益弹性的同时,也能捕捉Pure Alpha之外的风格收益[113]。 6. **模型名称:多粒度对比学习框架(CMLF)** * **模型构建思路**:解决直接融合不同粒度量价数据时面临的粒度不一致性和市场状态变化挑战,通过对比学习机制学习有效的股票表征,并动态调整特征融合方式[36]。 * **模型具体构建过程**: * **预训练阶段**:设计跨粒度对比和跨时间对比两种机制,以学习更有效的股票表征[36]。 * **特征融合阶段**:引入自适应门控机制,动态调节不同粒度特征的融合权重[36]。 7. **模型名称:多周期学习框架(MLF)** * **模型构建思路**:包含核心模块以消除周期间冗余信息、融合各周期预测结果,并确保数据一致性以降低模型偏差[40]。 * **模型具体构建过程**:包含三个核心模块:周期间冗余过滤(IRF)、可学习加权集成(LWI)和多周期自适应分块(MAP)[40]。 8. **模型名称:模态感知Transformer(MAT)** * **模型构建思路**:旨在提升深度学习模型挖掘跨模态交互信息的能力,通过引入特征级注意力层识别各模态中最相关的特征[42]。 * **模型具体构建过程**:设计三种多头注意力机制:模态内注意力(捕捉单模态内部时间依赖)、模态间注意力(探索不同模态间关联)和目标模态注意力(在解码阶段捕捉目标序列与各输入模态间的交互作用)[42]。 9. **模型名称:非平稳Transformer** * **模型构建思路**:针对金融时间序列的非平稳特性,改造Transformer底层架构,使模型能感知并适应数据分布的变化[77]。 * **模型具体构建过程**:保留数据预处理时描述原始数据分布特征的参数(如均值、方差),将注意力机制中计算的自注意力权重按照从原始数据分布特征中学到的平稳因子进行放缩,从而将数据分布统计特征引入注意力模块[77]。 10. **模型/框架名称:LLM-FADT文本策略** * **模型构建思路**:借助大语言模型(LLM)对上市公司相关研报、新闻文本进行深度理解,将另类数据中的情绪因子转化为交易信号[6][51]。 * **模型具体构建过程**:利用大模型深入挖掘文本数据,通过数据增强、分域建模的思想将文本情绪因子与AI模型相结合[51][52]。 11. **模型/框架名称:舆情分诊台(LLMRouter-GRU)** * **模型构建思路**:借助大模型挖掘新闻舆情文本,通过分域建模的思想将情绪因子与AI量价因子相结合,赋能选股模型[51]。 * **模型具体构建过程**:利用大模型处理新闻舆情文本,构建情绪因子,并将其与GRU等量价模型结合进行选股[51]。 12. **模型名称:3S-Trader** * **模型构建思路**:一个多LLM框架,用于自适应股票评分、策略制定和组合优化中的标的筛选,整合多源信息并提供可解释的策略优化方向[125]。 * **模型具体构建过程**:通过多个LLM代理分别分析新闻、财报和技术指标,对每只股票生成多维评分,再结合策略迭代模块进行组合构建与调整[125]。 13. **模型名称:MoEDRLPM** * **模型构建思路**:基于混合专家(Mixture of Experts)的深度强化学习组合模型,旨在通过动态切换交易逻辑来适应多变的市场状态[124]。 * **模型具体构建过程**:引入时序与空间注意力机制刻画资产的时空相关性,并利用混合专家结构在不同市场状态下动态切换交易逻辑[124]。 模型的回测效果 (注:报告中对部分模型给出了具体的策略跟踪结果,但指标名称和取值在提供的文本中未完整、系统地列出。以下根据原文提及的绩效描述进行总结。) 1. **AI全频段量价模型**:自2017年以来年化超额收益显著,在样本外持续展现出对中证1000指数的稳健增强效果[6]。 2. **Master因子**:通过精细化的结构设计与风格控制,既可兼顾Pure Alpha,也有机会捕获风格收益[6]。 3. **PortfolioNet 2.0因子**:在回测区间(2023-01-03至2025-11-28)内,合成因子相比于经典AI量价模型取得明显提升,在300增强、500增强与1000增强场景下,年化超额收益分别提升7.5pct、7.5pct与8.5pct,信息比率(IR)同步改善[113]。 4. **舆情分诊台(LLMRouter-GRU)**:在文本另类数据相关策略中表现优异[6]。 5. **LLM-FADT文本策略**:在文本另类数据相关策略中表现优异[6]。 量化因子与构建方式 1. **因子名称:Master因子** * **因子构建思路**:通过精细化的模型结构设计与风格控制,构建既能捕捉Pure Alpha,又能兼顾风格收益的复合因子[6]。 * **因子具体构建过程**:基于Master模型(一种市场引导的股票Transformer)进行股价预测,生成的预测信号作为选股因子[86]。具体构建方法可参考图表51[12]。 2. **因子名称:PortfolioNet2.0因子** * **因子构建思路**:利用PortfolioNet 2.0模型,通过端到端学习从原始数据中合成兼取风格收益与Pure Alpha的因子[6][113]。 * **因子具体构建过程**:模型在训练过程中,通过可微的组合约束项,使学习到的信号同时蕴含Pure Alpha和风格收益信息,最终输出用于选股的合成因子[113]。 3. **因子名称:大模型舆情选股因子 / LLM-FADT因子** * **因子构建思路**:利用大语言模型对文本(如分析师研报、新闻)的深度理解能力,挖掘其中的情绪或事件信息,并将其量化为选股因子[6][51]。 * **因子具体构建过程**:通过大模型处理文本数据,进行情感分类、信息提取或逻辑推理,将结果转化为数值型的股票信号[51][61]。 4. **因子名称:AI宏观因子** * **因子构建思路**:借助大语言模型从海量新闻舆情中提炼宏观叙事与情绪,构建能够捕捉传统数据滞后市场规律的宏观因子[5][132]。 * **因子具体构建过程**:使用LLM处理宏观新闻文本,构建例如经济增长、地缘风险等情绪指数,形成可用于资产配置或策略的宏观因子[53][132]。 5. **因子/框架名称:风险因子挖掘框架(如HRFT)** * **因子构建思路**:专注于挖掘刻画市场不确定性(如波动、相关性、尾部风险)的风险因子,而非传统收益因子[93]。 * **因子具体构建过程**:以HRFT(High-Frequency Risk Factor Transformer)为例,作为一种端到端挖掘框架,将符号数学类比为语言,利用Transformer直接从高频交易特征中自动提取可解释的公式化风险因子,例如用于度量短期市场收益分布方差的因子[93]。 6. **因子挖掘框架:EvoAlpha / TreEvo / CogAlpha** * **构建思路**:基于大语言模型实现“认知型”因子挖掘,利用LLM对金融语义和代码逻辑的理解来指导进化过程,提升搜索效率和因子的可解释性[96][97]。 * **具体构建过程**:如TreEvo框架引入“树状思维进化”,让LLM先构建分层的交易逻辑(如动量、反转的组合),再将其转化为具体代码,实现从线性代码生成向层次化思维进化的转变[97]。 7. **因子挖掘框架:Alpha Jungle / RiskMiner** * **构建思路**:将LLM的生成能力与蒙特卡洛树搜索(MCTS)等规划算法结合,在高维稀疏的Alpha空间中实现有导向、有策略的高效导航[100][101]。 * **具体构建过程**:LLM作为策略网络提出候选公式,回测结果作为价值网络的反馈信号,引导MCTS的搜索方向。RiskMiner则采用“风险寻求”的MCTS变体,专门探索高风险但潜在高收益的稀有因子[101]。 8. **因子挖掘框架:AlphaForge / Synergistic Alpha** * **构建思路**:重心从挖掘单一因子转向“因子协同”与“动态组合”,直接面向投资组合的最终表现进行端到端优化[105]。 * **具体构建过程**:不仅挖掘基础公式,还通过基因拼接等算子寻找与现有因子库正交的新因子,并引入动态权重调整机制,实现基于市场环境变化的实时因子重组[105]。 因子的回测效果 (注:报告中对部分因子给出了具体的绩效指标,以下根据原文图表和描述进行总结。) 1. **Master因子**:根据图表52,在回测中展示了其RankIC、年化超额收益、夏普比率等信息,并与其他基准因子进行了对比[12]。图表55和56显示了其用于中证1000指数增强的业绩指标和超额净值曲线[12]。 2. **PortfolioNet2.0因子**:根据图表59,在中证1000指增组合中(回测区间2023-01-03至2025-12-31),展示了年化超额收益、超额波动、信息比率(IR)、最大回撤等绩效指标[12]。 3. **“舆情分诊台”AI量价因子**:根据图表57,在沪深300指增组合中(回测区间2023-01-03至2025-12-31),展示了年化超额收益、信息比率(IR)等绩效表现[12]。 4. **LLM-FADT文本策略**:根据图表63,在中证500增强策略回测期(2017-01-26至2025-12-31)内,展示了年化收益、年化波动、夏普比率、最大回撤等绩效指标[12]。图表65对比了其与BERT-FADT策略的超额收益[12]。
量化择时和拥挤度预警周报(20260124):市场下周或将震荡上行
国泰海通证券· 2026-01-25 09:00
量化模型与构建方式 1. **模型名称:SAR技术指标择时模型**[1][7][14] * **模型构建思路**:使用抛物线转向指标(SAR)来识别市场趋势的潜在反转点,生成买入或卖出信号[1][7][14]。 * **模型具体构建过程**:SAR指标的计算涉及一个递归过程,其核心思想是随着价格趋势的发展,止损点(即SAR值)会加速移动。具体公式和计算步骤在报告中未详细给出,但标准SAR计算公式通常如下: $$SAR_{t} = SAR_{t-1} + AF \times (EP - SAR_{t-1})$$ 其中,`SAR_t`为当前周期的SAR值,`SAR_{t-1}`为上一周期的SAR值,`AF`为加速因子(随着新极值点出现而递增,但有上限),`EP`为当前上涨趋势中的最高价或下跌趋势中的最低价(极值点)。当价格从下方突破SAR时,发出买入信号;当价格从上方跌破SAR时,发出卖出信号[15]。 2. **模型名称:市场均线强弱指数**[4][14] * **模型构建思路**:通过计算各行业指数相对于其均线的位置,来综合判断整个市场的技术强弱[4][14]。 * **模型具体构建过程**:报告提及该指数基于Wind二级行业指数计算。具体构建过程未详细说明,但通常思路可能是:计算每个行业指数相对于其某条移动平均线(如20日、60日均线)的偏离度或强弱状态,然后将所有行业的得分进行加总或平均,得到代表整体市场强度的指数。当前得分为238,处于2023年以来86.52%的分位点[14]。 3. **模型名称:市场情绪模型**[4][14][16] * **模型构建思路**:通过构建与涨跌停板相关的因子,来刻画市场的情绪强弱[4][14]。 * **模型具体构建过程**:根据国泰海通量化团队前期专题报告,该模型包含多个细分情绪因子。报告列出了截至当前的部分因子信号:净涨停占比(信号为1)、跌停次日收益(信号为0)、涨停板占比(信号为0)、跌停板占比(信号为0)、高频打板收益(信号为1)[16]。这些因子信号通过一定规则(报告中未详述)汇总成情绪模型得分(当前为2分,满分5分)以及趋势模型信号(正向)和加权模型信号(正向)[14]。 4. **模型名称:高频资金流择时模型**[4][14][16] * **模型构建思路**:通过分析高频资金流的走势,对主要宽基指数发出买入或卖出信号[4][14]。 * **模型具体构建过程**:根据国泰海通量化团队前期专题报告构建。报告展示了该模型对沪深300、中证500、中证1000指数的信号。模型分为“激进多头”、“激进多空”、“稳健多头”、“稳健多空”四种策略,当前对所有观察的宽基指数均发出看多信号(信号值为1)[16]。 5. **因子名称:因子拥挤度复合指标**[18][19] * **因子构建思路**:用于预警因子因资金过度追逐而可能失效的风险,通过综合多个维度指标来度量因子的拥挤程度[18]。 * **因子具体构建过程**:根据国泰海通量化团队前期专题报告,使用四个指标度量因子拥挤度:估值价差、配对相关性、长期收益反转、因子波动率。报告未给出每个分项指标的具体计算公式。最终,将这四个指标得分综合成一个复合拥挤度打分[18][19]。 6. **因子名称:行业拥挤度指标**[25][27] * **因子构建思路**:度量特定行业板块因资金过度集中而可能面临的回调风险[25]。 * **因子具体构建过程**:根据国泰海通量化团队前期专题报告构建。报告未给出具体计算公式,但展示了截至2026年1月23日各行业的拥挤度数值及相对上月的变化[25][27][28]。 模型的回测效果 (注:本报告为周报,主要展示模型当期信号和部分指标状态,未提供历史回测绩效指标如年化收益率、夏普比率等。) 量化因子与构建方式 1. **因子名称:流动性冲击指标**[4][8] * **因子构建思路**:基于沪深300指数,衡量当前市场流动性相对于历史平均水平的偏离程度[4][8]。 * **因子具体构建过程**:报告指出,该指标值为5.09,意味着当前市场的流动性高于过去一年平均水平5.09倍标准差。具体计算公式未提供[8]。 2. **因子名称:PUT-CALL比率**[4][8] * **因子构建思路**:通过上证50ETF期权看跌期权与看涨期权的成交量比率,来观察投资者对短期走势的情绪谨慎程度[4][8]。 * **因子具体构建过程**:计算公式为看跌期权成交量除以看涨期权成交量。报告指出周五该比率为0.98,高于前一周的0.80[8]。 3. **因子名称:五日平均换手率**[4][8] * **因子构建思路**:通过计算上证综指和Wind全A指数的五日平均换手率,并观察其历史分位点,来判断市场交易活跃度[4][8]。 * **因子具体构建过程**:计算指数最近五个交易日的平均换手率。报告指出当前值分别为1.50%和2.21%,处于2005年以来的80.71%和86.58%分位点[8]。 4. **因子名称:日历效应因子**[7][9] * **因子构建思路**:基于历史数据,统计特定时间段(如1月下半月)各大宽基指数的历史表现规律,作为市场表现的参考[7][9]。 * **因子具体构建过程**:统计2005年以来,每年1月下半月各指数的涨跌幅,计算上涨概率、涨幅均值和中位数。例如,报告指出上证综指在1月下半月上涨概率为55%,涨幅均值为-1.52%[9]。 5. **因子名称:估值价差(因子拥挤度分项)**[18][19] * **因子构建思路**:作为因子拥挤度的度量指标之一,具体思路未在本文中详述[18]。 * **因子具体构建过程**:计算过程未提供。报告展示了小市值、低估值、高盈利、高增长因子的估值价差分项得分[19]。 6. **因子名称:配对相关性(因子拥挤度分项)**[18][19] * **因子构建思路**:作为因子拥挤度的度量指标之一,具体思路未在本文中详述[18]。 * **因子具体构建过程**:计算过程未提供。报告展示了小市值、低估值、高盈利、高增长因子的配对相关性分项得分[19]。 7. **因子名称:长期收益反转(因子拥挤度分项)**[18][19] * **因子构建思路**:作为因子拥挤度的度量指标之一,具体思路未在本文中详述[18]。 * **因子具体构建过程**:计算过程未提供。报告展示了小市值、低估值、高盈利、高增长因子的长期收益反转分项得分[19]。 8. **因子名称:因子波动率(因子拥挤度分项)**[18][19] * **因子构建思路**:作为因子拥挤度的度量指标之一,具体思路未在本文中详述[18]。 * **因子具体构建过程**:计算过程未提供。报告展示了小市值、低估值、高盈利、高增长因子的因子波动率分项得分[19]。 因子的回测效果 (注:本报告未提供因子IC、IR、多空收益等传统因子测试结果。主要展示了部分因子的当期数值或状态。) **因子拥挤度复合指标取值(截至2026.01.23)**[19][21] 1. 小市值因子拥挤度:0.28 2. 低估值因子拥挤度:-0.42 3. 高盈利因子拥挤度:0.31 4. 高盈利增长因子拥挤度:0.35 **行业拥挤度指标取值(截至2026.01.23,列举部分)**[27][28] 1. 有色金属行业拥挤度:2.08 2. 综合行业拥挤度:1.98 3. 通信行业拥挤度:1.97 4. 电子行业拥挤度:1.47 5. 国防军工行业拥挤度:1.46 6. 食品饮料行业拥挤度:-1.27 7. 美容护理行业拥挤度:-1.43
量化择时和拥挤度预警周报(20260124):市场下周或将震荡上行-20260124
国泰海通证券· 2026-01-24 23:33
量化模型与构建方式 1. **模型名称:SAR择时模型**[14] * **模型构建思路**:使用抛物线转向指标(SAR)来识别市场趋势的潜在反转点,生成买入或卖出信号[14]。 * **模型具体构建过程**:SAR指标的计算涉及一个加速因子,随着趋势的延续,该因子会逐步增大,使得止损点(SAR值)加速靠近价格。当价格从下方突破SAR线时,发出买入信号;当价格从上方跌破SAR线时,发出卖出信号[14][15]。报告中将此模型应用于Wind全A指数。 2. **模型名称:市场均线强弱指数**[14] * **模型构建思路**:通过计算各行业指数相对于其均线的位置,综合评估整个市场的技术强弱[14]。 * **模型具体构建过程**:基于Wind二级行业指数,计算每个行业指数与其均线(如20日均线)的相对位置,然后对所有行业的得分进行加总或平均,得到市场整体的均线强弱分数。报告指出当前得分为238,处于2023年以来的86.52%分位点,表明市场技术面偏强[14][16]。 3. **模型名称:市场情绪模型**[14] * **模型构建思路**:通过构建与涨跌停板相关的因子,来刻画市场的情绪强弱和赚钱效应[14]。 * **模型具体构建过程**:根据国泰海通量化团队前期专题报告,构建了多个细分情绪因子,包括:净涨停占比、跌停次日收益、涨停板占比、跌停板占比、高频打板收益[14][17]。每个因子会生成一个信号(例如,1表示看多,0表示中性或看空),最终通过某种方式(如加权或打分卡)汇总成一个综合情绪得分。报告显示当前情绪模型得分为2分(满分5分)[14]。 4. **模型名称:高频资金流择时模型**[14] * **模型构建思路**:通过分析高频资金流的走势,对主要宽基指数发出买入或卖出信号[14]。 * **模型具体构建过程**:根据国泰海通量化团队前期专题报告,利用高频资金流数据构建模型。模型分为“激进多头”、“激进多空”、“稳健多头”、“稳健多空”四种策略,每种策略对特定指数(如沪深300、中证500、中证1000)生成信号(1代表看多)[14][17]。 5. **因子名称:因子拥挤度复合指标**[18] * **因子构建思路**:为了预警因子可能因资金过度追逐而失效的风险,使用多个维度指标综合度量因子的拥挤程度[18]。 * **因子具体构建过程**:参考国泰海通量化团队前期专题报告,使用四个指标来度量因子拥挤度[18]: 1. **估值价差**:衡量因子多空组合在估值指标上的差异。 2. **配对相关性**:衡量因子多空组合内股票收益的相关性。 3. **长期收益反转**:衡量因子近期收益与长期收益的背离情况。 4. **因子波动率**:衡量因子收益序列的波动情况。 将上述四个分项指标标准化后,通过一定方法(如等权或加权)合成一个综合拥挤度得分。报告展示了小市值、低估值、高盈利、高增长四个因子的拥挤度[19][21]。 6. **因子名称:行业拥挤度指标**[25] * **因子构建思路**:度量特定行业板块因资金过度集中而可能面临回调的风险[25]。 * **因子具体构建过程**:根据国泰海通量化团队前期专题报告《行业轮动系列研究 15——行业板块拥挤度》构建。报告未给出具体计算公式,但展示了截至2026年1月23日各行业的拥挤度数值及相对上月的变化[25][27][28]。 模型的回测效果 *注:本报告为周报,主要展示模型的最新信号和状态,未提供历史回测的绩效指标(如年化收益率、夏普比率、最大回撤等)。* 1. **SAR择时模型**:对Wind全A指数,于1月20日发出卖出信号,于1月23日再度发出买入信号[14]。 2. **市场均线强弱指数**:当前市场得分为238,处于2023年以来的86.52%分位点[14]。 3. **市场情绪模型**:综合得分为2分(满分5分),趋势模型信号为正向,加权模型信号为正向[14]。细分因子信号为:净涨停占比(1),跌停次日收益(0),涨停板占比(0),跌停板占比(0),高频打板收益(1)[17]。 4. **高频资金流择时模型**:对沪深300、中证500、中证1000指数,激进多头、激进多空、稳健多头、稳健多空四种策略信号均为1(看多)[17]。 因子的回测效果 *注:本报告未提供因子IC、IR、多空收益等传统因子测试绩效指标。主要展示了因子拥挤度指标的最新数值。* 1. **小市值因子拥挤度**:综合打分 0.28[19][21]。分项得分:估值价差 0.67,配对相关性 0.45,市场波动 -0.51,收益反转 0.51[19]。 2. **低估值因子拥挤度**:综合打分 -0.42[19][21]。分项得分:估值价差 -1.39,配对相关性 0.24,市场波动 1.39,收益反转 -1.90[19]。 3. **高盈利因子拥挤度**:综合打分 0.31[19][21]。分项得分:估值价差 -0.61,配对相关性 0.15,市场波动 0.15,收益反转 1.57[19]。 4. **高盈利增长因子拥挤度**:综合打分 0.35[19][21]。分项得分:估值价差 1.12,配对相关性 -0.49,市场波动 -0.21,收益反转 0.97[19]。 5. **行业拥挤度**:截至2026年1月23日,有色金属(2.08)、综合(1.98)、通信(1.97)、电子(1.47)、国防军工(1.46)等行业拥挤度相对较高[27][28]。国防军工和电子的行业拥挤度上升幅度相对较大[25][28]。
金融工程专题研究:安沪深300指数增强基金投资价值分析
国信证券· 2026-01-24 22:46
量化模型与构建方式 1. **模型名称**:创新的基本面量化模型[32] **模型构建思路**:融合主动权益投资与量化投资的优势,将基本面投资逻辑进行定量化归纳和提炼,以兼顾长期逻辑与投资效率[31][33] **模型具体构建过程**:该模型并非一个具体的单一模型,而是一个融合性的投资框架。其核心是将传统基本面分析的逻辑(如产业理解、深度价值挖掘)进行系统化、定量化的处理,形成可验证、可迭代的量化规则[30][33]。汇安基金基于此框架,构建了一个包含多种策略的量化策略储备体系,可以根据产品定位和客户需求进行灵活组合与定制化输出[35][37]。具体策略储备包括:适配A股市场的Barra多因子模型、小微盘精选策略、超预期策略、机构持仓精选策略、SmartBeta选股策略、红利精选策略[35]。 2. **模型名称**:Brinson归因模型[56] **模型构建思路**:用于分解投资组合相对于基准的超额收益来源,将超额收益拆解为配置收益、选股收益和交互收益,以评估基金经理的资产配置和个股选择能力[56] **模型具体构建过程**:基于基金定期报告(半年报/年报)披露的全部持仓,模拟其下一季度的收益,并以沪深300指数作为业绩基准进行归因分析。超额收益被分解为三个部分:配置收益(行业/板块配置贡献)、选股收益(行业内个股选择贡献)和交互收益(配置与选股共同作用的贡献)。此外,还定义了交易收益,即基金实际收益与基于定期报告持仓模拟收益的差额,用于衡量持仓披露后主动交易带来的收益。具体拆解公式如下: $$基金收益-指数收益=交易收益+超额收益=交易收益+配置收益+交互收益+选股收益$$[56] **模型评价**:该模型能有效拆解基金超额收益的来源,帮助分析基金经理的选股能力和配置能力[56]。 量化因子与构建方式 1. **因子名称**:Barra风险因子[35][50] **因子构建思路**:采用成熟的Barra多因子风险模型来刻画股票的风险特征,并控制组合相对于基准的风格暴露,以实现“紧约束,低偏离”的投资目标[35][46] **因子具体构建过程**:报告中未详细描述Barra因子的具体构建公式,但明确指出该基金使用了适配A股市场的Barra多因子模型[35]。该模型通常包含一系列风格因子(如市值、估值、动量、波动率、流动性、成长、盈利质量等)和行业因子。通过计算基金持仓在这些因子上的暴露度,并与基准指数(沪深300)的暴露度进行对比,以评估组合的风格偏离情况[50]。 **因子评价**:使用Barra模型有助于严格控制组合的风格暴露,使其贴近基准,减少不必要的风格偏离风险,符合“紧约束”的策略要求[46][50]。 模型的回测效果 1. **创新的基本面量化模型(汇安沪深300指数增强A应用效果)** **全样本期(2023-09-28至2026-01-16)**:年化收益13.06%,年化超额收益2.29%,信息比率(IR)0.81,年化跟踪误差2.53%,最大回撤-13.65%[40][42] **2024年度**:年化超额收益-0.92%,信息比率(IR)-0.26,年化跟踪误差3.31%[42] **2025年度**:累计超额收益7.23%,信息比率(IR)4.74,年化跟踪误差1.28%,相对最大回撤-0.57%[3][41][42] 2. **Brinson归因模型(应用于汇安沪深300指数增强A的归因结果)** **2025年第一季度**:选股收益0.89%,配置收益-0.19%,交互收益-0.03%,超额收益0.67%[56][59] **2025年第三季度**:选股收益0.42%,配置收益1.51%,交互收益0.10%,超额收益2.03%[56][59] **2025Q1与Q3均值**:平均季度选股收益0.66%[3][56][59] 因子的回测效果 1. **Barra风险因子暴露分析(汇安沪深300指数增强A,2024H2至2025H1)** **市值因子**:暴露与沪深300基准指数几乎保持一致,无明显偏离[50] **成长因子**:略有正向暴露[50] **整体风格暴露**:与沪深300指数的因子暴露整体较为相近[3][50]