Workflow
金融工程月报:券商金股2025年10月投资月报-20251009
国信证券· 2025-10-09 14:46
根据提供的金融工程月报,以下是关于报告中涉及的量化模型和因子的总结: 量化模型与构建方式 1. 券商金股指数模型 - **模型构建思路**:券商金股组合能够体现总量分析师自上而下的配置能力和行业分析师自下而上的选股能力,并且研究发现该股票池能够较好地跟踪偏股混合型基金指数的表现[12][18] - **模型具体构建过程**:每月初汇总券商金股,根据其被券商推荐的家数进行加权构建指数,并于每月第一天收盘价进行调仓[18] 为了更公允地与偏股混合型基金指数比较,在计算收益时,以每次调仓时点所能获取的主动股基最近一个报告期的权益仓位中位数作为券商金股指数的仓位[18] 2. 券商金股业绩增强组合模型 - **模型构建思路**:以对标公募基金中位数为基准,在券商金股股票池中进行优选,目标是获得稳定战胜偏股混合型基金指数的表现[12][39][43] - **模型具体构建过程**:以券商金股股票池为选股空间和约束基准,采用组合优化的方式控制组合与券商金股股票池在个股、风格上的偏离,以全体公募基金的行业分布为行业配置基准进行构建[43] 组合考虑仓位及交易费用的影响[44] 量化因子与构建方式 1. 券商推荐家数因子 - **因子构建思路**:在券商金股股票池中,多人推荐的股票往往能够获得更高的市场关注度[31] - **因子具体构建过程**:统计每只股票被不同券商推荐为金股的家数,作为衡量市场关注度的指标[31][34] 2. 买方关注度因子 - **因子构建思路**:如果一只股票尚未被任何主动股基持有为前十大重仓股,说明其在公募基金经理群体中的关注度有待提升[35] - **因子具体构建过程**:识别本月券商金股股票池中,尚未被任何主动股基在最近一个季报中持有为前十大重仓股的样本[35][38] 3. 卖方关注度因子 - **因子构建思路**:如果某只股票在最近12个月均未被任何券商分析师推荐为金股,说明其在券商分析师群体中受到的关注相对较少[36] - **因子具体构建过程**:筛选本月金股中,属于近12个月以来首次出现在券商金股股票池中的样本[36][37] 4. 常见选股因子 报告中提到了在券商金股股票池中跟踪的多种常见选股因子[3][27]: - 日内收益率 - BP(账面市值比) - 波动率 - 总市值 - SUE(标准化未预期收益) - 单季度超预期幅度 - 单季度营收增速 - 分析师净上调幅度 - 预期股息率 模型的回测效果 1. 券商金股指数模型 - 本月(20250902-20250930)收益:3.65%[21] - 今年以来(20250102-20250930)收益:31.66%[21] - 同期偏股混合型基金指数收益:35.37%[21] 2. 券商金股业绩增强组合模型 **本月表现(2050901-20250930)**[5][42]: - 绝对收益:-0.55% - 相对偏股混合型基金指数超额收益:-3.50% **本年表现(20250102-20250930)**[5][42]: - 绝对收益:33.26% - 相对偏股混合型基金指数超额收益:1.19% - 在主动股基中排名分位点:43.07%(1494/3469) **历史表现(2018.1.2-2025.6.30)**[44][47]: - 年化收益:19.34% - 相对偏股混合型基金指数年化超额:14.38% - 2018-2025年期间,每年业绩排名都排在主动股基前30%的水平 因子的回测效果 1. 选股因子近期表现 **最近一个月表现**[3][27]: - 表现较好因子:日内收益率、BP、波动率 - 表现较差因子:总市值、SUE、单季度超预期幅度 **今年以来表现**[3][27]: - 表现较好因子:总市值、单季度营收增速、分析师净上调幅度 - 表现较差因子:波动率、预期股息率、BP 2. 行业因子表现 **本月行业组合收益**[22][23][25]: - 超额收益排名前三行业:计算机、房地产、汽车 **今年以来行业组合收益**[22][23][26]: - 超额收益排名前三行业:电子、汽车、计算机
量化点评报告:十月配置建议:价值股的左侧信号
国盛证券· 2025-10-09 14:10
根据研报内容,以下是关于量化模型和因子的总结: 量化模型与构建方式 1. 模型名称:A股赔率模型 - **模型构建思路**:基于股权风险溢价(ERP)和股息风险溢价(DRP)的标准化数值等权计算A股赔率,以衡量A股资产的估值吸引力[10] - **模型具体构建过程**:首先计算ERP和DRP,然后对这两个指标进行标准化处理,最后将标准化后的数值进行等权加总得到综合赔率指标[10] 2. 模型名称:宏观胜率评分卡模型 - **模型构建思路**:从货币、信用、增长、通胀和海外五个宏观因素出发,合成得到各资产的综合胜率指标[10][42] - **模型具体构建过程**:基于五个宏观因子构建评分体系,综合评估各类资产的胜率表现[10][42] 3. 模型名称:债券赔率模型 - **模型构建思路**:根据长短债预期收益差构建债券资产赔率指标,衡量债券市场的估值水平[11] - **模型具体构建过程**:使用利率债收益预测框架,基于长短债的预期收益差异来构建赔率指标[11] 4. 模型名称:美联储流动性指数模型 - **模型构建思路**:结合数量维度和价格维度构建美联储流动性指数,用于评估市场流动性状况[15] - **模型具体构建过程**:从联储负债端存款准备金、净流动性、联储信用支持、预期引导、市场隐含、公告意外等多个维度综合构建流动性指数[16] 5. 模型名称:行业轮动三维评价模型 - **模型构建思路**:基于趋势-景气度-拥挤度三维评价体系进行行业轮动配置[34][36] - **模型具体构建过程**:使用行业过去12个月信息比率刻画行业动量和趋势,以行业的换手率比率、波动率比率和beta比率刻画行业的交易拥挤度,结合景气度指标形成三维评价体系[34] 6. 模型名称:赔率+胜率增强型策略 - **模型构建思路**:结合各资产的赔率与胜率策略的风险预算,在目标波动率约束的条件下构建资产配置策略[3][39][45] - **模型具体构建过程**:将赔率策略的风险预算和胜率策略的风险预算进行简单相加得到综合得分,据此进行资产配置权重调整[45] 量化因子与构建方式 1. 因子名称:价值因子 - **因子构建思路**:基于价值风格的三标尺(赔率、趋势、拥挤度)进行综合评价[19][22] - **因子具体构建过程**:从赔率、趋势和拥挤度三个维度对价值风格进行量化评分,赔率回升至0.9倍标准差,趋势位于-0.3倍标准差,拥挤度处于-1.4倍标准差的较低水平[19][22] 2. 因子名称:小盘因子 - **因子构建思路**:基于小盘风格的三标尺进行综合评价[20][23] - **因子具体构建过程**:小盘因子的赔率处于-0.2倍标准差(中性水平),趋势位于1.6倍标准差(极高水平),拥挤度回落至-0.5倍标准差(中低水平)[20][23] 3. 因子名称:质量因子 - **因子构建思路**:基于质量风格的三标尺进行综合评价[24][26] - **因子具体构建过程**:质量风格赔率当前位于1.4倍标准差,拥挤度处于-0.5倍标准差的较低水平,趋势处于-1.2倍标准差的较低水平[24][26] 4. 因子名称:成长因子 - **因子构建思路**:基于成长风格的三标尺进行综合评价[27][29] - **因子具体构建过程**:成长因子趋势回升至0.1倍标准差的中等水平,赔率位于0.8倍标准差,拥挤度升至1.0倍标准差[27][29] 模型的回测效果 1. 赔率+胜率增强型策略 - 2011年以来年化收益7.0%,最大回撤2.8%[3][45] - 2014年以来年化收益7.6%,最大回撤2.7%[3][45] - 2019年以来年化收益7.2%,最大回撤2.8%[3][45] 2. 赔率增强型策略 - 2011年以来年化收益6.6%,最大回撤3.0%[39][41] - 2014年以来年化收益7.5%,最大回撤2.4%[39][41] - 2019年以来年化收益7.0%,最大回撤2.4%[39][41] 3. 胜率增强型策略 - 2011年以来年化收益7.0%,最大回撤2.8%[42][44] - 2014年以来年化收益7.7%,最大回撤2.3%[42][44] - 2019年以来年化收益6.3%,最大回撤2.3%[42][44] 4. 行业轮动三维评价模型 - 2011年以来超额表现13.1%,跟踪误差11.0%,最大回撤25.4%,信息比率1.18[35] - 2014年以来超额表现13.0%,跟踪误差12.0%,最大回撤25.4%,信息比率1.08[35] - 2019年以来超额表现10.8%,跟踪误差10.7%,最大回撤12.3%,信息比率1.02[35] 因子的回测效果 1. 价值因子 - 赔率:0.9倍标准差[19][22] - 趋势:-0.3倍标准差[19][22] - 拥挤度:-1.4倍标准差[19][22] - 综合得分:3分[19] 2. 小盘因子 - 赔率:-0.2倍标准差[20][23] - 趋势:1.6倍标准差[20][23] - 拥挤度:-0.5倍标准差[20][23] - 综合得分:2.2分[20] 3. 质量因子 - 赔率:1.4倍标准差[24][26] - 趋势:-1.2倍标准差[24][26] - 拥挤度:-0.5倍标准差[24][26] - 综合得分:0.6分[24] 4. 成长因子 - 赔率:0.8倍标准差[27][29] - 趋势:0.1倍标准差[27][29] - 拥挤度:1.0倍标准差[27][29] - 综合得分:0.1分[27]
科技板块出现分化
国盛证券· 2025-10-08 20:38
根据研报内容,总结如下: 量化模型与构建方式 **1 模型名称:A股景气指数模型[29]** - 模型构建思路:以上证指数归母净利润同比为Nowcasting目标,构建反映A股景气度的高频指数[29] - 模型具体构建过程:通过高频数据实时追踪上证指数归母净利润同比变化,构建景气度指数,用于判断经济周期位置和趋势[29] **2 模型名称:A股情绪指数模型[36]** - 模型构建思路:基于市场波动率和成交额的变化方向划分四个象限,构造情绪指数包含见底预警与见顶预警[36] - 模型具体构建过程:将市场按照波动率和成交额的变化方向划分为四个象限,识别不同象限的市场收益特征,据此构建情绪指数$$情绪指数 = f(波动率变化, 成交额变化)$$其中波动率变化和成交额变化分别代表市场价和量的情绪维度[36] **3 模型名称:BARRA多因子模型[58]** - 模型构建思路:参照BARRA因子模型框架,对A股市场构建十大类风格因子体系[58] - 模型具体构建过程:构建十大类风格因子包括:市值(SIZE)、BETA、动量(MOM)、残差波动率(RESVOL)、非线性市值(NLSIZE)、估值(BTOP)、流动性(LIQUIDITY)、盈利(EARNINGS_YIELD)、成长(GROWTH)和杠杆(LVRG),用于解释股票收益和市场风格特征[58] **4 模型名称:指数增强组合模型[46][53]** - 模型构建思路:基于量化策略模型构建中证500和沪深300指数增强组合,追求超越基准的超额收益[46][53] - 模型具体构建过程:通过多因子选股模型和优化算法,在控制跟踪误差的前提下构建投资组合,具体持仓权重由策略模型生成[46][53] **5 模型名称:主题挖掘算法模型[46]** - 模型构建思路:基于新闻和研报文本挖掘主题投资机会[46] - 模型具体构建过程:通过对文本处理、主题关键词提取、主题个股关系挖掘、主题活跃周期构建、主题影响力因子构建等多个维度描述主题投资机会[46] 量化因子与构建方式 **1 因子名称:市值因子(SIZE)[58][59]** - 因子构建思路:衡量股票市值规模对收益的影响[58] - 因子具体构建过程:基于股票总市值或流通市值构建,反映规模效应[58] **2 因子名称:BETA因子[58][59]** - 因子构建思路:衡量股票系统性风险暴露[58] - 因子具体构建过程:通过股票收益与市场收益的回归系数计算[58] **3 因子名称:动量因子(MOM)[58][59]** - 因子构建思路:捕捉股票价格动量效应[58] - 因子具体构建过程:基于历史价格表现构建,反映趋势延续特征[58] **4 因子名称:残差波动率因子(RESVOL)[58][59]** - 因子构建思路:衡量股票特异性风险[58] - 因子具体构建过程:通过回归残差的标准差计算,反映非系统性波动[58] **5 因子名称:非线性市值因子(NLSIZE)[58][59]** - 因子构建思路:捕捉市值与收益的非线性关系[58] - 因子具体构建过程:对市值因子进行非线性变换,识别市值效应的复杂特征[58] **6 因子名称:估值因子(BTOP)[58][59]** - 因子构建思路:衡量股票估值水平对收益的影响[58] - 因子具体构建过程:基于市净率等估值指标构建,反映价值效应[58] **7 因子名称:流动性因子(LIQUIDITY)[58][59]** - 因子构建思路:捕捉流动性溢价效应[58] - 因子具体构建过程:基于换手率、交易量等流动性指标构建[58] **8 因子名称:盈利因子(EARNINGS_YIELD)[58][59]** - 因子构建思路:衡量公司盈利能力对收益的影响[58] - 因子具体构建过程:基于市盈率、盈利收益率等指标构建[58] **9 因子名称:成长因子(GROWTH)[58][59]** - 因子构建思路:捕捉公司成长性特征[58] - 因子具体构建过程:基于收入增长率、盈利增长率等成长性指标构建[58] **10 因子名称:杠杆因子(LVRG)[58][59]** - 因子构建思路:衡量公司财务杠杆水平对收益的影响[58] - 因子具体构建过程:基于资产负债率、权益乘数等杠杆指标构建[58] 模型的回测效果 **1 A股景气指数模型[33]** - 截至2025年9月30日,A股景气指数为21.28,相比2023年底上升15.85[33] **2 指数增强组合模型[46][53]** - 中证500增强组合:节前收益1.99%,跑输基准0.38%;2020年至今超额收益51.20%,最大回撤-5.73%[46] - 沪深300增强组合:节前收益率2.15%,跑赢基准0.16%;2020年至今超额收益38.68%,最大回撤-5.86%[53] **3 A股情绪指数模型[40]** - 当前A股情绪见底指数信号:空,A股情绪见顶指数信号:空,综合信号为:空[40] 因子的回测效果 **1 风格因子近期表现[59]** - 市值因子:超额收益较高[59] - 残差波动率因子:呈较为显著的负向超额收益[59] - BETA因子:表现优异[59] - 成长因子:表现优异[59] - 价值因子:表现不佳[59] **2 行业因子近期表现[59]** - 钢铁、电力设备、有色金属等行业因子:相对市场市值加权组合跑出较高超额收益[59] - 消费者服务、煤炭、银行等行业因子:回撤较多[59] **3 因子相关性分析[60]** - 流动性因子与Beta、动量、残差波动率呈现明显正相关性[60] - 价值因子与Beta、残差波动率、流动性等因子呈现明显负相关性[60] - 市值因子与非线性市值因子相关性为0.513[60] - Beta因子与流动性因子相关性为0.568[60] - 动量因子与残差波动率因子相关性为0.577[60]
高波的鱼尾,难测的鱼头
国投证券· 2025-10-08 18:02
根据提供的研报内容,以下是关于量化模型与因子的总结: 量化因子与构建方式 **1 因子名称:行业分歧度[7]** - **因子构建思路**:通过计算各行业滚动一季度收益率的标准差,来衡量市场行业表现的分化程度[7] - **因子具体构建过程**: 1. 选取市场中的所有行业作为计算样本 2. 计算每个行业在过去一个季度(滚动窗口)的收益率 3. 计算这些行业收益率的标准差,作为行业分歧度指标 具体公式为: $$行业分歧度 = Std( R_{i, t} )$$ 其中,`R_i,t` 代表行业 `i` 在滚动一季度窗口内的收益率,`Std` 代表标准差函数 **2 因子名称:交易拥挤度[7]** - **因子构建思路**:通过计算特定板块(如TMT、先进制造)的成交金额占市场总成交金额的比例,来衡量资金在这些板块的集中程度[7] - **因子具体构建过程**: 1. 确定目标板块(如TMT板块、先进制造板块) 2. 计算目标板块内所有成分的日成交金额总和 3. 计算全市场(或选定基准)的总成交金额 4. 计算板块成交金额总和与市场总成交金额的比值 具体公式为: $$板块拥挤度 = \frac{成交金额_{板块}}{成交金额_{全市场}}$$ 报告中特别提及了TMT板块拥挤度,以及TMT与先进制造板块合并计算的拥挤度[7] **3 因子名称:股债收益差[8]** - **因子构建思路**:通过比较股票市场收益率与债券市场收益率的差异,并结合布林带分析,来判断市场的相对价值和风险[8] - **因子具体构建过程**: 1. 计算股票的隐含收益率(通常使用市盈率的倒数等方法) 2. 选取代表性债券(如10年期国债)计算其到期收益率 3. 计算股债收益差:`股债收益差 = 股票收益率 - 债券收益率` 4. 基于近三年的股债收益差数据计算其布林带,包括中轨(均值)和上下轨(均值±2倍标准差)[8] 报告中指出该指标用于判断市场位置,当前运行在布林带下轨(-2倍标准差)下方[8] 模型的回测效果 *(注:报告中未提供具体量化模型的回测数值结果)* 因子的回测效果 *(注:报告中未提供具体量化因子的回测数值结果,但对因子的历史表现和当前状态有定性描述)* **行业分歧度因子**:近期持续扩大,若格局延续预计将突破2024年9月以来的峰值,历史极值通常伴随市场风险偏好提升出现[7] **交易拥挤度因子**:TMT板块成交占比处于历史第三高位,TMT与先进制造板块合并占比正逼近历史最高水平[7] **股债收益差因子**:当前已持续运行在近三年布林带下轨的-2倍标准差下方[8]
金融工程定期:港股量化:南下资金创2021年2月以来新高,10月增配有色
开源证券· 2025-10-06 15:06
根据研报内容,总结如下: 量化模型与构建方式 1. **模型名称:港股多因子模型**[36][37] * **模型构建思路**:在港股通样本股中,综合运用技术面、资金面、基本面和分析师预期面四大类因子,筛选出表现优异的股票构建投资组合[36][37] * **模型具体构建过程**:每月末,对港股通样本股中的每只股票计算其综合因子得分,该得分由技术面、资金面、基本面和分析师预期面四大类因子合成[36][37];然后选取综合得分最高的前20只股票,采用等权重方式构建投资组合,即“港股优选20组合”[37][39];基准指数选用港股综合指数(HKD) (代码:930930.CSI)[39] 模型的回测效果 1. **港股优选20组合**[39][40] * **全区间(2015.1~2025.9)超额年化收益率**:12.9%[39][40] * **全区间(2015.1~2025.9)超额收益波动比**:1.0[39][40] * **全区间(2015.1~2025.9)超额最大回撤**:18.2%[40] * **2025年9月组合收益率**:0.25%[39] * **2025年9月基准指数收益率**:7.65%[39] * **2025年9月组合超额收益率**:-7.41%[39] 量化因子与构建方式 1. **因子类别:技术面因子**[36][37] * **因子构建思路**:基于股票的市场交易数据构建,反映股票价格走势、动量等市场行为特征[36][37] 2. **因子类别:资金面因子**[36][37] * **因子构建思路**:基于市场资金流向数据构建,反映各类投资者(如南下资金、外资等)对股票的偏好和持仓变化[36][37][22] 3. **因子类别:基本面因子**[36][37] * **因子构建思路**:基于公司的财务报表数据构建,反映公司的盈利能力、估值水平等内在价值[36][37] 4. **因子类别:分析师预期面因子**[36][37] * **因子构建思路**:基于分析师的预测数据构建,反映市场对公司未来业绩的预期[36][37]
黄金资产涨幅领先,基于宏观因子的资产配置模型单周涨幅0.04%
国泰海通证券· 2025-09-30 21:22
根据研报内容,现总结如下: 量化模型与构建方式 1. **模型名称**:Black-Litterman模型(BL模型)[12] * **模型构建思路**:该模型是对传统均值-方差模型的改进,采用贝叶斯理论将投资者的主观观点与量化配置模型有机结合起来,通过投资者对市场的分析预测资产收益,进而优化资产配置权重[12] * **模型具体构建过程**:模型有效解决了均值-方差模型对于预期收益敏感的问题,同时相较纯主观投资具有更高的容错性[12] 报告中提及了两种应用:针对全球资产构建了两种BL配置模型,投资标的包括沪深300、恒生指数、标普500、中债-国债总财富指数、中债-企业债总财富指数与南华商品指数[13];针对国内资产也构建了两种BL配置策略,投资标的包括沪深300、中证1000、恒生指数、中债-国债总财富指数、中债-企业债总财富指数、中证转债、南华商品指数和SHFE黄金[13] * **模型评价**:为投资者持续提供高效的资产配置方案[12] 2. **模型名称**:风险平价模型[17] * **模型构建思路**:该模型是传统均值-方差模型的改进,其核心思想是把投资组合的整体风险分摊到每类资产(因子)中去,使得每类资产(因子)对投资组合整体风险的贡献相等[17] * **模型具体构建过程**:模型构建分为三步:第一步,选择合适的底层资产;第二步,计算资产对组合的风险贡献;第三步,求解优化问题计算持仓权重[18] 具体应用上,基于沪深300指数、标普500指数、恒生指数、中债-企业债总财富指数、南华商品指数和COMEX黄金构建了全球资产风险平价模型[18];针对国内资产,选取沪深300、中证1000、恒生指数、中债-国债总财富指数、中债-企业债总财富指数、中证转债、南华商品指数和SHFE黄金作为投资标的,构建了国内资产风险平价策略[18] 3. **模型名称**:基于宏观因子的资产配置模型[21] * **模型构建思路**:构造涵盖增长、通胀、利率、信用、汇率和流动性六大风险的宏观因子体系,并基于此建立一个通用性的宏观因子资产配置框架,将宏观研究的主观观点进行资产层面的落地[21] * **模型具体构建过程**:通过Factor Mimicking Portfolio方法构造六大宏观风险的高频宏观因子[22] 以前文提到的8类国内资产作为资产池,按以下四步构建策略:第一步,每月末计算资产的因子暴露水平;第二步,以资产的风险平价组合作为基准,计算出基准因子暴露;第三步,根据对宏观未来一个月的判断给定主观因子偏离值,结合基准因子暴露,得到资产组合的因子暴露目标;第四步,带入模型反解得到下个月的各个资产配置权重[22] 主观因子偏离值每月给出,例如在2025年08月底,为增长、通胀、利率、信用、汇率和流动性设置的偏离值分别为0, 0, -1, 0, 1, 0[24] 模型的回测效果 1. **国内资产BL模型1**:上周收益-0.11%,9月份收益-0.14%,2025年收益3.23%,年化波动2.19%,最大回撤1.31%[14] 2. **国内资产BL模型2**:上周收益-0.11%,9月份收益-0.13%,2025年收益2.84%,年化波动1.99%,最大回撤1.06%[14] 3. **全球资产BL模型1**:上周收益0.04%,9月份收益0.11%,2025年收益0.84%,年化波动1.99%,最大回撤1.64%[14] 4. **全球资产BL模型2**:上周收益0.0%,9月份收益0.03%,2025年收益1.84%,年化波动1.63%,最大回撤1.28%[14] 5. **国内资产风险平价模型**:上周收益-0.06%,9月份收益0.05%,2025年收益2.99%,年化波动1.35%,最大回撤0.76%[20] 6. **全球资产风险平价模型**:上周收益-0.07%,9月份收益0.13%,2025年收益2.50%,年化波动1.48%,最大回撤1.20%[20] 7. **基于宏观因子的资产配置模型**:上周收益0.04%,9月份收益0.26%,2025年收益3.29%,年化波动1.32%,最大回撤0.64%[26] 量化因子与构建方式 1. **因子名称**:宏观因子(增长、通胀、利率、信用、汇率、流动性)[21] * **因子的构建思路**:构建涵盖六大风险的宏观因子体系,作为宏观因子资产配置框架的基础[21] * **因子具体构建过程**:通过Factor Mimicking Portfolio方法构造了增长、通胀等六大宏观风险的高频宏观因子[22]
“数”看期货:大模型解读近一周卖方策略一致观点-20250930
国金证券· 2025-09-30 15:05
根据研报内容,以下是关于量化模型和因子的总结: 量化模型与构建方式 1. **模型名称:股指期货期现套利模型**[45][46] **模型构建思路**:当股指期货的市场价格偏离其理论价格时,通过在期货和现货市场进行低买高卖操作,并持有至基差收敛以获取无风险收益[45] **模型具体构建过程**:模型基于期货价格在交割日会与现货价格收敛的理论,分为正向套利和反向套利两种策略[45] - **正向套利**:当现货被低估而期货被高估时,卖出期货合约,买入现货[46] - **反向套利**:当现货被高估而期货被低估时,买入期货合约,卖出现货[46] **套利收益率计算公式**: 正向套利收益率公式为: $$P={\frac{(F_{\mathrm{t}}-S_{\mathrm{t}})-(S_{\mathrm{t}}+F_{\mathrm{t}}M_{\mathrm{t}})(1+r_{\mathrm{t}})^{\frac{T-t}{360}}-S_{\mathrm{t}}C s-F_{\mathrm{t}}C f)}{S_{\mathrm{t}}+F_{\mathrm{t}}M_{\mathrm{t}}}}$$ [46] 反向套利收益率公式为: $$P={\frac{(S_{t}-F_{t})-(S_{t}M l+F_{t}M_{f})(1+r_{f})^{\frac{T-t}{360}}-S_{t}C s-F_{t}C f-S_{t}r^{\frac{T-t}{360}})}{S_{t}M l+F_{t}M_{f}}}$$ [46] 其中,`S_t`和`F_t`分别为t时刻现货与期货价格,`S_T`和`F_T`为T时刻价格,`M_f`和`M_l`为期货与融券保证金比率,`C_s`和`C_f`为现货与期货交易费用比率,`r_f`为无风险利率,`r_l`为融券年利率[46] **参数设定**:计算中,股指期货单边交易费用取万分之零点二三,现货单边交易费用取千分之一,期货和融券保证金分别为20%和50%,融券利率为年化10.6%,暂不考虑分红影响[46] 2. **因子名称:分红点位预测因子**[47][50] **因子构建思路**:通过预测指数成分股的分红,来修正股指期货的基差率,从而更准确地反映市场真实的基差水平[47] **因子具体构建过程**:因子构建的核心是对指数成分股未来分红点位的预测,具体方法如下[47]: - **分红进度处理**:对于已实施或已公布分红预案的股票,按照实际实施或预案计算;对于未公布分红预案的股票,使用EPS乘以预测派息率进行估算[47] - **EPS取值规则**: - 若预测时间t在10月之前,且上年度公司分红未结束,则使用上年度数据进行预测,EPS取年报披露的EPS;若年报EPS未披露,则取上年度12月31日的EPS_TTM[47][48] - 若预测时间t在10月之后,对于已结束分红的公司,需对明年分红进行预测,EPS取值为t时间的EPS_TTM[47][48] - **预测派息率取值规则**: - 对于过去三年稳定派息的公司,预测派息率取过去三年派息率均值[48][52] - 对于稳定派息不足三年但持续盈利的公司,预测派息率取上一年度的派息率[48][52] - 对于过去一年未盈利、正在资产重组、上市不足一年的公司,若没有分红预告,则认为其不分红,预测派息率为0[49][52] - **分红点位计算**:最终的分红点位影响通过以下公式计算: $$分红点位 = \sum \frac{每股分红 * 指数收盘价 * 成分股权重}{成分股收盘价} = \sum \frac{EPS * 预测派息率 * 指数收盘价 * 成分股权重}{成分股收盘价}$$ [50] 3. **模型名称:卖方策略观点大模型汇总流程**[39][42] **模型构建思路**:利用大语言模型(LLM)自动化处理大量卖方策略报告,提取并汇总市场及行业观点,识别共识与分歧,为投资者提供参考[5][39] **模型具体构建过程**:通过构建多套提示词(prompts),让大模型完成从含观点的研报筛选、市场观点和行业观点的原文信息提取,到最终观点汇总的全流程[39][42] 模型的回测效果 *(注:研报中未提供具体的量化模型回测绩效指标,如年化收益率、夏普比率、最大回撤等)* 量化因子与构建方式 *(注:研报中除“分红点位预测因子”外,未详细描述其他独立的量化因子构建)* 因子的回测效果 *(注:研报中未提供“分红点位预测因子”或其他因子的具体测试结果,如IC值、IR值、因子收益率等)*
大额买入与资金流向跟踪(20250922-20250926)
国泰海通证券· 2025-09-30 13:52
根据提供的研报内容,总结如下: 量化因子与构建方式 1. **因子名称:大买单成交金额占比**[7] * **因子构建思路**:该因子旨在刻画大资金的买入行为[7] 其核心思路是利用逐笔成交数据,识别出大额买单,并计算其成交金额在总成交额中的比例[7] * **因子具体构建过程**: 1. 数据准备:获取股票的逐笔成交数据[7] 2. 数据还原:根据逐笔成交数据中的叫买和叫卖序号,将数据还原为买卖单数据[7] 3. 筛选大单:对还原后的买卖单数据,按照每单的成交量设定阈值,筛选出大额交易单[7] 4. 计算指标:从大额交易单中,提取大买单的成交金额,并计算其占当日该股票总成交金额的比例[7] 公式如下: $$大买单成交金额占比 = \frac{当日大买单成交金额}{当日总成交金额}$$[7] 2. **因子名称:净主动买入金额占比**[7] * **因子构建思路**:该因子旨在刻画投资者的主动买入行为[7] 其核心思路是根据逐笔成交数据区分主动买入和主动卖出,计算其净额占总体成交的比例[7] * **因子具体构建过程**: 1. 数据准备:获取股票的逐笔成交数据[7] 2. 行为界定:根据逐笔成交数据中的买卖标志,界定每一笔成交属于主动买入还是主动卖出[7] 3. 计算净额:将当日所有主动买入成交金额之和,减去所有主动卖出成交金额之和,得到净主动买入金额[7] 4. 计算指标:计算该净主动买入金额占当日总成交金额的比例[7] 公式如下: $$净主动买入金额占比 = \frac{当日主动买入成交金额 - 当日主动卖出成交金额}{当日总成交金额}$$[7] 因子的回测效果 * **大买单成交金额占比因子**:在个股层面,近5日(20250922-20250926)该因子均值排名前列的股票其指标值介于87.3%至89.1%之间,时序分位数均高于95%[9] 在宽基指数层面,近5日该因子均值介于70.2%(上证50)至72.3%(上证指数)之间[12] 在行业层面,近5日该因子均值排名前五的中信一级行业为:银行(80.0%)、石油石化(79.0%)、非银行金融(78.2%)、钢铁(78.2%)、房地产(78.1%)[4][13] 在ETF层面,近5日该因子均值排名前列的ETF其指标值介于87.8%至89.7%之间[15] * **净主动买入金额占比因子**:在个股层面,近5日(20250922-20250926)该因子均值排名前列的股票其指标值介于10.9%至17.9%之间,时序分位数均高于95%[10] 在宽基指数层面,近5日该因子均值介于-6.6%(创业板指)至1.1%(上证50)之间[12] 在行业层面,近5日该因子均值排名前五的中信一级行业为:银行(10.1%)、石油石化(3.9%)、农林牧渔(2.0%)、房地产(1.4%)、电力及公用事业(1.0%)[4][13] 在ETF层面,近5日该因子均值排名前列的ETF其指标值介于6.9%至16.0%之间[16]
机器学习因子选股月报(2025年10月)-20250930
西南证券· 2025-09-30 12:03
根据研报内容,总结如下: 量化模型与构建方式 1. **模型名称:GAN_GRU模型**[4][13] * **模型构建思路**:该模型是一个深度学习选股模型,其核心思路是利用生成式对抗网络(GAN)对量价时序特征进行增强处理,然后再利用门控循环单元(GRU)网络对处理后的时序特征进行编码,以预测股票的未来收益[4][13]。 * **模型具体构建过程**: * **基础特征**:模型输入为18个量价特征,包括日频特征(如开盘价、收盘价、成交量等)和月频特征(如月涨跌幅、月换手率等)[17][19]。 * **特征预处理**:每次采样的40天内,每个特征在时序上去极值并标准化;每个特征在个股层面上进行截面标准化[18]。 * **GAN特征生成**: * **生成器(G)**:采用LSTM模型,输入原始量价时序特征(形状为40*18),输出经处理后的量价时序特征(形状仍为40*18)[33][37]。其损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 是随机噪声,\(G(z)\) 是生成的数据,\(D(G(z))\) 是判别器判断生成数据为真的概率[24]。 * **判别器(D)**:采用CNN模型,用于区分真实量价特征和生成器生成的特征。其损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 是真实数据,\(D(x)\) 是判别器对真实数据的输出概率[27]。 * **训练过程**:生成器和判别器交替训练,直至模型收敛[29][30]。 * **GRU收益预测**:将GAN中生成器输出的增强后特征,输入到一个两层GRU网络(GRU(128, 128))中,后面再接一个多层感知机MLP(MLP(256, 64, 64))。模型最终输出的预测收益(pRet)即作为选股因子[22]。 * **训练与预测设置**: * 使用过去400天内的数据,每5个交易日采样一次,采样形状为40*18,用以预测未来20个交易日的累计收益[18]。 * 训练集与验证集比例为80%:20%[18]。 * 采用半年滚动训练,每年6月30日和12月31日进行模型训练,用于未来半年的预测[18]。 * 回测中,因子经过行业和市值中性化以及标准化处理[22]。 模型的回测效果 1. **GAN_GRU模型**,IC均值0.1136[41][42],ICIR(未年化)0.89[42],换手率0.83[42],年化收益率37.41%[42],年化波动率23.59%[42],信息比率(IR)1.59[42],最大回撤率27.29%[42],年化超额收益率22.58%[41][42] 量化因子与构建方式 1. **因子名称:GAN_GRU因子**[4][13] * **因子构建思路**:该因子是GAN_GRU模型输出的股票未来收益预测值,直接作为选股依据[4][13][22]。 * **因子具体构建过程**:因子构建过程与上述GAN_GRU模型的构建过程完全一致,因子值即为模型的最终输出(pRet)[22]。 因子的回测效果 1. **GAN_GRU因子**,IC均值0.1136[41][42],近期IC值(2025年9月)0.1053[41][42],近一年IC均值0.0982[41][42]
“学海拾珠”系列之二百五十:如何压缩因子动物园?
华安证券· 2025-09-29 21:18
根据研报内容,现对其中涉及的量化模型与因子进行总结如下: 量化模型与构建方式 1. **模型名称**:迭代因子选择模型[3] - **模型构建思路**:针对“因子动物园”问题,提出一种系统性的迭代选择策略,旨在以最少数量的因子捕捉绝大部分有效的定价信息[2][3] - **模型具体构建过程**:该模型从CAPM开始,在每一步迭代中,从剩余因子池中选择一个能最大程度提升当前模型解释力的因子加入模型,提升效果通过GRS统计量的下降幅度来衡量[3] - **步骤1**:设 l=0,以CAPM模型作为起点,解释因子动物园中除市场因子外的N个因子[25] $$f_{i}=\alpha_{i}+\beta_{m}r_{m}+\varepsilon_{i}\qquad i=1,\ldots,N\tag{1}$$ 其中,rm 是市场超额收益,N 是因子动物园中除市场因子外的因子数量[25] - **步骤2**:测试 N−l 个不同的增强因子模型,每个模型都将一个剩余的因子(标记为 ftest)添加到前一次迭代的模型中[26] $$f_{i}=\alpha_{i}+\beta_{m}r_{m}+\sum_{k=1}^{l}\beta_{k}f_{k}+\beta^{test}f^{test}+\varepsilon_{i}\qquad i=1,\ldots,N-l\,$$ - **步骤3**:根据解释力(由GRS统计量量化)对测试的因子模型进行排序,并选择最强的模型[26] - **步骤4**:设 l=l+1,并根据增强后的因子模型计算剩余显著因子alpha的数量 n(α)t>x[26] $n(\alpha)_{t>x}=|\{a_{i}\,|\,t(a_{i})>x\}|$$i=1,...,N-l$ 其中 x 是选定的显著性阈值(例如 t>1.96 或 t>3.00)[26][29] - **步骤5**:如果 n(α)t>x=0,即剩余因子的alpha在统计上与零无差异,则停止迭代;否则,返回步骤2继续[26] - **模型评价**:该方法能以最少的因子数量,系统性地捕捉因子动物园中的绝大部分有效信息,其有效性在美国及全球数据中均得到验证[3][4][71] 2. **模型名称**:GRS统计量评估模型[30] - **模型构建思路**:GRS统计量用于检验所有测试资产的alpha是否联合为零,是评估资产定价模型性能的标准工具[30] - **模型具体构建过程**:GRS检验统计量的计算基于测试资产alpha的最大化夏普比率平方和模型因子收益的最大化夏普比率平方[30] - 截距项的最大化夏普比率平方定义为: $$Sh^{2}(\alpha)=\alpha^{\dagger}\Sigma^{-1}\alpha\tag{4}$$ 其中 Σ=eτe/(τ−K−1)是回归残差 e 的协方差矩阵[30] - 给定模型因子的最大化夏普比率平方定义为: $$Sh^{2}(f)=\overline{f}^{\dagger}\Omega^{-1}\overline{f}\tag{5}$$ 其中 fˉ 是模型的平均因子收益,Ω=(f−fˉ)⊤(f−fˉ)/(τ−1)是模型因子的协方差矩阵[30] - GRS检验统计量计算为: $$F_{G R S}=\frac{\tau(\tau-N-K)}{N(\tau-K-1)}\,\frac{S h^{2}(\alpha)}{(1+S h^{2}(f))}$$ 且 FGRS∼F(N,τ−N−K)[30] 模型的回测效果 1. **迭代因子选择模型**(基于美国市值加权因子,样本期1971年11月至2021年12月)[31][32][40] - 当使用 t>3.00 的显著性阈值时,添加第15个因子后,剩余显著alpha的数量降至0[40][42] - 当使用 t>1.96 的显著性阈值时,总共需要18次迭代可使剩余alpha变得不显著[40][42] - 在包含相同数量因子的情况下,该迭代模型优于常见的学术因子模型(如Fama-French五因子、六因子模型等)[43][46] 2. **GRS统计量评估结果**(针对迭代因子选择过程)[40] - 起点CAPM模型的GRS统计量为4.36 (p值为0.00),剩余显著因子数量(t>2阈值)为105个,(t>3阈值)为86个[40] - 添加第一个因子(cop_at)后,GRS统计量降至3.54,平均绝对alpha为年化3.94%[40] - 添加第二个因子(noa_grla)后,GRS统计量降至2.98,平均绝对alpha降至年化2.15%[40][41] - 添加第15个因子(rmax5_rvol_21d)后,GRS统计量降至1.19 (p值为0.09)[40] 量化因子与构建方式 1. **因子名称**:基于现金的营业利润与账面资产比率 (cop_at)[40] - **因子构建思路**:属于质量因子类别,在迭代选择过程中被识别为因子动物园中最强的因子[40][46] 2. **因子名称**:净经营资产变化 (noa_grla)[40] - **因子构建思路**:属于投资因子类别,在迭代选择过程中被识别为次强的因子[40] 3. **因子名称**:销售增长(1个季度)(saleq_gr1)[40] - **因子构建思路**:属于投资因子类别[40] 4. **因子名称**:内在价值与市值比 (ival_me)[40] - **因子构建思路**:属于价值因子类别[40] 5. **因子名称**:残差动量 t-12 至 t-1 (resff3_12_1)[40] - **因子构建思路**:属于动量因子类别[40] 6. **因子名称**:第6-10年滞后收益(年化)(seas_6_10an)[40] - **因子构建思路**:属于季节性因子类别[40] 7. **因子名称**:债务与市值比 (debt_me)[40] - **因子构建思路**:属于价值因子类别[40] 8. **因子名称**:第6-10年滞后收益(非年化)(seas_6_10na)[40] - **因子构建思路**:属于低风险因子类别[40] 9. **因子名称**:零交易天数(12个月)(zero_trades_252d)[40] - **因子构建思路**:属于低风险因子类别[40] 10. **因子名称**:当期营运资本变动 (cowc_grla)[40] - **因子构建思路**:属于应计项目因子类别[40] 11. **因子名称**:净非流动资产变动 (nncoa_grla)[40] - **因子构建思路**:属于投资因子类别[40] 12. **因子名称**:经营现金流与市值比 (ocf_me)[40] - **因子构建思路**:属于价值因子类别[40] 13. **因子名称**:零交易天数(1个月)(zero_trades_21d)[40] - **因子构建思路**:属于低风险因子类别[40] 14. **因子名称**:换手率 (turnover_126d)[40] - **因子构建思路**:属于低风险因子类别[40] 15. **因子名称**:过去五个最高日收益经波动率调整 (rmax5_rvol_21d)[40] - **因子构建思路**:属于短期反转因子类别,是使剩余显著alpha数量(t>3阈值)降为零的关键因子[40][42] 因子的回测效果 1. **关键因子集整体效果**(美国市场,前15个选定因子)[40][46] - 这15个因子源自13个因子风格类别中的8个,显示了因子集的异质性[17][46] - 该因子集能够解释美国市场153个因子的绝大部分收益信号,表明多数因子存在冗余[2][17] 2. **因子加权方案对比**(上限市值加权CW、市值加权VW、等权EW)[64][68][69] - **等权(EW)因子**:表现出更强且更多样的alpha,但需要超过30个因子才能覆盖因子动物园(t>2阈值)[4][64][69][70] - **上限市值加权(CW)因子**:需要约15个因子(t>3阈值)或18个因子(t>2阈值)来覆盖因子动物园[64][69][70] - **市值加权(VW)因子**:需要约18-19个因子(t>2阈值)来覆盖因子动物园[69][70] 3. **全球因子分析效果**(样本期1993年8月至2021年12月)[71][74] - 使用全球因子数据时,需要约11个因子(t>3阈值)或20多个因子(t>2阈值)来覆盖全球因子动物园[74] - 基于全球数据选出的因子模型对美国因子的解释力强于对美国以外全球因子的解释力,暗示国际因子蕴含更丰富的alpha信息[4][71][75]