机器学习系列之九:Mamba-MoE:风险中性化与多模型融合
东北证券· 2025-05-29 15:41
量化模型与构建方式 1. **模型名称:Mamba-MoE** - **模型构建思路**:通过Mamba架构高效提取时间序列特征,结合混合专家模型(MoE)进行多模型融合,同时引入线性与非线性的风险约束以降低风险暴露[2][3][44]。 - **模型具体构建过程**: 1. **任务一(Alpha因子生成)**:使用Mamba模块处理股票特征序列(维度为`(batch_size, window_length, feature_num)`),通过卷积和SSM(选择性状态空间模型)提取时序特征,输出Alpha因子[27][30][32]。 - SSM离散化公式: $$\bar{A}=\exp(\Delta A),$$ $$\bar{B}=(\Delta A)^{-1}(\exp(\Delta A)-I)\Delta B.$$ 2. **任务二(非线性风险因子生成)**:构建异质图(节点为股票风险因子,边包括同行业关联和高相似度关联),通过图卷积生成非线性风险因子[47][48]。 3. **损失函数**:结合Alpha因子与风险因子的相关性惩罚项: $$L=MSE(\hat{y},y_1)+MSE(\hat{r},y_2)+\frac{\alpha}{d_R+1}\sum_{i=1}^{d_R+1}\rho(\hat{y},R_i)^2.$$ - **模型评价**:双任务学习显著降低风险暴露,提升因子稳定性;MoE融合增强模型泛化性[53][56][72]。 2. **模型名称:Mamba-10与Mamba-5** - **构建思路**:分别以10日和5日收益为标签训练模型,通过交叉验证生成多个子模型,等权或MoE融合[98][99]。 - **具体构建**:5折交叉验证扩展窗口训练,MoE路由器结合股票特征与市场特征动态加权[98][99]。 --- 量化因子与构建方式 1. **因子名称:Mamba-MoE合成因子** - **构建思路**:融合Mamba-5和Mamba-10的多模型输出,结合风险中性化约束[103][137]。 - **具体构建**: - 对Alpha因子进行行业市值中性化处理。 - 通过MoE加权合成,路由器输入包括股票特征和市场特征(如指数收益率、VIX等)[98][99]。 - **因子评价**:稳定性优于单模型,对市值暴露控制较好,但对低波动和低流动性有一定暴露[103][137]。 2. **因子名称:非线性风险因子** - **构建思路**:捕捉风险因子间非线性交互及股票关联信息[44][48]。 - **具体构建**:基于CNE6风险因子构建异质图,通过GNN生成非线性风险因子[48][49]。 --- 模型的回测效果 1. **Mamba-MoE模型** - Rank IC:13.22%,ICIR:1.28,多头年化收益:33.01%,多空Sharpe Ratio:9.25[103][137]。 - 沪深300增强年化超额收益:9.02%,跟踪误差:4.26%[156]。 2. **Mamba-10模型(双任务)** - Rank IC:12.83%,ICIR:1.28,多空最大回撤:11.71%[56][72]。 3. **行业风格中性化测试** - 双任务设定下Rank IC衰减至8.81%,但多空Sharpe Ratio仍达11.49[72]。 --- 因子的回测效果 1. **Mamba-MoE合成因子** - 全市场十分组测试:多空年化收益125.32%,波动率13.55%[103]。 - 分域测试(中证1000):Rank IC 11.12%,多空Sharpe Ratio 7.17[137]。 2. **非线性风险因子** - 与流动性因子相关性:-20.74%(双任务)[78][79]。 --- 关键创新点 - **风险中性化**:通过损失函数直接约束风险暴露,避免组合优化时的信号扭曲[44][50]。 - **多模型融合**:交叉验证与MoE集成缓解分布漂移问题,提升稳健性[2][98][99]。 - **高效计算**:Mamba的线性复杂度优于Transformer,支持并行训练[23][31]。
机器学习因子选股月报(2025年6月)
西南证券· 2025-05-29 14:10
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10]。 - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14]。 2. **预处理**:时序去极值+标准化,截面标准化[14]。 3. **GAN部分**: - 生成器(G):LSTM结构,输入噪声生成逼真量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - 判别器(D):CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][21][23][26]。 4. **GRU部分**:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18]。 - **模型评价**:有效捕捉量价时序特征的非线性关系,生成因子具有较高区分度[9][18]。 --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37]。 - **因子具体构建过程**: 1. 模型训练:半年滚动训练(每年6月30日、12月31日更新),预测未来20日收益[14]。 2. 因子生成:对全A股(剔除ST及上市不足半年股票)输出pRet,中性化处理[14][18]。 --- 模型的回测效果 1. **GAN_GRU模型**: - IC均值:11.57% | ICIR:0.89 | 年化超额收益率:25.01% - 年化波动率:24.02% | IR:1.66 | 最大回撤:27.29%[37][38]。 --- 因子的回测效果 1. **GAN_GRU因子**: - **全A表现**: - 近一年IC均值:11.54% | 最新一期IC:-0.28%[37][38]。 - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39]。 - 近一年超额收益前五行业:石油石化(5.60%)、建筑材料(5.29%)、家用电器(5.06%)[42]。 - **多头组合**: - 当期超额收益最高行业:商贸零售(8.22%)、国防军工(7.15%)[42]。 - 最新前十个股:顺威股份、博深股份、九典制药等[44][48]。
机器学习因子选股月报(2025年6月)-20250529
西南证券· 2025-05-29 13:15
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),过去400天的数据,每5天采样一次,形成40×18的特征矩阵[13][14] 2. **GAN部分**: - **生成器(G)**:LSTM结构,输入噪声生成模拟量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - **判别器(D)**:CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][23][26] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[18] 4. **数据处理**:时序去极值+标准化,截面标准化[14] - **模型评价**:通过对抗训练提升特征生成质量,保留时序特性,适配金融数据的高噪声环境[29][33] --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37] - **因子具体构建过程**: 1. 模型每半年滚动训练(6月30日/12月31日),预测未来半年收益[14] 2. 剔除ST股及上市不足半年的股票,保留有效样本[14] 3. 因子值=模型输出的pRet,截面排序后取前10%作为多头组合[37][44] --- 模型的回测效果 1. **GAN_GRU模型**: - **IC均值**:11.57%(全A股,2019/01-2025/05)[37] - **ICIR**:0.89[38] - **年化超额收益率**:25.01%[37] - **信息比率(IR)**:1.66[38] - **最大回撤**:27.29%[38] --- 因子的回测效果 1. **GAN_GRU因子**: - **近期IC(2025/05)**:-0.28%,近一年IC均值11.54%[37][38] - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39] - 近一年IC均值前五行业:建筑装饰(18.54%)、公用事业(18.14%)[39] - **多头组合超额收益**: - 当期最高行业:商贸零售(8.22%)、国防军工(7.15%)[42] - 近一年月均最高行业:石油石化(5.60%)、建筑材料(5.29%)[42] --- 多头组合示例(2025/05) - **前十个股**:顺威股份(家用电器)、博深股份(机械设备)、九典制药(医药生物)等[44][48] - **行业排名第一个股**:如顺威股份(家用电器)、盛剑科技(环保)等[44]
FOF和资产配置月报:关税缓和交易接近充分演绎,延续哑铃配置-20250528
华鑫证券· 2025-05-28 22:35
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称**:高景气成长与红利策略轮动择时模型 **模型构建思路**:通过多因子信号动态调整高景气成长与红利资产的配置比例,捕捉风格轮动机会[57] **模型具体构建过程**: - 每月末选取有效单因子信号:期限利差、社融增速、CPI与PPI四象限、美债利率、资金博弈(ETF/险资/外资) - 各指标独立生成买入高景气或红利的信号,取均值作为综合打分 - 最终配置比例根据打分结果动态调整(如80%红利+20%成长)[57] **模型评价**:能够有效捕捉市场风格切换,尤其在资金面驱动下表现突出 2. **模型名称**:大小盘轮动模型 **模型构建思路**:结合市场利率与动量指标判断小盘/大盘占优阶段[58] **模型具体构建过程**: - 货币宽松期(低利率)优先配置小盘股 - 动量指标采用RSI技术面分析,当小微盘股流动性宽松且RSI强势时看多[4] - 叠加日历效应(如5月小盘跑赢概率62%)[60] 模型的回测效果 1. **高景气成长与红利轮动模型** - 年化收益14.88%,超额基准12.07% - 最大回撤27.08%,年化波动率23.32% - Sharpe比率0.64,Calmar比率0.55[57] 2. **大小盘轮动模型** - 中证2000/沪深300比值最新值2.2(显示小盘占优)[59] - 5月小盘超额收益历史均值+6%[60] 量化因子与构建方式 1. **因子名称**:红利因子 **因子构建思路**:筛选高股息率、低波动率的防御性股票[4] **因子具体构建过程**: - 计算股息率:$$ Dividend\ Yield = \frac{Annual\ Dividend}{Current\ Price} $$ - 叠加波动率筛选:取过去一年日收益率标准差最低的30%股票 - 行业侧重银行、电力、公用事业等[4] 2. **因子名称**:关税缓和因子 **因子构建思路**:捕捉中美关税政策调整对行业的影响[9][10] **因子具体构建过程**: - 构建关税敏感度指标:$$ Sensitivity = \frac{Export\ Revenue}{Total\ Revenue} \times \frac{Tariff\ Change}{1+Base\ Rate} $$ - 对半导体、新能源汽车等外向型行业加权[23] 因子的回测效果 1. **红利因子** - 中证红利全收益指数近1年收益85.30%,年化波动率17.81%[54] - 最大回撤27.08%,显著低于成长风格[54] 2. **关税缓和因子** - 半导体板块近1月超额收益7.85%(通信行业)[61] - 港股恒生科技指数关税缓和后上涨6.02%[6] 注:报告中未提及的模型/因子细节已按规则跳过,公式严格按原文格式呈现。
金融工程日报:A股窄幅整理,可控核聚变、新消费题材持续活跃-20250528
国信证券· 2025-05-28 22:18
根据提供的金融工程日报内容,以下是量化模型与因子的总结: 量化因子与构建方式 1. **封板率因子** - 构建思路:通过监测涨停股在盘中维持涨停状态的比例,反映市场追涨情绪的持续性[17] - 具体构建: $$封板率=\frac{最高价涨停且收盘涨停的股票数}{最高价涨停的股票数}$$ 统计上市满3个月的股票,剔除新股干扰[17] - 评价:高频情绪指标,对短期动量策略有参考价值 2. **连板率因子** - 构建思路:衡量涨停股连续涨停的概率,捕捉市场极端动量效应[17] - 具体构建: $$连板率=\frac{连续两日收盘涨停的股票数}{昨日收盘涨停的股票数}$$ 需排除ST股和上市不足3个月的股票[17] 3. **股指期货贴水率因子** - 构建思路:利用期货主力合约与现货指数的基差,反映市场预期[29] - 具体构建: $$年化贴水率=\frac{基差}{指数价格} \times \frac{250}{合约剩余交易日数}$$ 跟踪上证50/沪深300/中证500/中证1000四大合约[29] - 评价:对冲成本指标,极端贴水预示市场恐慌 4. **大宗交易折价率因子** - 构建思路:通过大宗交易成交价与市价的偏离度监测大资金动向[26] - 具体构建: $$折价率=\frac{大宗交易总成交金额}{当日成交份额的总市值}-1$$ 统计单笔成交超500万元的交易[26] 因子回测效果 1. **封板率因子** - 当日值:64%(较前日下降10%)[17] - 月波动区间:50%-75%[19] 2. **连板率因子** - 当日值:26%(较前日下降14%)[17] - 月波动区间:20%-40%[19] 3. **股指期货贴水率因子** - 上证50:年化贴水率10.29%(近一年15%分位)[29] - 沪深300:年化贴水率12.72%(近一年10%分位)[29] - 中证500:年化贴水率19.19%(近一年10%分位)[29] - 中证1000:年化贴水率22.31%(近一年12%分位)[29] 4. **大宗交易折价率因子** - 当日值:6.65%(近半年均值5.48%)[26] - 半年波动区间:4%-8%[28] 注:报告中未涉及完整量化模型构建,主要为市场监测类因子[17][26][29]
市场环境因子跟踪周报(2025.05.23):市场缩圈,小盘调整风险增加-20250528
华宝证券· 2025-05-28 21:13
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化因子与构建方式 1. 股票市场因子 1. **因子名称**:大小盘风格因子 - **构建思路**:通过比较大盘股与小盘股的表现差异来捕捉市场风格变化[10] - **具体构建过程**:计算大盘指数(如上证50)与微盘股指数的收益率差值,标准化后作为因子值 - **因子评价**:反映市场风险偏好,但易受极端行情影响[12] 2. **因子名称**:价值成长风格因子 - **构建思路**:基于估值指标(如PE/PB)与成长指标(如营收增速)划分价值/成长风格[10] - **具体构建过程**: - 价值得分:$$ \text{Value}_i = \frac{1}{3}(\text{PE}_i + \text{PB}_i + \text{DY}_i) $$ - 成长得分:$$ \text{Growth}_i = \frac{1}{2}(\text{RevenueGrowth}_i + \text{EPSGrowth}_i) $$ - 因子值 = 价值组合收益率 - 成长组合收益率[12] 3. **因子名称**:行业超额收益离散度因子 - **构建思路**:衡量行业间超额收益分化程度[12] - **具体构建过程**:计算各行业指数超额收益的标准差,滚动20日标准化[12] 4. **因子名称**:成分股上涨比例因子 - **构建思路**:反映市场广度与赚钱效应[25] - **具体构建过程**:每日统计指数成分股中上涨家数占比,5日移动平均[25] 2. 商品市场因子 1. **因子名称**:趋势强度因子 - **构建思路**:捕捉商品期货价格的动量效应[25] - **具体构建过程**: $$ \text{TrendStrength} = \frac{\text{MA}_{20}(\text{Close}) - \text{MA}_{60}(\text{Close})}{\text{MA}_{60}(\text{Close})} $$ 按能化、黑色等板块分别计算[26] 2. **因子名称**:基差动量因子 - **构建思路**:利用期货基差变化预测未来价格[26] - **具体构建过程**:计算近月合约与主力合约价差的5日变化率[29] 3. **因子名称**:波动率因子 - **构建思路**:衡量商品价格波动水平[32] - **具体构建过程**:滚动20日收益率标准差,按板块归一化[29] 3. 期权市场因子 1. **因子名称**:隐含波动率偏度因子 - **构建思路**:通过期权偏度反映市场对小盘股调整风险的预期[35] - **具体构建过程**: $$ \text{Skew} = \frac{\text{IV}_{\text{Call}} - \text{IV}_{\text{Put}}}{\text{ATM IV}} $$ 分别计算上证50与中证1000指数期权偏度[37] 因子回测效果 股票市场因子 1. 大小盘风格因子:上周偏向大盘风格(+0.32σ)[12] 2. 价值成长风格因子:上周偏向价值风格(+0.41σ)[12] 3. 行业超额收益离散度:下降至0.18(前值0.23)[12] 4. 成分股上涨比例:下降至48.7%(前值52.1%)[25] 商品市场因子 1. 趋势强度因子:能化板块+1.2σ,贵金属板块+0.8σ[29] 2. 基差动量因子:农产品板块-0.5σ,黑色板块+1.1σ[29] 3. 波动率因子:能化板块波动率1.8σ,有色板块0.6σ[29] 期权市场因子 1. 隐含波动率偏度:中证1000看跌期权偏度维持+1.5σ优势[37] 注:所有因子测试结果基于2025年5月19-23日数据[9][12][29]
ANS:让优化器学会远离噪声交易
华泰证券· 2025-05-28 14:44
量化模型与构建方式 1.模型名称:ANS对抗噪声交易优化器 模型构建思路:将行为金融学中的累积前景理论融入组合优化过程,通过三阶段优化实现基于对抗机制的组合优化决策[1][2] 模型具体构建过程: 1) 原始投资组合权重输出:与传统优化器类似,但去掉换手率约束以避免路径依赖[38] 2) 非理性投资组合权重输出: - 使用累积前景理论构建非理性效用函数: $$U^{c p t}(w)=f_{\pi_{+}}(\phi_{+}(\mathrm{u}_{+}(R w)))-f_{\pi_{-}}(\phi_{-}(\mathrm{u}_{-}(R w)))$$[44] - 采用MM算法求解非凸优化问题[47] 3) 对抗投资组合权重输出:通过构造持仓变动实现反向交易行为修正[50] 4) 理性投资组合权重输出:引入多任务学习,将目标权重与对抗组合的L1范数距离作为目标函数: $$\max \sum_i w_i r_i - \lambda\|w-w^a\|_1$$[51] 模型评价:作为"即插即用"的灵活组件,可适配任意Alpha因子,在保持传统组合优化优势的同时实现权重自适应调整[2][35] 2.模型名称:TK因子模型 模型构建思路:基于累积前景理论构建非理性因子,刻画非理性交易者行为[24] 模型具体构建过程: 1) 使用股票过去60个月的月频收益率作为收益分布替代 2) 计算每支股票的原始TK价值: $$T K\equiv\sum_{i=-m}^{-1}v(r_i)\left[w^{-}\left(\frac{i+m+1}{60}\right)-w^{-}\left(\frac{i+m}{60}\right)\right]+\sum_{i=1}^{n}v(r_i)\left[w^{+}\left(\frac{n-i+1}{60}\right)-w^{+}\left(\frac{n-i}{60}\right)\right]$$[24] 3) 引入衰减系数改进: $$\begin{array}{l}{{\mathrm{TK}\equiv\sum_{i=-m}^{-1}\rho^{t(i)}v(r_i)\left[w^{-}\left(\frac{i+m+1}{60}\right)-w^{-}\left(\frac{i+m}{60}\right)\right]}}\\ {{\qquad+\sum_{i=1}^{n}\rho^{t(i)}v(r_i)\left[w^{+}\left(\frac{n-i+1}{60}\right)-w^{+}\left(\frac{n-i}{60}\right)\right]}}\end{array}$$[25] 因子评价:在头尾两端具有很强的区分度,但整体预测性能不足,分层效果不明显[29][32] 模型的回测效果 1.ANS优化器模型 - 中证500指增:年化超额收益11.00%,超额最大回撤9.84%,IR 1.74[67][68] - 中证1000指增:年化超额收益18.26%,超额最大回撤10.36%,IR 2.43[72][73] 2.TK因子模型 - IC值:-1.18%,RankIC:-1.65%[30] - Top层收益:-7.77%,Bottom层收益:6.46%[30] - 多空收益:-7.12%,Top层IR:-1.81,Bottom层IR:-0.33[30] 量化因子与构建方式 1.因子名称:GRU量价因子 因子的构建思路:作为基础Alpha因子用于对比实验[55] 2.因子名称:负向TK因子 因子的构建思路:将GRU预测因子与负向TK因子按9:1比例加权融合[60] 3.因子名称:TK风格因子 因子的构建思路:将TK值作为一种风格,添加相对基准指数的负向暴露约束[60]
股指分红点位监控周报:大盘风格持续领航,IH合约升水,IM合约深贴水-20250527
国信证券· 2025-05-27 21:47
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:股指分红点位测算模型** - **模型构建思路**:通过精确预测指数成分股的分红金额、除息日等关键指标,计算股指期货合约在到期前的分红影响点数,从而准确衡量期货合约的升贴水幅度[12][36] - **模型具体构建过程**: 1. **成分股权重计算**:采用中证指数公司日度权重数据,若需估算则使用公式: $$W_{n,t}={\frac{w_{i0}\times(1+r_{n})}{\sum_{i=1}^{N}w_{i0}\times(1+r_{n})}}$$ 其中$w_{i0}$为最近公布权重,$r_n$为个股涨跌幅[43] 2. **分红金额预测**:若未公布分红,则通过净利润×股息支付率估算。净利润预测采用历史分布动态法(分稳定/不稳定两类公司处理),股息支付率采用历史均值或截尾处理[45][49][51] 3. **除息日预测**:基于预案/决案公告日与历史间隔天数的稳定性线性外推,或默认7-9月区间[53][54] 4. **分红点数整合**:汇总所有成分股在期货合约到期前的分红影响,公式为: $$\text{分红点数}=\sum_{n=1}^{N}\left(\frac{\text{成分股分红金额}}{\text{成分股总市值}} \times \text{权重} \times \text{指数收盘价}\right)$$[36] - **模型评价**:对上证50和沪深300预测误差约5点,中证500误差约10点,具有较高准确性[59] 2. **模型名称:股息率动态计算模型** - **模型构建思路**:实时跟踪已实现与剩余股息率,反映指数分红进度[17] - **模型具体构建过程**: - **已实现股息率**:累计已分红金额占总市值比例加权求和 - **剩余股息率**:未分红公司的预案/决案金额占总市值比例加权求和[17] --- 量化因子与构建方式 1. **因子名称:年化升贴水因子** - **因子构建思路**:衡量股指期货合约相对指数的溢价/折价水平,扣除分红影响后反映市场情绪[12][13] - **因子具体构建过程**: $$\text{年化升贴水}=\left(\frac{\text{含分红价差}}{\text{指数收盘价}}\right) \times \frac{365}{\text{到期天数}} \times 100\%$$ 其中含分红价差=合约收盘价+分红影响点数-指数收盘价[13] 2. **因子名称:行业股息率因子** - **因子构建思路**:通过行业股息率中位数排序捕捉高分红板块[15] - **因子具体构建过程**:计算各行业已公布预案个股的股息率(预案分红金额/当前总市值)中位数[15] --- 模型的回测效果 1. **股指分红点位测算模型** - 上证50预测误差:±5点[59] - 沪深300预测误差:±5点[59] - 中证500预测误差:±10点[59] 2. **股息率动态计算模型** - 截至2025/5/27: - 上证50已实现股息率0.17%,剩余2.18%[17] - 沪深300已实现0.28%,剩余1.73%[17] - 中证500已实现0.23%,剩余1.14%[17] --- 因子的回测效果 1. **年化升贴水因子**(2025/5/27主力合约): - IH升水2.14%,IF贴水2.80%,IC贴水10.94%,IM贴水16.65%[13] - 历史分位点:IH(68%)、IF(29%)、IC(17%)、IM(6%)[27] 2. **行业股息率因子**: - 煤炭、银行、钢铁行业股息率排名前三[15]
AI动态汇总:Claude4系列发布,谷歌上线编程智能体Jules
中邮证券· 2025-05-27 21:43
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:Claude Opus 4** - **模型构建思路**:专为复杂推理与软件开发设计,扩展AI智能体能力边界[12] - **模型具体构建过程**: - 基于Anthropic的底层架构优化,增强跨文件代码理解能力 - 引入记忆文件机制,通过本地存储关键信息提升长期任务连贯性[16] - 采用轻量级思考摘要功能,在5%场景下精简推理链条[19] - **模型评价**:在SWE-bench测试中准确率72.5%,TerminalBench测试43.2%,展现顶尖编码能力[12][16] 2. **模型名称:Claude Sonnet 4** - **模型构建思路**:平衡性能与成本的通用模型,优化指令遵循能力[12] - **模型具体构建过程**: - 基于Sonnet 3.7改进编码和推理模块 - 通过行为控制技术降低系统漏洞利用概率65%[16] - **模型评价**:SWE-bench测试72.7%优于Opus 4,但综合性能稍逊[16] 3. **模型名称:Cosmos-Reason1** - **模型构建思路**:融合物理常识与具身推理,面向自动驾驶/机器人场景[29] - **模型具体构建过程**: - 采用混合Mamba-MLP-Transformer架构,结合ViT视觉编码器[30] - 四阶段训练流程: 1. 130M数据视觉预训练(跨模态对齐) 2. 8M通用监督微调(SFT) 3. 物理AI专项微调(16类知识注入) 4. GRPO算法强化学习优化决策[30] - 公式:奖励机制采用时空谜题自监督生成$$R=\sum_{t=1}^{T}\gamma^{t-1}r_t(s_t,a_t)$$ - **模型评价**:物理常识测试60.2%准确率,具身推理任务性能提升10%[34] 4. **模型名称:Gemini 2.5 Pro** - **模型构建思路**:旗舰级多模态推理模型,扩展上下文窗口至200万token[43] - **模型具体构建过程**: - 引入"Deep Think"并行推理架构,动态调整5%-100%思考强度 - 集成Model Context Protocol SDK降低开源工具链对接门槛[44] - **模型评价**:MMMU测试84.0%,长期记忆准确率83.1%显著优于竞品[44] 5. **模型名称:Devstral** - **模型构建思路**:开源编程专用模型,强化安全对齐与工程级任务处理[38] - **模型具体构建过程**: - 基于Mistral Small 3.1架构,采用Tekken Tokenizer(131,000词汇量) - 零样本训练策略避免SWE-bench过拟合[41] - **模型评价**:SWE-bench Verified得分46.8%,超越前代开源模型6%[39] --- 模型的回测效果 1. **Claude Opus 4** - SWE-bench准确率72.5%[12] - TerminalBench准确率43.2%[12] - 长期记忆准确率83.1%(MRCR 128K测试)[44] 2. **Cosmos-Reason1-7B** - 物理常识基准60.2%准确率[34] - 具身推理基准平均60.7%[34] - 8K视频流推理速度较GPT-4快11倍[34] 3. **Gemini 2.5 Pro** - MMMU得分84.0%[44] - WebDev Arena测试1499.95分(较前代+147)[44] 4. **Devstral** - SWE-bench Verified得分46.8%[39] - 单RTX 4090显卡可部署[39] --- 技术前沿发现 1. **思维链(CoT)对指令遵循的影响** - **构建思路**:通过IFEval/ComplexBench基准测试15种模型的CoT干扰效应[52] - **关键发现**: - CoT导致IFEval准确率平均下降12.3%[54] - 注意力机制显示约束token关注度下降18.7%[60] - **缓解方案**: - 分类器选择性推理提升IFEval准确率7.2%[65] - 自适应推理选择优化ComplexBench表现[64] (注:原文未涉及量化因子相关内容,故未总结该部分)
金融工程日报:A股震荡走低,机器人、算力领跌,新消费题材逆势走强-20250527
国信证券· 2025-05-27 20:59
根据提供的金融工程日报内容,该报告主要聚焦市场表现和情绪指标,未涉及具体的量化模型或因子构建。以下是可提取的核心量化指标: 1. 市场情绪指标 - 封板率计算方式:最高价涨停且收盘涨停的股票数/最高价涨停的股票数[16] - 连板率计算方式:连续两日收盘涨停的股票数/昨日收盘涨停的股票数[16] - 当日封板率74%(较前日+2%),连板率41%(较前日+9%)[16] 2. 资金流向指标 - 两融余额占比:两融余额/流通市值=2.3%[21] - 两融交易占比:(融资买入额+融券卖出额)/市场成交额=8.2%[21] 3. 折溢价指标 - ETF折溢价:创50ETF富国溢价2.01%,沪港深300ETF折价0.48%[22] - 大宗交易折价率公式:大宗交易总成交金额/当日成交份额总市值-1[25] - 近半年平均折价率5.48%,当日折价率4.03%[25] 4. 股指期货指标 - 年化贴水率公式:基差/指数价格*(250/合约剩余交易日数)[28] - 当日贴水率分位数: • 上证50:9.14%(16%分位)[28] • 沪深300:11.57%(13%分位)[28] • 中证500:19.29%(10%分位)[28] • 中证1000:22.87%(11%分位)[28] 注:报告未包含量化模型或因子构建的具体方法论,主要为市场监测类指标的实时数据展示。所有计算公式和数据取值均来自原文标注的章节。