Workflow
量化周报:下跌秩序的增强
民生证券· 2024-11-24 18:28
量化模型与构建方式 1. 三维择时模型 - **模型名称**:三维择时模型 - **模型构建思路**:通过分歧度、流动性和景气度三个维度来判断市场走势 - **模型具体构建过程**: - **分歧度**:衡量市场参与者对未来走势的分歧程度 - **流动性**:衡量市场的资金流动情况 - **景气度**:衡量市场的整体经济状况 - 公式:未提供具体公式 - **模型评价**:在高波动环境下,流动性回落偏向于震荡下跌[7][11][13] 2. 资金流共振策略 - **模型名称**:资金流共振策略 - **模型构建思路**:通过监控融资融券和大单资金的流入流出情况,选择资金流入较多的行业 - **模型具体构建过程**: - **融资资金因子**:Barra市值因子中性化后的融资净买入(个股加总),取最近20日均值 - **主动大单资金因子**:行业最近一年成交量时序中性化后的净流入排序,取最近10日均值 - 选择两种资金流都看好的行业,即每一期同时在两个因子排序前十的行业 - 公式:未提供具体公式 - **模型评价**:策略2018年以来费后年化超额收益14.5%,信息比率1.4,相对北向-大单共振策略回撤更小[23][28][29] 模型的回测效果 - **三维择时模型**:未提供具体回测效果 - **资金流共振策略**: - **绝对收益**:-1.4% - **超额收益**:0.4% - **年化超额收益**:14.5% - **信息比率**:1.4[28][29] 量化因子与构建方式 1. 反转因子 - **因子名称**:反转因子 - **因子的构建思路**:通过观察股票价格的反转趋势来预测未来走势 - **因子具体构建过程**: - 公式:未提供具体公式 - **因子评价**:表现较好,最近一周相对于中证全指的超额收益达到2%以上[33][34] 2. 估值因子 - **因子名称**:估值因子 - **因子的构建思路**:通过估值指标(如市盈率、市销率等)来选择低估值股票 - **因子具体构建过程**: - 公式:未提供具体公式 - **因子评价**:在不同市值下表现较好,整体看大市值下因子超额更高[33][35] 因子的回测效果 - **反转因子**: - **近一周多头超额**:2.74% - **近一个月多头超额**:6.09% - **近一年多头超额**:11.66%[34][35] - **估值因子**: - **近一周多头超额**:2.69% - **近一个月多头超额**:6.68% - **近一年多头超额**:10.92%[34][35]
金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代
国金证券· 2024-11-24 16:23
量化模型与构建方式 1. 宏观择时策略模型 - **模型名称**:宏观择时策略模型 - **模型构建思路**:基于宏观事件因子进行股债轮动策略,通过规避宏观下行风险来获取超额收益 - **模型具体构建过程**: - 使用景气度指标(如中采制造业PMI)和PPI同比+工业增加值同比来判断经济环境阶段 - 通过调整因子打分方式,提升持仓权重,适配上涨行情 - 增加市场情绪类指标,及时反映非宏观驱动的指数行情 - 公式:择时信号 = max(经济增长信号, 流动性信号) > 30% ? 1 : 0 - **模型评价**:在市场上行阶段表现较好,通过调整规则提升持仓权重和时长,避免错过上涨行情[89][90][91] 2. AI选股模型 - **模型名称**:AI选股模型 - **模型构建思路**:基于决策树的集成算法GBDT和神经网络类模型,针对不同特征数据集进行训练 - **模型具体构建过程**: - 使用量价数据进行模型训练,模型天然向低波、非流动性等因子学习 - 通过回归剥离Barra风格因子后的表现,发现在不同股票池中因子表现有差异 - 公式:AI因子 = GBDT模型(量价数据) + 神经网络模型(特征数据) - **模型评价**:整体表现优异,但在特定月份回撤明显,需结合市场环境进行调整[140][143][144] 模型的回测效果 宏观择时策略模型 - **年化超额收益**:12.05%[67] - **最大回撤**:17.31%[67] - **信息比率(IR)**:0.68[67] AI选股模型 - **沪深300股票池**:剥离Barra后因子多头超额收益走平[147] - **中证500股票池**:剥离Barra后因子多头超额收益走平[147] - **中证1000股票池**:剥离Barra后因子多头超额收益保持向上稳定走势[147] 量化因子与构建方式 1. 分析师预期因子 - **因子名称**:分析师预期因子 - **因子的构建思路**:通过分析师对行业的预期来判断高景气度的行业 - **因子具体构建过程**: - 收集分析师对各行业的预期数据 - 计算各行业的景气度指标 - 公式:分析师预期因子 = Σ(分析师预期 * 行业景气度) - **因子评价**:在市场下行阶段表现较差,但在市场回暖阶段表现回升[118][119] 2. 超预期因子 - **因子名称**:超预期因子 - **因子的构建思路**:通过实际业绩超出预期的情况来判断行业表现 - **因子具体构建过程**: - 收集各行业的实际业绩数据 - 计算实际业绩与预期的差值 - 公式:超预期因子 = Σ(实际业绩 - 预期业绩) - **因子评价**:整体表现稳健,建议持续配置[118][119] 因子的回测效果 分析师预期因子 - **IC均值**:1.4%[111] - **多空收益**:0.7%[111] - **多头超额收益**:3.6%[111] - **多头收益**:8.1%[111] 超预期因子 - **IC均值**:5.8%[111] - **多空收益**:7.1%[111] - **多头超额收益**:4.3%[111] - **多头收益**:8.8%[111]
金融工程定期:AIGC板块的资金行为监测
开源证券· 2024-11-24 11:23
总结 量化模型与构建方式 - **模型名称**:公募基金实时持仓测算模型 **模型构建思路**:基于基金净值、持仓披露、调研行为等市场公开信息,实时测算公募基金的持仓动态[3][15] **模型具体构建过程**:通过复杂的数据处理流程,整合基金净值、持仓披露和调研行为等公开信息,动态估算公募基金的持仓比例[15] - **模型名称**:ETF资金持仓动态监测模型 **模型构建思路**:通过ETF持仓占流通市值比例的变化,监测市场资金动态[15][17] **模型具体构建过程**:计算ETF持仓占流通市值比例,并通过移动平均(MA5)平滑数据,观察其趋势变化[17] - **模型名称**:两融余额动向监测模型 **模型构建思路**:通过融资余额的变化,反映市场投资者的看多情绪[18] **模型具体构建过程**:统计融资余额的历史数据,分析其变化趋势,结合市场背景解读投资者情绪[18] 模型的回测效果 - **公募基金实时持仓测算模型**:2024年以来,公募基金对AIGC板块的配置仓位有所下降[3][15] - **ETF资金持仓动态监测模型**:2024年以来,ETF持仓占AIGC板块股票市值比例持续上升,达到5.5%[15][17] - **两融余额动向监测模型**:融资余额自2024年9月25日后大幅反弹向上,融券余额处于较低水平[3][18] 量化因子与构建方式 - **因子名称**:主力资金净流入因子 **因子的构建思路**:通过大单(20-100万元)与超大单(>100万元)的加总,作为主力资金的代理变量,分析资金流向[23] **因子具体构建过程**: 1. 收集大单与超大单的交易数据 2. 计算主力资金净流入值 3. 按个股统计主力资金净流入排名[23][24] - **因子名称**:高频股东户数变动因子 **因子的构建思路**:通过股东户数的变化,捕捉市场投资者行为的变化趋势[31] **因子具体构建过程**: 1. 收集上市公司最新两期的股东户数数据 2. 计算股东户数变动比例 3. 按变动比例对个股进行排序[31][32] 因子的回测效果 - **主力资金净流入因子**:协创数据净流入111972.3万元,金山办公净流入70872.9万元,拓尔思净流入58277.4万元[23][24] - **高频股东户数变动因子**:协创数据股东户数增幅36.48%,福石控股增幅35.88%,淳中科技增幅34.21%[31][32]
金融工程:ETF跟踪指数规模变化周报
天风证券· 2024-11-24 11:23
- 本报告未涉及量化模型或量化因子的构建、测试及相关分析内容[1][2][5][6]
【专题研究】期权:量化视角评估期权组合效益(一)
中粮期货· 2024-11-22 16:03
量化模型与构建方式 模型名称:卖出宽跨式期权组合策略模型 - **模型构建思路**:通过对标的期货进行基本面分析,评估其趋势性或波动性,然后匹配对应的期权组合策略,最终预测策略的收益及风险[1][4] - **模型具体构建过程**: 1. **基本面分析**:对甲醇期货的供需、库存、价格波动等进行分析,判断其价格区间震荡的可能性[5] 2. **期权组合策略**:选择卖出宽跨式期权组合,由一个低执行价看跌期权和一个高执行价看涨期权组成,适用于标的资产价格预期波动较低的情形[4] 3. **统计学模型**:假设在风险中性条件下,期货价格的运动过程为: $$ \frac{dS_t}{S_t} = \mu dt + \sigma dB_t $$ 其中,$S_t$是t时刻的期货价格,$\mu$是无风险利率,$\sigma$为标的的波动率,$dB_t = \mathcal{E}\sqrt{dt}$($\mathcal{E}$服从标准正态分布)[7][8] 4. **伊藤定理处理**:使用伊藤定理处理$d(\ln S)$: $$ d(\ln S) = (\mu - \frac{\sigma^2}{2}) dt + \sigma dB $$ 对上述方程积分后取指数,得: $$ S_T = S_t \exp \left( (\mu - \frac{\sigma^2}{2})(T - t) + \sigma \mathcal{E} \sqrt{T - t} \right) $$ 这样就得到了任意两个时间节点下期货价格间的关系[9][10] 5. **蒙特卡洛模拟**:利用编程技术的蒙特卡洛模拟法,设定时间单位为一个交易日、模拟路径个数为1000,生成未来一段时间内N个时间节点,M条路径的模拟价格数值[11][12] 6. **输出结果**:计算每条路径在卖出宽跨式组合的损益结构下的损益情况并进行统计,生成收益率、胜率以及收益率*胜率三个矩阵[13][14][16][18] - **模型评价**:该模型通过基本面分析和统计学模型相结合,能够较为准确地预测期权组合策略的收益及风险,具有较高的实用性和可复制性[1][4][19] 模型的回测效果 - **MA501卖出宽跨年化收益率矩阵(预测值)**: - C2600-P2550组合的年化收益率为23.00%[15] - **MA501卖出宽跨胜率矩阵(预测值)**: - C2600-P2550组合的胜率为66.70%[17] - **MA501卖出宽跨胜率*收益率矩阵(预测值)**: - C2600-P2550组合的胜率*收益率为16.30%[18]
【专题研究】期权:量化视角评估期权组合效益(一)
中粮期货· 2024-11-22 12:58
量化模型与构建方式 1. 模型名称:基于统计学模型的期货价格模拟 - **模型构建思路**:假设期货价格的运动过程符合风险中性条件下的随机游走模型,通过伊藤定理推导出期货价格在任意两个时间节点间的关系,并利用蒙特卡洛模拟法生成未来价格路径[7][8][9] - **模型具体构建过程**: 1. 假设期货价格的运动过程为: $$ \frac{dS_t}{S_t} = \mu dt + \sigma dB_t $$ 其中,$S_t$为$t$时刻的期货价格,$\mu$为无风险利率,$\sigma$为标的波动率,$dB_t = \epsilon \sqrt{dt}$,$\epsilon$服从标准正态分布[7] 2. 使用伊藤定理处理$ln(S)$,得到: $$ d(lnS) = (\mu - \frac{\sigma^2}{2})dt + \sigma dB $$ 进一步推导出期货价格在任意两个时间节点间的关系: $$ S_T = S_t \cdot exp\left((\mu - \frac{\sigma^2}{2})(T-t) + \sigma \epsilon \sqrt{T-t}\right) $$[8][9] 3. 利用蒙特卡洛模拟法: - 将当前时间点到期权到期日之间的时间分割为多个时间段 - 随机生成$\epsilon$,重复模拟价格路径 - 设定时间单位为一个交易日,模拟路径个数为1000,最终生成未来价格路径矩阵[10] - **模型评价**:通过蒙特卡洛模拟法,能够较为全面地捕捉期货价格的波动特征,适用于复杂的期权组合策略分析[9][10] 2. 模型名称:卖出宽跨式期权组合策略模型 - **模型构建思路**:通过对标的资产的基本面分析,判断其波动性水平,选择适配的期权组合策略,并利用统计学模型评估策略的收益与风险[1][3][11] - **模型具体构建过程**: 1. 选择卖出宽跨式期权组合策略,该策略由一个低执行价看跌期权和一个高执行价看涨期权组成,方向均为卖出[3] 2. 适用场景:标的资产价格预期波动较低的情形[3] 3. 结合基本面分析,选择甲醇作为研究对象,因其波动率处于历史低位,且基本面中性[3][5][6] 4. 利用统计学模型模拟期货价格路径,计算每条路径下的损益情况,生成收益率、胜率及收益率*胜率矩阵[11] - **模型评价**:该模型通过结合基本面分析与统计学方法,能够较为精准地评估期权组合策略的收益与风险,具有较强的实用性和可复制性[11] --- 模型的回测效果 1. 基于统计学模型的期货价格模拟 - **年化收益率矩阵(预测值)**:C2600-P2550组合的年化收益率为23.00%,在所有组合中表现最佳[13] - **胜率矩阵(预测值)**:C2600-P2550组合的胜率为66.70%,在高收益组合中表现较优[14] - **胜率*收益率矩阵(预测值)**:C2600-P2550组合的胜率*收益率为16.30%,为综合盈利能力最强的组合[16] 2. 卖出宽跨式期权组合策略模型 - **年化收益率矩阵(预测值)**:收益率随行权价格的上下边界变化而变化,C2600-P2550组合的年化收益率最高为23.00%[13] - **胜率矩阵(预测值)**:胜率随行权价格的上下边界变化而变化,C2600-P2550组合的胜率为66.70%[14] - **胜率*收益率矩阵(预测值)**:C2600-P2550组合的胜率*收益率为16.30%,为综合盈利能力最强的组合[16] --- 量化因子与构建方式 1. 因子名称:波动率因子 - **因子构建思路**:通过分析标的资产的历史波动率水平,判断其在当前市场中的相对位置,作为期权组合策略选择的依据[5][6] - **因子具体构建过程**: 1. 计算甲醇主连合约的历史波动率 2. 横向比较甲醇近一年波动率在全部品种中的排名,发现其处于历史分位低点,排名约70%[5] - **因子评价**:波动率因子能够有效反映标的资产的波动特征,为期权组合策略的选择提供了重要依据[5][6] 2. 因子名称:持仓量因子 - **因子构建思路**:通过分析标的资产的持仓量变化,判断市场参与者的活跃程度及其对价格波动的影响[6] - **因子具体构建过程**: 1. 统计甲醇全部合约的综合持仓量 2. 发现其在今年下半年始终处于历史性低位[6] - **因子评价**:持仓量因子能够从市场参与者的角度反映标的资产的活跃程度,为期权策略的适配性分析提供了支持[6] --- 因子的回测效果 1. 波动率因子 - **年化收益率矩阵(预测值)**:波动率因子支持的C2600-P2550组合年化收益率为23.00%[13] - **胜率矩阵(预测值)**:波动率因子支持的C2600-P2550组合胜率为66.70%[14] - **胜率*收益率矩阵(预测值)**:波动率因子支持的C2600-P2550组合胜率*收益率为16.30%[16] 2. 持仓量因子 - **年化收益率矩阵(预测值)**:持仓量因子支持的C2600-P2550组合年化收益率为23.00%[13] - **胜率矩阵(预测值)**:持仓量因子支持的C2600-P2550组合胜率为66.70%[14] - **胜率*收益率矩阵(预测值)**:持仓量因子支持的C2600-P2550组合胜率*收益率为16.30%[16]
【浙商金工-年度策略】大财政时代开启,内需牛蓄势待发
浙商证券· 2024-11-20 22:03
量化模型与构建方式 1. 模型名称:宏观周期模型 - **模型构建思路**:通过对宏观经济分项指标的量化分析,定义经济周期的不同阶段,并据此判断经济所处的状态[10] - **模型具体构建过程**: 1. 选取经济景气、信用、通胀等宏观分项指标[10] 2. 计算各分项指标的历史分位值,例如经济景气分位值为6.7%、信用分位值为17%、通胀分位值为5.4%[10] 3. 根据分位值的组合,定义经济周期阶段,如筑底后期[10] - **模型评价**:模型能够较好地反映宏观经济的阶段性特征,为经济走势的判断提供了量化依据[10] 2. 模型名称:高频策略流动性模型 - **模型构建思路**:研究市场流动性对高频策略收益的影响,构建流动性与策略收益的关系曲线[79] - **模型具体构建过程**: 1. 定义市场流动性指标,如全市场日成交额[79] 2. 通过回归分析,量化流动性对高频策略年化超额收益的影响[84] - 回归方程: $$\text{超额收益} = \beta_1 \cdot \text{指数涨幅} + \beta_2 \cdot \text{成交量} + \epsilon$$ 其中,$\beta_1 = -0.9920$,$\beta_2 = 0.0058$[84] 3. 绘制流动性影响曲线,发现流动性对高频策略收益的影响呈S型[79] - **模型评价**:模型揭示了高频策略收益对流动性的依赖性,为高频策略的优化提供了理论支持[79][84] 3. 模型名称:成交量预测模型 - **模型构建思路**:基于时间序列分析,预测未来市场成交量中枢的变化[94] - **模型具体构建过程**: 1. 对中证500月成交量进行ADF检验,确认其为平稳时间序列[93] 2. 构建AR(1)模型: $$\mathrm{Y_{t}=\ 132\ +\ 0.85*Y_{t-1}+\ e_{t}}$$ 其中,$\mathrm{Y_t}$为当前月成交量,$\mathrm{Y_{t-1}}$为上月成交量,$\mathrm{e_t}$为误差项[94] 3. 使用模型预测未来1年中证500月成交量,得出成交量中枢将由130亿股提升至300亿股[95] - **模型评价**:模型能够较准确地预测市场流动性变化,为高频策略收益的提升提供了量化依据[94][95] --- 模型的回测效果 1. 宏观周期模型 - **经济景气分位值**:6.7%[10] - **信用分位值**:17%[10] - **通胀分位值**:5.4%[10] 2. 高频策略流动性模型 - **回归系数**: - 指数涨幅:$\beta_1 = -0.9920$[84] - 成交量:$\beta_2 = 0.0058$[84] - **年化超额收益提升**:日成交额中枢由8000亿提升至1.3万亿时,高频策略年化超额收益提升约12.5%[95] 3. 成交量预测模型 - **成交量中枢预测**:中证500月成交量由130亿股提升至300亿股[95] - **全A日成交额中枢预测**:由8000亿提升至1.3万亿[95] --- 量化因子与构建方式 1. 因子名称:高频因子 - **因子构建思路**:通过高频交易数据提取因子,捕捉短期市场波动中的超额收益机会[89] - **因子具体构建过程**: 1. 提取高频交易数据,计算高频因子收益[89] 2. 对比日间因子收益,验证高频因子的超额收益能力[89] 3. 贴近现实,考虑交易成本对高频因子收益的影响[90] - 不同交易成本下的年化超额收益: | 双边税费+滑点% | 年化超额% | | --- | --- | | 0.05 | 2.25 | | 0.1 | -0.5 | | 0.14 | -2.7 |[91] - **因子评价**:高频因子在理想条件下具有显著的超额收益,但对交易成本敏感,需优化执行策略[89][90] --- 因子的回测效果 1. 高频因子 - **年化收益**:21%[89] - **累计收益**:149%[89] - **交易成本敏感性**: - 双边税费+滑点0.05%时,年化超额收益为2.25%[91] - 双边税费+滑点0.1%时,年化超额收益为-0.5%[91]
【长江研究·早间播报】金工/化工/环保/食品(20241119)
长江证券· 2024-11-19 16:03
- 模型名称:红利低波策略模型 - 模型构建思路:通过选择低波动率的红利资产,构建一个风险较低且收益稳定的投资组合[3] - 模型具体构建过程:首先筛选出红利资产,然后根据波动率指标进行排序,选择波动率较低的资产构建组合[3] - 模型评价:该模型在震荡行情下表现出较强的收益韧性和风险控制能力[3] - 模型名称:红利价值策略模型 - 模型构建思路:通过选择具有价值属性的红利资产,构建一个兼具红利和价值特征的投资组合[3] - 模型具体构建过程:首先筛选出红利资产,然后根据价值指标(如市盈率、市净率等)进行排序,选择价值属性较强的资产构建组合[3] - 模型评价:该模型在震荡行情下表现出较强的收益韧性和风险控制能力[3] - 模型名称:攻守备红利30组合 - 模型构建思路:通过选择30只红利资产,构建一个攻守兼备的投资组合[3] - 模型具体构建过程:首先筛选出红利资产,然后根据一定的指标(如收益率、波动率等)进行排序,选择前30只资产构建组合[3] - 模型评价:该组合在震荡行情下表现出较好的韧性,超额收益显著[3] - 模型名称:医疗保健增强1.0组合 - 模型构建思路:通过选择医疗保健板块的优质资产,构建一个增强型投资组合[3] - 模型具体构建过程:首先筛选出医疗保健板块的资产,然后根据一定的指标(如收益率、波动率等)进行排序,选择优质资产构建组合[3] - 模型评价:该组合在震荡行情下表现出较好的韧性,超额收益显著[3] - 红利低波策略模型,超额收益约0.26%[3] - 红利价值策略模型,超额收益约0.26%[3] - 攻守备红利30组合,超额收益约0.26%[3] - 医疗保健增强1.0组合,超额收益约0.43%[3]
量化策略系列之八:DFQ机器学习行业轮动模型
东方证券· 2024-11-19 09:23
量化模型与构建方式 1. DFQ工业类行业轮动模型 - **模型构建思路**:基于38个证监会二级行业构建行业因子,转化为中信一级行业后进行行业轮动[16][19] - **模型具体构建过程**: - 使用中观行业数据、分析师预期、业绩超预期、资金流向四个维度的14个单因子合成行业因子[16][17] - 将证监会二级行业因子得分转化为中信一级行业因子得分,采用市值加权方式[19] - 因子值进行截面标准化,缺失值用0填充[19] - **模型评价**:转化为中信一级行业后损失较多信息,近年来策略有效性降低[20] 2. DFQ行业动量轮动模型 - **模型构建思路**:基于行业动量的改进算法,构建月频行业轮动策略[25] - **模型具体构建过程**: - 提出三种行业动量的改进算法,将三个单因子合成行业因子[25] - 使用过去12个月的行业动量、行业换手率等特征[24] - **模型评价**:动量类策略整体表现不如基本面策略,近年来策略有效性降低[26] 3. DFQ遗传规划行业因子挖掘系统 - **模型构建思路**:通过遗传规划算法挖掘行业因子,优化进化效率,生成高质量因子[51][52] - **模型具体构建过程**: - 使用gplearn库的SymbolicTransformer模块,加入145个特征和140个算子[74][76] - 采用滚动挖掘方式,每隔一年重新挖掘,训练集长度固定为10年[69][72] - 适应度指标为20个路径下多头(top5)行业组合的月均超额收益的最小值,阈值为0.5%[78][80] - 通过7点改进提升进化效率,包括提升初始种群质量、动态调整进化参数、降低因子相关性等[52][54][61] - **模型评价**:挖掘出的单因子数量多且相关性低,但样本外易失效,需通过加权提升表现[194] 4. DFQ机器学习行业轮动模型 - **模型构建思路**:将vae、xgb、gp三个行业因子等权合成,构建行业轮动模型[165] - **模型具体构建过程**: - vae和xgb因子通过选股因子加权得到,gp因子通过遗传规划挖掘得到[163][164] - 合成因子前对单因子进行Boxplot去异常值、zscore标准化、以0填充缺失值[124] - 等权合成后进行回测[165] - **模型评价**:模型表现突出,能实现1+1>2的效果[165] --- 模型的回测效果 1. DFQ工业类行业轮动模型 - **年化超额收益**:2020-2024年为3.33%[20] - **超额收益最大回撤**:19.39%[20] 2. DFQ行业动量轮动模型 - **年化超额收益**:2020-2024年为3.68%[26] - **超额收益最大回撤**:24.78%[26] 3. DFQ遗传规划行业因子挖掘系统 - **年化超额收益**:2020-2024年为11.10%(动态xgb加权)[128] - **超额收益最大回撤**:10.28%[128] - **月度胜率**:61.40%[128] - **超额收益夏普比**:1.16[128] 4. DFQ机器学习行业轮动模型 - **年化超额收益**:2020-2024年为18.42%[165] - **超额收益最大回撤**:7.76%[165] - **月度胜率**:66.67%[165] - **超额收益夏普比**:1.77[165] --- 量化因子与构建方式 1. vae因子 - **因子构建思路**:通过选股因子加权得到行业因子[43] - **因子具体构建过程**: - 选股因子匹配到中证全指股票池,进行Boxplot去异常值、zscore标准化[43] - 按个股市值加权得到行业因子[43] - **因子评价**:多头端top5行业组合表现较好[43] 2. xgb因子 - **因子构建思路**:通过选股因子加权得到行业因子[43] - **因子具体构建过程**: - 同vae因子[43] - **因子评价**:多头端top5行业组合表现较好[43] 3. gp因子 - **因子构建思路**:通过遗传规划算法挖掘行业因子[51] - **因子具体构建过程**: - 使用滚动挖掘方式,每隔一年重新挖掘[69] - 适应度指标为多头月均超额收益的最小值[78] - **因子评价**:相关性低,适合与其他因子结合使用[164] --- 因子的回测效果 1. vae因子 - **年化超额收益**:10.01%[166] - **超额收益最大回撤**:10.09%[166] - **月度胜率**:57.89%[166] - **超额收益夏普比**:1.03[166] 2. xgb因子 - **年化超额收益**:10.82%[166] - **超额收益最大回撤**:10.61%[166] - **月度胜率**:59.65%[166] - **超额收益夏普比**:1.02[166] 3. gp因子 - **年化超额收益**:11.10%[166] - **超额收益最大回撤**:10.28%[166] - **月度胜率**:61.40%[166] - **超额收益夏普比**:1.16[166]
深度学习研究报告:股价预测之多模态多尺度
广发证券· 2024-11-18 17:19
量化模型与构建方式 1. 模型名称:多模态多尺度股价预测模型 - **模型构建思路**:基于AI看图初始版本模型,结合多模态(图表数据与时序数据)和多尺度(不同频率的价量数据)特征,采用深度学习方法进行改进,提升股价预测能力[14][17][18] - **模型具体构建过程**: 1. **多模态特征提取**:结合卷积模型和时序模型,分别处理价量数据图表和时序数据,融合两种模态的特征[17] 2. **多尺度特征提取**:引入1分钟频、日频、周频三种频率的价量数据,构建55组高频因子特征,并通过时序模型提取多日特征[18] 3. **轻量化设计**:对每个子模型的参数量进行大幅度压缩,卷积模块的特征维度仅为初始模型的1/4,降低过拟合风险并提升计算效率[18] 4. **多头输出**:模型输出包括未来股价的绝对收益和涨跌分类,分别采用均方误差和交叉熵作为损失函数,进行端到端训练[19] 5. **训练与验证**:训练样本为2008-2016年数据,验证样本为2017-2019年数据,回测样本为2020-2024年数据[23][117] - **模型评价**:通过多模态、多尺度特征提取和轻量化设计,显著提升了模型的预测能力和计算效率[14][18][19] --- 模型的回测效果 1. 多模态多尺度股价预测模型 - **RankIC均值**: - 全市场:8.7% - 沪深300:7.9% - 中证500:6.6% - 中证800:6.9% - 中证1000:8.2% - 国证2000:8.7% - 创业板:10.4%[21][116] - **RankIC胜率**: - 全市场:86.7% - 沪深300:69.0% - 中证500:73.5% - 中证800:75.2% - 中证1000:84.8% - 国证2000:86.1% - 创业板:89.2%[21][116] - **超额年化收益率**: - 全市场:12.97% - 沪深300:9.17% - 中证500:5.30% - 中证800:8.38% - 中证1000:7.47% - 国证2000:7.47% - 创业板:11.52%[21][117] --- 量化因子与构建方式 1. 因子名称:多模态多尺度因子 - **因子构建思路**:基于多模态(图表数据与时序数据)和多尺度(不同频率价量数据)特征提取,结合深度学习模型的预测结果生成因子[14][17][18] - **因子具体构建过程**: 1. **高频因子**:从1分钟频价量数据中提取55组特征,构建日度因子[18] 2. **时序因子**:基于日频和周频数据,利用时序模型提取历史走势特征[18] 3. **卷积因子**:基于标准化价量数据图表,利用卷积模型提取形态走势特征[17] 4. **因子融合**:将时序因子和卷积因子进行特征融合,生成最终因子[17][18] - **因子评价**:与Barra风格因子的相关性较低,具有较强的独立性,相关性最高的三个因子为流动性因子(-18%)、波动率因子(-16%)和市值因子(-8%)[22][23] --- 因子的回测效果 1. 多模态多尺度因子 - **RankIC均值**: - 全市场:8.7% - 沪深300:7.9% - 中证500:6.6% - 中证800:6.9% - 中证1000:8.2% - 国证2000:8.7% - 创业板:10.4%[21][116] - **RankIC胜率**: - 全市场:86.7% - 沪深300:69.0% - 中证500:73.5% - 中证800:75.2% - 中证1000:84.8% - 国证2000:86.1% - 创业板:89.2%[21][116] - **超额年化收益率**: - 全市场:12.97% - 沪深300:9.17% - 中证500:5.30% - 中证800:8.38% - 中证1000:7.47% - 国证2000:7.47% - 创业板:11.52%[21][117]