Workflow
20231227_海通证券_金融工程专题_余浩淼_选股因子系列研究(九十二)——组合约束对其收益表现的影响分析(1)
海通证券· 2023-12-27 00:00
量化模型与构建方式 1. 多头加权法下的纯多头组合 - **模型名称**:多头加权法下的纯多头组合 - **模型构建思路**:通过给多头股票更高的权重,降低IC较高但多头端选股效果羸弱的因子收益,从而提升组合表现[9] - **模型具体构建过程**: 1. 选取ROE、SUE、分析师高评分数、换手率、反转、特质波动、非流动性、尾盘成交占比、买入意愿强度、大单净买入占比、高频深度学习因子和日频深度学习因子共12个因子[10] 2. 对因子进行市值、非线性市值、估值及行业中性化处理和逐次正交[10] 3. 通过加权最小二乘回归计算多因子模型的因子收益,得到预期收益[10] 4. 以周度为换仓频率,选取预期收益最高100个股票构建三个等权纯多头组合[10] 5. 加权方式包括等权法、分组加权法和最低权数分组加权法[10] 6. 公式:$ Wi = Wmin + (gt - go)/(gN - 9o) * (1 - Wmin) $,其中Wi为股票i的权数,Wmin为设定的最小权数[11] - **模型评价**:通过给多头股票更高的权重,可以提升组合年化收益与信息比[9] 2. 指数增强组合的线性规划 - **模型名称**:指数增强组合的线性规划 - **模型构建思路**:通过线性规划和蒙特卡洛模拟,优化股票权重以提升组合表现[2][26] - **模型具体构建过程**: 1. 将带约束的增强组合构建过程转化为标准形式的线性规划问题[27] 2. 公式:$ \operatorname*{max}\sum_{i=0}^{n}c_{i}*x_{i} $,$ s.t1\geq\sum_{i=0}^{n}x_{i}\geq0.95 $,$ mv_{index}+0.3\geq\sum_{i=0}^{n}mv_{i}*x_{i}\geq mv_{index}-0.3 $,$ nlmv_{index}+0.3\geq\sum_{i=0}^{n}nlmv_{i}*x_{i}\geq nlmv_{index}-0.3 $,$ Pctmax_{indus_{m}}\geq\sum_{i\in I_{indus_{m}}}x_{i}\geq Pctmin_{indus_{m}} $,$ pb_{index}+0.3\geq\sum_{i=0}^{n}pb_{i}*x_{i}\geq pb_{index}-0.3 $[28][29] 3. 通过蒙特卡洛模拟,模拟M次包含全市场所有n个股票的预期收益向量,求解得到对应的满足组合约束条件的M个不同的组合权重向量[33] - **模型评价**:通过蒙特卡洛模拟获得权重参考系数进行加权,可以提升组合表现[38] 模型的回测效果 1. 多头加权法下的纯多头组合 - **年化超额收益**:等权24.5%,分组加权-26.1%,最低权数分组加权25.6%[12] - **信息比**:等权2.656,分组加权-1.422,最低权数分组加权2.726[12] 2. 指数增强组合的线性规划 - **年化超额收益**:300增强等权5.3%,300增强最低权数分组加权4.8%,500增强等权11.8%,500增强最低权数分组加权11.4%[24] - **信息比**:300增强等权1.521,300增强最低权数分组加权1.299,500增强等权2.357,500增强最低权数分组加权2.265[24] 量化因子与构建方式 1. 因子收益加权 - **因子名称**:因子收益加权 - **因子的构建思路**:通过加权最小二乘回归计算因子收益,提升组合表现[10] - **因子具体构建过程**: 1. 选取12个因子,对其进行市值、非线性市值、估值及行业中性化处理和逐次正交[10] 2. 通过加权最小二乘回归计算多因子模型的因子收益,得到预期收益[10] 3. 公式:$ weight_{f_{i}}=\sqrt{\Sigma_{i=1}^{n}abs(Revenue_{f_{i}})} $[12] - **因子评价**:通过加权最小二乘回归计算因子收益,可一定程度上提升组合的收益表现[45] 因子的回测效果 1. 因子收益加权 - **等权因子权重**:ROE 8.88%,分析师高评分数4.11%,SUE 6.58%,特质波动10.90%,换手率12.49%,反转9.09%,非流动性2.65%,尾盘成交占比5.91%,买入意愿强度5.81%,大单净买入占比13.11%,高频深度学习因子10.64%,日频深度学习因子8.03%[14] - **最低权数分组加权因子权重**:ROE 9.01%,分析师高评分数4.43%,SUE 7.16%,特质波动9.96%,换手率11.00%,反转7.94%,非流动性2.74%,尾盘成交占比6.53%,买入意愿强度6.16%,大单净买入占比14.02%,高频深度学习因子11.05%,日频深度学习因子8.02%[14] - **多空收益**:ROE 0.48%,分析师高评分数0.18%,SUE 0.31%,特质波动0.49%,换手率-0.85%,反转-0.69%,非流动性0.18%,尾盘成交占比-0.31%,买入意愿强度0.21%,大单净买入占比0.63%,高频深度学习因子0.86%,日频深度学习因子0.65%[14] - **多头超额**:ROE 0.17%,分析师高评分数0.12%,SUE 0.17%,特质波动0.17%,换手率0.18%,反转-0.04%,非流动性-0.02%,尾盘成交占比0.00%,买入意愿强度0.00%,大单净买入占比0.26%,高频深度学习因子0.32%,日频深度学习因子0.19%[14] - **多头超额占比**:ROE 34.5%,分析师高评分数66.1%,SUE 54.7%,特质波动33.4%,换手率21.6%,反转-5.8%,非流动性-11.8%,尾盘成交占比1.1%,买入意愿强度-1.5%,大单净买入占比40.6%,高频深度学习因子37.3%,日频深度学习因子29.5%[14]
20230911_海通证券_金融工程专题_冯佳睿 袁林青_选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比(1)
海通证券· 2023-09-11 00:01
量化因子与构建方式 1. **单颗粒度模型** - **因子名称**: 单颗粒度模型 - **因子构建思路**: 使用不同频率的量价数据构建日度和小时级特征,作为深度学习模型的输入[11] - **因子的公式**: 无 - **文章对因子的评价**: 使用单一的日度特征已经可以实现不俗的业绩,但更细颗粒度的特征依然有值得挖掘的有效信息[15] 2. **多颗粒度模型** - **因子名称**: 多颗粒度模型 - **因子构建思路**: 1. "多颗粒度输入,一次性训练":将不同颗粒度的特征均作为模型输入,并通过独立的GRU提取序列信息;随后,将GRU的输出结果合并,再通过MLP得到最终的输出[16] 2. "单颗粒度训练,输出集成":单独训练每一个颗粒度的特征,输出对标签的预测;在最终的推理阶段,集成不同颗粒度模型的输出[16] - **因子的公式**: 无 - **文章对因子的评价**: 多颗粒度模型的Rank IC和年化多头超额收益,相比单颗粒度模型都得到了不同程度的提升[18] 3. **双向AGRU多颗粒度模型** - **因子名称**: 双向AGRU多颗粒度模型 - **因子构建思路**: 引入注意力机制,并将GRU模型从单向改为双向,即分别按顺序和逆序学习特征序列,并提取信息[22] - **因子的公式**: 无 - **文章对因子的评价**: 双向AGRU多颗粒度模型的Rank IC、ICIR和多头超额收益都得到了全面而稳定的提升[26] 4. **多颗粒度残差学习网络** - **因子名称**: 多颗粒度残差学习网络 - **因子构建思路**: 将多个相同的模块叠加,形成整体网络架构,但每个模块只单独处理一个颗粒度的数据。从第二个模块起,输入的特征都需通过取残差的方式,剔除前一颗粒度已包含的信息[39] - **因子的公式**: $$ \mathcal{L}=\sum_{i=1}^{N}||y^{i}-\hat{y}^{i}||^{2}+\lambda_{1}\sum_{i=1}^{N}\mathcal{L}_{Rec}+\frac{\lambda_{\theta}}{2}||\theta||_{F}^{2} $$ - **文章对因子的评价**: 多颗粒度残差学习网络并未展现出显著的优势,Rank IC、ICIR、多头组合超额收益均弱于输出集成模型[42] 因子的回测效果 1. **单颗粒度模型** - **5日标签** - Rank IC: 日度 0.118, 60分钟 0.116, 30分钟 0.119[12] - ICIR: 日度 7.54, 60分钟 7.35, 30分钟 7.56[12] - 胜率: 日度 87%, 60分钟 86%, 30分钟 87%[12] - Top10%费前: 日度 30.3%, 60分钟 27.1%, 30分钟 28.7%[12] - 组合年化超额费后: 日度 20.1%, 60分钟 16.8%, 30分钟 18.4%[12] - Top100费前: 日度 37.2%, 60分钟 31.9%, 30分钟 31.9%[12] - 组合年化超额费后: 日度 24.4%, 60分钟 18.6%, 30分钟 18.6%[12] 2. **多颗粒度模型** - **5日标签** - Rank IC: 混合输入 0.139, 输出集成 0.139, 输出集成1 0.139[18] - ICIR: 混合输入 7.83, 输出集成 7.63, 输出集成1 7.71[29] - 胜率: 混合输入 88%, 输出集成 87%, 输出集成1 87%[29] - Top10%费前: 混合输入 30.8%, 输出集成 30.6%, 输出集成1 31.4%[29] - 组合年化超额费后: 混合输入 20.0%, 输出集成 20.6%, 输出集成1 21.4%[29] - Top100费前: 混合输入 37.1%, 输出集成 36.6%, 输出集成1 38.1%[29] - 组合年化超额费后: 混合输入 23.5%, 输出集成 23.8%, 输出集成1 25.3%[29] 3. **双向AGRU多颗粒度模型** - **5日标签** - Rank IC: 混合输入 0.125, 输出集成 0.126, 输出集成1 0.127[29] - ICIR: 混合输入 8.09, 输出集成 7.87, 输出集成1 7.88[29] - 胜率: 混合输入 88%, 输出集成 88%, 输出集成1 88%[29] - Top10%费前: 混合输入 34.5%, 输出集成 33.6%, 输出集成1 34.2%[29] - 组合年化超额费后: 混合输入 23.5%, 输出集成 24.0%, 输出集成1 24.3%[29] - Top100费前: 混合输入 41.1%, 输出集成 42.0%, 输出集成1 42.0%[29] - 组合年化超额费后: 混合输入 27.1%, 输出集成 29.3%, 输出集成1 29.2%[29] 4. **多颗粒度残差学习网络** - **5日标签** - Rank IC: 0.114[42] - ICIR: 7.49[42] - 胜率: 86%[42] - Top10%费前: 27.9%[42] - 组合年化超额费后: 18.6%[42] - Top100费前: 32.1%[42] - 组合年化超额费后: 21.1%[42]
20230513_海通证券_金融工程专题_冯佳睿袁林青_选股因子系列研究(八十七)——高频与日度量价数据混合的深度学习因子
海通证券· 2023-05-13 00:01
量化因子与构建方式 1. **混频深度学习因子** - **因子构建思路**:将26个日频特征和64个60分钟频特征共同输入深度学习模型,并大幅延长训练和迭代周期,得到新的混频深度学习因子[1][8][9] - **因子的公式**:无具体公式 - **文章对因子的评价**:因子呈现出显著的周度选股能力,周均IC达到0.10,TOP 10%和TOP 100多头组合的多路径平均年化超额收益分别高达30%和35%[1][2][11] 2. **未来5日因子** - **因子构建思路**:使用未来5日(T+1~T+6)收益率作为预测标签训练得到的因子[10] - **因子的公式**:无具体公式 - **文章对因子的评价**:表现优于未来10日因子,但自相关性更低,换手率略高[12][13] 3. **未来10日因子** - **因子构建思路**:使用未来10日(T+1~T+11)收益率作为预测标签训练得到的因子[10] - **因子的公式**:无具体公式 - **文章对因子的评价**:表现略逊于未来5日因子,但自相关性更高,换手率略低[12][13] 4. **相互正交因子集合** - **因子构建思路**:在MLP与输出层之间加入一个正交层,生成32个相互正交的因子[50][51] - **因子的公式**:无具体公式 - **文章对因子的评价**:因子周均IC在0.03-0.04之间,TOP 10%组合年化超额收益为5%-12%[52][54] 5. **与指定因子集合正交的因子集合** - **因子构建思路**:在MLP与输出层之间加入一个正交层,生成与行业、市值和BP正交,且内部相互正交的32个因子[50][55] - **因子的公式**:无具体公式 - **文章对因子的评价**:因子集合整体的选股能力受到明显削弱,IC从0.03-0.04降至0.015-0.025,TOP 10%组合年化超额收益为5%-12%[56][58] 因子的具体指标值 1. **周频因子选股能力** - **IC均值**:未来5日因子0.104,未来10日因子0.102[13] - **年化ICIR**:未来5日因子8.418,未来10日因子7.853[13] - **胜率**:未来5日因子91%,未来10日因子87%[13] - **Rank IC均值**:未来5日因子0.099,未来10日因子0.102[13] - **年化Rank ICIR**:未来5日因子7.047,未来10日因子7.136[13] - **因子自相关性**:未来5日因子0.53,未来10日因子0.66[13] - **TOP 10%组合换手率**:未来5日因子64%,未来10日因子56%[13] 2. **预测标签调整的周频因子选股能力** - **IC均值**:未来5日因子0.102,未来10日因子0.099[14] - **年化ICIR**:未来5日因子6.915,未来10日因子6.496[14] - **胜率**:未来5日因子85%,未来10日因子83%[14] - **Rank IC均值**:未来5日因子0.119,未来10日因子0.118[14] - **年化Rank ICIR**:未来5日因子7.932,未来10日因子7.801[14] - **因子自相关性**:未来5日因子0.60,未来10日因子0.70[14] - **TOP 10%组合换手率**:未来5日因子62%,未来10日因子56%[14] 3. **32个因子的周频选股能力(相互正交)** - **IC均值**:0.030-0.047[54] - **周度胜率**:59%-81%[54] - **多头超额收益**:5.2%-11.6%[54] 4. **32个因子的周频选股能力(与行业、市值和BP正交)** - **IC均值**:0.015-0.027[58] - **周度胜率**:59%-71%[58] - **多头超额收益**:-0.1%-5.6%[58]
20230130_海通证券_金融工程专题_冯佳睿_选股因子系列研究(八十六)——深度学习高频因子的特征工程(1)
海通证券· 2023-01-30 00:00
量化因子与构建方式 - **深度学习高频因子** - **因子构建思路**:使用"原始数据-分钟级基础指标-目标频率衍生指标"的方式生成高频特征。基于原始数据生成一系列分钟级的基础指标,这类指标旨在捕捉原始数据中的基本信息。得到基础指标序列后,通过不断变换输入的基础指标序列生成特征[1][2][11] - **因子的公式**: - 下行大买单金额占比: $$ \mp{\hat{4}}\tau\,{\hat{b}}\,\psi(a,b)={\frac{\sum_{b<0}a}{\sum a}} $$ - 下行小买单单均金额占比: $$ \text{公式中} \, \{a} \, \text{代表} \, a \, \text{的数量} $$ - **文章对因子的评价**:在后续的样本外跟踪中,因子展现出了较为稳定的选股能力[8][9][12] 因子的回测效果 - **周均IC**:176特征集合为0.072,偏度调整后为0.073,偏度调整和去极值后为0.073[13][19][26] - **年化ICIR**:176特征集合为8.884,偏度调整后为9.158,偏度调整和去极值后为9.265[13][19][26] - **月度胜率**:176特征集合为90%,偏度调整后为90%,偏度调整和去极值后为91%[13][19][26] - **年化多头超额收益**:176特征集合为28.5%,偏度调整后为31.1%,偏度调整和去极值后为31.4%[13][19][26] - **年化空头超额收益**:176特征集合为-38.8%,偏度调整后为-38.6%,偏度调整和去极值后为-38.7%[13][19][26] - **年化多空收益**:176特征集合为67.3%,偏度调整后为69.7%,偏度调整和去极值后为70.1%[13][19][26]
日内分钟收益率的时序特征:逻辑讨论与因子增强——市场微观结构研究系列(19)
开源证券· 2022-12-25 00:01
量化因子与构建方式 1. 因子名称:跌幅时间重心偏离因子 - 因子的构建思路:通过观察日内分钟收益率的时序特征,构建反映跌幅时间重心偏离的选股因子[10][16] - 因子具体构建过程: 1. 将09:31至15:00间的240根分钟Bar依次标记为1至240,分别统计价格上涨和价格下跌两组分钟Bar的时间标识序列[10] 2. 计算涨幅时间重心和跌幅时间重心: $$ G_u = \frac{UR_u}{\|R_u\|_1} $$ $$ G_d = \frac{DR_d}{\|R_d\|_1} $$ 其中,$UR_u$和$DR_d$分别表示涨幅和跌幅分钟的时间序号及收益率[10] 3. 以跌幅时间重心对涨幅时间重心在截面上回归取残差,再取其20日均值作为跌幅时间重心偏离因子[20] - 因子评价:跌幅时间重心偏离因子是刻画分钟时序特征更有效的指标,因子的稳定性相比原始"时间差"因子更高[21] 2. 因子名称:时间重心偏离(TGD)因子 - 因子的构建思路:剥离可能影响"时间差Alpha"的干扰因子,在跌幅时间重心偏离因子的基础上改进得到时间重心偏离(TGD)因子[3][62] - 因子具体构建过程: 1. 逐日计算个股的涨幅时间重心和跌幅时间重心,并统计以下指标:平均涨幅、平均跌幅、时段1(09:31-10:00)的涨跌幅、时段2(10:01-10:30)的涨跌幅、隔夜涨跌幅[64] 2. 将涨、跌幅的时间重心单独剥离干扰因子: $$ G_u = f(\bar{R_u}, R_{1u}, R_{2u}, R_{hu}) $$ $$ G_d = f(\bar{R_d}, R_{1d}, R_{2d}, R_{hd}) $$ 3. 通过截面回归方法,构造"时间差"指标,并取其20日均值作为因子: $$ TGD = \frac{1}{20} \sum_{i=1}^{20} (G_d - G_u) $$ - 因子评价:TGD因子的有效性较原始因子大幅提升,全市场五分组下的多空信息比率达到4.93,因子收益较为稳定[3][62] 3. 因子名称:合成因子 - 因子的构建思路:将时间维度的综合信息因子(TGD)与收益率分布的典型因子(日内收益率偏度SKEW)进行合成,提升因子效果[3][76] - 因子具体构建过程: 1. 选取分布特征的典型因子:日内收益率偏度SKEW因子[76] 2. 将TGD因子与SKEW因子在横截面上排序加总得到合成因子[76] - 因子评价:合成因子在稳定性方面进一步改善,Rank ICIR达到5.74[76] 因子的回测效果 1. 跌幅时间重心偏离因子 - Rank IC:0.054[21] - Rank ICIR:2.99[21] - 多空收益:21.2%[21] - 多空IR:2.39[21] 2. 时间重心偏离(TGD)因子 - Rank IC:0.067[72] - Rank ICIR:4.94[72] - 多空收益:21.35%[72] - 多空IR:4.93[3][62] 3. 合成因子 - Rank IC:0.084[78] - Rank ICIR:5.74[78] - 多空收益:不详 - 多空IR:4.45[78]
20220621_海通证券_金融工程专题_冯佳睿余浩淼_选股因子系列研究(八十一)——净利润相关指标的进一步改进
海通证券· 2022-06-21 00:00
量化因子与构建方式 - **ROE因子** - **构建思路**: 将最新披露ROE替换为已披露的业绩快报或业绩预告公布的数值,和一致预期ROE共同作为预测变量,建立当期真实ROE的预测模型[1][8] 进一步采用ROE历史波动率倒数加权的方式,降低预测精度较差的那部分股票的影响[1][8] - **公式**: 无 - **评价**: ROE因子在全市场中是一个颇为有效的财务类因子,但不同行业的ROE对于公司股票市场价值的影响程度有很大差异[11][12] 剔除电力及公用事业、房地产、纺织服装和商贸零售四个行业后,ROE因子的选股效果显著提升[12][14] - **SUE因子** - **构建思路**: 采用和改善ROE因子有效性相同的方式,调整SUE因子的权重[2] 计算公式为SUE = DREV/SD(DREVt=1...4),其中DREV为净利润同比增量,SD为过去四个季度净利润同比增量的标准差[21] - **公式**: $$ SUE = \frac{DREV}{SD(DREV_{t=1...4})} $$ 其中,DREV为净利润同比增量,SD为过去四个季度净利润同比增量的标准差[21] - **评价**: SUE因子虽有一定的业绩动量效应,但由于其本质为净利润的同比差分,效应显著弱于ROE[23] 调整不同行业股票SUE的权重,可以使因子表现获得更为显著的提升[24][27] 因子的回测效果 - **全市场多头组合** - **年化收益**: - Wind全A: 3.6% - 最新披露组合: 15.5% - 预测最新组合: 17.6% - 改进预测最新组合: 17.9%[32] - **年化波动**: - Wind全A: 26.2% - 最新披露组合: 28.2% - 预测最新组合: 28.2% - 改进预测最新组合: 28.4%[32] - **夏普比率**: - Wind全A: 0.136 - 最新披露组合: 0.551 - 预测最新组合: 0.625 - 改进预测最新组合: 0.631[32] - **最大回撤**: - Wind全A: 56.0% - 最新披露组合: 48.6% - 预测最新组合: 48.2% - 改进预测最新组合: 48.7%[32] - **收益回撤比**: - Wind全A: 0.064 - 最新披露组合: 0.320 - 预测最新组合: 0.365 - 改进预测最新组合: 0.368[32] - **指数增强组合** - **沪深300** - **年化超额收益**: - 最新披露组合: 4.6% - 预测最新组合: 5.7% - 改进预测最新组合: 6.3%[36] - **年化超额波动**: - 最新披露组合: 7.6% - 预测最新组合: 7.9% - 改进预测最新组合: 8.0%[36] - **信息比率**: - 最新披露组合: 0.608 - 预测最新组合: 0.724 - 改进预测最新组合: 0.791[36] - **超额最大回撤**: - 最新披露组合: 13.6% - 预测最新组合: 14.8% - 改进预测最新组合: 12.7%[36] - **超额收益回撤比**: - 最新披露组合: 0.340 - 预测最新组合: 0.384 - 改进预测最新组合: 0.495[36] - **中证500** - **年化超额收益**: - 最新披露组合: 11.7% - 预测最新组合: 11.8% - 改进预测最新组合: 12.8%[36] - **年化超额波动**: - 最新披露组合: 6.6% - 预测最新组合: 6.9% - 改进预测最新组合: 7.4%[36] - **信息比率**: - 最新披露组合: 1.782 - 预测最新组合: 1.703 - 改进预测最新组合: 1.745[36] - **超额最大回撤**: - 最新披露组合: 8.9% - 预测最新组合: 9.8% - 改进预测最新组合: 9.9%[36] - **超额收益回撤比**: - 最新披露组合: 1.308 - 预测最新组合: 1.204 - 改进预测最新组合: 1.304[36] - **中证800** - **年化超额收益**: - 最新披露组合: 7.4% - 预测最新组合: 8.2% - 改进预测最新组合: 8.4%[36] - **年化超额波动**: - 最新披露组合: 6.2% - 预测最新组合: 6.4% - 改进预测最新组合: 6.6%[36] - **信息比率**: - 最新披露组合: 1.188 - 预测最新组合: 1.285 - 改进预测最新组合: 1.277[36] - **超额最大回撤**: - 最新披露组合: 11.1% - 预测最新组合: 10.0% - 改进预测最新组合: 11.0%[36] - **超额收益回撤比**: - 最新披露组合: 0.663 - 预测最新组合: 0.817 - 改进预测最新组合: 0.766[36]
20211227_海通证券_金融工程专题_冯佳睿余浩淼_选股因子系列研究(七十五)——限价订单簿(LOB)的还原和应用
海通证券· 2021-12-27 00:00
量化模型与构建方式 模型名称:限价订单簿(LOB)还原 - 模型构建思路:利用逐笔数据还原盘口行情,以提高订单簿的更新频率和信息丰富度[8][9] - 模型具体构建过程: - 集合竞价阶段:利用逐笔数据还原集合竞价阶段的买卖挂单信息[14] - 连续竞价阶段:逐笔委托中包含了连续竞价阶段的全部委托单信息,通过逐笔数据还原盘口行情[15][16] - 模型评价:可以将订单簿的更新频率提升到0.01秒以内,避免快照行情的延迟问题,实时跟踪订单簿的全貌[16] 模型名称:模拟撮合系统 - 模型构建思路:通过逐笔数据还原的盘口行情,模拟撮合过程以估计交易成本[17] - 模型具体构建过程: - 利用逐笔数据构造模拟撮合过程,确保成交优先级的精确性[18] - 适用于委托量较小的订单,大订单需要更复杂的系统[18] - 模型评价:可以更好地估计交易成本,但对大订单的模拟效果有限[18] 模型名称:限价单与市价单 TWAP 策略 - 模型构建思路:通过分散下单,降低冲击成本和极端交易价格对整体交易成本的影响[19] - 模型具体构建过程: - 市价单 TWAP:每3秒下等量的市价单[19] - 限价单 TWAP:每3秒以本方最优价下等量限价单,未成交部分在分钟末以市价单一次性下出[19] - 对京东方A、中国平安、证券ETF、创业板50ETF进行模拟实践,测试不同时间段和金额的成交效果[19][21] - 模型评价:限价单 TWAP 策略在流动性充裕的环境下应比市价单 TWAP 策略有更低的交易成本,但在成交概率较低时可能产生亏损[22] 模型名称:改进 TWAP 策略 - 模型构建思路:通过提高限价单的成交概率,降低强制成交比例[22] - 模型具体构建过程: - 定义限价买卖委托成交概率指标,指导下单决策[23][24] - 基于 LOB 指标预测买卖成交概率,改进 TWAP 策略[31][32] - 使用回归模型预测买卖成交概率,提供决策依据[36][37] - 模型评价:改进后的 TWAP 策略可以显著提升限价单的成交概率,降低强制成交比例,但效果因证券而异[30][38] 模型的回测效果 限价单 TWAP 策略 - 京东方A,限价单日均超额收益:0.005%(1000万,9:30-10:00),-0.005%(1亿,9:30-10:00)[21] - 中国平安,限价单日均超额收益:0.004%(1000万,9:30-10:00),-0.003%(1亿,9:30-10:00)[21] - 证券ETF,限价单日均超额收益:0.008%(200万,9:30-10:00),-0.003%(2000万,9:30-10:00)[21] - 创业板50ETF,限价单日均超额收益:0.006%(200万,9:30-10:00),0.002%(2000万,9:30-10:00)[21] 改进 TWAP 策略 - 京东方A,相对市价单超额收益:0.016%(1000万,9:30-10:00),0.008%(1亿,9:30-10:00)[44] - 中国平安,相对市价单超额收益:0.003%(1000万,9:30-10:00),-0.003%(1亿,9:30-10:00)[44] - 证券ETF,相对市价单超额收益:0.006%(200万,9:30-10:00),0.003%(2000万,9:30-10:00)[44] - 创业板50ETF,相对市价单超额收益:0.002%(200万,9:30-10:00),-0.006%(2000万,9:30-10:00)[44] 量化因子与构建方式 因子名称:买入意愿因子 - 因子的构建思路:结合盘口快照与逐笔成交数据,构建开盘后买入意愿占比因子[48] - 因子具体构建过程: - 定义委买增额和委卖增额,计算净委买增额和净主买成交额[48] - 利用 LOB 数据进一步分解为挂单、撤单、成交和净被动买入四个因子[50][51] - 因子评价:通过 LOB 指标重构现有价量因子,为观察市场微观结构提供了多维视角[55] 因子的回测效果 买入意愿因子 - 开盘后买入意愿占比(LOB),IC:0.034,IC-IR:4.006,IC胜率:88.9%,多空月均收益:1.25%[54] - 开盘后买入意愿占比(快照),IC:0.034,IC-IR:3.988,IC胜率:88.9%,多空月均收益:1.19%[54]
独家量价因子的高频测试
开源证券· 2021-09-24 16:04
- 开源金工独家量价因子包括主动买卖、聪明钱、理想振幅、APM、理想反转、大单资金流、小单资金流和长端动量因子[4][11] - 大部分因子间的相关性并不高,尤其是长端动量因子;理想振幅因子与聪明钱因子具有一定正相关性(0.34),大单资金流因子与小单资金流因子具有高度负相关性(-0.63)[4][11] - 8个量价因子的测试频率从月频提升至更高频下,仍具有高夏普比率[4][12] - 三种测试频率下的因子整体效果,双周频>周频>月频[4][12] - 大单资金流、长端动量因子在三种频率下的多头表现均优异[4][12] - 大单资金流、理想振幅、聪明钱在三种频率下的多空表现均优异[4][12] - 8个因子的多空净值均在创历史新高,而长端动量、大单资金流因子的多头净值创历史新高[4][16] - 复合因子在多头端及多空端均显著优于原始因子[5][24] - 复合因子无论是在多头端还是多空端均优于各原始因子[5][24] 因子构建方式 - **理想反转因子** - 构建思路:对选定股票S,回溯取其过去20日的数据,计算股票S每日的平均单笔成交金额,单笔成交金额高的10个交易日涨跌幅加总,记作$M_{high}$,单笔成交金额低的10个交易日涨跌幅加总,记作$M_{low}$,理想反转因子M=$M_{high}-M_{low}$[28] - 公式:$M = M_{high} - M_{low}$[28] - **聪明钱因子** - 构建思路:对选定股票,回溯取其过去10个交易日的分钟行情数据,构造指标$S_t=|R_t|/V_t^{0.25}$,将分钟数据按照指标$S_t$从大到小进行排序,取成交量累积占比前20%的分钟,视为聪明钱交易,计算聪明钱交易的成交量加权平均价VWAP$_{smart}$,计算所有交易的成交量加权平均价VWAP$_{all}$,聪明钱因子Q=VWAP$_{smart}$/VWAP$_{all}$[28] - 公式:$Q = \frac{VWAP_{smart}}{VWAP_{all}}$[28] - **APM因子** - 构建思路:对选定股票,回溯取其过去20日数据,计算逐日上午和下午的股票收益率和指数收益率,进行回归得到残差项,计算每日上午与下午残差的差,构造统计量stat来衡量上午与下午残差的差异程度,消除动量因子影响,将统计量stat对动量因子进行横截面回归,回归得到的残差值作为APM因子[28] - 公式:$stat_j = b \cdot Ret20_j + \varepsilon_j$[28] - **理想振幅因子** - 构建思路:对选定股票S,回溯取其最近N个交易日的数据,计算股票S每日的振幅,选择收盘价较高的$\lambda$有效交易日,计算振幅均值得到高价振幅因子$V_{high}(\lambda)$,选择收盘价较低的$\lambda$有效交易日,计算振幅均值得到低价振幅因子$V_{low}(\lambda)$,理想振幅因子$V(\lambda) = V_{high}(\lambda) - V_{low}(\lambda)$[28] - 公式:$V(\lambda) = V_{high}(\lambda) - V_{low}(\lambda)$[28] - **主动买卖因子** - 构建思路:逐日计算大单和中单总的主动买卖因子$ACT_{正向,t}$,以及小单的主动买卖因子$ACT_{负向,t}$,回溯过去20个交易日,取收益率最高$\lambda$比例的交易日,称为高收益日;取收益率最低$\lambda$比例的交易日,称为低收益日,对高收益日的$ACT_{正向,t}$因子取平均,记为$ACT_{正向}$;对低收益日的$ACT_{负向,t}$因子取平均,记为$ACT_{负向}$[28] - 公式:$ACT_{正向,t} = \frac{主动买入金额(大单+中单) - 主动卖出金额(大单+中单)}{主动买入金额(大单+中单) + 主动卖出金额(大单+中单)}$[28] - 公式:$ACT_{负向,t} = \frac{主动买入金额(小单) - 主动卖出金额(小单)}{主动买入金额(小单) + 主动卖出金额(小单)}$[28] - **长端动量因子** - 构建思路:对选定股票,回溯取其最近160个交易日的数据,计算股票每日的振幅,选择振幅较低的70%交易日,涨跌幅加总,得到长端动量因子[28] - **大小单资金流因子** - 构建思路:计算小单资金流强度和大单资金流强度,对其关于过去20日涨跌幅做回归,得到残差[28] - 公式:$S_t = \frac{\sum_{t-T}^{t}(buy_t - sell_t)}{\sum_{t-T}^{t}|buy_t - sell_t|}$[28] - 公式:$S_t = a + b \cdot Ret20_t + \varepsilon_t$[28] 因子的具体指标值 - **IC均值** - 主动买卖:0.016[13] - 聪明钱:-0.022[13] - 理想振幅:-0.031[13] - APM:0.019[13] - 理想反转:-0.024[13] - 长端动量:0.014[13] - 大单资金流:0.025[13] - 小单资金流:-0.020[13] - **rank IC均值** - 主动买卖:0.037[13] - 聪明钱:-0.053[13] - 理想振幅:-0.061[13] - APM:0.023[13] - 理想反转:-0.052[13] - 长端动量:0.023[13] - 大单资金流:0.045[13] - 小单资金流:-0.034[13] - **年化ICIR** - 主动买卖:1.86[13] - 聪明钱:-2.49[13] - 理想振幅:-2.97[13] - APM:2.83[13] - 理想反转:-2.29[13] - 长端动量:1.28[13] - 大单资金流:2.76[13] - 小单资金流:-2.18[13] - **年化收益率** - 主动买卖:13.60%[13] - 聪明钱:21.85%[13] - 理想振幅:26.56%[13] - APM:12.62%[13] - 理想反转:17.23%[13] - 长端动量:15.29%[13] - 大单资金流:23.05%[13] - 小单资金流:15.83%[13] - **多空对冲收益波动比** - 主动买卖:2.08[13] - 聪明钱:2.49[13] - 理想振幅:2.92[13] - APM:1.99[13] - 理想反转:1.98[13] - 长端动量:1.67[13] - 大单资金流:2.95[13] - 小单资金流:1.88[13] - **多空对冲年化收益率** - 主动买卖:28.05%[13] - 聪明钱
分析师目标价的 Alpha 信息
开源证券· 2021-09-14 08:08
量化因子与构建方式 WTR因子 - **因子名称**: 加权预期收益率因子(WTR) - **因子构建思路**: 该因子考虑了分析师发布报告时的股票价格,并根据股票价格走势验证分析师的目标价格判断,赋予不同权重[66] - **因子的公式**: $$ W T R=\sum\frac{P_{i}^{e}}{P_{i}^{0}}=\frac{\sum P_{i}^{e}\times P/P_{i}^{0}}{P}=\sum\frac{P_{i}^{e}}{P}\omega_{i}=T R\times W $$ 其中,$P_{i}^{0}$表示在第$i$家机构发布价格预测前一个交易日的收盘价;$P_{i}^{e}$为第$i$家机构发布的股票目标价格;$P$为月末计算因子时的股票收盘价;$\omega_{i}$表示在不同行情下,对不同机构预测的目标价格应赋予的系数[66] - **文章对因子的评价**: 因子的收益大多集中在多头端,说明高预期收益率的股票要明显比低预期收益率的股票要好,分析师对于个股的价格预测存在有效的选股能力[68] MTR因子 - **因子名称**: 调整预期收益率因子(MTR) - **因子构建思路**: 该因子反映的是分析师预期的变化在短期对市场的冲击影响,相对于WTR因子在逻辑上"更短"一些[71] - **因子的公式**: $$ MTR = \Delta(WTR) $$ - **文章对因子的评价**: MTR因子的多空收益主要贡献在空头端,分析师下调收益率的含义相对而言更加明确一些[72] CTR因子 - **因子名称**: 关注度修正因子(CTR) - **因子构建思路**: 该因子考虑了分析师预期数据中的关注度因子C,在截面上反映的是股票热度的差异性[74] - **因子的公式**: $$ CTR = Rank(WTR) \times Rank(C) $$ - **文章对因子的评价**: CTR因子的多头年化收益率达到14.4%,夏普比率为0.546,胜率同样比原始因子的表现更好[75] TR_ICIR因子 - **因子名称**: 预期收益率因子合成(TR_ICIR) - **因子构建思路**: 将WTR因子、MTR因子和CTR因子等权组合,利用ICIR加权合成[77] - **文章对因子的评价**: 合成因子的表现要优于原始因子,从时效性、预期偏差以及关注效应三个维度拆解一致预期目标价的Alpha,通过ICIR加权的方法,最终构造的合成因子在稳定性上有明显的提升[78] 因子的回测效果 WTR因子 - **多头年化收益率**: 14.4%[68] - **夏普比率**: 0.522[68] - **信息比率(IR)**: 0.696[68] - **月度胜率**: 0.696[69] MTR因子 - **多头年化收益率**: 12.3%[72] - **夏普比率**: 0.456[72] - **信息比率(IR)**: 1.772[72] - **月度胜率**: 0.703[73] CTR因子 - **多头年化收益率**: 14.4%[75] - **夏普比率**: 0.546[75] - **信息比率(IR)**: 1.233[76] - **月度胜率**: 0.674[76] TR_ICIR因子 - **多头年化收益率**: 14.9%[77] - **夏普比率**: 0.545[78] - **信息比率(IR)**: 1.401[78] - **月度胜率**: 0.674[78]
量化资产配置专题报告
爱建证券· 2019-08-27 07:07
量化因子与构建方式 - **BL因子** - **因子构建思路**: 结合Black-Litterman模型(BL模型)和回归树模型,BL模型在不完全受限于历史数据的情况下可以加入一些主观观点,从而降低模型失效的概率[13][22] - **因子的公式**: - 资产预期回报公式: $$ \text{bl} = [Ρ′Ω^{-1}P + (τΣ)^{-1}]^{-1}[Ρ′Ω^{-1}Q + (τΣ)^{-1}Π] $$[56] - 资产协方差矩阵公式: $$ \Sigma_{\text{bl}} = \Sigma + [(\tau\Sigma)^{-1} + (Ρ′Ω^{-1}P)]^{-1} $$[57] - **文章对因子的评价**: 样本外的回测结果显示结合了回归树的BL模型整体表现相对较好,回归树视角下的宏观经济变量与大类资产回报之间的关系为主观预期提供了一定的参考价值[13][87] 因子的具体指标值 - **回报率** - BL因子: 74%[103] - 沪深300: 29%[103] - 中证时钟配置: 49%[103] - **最大回撤** - BL因子: 13.71%[103] - 沪深300: 40.56%[103] - 中证时钟配置: 7.88%[103]