Workflow
20200209_开源证券_金融工程专题_聪明钱因子模型的2_0版本--市场微观结构研究系列(3)_魏建榕,傅开波,高鹏
开源证券· 2020-02-09 00:00
量化因子与构建方式 聪明钱因子(原始模型) - **因子名称**:聪明钱因子[5][15] - **因子的构建思路**:通过分钟行情数据的价量信息,识别机构参与交易的多寡,构造跟踪聪明钱的选股因子[5][15] - **因子具体构建过程**: 1. 回溯选定股票过去10个交易日的分钟行情数据[17] 2. 构造聪明度指标 $ S_t = R_t / \sqrt{V_t} $,其中 $ R_t $ 为第 $ t $ 分钟涨跌幅,$ V_t $ 为第 $ t $ 分钟成交量[17] 3. 按 $ S_t $ 从大到小排序,取成交量累积占比前20%的分钟视为聪明钱交易[16][17] 4. 计算聪明钱交易的成交量加权平均价 $ VWAP_{smart} $[17] 5. 计算所有交易的成交量加权平均价 $ VWAP_{all} $[17] 6. 构造聪明钱因子 $ Q = VWAP_{smart} / VWAP_{all} $[17] - **因子评价**:逻辑简洁,样本内表现良好,但样本外表现逐渐减弱[15][23] 聪明钱因子(改进模型) - **因子名称**:改进后的聪明钱因子[7][23] - **因子的构建思路**:通过重新考察聪明度指标 $ S $ 的构造方式,优化聪明钱划分,提升选股能力[7][23] - **因子具体构建过程**: 1. 将分钟成交量 $ V $ 的指数项定义为可变参数 $ \beta $,构造一般化公式 $ S = |R| / (V^\beta) $[24] 2. 测试不同 $ \beta $ 值下的因子选股能力,发现当 $ \beta = 0.1 $ 时信息比率达到最优[24][28] 3. 进一步尝试对分钟成交量作对数变换,构造公式 $ S = |R| / \ln(V) $[31][32] - **因子评价**:改进后的因子选股能力显著提升,尤其在中小市值股票中表现更优[7][28][43] 不同 $ S $ 指标的构造方式 - **因子名称**:基于不同 $ S $ 指标的聪明钱因子[31][32] - **因子的构建思路**:尝试不同的聪明度指标构造方式,优化因子选股能力[31][32] - **因子具体构建过程**: 1. $ S_1 = V $:单独考虑分钟成交量[32] 2. $ S_2 = \text{rank}(R) + \text{rank}(V) $:分钟涨跌幅绝对值分位排名与分钟成交量分位排名之和[32] 3. $ S_3 = R / \ln(V) $:分钟涨跌幅绝对值除以分钟成交量对数值[32] - **因子评价**:对分钟成交量作对数变换构造的因子($ S_3 $)选股能力最强[32] --- 因子的回测效果 原始聪明钱因子 - **信息比率**:1.69[32] - **IC均值**:未明确列出[32] - **多空对冲净值**:样本外表现逐渐减弱[23][27] 改进后的聪明钱因子(基于 $ \beta = 0.1 $) - **信息比率**:3.67[28] - **IC均值**:未明确列出[28] - **多空对冲净值**:显著提升,尤其在中证1000成分股中表现最佳[44][50] 改进后的聪明钱因子(基于对数成交量) - **信息比率**:3.74[32] - **IC均值**:-0.050[32] - **多空对冲净值**:对中小市值股票效果更优[48][50] 不同 $ S $ 指标的回测效果 - **$ S_1 = V $**: - 信息比率:2.03[32] - IC均值:-0.036[32] - 多空对冲净值:未明确列出[32] - **$ S_2 = \text{rank}(R) + \text{rank}(V) $**: - 信息比率:2.61[32] - IC均值:-0.043[32] - 多空对冲净值:未明确列出[32] - **$ S_3 = R / \ln(V) $**: - 信息比率:3.74[32] - IC均值:-0.050[32] - 多空对冲净值:未明确列出[32]
20191223_开源证券_金融工程专题_市场微观结构研究系列(1)--A股反转之力的微观来源_傅开波,魏建榕_2019-12-20
开源证券· 2019-12-23 00:00
量化模型与构建方式 W式切割模型 - **模型名称**:W式切割模型 - **模型构建思路**:通过对过去20日的涨跌幅进行切割,分解出反转与动量的成分,以提高反转因子的收益稳健性[11][4] - **模型具体构建过程**: 1. 对选定股票S,回溯取其过去20日的数据[12][4] 2. 计算股票S每日的平均单笔成交金额(成交金额/成交笔数)[12][4] 3. 单笔成交金额高的10个交易日,涨跌幅加总,记作M_high[12][4] 4. 单笔成交金额低的10个交易日,涨跌幅加总,记作M_low[12][4] 5. 理想反转因子M = M_high - M_low[12][4] 6. 对所有股票,都进行以上操作,计算各自的理想反转因子M[12][4] - **公式**: $ M = M_{high} - M_{low} $ 公式中,$ M_{high} $ 表示单笔成交金额高的10个交易日的涨跌幅加总,$ M_{low} $ 表示单笔成交金额低的10个交易日的涨跌幅加总[12][4] - **模型评价**:W式切割模型简洁有效,显著优于传统反转因子Ret20,其收益稳健性更强[11][4] 新W式切割模型 - **模型名称**:新W式切割模型 - **模型构建思路**:用分位数代替平均值作为切割标准,以获取更多微观信息并优化反转因子的表现[17][18] - **模型具体构建过程**: 1. 对选定股票S,回溯取其过去20日的数据[18] 2. 计算股票S每日逐笔成交金额分布的1/16分位值[18] 3. 1/16分位值高的10个交易日,涨跌幅加总,记作M_high[18] 4. 1/16分位值低的10个交易日,涨跌幅加总,记作M_low[18] 5. 理想反转因子M = M_high - M_low[18] 6. 对所有股票,都进行以上操作,计算各自的理想反转因子M[18] - **公式**: $ M = M_{high} - M_{low} $ 公式中,$ M_{high} $ 表示1/16分位值高的10个交易日的涨跌幅加总,$ M_{low} $ 表示1/16分位值低的10个交易日的涨跌幅加总[18] - **模型评价**:随着分位值的提高,M_high的反转特性增强,M_low逐渐呈现动量特性,切割效果显著优化[21][30] 高分位反转因子 - **因子名称**:M_high_13/16 - **因子构建思路**:采用高分位值作为切割标准,选取高分位值较高的交易日以增强反转特性[30] - **因子具体构建过程**: 1. 对选定股票S,回溯取其过去20日的数据[30] 2. 计算股票S每日逐笔成交金额分布的13/16分位值[30] 3. 13/16分位值高的10个交易日,涨跌幅加总,记作M_high_13/16[30] - **公式**: $ M_{high\_13/16} = \text{涨跌幅加总(13/16分位值高的10个交易日)} $[30] - **因子评价**:M_high_13/16因子保留了长期收益特征,同时成功避免了大幅回撤,表现稳健[31][30] --- 模型的回测效果 W式切割模型 - **信息比率(IR)**:2.51[11] - **月度胜率**:74%[11] 新W式切割模型 - **信息比率(IR)**:随着分位值提高,M_high的IR值显著增强,最佳分位值未明确[24][30] 高分位反转因子(M_high_13/16) - **信息比率(IR)**:2.00[31] - **月度胜率**:72.0%[31] - **IC**:-0.070[31] - **rankIC**:-0.087[31] --- 因子的回测效果 理想反转因子(M) - **信息比率(IR)**:2.51[11] - **月度胜率**:74%[11] 新W式切割因子(M_high与M_low) - **M_high的IC值**:随着分位值提高,IC绝对值逐渐增大,呈现更强反转特性[21][24] - **M_low的IC值**:随着分位值提高,IC逐渐从负值转为正值,呈现动量特性[21][24] 高分位反转因子(M_high_13/16) - **信息比率(IR)**:2.00[31] - **月度胜率**:72.0%[31] - **IC**:-0.070[31] - **rankIC**:-0.087[31]
量化资产配置专题报告
爱建证券· 2019-08-27 07:07
量化因子与构建方式 1. **BL因子** - **因子构建思路**:BL模型结合了投资者对资产的预期回报和市场均衡回报,从而形成一个新的预期回报向量[7][14] - **因子的公式**: $$ \mu_{\mathrm{bl}}=[\mathrm{P^{\prime}\Omega^{-1}P+(\tau\Sigma)^{-1}]^{-1}[P^{\prime}\Omega^{-1}Q+(\tau\Sigma)^{-1}\Pi]} $$ $$ \Sigma_{\mathrm{bl}}=\Sigma+[(\tau\Sigma)^{-1}+(\mathrm{P}^{\prime}\Omega^{-1}\mathrm{P})]^{-1} $$ 公式中,$\mu_{\mathrm{bl}}$是资产预期回报,$\Sigma_{\mathrm{bl}}$是资产的协方差矩阵,$P$是观点矩阵,$Q$是观点向量,$\Omega$是观点不确定性矩阵,$\tau$是先验分布的信心常数,$\Sigma$是资产历史回报的协方差矩阵,$\Pi$是隐含均衡回报向量[19][20][23] - **文章对因子的评价**:结合了回归树的BL模型在资产配置上存在一定的价值[51] 2. **回归树因子** - **因子构建思路**:回归树是机器学习中的一种监督学习回归算法,适用于应对变量间相关性较高的宏观经济变量[2][24] - **因子的公式**:无具体公式,回归树通过一系列不等式分支来减小均方误差,最终呈现出类似树的形状[31][33] - **文章对因子的评价**:回归树视角下的宏观经济变量与大类资产回报之间的关系为主观预期提供了一定的参考价值[2][49] 因子的具体指标值 1. **BL因子** - **信息比率(IR)**:无具体值 - **夏普比率**:无具体值 - **最大回撤**:13.71%[47] - **累计收益**:74%[47] 2. **回归树因子** - **信息比率(IR)**:无具体值 - **夏普比率**:无具体值 - **最大回撤**:无具体值 - **累计收益**:无具体值
结合回归树的 BL 资产配置模型的实践运用
爱建证券· 2019-08-27 00:00
量化模型与构建方式 1. 模型名称:Black-Litterman模型(BL模型) - **模型构建思路**:BL模型结合了投资者的主观观点和市场均衡回报,形成新的预期回报向量,能够在一定程度上减少对历史数据的依赖[6][7][9] - **模型具体构建过程**: 1. **核心参数**: - 风险厌恶系数($\lambda$):衡量投资者对风险的态度,公式为 $\lambda = \frac{\mu_B}{\sigma_B \sqrt{W_{mkt}' \Sigma W_{mkt}}}$,其中$\mu_B$和$\sigma_B$分别为基准指数的均值回报和标准差,$\Sigma$为样本的协方差矩阵[23] - 市场均衡回报向量($\Pi$):公式为 $\Pi = \lambda \Sigma W_{mkt}$,$W_{mkt}$为市值权重[23] - 观点矩阵($P$)、观点值($Q$)和观点不确定性($\Omega$):用于表达投资者的主观观点及其不确定性[20][21] - 先验分布信心常数($\tau$):通常取值在0.01到0.05之间,或根据样本大小计算$\tau = 1/Obs$[22] 2. **贝叶斯法则**:结合市场均衡回报和主观观点,形成新的回报分布,公式为: $$ \mu_{bl} = [P' \Omega^{-1} P + (\tau \Sigma)^{-1}]^{-1} [P' \Omega^{-1} Q + (\tau \Sigma)^{-1} \Pi] $$ $$ \Sigma_{bl} = \Sigma + [( \tau \Sigma)^{-1} + (P' \Omega^{-1} P)]^{-1} $$[15][19][47] 3. **优化权重**:基于新的回报分布,优化资产权重,约束条件为权重和为1且非负[47] - **模型评价**:BL模型的优点是可以灵活地加入主观观点,减少对历史数据的依赖,但主观观点的准确性对结果影响较大[7][51] 2. 模型名称:结合回归树的BL模型 - **模型构建思路**:通过回归树模型估计宏观经济变量与大类资产回报之间的关系,生成BL模型的主观观点($Q$)和观点不确定性($\Omega$)[2][35] - **模型具体构建过程**: 1. **回归树模型**: - 回归树是一种监督学习算法,适用于处理变量间相关性较高的情况,计算过程快速[2][24] - 通过分支条件(如减小均方误差)生成叶子节点,最终输出预测值[31][33] 2. **主观观点的生成**: - 自变量为10个宏观经济指标(如GDP、工业增加值、固定资产投资等),因变量为四类资产的回报(权益、固收、货币、商品)[36][38] - 使用回归树模型训练样本内数据,预测样本外资产回报,生成$Q$[44] 3. **观点不确定性的生成**: - 使用线性回归的标准化残差的方差作为$\Omega$[44] 4. **结合BL模型**:将回归树生成的$Q$和$\Omega$输入BL模型,完成资产配置[44][47] - **模型评价**:结合回归树的BL模型在资产配置中表现较好,能够为主观观点提供科学的定量支持[2][49] --- 模型的回测效果 1. BL模型 - **区间回报**:约49%(基准为中证时钟配置策略指数)[47] - **最大回撤**:约7.88%[47] 2. 结合回归树的BL模型 - **区间回报**:约74%(同期沪深300为29%,中证时钟配置策略指数为49%)[47] - **最大回撤**:约13.71%(同期沪深300为40.56%,中证时钟配置策略指数为7.88%)[47]
高频数据因子研究系列二:基于日内高频数据的短周期选股因子研究
广发证券· 2019-08-15 00:00
量化模型与构建方式 1. **模型名称**:回归模型 **模型构建思路**:基于个股日内高频数据,构建已实现波动(RVol)、已实现偏度(RSkew)、已实现峰度(RKurt)因子指标,并通过回归模型分析残差标准差对个股收益率的区分度[5] **模型具体构建过程**: - 首先计算个股在交易日t的分钟级别收益率: $$r_{t,i} = \ln(P_{t,i}) - \ln(P_{t,i-1})$$ 其中,\(P_{t,i}\)表示交易日t第i分钟的对数价格[32] - 计算已实现方差(Realized Variance): $$RDVar_t = \sum_{i=1}^{N} r_{t,i}^2$$ - 计算已实现波动率(Realized Volatility): $$RDVol_t = \sqrt{RDVar_t}$$ - 计算已实现偏度(Realized Skewness)和已实现峰度(Realized Kurtosis): $$RDSkew_t = \frac{\sum_{i=1}^{N} r_{t,i}^3}{(RDVar_t)^{3/2}}$$ $$RDKurt_t = \frac{\sum_{i=1}^{N} r_{t,i}^4}{(RDVar_t)^2}$$ - 计算每日变化量: $$\Delta Vol_t = RDVol_t - RDVol_{t-1}$$ $$\Delta Skew_t = RDSkew_t - RDSkew_{t-1}$$ $$\Delta Kurt_t = RDKurt_t - RDKurt_{t-1}$$ - 将以上变量代入回归模型: $$r_{t,i} = \alpha + \beta_1 RDVol_t + \beta_2 \Delta Vol_t + \beta_3 \Delta Skew_t + \beta_4 \Delta Kurt_t + \epsilon_{t,i}$$ - 取回归模型的残差标准差作为因子指标,分析其对个股收益率的区分度[34] 量化因子与构建方式 1. **因子名称**:已实现波动率(RVol) **因子构建思路**:通过个股日内高频数据计算已实现波动率,衡量个股的波动性[5] **因子具体构建过程**: - 计算个股在交易日t的分钟级别收益率: $$r_{t,i} = \ln(P_{t,i}) - \ln(P_{t,i-1})$$ - 计算已实现方差: $$RDVar_t = \sum_{i=1}^{N} r_{t,i}^2$$ - 计算已实现波动率: $$RDVol_t = \sqrt{RDVar_t}$$[31] 2. **因子名称**:已实现偏度(RSkew) **因子构建思路**:通过个股日内高频数据计算已实现偏度,衡量个股收益率的偏态分布[5] **因子具体构建过程**: - 计算已实现偏度: $$RDSkew_t = \frac{\sum_{i=1}^{N} r_{t,i}^3}{(RDVar_t)^{3/2}}$$[33] 3. **因子名称**:已实现峰度(RKurt) **因子构建思路**:通过个股日内高频数据计算已实现峰度,衡量个股收益率的峰态分布[5] **因子具体构建过程**: - 计算已实现峰度: $$RDKurt_t = \frac{\sum_{i=1}^{N} r_{t,i}^4}{(RDVar_t)^2}$$[33] 模型的回测效果 1. **回归模型**: - 全市场选股: - IC均值:-0.036 - 负IC占比:63.5% - 多头组合年化收益率:32.39% - 信息比率(IR):0.91 - 相对中证800年化超额收益率:24.52% - 信息比率(IR):1.89[6] - 中证500选股: - IC均值:-0.048 - 负IC占比:66.2% - 多头组合年化收益率:30.32% - 相对空头组合年化超额收益率:30.73% - 信息比率(IR):2.76[6] 因子的回测效果 1. **已实现波动率(RVol)**: - 全市场选股: - IC均值:-0.036 - 负IC占比:63.5%[6] - 中证500选股: - IC均值:-0.048 - 负IC占比:66.2%[6] 2. **已实现偏度(RSkew)**: - 全市场选股: - IC均值:-0.036 - 负IC占比:63.5%[6] - 中证500选股: - IC均值:-0.048 - 负IC占比:66.2%[6] 3. **已实现峰度(RKurt)**: - 全市场选股: - IC均值:-0.036 - 负IC占比:63.5%[6] - 中证500选股: - IC均值:-0.048 - 负IC占比:66.2%[6]
深度学习研究报告之六:深度学习在指数增强策略上的应用
广发证券· 2019-04-03 00:00
量化模型与构建方式 深度学习选股模型 - **模型名称**:深度学习选股模型 - **模型构建思路**:通过深层神经网络,建立股票因子和未来收益率之间的关系,根据对个股收益率的预测进行选股[18] - **模型具体构建过程**: - 输入层X包含156个特征,包括传统选股因子、价量技术指标和行业属性变量[18] - 模型采用7层深层神经网络,包括输入层X、输出层Y和5个隐含层H1、H2、H3、H4、H5[19] - 输出层Y有3个节点,表示股票未来走势的三种可能性:上涨、平盘、下跌[21] - 使用softmax激活函数,预测值为$\hat{\mathbf{y}}=[\hat{\mathcal{V}}_{1}\quad\hat{\mathcal{V}}_{2}\quad\hat{\mathcal{V}}_{3}]^{T}=\left[{\frac{e^{z_{1}}}{\sum_{i=1,2,3}e^{z_{i}}}}\quad{\frac{e^{z_{2}}}{\sum_{i=1,2,3}e^{z_{i}}}}\quad{\frac{e^{z_{3}}}{\sum_{i=1,2,3}e^{z_{i}}}}\right]^{T}$[21] - 损失函数采用交叉熵,优化目标为$E(w)=-\sum_{n=1}^{N}\sum_{k=1}^{K}[y_{n k}\log{\hat{y}}_{n k}+(1-y_{n k})\log(1-{\hat{y}}_{n k})]$[21] - 采用Dropout和Batch Normalization技术提高模型的泛化能力和训练效率[23] - 模型回测期为2011年1月至2019年2月,每半年更新一次,训练采用最近6年的市场数据[24] - **模型评价**:深度学习选股模型能够从因子的非线性特征中获取额外信息,具有较好的应用前景[15] 组合优化模型 - **模型名称**:组合优化模型 - **模型构建思路**:在满足行业中性和风格中性约束,以及控制组合年化跟踪误差的约束条件下,以最大化组合收益率为目标函数,对组合权重进行优化[29] - **模型具体构建过程**: - 结构化多因子风险模型将股票收益率分解为因子暴露、因子收益率和特质因子收益率三个部分,公式为$r_{i}=f_{m}+\sum_{k=1}^{I}x_{i k}^{I}f_{k}^{I}+\sum_{k=1}^{S}x_{i k}^{s}f_{k}^{s}+u_{i}$[25] - 股票收益率的协方差矩阵为$V=X F X^{T}+\Delta$[26] - 组合优化问题的目标函数为$\operatorname*{max}_{w}\,R_{p}(w)-T C(w,w_{0})$,约束条件包括控制跟踪误差、行业中性、风格中性、不允许做空和满仓运行[29][30][32] - 组合的预期收益率$R_{p}(w)=f_{D L}w^{\mathrm{T}}t$,交易成本$T C(w,w_{0})=t c\times{\frac{1}{2}}\|w-w_{0}\|_{1}$[30][31] 模型的回测效果 - **中证1000指数增强策略** - 年化超额收益:成份股内选股27.56%,全市场选股29.07%[50][84] - 超额收益最大回撤:成份股内选股-4.84%,全市场选股-5.09%[50][84] - 年换手率:成份股内选股15.07倍,全市场选股15.66倍[55][84] - 年化跟踪误差:成份股内选股6.11%,全市场选股6.42%[55][84] - 信息比:成份股内选股3.93,全市场选股3.77[55][84] - **中证500指数增强策略** - 年化超额收益:成份股内选股15.25%,全市场选股14.67%[62][84] - 超额收益最大回撤:成份股内选股-4.55%,全市场选股-4.55%[62][84] - 年换手率:成份股内选股14.36倍,全市场选股15.22倍[67][84] - 年化跟踪误差:成份股内选股5.30%,全市场选股5.79%[67][84] - 信息比:成份股内选股2.78,全市场选股2.74[67][84] - **沪深300指数增强策略** - 年化超额收益:成份股内选股7.26%,全市场选股13.11%[74][84] - 超额收益最大回撤:成份股内选股-4.36%,全市场选股-8.20%[74][84] - 年换手率:成份股内选股7.99倍,全市场选股8.71倍[79][84] - 年化跟踪误差:成份股内选股4.42%,全市场选股5.59%[79][84] - 信息比:成份股内选股1.74,全市场选股1.53[79][84] 量化因子与构建方式 深度学习因子 - **因子名称**:深度学习因子 - **因子的构建思路**:通过深层神经网络预测股票未来收益率,生成股票的上涨打分作为因子[23] - **因子具体构建过程**: - 使用深层神经网络模型,输入层包含156个特征,输出层有3个节点,表示股票未来走势的三种可能性[18][19][21] - 采用softmax激活函数,预测值为$\hat{\mathbf{y}}=[\hat{\mathcal{V}}_{1}\quad\hat{\mathcal{V}}_{2}\quad{\hat{\mathcal{V}}}_{3}]^{T}$[21] - 损失函数采用交叉熵,优化目标为$E(w)=-\sum_{n=1}^{N}\sum_{k=1}^{K}[y_{n k}\log{\hat{y}}_{n k}+(1-y_{n k})\log(1-{\hat{y}}_{n k})]$[21] - 采用Dropout和Batch Normalization技术提高模型的泛化能力和训练效率[23] - 模型回测期为2011年1月至2019年2月,每半年更新一次,训练采用最近6年的市场数据[24] - **因子评价**:深度学习因子能够从因子的非线性特征中获取额外信息,具有较好的应用前景[15] 因子的回测效果 - **中证1000指数增强策略** - IC均值:0.095[46] - IC_IR:0.795[46] - **中证500指数增强策略** - IC均值:0.069[58] - IC_IR:0.691[58] - **沪深300指数增强策略** - IC均值:0.039[70] - IC_IR:0.287[70]
20190220-国盛证券-量化专题报告:多因子系列之二:Alpha因子高维度与非线性问题——基于Lasso的收益预测模型
国盛证券· 2019-02-20 00:00
量化模型与构建方式 1. Lasso 模型 - **模型构建思路**:Lasso 模型通过在回归中加入 L1 正则项,解决高维度下因子筛选和收益预测的问题[2] - **模型具体构建过程**: 1. 线性回归模型:$ \text{min} \frac{\|Y-X\beta\|_{2}^{2}}{n} + \lambda \|\beta\|_{1} $[23] 2. 训练样本长度 M 个月,调节参数通过训练数据得到[24] 3. 每个月月底,将前 M 个月的数据作为训练样本,求解 Lasso 的参数,预测股票下个月的收益[25] - **模型评价**:Lasso 模型相比传统模型具有更好的收益预测能力,但在因子筛选方面效果一般[2][27] 2. Adaptive Lasso 模型 - **模型构建思路**:在 Lasso 模型基础上改进,赋予不同因子权重不同的惩罚项,解决 Lasso 模型一致性条件过于严格的问题[2][28] - **模型具体构建过程**: 1. 首先进行 Lasso 回归,得到每个变量的系数 2. 将变量的系数作为权重,进行第二次回归:$ \text{min} \frac{\|Y-X\beta\|_{2}^{2}}{n} + \lambda \sum_{j=1}^{p} \frac{|\beta_{j}|}{|\beta_{\text{int},j}|} $[29] - **模型评价**:Adaptive Lasso 在因子筛选和收益预测方面均优于 Lasso 模型[28][32] 3. Group Lasso 模型 - **模型构建思路**:考虑因子和收益的非线性关系,通过二次样条函数拟合因子和收益的非线性关系,并用 Group Lasso 方法进行估计[3][50] - **模型具体构建过程**: 1. 定义股票的期望收益:$ m_{t}(f_{1},\dots,f_{s}) = E[R_{it}|F_{1,it-1}=f_{1},\dots,F_{S,it-1}=f_{S}] $[53] 2. 用二次样条函数拟合因子和收益的非线性关系:$ m_{ts}(f) \approx \sum_{k=1}^{L+2} \beta_{tsk} p_{k}(f) $[57] 3. 用 Group Lasso 方法进行估计:$ \text{min} \sum_{i=1}^{N} \left( R_{it} - \sum_{s=1}^{S} \sum_{k=1}^{L+2} \beta_{sk} p_{k}(f_{s,it-1}) \right)^{2} + \lambda \sum_{s=1}^{S} \left( \sum_{k=1}^{L+2} \beta_{sk}^{2} \right)^{\frac{1}{2}} $[61] - **模型评价**:Group Lasso 方法在捕捉因子和收益的非线性关系方面表现优秀,预测能力优于线性模型[50][69] 模型的回测效果 Lasso 模型 - **第一组年化收益**:0.143 - 0.161[26] - **第一组年化波动**:0.044 - 0.050[26] - **信息比率**:2.853 - 3.296[26] - **IC**:0.088 - 0.096[26] - **ICIR**:4.523 - 5.412[26] - **因子个数**:18.656 - 53.215[26] - **MSE**:0.12566 - 0.12617[26] Adaptive Lasso 模型 - **第一组年化收益**:0.147 - 0.162[31] - **第一组年化波动**:0.045 - 0.051[31] - **信息比率**:2.891 - 3.285[31] - **IC**:0.089 - 0.097[31] - **ICIR**:4.894 - 5.409[31] - **因子个数**:18.516 - 37.849[31] - **MSE**:0.12568 - 0.12619[31] Group Lasso 模型 - **第一组年化收益**:0.149 - 0.190[63][67] - **第一组年化波动**:0.039 - 0.066[63][67] - **信息比率**:2.420 - 3.630[63][67] - **IC**:0.087 - 0.094[63][67] - **ICIR**:3.942 - 5.004[63][67] - **MSE**:0.125568 - 0.126164[63][67]
多因子ALPHA系列报告之(三十八):从个股分化看风格轮动
广发证券· 2019-01-08 00:00
量化模型与构建方式 1. **模型名称**:基于分化度的动态风格轮动策略 **模型构建思路**:通过个股分化度指标MADI来判断市场风格,当分化度低于特定阈值时,采用风格趋势策略,反之则采用风格反转策略[2] **模型具体构建过程**:首先计算个股分化度MADI,公式为: $$MADI_{t}=DI_{t}\times{\frac{Vol_{t}}{M}}\sum Vol_{t}$$ 其中,DI为个股横截面月收益率标准差,Vol为个股成交量,M为近12期成交量。当MADI低于阈值F时,采用风格趋势策略,否则采用风格反转策略[23][33] **模型评价**:该策略能够根据市场分化度动态调整风格,显著提升了策略的年化超额收益率[3] 模型的回测效果 1. **基于分化度的动态风格轮动策略**,年化超额收益率为17.6%,年化波动率为9.2%,信息比率(IR)为1.92,最大回撤为7.5%,月换手率为49.5%[40][43] 2. **静态因子策略**,年化超额收益率为13.2%,年化波动率为8.0%,信息比率(IR)为1.65,最大回撤为6.4%,月换手率为47.0%[40] 3. **风格趋势策略**,年化超额收益率为15.6%,年化波动率为8.5%,信息比率(IR)为1.83,最大回撤为7.5%,月换手率为45.5%[40] 4. **风格反转策略**,年化超额收益率为14.6%,年化波动率为9.5%,信息比率(IR)为1.54,最大回撤为17.9%,月换手率为50.8%[40] 量化因子与构建方式 1. **因子名称**:成交量调整分化度指标(VADI) **因子构建思路**:通过剔除股票池涨跌幅首尾各10%的个股,并在剩余80%的个股中计算分化度,再乘以相对成交量进行调整[23] **因子具体构建过程**:首先计算个股分化度DI,公式为: $$DI_{t}=\sqrt{\frac{1}{N-1}\sum(r_{it}-{\bar{r}}_{it})^{2}}$$ 然后计算VADI,公式为: $$VADI_{t}=DI_{t}\times{\frac{Vol_{t}}{M}}\sum Vol_{t}$$ 其中,Vol为个股成交量,M为近12期成交量[23] **因子评价**:VADI能够更准确地反映市场分化度,尤其是在极端市场环境下[23] 因子的回测效果 1. **VADI因子**,在中证800成分股中的平均值为6.7%[25] 2. **DI因子**,在中证800成分股中的平均值为9.7%[25] 最新风格配置结果 1. **中证800策略**,最新风格配置权重为:股息率17%,市现率17%,换手率17%,EPS增长率17%,ROE 4.3%,1个月成交金额2.1%,流通市值0%,DP 17%,CFP 17%,EP 8.5%,SP 8.5%,BP 8.5%[76] 2. **中证500策略**,最新风格配置权重为:ROE 5.4%,1个月成交金额21.6%,换手率5.4%,一个月股价反转10.8%,三个月股价反转0%,流通市值2.7%,DP 21.6%,CFP 10.8%,EP 5.4%,SP 10.8%,BP 5.4%[79] 3. **沪深300策略**,最新风格配置权重为:ROE 3.8%,1个月成交金额3.8%,换手率30.8%,一个月股价反转3.8%,容量比3.8%,流通市值0%,营业费用比例0%,固定比7.7%,EP 15.4%,BP 30.8%[83]
20181228-渤海证券-渤海证券多因子模型研究系列之六:使用thompson sampling算法的策略混合模型
渤海证券· 2018-12-28 00:00
量化模型与构建方式 分层抽样多因子模型 - **模型名称**: 分层抽样多因子模型 - **模型构建思路**: 针对沪深300和中证500成分股,以月度调仓频率构建投资组合,剔除行业影响,单独检测市值因子在历史不同时间段的表现[14][15] - **模型具体构建过程**: 1. 选取估值、盈利、成长、动量、反转、波动率、流动性、市值八大类因子构建多因子模型,经过缺失值处理、去极值、标准化、中性化等前期准备步骤,采用半衰期加权移动平均方法构建收益预测模型[14] 2. 将基准指数按行业划分为31个子集,每个子集中用市值因子将股票划分为数目相等的两组:大市值组与小市值组[15] 3. 在每个组中各自选取预期收益最高的两只股票,令其均分所在行业在基准指数中的权重,从而剔除行业影响[15] - **模型评价**: 能否适应因子的风格变化,主要看其能否在市场风格转变时迅速调整[16] Thompson Sampling 算法 - **模型名称**: Thompson Sampling 算法 - **模型构建思路**: 将多臂赌博机每一个臂的回报概率看作一个Beta分布,通过不断测试调整Beta分布的参数α和β的值,确定最后的权重[27][29] - **模型具体构建过程**: 1. Beta分布的概率密度函数形式如下: $$ f(x;\alpha,\beta)=\mathrm{constant}\cdot x^{\alpha-1}(1-x)^{\beta-1} $$ 其中,α表示实验成功次数,β表示实验失败次数,α/(α+β)为Beta分布的均值[28] 2. 在离散空间中,每次试验中选中一个臂,有收益则该臂的Beta分布的参数α增加1,否则β增加1[29] 3. 扩展到连续空间后,计算之前M期历史收益情况,当大市值组合收益>小市值组合收益时,α值增加1;反之,β值增加1[29] 4. 大市值组合的权重设为α/(α+β),小市值组合的权重设为β/(α+β),得到两个组合混合的最优比例[29] - **模型评价**: 在自我调整的及时性上有更大的优势,表现出较好的适应性[29] Greedy Algorithm - **模型名称**: Greedy Algorithm - **模型构建思路**: 计算每一个臂的回报,选择回报最大的臂进行操作[23] - **模型具体构建过程**: 1. 设置M(M=24)期历史数据为观测窗口,计算两种组合的历史收益[23] 2. 在下一期选择收益高的一组[23] - **模型评价**: 没有完全探索其它奖励概率的可能性,很容易丢掉最优解[23] Epsilon-Greedy Algorithm - **模型名称**: Epsilon-Greedy Algorithm - **模型构建思路**: 在贪心算法的基础上引入探索机制,通过随机数生成来决定是否探索[24] - **模型具体构建过程**: 1. 选定一个较小的常数ε,每次生成一个0到1之间的随机数[24] 2. 如果随机数落在[0,ε]区间内,则随机选择一个臂;如果落在[ε,1]区间内,则选择当前情况下回报率最大的臂[24] 3. 扩展到连续空间后,赋予预期回报率较大组合1-ε的权重,赋予另外一组投资组合ε的权重[24] - **模型评价**: 保持了一定对于探索的开放性,但不能根据试验结果进行自我调整,影响最终整体收益[24] --- 模型的回测效果 沪深300回测结果 - **Thompson Sampling**: 年化收益7.02%,信息比率1.41,胜率66.67%[31][34] - **Epsilon-Greedy Algorithm**: 年化收益5.93%,信息比率1.25,胜率61.90%[34] - **Greedy Algorithm**: 年化收益3.05%,信息比率0.25,胜率55.24%[34] - **定期调整资产比例组(CRP)**: 年化收益6.47%,信息比率1.39,胜率60.95%[34] - **买入持有组(BAH)**: 年化收益6.71%,信息比率1.37,胜率60.00%[34] 中证500回测结果 - **Thompson Sampling**: 年化收益12.43%,信息比率2.24,胜率75.24%[40][44] - **Epsilon-Greedy Algorithm**: 年化收益9.04%,信息比率1.45,胜率66.67%[44] - **Greedy Algorithm**: 年化收益10.72%,信息比率2.00,胜率73.33%[44] - **定期调整资产比例组(CRP)**: 年化收益11.71%,信息比率2.19,胜率74.29%[44] - **买入持有组(BAH)**: 年化收益11.82%,信息比率2.23,胜率79.05%[44] 股债混合模型回测结果 - **Thompson Sampling**: 年化收益15.73%,信息比率3.0044,胜率53.24%[49][51] - **Epsilon-Greedy Algorithm**: 年化收益8.46%,信息比率0.5649,胜率51.90%[51] - **Greedy Algorithm**: 年化收益12.84%,信息比率0.5289,胜率51.90%[51] - **定期调整资产比例组(CRP)**: 年化收益5.76%,信息比率0.0825,胜率47.41%[51]
20180926-渤海证券-渤海证券多因子模型研究系列之五:使用Bandit Learning算法的多因子模型
渤海证券· 2018-09-26 00:00
量化模型与构建方式 1. 模型名称:Bandit Learning 模型 - **模型构建思路**:Bandit Learning 模型是一种在线学习算法,旨在通过实时反馈平衡守成(exploitation)与探索(exploration)的比例,以最大化总体收益[4][10][12] - **模型具体构建过程**: 1. 定义资产收益率 $R_{k}=(R_{k,1},\cdots R_{k,n})^{T},k=1,\cdots,m$,并在每个时刻 $k$ 求解权重 $W_{k}=(W_{k,1},\cdots,W_{k,n})^{\rm T}$,满足 $\sum_{i=1}^{n}w_{k,i}=1$ 和 $w_{k,i}\geq0$[13][14] 2. 使用传统多因子模型估计资产收益率和协方差矩阵 $\Sigma_{k}$,并对协方差矩阵进行主成分分解,得到特征值和特征向量[14][16] 3. 对特征向量进行归一化处理,得到线性不相关的投资组合权重 $\widetilde{H}_{k}$,并计算新的协方差矩阵 $\tilde{\Sigma}_{k}$[16][17] 4. 使用 UCB(Upper Confidence Bound)算法计算每个特征向量的奖赏函数 $\bar{r}_{i}(t_{k})=\frac{\bar{H}_{k,i}R_{k,i}}{\sqrt{\hat{A}_{k,i}}}$,并选择最优臂 $i_{k}^{*}$ 和 $j_{k}^{*}$[19][21][23] 5. 通过优化权重 $\theta_{k}^{*}=\frac{\tilde{\lambda}_{k,i_{k}^{*}}}{\tilde{\lambda}_{k,i_{k}^{*}}+\tilde{\lambda}_{k,j_{k}^{*}}}$,构建最终投资组合权重 $w_{k}=(1-\theta_{k}^{*})\bar{H}_{k,i_{k}^{*}}+\theta_{k}^{*}\bar{H}_{k,j_{k}^{*}}$[24][25] 6. 对权重进行非负约束调整,最终输出最优权重 $w_{new,k}$[26][27] - **模型评价**:Bandit Learning 模型在震荡市中表现优于传统多因子模型,但在趋势性市场中表现稍逊。其选股风格较为跳跃,适应性较强,但收益来源和延续能力存在不确定性[4][42][50] 2. 模型名称:传统多因子模型 - **模型构建思路**:基于 Markowitz 风险收益模型,通过线性模型预测收益,结合 Barra 模型估计协方差矩阵,优化投资组合[9][31] - **模型具体构建过程**: 1. 选取估值、盈利、成长、动量、反转、波动率、流动性、市值八大类因子,经过缺失值处理、去极值、标准化和中性化等步骤,构建收益预测模型[31][33] 2. 使用 Barra 模型估计协方差矩阵 $\Sigma=X_{f}F X_{f}{}^{\prime}+\Delta$,其中 $X_{f}$ 为因子暴露矩阵,$F$ 为因子收益率协方差矩阵,$\Delta$ 为个股残差波动率对角矩阵[33][34] 3. 结合收益预测和风险预测,求解优化问题 $\max \alpha^{\prime}w-\frac{1}{2}\lambda w^{\prime}\Sigma w$,其中 $\alpha$ 为收益预测,$\Sigma$ 为协方差矩阵,$\lambda$ 为风险厌恶系数[35][36] - **模型评价**:传统多因子模型在趋势性市场中表现优异,但在震荡市和市场剧变时回撤较大,适应性较弱[4][42][50] --- 模型的回测效果 Bandit Learning 模型 - **累计收益**:$l=3$为143.73%,$l=4$为175.09%,$l=5$为95.01%[43] - **年化收益**:$l=3$为17.82%,$l=4$为20.48%,$l=5$为13.08%[43] - **波动率**:$l=3$为30.69%,$l=4$为30.23%,$l=5$为30.07%[43] - **最大回撤**:均为57.03%[43] - **夏普比率**:$l=3$为0.578,$l=4$为0.6742,$l=5$为0.4331[43] - **胜率**:$l=3$为53.03%,$l=4$为52.81%,$l=5$为52.67%[43] 传统多因子模型 - **累计收益**:180.34%[43] - **年化收益**:20.89%[43] - **波动率**:25.71%[43] - **最大回撤**:35.59%[43] - **夏普比率**:0.8088[43] - **胜率**:53.76%[43] --- 量化因子与构建方式 1. 因子名称:估值因子 - **因子的构建思路**:衡量股票的估值水平[33] - **因子具体构建过程**:选取 BP 和扣非 EP_ttm 作为估值因子[33] 2. 因子名称:盈利因子 - **因子的构建思路**:衡量公司盈利能力[33] - **因子具体构建过程**:选取单季度 ROE 作为盈利因子[33] 3. 因子名称:成长因子 - **因子的构建思路**:衡量公司成长性[33] - **因子具体构建过程**:选取单季度营业收入增长率和单季度归母净利润增长率[33] 4. 因子名称:动量因子 - **因子的构建思路**:衡量股票的动量效应[33] - **因子具体构建过程**:选取指数加权一年收益率和上月收益率[33] 5. 因子名称:反转因子 - **因子的构建思路**:衡量股票的反转效应[33] - **因子具体构建过程**:选取上月收益率[33] 6. 因子名称:波动率因子 - **因子的构建思路**:衡量股票的波动性[33] - **因子具体构建过程**:选取月度、季度和年度波动率[33] 7. 因子名称:流动性因子 - **因子的构建思路**:衡量股票的流动性[33] - **因子具体构建过程**:选取月度、季度和年度换手率[33] 8. 因子名称:市值因子 - **因子的构建思路**:衡量股票的市值规模[33] - **因子具体构建过程**:选取流通市值对数[33] --- 因子的回测效果 Bandit Learning 模型因子 - **因子均值**:市值-0.197,盈利-0.050,反转-0.002,动量-0.004,成长0.226,流动性0.043,波动率0.167,估值-0.138[49] - **因子波动**:市值0.413,盈利0.521,反转0.490,动量0.446,成长1.114,流动性0.457,波动率0.378,估值0.297[49] - **因子收益**:市值0.007,盈利-0.005,反转-0.027,动量0.019,成长0.063,流动性-0.018,波动率-0.069,估值-0.094[49] 传统多因子模型因子 - **因子均值**:市值-0.174,盈利0.221,反转0.002,动量0.141,成长0.700,流动性-0.218,波动率-0.131,估值0.245[49] - **因子波动**:市值0.534,盈利0.425,反转0.368,动