Workflow
Logit回归
icon
搜索文档
宏观视角下的港股择时模型
长江证券· 2026-02-28 21:03
量化模型与构建方式 1. **模型名称:宏观视角下的港股择时模型** [3][6][8] * **模型构建思路**:以宏观预期指标为主,辅以其他常见宏观指标和港股市场特异性指标,构建一个对恒生指数R未来一个月涨跌进行预测的二分类(买入/空仓)择时模型[3][16]。 * **模型具体构建过程**: 1. **宏观变量选取与处理**:从宏观经济、货币与流动性、通胀与价格水平、资金与情绪四个维度选取一系列原始连续宏观变量[34][35][37]。将连续变量通过多种方法改造成二元(0/1)状态变量,以作为Logit回归的自变量[39]。主要改造方法包括: * **门限项**:采用“二八分位数”法(超过过去12期80%分位数为1,低于20%分位数为0)或“中位值”法(大于过去6期中位数为1,否则为0)[42]。 * **方向项**:数值大于0为1,否则为0[42]。 * **差分项**:计算滞后2期差分($Var_{con, t} - Var_{con, t-2}$),大于0为1,否则为0[42]。 * **平滑项**:采用HP滤波(lambda=14400)保留趋势项[42][72]。 * **波动项**:计算过去6期滚动标准差,若超过过去12期20%分位数为1,否则为0[42]。 2. **单变量筛选**:对每个宏观变量的不同细分指标项(如门限项、方向项等)分别进行Logit回归检验,评估其预测恒生指数R下月涨跌(因变量也为0/1变量)的能力[39][41]。评估指标包括样本外AUC(auc_pred)、显著性(p值)等[42]。最终筛选出预测能力较强的四个指标项[85]: * 方向项-USDHKD预期修正滞后2期(lag_2) * 门限项(二八分位数)-CPI预期修正滞后1期(lag_1) * 方向项-花旗中国经济意外指数月度均值滞后3期(lag_3) * 波动项-恒生指数期权认沽认购比状态变化变量(change) 3. **模型训练**:使用上述四个变量作为输入,采用Logit模型进行训练[8][90]。以80%的样本作为训练集,20%作为测试集[91]。 4. **信号生成**:根据训练好的模型计算因变量预测值,若预测值大于0.5则给出买入信号(1),否则给出空仓信号(0)[93]。 * **模型评价**:模型综合考虑了流动性、宏观经济、通胀和市场情绪,样本外预测能力(AUC)较为优秀,过拟合程度可控[3][8][91]。其中方向项-USDHKD预期修正最显著,表明港股涨跌预测或由流动性预期的边际变化主导[91]。 模型的回测效果 1. **宏观视角下的港股择时模型**,样本外AUC约0.70[3][91],训练集AUC约0.77[91],过拟合程度约9.15%[91]。全区间(2015年初至2026年1月底)年化超额收益约10.74%[3][95],月度胜率约81.95%[3][95],年度胜率约81.82%[95]。年化收益16.43%,最大回撤19.91%,年化波动14.31%,夏普比率1.14,信息比率(IR)0.71[96]。 量化因子与构建方式 1. **因子名称:方向项-USDHKD预期修正滞后2期 (lag_2)** * **因子构建思路**:USDHKD预期修正反映了美元兑港币汇率预期的边际变化。由于港币实行联系汇率制度,汇率预期的微小变化会带来流动性预期的改变,从而影响港股[7][46]。 * **因子具体构建过程**:使用下季度美元兑港币汇率的当月预测值减去上月预测值,得到连续变量`USDHKD预期修正`[37]。然后构建其**方向项**:若该连续变量大于0,则因子取值为1,否则为0[42]。最后,使用滞后2期的数据(lag_2)[61]。 * **因子评价**:在方向项检验中长期收益最好,系数为负(-2.41),表明当美元相较于港币的增值预期上修或贬值预期下调时(即因子为1),恒生指数R上涨概率更大,符合理论预期[63]。是最终择时模型中最显著的变量[91]。 2. **因子名称:门限项(二八分位数)-CPI预期修正滞后1期 (lag_1)** * **因子构建思路**:CPI预期修正反映了通胀预期的边际变化。通胀预期的变化会影响市场对经济状况和政策的判断[46]。 * **因子具体构建过程**:使用下季度CPI的当月预测值减去上月预测值,得到连续变量`CPI预期修正`[37]。然后构建其**门限项(二八分位数)**:计算该连续变量过去12期的80%分位数和20%分位数。若最新值超过80%分位数,则因子取值为1;若低于20%分位数,则取值为0;处于中间则状态不变[42]。最后,使用滞后1期的数据(lag_1)[45]。 * **因子评价**:系数为负(-1.42),表明当通胀预期上修速度放缓或通缩预期修正速度加快时(即指标修正幅度处于历史低位,因子为0),恒生指数R上涨概率更大[46]。但其有效性与经济状况直接关联,需结合其他指标判断[46]。 3. **因子名称:方向项-花旗中国经济意外指数月度均值滞后3期 (lag_3)** * **因子构建思路**:花旗中国经济意外指数衡量国内经济数据相对于市场预期的超预期程度,是感知经济动能转向的指标[34][35]。 * **因子具体构建过程**:先计算日频花旗中国经济意外指数的月度平均值,得到连续变量`花旗中国经济意外指数月度均值`[37]。然后构建其**方向项**:若该连续变量大于0,则因子取值为1,否则为0[42]。最后,使用滞后3期的数据(lag_3)[61]。 * **因子评价**:系数为正(1.55),表明当经济超预期时(即因子为1),恒生指数R上涨概率更大,符合理论预期[64]。预测能力较稳健[87]。 4. **因子名称:波动项-恒生指数期权认沽认购比状态变化变量 (change)** * **因子构建思路**:恒生指数期权认沽认购比是市场情绪的指标,其波动率的变化可能预示着市场风险的转变[83]。 * **因子具体构建过程**:计算恒生指数期权认沽合约成交量与认购合约成交量之比,得到连续变量`恒生指数期权认沽认购比`[37]。然后构建其**波动项**:首先计算该连续变量过去6期的滚动标准差。然后计算该标准差过去12期的20%分位数。若最新的6期标准差突破(向上或向下)该20%分位数,则因子`change`取值为1,表示状态发生变化;否则取值为0[42][83]。 * **因子评价**:系数为负(-1.71),表明当认沽认购比的波动状态发生变化时(因子为1),恒生指数R大概率下跌[83]。该因子在规避市场快速下跌风险方面表现较优,能提供其他指标之外的增量信息[83]。 5. **因子名称:门限项(中位值)-M2同比预期修正滞后2期 (lag_2)** * **因子构建思路**:M2同比预期修正反映了货币供应量增长预期的边际变化,与流动性和经济基本面相关[55]。 * **因子具体构建过程**:使用下季度M2同比的当月预测值减去上月预测值,得到连续变量`M2同比预期修正`[37]。然后构建其**门限项(中位值)**:计算该连续变量过去6期的中位数。若最新值大于该中位数,则因子取值为1,否则为0[42]。最后,使用滞后2期的数据(lag_2)[53]。 * **因子评价**:在中位值门限项检验中效果最好,系数为负(-1.20)[55]。但传导链条复杂,需谨慎解读[55]。该因子在最终模型构建的单变量检验中被筛除[88]。 6. **因子名称:平滑项-GDP同比预期修正滞后2期 (lag_2)** * **因子构建思路**:GDP同比预期修正反映了经济增长预期的边际变化,其长期趋势项可能包含持续的经济动能信息[72]。 * **因子具体构建过程**:使用下季度GDP同比的当月预测值减去上月预测值,得到连续变量`GDP同比预期修正`[37]。然后构建其**平滑项**:对该连续变量进行HP滤波(lambda=14400),保留滤波后的趋势项[42][72]。最后,使用滞后2期的数据(lag_2)[72]。 * **因子评价**:在平滑项检验中长期收益最好,系数为正(30.18)[72]。但该因子在最终模型构建的单变量检验中被筛除[88]。 因子的回测效果 (注:以下为各因子在**单变量**Logit回归检验中,以其最佳细分指标项形式呈现的预测效果,指标口径一致) 1. **方向项-USDHKD预期修正滞后2期**,样本外AUC (auc_pred) 0.75[61],准确率 (accuracy) 62.50%,精确率 (precision) 73.33%,召回率 (recall) 68.75%,回归系数 (beta) -2.41,p值 0.0006[61]。 2. **门限项(二八分位数)-CPI预期修正滞后1期**,样本外AUC (auc_pred) 0.54[45],准确率 (accuracy) 66.67%,精确率 (precision) 78.57%,召回率 (recall) 68.75%,回归系数 (beta) -1.42,p值 0.0333[45]。 3. **方向项-花旗中国经济意外指数月度均值滞后3期**,样本外AUC (auc_pred) 0.69[61],准确率 (accuracy) 70.83%,精确率 (precision) 84.62%,召回率 (recall) 68.75%,回归系数 (beta) 1.55,p值 0.0027[61]。 4. **波动项-恒生指数期权认沽认购比状态变化变量**,样本外AUC (auc_pred) 0.48[80],准确率 (accuracy) 54.17%,精确率 (precision) 63.16%,召回率 (recall) 75.00%,回归系数 (beta) -1.71,p值 0.0053[80]。 5. **门限项(中位值)-M2同比预期修正滞后2期**,样本外AUC (auc_pred) 0.57[53],准确率 (accuracy) 50.00%,精确率 (precision) 62.50%,召回率 (recall) 62.50%,回归系数 (beta) -1.20,p值 0.0090[53]。 6. **平滑项-GDP同比预期修正滞后2期**,样本外AUC (auc_pred) 0.71[72],准确率 (accuracy) 58.33%,精确率 (precision) 68.75%,召回率 (recall) 68.75%,回归系数 (beta) 30.18,p值 0.0000[72]。