量化模型与构建方式 深度学习因子挖掘模型 - 模型名称:深层全连接神经网络模型 - 模型构建思路:通过深度学习模型提取高频数据低频化后的日频因子特征,建立股票价格预测模型[6][29][83] - 模型具体构建过程: 1. 输入层包含55个高频数据低频化的日频因子,作为模型的输入特征[6][29] 2. 模型采用7层神经网络结构,包括输入层、5个隐含层和输出层[29][31] 3. 输出层包含3个节点,分别表示股票未来走势的三种可能性:上涨、平盘、下跌[32] 4. 隐含层采用线性整流函数(ReLU)作为激活函数,输出层采用softmax激活函数[32] 5. 损失函数为交叉熵损失函数,优化目标为: 其中,表示第n个样本的第k个输出类别,表示对该输出的预测值[32][34] 6. 通过误差反向传播优化参数,生成对股票收益率预测能力较强的特征因子[34] - 模型评价:深度学习模型能够自动提取特征,适合处理高维度、高噪声的高频数据,且生成的特征因子与输入因子具有相对独立性[6][29][83] --- 量化因子与构建方式 高频人工因子 - 因子类别: 1. 日内价格相关因子:从日内累积收益率、收益率高阶统计量和价格趋势强度中提取特征,如收益率方差(real_var)、收益率峰度(real_kurtosis)、日内最大回撤率(intraday_maxdrawdown)等[37][39] 2. 成交量相关因子:基于分钟成交量与价格、收益率的关系构建因子,如Amihud非流动性因子(Amihud_illiq)、分钟成交量与收益率相关性(corr_VR)等[38][40] 3. 盘前价量因子:利用隔夜收益率和集合竞价信息构建因子,如隔夜收益率(ret_overnight)、集合竞价振幅(diverge_A1)等[41][43] 4. 特定时段采样因子:针对开盘后半小时和收盘前半小时的价量信息构建因子,如开盘后半小时收益率(ret_H1)、收盘前半小时收益率(ret_H8)等[42][44] 5. 大成交量相关因子:基于大成交量对应的收益率特征构建因子,如大成交量对应的收益率方差(real_varlarge)、大成交量对应的收益率峰度(real_kurtosislarge)等[45][46] --- 模型的回测效果 深度学习特征因子 - 创业板: 1. hf18因子:多头年化收益率27.25%,超额年化收益率25.50%,信息比率1.04[6][64][68] 2. hf2因子:多头年化收益率18.24%,多空年化收益率53.21%,Rank_IC为-8.43%[57][58] 3. hf13因子:多头年化收益率15.73%,多空年化收益率14.69%,Rank_IC为7.54%[57][58] - 中证1000: 1. hf13因子:多头年化收益率11.25%,超额年化收益率7.24%,信息比率0.64[6][78][80] 2. hf17因子:多头年化收益率7.20%,多空年化收益率4.68%,Rank_IC为-1.83%[71][72] 3. hf18因子:多头年化收益率5.35%,多空年化收益率10.49%,Rank_IC为-4.90%[71][72] 高频人工因子 - 创业板: 1. Amihud_illiq因子:多头年化收益率27.91%,多空年化收益率39.72%,Rank_IC为8.92%[47][48] 2. real_kurtosis因子:多头年化收益率15.12%,多空年化收益率5.85%,Rank_IC为-3.74%[47][48] 3. ratio_realvarlarge因子:多头年化收益率14.71%,多空年化收益率16.94%,Rank_IC为-5.98%[47][48] - 中证1000: 1. real_kurtosis因子:多头年化收益率10.76%,多空年化收益率15.15%,Rank_IC为-5.06%[51][52] 2. Amihud_illiq因子:多头年化收益率10.07%,多空年化收益率22.11%,Rank_IC为6.57%[51][52] 3. ratio_realvarlarge因子:多头年化收益率8.74%,多空年化收益率17.90%,Rank_IC为-5.95%[51][52] --- 因子的回测效果 创业板 - hf18因子:年化收益率27.25%,最大回撤率31.00%,年化波动率26.67%,信息比率1.02[64][68][70] - hf2因子:年化收益率18.24%,最大回撤率39.44%,信息比率1.03[57][58] 中证1000 - hf13因子:年化收益率11.25%,最大回撤率22.10%,年化波动率20.14%,信息比率0.56[78][80][82] - hf17因子:年化收益率7.20%,最大回撤率13.30%,信息比率0.78[71][72]
多因子ALPHA系列报告之(五十一):基于深度学习的高频数据因子挖掘
广发证券·2023-08-11 00:00