量化因子与构建方式 深度学习高频因子 特征构建 - 构建思路:使用"原始数据-分钟级基础指标-目标频率衍生指标"的方式生成高频特征[5][17] - 具体构建过程: - 基于原始数据生成分钟级基础指标,如主买、主卖金额序列[17] - 通过变换输入的基础指标序列生成特征,使用固定算子变换输入的方式[17] - 生成的特征包括下行大买单金额占比、下行小买单单均金额占比等[18] - 最终生成176个30分钟级别的特征集合[18] 特征处理 - 构建思路:对特征进行分布调整、极值处理和标准化[5][23] - 具体构建过程: - 分布调整:对偏度较大的特征进行调整,如取自然对数[24][26] - 极值处理:采用N倍标准差截断法处理极值[29] - 标准化:对特征进行单一截面标准化和跨截面标准化[35] 特征归因 - 构建思路:使用积分梯度法进行特征归因[5][46] - 具体构建过程: - 设定基线模型与模型输入间的路径,对梯度进行积分[44] - 计算每个特征的绝对贡献度,比较其对预测结果的重要性[47] 特征筛选 - 构建思路:基于特征归因结果进行特征筛选[5][53] - 具体构建过程: - 静态精选:根据全区间平均贡献度筛选出64个特征[53] - 动态精选:每次预测时,先使用176特征集合训练模型,再根据积分梯度法筛选出贡献度最高的特征[57] 因子的评价 - 评价:特征处理和筛选可以有效剔除冗余信息,提升模型表现[28][55][58] 因子的回测效果 176特征集合 - 周均IC:0.072[20] - 年化ICIR:8.884[20] - 周度胜率:90%[20] - 年化多头超额收益:28.5%[20] - 年化空头超额收益:-38.8%[20] - 年化多空收益:67.3%[20] 176特征集合(偏度调整) - 周均IC:0.073[27] - 年化ICIR:9.158[27] - 周度胜率:90%[27] - 年化多头超额收益:31.1%[27] - 年化空头超额收益:-38.6%[27] - 年化多空收益:69.7%[27] 176特征集合(偏度调整&去极值) - 周均IC:0.073[30] - 年化ICIR:9.265[30] - 周度胜率:91%[30] - 年化多头超额收益:31.4%[30] - 年化空头超额收益:-38.7%[30] - 年化多空收益:70.1%[30] 静态64特征集合 - 周均IC:0.075[54] - 年化ICIR:8.708[54] - 周度胜率:90%[54] - 年化多头超额收益:32.6%[54] - 年化空头超额收益:-39.1%[54] - 年化多空收益:71.7%[54] 动态64特征集合 - 周均IC:0.074[58] - 年化ICIR:8.764[58] - 周度胜率:91%[58] - 年化多头超额收益:33.4%[58] - 年化空头超额收益:-38.0%[58] - 年化多空收益:71.4%[58]
20230130_海通证券_金融工程专题_冯佳睿_选股因子系列研究(八十六)——深度学习高频因子的特征工程(1)
海通证券·2023-01-30 00:00