“量价淘金”选股因子系列研究(十二):“高频数据+离散化构建方式”在因子研究中的重要性
国盛证券|第22届新财富最具影响力研究机构第9名,第22届新财富本土最佳研究团队第6名·2025-05-14 14:33
研究背景与论点 - 市场竞争加剧和机器学习普及使挖掘多因子模型外增量信息困难,未来量价因子研究需“逐笔等高频数据”与“离散化因子构建方式”[1][8][9][10] 连续性因子构建 - 基于日频、分钟、逐笔数据构建“日频连续”“分钟连续”“逐笔连续”因子,叠加后因子回测绩效提升,但沪深300指增组合超额年化收益仅提升0.5%-0.6%[2][14][24][30][38][47] 离散化因子构建 - 基于分钟、逐笔数据构建“分钟离散”“逐笔离散”因子,叠加到“连续”因子上回测表现提升不明显,但沪深300指增组合超额年化收益提升超1%[3][48][54][61][70] “逐笔离散”因子表现 - 回测期2016/01/01 - 2025/04/30内,月度IC均值0.073,年化ICIR 2.87,10分组多空对冲年化收益38.30%[4] - 剔除常用风格与行业影响后仍有效,年化ICIR为2.84[4] - 构建的沪深300、中证500、中证1000指增组合超额年化收益分别为7.17%、10.43%、16.90%[81][83][86] 风险提示 - 结论基于历史数据和统计模型,市场环境改变可能致模型失效[4][90]