Workflow
高频数据
icon
搜索文档
“量价淘金”选股因子系列研究(十二):“高频数据+离散化构建方式”在因子研究中的重要性
国盛证券|第22届新财富最具影响力研究机构第9名,第22届新财富本土最佳研究团队第6名· 2025-05-14 14:33
研究背景与论点 - 市场竞争加剧和机器学习普及使挖掘多因子模型外增量信息困难,未来量价因子研究需“逐笔等高频数据”与“离散化因子构建方式”[1][8][9][10] 连续性因子构建 - 基于日频、分钟、逐笔数据构建“日频连续”“分钟连续”“逐笔连续”因子,叠加后因子回测绩效提升,但沪深300指增组合超额年化收益仅提升0.5%-0.6%[2][14][24][30][38][47] 离散化因子构建 - 基于分钟、逐笔数据构建“分钟离散”“逐笔离散”因子,叠加到“连续”因子上回测表现提升不明显,但沪深300指增组合超额年化收益提升超1%[3][48][54][61][70] “逐笔离散”因子表现 - 回测期2016/01/01 - 2025/04/30内,月度IC均值0.073,年化ICIR 2.87,10分组多空对冲年化收益38.30%[4] - 剔除常用风格与行业影响后仍有效,年化ICIR为2.84[4] - 构建的沪深300、中证500、中证1000指增组合超额年化收益分别为7.17%、10.43%、16.90%[81][83][86] 风险提示 - 结论基于历史数据和统计模型,市场环境改变可能致模型失效[4][90]
4月高频数据跟踪
联储证券· 2025-05-07 21:41
生产端 - 截止4月第四周,高炉开工率84.35%,环比升0.92个百分点;螺纹钢开工率41.98%,环比升0.84个百分点;电炉开工率64.10%,环比降0.99个百分点[11] - 主要工业品库存回落,螺纹钢、冷轧、热轧库存下降,铁矿石、炼焦煤库存回升,同比增速均为负[27] - 焦化、电炉产能利用率抬升,水泥熟料产能利用率下降,4月第四周电炉产能利用率52.03%,环比升0.37个百分点;焦化产能利用率78.98%,环比升0.52个百分点[49] 需求端 - 4月第四周,30城、100城商品房成交面积略有回升但同比增速跌幅扩大,土地溢价率7.42%,环比升69.02个百分点[53] - 居民出行升温,4月第四周邮政快递揽收量40.75亿件,环比升3.16个百分点;国内执行航班13384架次,同比升4.26个百分点[76] - 港口货物吞吐量升幅大,4月第四周为28501.90万吨,环比升9.00个百分点;CCFI、SCFI处于低位,同比负增[83] 价格端 - PPI方面,4月第四周铜价环比升2.39个百分点,钢、铝、动力煤、柴油价格回落,化工产品价格指数低位徘徊[85] - CPI方面,4月第四周农产品批发价格指数环比降0.23个百分点,猪肉、蔬菜、水果批发价走低,牛羊肉批发价回升[90] 风险提示 - 国内政策落地不及预期,海外政策超预期[5]