SSPT
搜索文档
量化研究参考系列之二一:SSPT:股票时序定制化预训练选股框架
东方证券· 2026-04-13 16:42
量化模型与构建方式 1. **模型名称:SSPT (Stock Specialized Pre-trained Transformer) 框架** [2][5][9] * **模型构建思路**:针对股票价格序列高噪声、非平稳、结构信息利用不足的问题,设计一个“预训练-微调”两阶段框架。通过设计贴合股票数据特性的预训练任务,从多个维度提取价格序列中的潜在结构特征,提升模型表征质量,再迁移至下游选股任务[5][9][10]。 * **模型具体构建过程**: 1. **数据构建**:以多股票日频价格数据为基础,将每只股票的历史序列按固定窗口长度进行滑动切片。基础输入特征包括开盘价、最高价、最低价、收盘价和成交量,并进一步加入5、10、20、30日移动均值等衍生特征,然后进行归一化处理,形成标准化的时序输入样本[16]。 2. **预训练任务设计**:设计三类预训练任务,从不同角度挖掘信息: * **股票代码分类 (SCC)**:任务为识别给定的价格序列片段来源于哪一只股票,旨在提取个股层面的特征差异[17]。 * **股票行业分类 (SSC)**:任务为识别给定的价格序列片段所属的行业,旨在捕捉板块层面的共性结构[18]。 * **移动均值预测 (MAP)**:任务为预测给定时间窗口内的平均价格(移动均值),而非单点价格,旨在提取更稳定的趋势信息,降低噪声干扰[22][23]。 3. **多任务联合训练**:采用标准Transformer架构作为核心编码器。在预训练阶段,Transformer同时承担上述三类任务,通过不同的任务头输出对应结果,并使用加权损失函数进行联合优化[23][24]。 4. **选股微调**:预训练完成后,保留Transformer编码层参数,移除预训练任务头,新增一个收益预测层。将模型训练目标切换为预测未来收益率,并在下游选股任务上进行微调。最终根据预测收益对股票排序,构建投资组合[28][31]。 2. **模型名称:DFQ-Diversify 模型 (作为对比模型提及)** [5][30] * **模型构建思路**:以解决分布外泛化问题为核心,通过自监督动态领域划分与对抗训练机制,显式地将“领域信息”(环境扰动)与“标签信息”(收益)解耦,从而提取跨环境稳定的预测特征[30][33]。 * **模型具体构建过程**:构建“领域–标签”双路径对抗训练体系。包含两个模块:`update_d`模块用于强化领域区分能力,同时通过梯度反转抑制标签信息;`update`模块用于强化标签(收益)预测能力,同时抑制领域信息。两个模块共享特征提取器,通过交替优化形成对抗博弈,实现特征空间的显式解耦[34][35]。 模型的回测效果 *指标说明:IRR为累计收益率,SR为夏普比率 (Sharpe Ratio)。结果基于NASDAQ、NYSE、TOPIX-100等市场回测[39][44]。* 1. **SSPT-ind 模型** (基于单一预训练任务):NASDAQ市场 IRR 0.74, SR 2.32;NYSE市场 IRR 0.41, SR 2.11;TOPIX-100市场 IRR 0.51, SR 1.33[44]。 2. **SSPT-comb 模型** (基于多任务联合预训练):NASDAQ市场 IRR 0.82, SR 2.25;NYSE市场 IRR 0.60, SR 2.35;TOPIX-100市场 IRR 0.43, SR 1.21[44]。 3. **市场基准 (Market)**:NASDAQ市场 IRR 0.15, SR 1.53;NYSE市场 IRR 0.10, SR 1.49;TOPIX-100市场 IRR 0.02, SR 0.19[44]。 4. **其他主流方法 (示例)**:在NASDAQ市场,CI-STHPAN模型 IRR 0.66, SR 2.01;ALSP-TF模型 IRR 0.53, SR 1.55;TimeMixer模型 IRR 0.42, SR 1.64[44]。 量化因子与构建方式 *注:本报告核心内容为量化模型框架,未涉及传统意义上的量化因子构建。报告在优化方向部分建议将输入特征从基础价量扩展至多维度因子体系,但未给出具体因子构建过程[49][50]。* 因子的回测效果 *无相关内容。*