时序基础模型(TSFM)概述 - 时序基础模型(TSFM)核心理念是通过在规模庞大、领域多样的时序数据语料库上进行预训练,构建通用的、与任务无关的模型,能够以少量甚至无需额外训练的方式适应各种下游任务 [2][6] - TSFM的根本优势在于其泛化能力和迁移学习能力,通过在上万亿个时间点上学习,能够捕捉普适性的时间模式、趋势和季节性规律 [2][6] - 这种零样本学习的新模式对于金融领域尤为重要,当面对新上市的金融工具或数据记录有限的新兴市场时,传统模型因数据稀疏而难以获得较好的训练效果 [2][6] - 时序基础模型的演化将简化金融领域时序预测任务的推理流程,节省预训练阶段的时间、计算资源以及人力成本,加速从数据到决策端的转化过程 [7] Kronos模型核心方法与架构 - Kronos是清华大学团队开发的专为金融K线数据设计的统一、可扩展的预训练框架,采用“领域预训练+微调”的范式,深度挖掘并理解金融市场的数据特征 [3][9] - 模型框架包含两个核心阶段:K线分词(K-line Tokenization)和自回归预训练(Autoregressive Pre-training) [9][12][13] - K线分词阶段通过特化分词器、分层量化和由粗到精的令牌结构,将连续、多维的金融市场数据转化为离散的、结构化的“语言” [12] - 自回归预训练阶段采用仅解码器的Transformer架构,进行分层预测目标训练,首先生成对市场主要趋势的预测,然后在此基础上进行精细化调整 [13][15] - 模型专门构建了高质量的金融数据库进行预训练,覆盖股票、加密货币、期货、外汇等多种资产类别和从1分钟到周线等7种不同时间频率 [16] Kronos模型性能表现 - 在价格序列预测任务中,Kronos的RankIC指标比领先的通用TSFM高出93%,比表现最好的非预训练专用模型高出87% [17] - 在波动率预测任务中,平均绝对误差(MAE)降低了9% [17] - 在合成K线数据生成任务中,生成数据的保真度和实用性方面提升了22% [17] - 在中国A股市场的回测中,由Kronos预测信号驱动的投资组合取得了最高的年化超额回报和信息比率 [17] - 官方公布了四个模型版本,参数量从4.1M到499.2M不等,其中前三个模型已开源 [16] Kronos在A股指数的预测表现 - 在2025年1月至9月的测试区间内,Kronos标准版对未来5个交易日收盘价的预测与真实序列保持较高一致性,平均斯皮尔曼相关系数为0.78,绝对误差均值为6.17 [4][20] - 模型在大市值指数中的表现优于小市值指数,沪深300指数未来5条预测序列的平均相关性为0.92,绝对误差均值为90.28,而中证1000指数平均相关性为0.85,绝对误差均值为306.03 [21] - 在价值指数上的预测表现优于成长指数,价值指数未来5条预测序列的平均相关性为0.92,收益率序列的平均相关性为0.20 [21] - 预测性能随预测期限延长而递减,但对第5个交易日的预测仍保持较高准确性 [20][22] 标准版Kronos择时策略效果 - 利用Kronos预测中证1000指数第5日收盘价构建择时策略,当预测收益率超过0.5%时产生做多信号 [30][31] - 策略采用T-1日收盘后生成信号,T日开盘建仓,固定持仓5个交易日,满仓操作 [31] - 标准版Kronos择时总体获得正收益,但错过了2025年7月以来的大部分涨幅,原因为模型较为依赖前期的指数反转逻辑 [4][33] 微调版Kronos滚动择时系统 - 采用模型参数微调和滚动调整推理参数并行的方案,引导Kronos适应指数的价格分布和变化特性 [4][34] - 参数微调使用中证1000指数成分股2010年至2022年的日度价量数据集,验证集为2023年至2024年 [37] - 滚动搜参方案以1个月为滚动测试集区间,对温度参数T、核采样概率top_p和回看窗口lookback_window进行网格搜索 [37][38] - 优化后模型在中证1000指数上的预测性能显著提升,未来5日收盘价预测序列与真实序列间的斯皮尔曼相关系数由0.732提升至0.856,绝对误差均值由435.2下调至275.5 [4][39] - 使用优化后的Kronos模型构建择时策略,2025年收益率达33.9%,相对于指数本身的年化超额收益达到9%,较原方法收益率提升20个百分点以上 [5][42]
中金 | 大模型系列(5):大语言时序模型Kronos的A股择时应用