Workflow
自回归差分移动平均模型(SARIMAX)
icon
搜索文档
中金:如何利用大模型实时预测宏观经济指标?
中金点睛· 2025-07-10 07:59
宏观数据实时预测方法 - 宏观经济指标存在滞后性,需通过实时预测模型捕捉变化 [1][7] - 三种常用实时预测方法:高频数据拆分、自回归模型(SARIMAX)、大语言模型(LLMs)文本解析 [2][8][15] - 高频数据拆分方法(如GDPNow)可解释性强但需定制化建模,易过拟合 [9] - SARIMAX模型通过历史数据自相关性和季节性参数预测,适合平稳序列 [10][12] - LLMs通过解析非结构化文本(研报、新闻)生成预测,突破结构化数据局限 [3][15] 自回归模型(SARIMAX)应用 - 自回归模型对CPI环比、新增人民币贷款等指标预测效果有限 [4][27] - 春节效应需作为外生变量处理,以修正1-2月数据失真 [20][26] - 适用条件:指标需满足平稳性(均值/方差稳定)、趋势性弱 [30] - 与上期相关性≥0.8的指标可直接沿用历史数据,无需建模 [23][27] 大语言模型(LLMs)预测效果 - LLMs对新增人民币贷款预测相关性从-0.1提升至0.9,显著优于自回归 [5][35] - 出口金额同比预测效果从0.37提升至0.72,贸易差额从0.55提升至0.76 [5][35] - 研报标题比内容向量(chunk)更有效,因内容匹配质量不稳定 [36][37] - 极值捕捉较平滑,但非极值趋势预测准确度高 [38] 方法对比与实施流程 - 优先级:高相关性指标沿用历史→平稳指标用SARIMAX→复杂指标用LLMs [24][45] - SARIMAX计算复杂度低,但依赖数据平稳性;LLMs适应性更强但存在随机性 [12][45] - 测试区间为2014-2025年月频数据,覆盖工业增加值、社零、贸易差额等12项指标 [18][19]