Workflow
频域幅度谱低秩分解
icon
搜索文档
别再用黑盒预测了!即插即用模块通过前置分解让iTransformer/PatchTST既准又可解释
量子位· 2026-04-02 13:30
文章核心观点 - 上海交通大学与麦考瑞大学联合提出了一种名为MLOW的全新前置分解范式,旨在解决深度时间序列预测模型的“黑盒”困境 [4] - MLOW通过频域幅度谱的低秩分解,能够在不改动主干模型结构的前提下,提升模型性能并提供清晰的可解释性,将趋势、周期与噪声成分解耦 [4] - 该方法基于一个关键发现:时间序列可以表示为频域幅度谱与带相位信息的周期基函数的组合,且不同数据集的幅度谱呈现出显著且可观测的分布模式 [4] 全新分解范式与核心方法 - **频域能量低秩分解**:MLOW从频域出发,对频谱幅度进行低秩分解,从而提取趋势与周期等主要结构 [5] - **Hyperplane-NMF**:这是一种全新的针对频域幅度低秩分解方法,兼具可解释性、泛化能力与高效推理能力 [6] - **宽松的超参选择**:该方法通过数学推理保证,可自由选择频域维度和时域维度,解决了传统方法中频域泄露的问题 [7] - **数学形式**:MLOW将输入时间序列表示为幅度、相位感知基函数和均值截距的组合,并通过低秩分量和新系数进行重构 [8] - **Hyperplane-NMF的优势**:该方法在测试时无需像标准NMF那样重新优化系数矩阵W,梯度更新方向完全顺从目标函数,且系数W的可解释性更强,可通过超平面投影进行可视化 [9][10] - **方法对比**:Hyperplane-NMF在可解释性、对新数据的高效处理及泛化能力方面,相较于NMF、Semi-NMF和PCA具有优势 [11] 可解释性与可视化 - **宽松的超参选择**:通过引入额外过去信息扩展频域维度,并截取最新的相位基函数,实现了频域与时域维度的自由选择 [12] - **可解释性分解**:MLOW可以清晰可视化时间序列被分解为V个低维表示的过程,展示学习到的低秩分量、新能量系数W和重构后的基函数P [12] - **成分解耦**:每个数据集的低秩分量可以有效反映时间序列中主要周期性成分与趋势性成分来自于哪些频域 [14] - **可视化展示**:MLOW能够有效解耦和分解主要周期性成分与趋势性成分,并对噪音具有鲁棒性 [15] 实验结果 - **性能表现**:在多个真实数据集(如电力、交通、气象等)上,MLOW显著优于传统分解方法及多种先进深度学习模型,表现出更强的鲁棒性和稳定性 [16] - **模型增强**:MLOW可在几乎不改变模型的情况下,显著增强经典时序模型如iTransformer和PatchTST,其表现远超现有方法 [16] - **具体数据**:在PEMS03数据集上,iTransformer+MLOW的MSE为0.086,MAE为0.186;PatchTST+MLOW的MSE为0.108,MAE为0.222,均优于DUET、CycleNet、SparseTSF、TimeKAN、TimesNet和Time Mixer等对比方法 [19] - 在PEMS08数据集上,iTransformer+MLOW的MSE为0.081,MAE为0.173;PatchTST+MLOW的MSE为0.120,MAE为0.232 [19] - 在ECL数据集上,iTransformer+MLOW的MSE为0.155,MAE为0.248;PatchTST+MLOW的MSE为0.173,MAE为0.281 [19] - 在Traffic数据集上,iTransformer+MLOW的MSE为0.393,MAE为0.250;PatchTST+MLOW的MSE为0.405,MAE为0.294 [19] 总结与意义 - MLOW为时间序列预测提供了一种全新的思路,将模型从“黑盒预测”转向“可解释建模”,被认为具有重要的理论意义与实际价值 [20]