波动方程
搜索文档
AAAI 2026 Oral | 告别注意力与热传导!北大清华提出WaveFormer,首创波动方程建模视觉
机器之心· 2026-01-21 08:32
核心观点 - 北京大学和清华大学的研究团队提出了一种名为WaveFormer的新型视觉主干网络,其核心创新在于使用**波动方程**作为全局建模机制,以替代传统的自注意力或热传导方程方法[2] - 该方法将视觉特征图视为在“传播时间”内演化的空间信号,通过**欠阻尼波动方程**实现全局交互,旨在同时精准保留图像的高频细节(如边缘、纹理)和低频全局结构,解决了现有方法中高频细节易丢失的问题[2][11] - WaveFormer在多项核心视觉任务(如图像分类、目标检测、语义分割)上实现了**速度、效率与精度的全面超越**,在保持竞争性精度的同时,显著提升了计算吞吐量并降低了计算复杂度[23][29] 方法原理 - 核心思想是**将全局交互从“相似度匹配”转向“波传播动力学”**,把图像特征视为“波场”,让语义信息像波一样振荡传播[10] - 引入了**欠阻尼波动方程的频域闭式解**,该解允许一个“初始速度场”,从而显式地建模空间频率,实现了**频率-时间解耦**:不同频率分量以不同方式振荡和衰减,但都参与全局语义传播[11][12][14] - 关键推导表明,与热方程的高频分量随时间急速衰减不同,WaveFormer的衰减项对不同频率更“公平”,频率差异主要体现在振荡项上,这使得高频细节得以保留[14][16][18] 技术实现 - 研究团队将波动方程的频域解实现为一个名为**WPO**的可替换算子,其核心计算通过快速傅里叶变换在频域进行,全局建模复杂度为**O(N log N)**,远低于自注意力的平方复杂度[18][19][20] - WPO的实现流程清晰:将输入特征图变换到频域,用波动方程的解对每个频率分量进行**振荡式调制**,再逆变换回空间域,完成一次全局语义传播[19] - WaveFormer采用层级式骨干网络结构,由stem和四个阶段组成,每个阶段包含WPO Block,可作为ViT或CNN的即插即用主干网络[20] 性能表现 - **ImageNet-1K图像分类**:WaveFormer-B模型在**10.8G FLOPs**和**68M参数**下,达到了**84.2%**的Top-1准确率[28][32] - **COCO目标检测与实例分割**:使用Mask R-CNN框架,WaveFormer-B在1×训练计划下达到**47.9% APb**和**43.2% APm**,推理速度为**20.4 img/s**,比Swin-B和ConvNeXt-B分别快**48%**和**45%**[30][33] - **ADE20K语义分割**:WaveFormer-B达到**50.5% mIoU**,同时在FLOPs和推理速度(FPS)上均具优势[31][33] - 综合来看,与Swin、ConvNeXt等主流模型相比,WaveFormer在保持竞争精度的同时,**最高可带来1.6倍吞吐量提升和30%的FLOPs降低**[29] 意义与影响 - WaveFormer为视觉基础模型开辟了**频域处理的新路径**,提供了一种新的、受物理启发的建模偏置,用于同时捕捉全局一致性与高频细节[22][35] - 该研究代表了视觉全局建模范式的转变:从**“token相似度交互”转向“语义场的动力学传播”**;从**隐式处理频率转向显式建模高低频演化**;从**黑盒模块转向可解释、可控的传播过程**[36] - 这项成果证明了**经典的物理波动规律能够为现代人工智能提供强大的归纳偏置**,不仅限于视觉领域,也为未来多模态语义传播的研究提供了启示[35][36]
当闭上眼,世界还存在吗?量子力学百年终极答案:全靠你“脑补”
36氪· 2025-12-18 18:00
量子力学百年会议与诠释之争 - 2025年,300多位世界顶尖物理学家登上黑尔戈兰岛,纪念量子力学诞生一百周年[6] - 会议核心争议在于量子力学的诠释问题,即方程背后描述的是世界本身还是人类对世界的认知[8][10][11] - 主要诠释流派包括哥本哈根诠释、多世界诠释、隐变量理论、关系量子力学和主观贝叶斯主义[11][12][13] 主要量子力学诠释观点 - 哥本哈根诠释将“测量”视为理论基本前提,其口号是“闭上嘴,直接算”[11] - 多世界诠释认为没有波函数坍缩,所有可能结果都在不同的分支宇宙中发生[12] - 隐变量理论为守住决定论引入“隐藏变量”,但需接受超距作用[13] - 关系量子力学认为现实由事物间的相互作用关系构成,不存在上帝视角的统一叙事[20][23][25] - 主观贝叶斯主义认为波函数是观察者个人信念的数学编码,是观察者与世界互动的“用户手册”[28][30] 思想实验与核心问题 - “维格纳的朋友”思想实验凸显了量子力学中“事实”是否唯一的根本问题[15][16][17][19] - 关系量子力学对此的解释是,实验室内的朋友与实验室外的维格纳各自建立了不同的关系事实,两者描述皆为真实[20] - 主观贝叶斯主义认为,两者描述的是不同主体对未来的信念和期望,而非同一客观实体的状态[28] - 争论的核心在于能否以及如何将量子力学应用于宏观世界系统[13] 诠释发展趋势与影响 - 2025年《自然》杂志调查显示,哥本哈根诠释以47%的支持率领先,但关系性与信息性框架已赢得21%的支持[31] - 关系性与信息性框架在博士生与青年研究者中支持率显著更高[31] - 2025年诺贝尔物理学奖得主米歇尔·德沃雷承认,主观贝叶斯主义重构的量子方程式直接启发其量子实验设计[31] - 关系量子力学与主观贝叶斯主义均强调观察者在量子现象描述中的特殊地位,实现了观察者的回归[31] 未来研究方向与意义 - 未来将通过运行在大型量子计算机上的人工智能代理,作为复杂度递增的“观察者”进行实证检验[33] - 现实的“关系性”与“非绝对性”,可能成为未来物理学与意识、信息及AI融合领域的元规则[34] - 量子力学的新起点在于,真实是每一个观察者与世界共同写下的故事,而非宇宙说明书中的固定条目[34]