VARnet算法
搜索文档
18岁高中生唯一作者发顶刊,用AI发现150万个新天体
虎嗅· 2025-05-12 09:42
研究课题与核心成果 - 18岁高中生Matteo Paz作为唯一作者在天文学顶刊《天文学杂志》发表论文,并凭借该成果赢得再生元科学人才奖冠军及25万美元奖金 [1][2][28] - 研究开发了名为VARnet的基于波形的机器学习算法,用于从NASA的NEOWISE任务数据中识别变星,该算法处理海量天文观测数据尤为有效 [19] - 研究总共调查了超过4.5亿个天体,生成了包含190多万个变星候选体的星表VarWISE,其中150多万个属于全新发现,并进一步筛选出包含84万多个高置信度候选体的子表,其中54万多个为新发现 [22] 研究方法与技术细节 - 为处理近200TB的原始数据,将天空划分成13000个等面积区域进行并行处理,聚类分析步骤消耗了超过1000小时的CPU时间 [21] - VARnet模型结合了傅里叶变换和小波方法,能够处理嘈杂的时间序列数据,每个天体的源处理时间少于53微秒,加权准确率达到98% [21] - 研究流程分为预处理和聚类分析、检测、表征三个步骤,并利用盖亚和2MASS等外部数据结合决策树分类器对变星类型进行预测 [21][22] 数据来源与合作机构 - 研究基于NASA于2009年发射的广域红外巡天探测者望远镜执行NEOWISE任务期间十多年积累的观测数据,数据量达2000TB [14] - 项目得到了加州理工学院行星探索者学院和暑期研究联系项目的支持,并与NASA旗下的喷气推进实验室有合作 [3][6] - 导师为加州理工学院红外处理和分析中心的天文学家Davy Kirkpatrick,其拥有指导高中生的丰富经验 [6][7] 研究成果的应用与影响 - 加州理工学院的一个红外光谱研究小组已开始使用VarWISE星表研究遥远宇宙中的双星系统,并发现了数十个之前未探测到的恒星系统,用于计算系外行星质量 [27] - 研究者指出该模型可应用于天文学其他时间域研究,甚至股票市场图表分析、大气污染效应研究等非天文领域,因其擅长处理具有周期性成分的时间序列数据 [28] - 研究成果作为独立科研项目,使研究者从全美约2500名参赛者中脱颖而出,赢得历史悠久、竞争激烈的再生元科学人才奖 [30] 研究者背景与未来发展 - 研究者自小学起受加州理工学院免费天文讲座熏陶,并于高中阶段参与了该校与NASA联合组织的天文学项目,学习了Python编程、数据分析等科研技能 [3][4] - 除了天文研究,研究者还创立运营青少年金融教育项目,并拥有一家音乐会推广公司,展示出多方面的能力 [31] - 目前已被斯坦福大学录取,并在导师的部门兼职处理NASA等机构的太空任务数据,同时正考虑利用红外望远镜技术监测地球火灾的新科研方向 [32][33]