PandemicLLM

搜索文档
开发出火遍全球的新冠疫情地图的中国留学生,发表最新论文:利用AI大模型预测疫情
生物世界· 2025-06-22 16:17
全球新冠疫情数据可视化地图 - 新冠大流行期间,约翰·霍普金斯大学开发的全球新冠疫情数据可视化地图单日访问量一度高达20亿,成为多国政府及媒体广泛引用的疫情追踪系统 [1] - 该地图由该校两位中国留学生董恩盛、杜鸿儒开发,结合自动化数据采集与人工审核机制实现高可靠性 [1][3] PandemicLLM模型技术突破 - 研究团队开发的多模态大型语言模型PandemicLLM通过融合文本政策、基因组数据、时空流行病学数据,实现疫情实时预测,预测性能显著优于传统模型 [3] - 首创"五级趋势分类法",采用疾控中心认可的住院趋势分类(大幅下降、温和下降、稳定、温和上升、大幅上升),提升决策效率 [8] - 实现"零样本"应对新变种,如BQ.1变种出现时无需重新训练模型,仅需添加特性描述即可提升28.2%预测准确率 [9] 传统模型痛点 - 传统模型存在四大缺陷:无法处理政策文本等非数值数据、新变种响应滞后需重新训练、预测结果可读性差、三分之二模型曾在疫情拐点预测失误 [10] 多模态数据处理 - PandemicLLM通过AI-人类协作提示词设计,将政策文本转化为防控力度变化描述(如"学校从强制关闭转为建议关闭"),基因监测数据解析为病毒特性(如"BQ.1变种传播力比BA.5高40%") [11] - 时空数据转化为排名描述(如"加州老年人口比例全美前五"),时间序列通过GRU神经网络编码关键趋势 [11] 模型测试表现 - 全美50州19个月测试显示:1周预测准确率56%(较传统模型提升20%),3周预测准确率46.4%(误差率降低22%),700亿参数版本准确率达57.1% [17][23] - 当模型对"大幅上升"判断置信度>85%时,实际发生概率达73%(1周)和64%(3周) [18] - 在疫情趋势一致的西部沿海、五大湖区表现最佳,政策多变地区如怀俄明州仍需优化,建议开发区域定制模型 [19] 行业影响 - 该研究开创AI辅助公共卫生决策新范式,未来决策者或可获取"风险趋势解读报告"而非原始数据 [24] - 研究成果发表于Nature Computational Science,论文链接提供完整技术细节 [25]