AI写综述，靠谱吗？

人工智能在科学文献综述中的应用进展 - 初创公司FutureHouse开发的人工智能系统PaperQA2能在几分钟内完成科学知识总结，准确度超过维基百科页面，并生成了约17000个人类基因的维基百科式条目 [1] - 基于人工智能的科学搜索引擎如Consensus和Elicit能通过查找、分类和总结出版物帮助撰写叙述性文献综述，但尚无法独立完成高质量的系统性综述 [2][4] - 南丹麦大学研究员Mushtaq Bilal开发的工具Research Kick和Scite系统能快速找出支持或反驳某个观点的文献并做出详细分析，显著提升文献综述效率 [4] 技术实现与挑战 - FutureHouse的PaperQA2系统通过搜索多个学术数据库并访问免费和付费论文全文来识别和总结最相关内容，但运行成本较高 [5] - Elicit和Consensus等工具只能搜索开放获取论文和摘要，无法检索付费墙后的全文，处理数百万篇全文需要极高计算成本 [5] - 系统性综述至少需要25个严谨步骤，目前人工智能工具如RobotSearch和RobotReviewer可辅助部分流程，但完全自动化仍需较长时间 [7][8] 性能评估与局限性 - FutureHouse团队测试显示，人工智能生成的文章出现"推理错误"的频率仅为人工撰写文章的一半，实现了"超人类水平科学知识综合" [6] - 人工智能科学搜索引擎的输出水平类似"赶工熬夜的本科生"，建议仅用于优化综述特定环节而非独立完成 [4] - 生成式人工智能在阅读和评估论文方面表现良好，但在设计全面文献搜索等环节仍存在不足 [9] 行业发展趋势 - 国际系统性综述自动化协作组织致力于开发自动化工具，Evidence Review Accelerator网站提供多种工具以逐年缩短综述时间 [9] - 英国两家资助机构宣布投入超过7000万美元开发证据综合系统，推动非营利组织参与人工智能工具开发 [12] - 研究人员担忧人工智能可能导致更多低质量综述，但也可能通过快速检查文献提高工作水平 [10][11]