AI辅助固收投研
搜索文档
BONDCLAW固收投研系列二:人机协同的REITS公告批量搜集实践
国投证券· 2026-04-28 14:43
报告行业投资评级 未提及 报告的核心观点 - AI数据采集已达实用水平,人机协作是当前有效模式,API优先策略可显著提升效率 [61] - 建议将重复性数据采集交由AI代理,对AI结果进行人工校验,关注合规边界 [62] - 当前AI浏览器自动化处于早期阶段,需关注其对复杂网页的理解准确率、多步骤操作完成率和错误恢复能力、大规模调用成本 [63] - 下一步可引入多Agent并行机制提升效率,需解决登录平台的会话共享问题 [65][66] 根据相关目录分别进行总结 1. 背景与思路 - 投研数据采集痛点在于传统方案极端,需中间路径,AI自主操作浏览器带来突破 [7] - AI驱动的浏览器操作是新范式,从代码地址定位转向语义理解,虽处于早期但值得提前布局 [8][9] - web - data - scraper以分析师思路加程序员技巧为核心理念,具备多种关键特征,可解决数据采集和信息检索问题 [10][11][14] - 选择在巨潮资讯网检索并下载REITs报告的实战任务验证方案可行性,web - data - scraper约20分钟完成任务 [15] 2. 实战过程:23分钟下载50份REITs报告 - 任务目标是从巨潮资讯网批量下载27只公募REITs的一季报和评估报告,任务涵盖多难点 [17] - 第一阶段AI像人一样探索网页,建立对网站结构的基本认知,探索策略有层次性 [18][23] - 第二阶段AI发现背后API,结合“像人一样看”和“像程序一样取”的能力,完成从了解网站结构到掌握批量获取方法的跨越 [24][33] - 第三阶段AI编写脚本首次批量下载,解决编码格式和标签污染问题,成功下载26只REITs的一季报,但评估报告搜集出现问题 [34][37] - 第四阶段AI诊断评估报告问题,调整策略,人工反馈帮助精准定位逻辑bug,体现人机协作模式 [38][44] - 第五阶段AI设计“双模式匹配”修复方案,重新执行脚本,完成成果校验 [45] 3. 成果与数据验证 - 最终成果为下载50份PDF文件,一季报26份完成率96.3%,评估报告24份完成率88.9%,文件均经校验 [48][49] - AI对异常情况进行主动识别和处理,体现异常识别能力 [50][52] - 下载文件按产品维度组织,目录结构清晰,便于查阅和分析 [53] 4. 两个值得关注的细节 - AI突破人工操作视觉限制,通过发现数据接口获取完整REITs产品清单 [55][56] - 评估报告误下载展示人机协作范式,AI设计“双模式匹配”机制解决问题 [57][59] 5. 总结与展望 - 本次实战启示AI数据采集达实用水平,人机协作有效,API优先策略提升效率 [61] - 对固收应用建议将重复性任务交AI代理,人工校验结果,关注合规边界 [62] - 当前AI浏览器自动化有局限,需关注理解准确率、操作完成率和成本控制 [63] - 下一步可引入多Agent并行机制,解决登录平台会话共享问题提升效率 [65][66]