OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复
36氪·2025-10-31 10:25

产品发布与核心功能 - OpenAI发布由GPT-5驱动的AI安全研究员Agent“Aardvark”,旨在自动发现并修复代码安全漏洞[1][3] - Aardvark的核心任务是持续分析源代码仓库,通过监控代码提交与变更,自动识别潜在漏洞、推断攻击路径并生成修复建议[4] - 该产品不依赖传统程序分析技术,而是运用大语言模型驱动的推理与工具使用能力来理解代码行为,工作流程包括威胁建模、漏洞发现、沙盒验证、Codex修复、人工复审及提交Pull Request[5][8][9] 性能表现与集成应用 - 内部测试显示,Aardvark在基准测试中对已知与人工注入漏洞的识别率达到92%,并能定位仅在复杂条件下出现的问题[3][12] - 该产品已发现并负责披露了众多漏洞,其中10个已获得CVE编号,并且可无缝集成GitHub、Codex及现有开发流程[10][12] - Aardvark不仅能识别安全漏洞,还能发现逻辑缺陷、不完整修复及隐私风险,OpenAI将为部分非商业开源仓库提供公益扫描服务[11][13] 行业竞争格局 - 整个10月,Anthropic、谷歌、微软等科技巨头相继发布类似的白帽AI Agent,形成密集的产品发布潮[3][14][19] - Anthropic于10月4日将Claude Sonnet 4.5应用于代码安全任务,其性能据称已超越Opus 4.1,且价格更低、速度更快[14][17] - 谷歌于10月6日发布利用Gemini Deep Think模型的CodeMender,微软于10月16日发布Vuln.AI,OpenAI在10月底发布Aardvark[17][19] 市场驱动因素 - 人工Debug与传统的自动化方法已无法满足大规模代码库的漏洞发现与修复需求,推动AI自动化工具成为关键手段[19] - 企业级网络中设备、服务、代码库数量巨大,同时AI技术也被用于快速寻找漏洞和生成攻击代码,导致漏洞数量激增和攻击手段智能化[19]