文章核心观点 - DeepMind推出名为CodeMender的AI智能体,旨在使用Gemini Deep Think模型自动修补关键软件漏洞,其核心价值在于通过严格的验证确保修复质量 [2] - 该技术标志着软件行业正进入自我修复时代,是迈向自动化安全修复的重要一步 [10][24] CodeMender的技术原理与功能 - 核心机制是借助Gemini深度思考模型的思维能力,构建能自动调试并修复复杂漏洞的Agent,配备强大工具集以在修改代码前进行逻辑推演和自动验证 [12] - 采用全面的代码安全方法,实现“被动响应”(立即修补新漏洞)与“主动防御”(重写和保护现有代码)并重 [4] - 综合使用调试器、源代码浏览器等工具精确定位漏洞根本原因,并设计补丁 [14] - 基于高级程序分析技术(如静态分析、动态分析、差分测试等)系统性地审视代码,以精准定位安全漏洞 [18] - 采用多智能体系统,使不同智能体能够协同处理问题的不同方面,例如使用基于LLM的代码审查工具高亮显示代码差异以验证更改 [18] CodeMender的实际应用与案例 - 在过去六个月的开发过程中,已向开源项目上传了72个安全修复程序,其中一些修复程序涉及多达450万行代码 [5] - 案例1:成功识别堆缓冲区溢出的根本原因(XML元素堆栈管理不正确),尽管最终补丁仅修改了几行代码 [15] - 案例2:智能体能够创建非平凡补丁,成功处理复杂对象生命周期问题,并修改了项目内一个完全自定义的C代码生成系统 [16][17] - 具备主动重写现有代码的能力,例如将-fbounds-safety注释应用于图像压缩库libwebp,以添加编译器边界检查防止缓冲区溢出漏洞被利用 [19] - 具备自动纠正新错误和测试失败的能力,并能根据LLM Judge工具的反馈进行自我修正和验证更改 [22][23] 行业影响与开发者反馈 - 该技术可帮助开发者从繁琐的查找漏洞工作中解脱出来,使其能专注于打造优质软件 [6] - 开发者认为其突破点在于确保修复不会破坏其他功能,这是真正自动化与演示的区别所在 [8] - 有观点认为该技术可能对QA、安全审计、漏洞赏金等领域的收入构成冲击 [8] - 引发了关于“AI产生软件漏洞”与“AI自动修复软件漏洞”之间可能形成军备竞赛的讨论 [10] - 谷歌已启动针对AI产品漏洞的奖励计划,漏洞猎手们累计获得超过43万美元奖金 [9] 当前状态与未来计划 - 目前所有CodeMender生成的补丁在提交到上游之前都会经过人类研究人员的审核 [24] - DeepMind计划在未来几个月内继续分享技术论文和报告,并希望最终将CodeMender发布为所有开发人员可用的工具 [24]
DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化
机器之心·2025-10-07 15:00