Google Jules
搜索文档
多个编码智能体同时使用会不会混乱?海外开发者热议
机器之心· 2025-10-06 12:00
AI编程工具发展现状 - AI编程工具的进步速度正在迅速加快,GPT-5和Gemini 2.5等前沿大模型已让开发者在实际任务中实现一定程度自动化 [1] - 结合成熟的CLI、IDE工具,采用编码智能体进行开发工作已成为常态和新的生活方式 [2] - 不仅程序员,产品类和设计类岗位从业人员也已广泛采用AI编码智能体辅助工作,AI生成代码比例越来越高 [3] 并行编码代理工作模式 - 独立开源开发者Simon Willison分享同时运行多个编码AI的经验,其相关推文阅读量已破10万 [3] - 高效使用并行代理的模式包括研究任务、系统机制回溯、小型维护任务和精确指定的实际工作 [6] - 研究任务用于回答问题或提供建议,而不会直接修改计划保留的项目代码,现代推理型大模型能在一两分钟内给出详细答案 [7][8][10] - 小型维护任务如修复测试套件抛出的弃用警告,可交给代理处理而无需中断主要任务 [13] - 对于根据详细规格说明生成的代码,审查负担较轻,只需验证代码是否符合要求 [15] 并行编码代理实践工具与方法 - 开发者主力工具包括Claude Code(Sonnet 4.5)、Codex CLI(GPT-5-Codex)和Codex Cloud(用于异步任务) [16][19] - 经常同时打开多个终端窗口,在不同目录中运行不同代理实例,以YOLO模式执行安全性可控任务 [16] - 对于高风险任务主要使用异步代理,最糟糕情况只是源码泄露 [17] - GitHub Codespaces运行VS Code的agent模式效率高且完全在浏览器中运行,在workshop或演示场景中特别好用 [17] 开发者社区反响与最佳实践 - Google Labs产品总监Kath Korevec有80%左右的编码工作由AI辅助完成,表达了对并行智能体工作流的热情 [21] - 开发者认为终端会话管理至关重要,在桌面上平铺CLI窗口既杂乱又容易出错 [23] - 建议在容器中并行化,跳过工作树并使用特定于任务的分支,Git集成是强制性的 [24][25] - 强调需仔细进行审查和测试,使用单独分支可以轻松实现这一点 [25] - 有开发者对并行使用多个代理表示担忧,主要担心架构或实现被误解带来的不可控因素 [26][27][31]
Claude 4发布:新一代最强编程AI?
虎嗅· 2025-05-23 08:30
模型发布与性能 - Anthropic正式发布Claude 4系列模型 包括Claude Opus 4和Claude Sonnet 4 [2] - Opus 4是目前全球最强的编程模型 能够稳定胜任复杂且持续时间长的任务和Agent工作流 [4] - Sonnet 4着重强化了编程和推理能力 能更精准地响应用户的指令 [4] - Opus 4在编程基准测试SWE-bench上拿下72.5%的高分 在Terminal-bench上以43.2%领先同行 [6] - Sonnet 4在SWE-bench的成绩达到72.7% 几乎与Opus 4持平 [15] 新功能与特性 - 工具辅助的延伸思考功能 模型在进行深入思考时能够交替使用工具优化推理过程 [7] - 两款模型可并行使用工具 执行更精确的指令 并提升记忆能力 [7] - Claude Code正式发布 支持GitHub Actions、VS Code和JetBrains [7] - API新增四项功能 包括代码执行工具、MCP连接器、文件API和最长可缓存1小时的提示缓存功能 [7] - 引入"思维总结"功能 在模型思考路径过长时自动调用更小模型进行压缩和归纳 [30] 实测表现 - 在Replit的实测中 Opus 4在多文件、大改动的项目中表现出更高准确率 [9] - 在代号为Goose的Agent中 该模型显著提升了代码质量 同时保持稳定性和性能 [10] - 进行高要求的开源重构任务时 连续稳定运行7小时 [11] - 能解决其他模型无法完成的复杂任务 成功处理多个前代模型没法完成的关键操作 [11] - 创建带有动画效果的天气卡片 只用一次机会就成功生成 [12] 行业影响与定位 - GitHub选择Sonnet 4作为新一代Github Copilot的底座模型 [17] - 两款模型为不同层级用户提供明确选项 Opus 4面向极致性能与科研突破 Sonnet 4面向主流落地与工程效率 [39] - 价格与前代保持一致 Opus 4每百万token为$15/$75 Sonnet 4为$3/$15 [38] - 三家头部AI公司几乎在同一时间选择Agent路径 编程是最天然适合AI Agent落地的场景 [55][56][57] - 开发者群体是天然适配Agent产品的用户 他们习惯自定义、愿意尝鲜、擅长集成 [58] 技术演进与未来展望 - 模型开发过程中存在"最后开窍"现象 某些能力在最后一刻才展现出来 [69][70] - 正在进入新世界 开发者可以像管理一支Agent团队一样工作 [74] - 预训练和后训练都有显著进步 扩展规律在预训练阶段依然有效 [78] - 未来一年"代码"方面会出现很多令人惊艳的进展 构建"Agent团队"将对世界产生有意思的影响 [103] - 当写软件的成本大幅下降时 经济和商业结构将发生改变 [104][105]