编程智能体

搜索文档
Devin 教你做 Agent:把 AI 当做需要指导的初级开发者
Founder Park· 2025-07-07 20:08
编程智能体实践指南核心观点 - 将AI视为需要明确指导的初级开发者而非魔法工具,资深工程师(Senior到Staff级别)因天然具备管理能力而能最快掌握智能体工具 [1] - 中大型任务(1-6小时工作量)采用智能体可节省约80%时间,技术功底和代码库理解仍是核心,但工作方式需转变为工程经理式多任务管理 [1][8] - 自主编程智能体已能端到端完成从想法到PR交付的全流程,显著提升工程师多任务处理能力,需适应与AI新同事的协作模式 [8][9] 基础与日常应用 - **指令具体化**:需明确实现路径而非仅下达目标,如单元测试需指定功能边界和mock方式 [11][12] - **起点定位**:告知代码库入口或参考文档,避免无效探索,例如新增Google模型支持时指引具体目录 [13] - **防御性提示**:预判潜在错误点并提前澄清,如提醒C++绑定需重新编译测试 [14] - **反馈闭环**:利用类型检查、单元测试等工具构建验证体系,强类型语言更利于AI迭代修正 [15] 复杂任务管理 - **分阶段执行**:对跨模块任务设置检查点(如数据库→后端→前端分步确认),避免错误累积 [26][27] - **草稿生成**:AI完成PR初稿可节省80%时间,但需提供清晰架构设计并预留人工精修空间 [24] - **联合规划**:利用Agent探索模糊需求,如通过"规划模式"理解认证系统工作原理 [25] - **验证强化**:在AI频繁修改区域大幅增加测试覆盖率,如Python转C++前增强单元测试 [29] 自动化与定制化 - **模板复用**:创建自动化提示词模板处理重复任务(如依赖升级、测试补充) [31][32] - **环境统一**:确保AI开发环境与团队完全一致,包括语言版本、预装工具和登录状态 [35] - **知识沉淀**:将常见错误清单和架构规范固化至AI知识库,如服务路由添加指南 [38] - **工具赋能**:开发CLI工具辅助AI工作,如仅显示首个失败测试的脚本提升调试效率 [37] 局限性认知与应对 - **能力边界**:AI在视觉还原、复杂调试等方面较弱,需人类提供可能原因列表而非全权委托 [39][40] - **知识更新**:需主动提供新发布库的文档链接,避免使用过时API [42] - **止损策略**:当AI明显偏离轨道时应及时中止,推倒重来比持续修正更高效 [44][46] - **权限管理**:为AI创建专属账户和隔离测试环境,仅授予最小必要权限 [47][48]
Devin Coding Agent提效80%指南:把AI当初级开发者 | Jinqiu Select
锦秋集· 2025-07-02 20:56
编程智能体实践指南核心观点 - 将AI视为需要明确指导的初级开发者而非魔法工具[1] - 资深工程师(Senior到Staff级别)采用智能体工具最快 因其天然具备管理初级开发者的能力[2] - 中大型任务(1-6小时工作量)可节省约80%时间[2] - 技术功底和代码库理解依然重要 但工作方式需转变为同时管理多个"初级开发者"(智能体)[7] 核心方法论 基础原则 - 清晰指令:明确测试功能/边界情况/依赖模拟 而非笼统要求[3][16] - 合理预期:大任务可节省80%时间但需设置检查点(规划→实现→测试→审查)[3][28] - 持续验证:提供完整CI/测试环境 在AI常改动区域增加测试覆盖率[3][33] 日常应用技巧 - 即时委派:将突发需求直接交由智能体处理[5][21] - 移动办公:通过手机端处理紧急bug[5][23] - 并行决策:让智能体实现多种架构方案再选择[5][25] - 自动化琐事:依赖升级/文档更新/测试用例补充[5][24] 复杂任务处理 - 分阶段实施:规划→模块A→测试→审查→模块B的检查点机制[30][31] - 防御性提示:预判可能错误并提前澄清 如C++绑定需重新编译[18] - 知识沉淀:将团队常见错误和验证方法存入智能体知识库[32][36] 高级定制化 - 环境配置:确保智能体开发环境与团队完全一致(语言版本/依赖包)[38][40] - CLI工具开发:创建专用命令行工具提升智能体效率[41] - 事件响应:对接告警系统实现自动日志分析和根因推测[37] 局限性管理 - 视觉还原:需依赖设计系统而非像素级还原[44] - 知识更新:需主动提供新发布库的官方文档[45] - 安全策略:使用只读API密钥和隔离测试环境[51][52] 行业趋势 - 编程智能体已完成从代码补全(Copilot)到端到端交付(Devin)的进化[11] - 自主Agent形态多样化 可集成于Slack/GitHub等日常工作工具[14] - 工程师角色向"工程经理"转型 需同时监督多个智能体工作流[7][53]
氪星晚报 |扎克伯格为Meta新 “超级智能”AI团队招聘人员;马斯克:SpaceX今年的收入将达到155亿美元;由微软支持的人工智能实验室Mistra...
36氪· 2025-06-10 19:00
劲仔食品 - 公司部分创新升级产品已进入胖东来系统 目前销售情况良好 [1] Meta - 扎克伯格正在组建专家团队以实现通用人工智能(AGI) 计划向Scale AI投资超100亿美元 [2] Uber与Wayve - 宣布计划在伦敦进行无人驾驶汽车测试 [2] 天康生物 - 5月销售生猪22.97万头 环比下降6.13% 同比下降9.67% [2] - 5月销售收入3.45亿元 环比下降9.21% 同比下降19.95% [2] - 5月商品猪销售均价14.02元/公斤 环比下降2.09% [2] - 1-5月累计销售生猪128.51万头 同比增长12.49% [2] - 1-5月累计销售收入19.02亿元 同比增长4.22% [2] 天合光能 - 目前超过1/3业务来自解决方案 未来两三年该比例将增至50%以上 [3] 平安好医生 - 品牌焕新为"平安好医生" 发布年度医健服务名片 [3] - 已建立覆盖29个科室约5万名医生团队 [3] - 链接10.5万家健康服务商 23.5万家药店 4000家医院 [3] SpaceX - 预计今年收入将达到155亿美元 [4] VinFast - 一季度交付36330辆电动汽车 同比增长296% [4] - 一季度总营收约6.57亿美元 同比增长149.9% [4] - 一季度净亏损约7.12亿美元 [4] 泡泡玛特 - 已注册数十枚labubu系列商标 [4] - 今年1月登记《LABUBU 与朋友们》动画剧集第一季剧本著作权 [4] 投融资 - 杭州氧宜居环保科技完成A轮5000万融资 用于车载负氧离子仪项目 [6] - 啵特叮咚完成2000万元天使轮融资 用于AI智能路由算法研发等 [7] - 龙兴航电完成亿元A++轮融资 杭州科创集团等参投 [8] - 光子跃迁获亿元天使轮融资 用于AI影像算法研发 [9] 新产品 - Mistral将推出其首个推理模型 [9] - 美团发布首款AI编程智能体产品NoCode [9] - 趣丸千音MCP Server上线 提供文本转语音等六大能力 [10] 行业监管 - 市场监管总局就《直播电商监督管理办法》公开征求意见 [10]
腾讯研究院AI速递 20250520
腾讯研究院· 2025-05-19 22:57
生成式AI 2. 项目属于"星际之门"计划一部分,耗电量相当于五座核电站,规模是德州阿比林园区的四 倍; 3. G42因与中国实体关系引发美方担忧,随后撤出在华投资,微软投资15亿美元并派高管入 驻G42董事会。 3. 推出Isaac GR00T平台和Cosmos物理AI模型,强化机器人与数字孪生技术,Newton物理 引擎将于7月开源。 一、 OpenAI沙漠中建全球最大AI数据中心,耗电抵五座核电站 1. OpenAI与阿联酋G42合作,计划在阿布扎比建设5千兆瓦数据中心,占地10平方英里,规 模超过摩纳哥; https://mp.weixin.qq.com/s/KkhGd6y8d0YkShctexNpaQ 二、 老黄最新演讲!新一代B300与 「 万卡互联」MVLink登场 1. NVIDIA推出新一代Grace Blackwell GB300系统,性能全面提升,可通过MVLink技术将 72个GPU连接成单一巨型GPU; 2. 发布MVLink Fusion计划,允许合作伙伴将自定义ASIC或CPU集成到NVIDIA生态系统, 支持半定制AI基础设施; https://mp.weixin.qq.com ...
老黄唱衰编程,GitHub CEO硬刚:放弃写代码等于放弃智能体未来话语权
量子位· 2025-05-19 17:39
核心观点 - GitHub CEO托马斯·多姆克反驳"编程无用论",认为2025年是编程智能体之年,但未来仍属于人类程序员[1][2] - 公司通过Copilot等产品增强开发者能力,已拥有1500万用户,同比增长4倍[5][10] - 智能体技术将融合同步和异步交互模式,实现自然语言指令执行任务[14][16][17] - 人类程序员仍将主导软件开发,AI作为助手无法取代[33][34][38] 2025年SWE智能体技术发展 - 2025年软件开发将围绕智能体技术展开,基于AI、LLM和上下文感知技术[14][15] - 智能体将并行处理多个任务,开发者成为"智能体乐队"指挥[21][22] - 模型已具备自主规划能力,通过工具调用接口完成工作[24] - 公司构建了人员关系图谱、工作流程图谱等独特上下文体系[26] Copilot产品进展 - Copilot用户达1500万,同比增长4倍,源于免费开放策略[10] - 定价从10美元/月调整至39美元/月,超额请求按0.04美元收费[27] - 产品已集成到所有主流IDE和GitHub网站,具有上下文理解优势[25] - 公司持续评估商业模式演变以支持代理模式运行[27] 人类程序员角色 - AI只能作为高级开发者助手,无法取代掌控软件生命周期的人类[33] - 需要持续学习代码,了解如何对代表人类思考和行动的机器编程[36][37] - 公司愿景是通过改进的自然语言界面打破人类与代码壁垒[34] - 人工智能必须在人类指导下实现自主[38]
刚刚,OpenAI最强编程智能体上线ChatGPT
机器之心· 2025-05-17 00:31
产品发布 - OpenAI宣布在ChatGPT中引入Codex研究预览版,这是一个云端软件工程智能体,可并行处理编写功能、解答代码问题、修复bug及提交拉取请求等任务[2] - Codex基于codex-1模型开发,该模型是OpenAI o3的优化版本,专门针对软件工程任务进行强化学习训练,生成的代码高度符合人类风格和PR偏好[4] - 产品初期面向ChatGPT Pro、Team和Enterprise用户开放,Plus和Edu用户将很快获得访问权限[5] 技术能力 - Codex在专属云沙盒环境中运行,预加载用户代码库,具备读写文件能力并可运行测试框架、代码检查器等命令[12] - 任务处理时间为1-30分钟(视复杂度而定),用户可实时查看进度并通过终端日志和测试输出验证操作[12] - 智能体遵循AGENTS.md文件指导操作,类似人类开发者需要配置环境、测试方案和文档支持[13] - 在内部测试中,codex-1即使没有AGENTS.md文件也展现出强劲性能[14] 产品特性 - 与o3相比,codex-1能生成更清晰的patch便于人工审核和集成到标准工作流程[18] - 完全运行于云端安全隔离容器,任务执行期间禁用互联网访问,仅能交互GitHub仓库提供的代码和预装依赖项[21] - 当前版本暂不支持前端图像输入和实时调整智能体功能[24] 商业模式 - 初期提供免费试用期,后续将推出限速访问和按需付费选项[23] - 通过Responses API调用codex-mini-latest模型的定价为输入tokens每100万$1.50,输出tokens每100万$6[28] 行业影响 - 行业观察者认为Codex可实现软件自我编写,测试显示其擅长模拟代码行为和外观[6] - 远程智能体执行速度虽慢于交互式编辑,但未来协作模式将趋近人类同事的异步协作[25] - 该技术预示编程门槛可能持续降低[27]