Multi-Agent

搜索文档
人工智能领域青年学者杨健:人人可编程的时代正在到来
环球网资讯· 2025-07-07 18:57
人工智能在软件开发中的应用 - 人工智能已深度融入软件开发全流程,从自动生成代码、调试优化到理解项目需求、协作式编程,极大提升开发效率 [1] - AI正从辅助工具迈向智能合作者,借助自然语言接口、上下文感知和多智能体系统,推动编程门槛持续降低 [1] - AI驱动的工具能够在软件生命周期的多个阶段为开发人员提供支持,包括编写调试代码、优化公式和预测潜在漏洞 [2] 大型语言模型的技术特点 - 现代大型语言模型基于深度神经网络构建,采用预训练的变换器架构,参数规模可达数千亿,在翻译、对话、内容创作等任务中展现出强大能力 [2] - 代码大型语言模型专门用于理解、生成和处理编程代码,基于GitHub等平台的开源代码数据,帮助开发者完成代码编写、调试、重构等任务 [3] - 大型语言模型可分析大量文档,实时回答技术问题,帮助新手加快新框架和编程语言的学习速度 [3] AI编程的未来趋势 - 未来编程将呈现"自动化程度更高、协作性更强、AI深度集成"的趋势,出现更直观的开发环境、更先进的自动代码生成工具和更智能的AI助手 [4] - AI编程通过辅助甚至自动化软件开发流程实现飞跃,涵盖代码生成、调试、优化乃至新编程语言的设计,显著提升开发效率和软件质量 [4] - 自然语言编程的兴起使编程过程变得直观,开发者只需用自然语言描述任务,模型便可自动生成相应代码,降低入门门槛 [5] 多智能体系统与AI程序员 - 多智能体系统由多个AI代理组成,能够感知环境、做出决策并协同工作,实现任务自动化、流程优化和实时反馈 [6] - Cognition AI推出的AI程序员Devin能够自主处理整个软件开发生命周期,包括理解需求、编写、测试、调试、部署等,在SWE-bench基准测试中解决了近10%的GitHub真实问题 [6] - AI驱动的编程正从简单的自动补全工具发展为能够理解项目上下文、生成完整功能甚至自主管理开发流程的软件合作者 [7] AI对开发者与非程序员的影响 - AI辅助开发自动完成重复性任务、优化代码结构并缩短调试时间,实时提供示例与建议,加速学习过程 [7] - AI赋能非程序员,使其能够借助低代码、无代码平台和聊天机器人生成功能性代码、调试错误、理解编程概念 [7] - 虽然复杂项目仍需要专业开发者,但AI的发展推动了软件开发的普及化与多元化 [7]
京东抢人,薪酬不设上限
21世纪经济报道· 2025-06-30 16:25
人才招募 - 公司推出顶尖青年技术天才项目TGT,面向全球高校本硕博在校生、应届生及毕业两年内的技术人才,薪酬不设上限 [2] - 不到50天时间已与国内外几十所院校、千名师生进行深度交流,招募领域涵盖多模态大模型与应用、机器学习、搜索推荐广告等8大方向 [2] - 公司在AI顶尖人才招募上进展顺利,TGT候选人持续增加 [2] AI技术应用 - 今年618期间大模型调用量较去年双十一上升130% [3] - 公司内部运行超过1.4万个AI智能体 [3] - 超100万商家使用京小智服务客户,1.7万商家使用数字人直播带货 [3] 智能助手功能 - 商家智能助手能辅助商家应对平台信息、了解店铺经营状况 [3] - 算法底座基于大语言模型构建Multi-agent系统,模拟电商商家团队经营协作方式 [3] - 通过多智能体动态规划及协同技术解决电商运营中的复杂决策问题 [3] 技术挑战 - 商家智能助手需调用大量工具,涉及多个模型或智能体之间的联动 [4] - 多智能体异步自进化是需要攻克的技术难题之一 [4]
对谈斯坦福 Biomni 作者黄柯鑫:AI Scientist 领域将出现 Cursor 级别的机会|Best Minds
海外独角兽· 2025-06-20 19:18
AI+生物领域发展现状 - 语言模型和agent技术正在从通用领域快速渗透到生物医药等高价值垂直领域 [3] - AI scientist agent能够自主提出假设、设计实验并循环修正,正在改写科研和药物开发范式 [3][19] - 前谷歌CEO投资的FutureHouse推出四款AI scientist agent,并宣称其AI系统Robin成功发现新药 [3][25] - OpenAI近期强调AI在生物学领域能力不断增强 [3] AI scientist的本质与特点 - AI scientist本质是agentic system,能够模拟人类科学家的"假设-实验-观察"循环 [19][21] - 与通用agent相比,AI scientist需要专业环境和专家know-how支持 [28] - 当前阶段AI scientist主要实现任务自动化,未来目标是实现完全自主的科学发现 [21][29] - AI scientist可以使用AlphaFold等工具完成任务,两者是互补关系 [53] 通用agent的局限性 - 通用agent缺乏生物学专业环境和工具整合 [28] - 生物学领域存在大量未记录的专家隐性知识 [28] - 科研探索需要严谨性、创造力和长期规划能力,这些都是当前agent的短板 [28] - 生物研究任务高度分散,需要跨学科交叉研究能力 [37] Biomni系统的创新 - Biomni构建了集成数百种专业工具、数据库与软件的开放环境 [34][38] - 通过文献挖掘和Action Discovery agent发现新工具资源 [38] - 采用code as action设计,使agent能够灵活处理复杂任务 [38] - 在湿实验protocol设计和数据分析等任务上显著提升效率 [39] - 未来计划引入强化学习让agent自主学习和优化解决方案 [48] AI for Science的商业机会 - 生物医药研发存在数千亿美元市场,AI可大幅提升效率 [77] - AI scientist可能带来类似Cursor或Devin的创业机会 [77] - 未来可能出现"一人+多个agent"运营的虚拟药企模式 [79] - 药企对AI接受度提高,开始使用ChatGPT等工具辅助工作 [81] 行业挑战与未来方向 - 生物学数据获取成本高,是主要瓶颈 [62] - 需要设计适合生物学特点的benchmark评估体系 [70] - 强化学习在生物学应用需要明确定义的reward系统 [50] - 终极目标是AI scientist实现诺贝尔奖级别的科学发现 [90]
关于 Multi-Agent 到底该不该做,Claude 和 Devin 吵起来了
Founder Park· 2025-06-16 22:16
多智能体系统核心观点 - Anthropic与Cognition两篇文章共同揭示了多智能体系统的适用场景与局限性:Anthropic强调多智能体在低依赖、可并行任务中的高效性(如研究任务),而Cognition指出高依赖、紧耦合任务(如AI Coding)目前不适合多智能体架构 [2][12][39] - 多智能体系统性能提升显著但成本高昂:Anthropic的测试显示多智能体系统比单智能体性能提升90.2%,但token消耗达普通聊天的15倍 [9][10] - 当前技术限制下,多智能体系统需满足三大条件:任务价值足够高、需要大量并行处理、信息量超出单个上下文窗口 [12][16] 多智能体架构设计 - 编排器-工作器模式为核心架构:主智能体负责协调,子智能体并行执行任务,通过动态搜索替代传统RAG的静态检索 [13][16][19] - 并行工具调用实现效率飞跃:引入两层并行化(主智能体同时启动3-5个子智能体,子智能体并行使用3+工具)使复杂查询研究时间缩短90% [25][26] - 上下文管理策略关键:采用外部内存存储关键信息、智能压缩机制防止溢出,子智能体输出直接写入文件系统减少token开销 [35][36] 多智能体适用场景 - 最佳应用领域:开放式研究任务(如跨领域软件开发、商业策略制定、学术研究),可覆盖信息量超出单智能体能力的广度型查询 [9][38] - 当前不适用场景:需要共享同一上下文的高依赖任务(如实时编码协调),LLM智能体尚无法有效处理任务分配与实时协调 [12][57] - 典型成功案例:Anthropic多智能体系统完成标普500公司董事会成员搜索等复杂研究任务,而单智能体系统失败 [9] 多智能体工程挑战 - 提示工程决定系统行为:需开发智能体心理模型,明确任务分配规则(简单查询1个智能体3-10次调用,复杂研究10+子智能体) [21][23] - 调试复杂度指数级增长:微小提示改动引发连锁反应,需建立模拟环境观察失败模式(如子智能体重复搜索、工具选择错误) [21][31] - 部署策略特殊:采用彩虹部署逐步迁移流量,避免中断运行中的智能体状态 [33] 多智能体评估方法 - 传统评估方法失效:需采用最终状态评估而非路径验证,LLM评判者规模化评估事实准确性、引用质量等维度 [27][28][29] - 人工测试不可替代:发现自动化评估遗漏的边缘情况(如SEO内容偏好),修正信息源选择偏差 [29] - 涌现行为需监控:智能体交互产生非预期行为,需追踪决策模式与交互结构 [30] AI Coding领域实践 - Cognition实践表明:2025年技术条件下,编程任务采用多智能体会导致系统脆弱,因决策分散且上下文共享不足 [57] - 单线程线性agent更可靠:Claude Code子agent仅回答明确定义问题,避免并行工作导致的矛盾输出 [55] - 上下文工程是核心:需压缩历史对话关键细节,微调专用模型管理长上下文 [53]
统一20+多智能体方法,MASLab震撼发布
机器之心· 2025-06-13 12:31
多智能体系统(MAS)研究进展 - OpenAI将「组织级」智能列为AGI最终目标,即AI能像组织般管理复杂流程和决策[1] - 近两年多智能体系统研究快速涌现,推动领域向该目标迈进[1] - 上海交大、牛津大学等10家机构联合推出首个统一的大模型多智能体系统代码库MASLab[2] MASLab核心功能 - 集成20种主流MAS方法,覆盖NeurIPS/ICLR等顶会成果,严格遵循原始实现[6][8] - 统一输入预处理、LLM配置和评估协议,确保横评公平性[8] - 结构化代码设计支持快速复现和二次开发,解决接口混乱问题[7][8] 多智能体系统性能评估 - 实验覆盖10余种基准(MATH/GPQA等)和8大模型(LLaMA-3.3/GPT-4o等)[11] - MAS-GPT在Llama-3.3-70B上取得63.6平均分,优于单智能体基线(58.9)[12] - Qwen-2.5-72B上最佳方法(MAS-GPT)较单智能体提升1.3分(63.4 vs 62.1)[12] 技术创新与社区建设 - 团队提出MASLab-ReAct新方法,在工具调用场景展现显著优势[16] - 实验证明评估协议差异会导致方法排名剧烈变动[17] - 发起MASWorks开源社区,计划在ICML 2025举办MAS专题研讨会[23][24]
Anthropic工程师教你怎么做AI Agent:不做全场景、保持简单,像Agent一样思考
Founder Park· 2025-04-11 19:11
文章转载自「INDIGO 科技加速站」 Anthropic 工程师 Barry Zhang 在 AI Engineer 工作坊上的一个分享 "如何构建有效的 Agent",其中印象最深的一个观点: Don't build agents for everything ,反过来理解就是别做什么都能干的 Agent,那是我们大模型要干的事情 构建有效 Agent 的三大要点: Barry 主要负责 Agentic System,演讲内容基于他和 Eric 合著的一篇博文,下面详细总结他们的核心观点,以及对 Agent 系统的演进和未来的思考。 Agent 系统的演进 1. 简单功能(Simple Features): 起初是简单的任务,如摘要、分类、提取,这些在几年前看似神奇,现在已成为基础。 2. 工作流(Workflows): 随着模型和产品成熟,开始编排多个模型调用,形成预定义的控制流,以牺牲成本和延迟换取更好性能。这被认为是 Agent 系统的前身。 3. Agent: 当前阶段,模型能力更强,领域特定的 Agent 开始出现。与工作流不同,Agent 可以根据环境反馈自主决定行动路径,几乎独立运 作。 4 ...