Multi-Agent - 财报，业绩电话会，研报，新闻

Multi-Agent

搜索文档

环球网资讯· 2025-07-07 18:57

人工智能在软件开发中的应用 - 人工智能已深度融入软件开发全流程，从自动生成代码、调试优化到理解项目需求、协作式编程，极大提升开发效率 [1] - AI正从辅助工具迈向智能合作者，借助自然语言接口、上下文感知和多智能体系统，推动编程门槛持续降低 [1] - AI驱动的工具能够在软件生命周期的多个阶段为开发人员提供支持，包括编写调试代码、优化公式和预测潜在漏洞 [2] 大型语言模型的技术特点 - 现代大型语言模型基于深度神经网络构建，采用预训练的变换器架构，参数规模可达数千亿，在翻译、对话、内容创作等任务中展现出强大能力 [2] - 代码大型语言模型专门用于理解、生成和处理编程代码，基于GitHub等平台的开源代码数据，帮助开发者完成代码编写、调试、重构等任务 [3] - 大型语言模型可分析大量文档，实时回答技术问题，帮助新手加快新框架和编程语言的学习速度 [3] AI编程的未来趋势 - 未来编程将呈现"自动化程度更高、协作性更强、AI深度集成"的趋势，出现更直观的开发环境、更先进的自动代码生成工具和更智能的AI助手 [4] - AI编程通过辅助甚至自动化软件开发流程实现飞跃，涵盖代码生成、调试、优化乃至新编程语言的设计，显著提升开发效率和软件质量 [4] - 自然语言编程的兴起使编程过程变得直观，开发者只需用自然语言描述任务，模型便可自动生成相应代码，降低入门门槛 [5] 多智能体系统与AI程序员 - 多智能体系统由多个AI代理组成，能够感知环境、做出决策并协同工作，实现任务自动化、流程优化和实时反馈 [6] - Cognition AI推出的AI程序员Devin能够自主处理整个软件开发生命周期，包括理解需求、编写、测试、调试、部署等，在SWE-bench基准测试中解决了近10%的GitHub真实问题 [6] - AI驱动的编程正从简单的自动补全工具发展为能够理解项目上下文、生成完整功能甚至自主管理开发流程的软件合作者 [7] AI对开发者与非程序员的影响 - AI辅助开发自动完成重复性任务、优化代码结构并缩短调试时间，实时提供示例与建议，加速学习过程 [7] - AI赋能非程序员，使其能够借助低代码、无代码平台和聊天机器人生成功能性代码、调试错误、理解编程概念 [7] - 虽然复杂项目仍需要专业开发者，但AI的发展推动了软件开发的普及化与多元化 [7]

Artificial Intelligence

Large Language Models

Artificial Intelligence

Large Language Models

21世纪经济报道· 2025-06-30 16:25

人才招募 - 公司推出顶尖青年技术天才项目TGT，面向全球高校本硕博在校生、应届生及毕业两年内的技术人才，薪酬不设上限 [2] - 不到50天时间已与国内外几十所院校、千名师生进行深度交流，招募领域涵盖多模态大模型与应用、机器学习、搜索推荐广告等8大方向 [2] - 公司在AI顶尖人才招募上进展顺利，TGT候选人持续增加 [2] AI技术应用 - 今年618期间大模型调用量较去年双十一上升130% [3] - 公司内部运行超过1.4万个AI智能体 [3] - 超100万商家使用京小智服务客户，1.7万商家使用数字人直播带货 [3] 智能助手功能 - 商家智能助手能辅助商家应对平台信息、了解店铺经营状况 [3] - 算法底座基于大语言模型构建Multi-agent系统，模拟电商商家团队经营协作方式 [3] - 通过多智能体动态规划及协同技术解决电商运营中的复杂决策问题 [3] 技术挑战 - 商家智能助手需调用大量工具，涉及多个模型或智能体之间的联动 [4] - 多智能体异步自进化是需要攻克的技术难题之一 [4]

Artificial Intelligence

Artificial Intelligence

对谈斯坦福 Biomni 作者黄柯鑫：AI Scientist 领域将出现 Cursor 级别的机会｜Best Minds

海外独角兽· 2025-06-20 19:18

AI+生物领域发展现状 - 语言模型和agent技术正在从通用领域快速渗透到生物医药等高价值垂直领域 [3] - AI scientist agent能够自主提出假设、设计实验并循环修正，正在改写科研和药物开发范式 [3][19] - 前谷歌CEO投资的FutureHouse推出四款AI scientist agent，并宣称其AI系统Robin成功发现新药 [3][25] - OpenAI近期强调AI在生物学领域能力不断增强 [3] AI scientist的本质与特点 - AI scientist本质是agentic system，能够模拟人类科学家的"假设-实验-观察"循环 [19][21] - 与通用agent相比，AI scientist需要专业环境和专家know-how支持 [28] - 当前阶段AI scientist主要实现任务自动化，未来目标是实现完全自主的科学发现 [21][29] - AI scientist可以使用AlphaFold等工具完成任务，两者是互补关系 [53] 通用agent的局限性 - 通用agent缺乏生物学专业环境和工具整合 [28] - 生物学领域存在大量未记录的专家隐性知识 [28] - 科研探索需要严谨性、创造力和长期规划能力，这些都是当前agent的短板 [28] - 生物研究任务高度分散，需要跨学科交叉研究能力 [37] Biomni系统的创新 - Biomni构建了集成数百种专业工具、数据库与软件的开放环境 [34][38] - 通过文献挖掘和Action Discovery agent发现新工具资源 [38] - 采用code as action设计，使agent能够灵活处理复杂任务 [38] - 在湿实验protocol设计和数据分析等任务上显著提升效率 [39] - 未来计划引入强化学习让agent自主学习和优化解决方案 [48] AI for Science的商业机会 - 生物医药研发存在数千亿美元市场，AI可大幅提升效率 [77] - AI scientist可能带来类似Cursor或Devin的创业机会 [77] - 未来可能出现"一人+多个agent"运营的虚拟药企模式 [79] - 药企对AI接受度提高，开始使用ChatGPT等工具辅助工作 [81] 行业挑战与未来方向 - 生物学数据获取成本高，是主要瓶颈 [62] - 需要设计适合生物学特点的benchmark评估体系 [70] - 强化学习在生物学应用需要明确定义的reward系统 [50] - 终极目标是AI scientist实现诺贝尔奖级别的科学发现 [90]

Artificial Intelligence

Artificial Intelligence

Biomedical Research

关于 Multi-Agent 到底该不该做，Claude 和 Devin 吵起来了

Founder Park· 2025-06-16 22:16

多智能体系统核心观点 - Anthropic与Cognition两篇文章共同揭示了多智能体系统的适用场景与局限性：Anthropic强调多智能体在低依赖、可并行任务中的高效性（如研究任务），而Cognition指出高依赖、紧耦合任务（如AI Coding）目前不适合多智能体架构 [2][12][39] - 多智能体系统性能提升显著但成本高昂：Anthropic的测试显示多智能体系统比单智能体性能提升90.2%，但token消耗达普通聊天的15倍 [9][10] - 当前技术限制下，多智能体系统需满足三大条件：任务价值足够高、需要大量并行处理、信息量超出单个上下文窗口 [12][16] 多智能体架构设计 - 编排器-工作器模式为核心架构：主智能体负责协调，子智能体并行执行任务，通过动态搜索替代传统RAG的静态检索 [13][16][19] - 并行工具调用实现效率飞跃：引入两层并行化（主智能体同时启动3-5个子智能体，子智能体并行使用3+工具）使复杂查询研究时间缩短90% [25][26] - 上下文管理策略关键：采用外部内存存储关键信息、智能压缩机制防止溢出，子智能体输出直接写入文件系统减少token开销 [35][36] 多智能体适用场景 - 最佳应用领域：开放式研究任务（如跨领域软件开发、商业策略制定、学术研究），可覆盖信息量超出单智能体能力的广度型查询 [9][38] - 当前不适用场景：需要共享同一上下文的高依赖任务（如实时编码协调），LLM智能体尚无法有效处理任务分配与实时协调 [12][57] - 典型成功案例：Anthropic多智能体系统完成标普500公司董事会成员搜索等复杂研究任务，而单智能体系统失败 [9] 多智能体工程挑战 - 提示工程决定系统行为：需开发智能体心理模型，明确任务分配规则（简单查询1个智能体3-10次调用，复杂研究10+子智能体） [21][23] - 调试复杂度指数级增长：微小提示改动引发连锁反应，需建立模拟环境观察失败模式（如子智能体重复搜索、工具选择错误） [21][31] - 部署策略特殊：采用彩虹部署逐步迁移流量，避免中断运行中的智能体状态 [33] 多智能体评估方法 - 传统评估方法失效：需采用最终状态评估而非路径验证，LLM评判者规模化评估事实准确性、引用质量等维度 [27][28][29] - 人工测试不可替代：发现自动化评估遗漏的边缘情况（如SEO内容偏好），修正信息源选择偏差 [29] - 涌现行为需监控：智能体交互产生非预期行为，需追踪决策模式与交互结构 [30] AI Coding领域实践 - Cognition实践表明：2025年技术条件下，编程任务采用多智能体会导致系统脆弱，因决策分散且上下文共享不足 [57] - 单线程线性agent更可靠：Claude Code子agent仅回答明确定义问题，避免并行工作导致的矛盾输出 [55] - 上下文工程是核心：需压缩历史对话关键细节，微调专用模型管理长上下文 [53]

Multi-Agent

AI Coding

Artificial Intelligence

Artificial Intelligence

Claude

Devin

统一20+多智能体方法，MASLab震撼发布

机器之心· 2025-06-13 12:31

多智能体系统（MAS）研究进展 - OpenAI将「组织级」智能列为AGI最终目标，即AI能像组织般管理复杂流程和决策[1] - 近两年多智能体系统研究快速涌现，推动领域向该目标迈进[1] - 上海交大、牛津大学等10家机构联合推出首个统一的大模型多智能体系统代码库MASLab[2] MASLab核心功能 - 集成20种主流MAS方法，覆盖NeurIPS/ICLR等顶会成果，严格遵循原始实现[6][8] - 统一输入预处理、LLM配置和评估协议，确保横评公平性[8] - 结构化代码设计支持快速复现和二次开发，解决接口混乱问题[7][8] 多智能体系统性能评估 - 实验覆盖10余种基准（MATH/GPQA等）和8大模型（LLaMA-3.3/GPT-4o等）[11] - MAS-GPT在Llama-3.3-70B上取得63.6平均分，优于单智能体基线（58.9）[12] - Qwen-2.5-72B上最佳方法（MAS-GPT）较单智能体提升1.3分（63.4 vs 62.1）[12] 技术创新与社区建设 - 团队提出MASLab-ReAct新方法，在工具调用场景展现显著优势[16] - 实验证明评估协议差异会导致方法排名剧烈变动[17] - 发起MASWorks开源社区，计划在ICML 2025举办MAS专题研讨会[23][24]

Multi-Agent Systems

General Artificial Intelligence

Artificial Intelligence

MASLab

Multi-Agent Systems

General Artificial Intelligence

Artificial Intelligence

MASLab

Anthropic工程师教你怎么做AI Agent：不做全场景、保持简单，像Agent一样思考

Founder Park· 2025-04-11 19:11

文章转载自「INDIGO 科技加速站」 Anthropic 工程师 Barry Zhang 在 AI Engineer 工作坊上的一个分享 "如何构建有效的 Agent"，其中印象最深的一个观点： Don't build agents for everything ，反过来理解就是别做什么都能干的 Agent，那是我们大模型要干的事情构建有效 Agent 的三大要点： Barry 主要负责 Agentic System，演讲内容基于他和 Eric 合著的一篇博文，下面详细总结他们的核心观点，以及对 Agent 系统的演进和未来的思考。 Agent 系统的演进 1. 简单功能（Simple Features）：起初是简单的任务，如摘要、分类、提取，这些在几年前看似神奇，现在已成为基础。 2. 工作流（Workflows）：随着模型和产品成熟，开始编排多个模型调用，形成预定义的控制流，以牺牲成本和延迟换取更好性能。这被认为是 Agent 系统的前身。 3. Agent：当前阶段，模型能力更强，领域特定的 Agent 开始出现。与工作流不同，Agent 可以根据环境反馈自主决定行动路径，几乎独立运作。 4 ...

AI Agent

Budget-aware Agents

Self-evolving Tools

Multi-agent Collaboration

Artificial Intelligence

Multi-agent Collaboration

Artificial Intelligence

Agent