Workflow
AI Agent
icon
搜索文档
Anthropic 详述如何构建多智能体研究系统:最适合 3 类场景
投资实习所· 2025-06-16 19:51
多智能体系统核心观点 - 多智能体系统最适合三类场景:高价值并行任务、超出单上下文窗口的信息处理、需要操作多个复杂工具的情况 [1][5] - 多智能体系统通过并行工作实现高效信息压缩,子智能体同步探索问题不同侧面后浓缩关键信息传递给主智能体 [3] - 内部测试显示多智能体系统在广度优先查询中表现突出,Claude Opus 4为主智能体的系统比单智能体版本性能提升90.2% [4] - 多智能体系统通过合理分配计算资源解决问题,token用量单独解释80%的性能差异 [4] - 实际运行中多智能体系统消耗token量是普通聊天的15倍,需匹配任务价值与性能提升 [5] 多智能体系统优势 - 研究工作具有不可预测性,AI Agent能根据进展灵活调整方向,传统线性处理无法胜任 [3] - 信息检索的核心在于从海量数据中提炼洞察,子智能体通过并行工作实现高效压缩 [3] - 当智能水平达到阈值后,多智能体系统成为扩展能力的必由之路,智能体群体能实现远超个体的成就 [3] - 最新Claude模型显著提升token使用效率,Claude Sonnet 4的性能增益超过在Claude Sonnet 3.7上双倍token预算的效果 [4] 研究架构设计 - 系统采用协调器-工作者模式,首席智能体协调流程并委托给并行操作的专门子智能体 [6] - 与传统RAG静态检索不同,采用多步骤动态搜索:持续发现信息、适应新发现、分析结果形成高质量答案 [8] - 主智能体规划方法后将方案存入Memory,创建承担具体研究任务的子智能体独立执行网络搜索 [11] - 主智能体综合结果决定是否深化研究,必要时创建新子智能体或调整策略 [11] - 信息收集完成后传递给CitationAgent处理文档和研究报告,确保每个主张都有准确引用来源 [11] 工程挑战与解决方案 - 早期智能体常出现创建过多子智能体、无止境搜索、过度更新互相干扰等问题 [13] - 提示策略聚焦启发式规则而非僵化条款,编码专家工作模式到提示中并设置防护栏防止失控 [13] - 构建能够从错误位置恢复的系统,利用模型智能优雅处理问题 [16] - 添加完整的生产跟踪功能诊断智能体失败原因,监控决策模式和交互结构保护用户隐私 [19] - 采用彩虹部署逐步将流量从旧版本转移到新版本,避免中断正在运行的智能体 [19] 性能优化策略 - 主智能体并行启动3-5个子智能体,子智能体并行使用3个或以上工具,将复杂查询研究时间缩短高达90% [17] - 教会协调者如何授权,明确具体目标、输出格式、工具指南和任务边界避免重复工作 [17] - 根据查询复杂度调整工作量,将工作量分级规则嵌入提示词 [17] - 工具设计和选择至关重要,为智能体提供明确启发式方法匹配工具使用与用户意图 [17] - 先广后深策略:鼓励智能体先从简短宽泛查询开始,评估可用内容后逐步缩小范围 [17] 评估方法 - 传统评估假设系统遵循固定路径,多智能体可能通过不同有效路径达成目标 [14] - 需要灵活评估方法判断结果正确性及过程合理性,而非检查是否遵循预先规定步骤 [14] - 采用LLM评估器按标准打分(事实准确性、引用准确性等),与人类判断最一致 [18] - 人工评估补缺发现自动化评估遗漏的边缘情况,如非常规查询的幻觉答案等 [18] - 对修改持久状态的智能体进行最终状态评估而非逐轮分析 [22] 应用场景与价值 - 前五类用途包括:跨专业领域开发软件系统(10%)、专业技术内容开发优化(8%)、业务增长与营收战略制定(8%)等 [21] - 用户反馈帮助找到未曾考虑的商业机会,解决复杂医疗保健方案,节省数天工作时间 [20] - 通过精心工程设计、全面测试、注重细节的提示和工具设计实现大规模可靠运行 [20]
我收到俩BP,一份是Manus(另一份也是)
虎嗅APP· 2025-06-16 18:30
公司概况 - Manus是一家中国AI Agent初创企业,自3月初上线以来因处理复杂任务的惊艳表现成为继DeepSeek之后最热门的AI公司[1] - 公司已完成由Benchmark领投的7500万美元融资(约5.4亿人民币),估值达5亿美元(约36亿人民币)[1] - 近期传闻接近完成数亿元人民币融资,由某地国资领投,投前估值37亿人民币,但公司高层否认此消息[2] 产品与技术 - Manus采用多代理架构模拟人类工作流(Plan-Do-Check-Act),成本为同类产品的十分之一[6] - 产品定位为"手脑并用",名称源自MIT校训Mens et Manus,核心价值在于实现从"我告诉AI做什么"到"AI能够自己完成任务"的转变[6] - 在GAIA基准测试中性能超越OpenAI同类产品,依赖动态调用GPT-4、Claude等国际大模型并整合开源工具链[7] - 6月初推出文本转视频生成功能,进入由OpenAI、阿里和腾讯等巨头参与的新兴市场[3] 市场定位与竞争 - AI Agent市场预计2035年达到2168亿美元,2024-2035年CAGR为40.15%[5] - 公司认为目前处于AI Agent的L3初级阶段(有条件的完全自动驾驶),领先于行业普遍所处的L2阶段[6] - 面向海外市场强调与巨头的差异化定位,面向国内市场则打造全球唯一形象[10] - 谷歌工程师常驻Manus团队协助与Gemini模型融合,微软CEO纳德拉已与团队面对面交流并推进合作[11] 商业模式与发展 - AI Agent将通过三层重构颠覆企业服务:交互层、逻辑层和价值层,预计到2027年40%的企业服务将由AI Agent组合交付[5] - 商业模式继承APP的规模化分发能力,通过大模型实现服务动态进化、收益与价值实时匹配等三大突破[6] - 传闻公司ARR已接近1亿美元,达到SaaS公司规模化运营标志性收入水平[17] - 计划今年开源部分模型,特别是推理(postering)部分,推动AI应用落地[15] 行业观点 - AI Agent市场处于早期阶段,大模型已完成搭台任务,为AI Agent能力进阶提供基础[5] - 随着AI应用标志性案例出现,"套壳"在AI界逐渐变成"褒义词",关键在于商业化能力和产品体验[8] - 创始人叙事能力被视为关键竞争优势,Benchmark合伙人强调构建企业叙事能力的重要性[16] - AI Agent正改变人机交互模式,从需要人类作为中介转向AI智能体直接执行任务[5]
在中国做AI难,做AI Agent容易
混沌学园· 2025-06-16 18:15
AI Agent 的核心价值与架构 - AI Agent 从被动工具升级为能自主理解目标、规划步骤、调用工具并完成任务的智能体,实现从"数字助理"到"数字员工"的进化 [8][10] - 典型架构包含四大模块:感知模块(通过API/传感器接收信息)、决策模块(基于知识库规划行动)、行动模块(调用API执行任务)、学习与记忆模块(优化知识库形成长期记忆) [12][13][14][15] AI Agent 的商业逻辑 - 商业价值从"信息服务"(如ChatGPT)跃迁至"流程自动化",核心能力是打通数字系统隔阂,完成实际工作流 [16][17] - 商业模式更接近RaaS(结果即服务),直接交付降本增效的成果,与企业核心利益挂钩 [18][19] 中国AI产业的差异化优势 - 基础大模型研发面临三大挑战:训练成本高达数十亿至百亿人民币、核心技术/人才差距、高端芯片供应链风险 [21][22] - AI Agent领域具备独特优势:海量复杂应用场景(如电商/工业数字化)、应用驱动创新的技术路径(快速微调开源模型)、完善数字基础设施(支付/物流/API生态)、政策支持"人工智能+"行动 [24][25][26][27] 中国AI Agent市场格局 - 互联网巨头(阿里/腾讯/百度/字节)将Agent作为串联生态的"神经网络",例如阿里"通义千问"整合电商/金融/物流业务 [27] - 垂直领域创新企业分三类:深入实体(如中科视语的交通解决方案)、深耕行业(如卓世科技的医疗AI家庭医生)、平台赋能(如斑头雁的低代码开发平台) [29][30] 行业发展趋势 - 中国AI Agent产业走务实路径,基础层研发挑战与应用层机遇并存,建议资源投向应用领域优化业务流程 [31] - 赛道呈现百花齐放态势,互联网巨头与垂直创新企业共同推动场景落地 [27][28]
我收到俩BP,一份是Manus(另一份也是)
投中网· 2025-06-16 16:57
公司估值与融资 - 公司4月完成7500万美元融资,估值达5亿美元(约36亿人民币),由Benchmark领投[1] - 近期接近完成新一轮人民币融资,由某地国资领投,金额达数亿元,投前估值37亿人民币[1] - 公司半年内估值翻5倍,成为继DeepSeek之后最热门的中国人工智能初创企业[1] 产品与技术 - 公司产品能处理复杂任务,推出文本转视频生成功能,进入由OpenAI、阿里和腾讯等巨头参与的新兴市场[3] - 产品采用多代理架构模拟人类工作流(Plan-Do-Check-Act),成本为同类产品的十分之一[7] - 产品在GAIA基准测试中性能超越OpenAI同类产品,依赖动态调用GPT-4、Claude等国际大模型[7] - 产品核心功能可在3小时内通过开源技术复刻,被评价为工程能力的胜利而非科学突破[9] 市场与行业 - AI Agent市场预计2035年达到2168亿美金,对应24-35年CAGR为40.15%[5] - AI Agent正通过三层重构颠覆企业服务,预计到2027年40%的企业服务将由AI Agent组合交付[6] - 公司认为大模型已完成搭台任务,为AI Agent能力进阶提供了有力基础[5] - 公司定位为通用模型,未来可能整合市面上多种Agent、Compute use能力[17] 商业模式与商业化 - AI Agent继承APP的规模化分发能力,通过大模型实现服务动态进化、收益与价值实时匹配等突破[6] - 公司ARR已接近1亿美元,标志着进入规模化运营阶段[19] - 公司面临从"单一爆款"进化为"生态型平台"的更大命题[19] 公司战略与定位 - 公司在海外立差异化定位人设,在国内打造全球唯一形象[11] - 公司六大核心能力包括自主操作能力、任务规划与执行、多源信息整合等[13] - 公司更擅长持续优化叙事,吸引投资人关注创始人的叙事能力和智识真诚[18] 产品发展历程 - 公司3月初仅限邀请用户上线,早期邀请码稀缺,二手平台价格炒至5-10万元[3] - 目前已开放公众注册,但中文版本仍在开发中[3] - 公司成立仅三年,推出产品仅三个月,但已获得市场高度关注[17]
豆包大模型再蜕变:跻身全球前列,加速Agent应用落地
中国新闻网· 2025-06-16 15:22
核心能力提升 - 豆包大模型1.6在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集表现跻身全球前列 [2] - 北京市高考海淀区模拟全卷测评中理科成绩提升154分、文科提升90分 [2] - 日均调用量从3月12.7万亿tokens增长至5月底超16.4万亿tokens [2] - 火山引擎在中国公有云大模型服务市场份额达46.4% [2] 定价策略创新 - 企业级0-32K输入区间定价为输入0.8元/百万tokens、输出8元/百万tokens [3] - 综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一 [3] - Seedance1.0 pro视频生成模型每千tokens 0.015元,5秒1080P视频生成成本3.67元 [3] 多模态技术布局 - 模型品类覆盖多模态、视频、图像、语音、音乐等全领域 [4] - 与超50%的985高校(包括北京大学)合作推进教学科研智能化 [4] - 全球Top10手机厂商中9家与火山引擎达成合作 [4] 行业应用落地 - 深度渗透消费电子、汽车、金融、教育等行业 [4] - 与梅赛德斯-奔驰合作搭载CLA车型实现语义理解增强与场景化服务 [4] - 与瑞幸咖啡共建AI点单智能体支持语音下单与个性化推荐功能 [5] - 支持浏览器自动操作(酒店预订)、购物小票识别转Excel等复杂任务 [5] 技术架构优势 - 首创按输入长度区间定价模式实现技术与商业双重创新 [2] - 底层模型支持深度思考与多模态交互(单任务处理达20万tokens) [5] - AI云原生架构持续迭代助力企业大规模部署Agent应用 [4]
【公告全知道】谷子经济+算力+军工+多模态AI+国产芯片!这家公司设立合资企业主要生产军工消音材料
财联社· 2025-06-15 21:59
公司动态 - 公司与上海博物馆等IP合作开发系列文创产品 设立合资企业主要生产军工消音材料 涉及谷子经济 算力 军工 多模态AI 国产芯片领域 [1] - 公司产品已集成抗量子密码算法和量子随机数芯片 涉及军工 量子科技 云计算 数字货币 区块链 AI智能体 芯片 华为鸿蒙领域 [1] - 公司豪掷近60亿元押注光通信赛道 涉及机器人 新能源汽车 光模块领域 [1] 行业热点 - 军工行业与消音材料 量子科技 云计算 数字货币 区块链等技术结合 呈现多元化发展趋势 [1] - 光通信赛道获近60亿元投资 显示行业在机器人 新能源汽车等领域的应用潜力 [1] - 文创产品开发与博物馆IP合作 体现谷子经济与科技融合的新模式 [1]
AI投研应用系列之二:从大模型到智能体,扣子Coze在金融投研中的应用
太平洋证券· 2025-06-15 14:51
根据研报内容,总结如下: 量化模型与构建方式 1. 模型名称:报告解读智能体;模型构建思路:利用Coze平台构建能够自动解读金融报告的智能体,通过插件获取报告内容并调用大模型进行分析[28];模型具体构建过程:在智能体编辑页面输入描述语句生成提示词,新建工作流编辑任务流程,使用文件读取插件提取文档内容及公式结构,配置大语言模型节点定义输出逻辑与格式规范[28][30];模型评价:能够准确解读报告内容并呈现重要公式,提升报告分析效率[31] 2. 模型名称:财务数据分析智能体;模型构建思路:构建能够从网页或插件获取财务数据并用大模型进行分析的智能体[35];模型具体构建过程:通过代码处理节点拼接网页URL,信息爬取节点实时获取财报数据,输入DeepSeek大模型节点进行综合分析[38],或通过新浪财经插件获取数据后输入大模型分析[45][47];模型评价:能够从多个维度生成财务分析和投资建议[39][48] 3. 模型名称:研报总结智能体;模型构建思路:构建能够爬取多篇策略研报并用大模型进行分析总结的智能体[52];模型具体构建过程:使用插件爬取html代码,循环节点处理多条内容,大模型节点提取相关内容并写入飞书多维表格[52][55],添加代码节点将JSON字符串转换为JavaScript对象[69];模型评价:实现用自然语言从html代码中提取内容,节省编写代码的工作[69] 量化因子与构建方式 1. 因子名称:财务分析因子;因子构建思路:从财务数据中提取关键指标作为因子[35];因子具体构建过程:通过爬取或插件获取归母净利润、营业总收入、营业成本、净利润、扣非净利润、股东权益合计、商誉、经营现金流量净额、基本每股收益、每股净资产、每股现金流、净资产收益率、总资产报酬率、毛利率等指标[36] 2. 因子名称:研报分析因子;因子构建思路:从策略研报中提取关键信息作为因子[52];因子具体构建过程:通过爬取获取报告标题、内容、机构名称和链接等信息[55],用大模型提取相关内容并分析总结[52] 模型的回测效果 1. 报告解读智能体,能够准确解读量化领域英文文献并呈现重要公式[31] 2. 财务数据分析智能体,能够从盈利能力、偿债能力、运营能力等维度生成分析[39][48] 3. 研报总结智能体,能够从多篇策略研报中提取关键信息并生成总结[52][60] 因子的回测效果 1. 财务分析因子,包含14个关键财务指标[36] 2. 研报分析因子,包含标题、内容、机构名称和链接等关键信息[55]
当AI来填报高考志愿 ,你听谁的?
上海证券报· 2025-06-14 18:56
通用大模型精调技术 - 阿里夸克基于通义千问发布国内首个高考志愿填报专用大模型,通过"精调"解决严肃场景下的AI幻觉问题[1][3] - 模型采用"高维约束+智能推理+人机协作"决策系统,邀请数百位专家参与监督机制构建[3][4] - 团队蒸馏数万条专家决策数据形成推理链,在最终结果环节增加历史数据校对确保信息真实性[4] 垂类模型训练要素 - 搭建覆盖全国2900多所高校、1600个本科专业的实时更新知识库,所有推理数据需交叉验证[3] - 针对用户认知局限设置12个信息采集点和隐形逻辑条件,调试模型与专家判断的逻辑一致性[4] - 算力投入提升至此前100倍以应对用户高峰,显著增加训练成本[4] Agent产品商业化进展 - 夸克去年服务3000万考生及家长,50%用户来自三线以下城市,今年升级为专家级建议的Agent形式[6] - 行业进入Agent元年,字节跳动推出"扣子空间",百度发布心响App,昆仑万维上线天工超级智能体[7] - 全球AI Agent市场规模预计从2024年51亿美元增至2030年471亿美元,年复合增长率44.8%[7] 行业竞争格局 - 大模型技术红利窗口期缩短,厂商需在几天内跟进OpenAI等巨头的新模型[6] - 天风证券认为Agent赛道更考验产品力而非基础模型的工程能力[7] - 阿里开源WebAgent,字节、百度等厂商加速本土化场景布局[7]
国泰海通研究|一周研选0607-0613
宏观分析 - 全球产业链、货币体系及资产分析框架面临重构,黄金因去美元化及央行购金需求或呈长期牛市,美元美债定价需关注美元信用因素 [3] - 国内经济需求端仍待提振,政策将延续渐进积极基调 [3] - 通胀低位徘徊,私人部门风险偏好回落,资产负债表修复进展有限,下半年政策发力有望更积极 [5] - 5月出口增速回落因关税预期见顶,后续出口中枢回落但仍有韧性 [9] - 美元信用处于脆弱边界的紧平衡,高利率环境抑制私人信贷扩张,政策需平衡长期贸易回流与短期债务风险 [11] 策略与市场动态 - 中国资产交投活跃,融资资金回流,偏股基金新发行规模超百亿,南下资金流入边际下降 [13] - 欧洲央行连续八次降息,上调港股和黄金配置至超配,下调国债至标配 [15] - 港股跑赢A股,稀缺资产(互联网、新消费、创新药等)吸引力强,恒生科技结构更优 [16] 固收与金融工程 - 稳定币新增需求缓解美债短期压力,但需警惕其"影子银行"风险 [18] - ETF扩容利好信用债,沪市ETF规模增长更显著,久期是关键差异变量 [20] - TS合约空单集中反映正套资金入场,后续基差或先走阔后收敛 [22] - 企业生命周期投资策略(初创/成长/成熟/整合)年化超额收益达14%-19.5% [24] - 6月风格日历效应不明显,建议均衡配置大小盘及价值成长 [25] 行业研究 - 人形机器人轴承市场潜力大,国产替代加速带动相关企业机遇 [27] - 618大促周期拉长,单件直降为主流,国补政策提振企业盈利能力 [29] - 低轨星座加速组网,信关站需求释放,硬件与测控服务受益 [31] 重点专题与会议 - 中东局势、周期逻辑梳理、企业级AI Agent应用进展为近期会议焦点 [33]
计算机行业2025年6月暨中期投资策略:AI产业快速迭代,持续看好Agent和算力租赁
国信证券· 2025-06-13 21:37
核心观点 - AI产业持续迭代,Agent成为当下应用最确定性方向,全球AI Agent市场规模预计在2025年达7.9亿美元,2030年增至526亿美元,复合增长率约46% [4] - 谷歌推出Gemini 2.5 Pro,重回AI舞台中心,开源A2A协议打造AI Agent新生态 [5] - 阿里和字节持续推出Agent产品,创业公司百花齐放,互联网巨头加大AI基础设施投资,算力租赁厂商受益明显 [6] - 维持“优于大市”评级,重点关注AI应用和Agent布局厂商及AI算力租赁产业链 [7] AI产业持续迭代,Agent开启应用生态 Google:重回AI舞台中心、Agent生态野心初显 - 谷歌I/O大会推出Gemini 2.5 Pro等产品,AI token调用猛增,提振市场对AI产业信心 [14] - Gemini 2.5 Pro技术进步显著,实现推理过程可视化,还发布了低门槛版Gemini 2.5 Flash [15][17] - 谷歌在图片、视频、音频领域升级明显,开源A2A协议,推出AI Agent扩大生态,还推出两款AI订阅 [18][19][23] 阿里:Qwen3性价比再大幅提升,BC两端Agent生态加速 - 阿里发布Qwen3,包含六款密集模型与两款混合专家模型,开源全系列登顶全球最强开源模型 [26] - Qwen3预训练数据规模更大、质量更高,性能优越,具有多种思考模式、多语言及增强的Agent能力 [27][30][32] - 阿里前瞻成立魔搭社区,MCP应用快速增长,C端心流Agent主打科研,新夸克升级为C端流量入口,B端与亚信科技合作推动AI本地化落地 [40][44][48] 字节:发布多模态Agent,Coze空间开始商业化 - 字节跳动推出UI - TARS - 1.5,在多个评测基准中表现出色,火山引擎借力AI增长,扣子空间开启内测并推进商业化 [51][55][57] 大量创新agent开始涌现 - Manus向全球用户开放注册,推出“文生视频”功能;Lovart专注设计领域,与可灵AI合作;Flowith打造画布式AI创作工具,发布Agent NEO [62][63][66] 算力需求依然景气,租赁订单持续落地 互联网巨头保持高投入,自建和租赁算力并行 - 阿里巴巴FY2025资本开支同比高增,未来3年预计投入超3800亿;腾讯2025年资本开支持续上行,满足AI相关需求 [74][79] 各厂商积极响应,算力租赁订单持续落地 - 海南华铁累计签订算力订单66.7亿元;有方科技子公司与航锦科技合作;智微智能成立子公司开展算力服务;润建股份绑定阿里;协创数据发布算力采购大单 [85][86][91] 投资建议 - AI产业持续迭代,Agent是应用最确定性方向,关注国内推出AI Agent产品公司及AI算力租赁产业 [93][94][95]