Workflow
MCP
icon
搜索文档
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 22:10
Agent定义与核心特征 - Agent是基于环境反馈使用工具的程序 采用Anthropic的定义[2] - 核心三要素包括状态(Context)、行动(Tool Use)、激励信号(RL反馈机制)[32][33] - 与RL强关联 需理解强化学习才能设计优质Agent产品[31] Agent技术演进 - 2023年4月AutoGPT为代表的早期Agent更像玩具 实际应用价值有限[4] - 当前Agent已能在工作生活场景中真正解决问题 实现价值跃迁[5] - 进步源于:1)底层模型能力提升(如RL结合、长思维) 2)工程产品突破(Context构建)[6][7] Context工程创新 - Context是大模型执行任务所需信息总和 不同产品Context构成不同[8] - 相比传统RAG Agent能自动化提炼Context 减少人工干预[10][11] - 优质Context需包含用户历史行为路径 如APP打开瞬间即提供海量意图线索[48][49] Tool Use技术方案 - Function Call/MCP/A2A属于代码驱动派 Computer Use/Browser Use属于视觉模拟派[13] - MCP核心价值在于统一Tool Use标准 降低工具调用门槛[12] - Browser Use存在纯视觉方案(如已倒闭的Adept)和API包装方案 后者更成熟稳定[15] 产品设计方法论 - Chat是最佳交互入口 保障用户自由度优于追求准确度[41] - 需解决双重信任问题:开发者信任模型能力 用户信任执行过程[52][54] - 垂直领域Agent将长期主导 通用Agent面临收敛困难[25][46] 行业竞争格局 - 当前Agent可分为:1)Coding Agent(交付代码) 2)调研Agent(交付报告) 3)表格Agent(定量分析)[61][64] - Sheet0实现100%准确率 核心在于模块化工具复用与AI Coding验证[57][67] - AI Coding与Agent存在协同效应 但直接编码执行任务成本过高[29][30] 发展关键变量 - 模型能力突破与Context工程进步是两大核心驱动因素[69][70] - 需构建完整评估体系(激励信号) 确保系统可收敛[35][71] - 产品需平衡通用性与准确性 不同场景选择不同技术路径[59][60]
百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用,帮助开发者全面拥抱MCP
雷峰网· 2025-04-26 18:00
百度AI开发者大会核心发布 - 公司发布文心大模型4.5 Turbo和X1 Turbo两大升级模型 具备多模态 强推理 低成本三大特性 [2][5] - 文心4.5 Turbo价格下降80% 每百万token输入0.8元 输出3.2元 为DeepSeek-V3价格的40% [5] - 文心X1 Turbo价格下降50% 每百万token输入1元 输出4元 为DeepSeek-R1价格的25% [5] - 两大模型多模态能力与GPT 4.1持平 优于GPT 4o 在多个基准测试中表现突出 [7][9] - X1 Turbo基于4.5 Turbo深度优化 思维链 逻辑推理 工具调用能力全面增强 效果领先竞品 [11] 多模态应用创新 - 高说服力数字人实现声形超拟真 内容专业 互动灵活 可应用于电商直播 游戏 消费等领域 [13] - 数字人具备剧本生成能力 表情语气动作实时匹配台词 情绪转折自然流畅 [13] - 数字人集成AI大脑 能根据直播数据实时调度助播 场控等角色 实现单人营销团队 [13] - 百度慧播星上线"一键克隆"功能 用户通过2分钟视频即可生成专属数字人主播 [14] - 沧舟OS是全球首个内容操作系统 支持多模态内容解析 向量化处理 混合生成 [14] - 百度网盘AI笔记实现视频与笔记同屏联动 可生成思维导图 出题测试等 [16] - 百度文库AI付费用户超4000万 月活9700万 网盘AI月活超8000万 [17] 多智能体技术突破 - 代码智能体"秒哒"向全社会开放 支持无代码编程 多智能体协作 多工具调用 [18] - 秒哒可协同产品经理 架构师等智能体 调用云服务组件 几分钟完成应用开发 [18] - 通用超级智能体"心响"支持复杂任务分解 已覆盖200个任务类型如租房维权 旅游规划 [21][22] - 多智能体协作成为高价值方向 从问答转向任务交付 需多角色协同执行 [21] 开发者生态建设 - 发布AI开放计划 为开发者提供流量收益 建立MCP server发现平台 [23] - 智能云千帆平台集成电商交易MCP服务 支持从推荐到购买的完整流程 [24] - 启动第三届"文心杯"创业大赛 最高投资额达7000万元 [27] - 未来5年计划培养1000万AI人才 [27] - 点亮国内首个全自研三万卡集群 支持千亿参数大模型全量训练 [29] 财务与战略动向 - 公司2024年营收1331亿元 智能云Q4同比增长26% [32] - 将110亿回款全部投入AI基础设施研发 [31]
“DeepSeek不是万能的”,李彦宏今年押注AI 应用:模型价再“打骨折”,重点布局多智能体、多模态
AI前线· 2025-04-25 16:25
百度Create开发者大会核心发布 - 百度发布文心大模型4.5 Turbo和X1 Turbo两款新模型,具备多模态、强推理、低成本特性,价格最高降80% [5][6][14][15] - 文心4.5 Turbo多模态能力与GPT 4.1持平、优于GPT 4o,X1 Turbo性能领先DeepSeek R1/V3最新版 [7][11] - 国内首个全自研三万卡集群点亮,可同时承载多个千亿参数大模型全量训练,支持1000用户并发百亿参数精调 [2][46] 模型技术突破 - **多模态能力**:通过异构专家建模、自适应分辨率编码等技术,跨模态学习效率提升近2倍,理解效果提升超30% [20] - **训练优化**:自反馈增强框架实现"训练-生成-反馈-增强"闭环,降低幻觉;融合偏好学习的强化学习技术提升结果质量判别准确率 [21][22] - **深度思考**:结合工具调用构建复合思维链,问题解决能力显著提升;数据建设闭环实现高效知识生产 [23][24] AI应用创新 - **多智能体应用**:推出"心响"App实现多AI协作,支持健康咨询联合会诊、法律智囊团等场景 [28][29] - **多模态应用**:高说服力数字人具备AI大脑,可自主调度直播资源,百度慧播星支持2分钟视频克隆数字人 [31][33] - **沧舟OS**:全球首个内容操作系统,支持多模态解析/生成,百度网盘AI笔记可一键生成视频思维导图 [38][39] 开发者生态支持 - **MCP协议**:百度智能云千帆平台全面兼容MCP,提供第三方Server发现、电商交易等服务,降低开发适配成本 [40][42] - **人才培养**:5年630万AI人才计划提前完成,未来5年将再培养1000万人才 [44] - **成本优化**:文心4.5 Turbo API价格降至DeepSeek-V3的40%,X1 Turbo价格仅DeepSeek-R1的25% [14][15]
李彦宏:有了超级能干的基础模型,就可以打造出超级有用且有趣的AI应用
IPO早知道· 2025-04-25 13:35
百度AI开发者大会核心发布 - 百度创始人李彦宏在Create2025大会上发布文心大模型4.5 Turbo和X1 Turbo两大新模型,具备多模态、强推理、低成本特性 [2][3][8] - 文心4.5 Turbo输入价格降至每百万token 0.8元(降80%),输出3.2元,性能对标GPT 4.1多模态能力 [3][8][11] - X1 Turbo输入价格每百万token 1元(降50%),输出4元,思维链和推理能力领先DeepSeek R1/V3 [8][15] 模型技术突破与行业影响 - 新模型强化多模态能力,文心4.5 Turbo在基准测试中持平GPT 4.1、优于GPT 4o [11][13] - X1 Turbo基于4.5 Turbo升级,增强问答、创作、逻辑推理及工具调用能力 [15][16] - 公司判断纯文本模型市场将萎缩,多模态模型将成为主流 [11] AI应用生态布局 - 发布高说服力数字人,支持电商直播场景的拟真交互与实时营销策略调整 [17][18][19] - 推出全球首个内容操作系统沧舟OS,集成多模态解析与三库三器架构,百度网盘AI笔记实现视频学习联动 [20][22] - 百度文库AI付费用户超4000万,AI月活达9700万;网盘AI月活超8000万 [23] 智能体与开发者支持 - 无代码工具"秒哒"开放后实现5元低成本应用开发,支持多智能体协作 [26][27] - 通用超级智能体"心响"覆盖200个任务类型,如租房维权全流程服务 [30][31] - 启动第三届文心杯创业大赛,最高奖励7000万元,计划5年培养1000万AI人才 [35] 基础设施与开放生态 - 点亮国内首个全自研三万卡集群,支持千亿参数大模型全量训练与千客户并发 [37] - 发布AI开放计划及MCP server平台,集成电商交易与搜索服务,加速开发者应用落地 [33]
从搜索到解决方案:解锁火山 DeepSearch 的“三连跳” MCP 玩法
歸藏的AI工具箱· 2025-04-24 17:34
火山开发者见面会核心发布 - 推出DeepSearch深度搜索复合应用服务 集成联网搜索、知识库、网页解析、Python代码执行器等MCP服务 开发者无需配置即可直接调用[5] - 发布豆包深度思考模型Doubao-1.5-thinking-pro和视觉理解模型Doubao-1.5-vision-pro 后者在视觉推理领域表现突出[5] - 推出方舟×RTC硬件解决方案 整合端侧自动唤醒与云端大模型语音能力 可快速赋能智能家居、穿戴设备等实现自然对话功能[5] DeepSearch技术实现与优势 - 采用多层级架构:API网关处理指令鉴权 Supervisor Agent生成任务规划 Work Agent并行调用Search/Knowledge等MCP服务 最终由Summary Agent聚合结果[25] - 底层融合Doubao-1.5-thinking-pro、Doubao-1.5-pro和DeepSeek-R1多模型 分别处理长链推理、指令遵循等不同场景[26] - 实现服务即插即用 MCP插件符合统一协议 支持新插件自动编排 开发者可通过veFaaS实现一键复制与托管[27] 实际应用表现 旅游规划场景 - 动态分步骤搜索 针对雨崩村、南极洛等特定地点实时检索最新信息 避免上下文遗忘问题[4] - 输出高度结构化 剔除景区介绍类冗余信息 聚焦交通安排、徒步装备等实用数据 并准确提示6月杜鹃花季等季节性信息[6] - 危险项目预警完善 针对高海拔徒步提供详细注意事项与必备装备清单[6] 行业数据调研场景 - 新能源汽车上险量查询中 明确标注13-20日数据可用范围 自动排除未更新的17-24日数据 来源链接可验证[13] - 信息分层呈现 优先展示产业新闻与总体数据 其次为车企动态 最后整合社交媒体热度趋势 符合问题需求优先级[13] 开发者使用路径 - 登录火山方舟平台后 通过应用广场获取深度推理应用 支持最大10层任务拆解测试[18][23] - 提供个性化提示词优化功能 测试阶段可收集用户输入进行调优[23] - MCP服务广场集中展示各类插件 支持Trae等IDE环境一键安装[26] 行业生态影响 - MCP技术显著降低AI能力探索门槛 模型功能更新周期从月级缩短至即时可用[26] - 头部厂商加速整合开发生态 通过标准化协议实现前端/业务系统无缝对接[27]
从搜索到解决方案:解锁火山 DeepSearch 的“三连跳” MCP 玩法
歸藏的AI工具箱· 2025-04-24 17:34
火山开发者见面会发布内容 - 公司发布RTC硬件和DeepSearch服务 其中DeepSearch服务将AI搜索信息加工和再整理能力应用化 大幅降低开发者使用门槛 [3] - 公司正式发布豆包深度思考模型Doubao-1.5-thinking-pro和视觉理解模型Doubao-1.5-vision-pro 其中视觉推理能力表现突出 [5] - 推出方舟×RTC硬件解决方案 实现端侧自动唤醒与云端大模型语音能力打包 可快速升级智能设备对话能力 [5] - 深度搜索复合应用服务DeepSearch集成联网搜索、知识库、网页解析、Python代码执行器等丰富MCP服务 开发者无需配置即可直接调用 [5] DeepSearch服务功能特点 - 在旅游规划场景中 服务能精准搜索实时信息 如交通安排、行程顺序、危险项目注意事项等 避免输出景点介绍的冗余内容 [4] - 针对特定需求(如必须前往雨崩村和南极洛) 服务会分步骤精准搜索相关信息 避免一次性搜索导致上下文遗忘 [6] - 在新能源汽车行业数据查询测试中 服务诚实反馈未找到17-24号上险量数据 但准确提供13-20号数据 并合理组织产业新闻、总体数据、厂家动态等内容 [10] - 服务能根据问题复杂度自动调整任务拆解层数 最多支持10步 并支持通过提示词优化实现个性化 [16] 技术实现方案 - 底层同时挂载Doubao-1.5-thinking-pro、Doubao-1.5-pro和DeepSeek-R1等多模型 实现复杂逻辑与摘要生成的协同 [20] - 采用API网关安全鉴权 Supervisor Agent生成Planning并分配子任务 Work Agent调用外部能力的技术架构 [20] - 所有MCP插件符合统一协议 新插件可被Supervisor自动编排 开发者可一键复制广场模板并部署 [21] - 服务对外暴露OpenAI兼容接口 实现前端、Bot、业务后台的零改动集成 [21] 开发者生态建设 - 公司上线MCP Servers广场 提供大量MCP服务 支持一键体验和安装 并提供Trae等IDE的安装命令 [23] - 通过火山方舟平台 开发者可快速体验和应用DeepSearch等能力 大幅降低MCP使用门槛 [12][16][18] - 行业趋势显示 国内大厂正加速拥抱MCP技术 并通过生态整合降低使用门槛 使AI能力探索周期从月级缩短 [24]
人工智能行业专题:大厂Agent来临,MCP拓宽应用边界
国信证券· 2025-04-24 15:52
报告行业投资评级 - 优于大市(维持评级) [1] 报告的核心观点 - Agent发展打开人机协同全新范式,为AI应用提供新发展思路,未来模型能力持续提升,各领域Agent将成模型触达终端用户的载体,持续看好AI应用后续发展 [2][33] 根据相关目录分别进行总结 字节跳动:发布通用Agent,掀开大厂竞赛帷幕 - 4月18日晚间,字节跳动扣子空间开启内测,定位通用Agent,采用邀请码制,用户可选择通用实习生或行业领域专家,通过与AI互动完成工作任务 [5] - 扣子空间特点:从回答到解决问题全线打通,拥有专家Agent生态,有探索/规划双模式,支持MCP扩展集成 [5] - MCP是开放标准协议,集成MCP扩展可扩展Agent能力边界,国内大厂纷纷布局MCP,有望成为AI时代的HTTP协议,提效AI应用开发、加速生态扩展 [8] - 扣子空间优点:内容全面、输出文档能力优秀、人机协同能力强,支持多任务同时进行,分专家和通用模型,MCP扩展集成解决调用数据问题并提供应用接入入口 [11] - 字节跳动发布扣子空间拉开大厂布局通用Agent序幕,阿里、腾讯等公司有望迅速推进,相关生态有望加速扩张 [2][11] 智谱:全栈自研,开源推动生态 - 3月31日,智谱发布AutoGLM沉思,具备深度研究和实际操作能力,能模拟人类思维过程,完成数据检索、分析到生成报告 [15] - AutoGLM沉思技术演进历经多阶段,核心链路技术与32B/9B GLM模型于4月15日全面开源 [15] - AutoGLM沉思核心在于深度思考、感知世界和工具使用三大能力,以智谱新推出的沉思模型为基础,可通过强化学习提升模型能力 [15] - AutoGLM沉思利用智谱自主研发的全栈大模型技术,新版基座模型GLM - 4 - Air - 0414参数量320亿,新版推理模型GLM - Z1 - Air性能与DeepSeek - R1媲美,推理速度提升8倍,成本降低至1/30 [19] - AutoGLM系列模型在多个测试环境中取得SOTA成绩,特别是在Phone Use和Browser Use基准测试中超越顶尖模型 [19] - AutoGLM沉思能回应开放式复杂问题,已在智谱清言PC客户端上线preview版本,未来两周将扩展更多智能体执行能力 [19] - AutoGLM沉思进步:叠加环境交互能力,输出内容更全面,降低AI技术使用门槛;核心模型逐步开源,推动生态扩展和应用场景催化;比Manus更灵活、高效、易于访问,无明确任务限制,自主研发具备更高灵活性、控制力和成本效益 [20] Genspark:整合多AI模型提供准确响应 - 美国时间4月2日,景鲲发布Genspark超级智能体,宣称是综合性AI助手,可协调多个AI工具高效执行任务,在GAIA Benchmark测试中表现超越多个产品 [28] - Genspark采用整合多AI模型的混合代理(MoA)系统,包含80多个工具集和10多个高级数据集,背后有9个模型,能汇总和优化多个高级模型的响应 [28] - Genspark 3月上线iOS应用程序,定位超级AI应用,集多种功能于一体,新注册用户有免费体验积分,PLUS会员需付费,价格为239.88美元/年或24.99美元/月,每月可获10000使用积分 [31] - Genspark特点:调用不同模型完成任务,内部构建可靠工具集和数据集,信息来自可靠来源,无广告和商业偏见,可提高效率 [31] 投资建议 - Agent时代到来,海外垂直Agent和国内通用Agent发展,相关生态有望快速发展,覆盖下游领域、实现全面自动化 [33] - C端Agent重塑流量入口,B端Agent对垂直私域数据进行智能体改造或将率先落地 [33] 相关标的梳理 - 通用企业Agent领域,用友网络、金蝶国际、泛微网络等公司有相关布局 [34] - 金融领域,中科金财、顶点软件、天阳科技等公司有相关产品和服务 [34] - 政务领域,博思软件、久其软件在相关领域开展应用和预研工作 [34] - 法律领域,华宇软件、金桥信息利用大模型和Agent技术助力业务 [34] - 医疗领域,嘉和美康、国脉科技推出相关智能体产品 [34] - 工业领域,赛意信息、鼎捷数智构建相关平台和智能体 [34] - 虚拟机领域,深信服提供安全和管理相关Agent [34] - 营销领域,新大陆发布AI营销助手 [34]
扣子空间:字节首款Agent,比豆包更像助理
新财富· 2025-04-23 14:41
AI Agent行业发展 - 2025年被预测为"AI Agent之年",Manus的出现让用户首次体验到AI能自主操作电脑、浏览器和编写代码,定义了Agent类产品的基本形态 [2] - 字节跳动于4月18日推出首款toC Agent应用"扣子空间",定位为"通用实习生"与"领域专家",具备无限拓展能力 [4] - 行业竞争焦点已从大模型性能转向工具完善程度,MCP协议成为降低AI调用工具门槛的关键技术 [43] 扣子空间产品评测 - 提供探索模式和规划模式两种开发方式,后者允许用户修改AI生成的思维路径,确保交付结果更符合预期 [5][6] - 在旅行规划测试中,能调用高德地图插件生成可视化行程,但初期攻略颗粒度较粗,经细化要求后可提供包含具体餐馆、价格的高价值攻略 [6][7][8][10] - 成功开发俄罗斯方块HTML游戏并自主添加计分系统,但在更复杂的愤怒小鸟游戏开发中出现较多BUG [14][16][17] - 具备GUI交互能力,能在虚拟机中打开4399网站但受限无法自主游玩游戏 [23] 字节跳动Agent技术布局 - 内部至少有5个团队开发不同Agent产品,包括未公开的DevAgent和开源的Agent TARS [27][29] - TARS采用MCP协议并具备GUI交互能力,其视觉技术支持来自自研UI-TARS大模型,在7个GUI评测基准中取得SOTA表现 [33][34] - UI-TARS-1.5版本在Windows Agent Arena(50步)测试中得分42.1,远超此前29.8的SOTA水平 [34] MCP协议行业影响 - 被类比为"AI时代的HTTP协议",通过统一接口规范解决大模型访问不同数据库的难题 [40] - 字节、阿里等大厂积极布局,阿里在百炼平台、通义千问和蚂蚁百宝箱等产品线接入MCP服务 [43] - 推动互联网数据壁垒打破,使AI能力从简单对话转向实际生产力工具 [43] 行业未来展望 - 扣子空间验证了Agent产品形态的核心定义:调用工具完成复杂任务 [47] - 多数互联网大厂都在研发Agent产品,通义千问正合作开发中文版Manus [47] - Agent产品将快速普及并改变用户生活方式 [47]
扣子空间一手实测:字节的第一个Agent,比Manus如何?
Founder Park· 2025-04-21 20:23
产品发布与内测 - 4 月 17 日,豆包·深度思考模型发布,同步升级文生图模型 3.0、视觉理解模型,推出 OS Agent 解决方案及 AI 云原生推理套件[29] - 4 月 18 日晚间,字节跳动扣子空间开启内测,定位通用 Agent,采用邀请码制[3] 产品功能与体验 - 扣子空间用户可选择「通用实习生」或「领域专家」完成工作任务,有探索和规划两种模式,支持添加 MCP 扩展[4][7][13] - 实测中,制定旅游攻略和一周穿搭任务部分完成,专家助手任务出现 Python 脚本调用失败、API 权限异常等 Bug[6] - 接入语音合成工具可将文字攻略转成语音,查天气推荐穿搭可输出图片[15] 专家 Agent 情况 - 扣子空间内置「用户研究专家」和「华泰 A 股观察助手」两个专家 Agent,限时免费,前者单任务平均耗时 4 分钟,后者 23 分钟[24][25] - 「华泰 A 股观察助手」执行任务不稳定,出现数据未获取、Python 脚本调用失败等问题[26][27] 行业趋势与战略 - 2025 年之前被称为 Agent 之年,manus 加速大厂在该领域推进[29] - 做好 Agent 技术上需更强多模态模型、更好架构和工具、降低模型推理成本和延迟,字节或已做好准备[30][31] - 火山引擎通过多种方式全面推进 Agent 生态建设,未来 Agent 定义和应用场景将更清晰[32] - 字节的 Agent 战略以技术突破、生态协同和成本优势为核心[33]
A股五张图:万亿成交,百个题材
选股宝· 2025-04-21 18:35
市场行情 - 市场整体缩量走强,主要股指悉数上涨,沪指、深成指、创业板指分别收涨0.45%、1.27%、1.59% [3] - 市场呈现普涨格局,超4300只个股上涨,仅800余只个股下跌 [3] - 题材炒作活跃但杂乱,大飞机、跨境支付、黄金白银、AI智能体等多个概念板块均有强势表现 [3] 人形机器人 - 全球首个人形机器人马拉松赛事举行,20支队伍参赛,天工Ultra机器人夺冠,松延动力的“小顽童”获第二名 [6][7] - 宇树科技的G1人形机器人在比赛中摔倒引发讨论,公司澄清未直接参赛,表现差异源于不同团队的算法和操作,并正筹备格斗直播 [8][9] - 资本市场反应积极,人形机器人板块整体大涨3.5%,相关概念股如天奇股份(涨超7%)、利亚德(涨超11%)等表现强势 [9] MCP概念 - MCP是一项由Anthropic推出的标准化协议,技术定位类似“AI应用的USB-C接口”,旨在简化AI集成并降低开发门槛 [11] - 字节跳动新AI协同办公平台“扣子空间”开启内测并支持MCP扩展集成,成为板块重要催化因素 [11] - MCP概念股集体爆发,东方材料、恒锋信息(20CM涨停)等多股涨停,带动AI智能体板块大涨 [12] 跨境支付(CIPS) - 跨境支付概念早盘走强,板块收涨3.41%,海联金汇、信雅达等个股涨停 [14] - 板块走强受政策面支持,中国人民银行等联合印发方案,提出提升人民币跨境支付系统(CIPS)功能和全球网络覆盖 [14] 造纸及关联板块 - 造纸板块午后走强,安妮股份、华泰股份等涨停,催化因素可能包括“知识产权强国建设”发布会消息 [16][17] - 板块上涨更深层次原因可能源于原材料供应紧张,有报道称进口绒毛浆成本因关税骤增,导致国内现货报价翻倍,涨幅近50% [20] - 三胎概念中的可靠股份、百亚股份等涨停,其上涨逻辑可能与纸尿裤等产品的原材料涨价预期相关 [19][20]