Workflow
AI agent
icon
搜索文档
潜在爆款Agent一览
国盛证券· 2025-05-05 23:35
报告行业投资评级 - 增持(维持)[5] 报告的核心观点 - MCP是开放协议,为AI模型连接不同工具提供标准化方式,为AI agent调用外部功能带来全新可能,从AI应用底层体系看,其能增强AI决策与执行能力,更易孕育出好的Agent产品;互联网大厂纷纷接入MCP布局Agent,垂类/通用Agent有望持续迭代升级 [1][2][10] 根据相关目录分别进行总结 MCP打开功能调用全新可能,驱动AI agent体系进一步完善 - MCP是开放协议,标准化了应用程序向大语言模型提供上下文的方式,类似AI应用的万用USB接口,简化了AI模型与数据、工具和服务交互的方式,若工具软件方加入MCP生态,AI agent可更直接调用第三方软件工具,扩展能力边界 [10] - MCP优点包括简化开发、灵活性、实时响应、安全性与合规性、可扩展性,相比传统API接口,在集成难度、实时通信、动态发现、可扩展性、安全性与控制方面有显著优势 [13][14] - 字节扣子已接入MCP,用户可借用第三方软件能力扩展自身agent能力边界;阿里云百炼平台投入MCP体系建设,集成超30款MCP服务,全面支持MCP生态发展 [17][18] 互联网大厂纷纷接入MCP布局Agent,垂类/通用Agent有望持续功能升级 传统功能性APP走向agent化,AI有望带来全新功能升级 - 飞猪推出AI agent“问一问”,可智能化安排旅游攻略,涉及商品可一键下单预订,相比传统旅游AI工具,准确性、可用程度更高,产品交互体验更流畅,其解决传统旅游AI痛点的关键在于开放协议接口+实时数据+多智能体协作 [21][22][24] - 同程旅行推出AI agent“程心AI”,可提供一站式、个性化旅行攻略生成及全流程闭环服务,关键在于设计大模型和大数据结合的体系,基于真实数据结合用户诉求提供高质量旅行方案 [25][26] - 阿里钉钉推出AI助理,可智能化帮助用户完成请假助手、智能日程等办公任务 [28] - 飞书推出智能伙伴,让每个用户拥有专属ai智能伙伴,有长期记忆,更懂用户,还支持部署在飞书上的业务应用 [29] 伴随着MCP带来的功能聚合,通用agent不断涌现 - 夸克从浏览器发展成聚合AI搜索、生图、写作等多种功能的流量入口 [29] - 百度心响是通用AI智能体,通过自然语言交互帮助用户实现复杂任务拆解等,在健康、法律等专业场景实现「多智能体协作」机制 [32] - 360纳米发布MCP万能工具箱,接入超110款工具,覆盖多种场景且工具免费,用户可调用工具创建智能体,解决“AI可用”问题 [33][36] - Genspark是综合性AI agent引擎,具备AI PPT、深度研究等功能,能根据用户查询实时生成个性化页面,提供干净、丰富、互动性强的数字图景 [39] 投资建议 - 建议关注AGENT相关公司,如金山办公、泛微网络等;算力相关公司,如寒武纪、海光信息等;垃圾发电相关公司,如旺能环境、盈峰环境等;互联网大厂AI链相关公司,如寒武纪、恒玄科技等;军工AI相关公司,如能科科技、品高股份等 [3][4][41]
MCP对AI应用的影响
2025-04-27 23:11
纪要涉及的行业和公司 - **行业**:AI行业、金融行业、制造业、政务、医疗、旅游、办公、游戏、视频、SaaS软件行业 - **公司**:阿里、腾讯、字节、百盛集团、Minimax、智谱、Midas、Chorus、佳邦科技 纪要提到的核心观点和论据 国内MCP发展情况 - **发展滞后原因**:模型本身多任务规划与执行能力不足,如阿里千问2.5在多任务规划方面与Cloud 3.7有差距;生态系统不完善,国内无类似国外Manners和CodeBot的超级AI agent;国内大厂采取保守策略,优先在自身生态内发展[2] - **发展前景**:虽目前发展慢,但通过提升模型能力、扩展应用范围、优化生态系统和大厂开放合作,预计一至一年半后有更多震撼性应用出现[4] 阿里相关业务情况 - **钉钉和夸克定位**:钉钉是阿里AI ToB入口级应用,注重商业化落地与营收;夸克是AI ToC入口级应用,关注DAU增长和TOKEN消耗[1][7] - **百炼平台**:定位为专属模型训练和部署平台,通过MCP协议构建agent store生态,商业模式有项目制服务、AI agent销售分成和TOKEN册收入[3][11] - **TOKEN消耗与算力分配**:2025年千问单日TOKEN消耗达5万亿 - 6万亿,引入三方模型后总消耗量增加40%,预计Q2结束时突破10万亿;算力分配优先保证模型训练和实时推理[3][12][13] - **千问模型费用调整**:2025年预计下调30% - 50%,以降低企业使用成本,提高竞争力[1][6][9] 产品情况 - **Manas超级代理入口**:处理复杂任务时TOKEN消耗大,每次约15万 - 30万TOKEN;企业用户接受度高,开发者超千家,日TOKEN调用量3500亿 - 4500亿;定价高因技术壁垒和运营成本高,未来可能降价[1][5][8] - **Zinus产品**:定价每月199美金或299美金,市场反应积极,开发者多,日TOKEN调用量3500亿 - 4500亿;技术溢价性强,未来可能面临价格竞争[1][6] - **通义千问3.0模型**:采用MOE架构节省训练成本,支持128K长上下文窗口;中文语料占比超40%,多模态能力提升;价格竞争力强,生态合作能力好[15][16] MCP协议与应用 - **促进作用**:作为标准化接口协议,提供统一接口,促进agent应用落地,如金融机构和医疗领域已有实际应用案例[17] - **落地应用案例**:集中在旅游规划、金融、制造、政务、医疗和办公等领域,如旅游规划系统可提供路线规划,金融领域可用于贷款审批和投资理财风险评估等[18] AI发展趋势与商业化 - **AI agent发展趋势**:未来将进入AI agent涌现阶段,推动各行业数字化转型和创新[19] - **AI需求增长与商业化变现维度**:关注每日TOKEN调用量、产业端商业化营收数据、优秀超级AI应用宣传[20] 国内大厂AI发展路径 - **腾讯**:主要发力游戏和视频领域,优势在ToC领域[21] - **字节和阿里**:在ToB领域竞争激烈,飞书与钉钉在办公领域形成分流[21] AI产品推广与影响 - **推广现状**:企业推广两极分化,不到10%企业积极拥抱,多数企业需看到市场验证才考虑采用,商业化进程缓慢[22] - **对SaaS公司影响**:既带来转型为MCP工具服务商的机会,也面临失去入口级地位的风险,传统SaaS公司努力将产品AI化[23][24] 其他重要但是可能被忽略的内容 - **H20禁令影响**:导致集团2026年预期采购10万张卡目标难实现,计划用国产卡替代,预计2025年国产芯片在实时推理算力需求中占比超50%,资本开支可能增加[14] - **AI眼镜核心场景**:基于视觉显示和摄像头实时拍照提问,增强AI搜索体验,但关键在于准确度[25] - **企业接入MCP协议渗透率低原因**:企业处于观望阶段,传统SaaS公司需适应新商业模式[26] - **MCP工具服务商接入新AI应用条件**:AI应用具备全能型多任务处理能力时会大量接入[27] - **渗透率情况与加速因素**:目前处于初步阶段,模型能力提升和工程化AI agent能力增强可加速渗透率提升[28] - **佳邦科技作用**:在B端客户落地中进行知识清洗、梳理和调优,确保数据有效利用,提高落地效率[28][29] - **阿里AI知识梳理与调优**:是核心环节,因涉及处理复杂多模态数据,未来平台可能逐渐掌握该能力,减少对外部合作依赖[30][31][32]
OpenAI教你做Agent:2025年,评估标准和如何产品化是Agent的重点
Founder Park· 2025-04-25 21:29
AI Agent技术演进 - 2024年至2025年AI agent的行动能力和交互方式发生质变,头部模型厂商将agentic能力融入模型,成为模型竞赛重点之一 [2] - agent获取信息方式从单次搜索决策模式转变为完全自主的Deep Research模式,能同时打开多个网页节省时间 [3] - OpenAI判断agent可调用的工具数量将在几个月内从10个量级扩展到100个量级 [4] - multi agent系统具备更高可控性和优化潜力,通过任务分拆提升整体工作效率 [5] - vertical agent将直接受益于multi-agent系统发展 [6] 开发者工具与评估 - 开发者需要构建agent评估微调飞轮,通过强化微调能力让模型找到正确tool use路径 [7] - 评估器需能将模型输出与权威资料对比或执行代码验证数学正确性,而非简单字符串比对 [8] - 强化微调方法可推动模型在特定行业深入应用,实现专业化能力提升 [20] - 目前AI领域核心问题是评分机制,如何构建高质量任务和评分器成为重要课题 [21] Computer Use创新 - Computer Use处于早期阶段,VM(虚拟机)需要开发者填补空白,可能出现专门做iPhone VM的公司 [10] - computer use应用场景包括无API的传统软件系统自动化,如医疗行业手工操作和Google Maps街景分析 [22] - BrowserBase和Scrapybara等公司提供computer use模型托管服务,开发者可便捷访问底层控制 [25][26] - Arc浏览器开发的Dia项目将agent深度集成到浏览器中,成为浏览器本身的一部分 [29] 开发者实践与API设计 - multi agent系统通过任务分拆使调试更独立,降低修改风险 [31][33] - OpenAI采用"阶梯式API"设计理念,平衡易用性与可定制性,如向量搜索默认配置可逐步调整 [34] - Assistants API的tool use功能(如文件搜索)找到市场契合点,但使用门槛过高需优化 [36] - Responses API优化多轮交互体验,与MCP生态互补,需深入思考如何更好整合 [37] 行业应用与前景 - AI infra公司垂直化发展仍有市场需求,如Runloop AI为AI coding初创企业提供测试虚拟机 [38] - computer use在网络安全领域应用,如探测网站系统漏洞 [42] - 模型在科学研究领域应用被低估,可能加速科研进程 [53] - 旅游行业存在创新机会,期待AI agent打破传统格局 [56]
OpenAI:computer use 处于 GPT-2 阶段,模型公司的使命是让 agent 产品化
海外独角兽· 2025-04-23 20:41
AI Agent 技术发展 - 2025年AI agent在信息获取方式和工作流上发生重大变化,从单次搜索决策模式转变为完全自主的Deep Research模式,能同时打开多个网页并重新评估立场 [2] - Agent可调用工具数量将在几个月内从10个量级扩展到100个量级,模型将自主判断工具调用路径 [2][8] - Multi-agent系统通过任务分拆提升效率,每个agent专注特定子任务,使调试更独立且风险更低 [3][17] 技术突破与创新 - Chain of Thought与tool use结合使agent能在推理中自主调整工具调用方向,摆脱固定工作流限制 [8][29] - Computer Use处于早期阶段,虚拟机(VM)技术将成为创业机会,可能出现针对iOS等操作系统的专用VM公司 [5][12][25] - 评估微调飞轮成为关键,开发者需构建领域特定评估器验证模型输出的数学正确性和权威性 [4][9] 行业应用与生态 - Vertical agent将直接受益于multi-agent系统,在客户服务等领域形成专业化分工架构 [3][8] - 医疗和法律行业尝试用computer use自动化传统手工操作,如跨应用切换和Google Maps街景分析 [10][12] - BrowserBase和Scrapybara等公司构建computer use基础设施,提供浏览器自动化和远程桌面托管服务 [12] 开发者工具与API演进 - OpenAI推出阶梯式API设计,基础调用仅需4行代码,同时支持50+可配置参数满足高阶需求 [17][19] - Assistants API的tool use功能获市场认可,但使用门槛过高,新版将融合Chat Completions API的易用性 [20] - Responses API支持多轮交互和多重输出,与MCP生态形成互补,强化工具集成能力 [20][21] 未来趋势与挑战 - Agent将深度融入日常产品,如浏览器集成和自动化重复任务,实现"无处不在"的交互 [6][15] - 模型运行时间需从分钟级扩展到小时级以处理复杂任务,算力提升是关键突破点 [8][29] - 科学研究和机器人技术是被低估的应用领域,O系列模型可能加速科研进程 [30][31] 企业实践建议 - 建议企业优先构建内部multi-agent系统解决实际问题,为未来对接公共互联网做准备 [8][28] - AI初创公司应聚焦工作流编排,通过强化微调和CoT工具调用释放模型潜力 [29][32] - 基础设施领域存在垂直机会,如Runloop AI提供测试虚拟机,AIOps公司管理prompt和API计费 [21][23]
资深Agent专家看B端Agent进展
2025-04-16 11:03
纪要涉及的行业和公司 - **行业**:AI、金融、医疗、教育、互联网、制造、零售、医美、传统 SaaS、协同办公 - **公司**:阿里巴巴、钉钉、阿里云、招商银行、云南白药、飞书、金蝶、用友、Salesforce 纪要提到的核心观点和论据 阿里 B 端 agent 布局 - **主要抓手**:依靠钉钉和阿里云,钉钉专注中小企业市场,阿里云侧重中大型企业客户[1][2][3] - **进展**:钉钉落地智能问答、超级工单和舆情监控等标准化 agent;阿里云在质检、银行风险监控等领域取得案例[1] MCP 协议 - **意义**:是 AI agent 与外部应用服务高效交互的核心技术,阿里百炼平台和钉钉魔法棒已运用该协议提升工作流能力[1][5] - **功能**:可连接数据库并调取外部应用服务,但受生态互通性限制,主要在内部生态体系内实现[1][5] - **制约**:AI 对实时动态感知准确度不足,通过接口调取外部应用导致推理笨拙,解决需提升 AI agent 自身能力并与外部应用适配,涉及产业投入和企业配合[1][8] 阿里 agent 领域发展 - **进度**:技术平台打造和垂类场景切入取得进展,单一场景如问答较成熟,但复杂任务闭环有技术难度[1][9] - **问题**:商业化规模化是挑战,如钉钉去年完成 1,700 万任务指标,营收占比仍小[1][9][10] AI agent 商业化 - **问题**:规模化困难,难以直接给企业带来增量,需做好营销并提升多 agent 处理能力[11] - **技术路线**:超级 agent 和多 agent 协同,均需进一步突破[11] 销售模式和定价 - **模式**:解决方案和标品两种模式[2][12] - **定价**:钉钉解决方案售价 20 - 40 万,阿里云 50 - 80 万,毛利润 50%以上;钉钉 AIN 套餐售价 1 万元,包含四个标准化 agent,与标准版捆绑售卖[2][12][13] 钉钉商业化目标和业绩 - **目标**:今年 AI agent 商业化目标为 2 亿人民币[2][13] - **业绩**:去年全年收入 1,700 万元,一半来自解决方案,一半来自 AI 标品[2][13] AI agent 对原有产品销售的带动作用 - **带动作用显著**:销售人员用 AI 作为敲门砖吸引客户,传统 SaaS 模式加入 AI 能力后获客户青睐,中型企业及生态系统成员主动了解 AI 进展[14] 钉钉 AI 业务发展路径 - **弯路**:2023 年尝试 SaaS 与文档、会议结合,未吸引客户额外付费;2024 年初推出零代码开发平台,企业抵触[15] - **转变**:2024 年下半年转向研发标准化应用和完整解决方案,实现市场验证[15] 钉钉财务表现和增长因素 - **表现**:去年年度经常性收入(ARR)达 3.1 亿美元,前年仅 2 亿多美元,还有不到 5,000 万美元的生态和硬件分成收入[16] - **因素**:客户对 AI 技术应用的急切需求,以及钉钉在企业协同办公领域的持续创新[16] AI 技术应用案例 - **银行领域**:与招商银行合作开发贷款审批系统,提高审批效率;用于投资理财分析交易数据和风险预测,但未显著增加业务量,大规模推广有挑战[17][18] - **医疗行业**:与云南白药合作,通过问答系统提升销售效率,利用 OCR 视觉识别进行药材质检;医美行业通过视觉图片识别评估皮肤状况并提供护肤建议,与电商平台打通[19][20] - **教育行业**:应用于学生问答、课程排布、教师考勤率和教学统计的数据可视化;K12 教育用于生成绘本进行兴趣教育[19][20][21] 钉钉与阿里云 AI 定位区别 - **阿里云**:专注底层技术,提供云计算、存储和数据库等基础设施支持,百炼平台面向中大型企业[22] - **钉钉**:侧重于中小企业市场,提供通用 agent 服务[22] 竞争格局 - **传统 SaaS 领域**:钉钉在中小企业市场活跃度最高,飞书次之;大型客户及政企客户方面,金蝶、用友表现强势[23] - **协同办公领域**:由钉钉和飞书主导,随着 AI 商业化推进,阿里投入使钉钉竞争力提升[23][24] - **与其他厂商关系**:用友、金蝶等传统软件厂商是合作伙伴,阿里开放 AI 技术能力形成互补;国际平台如 Salesforce 是竞争对手,阿里巨额投资使其在 AI 平台建设上有优势[25] 其他重要但是可能被忽略的内容 - 目前行业处于早期快速发展阶段,有野蛮增长迹象,未来行业持续变化,竞争格局不断演变[26]
速递|学生创业五周开发,Browser Use获1700万美元押注,Manus的驱动工具之一
Z Potentials· 2025-03-24 12:20
文章核心观点 Browser Use作为AI工具知名度不断增长,筹集1700万美元,其将网站元素分解为“文本式”格式,可满足AI公司让AI agent与网站互动的需求,被认为是网络AI代理领域有潜力的工具 [2][4] 公司情况 - Browser Use由工学院的学生项目加速器创办,穆勒和祖尼克于2024年相识后共同提出将网络爬虫与数据科学结合的想法,在五周内构建演示版本并开源 [2][3] - 公司创始团队及其开源优先的方法促成了Felicis的投资 [4] 产品特点 - Browser Use本质上将网站的按钮和元素分解为“文本式”格式,供代理使用,有助于代理理解选项并自主决策,能以更低成本反复执行相同任务 [4] 市场需求与应用 - 越来越多AI公司希望AI agent能更优雅地与网站互动,Browser Use可成为满足此需求的“基础层”,当前Y Combinator冬季批次中有超20家公司使用 [4] - 有些公司希望让代理更容易浏览其网站,部分网站如LinkedIn经常改变工作方式导致代理易失败 [4] 行业观点 - 网络AI代理是下一个前沿领域,有助于实现人类任务的端到端自动化,AI agent是静态预训练模型与不断变化的数字环境之间的动态桥梁 [5]