Workflow
Agent(智能体)
icon
搜索文档
WAIC观察|Agent替代打工人还要多久?
第一财经· 2025-07-30 14:09
Agent行业现状 - Agent成为2025世界人工智能大会(WAIC)的热词,京东、百度、蜜度、亚马逊等企业均有相关产品展示 [1] - LangChain调查显示超过50%的公司已在生产环境中部署Agent,近80%正在开发中 [4] - 国际创投数据库Crunchbase显示,截至2025年6月AI Agent初创公司总共筹集约7亿美元 [4] 垂类Agent发展 - 垂类Agent相比通用Agent更受关注,因其业务明确、数据扎实且更容易锁定商业化订单 [2] - 蜜度针对舆情、公文写作、校对场景推出三个智能体新品,使用十多年积累的行业语料 [2] - 百度智能云推出"数字员工"形象,如"产品经理胡馨月"负责金融、科技等垂直行业任务 [4] 技术挑战 - 企业面临数据清洗复杂、语义难准、行业语料稀缺等难题,向量化处理质量直接影响Agent效果 [3] - 需要团队基于专业积累进行判断,没有捷径可走 [3] - 部分智能体存在基础理解问题,如分不清Apple公司和苹果水果 [7] 商业化尝试 - 京东云开源JoyAgent智能体,上线GitHub三天收获1000颗星标 [3] - AI硬件创业者尝试将Agent与硬件结合,如京东展出的教育类、陪伴类智能体硬件 [9] - Gartner预测到2027年末超过40%的代理型AI项目可能因成本、价值或风险问题被取消 [8] 行业观点 - 企业更倾向将Agent作为辅助工具而非替代品,关键判断和责任环节仍需人工把控 [5][6] - 当前存在技术进步速度与应用落地之间的gap,涉及稳定性、责任边界和数据安全 [5] - 真正有价值的Agent应在特定场景合理"出场",而非追求完全替代人类 [13]
李彦宏说的「MCP」,还有人不知道吗?
36氪· 2025-04-28 17:44
核心观点 - MCP(Model Context Protocol)作为AI领域的统一协议,正在推动AI应用生态的标准化和开放化,有望引发2025年AI应用大爆发 [5][9][10] - MCP通过定义大模型与外部工具交互的标准接口,显著降低AI应用开发门槛,开发者无需再为不同工具编写适配代码 [12][14][20] - 全球科技巨头(OpenAI、谷歌、Meta、阿里、腾讯等)已全面接入MCP协议,推动形成统一生态,全球MCP服务器数量超4000个且快速增长 [8][20][25] - MCP的开放性与抽象性使其成为行业共识,对比OpenAI封闭的GPTs商店策略,MCP更符合开发者需求和技术演进方向 [29][30] MCP协议定义与价值 - MCP全称Model Context Protocol,是由Anthropic于2024年11月推出的开放标准,相当于大模型的"万能插座",统一数据源与工具的交互语言 [12][13] - 核心价值在于标准化:服务方(如高德地图、微信读书)维护MCP服务器,开发者可直接调用,代码复用率提升80%以上 [7][14][20] - 典型应用场景:AI旅游助手开发中,MCP使地图查询、攻略检索等功能调用效率提升3倍,Token消耗减少50% [16][19][20] 行业生态发展现状 - 2025年2月起,Cursor、VSCode等主流开发工具支持MCP协议,3月OpenAI/谷歌相继接入,标志大模型厂商战略转向开放生态 [24][25][26] - 国内阿里云魔搭社区等平台已整合MCP服务,百度李彦宏将当前MCP开发类比"2010年移动APP开发"的黄金期 [5][18] - 现存问题:部分MCP服务器功能不完善(如某度地图仅20个工具)、文档缺失,非官方服务的稳定性与安全性存疑 [21][22] 技术对比与竞争格局 - 相比OpenAI的Function Calling,MCP将工具调用封装为"乐高积木"式模块,开发效率提升60%且兼容任意AI模型 [17][29] - OpenAI封闭式GPTs商店策略失败:商店中70%应用为低质套壳,商业化受阻;MCP开放路线重新赢得开发者 [28][30] - Anthropic通过MCP实现生态逆袭,OpenAI/谷歌等被迫跟进,行业进入"开放协议主导"的新阶段 [27][30] 市场影响与未来预期 - MCP协议推动AI应用从"散点创新"转向规模化爆发,2025年有望出现首个用户破亿的AI超级应用 [8][10] - 协议标准化使AI应用开发周期缩短40%,初创公司Manus等先行者已验证商业可行性 [6][18][20] - 长期博弈点:大厂核心数据开放程度将决定MCP生态上限,目前工具调用深度仍受厂商限制 [21][22]
李彦宏说的「MCP」,还有人不知道吗?
36氪· 2025-04-28 09:26
MCP协议概述 - MCP全称为"Model Context Protocol",是一种允许大模型标准化调用外部工具的开放协议 [6] - 该协议由Anthropic于2024年11月首次推出,2025年2月开始全球范围快速普及 [6][12] - 类比为给大模型安装"万能插座",统一不同工具间的交互标准 [6] 行业应用现状 - 高德地图、微信读书等应用已推出官方MCP服务器供开发者调用 [2] - OpenAI、谷歌、Meta及国内BAT等科技巨头均宣布支持MCP协议 [2] - 全球已有超过4000个MCP服务器上线,数量持续快速增长 [12] 技术价值 - 解决大模型与外部工具交互缺乏统一标准的问题,提升代码复用性 [11] - 开发者无需维护工具性能,只需专注应用开发,工作量减少50%以上 [12][13] - 支持云端/本地多种部署形式,不限制底层模型类型 [19] 生态发展 - Cursor、VSCode等主流开发工具2025年2月起支持MCP协议 [16] - OpenAI于2025年3月27日宣布支持,成为生态转折点 [16] - 对比封闭的GPTs商店,MCP开放特性更受开发者青睐 [18][19] 现存挑战 - 部分MCP服务器工具不足20个,存在功能不完善问题 [15] - 非官方维护的服务器存在安全性和稳定性风险 [12][15] - 大厂商可能保留核心数据接口,未完全开放能力 [15] 行业影响 - 被类比为AI领域的"秦始皇统一标准",可能引发2025年AI应用爆发 [4][5] - 促使大模型厂商从封闭生态转向开放合作战略 [17][21] - 开发门槛降低使AI应用创新从"星星点点"转向规模化发展 [3][5]
一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
AI科技大本营· 2025-04-27 15:12
大模型技术演进 - 大模型作为产业变革核心引擎,通过RAG、Agent与多模态技术重塑AI与现实的交互边界,推动行业从效率革新迈向业务重构 [1][2] - RAG突破大模型静态知识边界,解决数据时效性、隐私安全与专业适配等关键难题 [2][12] - Agent重构人机协作范式,具备自主决策与多任务协同能力 [2][5] - 多模态大模型解锁复杂场景落地潜力,实现跨模态语义理解 [2][6] RAG技术 - RAG通过外挂实时知识库解决大模型知识固定、数据隐私、可解释性及成本优化问题 [12][14][15][16] - 相比传统生成模型,RAG支持动态知识更新、答案可追溯至检索文档,适用于需事实性支持的场景 [17][19] - RAG构建面临文本向量化、多模态文档处理及可控检索等挑战,需优化分块策略与检索架构 [20][21][23][27] - 未来方向包括多模态文档统一处理范式与记忆驱动RAG,后者利用LLM的KV缓存实现动态索引 [28][32][34] Agent技术 - Agent通过感知层、决策层、执行层形成自主性系统,结合LLM、规划与工具实现复杂任务处理 [39][42] - 分为自主智能体(任务执行)与生成智能体(内容创作),MetaGPT和AutoGen为当前主流框架 [44][49][50][52] - Multi-Agent系统通过分布式协作解决非线性动态任务,提升容错能力与资源管理效率 [53][56][58] - 行业应用需突破任务解构、动态环境适应及价值观对齐等难点,采用元学习、联邦学习等技术优化 [59][62][63] 多模态大模型 - 紫东太初项目将目标检测、分割等CV任务统一到图文大模型,增强局部感知能力,在RefCOCO等任务中精度超越专有模型 [67][69][73][74] - 360研究院开放世界目标检测技术提升图像理解与语义融合能力,应用于自动驾驶等领域 [78][79][83] - 腾讯视频号审核系统融合多模态内容理解与文本RAG,通过垂类大模型与分甬道审核提升效率 [84][85][88][92][96] 未来趋势 - 算法层面向全模态能力发展,产品层面涌现人机协同复杂系统,领域层面与垂类场景深度结合 [98][100][103] - RAG、Agent与多模态将深度融合,形成感知-认知-决策闭环,催生手术机器人等新一代产业智能体 [100]