Agent

搜索文档
当前Agent的发展进行到了什么阶段?
中信建投· 2025-05-16 15:25
报告行业投资评级 未提及 报告的核心观点 - Agent虽无明确产品定义,但类别与应用场景迅速丰富,中美大厂发展思路有差异,B端厂商均关注平台化布局,其发展有望带动AI产业链向上,建议关注技术突破到商业化落地拐点 [2][3] - 工程师流程调优与否对应Agent发展两条路线,学界强调自主规划,业界关注独立完成任务能力 [2][6][15] - Agent类产品对算力消耗大,AI底层算力需求是产业重要一环,当前落地面临多种问题,技术迭代下商业化规模落地可期 [3] 根据相关目录分别进行总结 1、Agent定义尚未明确,但类别及应用场景已然丰富 - Agent尚无明确定义,自主规划与否是核心争议点,工程师流程调优对应两条发展路线,学界强调规划能力,业界如OpenAI强调独立完成任务,Anthropic区分Workflow和Agent [6][7][9] - Agent AI核心能力源于基础大模型深度集成,能力提升遵循递进范式,李飞飞团队将其分为多类 [25][28] - NLP与多模态技术发展使Agent应用场景丰富,包括工具使用和知识库查询、改进推理和规划、整合系统和人工反馈等NLP场景,图像 - 语言和视频 - 语言理解生成等多模态场景,以及机器人、医疗保健、游戏等领域 [30][34][38] 2、大厂助力Agent部署,B端场景已实现商业化价值 - 北美云厂商关注帮助客户部署模型和Agent,B端厂商聚焦打造Agent创建和管理平台,部分B端办公软件Agent已实现商业化,如Salesforce部分项目中Agentforce收入占比达35%,Workday 24Q4销售中30%来自AI相关产品 [52][53] - 谷歌助力Agent高效部署,推出开发工具包、设计师、管理平台等,发布A2A协议降低信息传输损耗 [54][55] - 微软Azure AI Foundry平台助力部署,推出多款办公Agent提升用户效率,支持A2A协议 [58][59] - 亚马逊Alexa+和Amazon Nova Act关注场景执行,Alexa+有超10万用户,Amazon Nova Act任务准确率30% - 60% [63] - Meta Llama 4提升模型效率,推出Agent管理仪表盘,关注Agent领域发展 [64][65] 3、国内Agent发展现状:互联网厂商把握流量趋势,B端企业提供Agent平台 - 国内互联网大厂遵循流量逻辑,推出类"Manus"通用Agent产品,B端企业基于平台选取价值场景落地 [79] - 字节跳动扣子空间提供通用和专家Agent,支持MCP协议,接入飞书打造B端办公体验 [81][82] - 百度推出移动端Agent心响,着眼C端用户,引入智能体接入方案 [83][84] - 腾讯基于微信生态构建AI应用,元宝、ima等产品有向Agent自主规划调用发展的基础 [89][90] - 阿里巴巴阿里云上线MCP服务,心流AI聚焦通用场景,飞猪"问一问"探索旅行垂直场景 [92][93] - 金蝶打造苍穹Agent平台,各产品线智能化升级,已签约多个客户 [96][97] - 用友发布YonGPT 2.0,通过Agent助力降本增效,25Q2将密集发布智能体产品 [101][102] - 泛微发布Xiaoe.AI,提供开箱即用和自行构建两类智能体产品 [105][106] - 致远互联打造AI - COP智能入口,发布CoMi Family智能体产品家族 [109][110] 4、Agent落地带来的改变和面临的挑战有几何? - AI原生应用推动Token消耗量激增,Manus单次任务消耗token数或达十万,Agent对token消耗源于长上下文窗口、多Agent/工具通信、验证模块、多模态场景,底层算力需求旺盛 [116][117][120] - Agent落地面临意图混淆、多Agent合作、幻觉等问题,学界和业界积极探索解决方法 [124][128][133] 5、投资建议 - Agent进展迅速,AI产业链趋势向上,AI模型及技术迭代利好有数据、客户、场景的软件企业,看好ERP和政府方向落地订单和产品,如金蝶国际、用友网络等 [4][138] - 模型私有化需求增加,利好一体机、超融合和B端服务外包企业,推荐服务器等相关标的及金融等领域企业,算力租赁和IDC标的值得关注 [4][138]
五月AI产品上新:设计Agent刷屏,汪源的笔记产品霸榜Product Hunt
Founder Park· 2025-05-13 21:07
AI设计工具 - Lovart是全球首个设计Agent,能完成从创意拆解到专业交付的全流程,内置GPT image-1、Flux pro、OpenAI-o3等多家图片生成、视频及音乐模型,支持自然语言设计和批量出图[4][8][9] - 产品在AI设计和设计圈刷屏,Founder Park分享的10个邀请码引发99+条求码消息[5][10] AI笔记与效率工具 - remio是前网易副总裁开发的AI Native笔记工具,结合AI搜索与笔记功能优化工作流程,改变用户捕捉、整理和利用信息的方式[10][13] - YouMind是语雀创始人推出的笔记产品,主打"万物化稿,稿生万物",支持多种素材转化为可编辑稿件并生成最终内容形式[55][59][60] - 快手推出的"喵记多"笔记产品采用拟人化"喵仔"AI助手,支持文字、图片、文件等格式收藏和对话式分类[46][48][49] 播客与内容创作工具 - Castwise是Podwise团队新品,能快速将播客音频处理成shownotes、公众号文章、小红书笔记等社交媒体素材,提高内容分发效率[14][17][18] - Nooka是重新定义听书体验的App,以20分钟音频播客解读非虚构书籍,支持用户打断提问并分享对话片段[41][42] AI搜索与知识管理 - 夸克浏览器上线"Deep Search"功能,主打先思考再搜索,具备多模态处理能力,可解读上传图片[19][20][23][24] - 秘塔推出知识讲解产品"今天学点啥",支持个性化拆解文章、视频或书籍,并上线针对家长的"讲题"功能[43][45] AI演示与视频工具 - Deckspeed是Product Hunt日榜第一的AI PPT产品,支持对话式内容创作、实时反馈、视觉优化与多工具联动[25][27][28] - Veogo AI是视频流量预测工具,能分析小红书热门视频并生成定制化脚本模板,提供流量趋势预测等功能[29][31][32][33] AI游戏与社交应用 - 萌爪派对是前字节AI Lab研究员开发的AI养宠社交游戏,玩家可培养千人千面的AI萌宠并体验多种互动方式[51][53][54][56] - Splitti是专为ADHD人群设计的日程管理软件,通过AI帮助用户拆解任务并降低启动难度[34][35][39] 其他AI产品 - Perplexity Comet是即将发布的AI浏览器,自带Agent功能可执行复杂操作如推特回复[50] - Qwen App是通义千问发布的国际版产品,提供Qwen 3模型及语音对话功能[61][62]
客户不转化、内容不合规?AI 与 Agent 如何破解金融营销五大难题
AI前线· 2025-05-13 14:35
金融营销的进化与AI价值定位 - 金融营销经历了从传统1.0时代(依赖网点和客户经理)到数字化2.0时代(CRM和线上渠道)的演进,但仍存在数据孤岛和体验割裂问题 [3] - 智能化3.0时代以大语言模型和Agent为核心,AI技术提供三大价值:客户洞察力(解析非结构化数据)、实时智能决策(动态生成最优策略)、高效服务执行(7x24小时标准化服务) [3][4][5] - 全球头部金融机构已系统化部署AI和Agent,将其视为刚需而非选配 [5] 当前金融营销的核心挑战 - 获客成本居高不下,零售客户CAC(客户获取成本)动辄上千元,传统渠道效率低且线上转化难 [6] - 个性化体验不足,数据分散导致客户体验割裂,推荐精准度低 [7] - 复杂金融产品(如结构性产品、基金)因条款晦涩导致客户决策困难,易引发误解和投诉 [7] - 强监管环境下合规与创新效率难以平衡,AI生成内容合规性及数据隐私问题凸显 [8] - 营销效果归因模糊,多渠道触点导致ROI难以科学衡量 [9] AI与Agent的解决方案与实践 - 构建"智能营销中台":数据基座(整合内外部数据)、智能引擎(AI算法集群)、服务与应用(标准化API支撑前端场景) [11] - 关键技术突破包括:大模型+RAG(结合内部知识库)、知识图谱(复杂关系推理)、多Agent协作(分工执行任务)、隐私计算(联邦学习) [12] - 行业标杆案例:某股份行通过数据中台提升高净值客户AUM,某理财子公司智能推荐系统转化率提升数倍,某银行AIGC平台优化私域运营效率 [12] 未来金融营销的竞争方向 - AI进化趋势:多模态交互(理解语音/图像)、因果决策(透明化解释)、自主进化(自我学习)、边缘响应(零延迟)、人机协同(1+1>2) [15] - 未来竞争核心是"智能密度",即通过AI构建感知-认知-决策-行动闭环,形成差异化优势 [16] - 智能化转型窗口期将决定企业未来10-20年的核心竞争力,需建立"AI原生"营销体系 [16] 行业活动与前沿动态 - AICon 2025聚焦AI Agent、多模态、大模型架构创新等议题,展示金融AI应用案例与趋势 [1][17]
大模型进入 RL 下半场,模型评估为什么重要?
Founder Park· 2025-05-13 11:42
大模型进入RL下半场 - 行业关注点从模型算法转向实际效用 需要重新定义问题和设计真实用例的evaluation [1] - 现有评估体系面临挑战 需有效衡量Agent产品的ROI [1] - 创企和应用AI的企业需通过模型测评结果指导产品开发落地 [1] Agent测评基准发展 - SuperCLUE推出中文通用AI智能体测评基准AgentCLUE-General 对主流Agent产品能力进行深度剖析 [1] - 公司在模型测评领域经验深厚 与国内外模型及Agent团队保持紧密联系 [1] 行业交流活动 - 邀请SuperCLUE联合创始人朱雷探讨大模型和Agent评估核心难题 [2] - 线上分享活动定于5月15日20-22点举行 [3] 行业热点话题 - Agent产品定价模式与付费机制成为关注焦点 [4] - 红杉AI峰会指出行业共识:AI从卖工具转向卖收益 [4] - YC合伙人认为当前AI应用问题源于产品设计能力不足 [4] - 红杉资本强调应用层价值 预测下一阶段是Agent时代 [4] - 企业落地Agent需关注关键指标选择 [4]
阶跃星辰姜大昕:追求AGI的初心不变,要在多模态能力和Agent方向做出差异化
IPO早知道· 2025-05-13 09:55
公司战略与核心观点 - 公司坚持基础大模型研发,追求AGI(通用人工智能)是初心且不会改变 [3] - 公司差异化特点在于多模态能力,目前多个模态性能在业界领先,并积极探索前沿方向 [3] - 公司在应用层面选择差异化路线,与合作伙伴共同发力智能终端Agent,形成从模型到Agent、云侧到端侧的生态体系 [3] - 行业技术发展处于陡峭区间,公司不会放弃主流增长或前进趋势 [3][4] 技术发展趋势 - 基础大模型发展呈现两大趋势:从模仿学习到强化学习、从多模态融合走向多模态理解生成一体化 [6] - 多模态理解生成一体化是重要趋势,尤其在视觉领域,理解与生成由同一模型完成 [11] - 公司已发布理解生成一体化模型Step 1X-Edit,总参数量19B(7B MLLM + 12B DiT),支持11类高频图像编辑任务 [13] - 公司内部正在开发更高级版本,未来几个月将发布更先进技术 [13] 多模态能力布局 - 公司建立Step系列通用大模型矩阵,包括语言模型和多模态模型,多模态细分涵盖图像、视频、语音、音乐等 [8] - 公司是国内少数重视模态全覆盖并坚持原生多模理念的企业,认为多模态是实现AGI的必经之路 [9] - 多模态能力对垂直领域和C端应用必不可少,公司具备全面自研预训练模型能力,构成独特优势 [9] 智能终端Agent战略 - 公司采用"超级模型+超级应用"双轮驱动策略,将智能终端Agent作为重要方向之一 [15] - Agent爆发需要多模态能力和慢思考能力,这两项能力在2024年取得突破性进展 [15] - 公司已与OPPO、吉利、智元机器人等头部企业合作,重点布局手机、汽车、机器人等智能终端 [16] - 公司认为AI时代产品流量增长逻辑不同于传统互联网,智能终端服务C端存在巨大机会 [17] 产品与技术成果 - 图像编辑大模型Step1X-Edit性能达到开源SOTA,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力 [13] - 该模型支持文字替换、风格迁移、材质变换、人物修图等11类高频图像编辑任务 [13] - 理解生成一体化的技术路线在公司成立之初就已设定 [14]
「阶跃星辰」的一次豪赌
36氪· 2025-05-12 08:27
公司战略与定位 - 阶跃星辰专注于多模态技术研发,认为多模态是实现AGI的必经之路,并将大部分资源投入该领域[4][8] - 公司采取差异化竞争策略,未参与应用投流热潮,仅试水To C应用,保持低调但技术领先的身位[2][3] - 技术路线选择"难上加难"的理解生成一体化原生多模方向,从成立之初即定为主线[5][14] 技术布局与成果 - 成立两年发布22款自研基座模型,其中16款为多模态模型,占比超70%,覆盖文字、语音、图像等六大模态[4] - 多模态技术处于早期探索阶段,类比语言模型相当于GPT-1.0前的Transformer时期,需解决模态融合不降智的难题[5][18] - 重点布局两大技术趋势:预训练模型+强化学习提升推理能力,以及视觉领域理解生成一体化[10][14] - 组建多支技术路线并行团队,采取"并发突破"策略应对技术不确定性[7] 产品与商业化路径 - 2025年将产品"跃问"更名为"阶跃 AI",实现从类ChatGPT产品向Agent能力转型[22] - 选择智能终端Agent为主攻方向,与Oppo、吉利汽车等头部企业合作落地手机、汽车、机器人场景[23][24] - 商业化逻辑强调模型突破先于应用爆发,通过绑定行业头部公司获取场景和数据,暂不直接ToC[20][24] - 认为AI产品流量增长不依赖传统投流模式,以DeepSeek为例验证技术驱动增长路径[19] 行业趋势判断 - 多模态与Agent成为2025年两大关键词,Agent爆发依赖多模态能力和慢思考能力的突破[6][23] - 技术演进路线从单模态到多模态,再到理解生成一体化,最终延伸至AI for Science[9][18] - 视觉领域尚未解决predict next frame难题,因模态复杂度远超语言(图片数据达百万维连续空间)[17] - 行业技术发展仍处陡峭增长期,基础模型研发决定应用上限,应用场景反哺模型迭代[22]
国信证券:大厂布局Agent产品 AI应用快速落地
智通财经网· 2025-05-09 10:00
以申万计算机板块为例,1)营收层面,计算机板块的营业收入合计为12499.4亿元,同比增长5.0%;2)归 母净利润层面,计算机板块2024年实现归母净利润182.0亿元,同比下降41.1%,该行认为主要因为:a) 板块仍受到宏观环境影响,行业竞争加剧;b)板块内部分公司业务向AI等新技术转向,研发和市场开拓 投入提升。计算机板块2025Q1实现营收共2818.7亿元,同比增长15.1%;实现归母净利润23.3亿元,同比 增加790.5%,主要因为:a)宏观环境回暖,板块公司业务逐步复苏;b)行业内公司在技术、市场等领域的 投入效果逐步显现,带动利润提升。 2025Q1板块估值、公募配置比例回升 2025Q1计算机板块公司业绩修复,板块估值回升,截至2025年4月30日,计算机板块的动态市盈率为 81.5x,高于历史中枢水平。根据Wind历史统计数据,公募基金配置计算机的比例一般在4%-5%之间;截 至2025Q1,公募基金配置计算机的比例为3.1%,环比上升,公募基金重仓前十大计算机公司分别为金 山办公、海康威视、科大讯飞、同花顺、深信服、中科曙光、浪潮信息、紫光股份、新大陆、德赛西 威。展望未来,随着整体 ...
Agent 如何在企业里落地?我们和火山引擎聊了聊
Founder Park· 2025-05-08 18:42
核心观点 - Manus的影响力被低估,其让大众真正看到Agent的重要性和可能性 [1][2] - 企业落地需要垂直领域真正懂场景的Agent,火山引擎发布的Data Agent是代表 [3] - Data Agent解决企业数据难题,包括统一管理平台、兼容非格式数据、自然语言查询等 [6][9] Data Agent功能 智能分析Agent - 涵盖智能分析Agent和营销策略Agent,前者主打数据分析,后者提供营销策划 [10] - 智能分析Agent类似chatbot,连接企业数据后可用自然语言对话进行数据分析 [11] - 测试案例显示可快速完成跨表查询任务,5分钟内给出查询和分析结果 [14][20] - 不仅能查询数据,还能解读数据并给出具体建议,如针对不同人群的销售策略 [32] 营销策略Agent - 处理新老用户和活动数据,提供从策划到执行的全流程服务 [39] - 测试案例显示可自动生成营销方案,包括客群筛选、触达内容编辑等 [44][54] - 生成的营销文案直击痛点,如针对不同敏感度客户的精准营销方案 [60][68] - 未来将加入营销后数据分析环节,实现营销活动全流程闭环 [69] Data Agent技术 - 采用MCP架构提升工具调用能力,适合调用稳定性好的服务 [72][73] - 通过工程化手段控制大模型幻觉问题,如单次数据准确性核查等 [71] - 数据库形态将变化,需要融合存储结构化、非结构化等多模态数据 [79][80] - 未来发展方向是自主学习和智能体协同,突破单一Agent能力边界 [87][89] 落地策略 - 大公司追最佳实践,小公司先用起来,数字化程度不同采取不同策略 [74][75] - 不会直接取代传统BI和ChatBI,而是长期共存服务不同场景 [76][77] - 开发团队需拥抱不确定性,深入理解模型原理而非简单加Prompt [82][85] - 产品方向是做更好的大模型容器,而非过度投入补模型短板 [86]
阿里云又丢出了核弹
华尔街见闻· 2025-05-07 22:41
阿里云AI战略布局 - 阿里云正式上线Qwen3系列模型"全家桶",包含2个MoE模型和6个稠密模型,参数规模从0.6B到235B,覆盖手机端到旗舰级体验,并一次性开源 [2] - Qwen3-4B小模型性能对标上一代Qwen-32B,发布两小时GitHub Star数超16.9k,显示市场高度关注 [2] - Qwen3采用混合推理架构,全球首个开源"快慢思考"集成模型,能自动识别任务场景切换思考模式,技术领先性显著 [5] 技术突破与成本优化 - Qwen3部署成本仅为DeepSeek-R1的四成(4张H20卡 vs 16张H20卡),性能全面超越国内领先模型 [6] - 模型支持MCP协议并推出Agent原生框架,孵化出爆款应用Manus(基于Qwen的Agent),推动AI应用生态 [13][14] - 阿里云通过"杰文斯悖论"效应刺激AI需求:Qwen3训练成本优化反而带动算力消耗激增,形成正向循环 [6] 集团AI化转型 - 阿里宣布未来三年投入3800亿建设云和AI基础设施,金额相当于近三年累计利润,战略级投入力度空前 [19][20] - 集团所有业务单元2025年绩效考核与AI应用成效挂钩,电商板块200+业务线联合通义团队开发智能功能 [21] - 夸克升级为集团AI旗舰应用,通义APP首批接入Qwen3模型,高德/飞猪/饿了么等快速落地AI功能 [23] 市场影响与财务前景 - 阿里云2024Q4营收317.42亿元(同比+13%),AI收入连续六季度三位数增长,市占率回升至26.1% [28][29] - 高盛预测2026/2027财年阿里云AI收入将达290亿/530亿元,占总收入20%/29%,推动整体收入增速超20% [29] - 摩根大通测算阿里云估值或达1850亿美元(按微软10.5倍PS),带动阿里整体市值从3045亿升至3910亿美元 [29] 行业竞争格局 - Qwen3实现中美大模型代际差抹平,开源生态已吸引90%上市银行/手机/汽车/家电品牌加入 [27] - 阿里构建"云计算底层+MaaS中间层+应用顶层"三位一体架构,布局完整度领跑国内互联网公司 [26][28] - 行业进入Agent元年,百万日活产品Agent化后token消耗激增30万倍,算力需求呈指数级增长 [16]
中国 AI 投资人:练习时长两年半
Founder Park· 2025-05-06 20:05
大模型行业动态 - 中国大模型能力获得认可,行业进入新篇章 [2][5] - DeepSeek推动中国AI生态良性变化,改变科研评价标准 [33][34] - 大模型发展进入L2阶段,对L1产品形成降维打击 [38][39] - 模型公司融资趋缓,资金开始流向应用层 [52][56][58] Manus成功经验 - 实现全球化营销和海外融资突破 [13][14] - 通过PLG方式实现快速增长,吸引硅谷投资 [15] - 团队具备快速调整产品方向的能力 [16] - 真格基金连续投资四次,看重创始人战略定力 [17][18][20] DeepSeek行业影响 - 降低大模型使用成本,促进小模型发展 [36] - 普及推理能力,提供宝贵训练数据 [37] - 推动AI商业化,降低客户教育成本 [37] - 证明L2对L1产品的降维打击 [38] 创业投资策略 - 应用层投资逻辑回归产品、用户需求和商业模式 [55][59] - 垂直领域机会多于通用领域 [97][98][106] - 早期创业者应关注小而美的闭环验证 [94][95] - ARR指标争议大,更应关注用户行为质量 [93][96] AI硬件与玩具 - Plaud Note年收入7000万美元,缺乏竞争对手 [76][81][83] - AI玩具应避免过度依赖"可爱"属性 [127] - 玩具开口说话可能破坏想象空间 [130][136] - 创造独特IP和玩法比单纯智能化更重要 [137][138] 技术发展趋势 - 视频生成技术处于早期采用阶段 [70] - AI基础设施比云计算时代更复杂 [70] - 多模态模型变化快于语言模型 [63][64] - 工具链设计需要预留技术突破冗余度 [64][65]