Workflow
AI Agent
icon
搜索文档
喝点VC|a16z华裔合伙人:MCP正重塑AI Agent生态,有望成为AI与工具交互的默认接口
Z Potentials· 2025-03-29 11:57
MCP协议概述 - MCP是2024年11月推出的开放协议 旨在为AI模型与外部工具交互提供统一标准接口 解决当前工具调用碎片化问题[2][3] - 借鉴LSP协议设计思路但创新性地采用以Agent为核心的执行模型 支持自主AI工作流和人类参与环节[5] - 定义AI模型调用外部工具、获取数据及服务交互的通用方式 例如Resend MCP server可同时协同多个客户端[3][5] MCP技术特点 - 推动工具从API向"Agent友好型"高阶抽象演进 例如封装多个API为draft_email_and_send()等符合任务逻辑的调用方式[6] - 支持动态工具选择机制 AI Agent可根据速度、成本、相关性实时选择最优MCP server[6][31] - 正在形成类似npm的生态体系 Mintlify、Smithery等工具市场加速MCP server的发现与共享[6][19] 当前应用场景 - Cursor作为典型MCP client展示"全能应用"潜力 通过接入Slack/Resend/Replicate等server实现代码编辑/通讯/邮件/图像生成多功能集成[8] - 开发者工作流优化:在IDE内直接执行Postgres SQL命令、管理Upstash缓存 减少上下文切换[10] - 非技术用户可通过Claude Desktop等平台使用MCP工具 未来将拓展至客服、营销、设计等业务场景[13] 生态发展现状 - 客户端以编程开发为核心 但预计将出现更多商业场景专用client[18] - server多为本地优先架构 未来将向远程连接和Streamable HTTP协议发展[18] - 基础设施工具加速完善 Mintlify、Cloudflare等平台解决部署、扩展和密钥管理问题[19] 未来技术挑战 - 需解决多租户架构支持 企业用户要求数据层与控制层分离的托管方案[21][22] - 缺乏统一身份验证机制 需构建涵盖客户端认证、工具认证、多用户验证的完整体系[23] - 权限控制需从session级细化 避免OAuth 2.1授权导致的"蜘蛛网式"权限结构[24] - Gateway组件将成为关键中间层 统一管理认证、路由、负载均衡等功能[25] 行业影响预测 - 开发者工具公司竞争维度改变 需设计可被agent自主发现的高质量工具[31] - 可能催生基于性能指标的动态定价模式 取代传统固定订阅制[31] - API设计范式转向任务场景导向 例如draft_email_and_send()复合函数将取代单一send_email()[32] - 文档机器可读性成为基础设施关键 支持基于文档自动生成MCP server[32]
Z Research|AI Agent会孕育下一代腾讯字节吗?(AI Agent 系列一)
Z Potentials· 2025-03-28 10:37
AI Agent 101 - AI Agent 是 AI 进程中的重要阶段,对应 L4 等级,从"成本中心"转向"价值引擎",但仍处于早期阶段,距离 AGI 尚有巨大工作量 [6] - AI 应用形态从 Chatbot 到 AI Copilot 再到 AI Agent,背后是 AI 能力的进化,实现更高任务难度和自动化程度,人机交互范式从"主从式"转向"伙伴式" [11] - AI 进程划分为 L1-L6,其中 Copilot 和 Agent 分别对应 L3-L4,反映 AI 应用从 GTM 阶段进入 PMF 阶段 [6] 入口之争 3.0 - 互联网入口演变史是技术满足需求的历史,从门户网站到搜索引擎再到超级 APP,每次入口革命都缩短意图与满足之间的路径 [22] - AI 时代入口形态依赖技术栈特点,LLM 的算力密集、人才密集、数据密集特性可能导向中心化,但 Deepseek 的出现带来悬念 [22] - 中美市场差异显著:美国市场硬件入口集中,AI Agent 与硬件强绑定胜率高;中国市场硬件入口分散,超级 APP 更可能掌握 AI Agent 话语权 [26] AI Agent 商业模式与挑战 - AI Agent 商业模式可能从已有 APP 盘子夺食,围绕数据权限引发剧烈反击,变现路径中平台分成和消费贷较为可行 [30] - AI Agent 面临高昂推理成本(单任务约 2$/次,能耗达纯 LLM 的 8 倍)、复杂环境适应能力不足、开放域任务失败率高达 30% 等技术卡点 [32] - 商业模型难以跑通,ROI 问题突出,当人类员工时薪低于 Agent 耗能成本时,效率革命故事将破灭 [32] AI Agent 市场竞争格局 - 大厂和大模型厂商在短期更具优势,资金、用户基础和数据积累提供巨大容错率;创业公司致胜之道在于抢先做出 Agent 领域 SOTA [3][39] - AI Agent 赛道可能被现有巨头主导,创业公司可通过聚焦细分领域实现高增长,如 Midjourney 在生图赛道的成功案例 [39] - 市场呈现三类玩家:大厂、大模型厂商和 Agent 创业公司,竞争烈度大于模型层,价格战和数据权限之争不可避免 [3] AI 时代创业新范式 - AI Copilot 阶段海外交出不错 PMF 答卷,代表性公司以小规模+高增长+易盈利为特征,如 AI 图像生成公司 2 年达到 2 亿美元 ARR [12] - AI 时代创业者需具备深厚学术或技术背景,强调 AI Native 特质,与移动互联网时代产品经理或商业背景为主的创业者画像不同 [13] - 创新聚焦底层技术突破与垂直场景深度整合,模式复制与场景渗透为主的移动互联网时代玩法不再适用 [14]
ERP厂商要被集体颠覆了?
虎嗅APP· 2025-03-27 18:21
核心观点 - 传统ERP和工具型SaaS将被以AI Agent为载体的新一代SaaS淘汰 [3] - DeepSeek的强推理、低成本、开源特性正在颠覆SaaS行业 [4] - AI Agent将率先在B端场景落地并颠覆传统SaaS [6] - 智能体可实现人"做不到、做不精"的事情,将大量进入工作场景 [16] - 应用层将涌现大量小微创新团队,软件开发门槛大幅降低 [19] - 用友、金蝶等SaaS企业股价上涨反映市场对智能体带动业绩增长的预期 [21] 行业变革 - 传统SaaS厂商面临被AI Agent替代的风险,需抓住变革机会实现二次增长 [4] - 强推理模型成本较高,短期内更可能在专业B端场景落地 [7] - 企业服务生态将重构:底层大模型厂商、中层垂直服务商、上层场景化应用 [19] - DeepSeek开源使服务商可本地化部署,行业know-how能力成为关键竞争优势 [19] 用友案例 - 用友内部已广泛使用数智员工,IT零基础员工10分钟即可构建智能体 [9] - 智能体在费控场景实现20分钟完成交通补贴支付全流程 [9] - 采购合同智能体可自动审核标记不合规条款并生成修改建议 [10] - 流水认领场景中智能体通过自我学习将准确率从50%提升至80% [14][16] - 用友计划在第二季度密集发布一系列AI智能体 [11] 技术特性 - DeepSeek-R1幻觉率达14.3%,高于Deepseek-V3的3.9% [18] - 智能体存在生成内容与事实不符的风险,关键决策仍需人工复核 [17][18] - 智能体可适应业务变化无需二次开发,显著提升人效 [16] 市场影响 - 资本市场看好智能体对SaaS企业业绩和人效的提升潜力 [21] - 能否实现智能体落地带来的实质性增长将决定企业价值重估 [21] - 跟不上AI变革的SaaS企业将被淘汰 [21]
速递|红杉EQT投资超千万美元,Outreach创始人要做AI Agent的财务中台
Z Potentials· 2025-03-27 12:25
图片来源: Outreach 随着 AI Agent 元年的到来,一个新的趋势正在兴起:初创公司提供工具,帮助雇主打造一支机器人队伍。 Manny Medina ,最著名的身份是价值 44 亿美元的销售自动化公司 Outreach 的创始人和前 CEO , Manny Medina 有一个新的初创公司 Paid 帮助 AI Agent 获得报酬。 Paid 并不制造 AI Agent 。它提供了一个平台,确保它们能够盈利地获得报酬。 Paid 周一宣布,它从欧洲巨头 EQT Ventures 、红杉资本和 GTMFund 那 里筹集了 1000 万欧元(约合 1100 万美元)的预种子投资。 Medina 在花了几个月时间与数十家代理平台初创公司交谈后,萌生了创建 Paid 的想法。在这些对话中,一个常见的抱怨浮出水面。"他们真的不知道该收 多少钱," Medina 告诉 TechCrunch 。 Paid 的前提是,传统的软件收费方式不适用于 AI 代理。Agent 公司不能按用户或按席位收费,这意味着不能基于使用软件的人数(如传统的 Microsoft Office )。关键在于一个员工可以运行多个代理。 ...
专家访谈汇总:中国宠物药正悄悄攻占全球市场
阿尔法工场研究院· 2025-03-26 21:33
智驾平权之车企智驾方案梳理 - 智能手机市场2024年预计出货量12.2亿部,同比增长7%,结束连续两年下滑[2] - L3级别自动驾驶(城市NOA)推动国内电动汽车渗透率达50%-80%以上[2] - 自主品牌通过独资或合资模式在海外建立生产基地,推动智能电动车全球化[2] 回盛生物:规模效应、出海扩张与宠物医疗生态的三重驱动 - 动保行业处于周期底部,养殖企业资产负债率从2024年Q1的66%降至Q3的61%,预计Q4进一步下降[2] - 公司通过原料药一体化布局降低制剂成本,核心产品泰乐菌素和泰万菌素生产规模持续扩大[2] - 2024年下半年原料药产能利用率提升,预计Q4营收突破4亿元创单季度新高[2] - 越南工厂2025年Q2投产加速东南亚市场扩展[2] - 推出宠物药品"盛宠宁"系列驱虫药,依托原料药优势提供更具价格竞争力的产品[2] - 中国兽药行业快速增长,2024年猪价回升将带动动保产品需求[2] 光学黄金大赛道 - 手机摄像头沿光学防抖、大光圈、潜望长焦等多方向发展,硬件升级推动ASP提升[3] - L2+级别ADAS在2025年加速渗透,10万元以下车型智能驾驶功能从"0"到"1"发展[3] - 车载摄像头需求快速增长,国产厂商量产能力提升将推动国产化率[3] - 光波导技术成为AR眼镜终极解决方案,水晶光电在AR领域布局值得关注[3] - 中国机器视觉市场规模2023年185亿元,预计2028年超395亿元(CAGR 17.5%)[3] 城市NOA渗透率提升,激光雷达行业爆发 - 2024年激光雷达交付量预计超150万台(同比+212%),前装搭载率提升至6%[4] - 激光雷达凭借高检测置信度、高距离精度成为高速NOA和城市NOA主流方案[4] - 智能驾驶在购车决策中重要性提升,激光雷达选配率上升[4] - 2023年中国激光雷达平均价格降至500美元以下,全球其他地区700-1000美元[6] DeepSeek算力效率提升≠算力通缩 - DeepSeek采用大规模专家并行模式,专家参数存储于多GPU提升算力资源利用率[7] - 通过算通信重叠策略缓解通信延迟问题,优化底层架构提升吞吐率[7] - MaaS模式对能提供大规模集群和高用户并发的公有云厂商具有盈利潜力[7] - DeepSeek单次推理激活370亿参数,H800单卡利用率达77%[7] - 多模态应用和AI Agent将增加单次请求tokens数量,带动算力需求增长[7] - 国产芯片厂商(如中兴通讯)和交换机厂商将持续受益于算力需求增长[7]
腾讯AI需要一个新的支点
新财富· 2025-03-26 14:46
腾讯2024年财报核心表现 - 2024年四季度营收1724.5亿元同比增长11%,经营利润594.8亿元同比增长21%,连续第九个季度领跑增长 [2] - 全年资本开支达768亿元同比增加221%,其中Q4资本开支366亿元同比激增386% [14] - 长青游戏矩阵(如《王者荣耀》《英雄联盟》)与AI技术(元宝APP、混元大模型)形成双轮驱动 [4][6] AI战略突破与竞争格局 - 腾讯元宝接入DeepSeek-R1后成为3月用户增长最快AI单品,35天内发布30次更新 [5][8] - 自研T1模型采用Mamba架构,价格低至DeepSeek-R1的1/4(输入1元/百万tokens) [12] - 当前AI应用竞争仍处早期阶段,买量策略(如下沉市场"AI下乡")仅能短期提升下载量,豆包仍领先用户留存 [22][24][25] 微信生态的AI战略价值 - 微信小程序覆盖99%日常场景,月流水近30亿元,具备颠覆操作系统的潜力 [36] - 计划通过小程序API接口开发AI Agent,实现自然语言调用服务(如订票、购物) [40] - 微信对话框作为原生入口可大幅降低AI使用门槛,未来算力需求将成倍增长 [41] 资本开支与行业定位差异 - 腾讯2025年资本支出指引为营收的"小十几%",与阿里三年3800亿元投入形成对比 [15][16] - 公司强调AI投入需"按需定产",2月微信AI搜一搜测试曾导致算力紧急调配 [18][19] - 马化腾认为当前AI基建存在泡沫,更倾向通过2C应用(如元宝、文档)间接变现 [17][18] 长期竞争关键因素 - 产品需绑定高频场景(如微信联动)而非依赖买量,参考豆包依托字节生态的成功 [30][31] - 小程序生态可能成为AI时代的"操作系统",为Agent提供工具链调用基础 [39][40] - 公司历史优势在于用户需求导向,AI持久战中需平衡战略耐心与战术敏捷 [43][45]
百万年薪抢人,vivo为何押宝家庭机器人?
36氪· 2025-03-26 11:27
vivo进军家庭机器人赛道 - 公司已成立机器人Lab部门,隶属于中央研究院,负责机器人产品孵化与预研工作,并高薪招聘机器人领域人才,如技术规划专家最高年薪超120万元[1] - 公司定位清晰,计划将服务数亿终端用户的能力移植到机器人,聚焦孵化机器人的"大脑"和"眼睛",依托AI大模型与影像技术积累,目标让机器人实现场景理解与需求响应[3] - 产品规划采取"渐进突围"策略,预计3-5年推出原型机,理想中的家庭机器人正式上市需10年以上,期间可能针对特定场景推出功能型产品[3] 技术优势与布局 - AI能力:公司自研蓝心大模型矩阵(语言/语音/图像/多模态)已应用于终端,AI Agent训练将成为机器人核心,其视觉理解技术(如vivo看见功能)可迁移至机器人视觉识别[8] - 空间感知:影像技术积累(TOF 3D技术、微云台防抖、VCS仿生光谱)为机器人空间定位与导航避障奠定基础,2024年发布的X100 Ultra支持3D影像,是机器人与物理世界交互的关键[9] - 混合现实协同:MR头显产品vivo Vision积累的空间感知与交互能力将复用至机器人,MR技术被视为机器人必备能力[10][12] - 专利储备:2024年公开机器人控制方法、基于MR的交互方法等专利,并提前布局6G通信以解决机器人云端算力依赖问题[13] 行业背景与竞争格局 - 市场潜力:家庭服务机器人被列入国家"十四五"规划重点领域,老龄化趋势推动家务/陪伴/教育监护需求,行业企业数量达45.17万家(截至2024年底),融资活跃[3][16] - 手机厂商竞逐:苹果组建数百人团队开发家用机器人,预计2028年量产,技术储备包括空间感知系统ARMOR;三星推出Bot Handy服务机器人与伴侣机器人Ballie[15] - 产业逻辑:机器人被视为联接物理与数字世界的桥梁,手机厂商凭借技术复用(影像/AI)、供应链话语权、用户数据与场景理解能力,可平滑切入赛道[18] 战略逻辑与产业趋势 - 技术复用路径:手机技术(5G/AI/影像/芯片)积累可迁移至机器人,形成"硬件-数据-场景"闭环,公司专注"大脑"与"眼睛"研发,其余交由供应链[18] - 行业分工趋势:机器人产业未来将高度分工,类似手机产业链模式,头部手机厂商因技术积累与用户规模占据主动权[19] - 长期主义布局:公司以"埋头种因"文化持续投入,影像技术十年研发经验将复制至机器人领域,为下一代产业浪潮做准备[19]
钉钉创始成员再创业,打造跨境电商AI Agent,完成亿元融资
创业邦· 2025-03-26 08:02
公司融资与背景 - 跨境电商AI Agent企业Shulex完成亿元级融资 由盛大资本领投 北极光创投和Starting Gate Fund等跟投 [1] - 公司主体为杭州数里行间科技有限公司 成立于2021年 专注于跨境电商领域的全球化AI SaaS企业 [1] - 团队核心成员来自阿里巴巴 网易 字节跳动 百度 谷歌等顶尖科技企业 [3] 创始人履历 - 创始人郭辰璐(花名天蓬)为前钉钉核心创始人之一 拥有美国亚利桑那州立大学英语教育学硕士学位 [2] - 在阿里巴巴任职超过14年 深度参与支付宝和社交软件"来往"项目 主导钉钉系统从0到1搭建及钉钉考勤机等爆款产品研发 [2] - 2021年离开阿里后创立数里行间科技 同年9月推出基于AI大模型的VOC和客服产品Shulex [2] 产品与技术能力 - 公司依靠强大产品自研能力 发布系列颠覆传统跨境行业的AI工具 [4] - 核心产品Shulex基于AI大模型技术 为企业提供VOC(Voice of Customer)分析和客服解决方案 [2]
万字长文,聊聊下一代AI Agent的新范式
36氪· 2025-03-25 18:19
产品创新与设计 - Manus AI被定位为全球首款通用型AI Agent 能够实现从指令到结果的一站式服务 通过多任务协同处理完成复杂工作 例如在17分钟内生成完整的行业分析报告 涵盖现状分析 趋势预测和公司筛选等功能 [3][17] - 产品设计突出用户体验优势 展示详细任务清单和实时进度 使用户清晰了解AI的规划与执行过程 这种设计显著降低了普通用户的使用门槛 被评价为对非技术用户友好 [18][20] - 虽自称通用型Agent 但实际内置29个工具 覆盖写作 信息收集 数据分析和代码编写等基础工作场景 专业领域能力仍存在局限 如无法处理炒股等特殊任务 [21] 技术架构与实现 - 采用多Agent协同架构 但运作模式固定 缺乏真正的自主交互能力 核心技术整合自现有方案如Devin的可视化代码展示和GPT Pilot的任务分解机制 未实现突破性创新 [20][25] - 核心瓶颈在于错误容忍度和记忆管理 大模型在多步调用中准确率下降 需根据不同场景调整容错标准 同时长上下文处理依赖RAG技术和窗口扩展 但当前效果仍不理想 [28][29] - 端到端训练代表下一代方向 Deep Research通过单一模型整合完整Agent能力 避免传统工程拼接 结合强化学习实现自主规划 与OpenAI O1和DeepSeek R1的阶段性生成思路一致 [27][37] 能力演进与突破方向 - 自我评估与反思能力成为关键进化路径 当前Agent缺乏结果验证机制 需通过环境闭环反馈或奖励模型提升自主性 [33] - 跨环境操作能力亟待加强 现有Agent局限于浏览器环境 未来需突破应用边界 自主调用专业软件如绘图或报表工具 [42] - 持续学习机制是核心挑战 需从使用数据中提取模式优化执行效率 例如将50步操作简化为10步 实现成本降低和个性化适配 [43] 行业影响与落地路径 - 垂直领域专业化优于通用型方案 细分场景如代码生成或SVG绘制需深度优化 通用Agent难以在各领域达到同等专业水平 [23] - 企业落地面临接口标准化挑战 需减少非标人机交互 通过自适应流程整合业务数据 实现灵活部署 [48] - 2025年预计出现转型拐点 企业积极拥抱AI提升人效 案例显示低代码平台50%代码由AI生成 硅谷企业采用AI更新旧系统替代高成本程序员 [51] 发展范式与未来趋势 - Agent下半场聚焦端到端训练范式 通过强化学习直接内化自主能力 降低传统工程开发依赖 [37][41] - 产品形态向"模型即服务"演进 从生成文本 代码 软件升级为直接提供服务 深度整合用户场景 [38][40] - 开源生态加速创新 OpenManus项目提供轻量级开发框架 MetaGPT实现动态任务分配 推动多Agent系统协同发展 [31][41]
深度|当AI学会跳过中间商,OpenAI对DoorDash的广告帝国产生威胁
Z Potentials· 2025-03-23 13:10
AI代理对消费端应用生态的冲击 - OpenAI推出名为Operator的AI代理产品 可通过接管用户浏览器自动化完成旅行规划、在线购物等消费端任务[1][3] - DoorDash、Uber和Instacart等公司成为Operator发布合作伙伴 但担忧AI代理可能使用户跳过其应用 直接通过AI完成交易[3] - 若用户不再直接访问应用 DoorDash网站广告价值将下降 其广告收入占比较小但增长迅速[3] 历史参照与行业应对 - 类似去中介化威胁曾出现在社交媒体和搜索引擎对新闻出版行业的影响中[4] - 零售媒体顾问指出AI代理未必能实现预期效果 引用亚马逊Alexa未彻底改变购物方式的先例[4][5] - 沃尔玛等零售商考虑开发自有AI代理与第三方代理互动 通过提供商品信息保持用户触点[12][13] 技术发展与市场反应 - 39%美国消费者已使用生成式AI完成购物任务 如产品推荐和清单制作 相关流量增速显著[9] - OpenAI向开发者开放网页浏览代理构建工具 中国公司Manus的代理已能自动生成股票分析报告和房产搜索[11] - Operator目前仅限ChatGPT Pro订阅用户使用 月费200美元 但存在响应速度慢和复杂网页处理不佳的问题[13][14] 企业合作与数据博弈 - DoorDash通过与OpenAI合作获取Operator使用数据 包括流量来源和常见用途汇总[5] - 公司发言人强调AI代理仅作为补充渠道 不影响广告业务 但内部会议显示潜在冲突[6][5] - 零售商与OpenAI存在双重关系 既付费使用其AI模型 又需防范代理技术对业务的冲击[10]