行业动态与巨头布局 - 2024年10月,OpenAI、Google、Anthropic三家主要模型公司均在Agent开发工具上推出新动作:OpenAI推出AgentKit,Google发布Gemini CLI Extensions,Anthropic推出Claude Skills [6] - Agent工具链已成为硅谷创业热点,LangChain融资1亿美元成为独角兽,ElevenLabs员工老股交易估值达66亿美元,OpenAI以11亿美元全股收购Statsig [7][24] - 过往全球开发者工具市场规模约200-300亿美元,AI可能将该市场规模推高十倍 [9] OpenAI AgentKit产品解析 - AgentKit涵盖Agent构建、部署和维护全周期,包括可视化构建工具Agent Builder、前端部署工具ChatKit以及评估优化工具New Evals [12] - Agent Builder通过拖拽式工作流构建Agent,思路与追求高度自动化的AGI终局路径相反,但更易于在企业中安全落地 [13] - ChatGPT周活跃用户达8亿,为开发者提供巨大分发红利和信任背书,有助于应用冷启动和进入大型企业采购流程 [15] - OpenAI不会放弃to B市场,其用户规模、生态竞争压力及B端数据对模型提升的重要性都支撑其持续投入企业侧 [17] Agent工具链的六次进化 - 第一次进化在2022年底ChatGPT发布后,催生LangChain等框架以管理外部数据和复杂任务编排 [26] - 第二次进化在2023年6月OpenAI官方支持function calling,以及2024年11月Anthropic发布MCP协议促进工具复用 [26] - 第三次进化在2024年5月GPT-4o推出高质量语音模式,带火实时音视频基础设施如LiveKit [27] - 第四次进化由Claude 3.5 Sonnet增强编码能力推动,产生对安全代码执行沙盒环境的需求 [27] - 第五次进化在2024年9月OpenAI发布o1 preview提升推理能力,催生强化学习微调和评估监督工具 [27] - 第六次进化是2024年10月Computer Use和Browser Use能力出现,形成完整的浏览器操作生态 [28] 关键创业方向与公司案例 - Composio作为MCP协议集成商,提供数百个高质量MCP Server,其产品Rube能根据任务自动调用正确的MCP Server [30][31] - Composio通过AI Agent自动生成和优化MCP Server代码,形成数据闭环和自进化壁垒 [34][35] - LiveKit作为实时音视频基础设施,日通话量从一年前的100万次增长至2000万次,年增20倍,服务OpenAI、Salesforce等大客户 [38][39] - 语音交互存在两种范式:级联式(语音→文本→模型→文本→语音)和端到端语音到语音,后者被认为是终局但前者在当前更可控 [40] - 记忆方案公司Letta提出"睡眠时计算"概念,为Agent提供情境、流程、知识和角色四类记忆管理 [42][43] 市场规模与投资逻辑 - AI可能将全球软件市场规模从6500亿美元推高至约10万亿美元,服务于AI Agent的工具链市场规模可能达到2000-5000亿美元 [50][51] - 百亿美元级公司的出现需具备成为行业标准、形成自进化数据闭环、卡住关键工作流节点三个维度 [53] - 具体机会领域包括智能体身份与调度(如Composio)、Agent可观测性(如Braintrust)、实时通信(如LiveKit)以及工作流集成 [52]
OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么丨晚点播客