级联路由
搜索文档
45比1,机器用户已经碾压人类——SaaS公司的新战场来了
深思SenseAI· 2026-04-13 13:52
文章核心观点 - 软件并未死亡,但软件的用户基础正在发生结构性替换,从人类用户转向AI Agent,这标志着行业进入了“Agent体验(AX)”时代 [1][2][3][5][6][7][8] - SaaS公司的核心竞争力正从图形用户界面体验转向为AI Agent提供卓越的体验,这要求公司重新构建产品交互模式、编码领域知识并优化性能与成本 [11][22][23] Agent用户基础的转变 - **用户结构发生根本性替换**:在普通企业中,机器身份与人类用户的比例已达到45:1,部分组织甚至高达100:1,AI Agent正成为主要用户 [6] - **Agent操作方式不同**:Agent通过API、脚本和结构化命令以编程方式操作软件,完全绕过图形界面,不进行点击导航 [7] - **生产数据印证趋势**:数据库服务Neon报告其80%的数据库由AI Agent创建;GitHub上超过5%的代码提交完全由Claude Code完成,另有约40%得到了AI辅助 [6] 定义Agent体验(AX)时代的三个关键信号 - **Anthropic发布托管Agent架构**:将“大脑”(模型与外壳)、“双手”(工具与沙箱)和“会话”(事件日志)三层解耦,意味着SaaS公司可将Agent架构委托给前沿AI实验室 [9] - **Intercom与Zapier为Agent重建产品**:Zapier的SDK让编程Agent能访问超过9000个应用连接器;Intercom的Fin AI助手实现了65%的端到端问题解决率,并发布了Fin CLI供Agent直接调用 [9] - **Linear的错误示范**:其发布的Agents功能优先构建了嵌入式聊天界面,但未提供MCP服务器或CLI工具,未能满足客户让外部Agent连接其数据的核心需求 [10] 新软件栈的构成模式一:Skill文件 - **Skill文件是编码领域知识的Markdown文档**:它直接告诉Agent如何正确使用工具,包括调用顺序、约束和原因,使领域专业知识能被Agent直接读取和执行,无需人类翻译 [12] - **Skill文件成为机构知识的新载体**:知识不再主要存在于用户界面或帮助中心,而是沉淀在Skill文件中,这对于确保Agent操作的准确性至关重要 [13] - **实际应用案例**:Figma随MCP服务器发布了编码设计系统惯例的Skills;PostHog将Skill文件视为给高素质新员工的入职手册,例如指导Agent使用正确的默认事件以避免数据误导 [12][13] 新软件栈的构成模式二:CLI工具与MCP服务器 - **命令行界面成为出色的Agent体验**:接受结构化输入并产生结构化输出的CLI命令天然可组合,便于Agent调用、串联工作流和失败重试 [14][15] - **领先公司已进行重建**:37signals将Basecamp重写为完全Agent可访问的产品,包括全新CLI和结构化JSON输出;Google的Gemini CLI扩展在三个月内吸引了超过100万开发者使用 [14] - **开发工具生态围绕Agent构建**:Vercel的AI SDK月下载量突破2000万;主流AI编程工具如Claude Code、GitHub Copilot CLI均通过命令行运行 [14][15] 新软件栈的构成模式三:垂直模型 - **垂直模型是在领域专属数据上微调的模型**:其在特定领域(如法律、客服)的表现超越通用模型,且理论上更快、更便宜 [16] - **垂直模型的成功与挑战案例**:法律AI公司Harvey的定制模型曾让律师在97%的情况下更偏好它而非GPT-4,并助力其ARR在2026年1月达到1.9亿美元,估值达110亿美元 [17]。然而,随着前沿通用推理模型的快速进步,Harvey自己的法律模型在基准测试中被超越,公司最终转向使用模型选择器在多个前沿模型间路由任务 [18] - **垂直模型的有效性条件**:在查询模式高度专门化、错误后果严重且公司拥有足够专有反馈数据的场景下能建立优势,例如Intercom基于超过4000万次已解决对话训练的客服检索模型 [19] 性能即护城河 - **成本与延迟成为关键竞争维度**:Agent只关心性能,包括认证简便性、安全性、成本和速度 [20] - **成本优化策略**:大多数AI生产任务(如数据验证、格式转换)不需要前沿模型推理。采用级联路由等策略,先将查询发送给廉价模型或代码,仅在需要时升级,可实现显著成本节约。斯坦福FrugalGPT研究显示,该方法在保持媲美GPT-4准确率的同时,最高可实现98%的成本降低,生产中通常节省30-60% [20] - **延迟优化至关重要**:小模型响应时间为数十毫秒,确定性代码为个位数毫秒,而前沿模型需要数秒。在链式调用的Agent工作流中,优化策略能将等待时间从30秒缩短至2秒,这种差异会被用户和Agent注意到 [20][21] 对行业与公司的启示 - **软件价值层转移**:软件的数据层、工作流逻辑和领域专业知识依然有价值且越来越重要,但必须被重新编码成Agent和模型能够消费的格式 [22] - **赢得Agent体验的五大要素**:1) 超越特定模型的稳定接口;2) 人类与Agent能力一致;3) 编码了从业者判断力的Skill文件;4) 供Agent配置操作的CLI;5) 在确有场景时使用垂直模型保持领先 [23] - **构建可防御优势**:最值得关注的公司是那些在权重里积累垂直数据优势、用Skill文件编码工作流知识、并用CLI/MCP服务器实现一切可组合的公司。仅声称“为自己的领域构建了AI Agent”已不具备防御性 [23]