级联路由 - 财报，业绩电话会，研报，新闻

级联路由

搜索文档

深思SenseAI· 2026-04-13 13:52

文章核心观点 - 软件并未死亡，但软件的用户基础正在发生结构性替换，从人类用户转向AI Agent，这标志着行业进入了“Agent体验（AX）”时代 [1][2][3][5][6][7][8] - SaaS公司的核心竞争力正从图形用户界面体验转向为AI Agent提供卓越的体验，这要求公司重新构建产品交互模式、编码领域知识并优化性能与成本 [11][22][23] Agent用户基础的转变 - **用户结构发生根本性替换**：在普通企业中，机器身份与人类用户的比例已达到45:1，部分组织甚至高达100:1，AI Agent正成为主要用户 [6] - **Agent操作方式不同**：Agent通过API、脚本和结构化命令以编程方式操作软件，完全绕过图形界面，不进行点击导航 [7] - **生产数据印证趋势**：数据库服务Neon报告其80%的数据库由AI Agent创建；GitHub上超过5%的代码提交完全由Claude Code完成，另有约40%得到了AI辅助 [6] 定义Agent体验（AX）时代的三个关键信号 - **Anthropic发布托管Agent架构**：将“大脑”（模型与外壳）、“双手”（工具与沙箱）和“会话”（事件日志）三层解耦，意味着SaaS公司可将Agent架构委托给前沿AI实验室 [9] - **Intercom与Zapier为Agent重建产品**：Zapier的SDK让编程Agent能访问超过9000个应用连接器；Intercom的Fin AI助手实现了65%的端到端问题解决率，并发布了Fin CLI供Agent直接调用 [9] - **Linear的错误示范**：其发布的Agents功能优先构建了嵌入式聊天界面，但未提供MCP服务器或CLI工具，未能满足客户让外部Agent连接其数据的核心需求 [10] 新软件栈的构成模式一：Skill文件 - **Skill文件是编码领域知识的Markdown文档**：它直接告诉Agent如何正确使用工具，包括调用顺序、约束和原因，使领域专业知识能被Agent直接读取和执行，无需人类翻译 [12] - **Skill文件成为机构知识的新载体**：知识不再主要存在于用户界面或帮助中心，而是沉淀在Skill文件中，这对于确保Agent操作的准确性至关重要 [13] - **实际应用案例**：Figma随MCP服务器发布了编码设计系统惯例的Skills；PostHog将Skill文件视为给高素质新员工的入职手册，例如指导Agent使用正确的默认事件以避免数据误导 [12][13] 新软件栈的构成模式二：CLI工具与MCP服务器 - **命令行界面成为出色的Agent体验**：接受结构化输入并产生结构化输出的CLI命令天然可组合，便于Agent调用、串联工作流和失败重试 [14][15] - **领先公司已进行重建**：37signals将Basecamp重写为完全Agent可访问的产品，包括全新CLI和结构化JSON输出；Google的Gemini CLI扩展在三个月内吸引了超过100万开发者使用 [14] - **开发工具生态围绕Agent构建**：Vercel的AI SDK月下载量突破2000万；主流AI编程工具如Claude Code、GitHub Copilot CLI均通过命令行运行 [14][15] 新软件栈的构成模式三：垂直模型 - **垂直模型是在领域专属数据上微调的模型**：其在特定领域（如法律、客服）的表现超越通用模型，且理论上更快、更便宜 [16] - **垂直模型的成功与挑战案例**：法律AI公司Harvey的定制模型曾让律师在97%的情况下更偏好它而非GPT-4，并助力其ARR在2026年1月达到1.9亿美元，估值达110亿美元 [17]。然而，随着前沿通用推理模型的快速进步，Harvey自己的法律模型在基准测试中被超越，公司最终转向使用模型选择器在多个前沿模型间路由任务 [18] - **垂直模型的有效性条件**：在查询模式高度专门化、错误后果严重且公司拥有足够专有反馈数据的场景下能建立优势，例如Intercom基于超过4000万次已解决对话训练的客服检索模型 [19] 性能即护城河 - **成本与延迟成为关键竞争维度**：Agent只关心性能，包括认证简便性、安全性、成本和速度 [20] - **成本优化策略**：大多数AI生产任务（如数据验证、格式转换）不需要前沿模型推理。采用级联路由等策略，先将查询发送给廉价模型或代码，仅在需要时升级，可实现显著成本节约。斯坦福FrugalGPT研究显示，该方法在保持媲美GPT-4准确率的同时，最高可实现98%的成本降低，生产中通常节省30-60% [20] - **延迟优化至关重要**：小模型响应时间为数十毫秒，确定性代码为个位数毫秒，而前沿模型需要数秒。在链式调用的Agent工作流中，优化策略能将等待时间从30秒缩短至2秒，这种差异会被用户和Agent注意到 [20][21] 对行业与公司的启示 - **软件价值层转移**：软件的数据层、工作流逻辑和领域专业知识依然有价值且越来越重要，但必须被重新编码成Agent和模型能够消费的格式 [22] - **赢得Agent体验的五大要素**：1) 超越特定模型的稳定接口；2) 人类与Agent能力一致；3) 编码了从业者判断力的Skill文件；4) 供Agent配置操作的CLI；5) 在确有场景时使用垂直模型保持领先 [23] - **构建可防御优势**：最值得关注的公司是那些在权重里积累垂直数据优势、用Skill文件编码工作流知识、并用CLI/MCP服务器实现一切可组合的公司。仅声称“为自己的领域构建了AI Agent”已不具备防御性 [23]