Trace Data
搜索文档
Cursor们为什么都开始自研模型?
深思SenseAI· 2026-04-01 15:46
文章核心观点 - 在AI时代,仅专注于应用层(中间层)的公司不是一个稳定的状态,它们最终都会向垂直整合(全栈化)发展,要么向下整合模型层,要么向上整合服务层 [1][2] - 垂直整合正在快速发生,模型公司、应用公司和服务公司最终将在同一战场竞争,行业格局正在重塑 [22][32] 三层蛋糕模型与中间层困境 - AI产业可简化为三层结构:顶层是**人/服务层**(审核、交付),中层是**应用/Agent层**(编排、数据上下文),底层是**模型层**(推理、生成)[6] - 传统的AI应用公司只占据中间层,如同餐厅只负责烹饪但不控制食材和外卖,其利润和差异化能力易受上下游挤压 [6][25] - 模型层被OpenAI、Anthropic、Google等巨头控制,服务层被行业知识和人力控制,导致纯应用层公司处境艰难 [6] 向下整合:吃掉模型层 - 路径是应用公司向下整合,训练和调优自己的模型,而不仅仅是调用API [9][11] - 在编程和客服赛道表现明显:**Cursor**发布了基于Kimi K2.5继续预训练的**Composer 2**前沿编码模型;**Intercom**发布了直接处理几乎所有英文客服对话的**Fin Apex**模型,并称之为“垂直模型的时代” [10][11] - 主要驱动力是构建**数据飞轮**:产品好→用户多→用户交互痕迹(trace)多→训练数据好→模型更强→产品更好,形成难以复制的壁垒 [12] - 次要原因包括**成本与速度**(特定场景下,微调小模型的成本可能只有通用大模型的十分之一,速度快好几倍)和**产品差异化**(自研模型难以被抄袭) [13] 向上整合:吃掉服务层 - 路径是应用公司向上整合,不卖软件,而是直接向终端客户**销售结果或服务**,拥有端到端的流程 [15][16] - AI将“最后一公里”的服务成本降低了一个数量级,使得原本人力密集、低毛利的“卖结果”模式变得经济可行 [17] - 代表性案例包括:**Crosby AI**提供端到端法律服务(Neofirm);**WithCoverage**和**Harper**作为AI原生保险经纪;**Mechanical Orchard**提供完整的遗留系统迁移服务 [18][19] - 当AI能完成90%的工作时,公司有动力吃掉剩下10%最值钱的部分,通过人机结合确保100%的交付,并将自动化率提升直接转化为毛利增长 [20] 殊途同归与最终状态 - 向下整合和向上整合两条路径最终会交汇 [21] - 向上整合的服务公司在积累行业数据后,会向下训练自己的模型;向下整合的公司在模型足够强后,会向上直接销售服务结果 [21] - 最终状态是公司同时拥有**底层智能**、**中间编排**和**上层交付**,实现三层通吃的“全栈”模式 [22] - 模型公司(如OpenAI、Anthropic、Google)也在从底层向上做应用,与应用公司从中间向两头扩张,最终将在同一战场相遇 [22] 垂直整合的前提与飞轮 - **向下整合**的前提是拥有**足够多、高质量的特定领域用户交互痕迹(trace)**,这是训练差异化模型的基础 [26][32] - **向上整合**的前提是**深刻理解行业的“最后一公里”**,即AI难以处理的合规、审核、信任等需要行业经验的部分 [27] - 两条路径的成功都依赖于构建强大的**增长飞轮** [28] - 向下整合的飞轮:用户用量 → 产生trace → 改进模型 → 增强产品 → 吸引更多用户 [29] - 向上整合的飞轮:完成服务交付 → 积累数据 → 提升自动化率 → 增加毛利 → 加大投入 → 提升交付能力 [30] - 竞争胜负取决于飞轮的转动速度 [31] 行业启示与影响 - 纯应用层(仅作为模型包装)是一个**过渡状态**,而非安全地带,公司必须选择向下或向上整合 [32] - 特定领域的**用户行为痕迹(trace)** 是AI时代新的数据护城河,早期获取用户对积累训练数据至关重要 [32] - AI使得**“销售结果”(Services-as-Software)** 的商业模式变得经济可行,这是一场正在发生的变革 [32] - 垂直整合已是进行时,案例包括Cursor发布自研模型、Intercom推动垂直模型、Crosby AI销售法律服务等 [32]