Cursor们为什么都开始自研模型?
深思SenseAI·2026-04-01 15:46

文章核心观点 - 在AI时代,仅专注于应用层(中间层)的公司不是一个稳定的状态,它们最终都会向垂直整合(全栈化)发展,要么向下整合模型层,要么向上整合服务层 [1][2] - 垂直整合正在快速发生,模型公司、应用公司和服务公司最终将在同一战场竞争,行业格局正在重塑 [22][32] 三层蛋糕模型与中间层困境 - AI产业可简化为三层结构:顶层是人/服务层(审核、交付),中层是应用/Agent层(编排、数据上下文),底层是模型层(推理、生成)[6] - 传统的AI应用公司只占据中间层,如同餐厅只负责烹饪但不控制食材和外卖,其利润和差异化能力易受上下游挤压 [6][25] - 模型层被OpenAI、Anthropic、Google等巨头控制,服务层被行业知识和人力控制,导致纯应用层公司处境艰难 [6] 向下整合:吃掉模型层 - 路径是应用公司向下整合,训练和调优自己的模型,而不仅仅是调用API [9][11] - 在编程和客服赛道表现明显:Cursor发布了基于Kimi K2.5继续预训练的Composer 2前沿编码模型;Intercom发布了直接处理几乎所有英文客服对话的Fin Apex模型,并称之为“垂直模型的时代” [10][11] - 主要驱动力是构建数据飞轮:产品好→用户多→用户交互痕迹(trace)多→训练数据好→模型更强→产品更好,形成难以复制的壁垒 [12] - 次要原因包括成本与速度(特定场景下,微调小模型的成本可能只有通用大模型的十分之一,速度快好几倍)和产品差异化(自研模型难以被抄袭) [13] 向上整合:吃掉服务层 - 路径是应用公司向上整合,不卖软件,而是直接向终端客户销售结果或服务,拥有端到端的流程 [15][16] - AI将“最后一公里”的服务成本降低了一个数量级,使得原本人力密集、低毛利的“卖结果”模式变得经济可行 [17] - 代表性案例包括:Crosby AI提供端到端法律服务(Neofirm);WithCoverageHarper作为AI原生保险经纪;Mechanical Orchard提供完整的遗留系统迁移服务 [18][19] - 当AI能完成90%的工作时,公司有动力吃掉剩下10%最值钱的部分,通过人机结合确保100%的交付,并将自动化率提升直接转化为毛利增长 [20] 殊途同归与最终状态 - 向下整合和向上整合两条路径最终会交汇 [21] - 向上整合的服务公司在积累行业数据后,会向下训练自己的模型;向下整合的公司在模型足够强后,会向上直接销售服务结果 [21] - 最终状态是公司同时拥有底层智能中间编排上层交付,实现三层通吃的“全栈”模式 [22] - 模型公司(如OpenAI、Anthropic、Google)也在从底层向上做应用,与应用公司从中间向两头扩张,最终将在同一战场相遇 [22] 垂直整合的前提与飞轮 - 向下整合的前提是拥有足够多、高质量的特定领域用户交互痕迹(trace),这是训练差异化模型的基础 [26][32] - 向上整合的前提是深刻理解行业的“最后一公里”,即AI难以处理的合规、审核、信任等需要行业经验的部分 [27] - 两条路径的成功都依赖于构建强大的增长飞轮 [28] - 向下整合的飞轮:用户用量 → 产生trace → 改进模型 → 增强产品 → 吸引更多用户 [29] - 向上整合的飞轮:完成服务交付 → 积累数据 → 提升自动化率 → 增加毛利 → 加大投入 → 提升交付能力 [30] - 竞争胜负取决于飞轮的转动速度 [31] 行业启示与影响 - 纯应用层(仅作为模型包装)是一个过渡状态,而非安全地带,公司必须选择向下或向上整合 [32] - 特定领域的用户行为痕迹(trace) 是AI时代新的数据护城河,早期获取用户对积累训练数据至关重要 [32] - AI使得**“销售结果”(Services-as-Software)** 的商业模式变得经济可行,这是一场正在发生的变革 [32] - 垂直整合已是进行时,案例包括Cursor发布自研模型、Intercom推动垂直模型、Crosby AI销售法律服务等 [32]

Cursor们为什么都开始自研模型? - Reportify