Flow Awareness

搜索文档

突袭Cursor，Windsurf抢发自研大模型！性能比肩Claude 3.5、但成本更低，网友好评：响应快、不废话

AI前线· 2025-05-16 23:39

整理 | 核子可乐、褚杏娟当地时间 5 月 16 日，专为软件工程师开发热门 AI 工具的初创公司 Windsurf 宣布推出了其首个 AI 软件工程模型家族：SWE-1。除了编码任务之外，本系列模型还针对完整软件工程流程进行了优化。此系列目前包含三款具体模型：这是继 30 亿美元被 OpenAI 收购消息后，Windsurf 的首次技术产品向动态，鉴于此，人们对 Windsurf 推出自研 AI 模型感到意外。然而，这次模型的发布表明，Windsurf 正在尝试从单纯开发应用程序，扩展到同时研发支撑这些应用的底层模型。 SWE-1 系列发布后，开发者 Arif 立马上手构建一个 Flutter 应用演示，评价称"目前为止很棒！" 不过，Nuttall 也指出，如果没有给出明确的规则，它还是会产生不少幻觉，比如它完全搞错了该如何在应用中添加路由。另外，和它一起写代码时，最好把功能拆分成小任务，并尽可能一开始就提供足够多的上下文信息，以避免陷入 AI 死循环。 "总体来说，我个人还是更倾向于在大多数场景下使用 Gemini 2.5，但这是个不错的开始，后续的迭代值得关注。"Nuttall 总结道 ...

Artificial Intelligence

Software Engineering

Flow Awareness

Artificial Intelligence

SWE-1

SWE-1-lite

Artificial Intelligence

Software Engineering

Flow Awareness

Artificial Intelligence

SWE-1

SWE-1-lite

怎么回事？刚被OpenAI收购，Windsurf就发了个自己的模型

Founder Park· 2025-05-16 17:22

核心观点 - OpenAI以30亿美元收购Windsurf [1] - Windsurf发布AI编程模型SWE-1 覆盖软件开发全流程核心为流动感知（Flow Awareness）实现人机自然交接 [1] - SWE-1系列包含三个模型：SWE-1 SWE-1-lite SWE-1-mini [2][5] - AI编程从代码补全发展到构建完整应用但仍需覆盖开发全流程的模型 [7][8][12] - Windsurf目标超越前沿实验室模型 [30][31] AI编程发展现状 - 模型能从自动补全发展到构建小型应用但存在上限 [7] - 软件开发不止编码需覆盖终端操作调试用户反馈等全流程 [8] - 工程过程跨阶段持续变化需处理未完成状态和模糊目标 [9][10] - 仅提升编码能力无法提高整体工程效率需支持完整流程的SWE模型 [12] SWE-1模型开发 - 灵感来自Windsurf编辑器构建共享时间线数据结构理解未完成状态和长周期任务 [13] - 离线评估接近前沿基础模型超越非前沿和开源对手 [15][21] - 会话式SWE任务基准：评估人机协作表现 [16] - 端到端SWE任务基准：评估独立解决问题能力 [19] - 线上实测指标： - 用户每天接受代码行数反映帮助程度和粘性 [24] - Cascade代码贡献率反映模型主动性和用户信任 [26] - SWE-1-lite取代Cascade Base SWE-1-mini针对低延迟场景 [28][29] 流动感知系统 - 核心理念为共享时间线实现AI与用户行为双向理解 [34] - 允许自然交接：AI执行-用户校正-AI继续形成顺畅衔接 [36] - 持续追踪模型能力边界明确需用户介入的任务 [37] - 共享时间线演进包括终端输出感知预览功能 IDE搜索感知等 [44] 未来展望 - SWE-1是起点将持续改进模型性能并保持低成本 [42] - AI编程从代码补全进入全面工程协作新时代 [43] - Windsurf具备打造前沿模型的引擎将加大投入实现超越 [31][42]