Flow Awareness

搜索文档
突袭Cursor,Windsurf抢发自研大模型!性能比肩Claude 3.5、但成本更低,网友好评:响应快、不废话
AI前线· 2025-05-16 23:39
整理 | 核子可乐、褚杏娟 当地时间 5 月 16 日,专为软件工程师开发热门 AI 工具的初创公司 Windsurf 宣布推出了其首个 AI 软件工程模型家族:SWE-1。除了编码任务之外,本系列模型还针对完整软件工程流程进行了优 化。 此系列目前包含三款具体模型: 这是继 30 亿美元被 OpenAI 收购消息后,Windsurf 的首次技术产品向动态,鉴于此,人们对 Windsurf 推出自研 AI 模型感到意外。然而,这次模型的发布表明,Windsurf 正在尝试从单纯开发应 用程序,扩展到同时研发支撑这些应用的底层模型。 SWE-1 系列发布后,开发者 Arif 立马上手构建一个 Flutter 应用演示,评价称"目前为止很棒!" 不过,Nuttall 也指出,如果没有给出明确的规则,它还是会产生不少幻觉,比如它完全搞错了该如 何在应用中添加路由。另外,和它一起写代码时,最好把功能拆分成小任务,并尽可能一开始就提供 足够多的上下文信息,以避免陷入 AI 死循环。 "总体来说,我个人还是更倾向于在大多数场景下使用 Gemini 2.5,但这是个不错的开始,后续的迭 代值得关注。"Nuttall 总结道 ...
怎么回事?刚被OpenAI收购,Windsurf就发了个自己的模型
Founder Park· 2025-05-16 17:22
核心观点 - OpenAI以30亿美元收购Windsurf [1] - Windsurf发布AI编程模型SWE-1 覆盖软件开发全流程 核心为流动感知(Flow Awareness)实现人机自然交接 [1] - SWE-1系列包含三个模型:SWE-1 SWE-1-lite SWE-1-mini [2][5] - AI编程从代码补全发展到构建完整应用 但仍需覆盖开发全流程的模型 [7][8][12] - Windsurf目标超越前沿实验室模型 [30][31] AI编程发展现状 - 模型能从自动补全发展到构建小型应用 但存在上限 [7] - 软件开发不止编码 需覆盖终端操作 调试 用户反馈等全流程 [8] - 工程过程跨阶段持续变化 需处理未完成状态和模糊目标 [9][10] - 仅提升编码能力无法提高整体工程效率 需支持完整流程的SWE模型 [12] SWE-1模型开发 - 灵感来自Windsurf编辑器 构建共享时间线数据结构 理解未完成状态和长周期任务 [13] - 离线评估接近前沿基础模型 超越非前沿和开源对手 [15][21] - 会话式SWE任务基准:评估人机协作表现 [16] - 端到端SWE任务基准:评估独立解决问题能力 [19] - 线上实测指标: - 用户每天接受代码行数反映帮助程度和粘性 [24] - Cascade代码贡献率反映模型主动性和用户信任 [26] - SWE-1-lite取代Cascade Base SWE-1-mini针对低延迟场景 [28][29] 流动感知系统 - 核心理念为共享时间线 实现AI与用户行为双向理解 [34] - 允许自然交接:AI执行-用户校正-AI继续 形成顺畅衔接 [36] - 持续追踪模型能力边界 明确需用户介入的任务 [37] - 共享时间线演进包括终端输出感知 预览功能 IDE搜索感知等 [44] 未来展望 - SWE-1是起点 将持续改进模型性能并保持低成本 [42] - AI编程从代码补全进入全面工程协作新时代 [43] - Windsurf具备打造前沿模型的引擎 将加大投入实现超越 [31][42]