Windsurf推出SWE-1模型家族 - 公司推出首个针对完整软件工程流程优化的AI模型家族SWE-1 包含三款具体模型:SWE-1、SWE-1-lite和SWE-1-mini [1][6] - 此举标志着公司从应用开发向底层模型研发的战略扩展 距离被OpenAI收购30亿美元后首次技术产品发布 [2] - SWE-1工具调用推理能力接近Claude 3.5 Sonnet 但服务成本更低 付费用户均可使用 [6] 模型技术特点 - SWE-1-lite取代原有Cascade Base模型 质量更优 面向所有用户无限次使用 [6] - SWE-1-mini强调响应速度 为Windsurf Tab被动体验提供支持 [6] - 模型采用"流程感知"训练方法 通过共享时间线实现人机无缝协作 [29][30] 产品性能表现 - 开发者实测显示模型响应迅速高效 但存在规则不明确时产生幻觉的问题 [5][7] - 在对话式SWE任务基准测试中 采用10分制评估人机交互编码能力 [15] - 端到端SWE任务基准测试显示 模型独立解决问题能力达到前沿水平 [18][20] 公司战略方向 - 目标是将软件开发速度提升99% 超越单纯编码功能 覆盖测试/用户反馈等全流程 [9][12] - 通过生产实验盲测验证 模型每日贡献代码行数等指标接近行业领先水平 [21][22] - 将持续投入SWE模型研发 计划超越现有前沿模型性能 [27][33] 编辑器技术赋能 - 编辑器整合终端输出/剪贴板内容/IDE搜索等多元感知能力 [31][32] - 共享时间线设计使模型能持续学习用户行为模式 形成数据飞轮 [30] - 当前已实现文本编辑器感知/终端感知/浏览器基础感知等多维度协作 [31]
突袭Cursor,Windsurf抢发自研大模型!性能比肩Claude 3.5、但成本更低,网友好评:响应快、不废话
AI前线·2025-05-16 23:39