Workflow
软件工程智能体
icon
搜索文档
天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课
机器之心· 2025-06-20 10:22
核心观点 - Skywork-SWE 是昆仑万维推出的自主代码智能体基座模型,专注于修复开源软件工程中的 bug,具备多轮交互、长上下文理解与逻辑推理能力 [2][7] - 该模型参数量达 32B,是目前同规模下最强的开源软件工程智能体之一,在 SWE-bench Verified 基准上取得 47% 的准确度,超越多个主流闭源模型 [7][25][33] - 其核心突破在于构建了业内最大规模、可验证的 SWE 数据集(10,169 个真实代码问题 + 8,209 条多轮交互轨迹),首次系统性验证了数据 Scaling Law 在复杂工程任务中的适用性 [11][13][40] 技术实现 数据集构建 - 从 15 万个 GitHub 仓库筛选出 10,169 个真实代码问题和 8,209 条多轮交互轨迹,覆盖 2,531 个仓库,远超同类数据集(如 SWE-Gym Lite 仅 230 个实例)[13][16][21] - 采用三阶段九步骤流程:数据采集与预筛选(阶段 A)、环境设置与执行验证(阶段 B)、智能体轨迹生成(阶段 C),确保每条样本可复现并通过单元测试 [12][16][17] - 数据复杂度显著更高:平均每个补丁涉及 2.3 个函数修改、6 个代码块、74 行代码变更,更贴近真实开发场景 [20][21] 模型性能 - 在 SWE-bench Verified 基准上,Skywork-SWE-32B 以 47% 准确度超越 DeepSeek-V3-0324(671B 参数)和 Claude 3.5(46%),并实现 38.0% pass@1 准确度刷新开源记录 [25][27][33] - 实验显示模型性能随数据规模呈指数级提升且未饱和,验证了数据 Scaling Law 的有效性 [27][29] - 采用测试时扩展(TTS)技术后,Best of 8 测试下准确率提升至 47% [30] 行业意义 - 填补了高质量 SWE 训练数据的空白,其数据集被类比为软件工程智能体的「ImageNet」[40] - 开创了「数据+系统+执行力」的智能体开发范式,未来将扩展至更多编程语言并支持在线强化学习探索 [41][42] - 是昆仑万维 Skywork 系列的重要落地成果,与其多模态推理模型、音乐模型、短剧创作模型等形成全链条布局 [42]
AI辅助编码将如何改变软件工程:更需要经验丰富的工程师
AI前线· 2025-05-12 12:28
生成式AI对软件工程的影响 - 生成式AI将继续改变软件开发方式,75%的开发者已使用AI工具进行软件工程相关工作[1] - AI工具仍处于创新周期早期阶段,软件工程AI智能体可能成为2025年创新核心[1] - 主流媒体对AI取代软件工程师的讨论多出自非专业人士,未能准确评估GenAI工具的效率和局限性[1] AI工具在软件开发中的使用模式 - 开发者分为"加速器"和"迭代器"两类,使用方式截然不同[3][7] - 加速器模式:从零快速构建最小可行产品,如Bolt、v0等工具可在几小时内将设计转化为可运行原型[10][11] - 迭代器模式:用于日常开发,如Copilot等工具辅助代码补全、重构和测试生成[11][12] AI辅助开发的挑战 - "70%问题":AI可快速完成70%工作,但剩余30%需要大量人工调试[14][15] - "两步后退悖论":修复一个问题可能导致更多新问题,形成恶性循环[16] - "知识悖论":AI工具对经验丰富开发者帮助更大,而非初学者[20][22] - 初级开发者容易接受AI输出导致"纸牌屋代码",缺乏可维护性[18] 有效的AI开发模式 - AI初稿模式:生成基本实现后人工重构和增强[28] - 持续对话模式:保持紧密反馈循环,频繁评审变更[29] - 信任加验证模式:生成代码后人工评审关键路径和边缘情况[30] 软件工程智能体的兴起 - 2025年将出现更自主的AI智能体,能规划、执行和迭代解决方案[35][38] - 多模态能力将整合视觉理解、口头对话和环境交互[40] - 英语优先的开发环境使自然语言沟通变得与编程技能同等重要[44] 软件质量与工艺 - AI加速开发但未显著提升软件质量,关键仍依赖人类判断[54] - AI生成代码可能导致"演示品陷阱",忽视边缘情况和用户体验[48][49] - 个人软件可能复兴,开发者将更关注细节和完整用户体验[53] AI对软件工程流程的影响 - AI主要帮助编码环节(占40%时间),对其他环节如规划、验证等帮助有限[58] - 自20世纪60年代以来,无开发者软件工程的梦想仍未实现[59] - 抽象层次越高,越难明确表达复杂软件需求[63] 行业趋势与人才需求 - 对经验丰富软件工程师的需求可能增加,因其能更有效使用AI工具[67] - AI智能体领域将吸引大量风投,价格有望下降[64] - 开发者需要掌握系统设计、架构思维和AI协作等新技能[45][46]