Workflow
软件工程
icon
搜索文档
ICLR 2026 oral | AI代码真能进生产环境?SwingArena:从「写对代码Commit」到「通过CI审查」
机器之心· 2026-02-12 14:45
大模型代码能力评测的现状与挑战 - 过去一年,大模型(如GPT、Claude、DeepSeek)生成代码的能力以肉眼可见的速度提升,已能快速生成看似专业的代码,从简单脚本到完整功能模块 [2] - 然而,工业界软件开发的核心要求远不止“写出一段能跑的代码”,代码需通过完整的持续集成流水线、符合项目规范、通过代码审查并在多轮修改中保持稳定,现有主流代码评测基准大多停留在“能否通过几个单元测试”的层面 [3] SwingArena评测框架的核心创新 - 该框架旨在填补长期缺失的、贴近真实软件工程流程的评测空白 [4] - 其核心观点是从“写对代码”转向“通过审查”,将真实开发中的审查与迭代博弈引入评测,通过对抗式设定,让两个模型分别扮演“提交者”和“审查者”,在真实CI环境中反复交锋,最终得分由真实执行结果决定 [9][11] - 该研究论文已被ICLR 2026接收,并已实现全栈开源 [5][12] 应对真实工程复杂度的技术方案 - 真实项目代码规模(如数万行代码、数百个文件)远超模型上下文窗口,为此SwingArena设计了一套检索增强流水线RACG [14][15] - RACG通过经典信息检索缩小范围,再以语法结构切块并用语义模型精排,在严格token预算下动态调整上下文粒度,确保模型看到最关键的代码片段 [15] - 消融实验显示,该分层检索策略相比仅用关键词匹配,能将补丁定位的Top-10命中率提升超过一倍 [15] 对抗评测揭示的模型行为差异 - 在SwingArena的对抗评测中,不同模型在工程决策上的“性格差异”被放大 [16] - 例如,GPT-4o作为提交者表现激进,能快速生成击败对手测试的补丁,胜率高,但CI通过率不稳定,代码规范性和鲁棒性易出问题 [17] - 相比之下,DeepSeek和Gemini表现更为保守,代码风格更规范,CI通过率更高,在多语言场景下稳定性更强 [17] - 这些差异为实际应用提供参考:快速原型开发可能适合激进策略,而生产环境和长期项目则更看重稳定性 [17] SwingArena的行业意义与价值 - 其意义在于推动评测视角从“功能正确性”转向“工程可用性” [18][19] - 通过引入CI流水线、代码审查和多轮迭代,该系统能帮助系统性回答哪些模型适合进入生产环境、不同工程场景下如何选择模型、以及如何设计更符合现实需求的AI编程助手等问题 [19] - 团队将在论文匿名期结束后完整开源所有组件,旨在为研究界和工业界评估与落地AI编程能力提供参考工具和框架 [19][20][21]
美国码农,正被AI“大屠杀”
虎嗅APP· 2025-12-31 22:08
AI对程序员就业市场的冲击 - 由AI导致的全球大裁员在2025年达到117万人,创2020年以来最高纪录[4] - 美国程序员的就业率暴跌27.5%,几乎被砍掉三分之一[5][6][9] - 斯坦福大学研究发现,自2022年底AI工具普及后,22至25岁程序员就业率下降近20%[10] - 一家美国咨询公司报告显示,AI直接或间接导致当年美国近55000人失业[13] 计算机专业毕业生就业困境 - 2026届计算机专业毕业生面临严峻就业市场,美国大学与雇主协会报告称雇主悲观情绪达2020年以来最高点[53] - 斯坦福大学和多伦多大学计算机系毕业生求职困难,许多人选择继续攻读研究生[21][22][25] - 学生依赖的实习或合作项目机会锐减,可能只有百分之一的申请者能收到回复[27] - 应届毕业生投递数百份简历,但机会稀少,且许多职位要求至少一年非实习工作经验[31][32] - 攻读硕士学位的毕业生发现收到的雇主回复甚至比本科时更少[34] AI工具对编程工作性质的重塑 - 前特斯拉AI总监Karpathy形容AI为“强大外星武器”,并指出程序员职业正经历剧烈变革,需掌握包括智能体、提示词等在内的新编程抽象层[38][40][41] - 谷歌全行业调查显示,高达90%的科技岗位使用AI工具,2024年该比例仅为14%[51] - 英伟达CEO黄仁勋指出“会用AI的人会抢饭碗”,AI正成为开发者必备技能[48] - AI工具改变了工程师角色,使其需要承担审查和修复AI生成代码的任务,经验丰富的开发者可能因此被拖慢进度[87][88][91] AI生成代码的质量问题与技术债务 - CodeRabbit公司分析470个代码合并请求发现,AI生成代码平均每个请求包含10.83个问题,是人类代码(6.45个问题)的1.7倍[60][61][62] - AI生成的代码中“严重”和“重大”问题比例极高,分别是人类的1.4倍和1.7倍[67] - 在逻辑与正确性问题上,AI生成的错误是人类的1.75倍(570 vs 326个错误)[71] - 在代码可读性问题上,AI产生的错误是人类的3.15倍[74] - 安全公司Apiiro研究发现,使用AI的开发者产生的安全问题是不用AI同行的十倍[82] - 贝恩公司报告指出,编程领域部署生成式AI后“成本节省并不显著”,且“结果未能达到炒作预期”[84] 行业岗位结构变化与技能需求转型 - 2023年至2025年间,“程序员”就业率暴跌27.5%,而“软件开发人员”就业率仅微跌0.3%[55][57] - 信息安全分析师和AI工程师职位出现两位数爆发式增长[57] - 雇主不再仅仅要求写代码,而是更高阶的思维能力、对软件开发生命周期的掌控以及理解模糊客户需求等AI难以替代的技能[57] - 61%的雇主表示未用AI简单取代入门级岗位,41%的雇主计划利用AI增强这些岗位[94] - 入门级招聘份额较疫情前水平下降50%,科技巨头在2023年招聘崩溃后,2024年反弹主要偏向有经验的员工,应届毕业生被落下[101][105] 软件工程师职业发展的新挑战 - AI包揽了传统的初级“脏活累活”,导致新人缺乏基础工作锻炼,陷入能力获取的“先有鸡还是先有蛋”死循环[95][96][99][100] - 许多公司目光短浅,不愿投资培训新人,可能导致未来中层骨干短缺[111][112] - 未来的工程师需要进化成为懂业务的战略家、严谨的安全审查官以及能够有效管理和修正AI代码的专家[118] - 在谈判、拓展客户关系等关键时刻,个人能力依然至关重要,AI无法替代[116]
美国码农,正被AI「大屠杀」,Karpathy惊呼,26届毕业生崩溃
36氪· 2025-12-29 11:26
AI对编程岗位的冲击与就业市场变化 - 2025年由AI导致的全球大裁员达到117万人,为2020年以来最高纪录[1] - 美国程序员的就业率暴跌27.5%,相当于近三分之一岗位消失[1] - 自2022年底AI工具普及后,22至25岁程序员就业率下降近20%[1] - AI直接或间接导致美国近55000人失业,对就业市场的冲击程度仅次于疫情[4] 应届毕业生与初级开发者面临的困境 - 2026年计算机专业毕业生面临严峻就业市场,雇主悲观情绪达2020年以来最高点[30] - 斯坦福、多伦多大学等顶尖院校CS毕业生求职陷入绝境,情况与三年前截然不同[9] - 许多应届生投递数百份简历,但给毕业生的机会少得可怜,且多要求至少一年非实习经验[17][18] - 应届生依赖的实习或co-op机会锐减,可能仅1%的申请者能收到回复[12] - 为提升竞争力选择攻读硕士的学生发现,求职回复甚至比本科时更少[19] - 初级岗位招聘份额较疫情前水平下降50%,大科技公司2024年招聘反弹主要偏向有经验者,应届生被落下[68][72] AI工具对编程工作性质的重塑 - 高达90%的科技岗位正在使用AI工具,而2024年该比例仅为14%[30] - AI正从生产力工具转变为直接替代程序员岗位的角色[8] - 前特斯拉AI总监Karpathy指出,程序员职业正经历剧烈变革,需掌握涉及智能体、提示词、工作流等的新编程抽象层[23][24] - 人类开发者角色转变为AI的“找茬专家”,需花费大量时间审查AI生成的代码[63] - 对于经验丰富的开发者,AI工具有时反而会拖慢工作进度[60] - 61%的雇主未用AI简单取代入门级岗位,41%的雇主计划利用AI增强这些岗位[63] AI生成代码的质量问题与技术债务 - AI生成的代码合并请求(PR)中问题数量是人类的1.7倍[36][40] - 人类代码平均每个PR包含6.45个问题,而AI代码平均包含10.83个问题[38] - AI生成的PR中,“严重”问题数量是人类的1.4倍,“重大”问题数量是人类的1.7倍[42][44][45] - AI在逻辑与正确性问题上错误尤为突出,相关错误数量是人类的1.75倍[48][56] - 在代码可读性方面,AI产生的错误是人类3.15倍,在命名不清、格式错误等方面也显著更多[52] - 使用AI的开发者引发的安全问题是不用AI者的十倍[60] - 这些问题正累积成巨大的“长期技术债”[39][53] 行业岗位需求的结构性分化 - “程序员”(Programmers,指按规格编写代码)就业率暴跌27.5%[37] - “软件开发人员”(Software Developers,侧重设计、架构与复杂问题解决)就业率仅微跌0.3%[37] - 信息安全分析师和AI工程师的职位在2023至2025年间出现两位数爆发式增长[33] - 雇主对软件工程职位的要求转向更高阶的思维能力、对开发生命周期的掌控以及理解模糊客户需求等AI难以替代的技能[33] 开发者职业发展路径的危机 - 传统上用于磨练初级工程师技能的“脏活累活”正被AI包揽,导致新人成长路径断裂[64] - 新人陷入“先有鸡还是先有蛋”的死循环:需要高级能力却缺乏基础工作锻炼[67] - 许多公司因注重短期业绩,不愿投资培训新人,可能导致未来中层骨干短缺[78] - 未来的工程师需进化成懂业务的战略家、安全审查官和能驾驭AI工具的超级驾驶员,仅会“默写算法”或“堆砌代码”的时代已终结[79]
斯坦福最火CS课:不让学生写代码,必须用AI
机器之心· 2025-12-08 18:11
课程概况与市场反响 - 斯坦福大学计算机系新开设的课程《现代软件开发者》(CS146S: The Modern Software Developer)成为AI圈热门话题,课程主旨是教授在不编写一行代码的情况下进行编程开发[1][2] - 该课程在2024年9月首次上线即被学生挤爆,候补名单超过200人,反映了市场对AI时代软件开发技能转型的强烈需求[5] - 课程历时10个月精心打造,是首个专注于人工智能软件原理与实践的课程,资料齐全,涵盖阅读材料、作业练习、示例代码和全套课件[8][9] 课程核心教学理念 - 课程明确鼓励学生尽可能不写代码,专注于使用AI工具进行“氛围编码”(Vibe Coding),学生提交作业需附带与AI的对话记录[5] - 教学重点并非AI原理或调优,而是教授如何使用Cursor和Claude等AI代码工具,并应对AI的“幻觉”问题[5] - 课程旨在帮助学生完成从使用AI到构建AI驱动软件的转变,为成为未来的AI原生软件工程师打下基础[16] 课程具体内容与结构 - 课程为期十周,内容循序渐进,从LLM基础知识与提示工程开始[10] - 第二至四周深入编程智能体(Agent)的内部结构、AI集成开发环境以及人机协作模式[11][12][13] - 第五至七周涵盖AI增强的现代终端、AI在测试与安全领域的应用,以及AI在软件支持与维护中的价值[14] - 第八至十周探讨AI驱动的自动化UI/App构建、智能体部署后的运维管理,以及人工智能软件工程的未来发展方向[15] 行业趋势与技能转型 - 课程的出现表明,在快速发展的大语言模型冲击下,行业最关注的问题已转变为如何适应充满AI的世界[5] - 课程最终周主题为“人工智能软件工程的未来”,聚焦软件开发职业的未来方向、新兴的AI驱动编码范式以及行业发展趋势[6][15] - 讲师指出,AI技术发展迅速,明年的课程内容可能会大不相同,暗示了行业技术迭代的高速度[23] 目标学员与前置要求 - 课程兼顾实用与有趣,配套实践项目,要求学习者具备与CS111相当的编程经验(编程语言、操作系统和软件工程)[9] - 推荐学员已修完CS221/229课程(高等数学、机器学习基础),表明课程面向已有一定技术基础的学习者[9] - 讲师Mihail Eric计划在明年教授一个面向专业开发者的公开版本课程,名为《AI Software Development: From First Prompt to Production Code》,显示该技能培训正从学术向职业领域扩展[19]
工程师变身AI“指挥者”,吉利与阿里云的软件开发变革实验
自动驾驶之心· 2025-11-13 08:04
行业核心挑战 - 汽车行业面临软件工程史上最大规模挑战,智能汽车代码量突破亿行,系统复杂度被放大数百倍[3] - 行业本质从硬件主导转向软件定义,软件决定产品核心体验,带来开发模式和复杂度的双重挑战[6] - 电子电气架构从分布式ECU向中央计算演进,面向服务架构(SOA)使系统集成复杂度呈指数级增长[8] - 需同时应对座舱域Linux/Android、智驾域QNX、车身域AUTOSAR等多平台,应用层与底层使用Java/Python/C/C++等异构技术栈[8] - 必须遵从ISO 26262功能安全、ISO/SAE 21434信息安全、ASPICE、MISRA C/C++等严苛国际标准,与敏捷开发模式存在张力[8] AI应用成效 - 公司软件开发人员占比从不到10%跃升至40%[3] - 数千人研发使用通义灵码,AI生成代码占比超过30%,代码开发效率提升20%[5] - 在30天项目中,编码实现环节效率提升30%,带动项目整体提效10%[11] - 编码阶段具体节省:编写代码从5人天减至4人天,注释补全从1.5人天减至0.5人天,单元测试从2.5人天减至2人天,代码优化从1人天减至0.5人天[11] - AI应用覆盖应用层软件研发、嵌入式开发和算法研发三大板块[10] 技术实施路径 - 通过构建高质量私有代码库、API文档和技术规范的专有知识库,使AI能理解业务上下文[15] - 结合RAG和MCP技术,使AI能准确提示内部API调用方式并遵循统一错误处理机制[14][15] - 支持企业专属版部署,通过VPC专线实现网络隔离与安全接入,确保核心代码资产不出内网[15] - 利用阿里云全球基础设施,实现多地部署、就近接入,满足全球研发中心低延迟和数据合规要求[18] 组织变革与价值延伸 - AI工具价值超越效率提升,协助处理PB级雷达点云和视频数据清洗,通过自然语言描述自动生成复杂脚本[11] - AI扮演知识管家角色,帮助新工程师将熟悉遗留代码模块的时间从一周缩短至两天,有效管理技术债[17] - 推动质量左移,在代码提交阶段由AI自动进行高频审核,使资深工程师从执行者转变为规则制定者[19] - 促进全球协同,统一代码仓和研发工具,推动编码规范和流程标准化[18] 未来愿景与人才转型 - 工程师角色从一线执行者转向AI指挥官,核心能力要求从实现能力转向定义问题、拆解任务和评估结果的能力[20][22] - 终极愿景是实现黑灯研究院,构建从需求到交付的端到端自动化工作流[22] - 未来工程师主导规则制定,AI承担更多执行工作,当前工程师与AI工作占比各半[21][22] - 行业急需既懂机械硬件又精通软件系统工程的交叉人才,AI有望降低软件开发门槛,让机械背景工程师参与软件开发[23]
南京大学:组建新工科“至诚班”
科技日报· 2025-06-18 08:42
南京大学本科教育改革举措 - 南京大学苏州校区新增自动化(机器人方向)招生专业,聚焦智能制造、智能机器人与决策控制等前沿方向,构建"创新创业实验班"个性化培养模式 [1] - 苏州校区新成立机器人与自动化学院,打造"入学即接轨产业"的实践平台 [1] - 推出"至诚班"培养模式,由院士领衔,知名学者担任导师,本科阶段强化科教融合,研究生阶段推行"校企双导"产教融合机制 [1] 强基计划与理科人才培养 - 2025年强基计划在数学与应用数学专业新增"智能科学"培养方向,在物理学专业新增"电子科学"培养方向 [2] - 匡亚明学院持续深化大理科班杰出人才培养模式改革,按照理科大类招生,低年级不分专业 [2] - 匡亚明学院学生可以100%自由选择分流方向、学科导师和学业导师、国际交流,100%入选'拔尖计划',80%以上毕业生进入名校深造 [2] 双学士学位复合型人才培养 - 2025年新增"软件工程+工商管理(软工商业创新班)"和"软件工程+经济学(软工经济创新班)"两个双学士学位项目 [2][3] - 软工商业创新班可申请工学和管理学双学士学位,软工经济创新班可申请工学和经济学双学士学位 [3] - 继续招收计算机金融实验班、德语法学实验班、智能系统集成实验班、大数据传播实验班等四个双学士学位项目 [3]
Redis 之父亲证:人类程序员仍力压 LLM!网友锐评:那是你没见过平庸码农被 AI 吊打的样子
程序员的那些事· 2025-05-30 15:10
AI与程序员能力对比 - 核心观点:人类程序员在复杂问题解决和创造性思维方面仍显著优于大语言模型(LLMs),AI当前主要作为辅助工具而非替代品[2][3][10] - Redis之父antirez通过修复HNSW图结构双向连接校验的案例,展示人类能提出LLM无法自主生成的优化方案(如异或累加器检测算法),将2000万向量集的校验时间从90秒优化至可接受范围[5][7][8][10] - 行业专家普遍认为LLM的价值在于充当"智能伙伴",帮助验证想法和代码审查,但无法替代需求分析、社交协作等软件工程核心环节[13][14] 技术实现细节 - Redis向量集修复方案: - 常规方法时间复杂度达O(N²),导致2000万向量加载时间翻倍至90秒[5][7] - LLM(Gemini 2.5 PRO)仅能建议排序+二分查找等基础优化,无法突破性解决指针校验问题[7][8] - 人类提出创新方案: - 哈希表存储连接关系(A:B:X格式),利用memcpy替代snprintf提升效率[8] - 128位寄存器异或累加检测,配合murmur-128哈希函数降低碰撞风险至可接受水平[9][14] 行业观点碰撞 - 能力边界争议: - 顶尖程序员(如antirez)的创造性解决方案能力远超LLM,但平庸程序员可能被AI工具缩小差距[15] - 软件工程的社交属性(需求分析、客户沟通)是AI难以替代的核心竞争力[14] - 技术演进预期: - 当前LLM在代码生成文档等标准化任务中表现最佳,但无法预判未来2年技术突破后的格局[13][16] 典型案例参考 - 高性能编程领域人类优势显著:日本工程师的PowerPC汇编代码性能可超越编译器生成代码达数量级差异[15] - AI生成代码现存缺陷:存在生成3000+行无法运行代码的案例,反映逻辑连贯性不足的问题[16]
又要取代程序员了?这锅轮到 AI 背了
AI科技大本营· 2025-05-29 16:05
核心观点 - AI不会取代程序员,而是提升对开发者系统设计能力的要求,优秀者被放大,平庸者被边缘化 [2][4][5] - 代码是负债而非资产,AI加速生成代码的同时,能有效管理这些负债的系统设计者价值更高 [22][23] - 技术变革的规律是"重塑"而非"取代",历史证明NoCode、云计算等催生了更高薪的新岗位 [10][14][16] 技术变革历史规律 - NoCode运动未消灭开发者,反而催生NoCode专家岗位,薪资高于传统程序员 [10][13][14] - 云计算将系统管理员重塑为DevOps工程师,职责扩展至基础设施即代码,薪资翻倍 [10][15][16] - 海外外包热潮最终演变为精细化分布式协作模式,总体成本不降反升 [17][18] AI对编程的影响机制 - AI代码助手如同木匠的CNC机床,仅工具升级,核心设计能力仍依赖人类 [3][20][26] - 初级开发者依赖AI生成代码但缺乏架构,高级开发者用AI辅助系统设计与业务模型 [7][19][23] - AI擅长局部代码优化但无法判断全局架构,错误设计被快速固化的风险加剧 [23][24] 行业能力需求演变 - 技术迭代推动岗位升维:系统管理员→DevOps、后端开发者→云架构师 [25][26] - 穿越技术周期的核心能力始终是系统设计而非写代码,这是AI尚未突破的领域 [11][26][27] - 技术革新本质是能力升维而非职业灭绝,程序员将进化为更高维度创作者 [21][28][29]