Workflow
代码生成
icon
搜索文档
不靠Agent,4步修复真Bug!蚂蚁CGM登顶SWE-Bench开源榜
机器之心· 2025-06-27 14:44
核心观点 - 蚂蚁集团推出的代码图模型CGM基于开源模型实现了与闭源模型媲美的性能,在SWE-BenchLite测试中解决率达到44%,位列开源模型第一[10][11][21] - CGM采用Agentless架构,首创将代码仓库图结构作为模态输入,直接融入大模型中,显著提升模型对代码结构的理解能力[39][40] - 该模型通过多粒度代码图谱建模、两阶段训练和轻量化GraphRAG框架三大技术突破,实现了高效仓库级代码修复[41][45][50] 技术性能 - 在SWE-BenchLite测试中,CGM解决率达到44%,远超GPT-4的1.7%和Claude2的4.8%,位列开源模型第一[3][10][21] - 该模型在2024年10月首次登顶SWE-BenchLite开源榜首时解决率为35.67%,后续版本提升至41.67%和44%,实现"连续三杀"[20][21] - CGM基于开源千问大模型开发,同步开放训练用的代码图数据,打破闭源模型垄断[13] 架构创新 - 首创Agentless架构,仅用4步轻量级GraphRAG流程完成问题定位与修复,相比传统Agent架构大幅简化[14][39][50] - 将代码仓库建模为图数据结构,通过程序分析技术捕捉函数调用、模块依赖等复杂关系[42][44] - 设计图感知注意力掩码机制,模拟图神经网络的消息传递,实现结构与语义的深度融合[46][47] 技术实现 - 多粒度代码图谱建模支持Python和Java,包含7类代码实体和5种依赖关系[42][48] - 两阶段训练实现结构-语义双模态对齐,包括语义对齐和图结构注意力机制[45][46] - GraphRAG框架精简为4个核心模块:改写器、检索器、重排器和生成器[51][52] 行业影响 - 该技术为企业在保障数据安全的同时提供更大自由度,可基于业务需求深度定制[54][55] - 解决了传统LLM+Agent架构存在的误差积累、训练数据不匹配和线性读代码局限等问题[30][34][36] - 标志着AI在软件工程领域的重大突破,可能引发行业变革[56]
AI编码工具双雄也开始商业互捧了?Cursor × Claude 最新对谈:两年后,几乎100%代码都将由AI生成!
AI前线· 2025-06-21 11:38
公司发展里程碑 - 成立不到两年即实现年经常性收入1亿美元,达到大多数SaaS公司需十年才能完成的里程碑 [1] - 公司成立一年半总融资达95亿美元,四位创始人年龄均为25岁 [5] - 4个月内ARR从1亿增至3亿美元,团队规模不足50人 [5] - 每日编写代码量达10亿行,工程师人均处理2万笔交易/秒 [3][7] 产品技术突破 - 通过Claude 3.5 Sonnet实现跨文件编辑能力跃升,推动产品大规模普及 [15][16] - 后台Agent功能支持异步任务处理,可完成90%工作后由开发者完善剩余部分 [23] - 采用"用Cursor构建Cursor"的递归开发模式,通过内部使用驱动产品迭代 [20][21] - 代码生成工具在用户中渗透率超90%,Tab功能完成70%手动编码内容 [39] 行业范式变革 - 开发者效率提升10倍,正在重构软件开发范式 [12] - 代码编写将遵循"AI生成+人类审核"模式,预计2027年AI参与度近100% [38][39] - 软件验证成为下一瓶颈,需解决代码审查与隐性知识获取难题 [24][27] - 代码结构趋向扁平化,API设计显性适配模型处理需求 [32] 核心竞争优势 - 专注开发者生产力工具赛道,拒绝盲目扩张保持小团队高效运作 [6] - 获得OpenAI领投的800万美元种子轮融资,形成战略联盟 [6] - 产品技术深度整合Claude系列模型,持续优化代理编码能力 [34][35] - 通过严格限制团队规模(<50人)维持极高人均产出效率 [5][7] 未来发展方向 - 重点突破大型代码库理解能力,解决数百万文件级别的复杂场景 [27][28] - 探索软件自适应进化,实现系统根据用户交互实时调整功能 [41] - 深化非技术因素整合,如销售端需求与代码决策的关联 [30] - 持续优化模型在工具链集成、环境迁移等方面的工程实践 [26]
AI 编程终结的不是代码,而是作为「容器」的软件
Founder Park· 2025-06-03 20:56
以下文章来源于范阳 ,作者范阳 范阳 . This is a "living media", 目标是建立一种文化, 使前沿科技和风险投资为人类服务,而不是把人类和生态作为手段。我是一名创业者,科技投资人和内容创 作者,这里也是我学习和成长的地方。 2005 年 YouTube 的「上传」按钮开启了内容创作的民主化时代。而现在,AI 以「描述」这一动词,正在改变我们对于软件的认知与生产方式。 一年后,这个预测逐渐应验。Chris Paik 近期再次发布了一篇博客文章《无限代码的黎明》,顺着这个方向,提出随着大语言模型(LLM)将代码生成的 成本降至趋近于零,传统意义上作为独立「应用程序」或「平台」存在的软件形式将逐渐消失。这篇文章的最核心观点是:软件的终结并非代码的死亡, 而是其作为「容器」的消融。 以下为文章原文,内容略有调整。 原文链接: https://docs.google.com/document/d/1Dm9UrhgaRMu_DjOz5KluO7ibOsPaUVQgwnC5-ccw9_g/mobilebasic 超 4000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者 ...
AI应用浪潮风靡全球!“OpenAI劲敌“Anthropic 创收规模五个月翻三倍
智通财经网· 2025-05-31 11:41
Anthropic营收增长 - Anthropic年化营收达30亿美元,较2024年12月的近10亿美元年化营收大幅跃升 [1] - 营收在3月底突破20亿美元,5月底达到30亿美元,5个月内增长三倍 [1] - 营收激增主要来自向企业销售定制化"AI大模型即服务",显示企业级AI应用需求大幅增长 [1] Anthropic业务模式 - 公司以AI代码生成技术闻名,产品在全球科技公司快速采用 [2] - 单季度营收增速使其成为风险投资家眼中增长最快的SaaS公司 [2] - 通过Claude AI聊天机器人订阅模式获得消费者驱动营收,但难以精准统计 [3] 与OpenAI对比 - OpenAI预计2025年营收超120亿美元,远高于去年37亿美元 [4] - OpenAI更聚焦消费者端,大部分营收来自ChatGPT订阅 [4] - Anthropic的Claude流量仅为ChatGPT的2% [5] 行业趋势 - 企业级AI应用软件需求旺盛,加速渗透至各行各业 [6] - C3.ai在19个行业创造营收,非油气行业营收同比增长48% [6] - AI训练成本下降将推动生成式AI应用和AI代理爆发式增长 [7] 公司背景 - Anthropic由离开OpenAI的团队于2021年创立 [5] - 公司完成35亿美元融资,估值达614亿美元 [5] - 获得谷歌母公司和亚马逊共同投资支持 [2]
美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节
机器之心· 2025-05-30 12:16
美团AI零代码工具NoCode核心观点 - 美团推出完全免费的AI零代码工具NoCode,用户通过自然语言对话即可生成应用,支持实时预览、局部修改和一键部署,大幅降低开发门槛 [2][4][12] - 工具定位为"全栈AI工程师",可创建个人提效工具、产品原型、交互页面等,内部已应用于网站页面、数据分析、简单游戏等多种场景 [18][26] - 采用三层技术架构:基础设施层、runtime sandbox层和Agent应用层,包含7B参数专用模型及多个垂直场景小模型,推理速度达每秒2000 token [24][25][27] - 内部测试显示非技术人员用户是技术人员的3倍,AI生成代码占仓库增量达50%,预计提效30-50% [21][40][41] 产品功能与技术特性 - **自然语言编程**:用户输入自然语言指令即可生成完整功能,支持指令拓展优化和一键优化 [12] - **实时交互能力**:具备Visual Edit功能实现局部修改,支持版本对比回退,每次对话自动生成带截图版本 [29][30] - **部署优化**:采用容器池化技术实现秒级启动,通过无状态设计和热更新保障实时渲染效率 [29] - **专业协同**:提供Dev Mode满足专业用户需求,实现非专业与专业用户的协同创作 [30] 内部应用案例 - HR团队用NoCode开发春节红包系统,覆盖10万员工,耗时仅1-2个工作日 [39] - 数据团队通过30-40轮对话即可创建定制化数据分析工具,大幅减少需求提交流程 [39] - 出海业务员工构建外语学习软件,HR/行政团队开发抽奖程序等多样化场景应用 [39] 技术架构创新 - 专用7B参数Apply模型基于美团代码基座训练,使用内部真实代码+合成数据,迭代超10个版本 [27] - 自研Embedding/Rerank等小模型集群,在精度不变前提下提升推理速度,优化token利用率 [28] - 图片检索服务结合网页上下文语义化处理,增强生成页面的视觉协调性 [30] 行业影响与未来规划 - 目标推动AI技术平民化,6月将发布专业开发工具Dev Mode,探索IDE领域创新 [48][49] - 长期方向聚焦打通非专业到专业的AI开发自动化,构建新型开发环境 [48] - 公司内部AI生成代码占比已达27%,预计将持续提升代码生产效率 [40][41]
整理:每日科技要闻速递(5月27日)
快讯· 2025-05-27 07:36
新能源汽车 - 碳酸锂期货价格跌破六万大关,反映原材料价格下行趋势 [1] - 比亚迪引发行业价格战担忧,业内认为"隐性降价"策略可能长期存在 [1] 科技与AI - 腾讯将发布全球首个全模态模型"混元-O",展示AI领域技术突破 [2] - 微软开源浏览器Agent工具,支持实时跟踪与控制智能体 [2] - 苹果计划对全平台操作系统进行设计革新,可能涉及用户体验升级 [2] - OpenAI计划设立首尔办事处,扩大亚洲市场布局 [2] - 美团透露其新代码约52%由AI生成,体现技术应用深度 [2] 半导体与硬件 - 三星HBM3E内存通过英伟达单芯片认证,成品认证或延迟至下半年 [2] - 小米否认玄戒O1芯片为Arm定制产品的传闻,澄清市场传言 [2] 医药与生物科技 - 优时比在中国上市重症肌无力创新药优迪革,拓展治疗领域 [2] 互联网与消费 - 美团一季度一线城市高频骑手月均收入达10010元,反映劳动力成本 [2] - 美团王兴回应京东外卖竞争,强调将不惜代价保持市场地位 [2] 消费电子 - 苹果可能调整iPhone发布策略,改为一年两次新品发布 [2]
AI 写码一时爽,代码审查火葬场?GitHub Copilot 副总揭秘新瓶颈 | GTC 2025
AI科技大本营· 2025-03-31 14:55
我们距离 AI 在绝大多数软件开发任务中实现人类水平的能力和自主性大约还有 24 到 36 个月的时间。 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 主持人: 大家好,我是 NVIDIA 开发者工具 AI 技术软件工程总监,马特·弗雷泽(Matt Frazier)。 众所周知,AI 辅助开发者工具,或者说代码生成、AI 代码生成——现在有很多叫法——正在从根本上改变我们开发软件的方式。NVIDIA 自然非常关 注这一趋势如何影响我们处理软件和加速计算的方法。 为此,在 GTC 2025(英伟达大会)上,我们邀请了来自多家公司和不同行业的 AI 代码生成通用应用专家,以及 CUDA 优化与相关研究领域的专家, 共同探讨这个话题。 我想快速问各位读者几个问题: 如果你对以上任何一个问题感同身受或感到好奇,那么接下来的讨论就值得你关注。下面,我想介绍一下参与本次讨论的嘉宾。 莎娜·达马尼(Sana Damani) ,她是 NVIDIA 架构研究组的研究科学家,致力于提升 GPU 上并行应用程序的性能,以及提高调试和优化工作的易用 性。 有多少人特别在 CUDA 调试中使用过 AI 驱动的代 ...