Cursor 2.0
搜索文档
老黄亲自站台,英伟达编程神器,Cursor 2.0自研模型狂飙4倍
36氪· 2025-10-30 15:33
核心产品升级:Cursor 2.0与自研模型Composer - Cursor发布2.0版本,核心是推出首款自研编码模型Composer,改变了长期依赖外部模型的局面[1][6] - Composer模型的速度是同等模型的4倍,专为低延迟智能编码打造,大部分任务可在30秒内完成,速度达到200 Tokens/秒[1][2] - 模型采用专家混合架构,并通过强化学习对软件工程进行专项优化,能自发习得执行复杂搜索、修复错误等能力[9][13] 功能与交互改进 - 重构了IDE交互逻辑,引入多智能体模式,可最多并行运行8个智能体,使用git worktrees或远程机器防止文件冲突[2] - 引入全新的代码审查功能,便于查看Agent在所有文件中的更改,无需来回切换文件[3] - 新增语音模式,支持动嘴编程,并改进上下文收集,Agent可自我收集上下文,无需手动附加[5] 技术架构与基础设施 - 公司基于PyTorch和Ray构建了定制化训练基础设施,以支持大规模环境下的异步强化学习[14] - 通过结合MXFP8 MoE kernels与专家并行等技术,能够在数千张NVIDIA GPU上以极低通信开销扩展训练,并实现更快推理速度[15] 市场定位与早期反馈 - 公司估值为百亿美金,此前受困于依赖Claude等外部模型及其收费模式,导致营收贡献给模型厂商,利润空间受限[6] - 英伟达在GTC 2025大会上提及公司产品,称其软件工程师都在使用Cursor,将其视为提升生产力的编程搭档[6] - 早期测试开发者反馈产品速度很快,但智能程度有观点认为不如Sonnet 4.5和GPT-5,多智能体模式适合宽屏使用[16][26][30][33] 行业竞争格局 - AI编程领域竞争激烈,存在Claude Code、Codex等众多工具[34] - 公司主要优势是较早占领了AI编程工具的市场心智,通过魔改VSCode和套壳API达到百亿美金估值[34]
Cursor 2.0来了,多agent并行,自研模型30秒跑完多数任务,MXFP8训练
36氪· 2025-10-30 12:35
产品升级概述 - 知名AI编程平台Cursor宣布升级到2.0版本,推出了包括自研编程模型Composer、用于并行协作多个Agent的新界面等15项升级 [1] 自研编程模型Composer - Composer模型专为低延迟的Agentic编程打造,大多数任务回合在30秒内完成,其速度达到同等智能模型的4倍,每秒输出的token数超过200个 [1] - 在内部评估中,Composer的智能水平超过最佳的开源编程模型(包括Qwen Coder和GLM 4.6),速度优于现有的前沿轻量级模型(包括Claude Haiku 4.5和Gemini Flash 2.5),但其智能水平仍低于GPT-5和Claude Sonnet 4.5 [1] - Composer是一个专家混合模型,支持长上下文的生成与理解,通过在多样化的开发环境中进行强化学习,对软件工程进行了专项优化 [35] 用户界面与交互体验 - Cursor 2.0的UI界面围绕Agent进行重新设计,不再以文件为核心,开发者可以聚焦目标,让不同的Agent分别处理实现细节 [3] - 用户仍可打开文件或一键切换回经典IDE视图以深入查看或编辑代码 [3] - 改进的提示词界面进行了全面优化,文件和目录以内嵌标签形式展示,复制和粘贴带有上下文标签的提示内容更加便捷,同时简化了上下文菜单 [25] 多Agent并行处理能力 - Cursor 2.0支持并行运行最多8个Agent,它们可以在不同的工作区中互不干扰地工作,用户还可以让多个Agent同时尝试解决同一问题,再择优采用最优方案 [3][6] - 多Agent并行功能使用git worktrees或者远程虚拟机完成,以避免文件冲突,每个Agent都会拥有专注的隔离代码库副本 [7] 浏览器集成与前端开发 - Agent可以控制Cursor内置的浏览器,通过导航、点击、输入、滚动、截屏等操作,完成测试应用、评估无障碍性、将设计转为代码等复杂任务 [9] - 新增的原生浏览器让Cursor 2.0能自动测试其工作并迭代直到产出正确结果,用户可以直接选中网页元素让Cursor修改 [5] - Cursor对浏览器工具进行了优化以提升效率并减少token使用,优化方向包括更高效的日志处理、图像级可视化反馈、智能提示、开发服务器感知等 [12] 代码审查与测试功能 - 改进的代码审查功能把所有修改聚合到一个界面,用户更容易查看Agent对多个文件所做的所有更改,而无需在各个文件之间跳转 [13] - 新增的原生浏览器功能让Cursor 2.0能自动测试其工作并迭代,直到产出正确结果 [5] 安全性与团队管理 - Cursor推出了沙盒终端功能的macOS版本,macOS版本的Agent命令和未列入允许列表的shell命令将默认在安全沙盒中运行,该沙盒环境拥有对用户工作区的读写权限,但无法访问互联网 [16] - 团队管理者可以在Cursor中自定义命令和规则,这一上下文将自动应用于所有团队成员,而无需存储在本地编辑器中 [19] - 企业管理员可以在团队级别统一配置沙盒终端的标准设置,包括沙盒可用性、Git访问权限以及网络访问策略 [28] 性能与基础设施优化 - Cursor使用语言服务器协议来实现特定于语言的功能,如今大幅提升了所有语言的LSP加载和使用性能,这一提升在Agent场景和查看代码差异时尤为明显 [22] - 对于大型项目,Python和TypeScript LSP默认运行速度将会更快,内存限制会根据可用RAM动态配置,公司还修复了一些内存泄漏问题,并提高了整体内存使用率 [22] - Cursor基于PyTorch和Ray构建了定制化训练基础设施,以在大规模环境下支持异步强化学习,并采用了MXFP8 MoE kernels、专家并行和混合分片数据并行,在原生低精度下完成训练 [40] 企业版特定功能 - 企业团队现在可以直接通过Web控制台分发Hooks,管理员能够新增Hooks、保存草稿,并灵活指定不同操作系统所适用的Hooks [29] - Cursor为企业用户提供了详细的审计日志功能,帮助团队跟踪关键操作、变更记录与合规性事件 [30] - 公司为企业用户使用Agent浏览器功能提供了额外支持,如MCP黑白名单管控等安全功能 [9] 模型训练与开发理念 - 在研发过程中,公司试验了一个代号为“猎豹”的原型Agent模型以更好地理解高速Agent模型的影响,Composer是该模型的智能升级版 [31] - 公司鼓励模型在工具使用上做出高效选择,并在可能的情况下最大化并行处理,通过减少不必要的回复、避免无依据的陈述来训练模型成为更有帮助的助手 [38] - 模型在强化学习时会自发习得一些有用能力,例如执行复杂搜索、修复linter错误,以及编写并运行单元测试 [39]
刚刚,Cursor 2.0携自研模型Composer强势登场,不再只做「壳」
机器之心· 2025-10-30 09:41
Cursor 2.0 版本发布 - Cursor 发布重大更新,包括首个自研编码模型 Composer 和用于并行协作多个智能体的新界面 [2] 自研模型 Composer 的意义 - Composer 的发布标志着公司从依赖第三方模型的“AI外壳”向“AI原生平台”的战略转型 [3][4] - 此举旨在打破长期依赖 Claude、GPT 等第三方模型的瓶颈 [3] 模型 Composer 的性能特点 - 模型生成速度达到每秒 250 个 token,是领先快速推理模型的两倍,是同类前沿系统的四倍 [9] - 模型智能程度匹敌中端前沿系统,但速度遥遥领先 [6][9] - 模型专为低延迟的智能体式编码打造,大多数任务回合在 30 秒内完成 [11] - 模型通过覆盖整个代码库的语义搜索等工具进行训练,在处理大型代码库方面能力显著更强 [12] 模型 Composer 的技术架构 - Composer 是一种混合专家模型,支持长上下文的生成与理解 [16] - 模型通过在多样化开发环境中进行强化学习,针对软件工程进行专项优化 [16] - 训练鼓励模型高效使用工具并最大化并行处理,模型自发习得执行复杂搜索、修复错误等能力 [19] - 公司构建了新的基准测试 Cursor Bench,以更贴近开发者实际使用价值的方式评估模型 [16] Cursor 2.0 的多智能体界面 - 新界面彻底以“智能体”为中心,用户可专注于结果,让智能体处理细节 [22] - 系统能够轻松并行运行多个互不干扰的智能体,并可利用多个模型尝试同一问题以提升结果质量 [22] - 新版本开始解决代码评审与变更测试这两个新的瓶颈 [24][25] - 构建了原生浏览器工具,使智能体可以测试其工作并持续迭代直至产出正确结果 [26] 训练基础设施 - 公司基于 PyTorch 和 Ray 构建了定制化训练基础设施,以支持大规模异步强化学习 [28] - 通过结合 MXFP8 MoE kernels 与专家并行等技术,将训练扩展到数千张 NVIDIA GPU,并实现更快的推理速度 [28] - 重写了虚拟机调度器,以支持在云端并发运行数十万份隔离的沙盒编码环境,实现了训练与生产环境的无缝统一 [28] 市场反馈与应用 - Composer 已被公司自身的工程团队在日常开发中使用,表明其成熟度和稳定性 [20] - 本次大版本更新获得了大量关注,早期体验开发者给出了积极反馈 [30][31][36]
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
量子位· 2025-10-30 09:06
产品发布与核心升级 - Cursor 2.0正式发布,并首次搭载了公司内部研发的大模型Composer [1][2] - 新模型Composer专为低延迟编码打造,能在30秒内完成大多数交互任务,比同行快400% [3][12] - 产品界面逻辑从“以文件为中心”切换为“以Agent为中心”,支持多个Agent同时运行、互不干扰 [6][7] 核心技术能力 - Composer模型基于强化学习训练,是一个大型MoE模型,训练过程在完整的Cursor环境中进行,使其能直接使用生产级工具 [21][22][25][26] - 模型生成代码的速度达到每秒250个tokens,比当前最快的推理模型快约两倍,比其他模型快四倍 [19][20] - 模型展现出涌现行为,能自动运行单元测试、修复代码格式错误,并可自主完成多步代码搜索与调试流程 [31] 新功能特性 - 新增原生浏览器工具,模型可以自己动手测试代码、调错、迭代,直到结果完全正确 [4] - 支持语音生成代码功能,用户无需敲键盘,可直接通过语音将思路转化为代码 [5] - 多Agent协作的基础架构建立在Composer的底层能力之上,允许让多个Agent同时尝试同一问题并择优采用 [32] 模型性能与评估 - 模型性能通过内部测试套件“Cursor Bench”评估,该系统根据真实开发者使用场景打造 [17] - 评估不仅关注代码正确性,还评估模型是否遵守抽象层次、风格规范和工程实践 [18] - 即便面对体量庞大、结构复杂的代码库,模型也能保持高水准的推理与理解能力 [13] 行业定位与战略 - 此次发布标志着公司从依赖GPT或Claude等外部模型,转向使用自研基座模型 [9][10][11] - 公司战略是发挥在应用端的产品优势,让模型直接在与用户相同的真实环境中运行,而非与头部基座模型直接竞争 [35][36]