产品发布与核心升级 - Cursor 2.0正式发布,并首次搭载了公司内部研发的大模型Composer [1][2] - 新模型Composer专为低延迟编码打造,能在30秒内完成大多数交互任务,比同行快400% [3][12] - 产品界面逻辑从“以文件为中心”切换为“以Agent为中心”,支持多个Agent同时运行、互不干扰 [6][7] 核心技术能力 - Composer模型基于强化学习训练,是一个大型MoE模型,训练过程在完整的Cursor环境中进行,使其能直接使用生产级工具 [21][22][25][26] - 模型生成代码的速度达到每秒250个tokens,比当前最快的推理模型快约两倍,比其他模型快四倍 [19][20] - 模型展现出涌现行为,能自动运行单元测试、修复代码格式错误,并可自主完成多步代码搜索与调试流程 [31] 新功能特性 - 新增原生浏览器工具,模型可以自己动手测试代码、调错、迭代,直到结果完全正确 [4] - 支持语音生成代码功能,用户无需敲键盘,可直接通过语音将思路转化为代码 [5] - 多Agent协作的基础架构建立在Composer的底层能力之上,允许让多个Agent同时尝试同一问题并择优采用 [32] 模型性能与评估 - 模型性能通过内部测试套件“Cursor Bench”评估,该系统根据真实开发者使用场景打造 [17] - 评估不仅关注代码正确性,还评估模型是否遵守抽象层次、风格规范和工程实践 [18] - 即便面对体量庞大、结构复杂的代码库,模型也能保持高水准的推理与理解能力 [13] 行业定位与战略 - 此次发布标志着公司从依赖GPT或Claude等外部模型,转向使用自研基座模型 [9][10][11] - 公司战略是发挥在应用端的产品优势,让模型直接在与用户相同的真实环境中运行,而非与头部基座模型直接竞争 [35][36]
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
量子位·2025-10-30 09:06