Workflow
AI Programming Platform
icon
搜索文档
Cursor自研新模型反超Opus 4.6,价格还“打一折”!网友实测:只有它写完应用能一次跑通
AI前线· 2026-03-20 16:01
Cursor公司发布Composer 2.0编程大模型 - 公司发布了第二代编程大模型Composer 2.0,并已在IDE中上线[2] 模型性能表现 - 在关键的编程基准测试Terminal-Bench 2.0上,Composer 2的性能反超了Claude的旗舰模型Opus 4.6[4] - 在衡量模型Debug能力的SWE-bench Multilingual测试中,Composer 2得分为73.7%,与Claude Opus 4.6的77.83%得分非常接近[13] - 公司自建了名为CursorBench的基准来评估智能体在真实任务中的执行水平,该基准曾使Claude Sonnet 4.5的得分从SWE-Bench的77.2骤降至37.9[14] - 根据公司提供的数据,Composer 2在CursorBench、Terminal-Bench 2.0和SWE-bench Multilingual上的得分分别为61.3、61.7和73.7,相比前代模型Composer 1.5(44.2, 47.9, 65.9)和Composer 1(38.0, 40.0, 56.9)有大幅提升[14] 定价与成本优势 - 新模型定价极具竞争力:Fast版本每百万输入token收费1.5美元,每百万输出token收费7.5美元,比上一代便宜约57%[9] - 普通版价格更低,为输入0.5美元/百万token,输出2.5美元/百万token[9] - 相比之下,Claude Opus 4.6的定价为输入5美元/百万token,输出25美元/百万token,Composer 2的普通版价格仅为Claude Opus的十分之一[9] 实际应用测试结果 - 开发者实测显示,在生成一个X克隆应用的任务中,Composer 2生成的应用可直接运行,而Claude Opus 4.6和GPT-5.4生成的版本均卡在CORS问题,需要额外调试[17] - 三者生成的代码结构和质量接近,但效率与成本差距显著:Composer 2用时5分钟,花费6.04美元;Claude Opus 4.6用时19分钟,花费10.43美元;GPT-5.4用时22分钟,花费14.15美元[17] 公司财务与运营状况 - 公司2025年销售额从一年前的1.5亿美元飙升至20亿美元(约合人民币138亿元)[21] - 公司员工数仅300多人[21] - 公司在去年11月完成一轮23亿美元的融资,投后估值约300亿美元(约合人民币2069亿元)[21] - 据2025年3月11日消息,公司正与投资者洽谈新一轮融资,投后估值可能达到500亿美元(约合人民币3448亿元),但谈判仍在进行中[21] 行业趋势与公司面临的挑战 - 软件开发正从“辅助写代码”向“智能体完成任务”切换,代码编辑器可能不再是唯一入口,这对以IDE为核心产品的公司构成根本性挑战[22][23] - 上游模型厂商(如Anthropic, OpenAI)正下场开发自己的IDE、CLI和智能体产品,可能直接拿走入口,使公司面临从“超级入口”滑落为“中间层”的风险[23] - 下游开发者开始直接使用Claude Code、Codex等CLI智能体完成任务,可能绕过公司的IDE产品[22][23] 公司的战略应对 - 首要战略是补足短板,自主研发编程大模型,减少对外部模型的依赖[24][26] - 战略重心从“文件中心”全面转向“任务中心”的智能体(Agent),上线云端多智能体协作功能,让多个Agent并行工作[25] - 继续深耕企业市场,利用大公司迁移慢、合同周期长、合规要求高的特点来巩固客户基础[26] - 降低对Anthropic和OpenAI的依赖,利用DeepSeek、Kimi、Qwen等开源模型进行二次训练,结合自有数据和强化学习,打造更便宜、更快的专用编码模型[26] - 公司的根本目标是,在代码编辑器可能失去中心地位的时代,重塑自身为一个拥有自有模型、系统和新型入口的AI编程平台[27]