Workflow
Composer
icon
搜索文档
4倍速吊打Cursor新模型,英伟达数千GB200堆出的SWE-1.5,圆了Devin的梦,实测被曝性能“滑铁卢”?
36氪· 2025-10-31 20:16
同时,Cognition 称,得益于与推理服务提供商 Cerebras 的合作,SWE-1.5 的运行速度最高可达 Anthropic 旗下 Sonnet 4.5 模型的 13 倍。 比 Sonnet 4.5 快 13 倍,编码性能近 SOTA "开发者不应在'思考速度快'与'思考质量高'的人工智能之间做选择。"Cognition 在官方声明中表示,这一理念是 SWE-1.5 的设计基础。 据介绍,SWE-1.5 经过专门设计,是一款拥有数千亿参数的前沿规模模型,旨在打破上述权衡困境的同时提供顶尖性能与一流速度。而该模型最显著的特 点是其原始速度,这一优势源于与推理领域专业机构 Cerebras 的深度合作:共同部署并优化 SWE-1.5。具体举措包括训练一个经过优化的草稿模型以实现 更快的投机解码以及构建定制化请求优先级系统,让端到端智能体交互过程更流畅。 Cognition 表示,此次合作让 SWE-1.5 实现了极佳的延迟表现,并"还树立了新的速度标准",使其处理速度最高可达 950 token / 秒,分别是 Haiku 4.5 模型 的 6 倍、Sonnet 4.5 模型的 13 倍。"这一性能飞跃 ...
4倍速吊打Cursor新模型!英伟达数千GB200堆出的SWE-1.5,圆了Devin的梦!实测被曝性能“滑铁卢”?
AI前线· 2025-10-31 13:42
比 Sonnet 4.5 快 13 倍, 编码性能近 SOTA "开发者不应在'思考速度快'与'思考质量高'的人工智能之间做选择。"Cognition 在官方声明中表示, 这一理念是 SWE-1.5 的设计基础。 据介绍,SWE-1.5 经过专门设计,是一款拥有数千亿参数的前沿规模模型,旨在打破上述权衡困境 的同时提供顶尖性能与一流速度。而该模型最显著的特点是其原始速度,这一优势源于与推理领域专 业机构 Cerebras 的深度合作:共同部署并优化 SWE-1.5。具体举措包括训练一个经过优化的草稿模 型以实现更快的投机解码以及构建定制化请求优先级系统,让端到端智能体交互过程更流畅。 Cognition 表示,此次合作让 SWE-1.5 实现了极佳的延迟表现,并"还树立了新的速度标准",使其处 理速度最高可达 950 token / 秒,分别是 Haiku 4.5 模型的 6 倍、Sonnet 4.5 模型的 13 倍。"这一性 整理 | 华卫 近日,开发出 Devin 智能体的知名人工智能公司 Cognition 推出其全新高速 AI 编码模型 SWE-1.5。 据介绍,该模型专为在软件工程任务中实现高性能 ...
腾讯研究院AI速递 20251031
腾讯研究院· 2025-10-31 00:06
OpenAI技术进展与战略 - 开源gpt-oss-safeguard安全分类模型,包含120B和20B版本,采用Apache 2.0许可证,无需重新训练即可直接理解策略文档进行内容分类 [1] - 该模型在内容审核评估集和ToxicChat数据集上表现超越GPT-5-thinking,达到行业最佳性价比 [1] - OpenAI内部Safety Reasoner原型技术已用于图像生成和Sora 2等产品,安全推理算力消耗占比高达16% [1] - OpenAI计划最早于2026年下半年提交上市申请,2027年挂牌,拟通过IPO募集至少600亿美元,估值或高达1万亿美元 [6] - 架构重组后非营利组织持有新组建的OpenAI集团26%股权,微软获得额外2500亿美元Azure采购合同,技术使用权延长至2032年 [6] AI开发工具与平台更新 - Cursor发布2.0版本,推出自研编码模型Composer,生成速度达每秒250个token,是同类前沿系统的4倍 [2] - Composer模型采用混合专家架构,通过强化学习针对软件工程优化,在Cursor Bench评测中达到前沿水平 [2] - 新版界面支持多智能体并行协作,基于git worktree或远程机器实现不同模型同时处理任务,并增加原生浏览器工具 [2] - Sora推出角色客串功能,可保持非人类角色一致性,并支持从生成视频中提取虚拟角色实现自循环 [2] - Sora新增视频拼接功能和社区排行榜,并在美国、加拿大、日本和韩国四国限时取消邀请码限制直接开放注册 [2] 语音与多模态AI技术突破 - MiniMax Speech 2.6端到端延迟低于250毫秒,已成为LiveKit、Pipecat、Vapi等全球语音平台的底层技术引擎 [3] - 新版本支持多语言的网址、邮箱、电话等非标准文本格式直接转换,无需繁琐文本预处理 [3] - 提供Fluent LoRA功能,即使带口音或不流利的非母语录音也可在音色复刻时生成流利自然语音,支持40多种语种 [3] - 北京智源发布悟界·Emu3.5多模态世界大模型,基于34B稠密Transformer在超10万亿Token上预训练 [4] - 模型采用"下一状态预测"目标,在图像编辑任务上达到与Gemini-2.5-Flash-Image相当性能,并通过DiDA技术将图像推理速度提升近20倍 [4][5] 前沿科学研究与发现 - OpenFold Consortium发布OpenFold3预览版,基于超30万实验结构和1300万合成结构训练,可预测蛋白质与小分子配体、核酸等相互作用 [7] - 在单体RNA结构预测中性能匹敌AlphaFold3,所有组件采用Apache 2.0许可证允许商用,诺和诺德等公司已计划利用该模型加速研发 [7] - Anthropic研究发现Claude能察觉并报告被人为注入的概念,在最强模型上内省成功率达20% [8] - 研究通过追溯性注入概念篡改AI的"记忆",发现模型会基于伪造的内部状态为自己的"错误"进行辩护和杜撰理由 [8] - 前Meta FAIR负责人田渊栋发表Grokking研究,证明模型仅需O(M log M)样本即可实现泛化,远低于传统M²的需求 [8]
老黄亲自站台,英伟达编程神器,Cursor 2.0自研模型狂飙4倍
36氪· 2025-10-30 15:33
核心产品升级:Cursor 2.0与自研模型Composer - Cursor发布2.0版本,核心是推出首款自研编码模型Composer,改变了长期依赖外部模型的局面[1][6] - Composer模型的速度是同等模型的4倍,专为低延迟智能编码打造,大部分任务可在30秒内完成,速度达到200 Tokens/秒[1][2] - 模型采用专家混合架构,并通过强化学习对软件工程进行专项优化,能自发习得执行复杂搜索、修复错误等能力[9][13] 功能与交互改进 - 重构了IDE交互逻辑,引入多智能体模式,可最多并行运行8个智能体,使用git worktrees或远程机器防止文件冲突[2] - 引入全新的代码审查功能,便于查看Agent在所有文件中的更改,无需来回切换文件[3] - 新增语音模式,支持动嘴编程,并改进上下文收集,Agent可自我收集上下文,无需手动附加[5] 技术架构与基础设施 - 公司基于PyTorch和Ray构建了定制化训练基础设施,以支持大规模环境下的异步强化学习[14] - 通过结合MXFP8 MoE kernels与专家并行等技术,能够在数千张NVIDIA GPU上以极低通信开销扩展训练,并实现更快推理速度[15] 市场定位与早期反馈 - 公司估值为百亿美金,此前受困于依赖Claude等外部模型及其收费模式,导致营收贡献给模型厂商,利润空间受限[6] - 英伟达在GTC 2025大会上提及公司产品,称其软件工程师都在使用Cursor,将其视为提升生产力的编程搭档[6] - 早期测试开发者反馈产品速度很快,但智能程度有观点认为不如Sonnet 4.5和GPT-5,多智能体模式适合宽屏使用[16][26][30][33] 行业竞争格局 - AI编程领域竞争激烈,存在Claude Code、Codex等众多工具[34] - 公司主要优势是较早占领了AI编程工具的市场心智,通过魔改VSCode和套壳API达到百亿美金估值[34]
Cursor 2.0来了,多agent并行,自研模型30秒跑完多数任务,MXFP8训练
36氪· 2025-10-30 12:35
智东西10月30日报道,今天,知名AI编程平台Cursor宣布升级到2.0版本,并推出了Cursor首个自研编程模型Composer,以及用于并行协作多 个Agent的新界面等15项升级。 Composer模型最大的特点就是快。Cursor称,该模型专为在Cursor中进行低延迟的Agentic编程而打造,大多数回合在30秒内即可完成,其速度 达到同等智能模型的4倍,每秒输出的token数已经超过200个。 在Cursor的内部评估中,Composer的智能水平已经超过了最佳的开源编程模型(包括Qwen Coder和GLM 4.6),速度则优于现有的前沿轻量 级模型(包括Claude Haiku 4.5和Gemini Flash 2.5),不过,其智能水平仍然低于GPT-5和Claude Sonnet 4.5。 ▲Composer与前沿开源、闭源模型的智能与速度对比 随着模型Agent能力的不断提升,Cursor的UI也随之升级。Cursor 2.0的UI界面不再以文件为核心,而是围绕Agent进行重新设计,开发者可以 聚焦想要的目标,让不同的Agent分别处理实现细节。 Cursor 2.0现已支持并行运行 ...
刚刚,Cursor 2.0携自研模型Composer强势登场,不再只做「壳」
机器之心· 2025-10-30 09:41
机器之心报道 机器之心编辑部 终于,Cursor 还是走上了自己训练大型语言模型的路。 Cursor 2.0 终于来了! 刚刚,Cursor 发布了两项重大更新:首个编码模型 Composer,以及用于并行协作多个智能体的新界面。 此举意义非凡。一直以来,Cursor 虽然广受欢迎,但终究免不了「AI 时代的 VS Code」的帽子,因为它此前只能使用 Claude、GPT 等第三方模型。这既是 Cursor 的起点,也成了它的瓶颈。 Composer 的发布,堪称是 Cursor 打破这个瓶颈的「独立宣言」,这也标志着 Cursor 正式从「AI 外壳」向「AI 原生平台」进化。 自研模型 Composer Composer 是一款前沿模型,虽然智能程度不敌 GPT-5 等最佳前沿模型,但速度确实遥遥领先,达到了同等智能模型的 4 倍。 在基准测试中, Composer 实现了前沿水平的编码智能,同时生成速度达到每秒 250 个 token—— 大约是领先的快速推理模型的两倍,是同类前沿系统的四倍。(注: Cursor 发布的对比将模型分为几个类 别:「最佳开源」(例如, Qwen Coder 、 GLM ...
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
量子位· 2025-10-30 09:06
最新进展, Cursor 2.0 正式发布,并且首次搭载了「内部」大模型。 没错,不是GPT、不是Claude,如今模型栏多了个新名字—— Composer 。 实力相当炸裂: 据官方说法, Composer仅需30秒就能完成复杂任务,比同行快400% 。 Jay 发自 凹非寺 量子位 | 公众号 QbitAI Cursor的首个编码模型,刚刚发布了! 太多了太多了,根本看不完。 400%效率飞跃 当然,其他的都是小菜,最炸裂的依然是—— Cursor居然有了自己的基座模型 。 基于模型升级,Cursor 2.0带来了不少新玩意儿—— 原生浏览器工具 :模型可以自己动手测试代码、调错、迭代,直到结果完全正确。 语音生成代码 :不用敲键盘,张嘴就行,直接把思路变成代码。 全新界面逻辑 :从「以文件为中心」切换为「以Agent为中心」,多个Agent可以同时运行、互不干扰。 让多个Agent同时尝试同一问题并择优采用,能显著提升最终结果。 要知道,以前的Cursor虽然火,但本质上还只是套壳GPT或Claude,再厉害也不是Cursor的功劳。 而这次不一样,Composer正式登场,Cursor终于能挺直腰板了 ...