Workflow
Claude Sonnet 4.5
icon
搜索文档
OpenAI“抖音”被嘲“好尬”?!Altman 大秀Sora 2、赶上谷歌Veo 3,但要邀请码才能玩?
AI前线· 2025-10-01 10:24
整理 | 褚杏娟 OpenAI 刚刚推出了一款名为 Sora 的新应用,这是一款结合了新模型 Sora 2 和一款使视频创作、分享与观看变得更加便捷的新产品。 OpenAI 对 Sora 2 信心十足:"我们直接跳到了我们认为可能是视频的 GPT-3.5 时刻。Sora 2 可以完成以前视频生成模型难以完成甚至根本完 不成的事情。" Sora 2 主要在理解物理世界上进行了大量优化。"这是世界上最好的视频生成模型,让你和朋友体验原始现实世界的物理特性,告别怪异的人 工智能氛围。"OpenAI Sora 研究员 Gabriel Petersson 说道。 网友 Chubby 表示,Sora 的逼真度令人信服,OpenAI 实际上已经成功赶上了谷歌的 Veo3。然而,OpenAI 的 Sora2 开发成本巨大,而社交 媒体应用 Sora 的回报只能在未来才能体现。 网友们看到 OpenAI 的演示后,有人表示欢呼,但也有人称"尴尬"和"糟糕"。 Gabriel 用自己和 Altman 为例演示了系列视频。 OpenAI 表示,该模型并不完美,也会犯很多错,但它证明了进一步扩展神经网络在视频数据上的训练,将使我们更 ...
深度讨论 Online Learning :99 条思考读懂 LLM 下一个核心范式|Best Ideas
海外独角兽· 2025-09-30 20:06
讨论主题: Online Learning 参与嘉宾: 拾象 Best Ideas 社群 在 OpenAI o1 将 LLM 带入 RL 范式 一年后,我们再次迎来 AI labs 的密集发布周期:OpenAl 在推出 Pulse 后紧接着在今天凌晨推出 ChatGPT 即时支付功能和协议,Anthropic 也同步推出最强编程模型 Claude Sonnet 4.5,能连续专注任务执行超过 30 小时。 这些迭代背后的共同特性是:推动模型在复杂、长程任务上的表现不断精进,甚至直接、实时地参 与人类社会经济活动。 要彻底实现这一目标、真正走入 AGI,更高效的模型进步路径、新的技术范 式一定是当下的关键问题,online learning 极有可能是这个问题的答案。 两周前,海外独角兽组织了一场 「Best ideas」闭门讨论,和一线 AI researchers 围绕 online learning 展开思考。 虽然今天 AI 社区对于 online learning 是什么、以及怎么做还存在非共识,但 online learning 代表了一种新的交互和推理范式,在实现极致个性化的同时能够动态迭代整个 ...
AI日报丨再套现超4000万美元!黄仁勋持续减持英伟达,看好OpenAI称其或成为下一个万亿美元巨头
美股研究社· 2025-09-30 20:06
A I 快 报 1 . 智谱旗舰模型GLM-4.6上线 寒武纪、摩尔线程已完成适配。 据智谱消息,最新的GLM-4.6模 型上线,其代码能力比前代GLM-4.5提升27%,在真实编程、长上下文处理、推理能力等多方面 表现优异。GLM-4.6在公开基准测试中达到国内最高水准,并在74个真实编程任务中超越其他国 产模型。 整理 | 美股研究社 在这个快速 变 化的 时代, 人工 智能技术正以前所未有的速度发展,带来了广泛的机会 。 《AI 日 报 》 致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的行 业 洞察和 价 值 分析。 2. DeepSeek在下一代AI模型中首次引入"稀疏注意力"机制。 9月29日,DeepSeek更新了一个 实验性的人工智能(AI)模型,并称之为迈向新一代架构的中间步骤。DeekSeek在Hugging Face上发布帖子,概述了DeepSeek-V3.1-Exp平台,并解释说该平台引入一种名为DeepSeek Sparse Attention(DSA)的"稀疏注意力机制",DSA可以在长上下文中进行更快、更高效的训 练和推理。 3. Anthropic推出最新AI模型 ...
深夜炸场!Claude Sonnet 4.5上线,自主编程30小时,网友实测:一次调用重构代码库,新增3000行代码却运行失败
AI科技大本营· 2025-09-30 18:24
整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 双节小长假将近,国内国外大模型公司闻风而动,赶在正式放假前让众人"小卷"一波。这不,继昨晚 DeepSeek 发布 DeepSeek V3.2-Exp 之后, Anthropic 又在今天带来了全新升级的 Claude Sonnet 4.5 版本,号称"世界上最好的编码模型"。 最强的编码模型 Claude Sonnet 4.5 来了:可自主持续运行 30 小时 根据官方测试结果显示,Claude Sonnet 4.5 在 SWE-bench Verified 评测里拿下了顶级成绩,这个测试主要看模型在真实世界里写代码的水平。 同时,Sonnet 4.5 在推理和数学等多项测试中也有大幅提升。从下图看出,在 Agentic Coding、Agentic Tool Use 等测试中 Claude Sonnet 4.5 远 超过更昂贵的 GPT-5、Gemini 2.5 Pro 等竞品模型。 实际测试中, Claude Sonnet 4.5 能在复杂的多步骤任务上坚持专注 超过 30 个小时。 相比此前 Opus 4 运行 7 小时左右的时间, Cla ...
Anthropic发布最强编码模型Claude Sonnet 4.5,可自主编码30小时
36氪· 2025-09-30 17:17
划重点: 当地时间9月29日,人工智能初创公司Anthropic正式推出新一代AI模型Claude Sonnet 4.5,宣称其为全球最先进、最安全的编码及复杂软 件智能体构建模型。 该模型在长周期任务处理上有所改进,可独立运行30小时完成从开发到安全审计的全流程工作,在SWE-bench Verified等权威测试中达到 最优水平。同时,Anthropic 升级开发者生态,推出Claude Agent SDK等工具,并为Max订阅用户开放 "用 Claude 想象" 临时预览功能, 支持实时生成软件演示。 Claude Sonnet 4.5定价延续前代标准,每百万输入Tokens 3美元,每百万输出Tokens 15美元,开发者无需额外成本即可升级。 当前AI编码领域竞争已进入白热化阶段,Anthropic面临多强并立的竞争态势:OpenAI已推出专注智能体编码的GPT-5-Codex,谷歌 Gemini则凭借出色的问题解决能力站稳脚跟。Anthropic在今年8月刚推出Claude Opus 4.1,在5月推出Claude Sonnet 4,如此快速的迭代节 奏,既凸显了当前AI领域的激烈竞争态势,也意味 ...
节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世
机器之心· 2025-09-30 16:45
机器之心报道 机器之心编辑部 新一代大模型的发布,都赶在了国庆假期前。 昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。 今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6 ,刚好撞车 Claude Sonnet 4.5。 这一「节前惊喜」迅速点燃了技术圈的热情,海外开发者甚至发出了「Do the Chinese guys ever rest???」的感叹 。 但新模型也让大家非常期待,这不刚发出来,就被网友们给盯上了。 但有一点不同,智谱的 GLM-4.6 会继续开源,它即将上线 Hugging Face、ModelScope 等平台,遵循 MIT 协议。 性能新高,token 消耗降低 突破开源上限 作为 GLM 系列的最新版本,GLM-4.6 在多个方面实现了全面提升,包括但不限于: 高级编码能力:在公开基准与真实编程任务中,GLM-4.6 代码能力对齐 Claude Sonnet 4,是国内已知的最好的 Coding 模型; 上下文长度:上下文窗口由 128K 增加至 200K,适应复杂的代码与智能体任务; 推理能力提升,并支持在推理过程中调用工具; 根据智 ...
深夜炸场,Claude Sonnet 4.5上线,自主编程30小时,网友实测:一次调用重构代码库,新增3000行代码却运行失败
36氪· 2025-09-30 16:43
双节小长假将近,国内国外大模型公司闻风而动,赶在正式放假前让众人"小卷"一波。这不,继昨晚 DeepSeek 发布 DeepSeek V3.2-Exp之后,Anthropic 又在今天带来了全新升级的 Claude Sonnet 4.5 版本,号称"世界上最好的编码模型"。 最强的编码模型 Claude Sonnet 4.5 来了:可自主持续运行 30 小时 根据官方测试结果显示,Claude Sonnet 4.5 在 SWE-bench Verified 评测里拿下了顶级成绩,这个测试主要看模型在真实世界里写代码的水平。 同时,Sonnet 4.5 在推理和数学等多项测试中也有大幅提升。从下图看出,在 Agentic Coding、Agentic Tool Use 等测试中 Claude Sonnet 4.5 远超过更昂贵 的 GPT-5、Gemini 2.5 Pro 等竞品模型。 | | Claude | Claude | Claude | GPT-5 | Gemini | | --- | --- | --- | --- | --- | --- | | | Sonnet 4.5 | Opus 4.1 | ...
华虹半导体涨超15%,科创芯片ETF指数、科创芯片ETF涨超2%
格隆汇APP· 2025-09-30 13:10
科创芯片ETF富国、科创芯片ETF国泰、科创芯片ETF指数、科创芯片ETF博时、科创芯片50ETF、科创 芯片ETF南方、科创芯片ETF基金、科创芯片ETF涨超2%。 | 名称 | 代码 | 涨跌幅 ▼ | 5日涨跌幅 | 估算规模 管理公司 | | --- | --- | --- | --- | --- | | 科创芯片ETF富国 | 588810 | 2.96% | 8.32% | 5.77亿 富国基金 | | 科创芯片ETF国泰 | 589100 | 2.87% | 8.34% | 6.41亿 国泰基金 | | 科创芯片ETF指数 | 588920 | 2.73% | 8.25% | 4.33亿 鹏华基金 | | 科创芯片ETF博时 | 588990 | 2.69% | 8.36% | 6.76亿 博时基金 | | 科创芯片50ETF | 588750 | 2.69% | 8.11% | 53.99亿 汇添富基金 | | 科创芯片ETF南方 | 588890 | 2.59% | 8.23% | 22.58亿 南方基金 | | 科创芯片ETF基金 | 588290 | 2.53% | 8.27% | 36 ...
能连续干活超30小时!Claude发起AI编程新一轮竞赛
第一财经资讯· 2025-09-30 12:13
2025年最热赛道AI编程又卷起来了。北京时间9月30日,Anthropic 正式发布Claude Sonnet 4.5,官方称 其为"世界上最好的编程模型",同时在智能体构建、计算机使用、推理和数学能力上有显著突破。从各 方面评测来看,Claude维持了自身在编程领域的王座地位。 在不少业内人士看来,Anthropic 此次更新的时间点颇具深意——一周后,OpenAI 将举办年度开发者大 会;而前不久,OpenAI 刚刚发布了强化智能体编程能力的 GPT-5-Codex,宣称能独立处理长达7小时的 大型复杂任务。 而这一次,Anthropic 直接将标准拉高:Sonnet 4.5 能够在复杂、多步骤任务中保持超过30小时的持续注 意力。 这一能力也得到了业内的认证,iGent AI的CEO表示,Sonnet 4.5"重新设定了行业期望",它可以自主处 理30多个小时的代码,使工程师在极短的时间内处理数月的复杂架构工作,同时保持大量代码库的一致 性。 从官方的评测来看,Sonnet 4.5在编程、数学等各项评测上超越了GPT-5和谷歌的Gemini2.5 pro。 在考察真实编程水平的 SWE-bench V ...
加量不加价,一篇说明白 Claude Sonnet 4.5 强在哪
Founder Park· 2025-09-30 11:46
以下文章来源于赛博禅心 ,作者金色传说大聪明 对于希望构建智能体的开发者,Sonnet 4.5 已集成到 Claude 开发者平台、Amazon Bedrock 和 Google Cloud 的 Vertex AI中。 超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 赛博禅心 . 拜AI古佛,修赛博禅心 今天, Anthropic 重磅发布了 Claude Sonnet 4.5 模型,官方称,这是 世界上最好的编码模型。 相较于OpenAI 前不久发布的 能独立运行超过 7 小时的 GPT-5 Codex, Claude Sonnet 4.5 能 够保持超过 30 小时的专注度来处理复杂的多步骤任务。 在定价方面, Claude Sonnet 4.5 与 Claude Sonnet 4 价格相同, 3 美元/百万 token 输入, 15 美元/百万 token 输出。 通过提示缓存可节省高达 90%的成本,批量处理可节省 50%的成 本。 同时, Anthropic 还发布了面向开发者的工具 Claude Agent SDK 和实验性研究预览功能 "Imagine with ...