Claude Opus 4.1

搜索文档
Aurora Mobile's GPTBots.ai to Integrate Claude Opus 4.1 to Advance Intelligent Agent Capabilities
Globenewswire· 2025-08-06 17:00
SHENZHEN, China, Aug. 06, 2025 (GLOBE NEWSWIRE) -- Aurora Mobile Limited (NASDAQ: JG) (“Aurora Mobile” or the “Company”), a leading provider of customer engagement and marketing technology services in China, today announced that its AI agent platform, GPTBots.ai, plans to integrate Claude Opus 4.1, the latest large language model (LLM) released by Anthropic. This upgrade is expected to significantly improve the performance of AI agents when handling complex tasks, thereby enhancing development efficiency an ...
深夜,OpenAI、谷歌等更新多款模型
第一财经· 2025-08-06 15:17
2025.08. 06 本文字数:1941,阅读时长大约4分钟 作者 | 第一财经 郑栩彤 北京时间8月6日凌晨,多家海外大模型厂商发布了最新产品。AI创业公司Anthropic发布了Claude Opus 4.1,称这一模型是Opus 4在代理任务、现实世界编码和推理方面的升级版。谷歌推出了新一 代世界模型Genie 3,并表示这是公司第一个支持实时交互的世界模型。OpenAI则开源了gpt-oss- 120b和gpt-oss-20b两个推理模型,这是OpenAI时隔六年再次开源模型。 这三家大模型厂商的新产品面向的使用场景各不相同,但不难看出,通过此次新品发布,OpenAI和 Anthropic都展示了产品策略上变化。 其中,OpenAI的开闭源策略发生了转变。随着DeepSeek引领开源的方向,今年4月,OpenAI CEO山姆·奥尔特曼(Sam Altman)就表示,OpenAI认为推出强大、有推理能力的新开源模型"非 常重要"。此次OpenAI兑现了推出新开源模型的承诺。山姆·奥尔特曼称,这两款开源模型是OpenAI 耗资数十亿美元的研究成果。 此次OpenAI开源的gpt-oss-120b参数量为 ...
新款大模型三箭齐发,人工智能ETF(159819)成交活跃,盘中净申购超3000万份
每日经济新闻· 2025-08-06 13:41
市场今日震荡上行,AI相关概念股午前走强,截至午间收盘,中证人工智能主题指数上涨0.7%,上证 科创板人工智能指数上涨1.8%,均冲击三连阳,人工智能ETF(159819)盘中成交额超2亿元,净申购 达3200万份。 人工智能ETF(159819)跟踪的中证人工智能主题指数聚焦沪深两市AI产业链各细分环节龙头公司,行 业分布相对均衡;科创人工智能ETF(588730)跟踪的上证科创板人工智能指数聚焦科创板AI龙头公 司,AI应用等环节占比较高,可助力投资者便捷布局AI产业发展机遇。 (文章来源:每日经济新闻) 昨日,OpenAI、Anthropic、谷歌三家科技公司皆发布了新模型,OpenAI开源gpt-oss-120b/20b两款开源 模型,这是自2019年GPT-2以来的首次模型开源,Anthropic发布Claude Opus 4.1,在Coding能力上继续 提升,谷歌DeepMind发布第三代通用世界模型Genie 3,可以生成前所未有的多样化交互式环境。 中信证券表示,下一代大模型逐步临近,其有望实现技术、能力、生态的全面发展,有望以2-3倍规模 实现近10倍智能水平,预计Agent及多模态两大方 ...
OpenAI、谷歌等深夜更新多款模型 展示开源、智能体、世界模型进展
第一财经· 2025-08-06 12:59
大模型厂商新品发布 - AI创业公司Anthropic发布Claude Opus 4 1 称该模型是Opus 4在代理任务 现实世界编码和推理方面的升级版 [1] - 谷歌推出新一代世界模型Genie 3 这是公司第一个支持实时交互的世界模型 [1] - OpenAI开源gpt-oss-120b和gpt-oss-20b两个推理模型 这是OpenAI时隔六年再次开源模型 [1] OpenAI开源策略转变 - OpenAI开源的gpt-oss-120b参数量为1170亿 采用MoE架构 激活参数量51亿 [2] - gpt-oss-20b参数量为210亿 同样采用MoE架构 激活参数量36亿 [2] - gpt-oss-120b在竞赛编码 工具调用基准测试中的得分接近或超过闭源的o4-mini模型 [2] - gpt-oss-20b在基准测试中的分数与o3-mini相当或超过o3-mini [2] - 新模型可在电脑 手机等端侧设备上本地部署 gpt-oss-120b可在单张80GB容量的GPU上运行 gpt-oss-20b可在16GB内存的消费级设备上运行 [2] Anthropic产品策略调整 - Anthropic决定更频繁地推出产品渐进式更新 而非只专注于重大版本更新 [3] - Claude Opus 4 1在深入研究 数据分析 代理搜索方面的能力较前一代有所提升 [3] - 新产品擅长处理复杂的多步骤问题 被定位为更有效的AI智能体 [3] - 在SWE-bench Verify基准测试中 Claude Opus 4 1得分74 5% 超过Opus 4的72 5% [4] - 在Terminal-Bench GPQA Diamond MMMLU基准测试中的得分分别为43 3% 80 9% 89 5% 超过Opus 4的39 2% 79 6% 88 8% [4] 谷歌世界模型进展 - 谷歌推出通用世界模型Genie 3 是公司第一个允许进行实时交互的世界模型 [5] - Genie 3可以生成多样化的交互环境 模拟水 光等自然现象 生成包含动物 植物的生态系统 创造动画角色并模拟复杂环境下各种元素的相互作用 [5] - Genie 3可以以每秒24帧的速度进行导航 在720p分辨率下保持长达几分钟的画面一致性 视觉记忆可追溯至一分钟前 [5] - Genie 3可生成长达几分钟的画面一致性 而Genie 2只能生成8秒 [6] - Genie 3可模拟灯光节期间在水面上行驶的摩托艇 效果十分真实 [6]
OpenAI、谷歌等深夜更新多款模型,展示开源、智能体、世界模型进展
第一财经· 2025-08-06 12:49
OpenAI产品策略变化 - OpenAI时隔六年再次开源模型,推出gpt-oss-120b和gpt-oss-20b两个推理模型,参数量分别为1170亿和210亿,均采用MoE架构 [1][2] - 开源策略转变源于DeepSeek引领的开源趋势,CEO表示推出强大开源模型"非常重要",这两款模型是耗资数十亿美元的研究成果 [1] - gpt-oss-120b在竞赛编码、工具调用基准测试中接近或超过闭源o4-mini,gpt-oss-20b与o3-mini相当或更优,性能属开源模型第一梯队 [2] - 新模型支持端侧设备本地部署,gpt-oss-120b可在单张80GB GPU运行,gpt-oss-20b可部署在16GB内存消费级设备甚至手机 [2] Anthropic产品策略变化 - 公司改变以往专注重大版本更新的策略,转向更频繁推出渐进式更新,此次发布Claude Opus 4.1并计划未来几周推出更多更新 [3] - Claude Opus 4.1在代理任务、现实世界编码和推理方面升级,擅长处理复杂多步骤问题,定位为更有效的AI智能体 [1][3] - 在SWE-bench Verify测试中得分74.5%超过前代72.5%,Terminal-Bench、GPQA Diamond、MMMLU测试分别达43.3%、80.9%、89.5%均超前代 [4] - 用户反馈显示代码修改精准度和调试效率明显改善 [4] 谷歌世界模型进展 - 推出首个支持实时交互的通用世界模型Genie 3,被视为迈向AGI的关键垫脚石 [5] - 可生成多样化交互环境,模拟水、光等自然现象及生态系统,动画角色和复杂元素相互作用,画面一致性达几分钟 [5] - 相比Genie 2的8秒画面一致性,Genie 3能生成长达几分钟的720p画面,视觉记忆可追溯一分钟前 [5][6] - 演示显示可模拟摩托艇撞击效果、生成推进视角的教室场景等高度逼真交互 [6] - 仍存在动作空间有限、多智能体交互模拟困难、交互时长不足数小时等局限 [9] 行业技术趋势 - 大模型能力持续升级,通过开源端侧部署模型、推进智能体技术、实现世界模型交互等方式提升可用性 [9]
Claude 小升级就赢了OpenAI 9年“开源神作”?高强度推理直接歇菜、幻觉率高达50%,写作还被Kimi 2吊锤?
AI前线· 2025-08-06 12:25
整理 |华卫 刚刚,OpenAI 发布了首个开源语言模型系列 gpt-oss,包括 gpt-oss-120b 和 gpt-oss-20b 两款语言模型:完全可定制,提供完整的思维链(CoT)并支 持结构化输出。 现在,gpt-oss-120b 和 gpt-oss-20b 的权重均可在 Hugging Face 上免费下载,且它们原生采用 MXFP4 量化格式。这使得 gpt-oss-120B 模型可在 80GB 内存内运行,而 gpt-oss-20b 仅需 16GB 内存。 下载链接: https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4 Github 地址: https://github.com/openai/gpt-oss 值得一提的是,几乎与 gpt-oss 开源同时,谷歌 Deepmind 宣布推出 Genie 3 ,Anthropic 放出了 Claude Opus 4.1。有网友感叹,"我们生活在什么样 的时代。"马斯克也转发了这条帖子,并配了意味深长的词和表情。 Claude Opus4.1 的最大亮 ...
御三家打起来了:OpenAI 开源、谷歌发布可交互的世界模型、Claude 4.1 成了编程新旗舰
Founder Park· 2025-08-06 11:43
OpenAI开源模型 - 发布两款开源模型gpt-oss-120b和gpt-oss-20b,采用Transformer架构和专家混合(MoE)技术,总参数分别为117B和21B,每个token激活参数分别为5.1B和3.6B [6][9] - 模型采用交替密集和局部带状稀疏注意力模式,支持128k上下文长度,使用分组多查询注意力和旋转位置编码(RoPE) [8] - 在MMLU测试中分别达到90.0和85.3分,接近o4-mini的93.0分,在AIME 2024数学竞赛中分别达到96.6和96.0分 [9] - gpt-oss-120b可在单个80GB GPU上运行,gpt-oss-20b仅需16GB内存,适合边缘设备部署 [10] - 提供Apache 2.0许可证,支持参数微调、函数调用、网页浏览和Python代码执行等Agentic功能 [14] DeepMind Genie 3 - 推出世界模型Genie 3,支持720p分辨率实时交互,场景一致性可维持数分钟 [15][17] - 相比Genie 2,分辨率从360p提升至720p,交互延迟实现实时响应 [16] - 支持提示词生成世界事件,可模拟自然现象、生态系统和不同历史场景 [15][19] Anthropic Claude Opus 4.1 - 升级旗舰模型Claude Opus 4.1,强化Agent能力和真实世界编程能力 [18] - 在SWE-bench Verified基准测试中达到74.5%,创造新纪录 [20] - 提供200K上下文窗口,在多文件代码重构方面表现突出 [23] - 定价为每百万输入token 15美元,输出token 75美元 [25]
就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1
机器之心· 2025-08-06 09:49
你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。 以前只有 OpenAI 抢占别人家的风头,这次轮到 OpenAI「被截胡」了!历史总是充满戏剧性! | 机器之心报道 | | --- | 机器之心编辑部 你会掏钱吗? 对比他们发推时间,算下来就是前后脚的功夫,不知是 Anthropic 提前得知了消息,还是刚巧赶上了,又或者是 Anthropic 以为 OpenAI 要发 GPT-5,提前放出模 型,时间挨的那么近,应该不是巧合。大家觉得呢? 总之,国外这几家公司上新模型,基本都在按照这个循环进行。 Claude Opus 4.1 登场 最新 Claude Opus 4.1 模型,基于 Claude Opus 4 构建,后者在今年 5 月末发布。可以看出 Anthropic 模型迭代速度还是非常快的。Claude Opus 4.1 主要在智能体任 务、真实世界编程和推理能力上有了大幅提升,具有 200K 上下文窗口。 | Input | $15 / MTok | | --- | --- | | Out ...
OpenAI发布ChatGPT世代首个开源模型gpt-oss,4060Ti都能跑得动。
数字生命卡兹克· 2025-08-06 06:08
行业动态 - Google发布世界模型Genie 3 该模型引发行业高度关注 被视为游戏和VR领域的重要突破[3] - Anthropic发布Claude Opus 4 1 在编程能力上持续进化 被解读为针对OpenAI的竞争行为[5][7] OpenAI开源模型GPT-oss - 公司首次在ChatGPT时代发布开源模型 包含120B和20B两个MoE架构版本[9][12][14] - 模型采用Apache 2 0许可 允许自由使用 120B版本参数117B 激活参数5 1B 20B版本参数20 9B 激活参数3 6B 均支持128K上下文[14][15][16][17] - 原生支持4-bit量化技术 20B模型仅需12 8GB存储空间 可在16GB显卡运行 120B模型可在80G单卡运行[18][20][25][26] - 采用MXFP4量化格式 性能损失极小 与英伟达NVFP4技术类似[24][27][29] 模型性能表现 - 在MMLU测试中 120B和20B版本分别获得90 0和85 3分 接近OpenAI商业版本[32] - 在GPQA Diamond测试中分别获得80 1和71 5分 在AIME数学竞赛中表现优异[32][38] - 在Codeforces编程测试中分别获得2622和2516分 优于DeepSeek R1但逊于商业版本[32] - 在写作能力测试中 20B版本表现优于同尺寸开源模型 但逊于商业大模型[67][69] 应用场景 - 提供在线试用平台gpt-oss com 并已接入OpenRouter API服务[39][40] - 支持本地部署 可通过Ollama工具运行 20B版本响应速度极快[44][49][50][51] - 在代码生成和数学推理方面表现突出 但存在一定幻觉问题[74][75] - 被视为改变开源社区格局的重要产品 可能推动行业竞争格局变化[80][81]
腾讯研究院AI速递 20250806
腾讯研究院· 2025-08-06 00:01
Claude Opus 4.1内测与行业动态 - Claude Opus 4.1正在内部测试,预计半月内发布,主打提升推理和规划能力 [1] - Anthropic年收入增长5倍达50亿美元,编程客户Cursor和GitHub Copilot贡献14亿美元API收入 [1] - Claude在AI编程领域优势明显但面临OpenAI等竞对威胁 [1] 腾讯ima功能更新 - ima新增AI播客功能,基于混元大模型提供自然对话与优质听感 [2] - 支持文件夹一键导入功能,大幅简化知识导入流程 [2] - 新增Xmind脑图解读与知识库内容置顶功能,提升知识管理效率 [2] 阿里开源Qwen-Image模型 - 通义千问开源200亿参数图像生成模型Qwen-Image,中英文文本渲染能力出色 [3] - 模型能精准生成含复杂文字的图像,包括PPT、海报和商品宣传图 [3] - 采用MMDiT架构和渐进式训练策略,多项基准测试达SOTA水平 [3] 华为开源盘古模型与CANN架构 - 华为开源三款盘古模型,规模分别为1B、7B和718B,Ultra MoE达7180亿参数 [4] - AI计算架构CANN及Mind系列应用使能套件全面开源开放 [4] - 采用Multi-head Latent Attention和负载均衡策略等创新技术 [4] 纳米AI多智能体蜂群技术 - 纳米AI推出多智能体蜂群,一句话生成10分钟高质量AI视频,降低95%制作成本 [5] - 引入L4级智能体标准,实现多智能体共享记忆和协作 [5] - 单步智能体成功率达99.97%,支持无限Token和上下文长度 [5] 谷歌大模型对抗赛 - 谷歌发起首届大模型对抗赛,8款顶级AI模型将在国际象棋领域对决 [6][7] - 参赛模型包括OpenAI、DeepSeek、Kimi、谷歌、Anthropic和xAI等 [6] - 比赛采用单败淘汰制,全程透明直播 [7] 苹果脑控技术进展 - 苹果与Synchron合作推出BCI HID协议,让脑电波成为原生输入方式 [8] - 渐冻症患者通过Stentrode脑机接口设备成功操控iPad [8] - 相比Neuralink采用低风险无创手术方式 [8] 宇树科技机器人产品 - 宇树科技发布四足机器狗Unitree A2,可负重100kg,最大奔跑速度5米/秒 [9] - 此前发布人形机器人R1,售价3.99万元起,被称为行业"价格屠夫" [9] - 公司2024年营收突破10亿元,Go1机器人全球出货量超5万台 [9] AI对社会结构影响预测 - 前谷歌高管预警2027年起AI将开启15年"地狱期",中产阶级或被消灭 [10] - 预测未来社会将只剩顶端0.1%富人和底层民众 [10] - 2042年后或进入AI主导的乌托邦时代 [10] 阶跃星辰开源基座模型 - 阶跃星辰开源基座模型Step 3,为3210亿参数的多模态推理模型 [11] - CEO坚信多模态生成与理解统一是通往AGI的必由之路 [11] - 聚焦智能终端Agent和垂类Agent两大方向 [11]