Claude Opus 4.8
搜索文档
Why Anthropic's $965 Billion+ IPO Could Pay Off Massively For Investors
Forbes· 2026-05-29 21:25
SAN FRANCISCO, CALIFORNIA - DECEMBER 04: Daniela Amodei, Co-Founder/President, Anthropic speaks onstage during "Teaching AI to Think Responsibly" at WIRED's The Big Interview 2025 at The Midway SF on December 04, 2025 in San Francisco, California. (Photo by Kimberly White/Getty Images for Wired) Getty Images for Wired Anthropic – provider of the AI chatbot Claude – is now valued at $985 billion following a $65 billion capital infusion – surpassing by 13% OpenAI's valuation as the world's most valuable start ...
实测Claude Opus4.8,这可能是第一个不会偷懒的模型
虎嗅APP· 2026-05-29 19:45
以下文章来源于数字生命卡兹克 ,作者数字生命卡兹克 希望能激发你对AI的好奇。 完成了新一轮650亿美元的融资,估值逼近一万亿美元。。。 本文来自微信公众号: 数字生命卡兹克 ,作者:数字生命卡兹克,原文标题:《实测Claude Opus 4.8,这可能是第一个不会偷懒的模型。》 大半夜的,刚准备早睡一下。 除此之外,又发了另一个消息。 前有港股智谱7000亿市值,后有Anthropic估值7万亿人民币。 果然AI行业的造富神话,比鬼故事还要鬼故事。 数字生命卡兹克 . 价格也没变,$5/M输入、$25/M输出。 所以基本上用的也是Opus 4.7的基模上直接又调了一下。 然后,我就反应过来了一件事,我靠,你Opus 4.8上了,你不会要把我的Opus 4.6给顶掉了吧。 因为Opus 4.5在内容创作上是我觉得的巅峰,Opus比Opus 4.7差了一点,但是我觉得还能用,而 Opus 4.7是我完全觉得不可用的状态。 按照claude在过去网页端只保留两代模型的优良传统,Opus 4.6可能会被顶掉。 我抱着进展的心情一看。 但是说实话,距离4月17号Opus 4.7上线,仅仅才过去42天,一个半月,又一个 ...
段永平重砸120亿,押注“下一个茅台”;豆包被逼急了;蔚来、小鹏等15家新能源车企涨价;双汇发布致歉声明……
商业洞察· 2026-05-29 17:33
解决销售难题,传播管理智慧 快来关注我吧! 知名投资人段永平完成对泡泡玛特的大额逆势增持,首次实现举牌入驻。 港交所 27日披露的权益变动表格显示,段永平通过其控制的H&H International Investment 在2026年5月25日以每股150港元的平均价格,买入了9823200股泡泡玛特普通股,交易总额 高达14.7亿港元。 完成本次增持后,段永平合计持有泡泡玛特 7637.16 万股股份,持股比例达到 5.69%,知名投 资人段永平与其旗下公司同步增持公司股份,成为公司第二大股东,触发强制披露要求,正式触 发举牌规则。 就在一年前,他还公开表示 "看不懂潮玩,不敢投"。 解析: 段永平又出手了。这次不是茅台,也不是苹果,而是那个卖盲盒的泡泡玛特。 5月25日,港交所一纸权益披露炸了锅:段永平及其家族办公室以均价150港元/股,大手笔 增持泡泡玛特近千万股,持股比例直接飙升至5.69%,触发举牌线,坐稳了仅次于创始人王 宁的第二大股东交椅。按当时市值算,这笔押注逼近120亿港元。 销售 观点 必看 案例 职场 TO 今日头条 段永平重砸 120亿,押注"下一个茅台"? 段永平的投资风格向来以 ...
新一轮大模型要来了!Blackwell加持下,AI能力更强了?
华尔街见闻· 2026-05-29 17:11
AI大模型行业核心观点 - AI大模型竞争正迈入以英伟达Blackwell架构为关键催化剂的新技术节点,首批基于此架构训练的旗舰模型即将亮相,有望与现有产品形成能力断层 [1][5][6] - 行业呈现强劲且垂直拉升的需求态势,但供给侧增速相对渐进,算力与推理成本双双走高,供需错配格局正在重塑整个行业的定价与商业化逻辑 [2][3][5] 技术节点与模型发布 - **Blackwell架构成为关键催化剂**:花旗研究将“首批基于Blackwell架构训练的模型”列为近期最重要的技术催化剂,其算力优势尚未体现在现有顶级模型上,市场预期其落地将带来明显能力跃迁 [1][6] - **密集的模型发布日程**:未来数月发布节点密集,包括谷歌Gemini 3.5 Pro(预计二季度)、Anthropic Claude Sonnet 4.7(预计二季度)、OpenAI GPT-6.0(排期三季度)以及Claude Opus 5、Sonnet 5等(定档四季度)[7] - **“前Blackwell时代”的最后顶级模型**:Anthropic的Claude Mythos预览版被视为当前架构的能力天花板,其之后的重磅模型将首批受益于Blackwell算力红利 [6] 主要厂商动态与产品进展 - **Anthropic加速迭代**:提前发布Claude Opus 4.8,核心升级包括新增“投入控制”机制、推出“动态工作流”研究预览版以及着力提升“诚实度”[9][10] - **Claude Opus 4.8性能与定价**:在Online-Mind2Web基准测试中获得84%,优于Opus 4.7和GPT-5.5;定价维持每百万输入token 5美元、输出token 25美元,并新增速度为标准模式2.5倍的“快速模式”[11] - **xAI的Grok-5**:马斯克披露参数达1.5万亿的Grok-5训练已完成,预计2至3周内发布,参数规模是当前Grok-4的三倍,并整合了来自Cursor的大量编程数据以增强编程能力 [13][14][15] - **MiniMax的新模型**:工程主管预告采用全新稀疏注意力机制的MiniMax-M3即将推出,据称预填速度可提升9.7倍、解码速度提升15.6倍,有望延续其在性价比赛道的优势 [16][17] - **其他竞争者**:DeepSeek V4 Pro、Qwen3.6 Plus、Kimi K2.6等产品相继入场,前沿模型竞争多极化趋势清晰 [19] 市场需求与采用情况 - **需求呈现“垂直墙”式增长**:OpenAI首席财务官用此描述需求增速,具体数据包括:谷歌每月处理的tokens量达3.2千万亿(Q),同比增长7倍;Anthropic预计二季度末年化收入(ARR)约达500亿美元,较3月底的300亿美元大幅跳升;OpenAI一季度单季收入57亿美元,已超去年上半年总和(约43亿美元)[2][20][21] - **企业采用仍处早期**:花旗认为企业端AI采用加速仍处于早期阶段,需求天花板远未到来 [22] - **AI对生产效率的冲击**:Intuit、Meta及Cisco相继宣布裁员,被解读为AI加速冲击传统生产效率场景的潜在信号 [23] 行业定价逻辑演变 - **推理定价双轨化**:高端前沿推理定价坚挺甚至上涨(如GPT-5.5相较GPT-5.4价格约上涨2倍),而接入层面竞争加剧(如谷歌下调AI Ultra订阅价格并推出新档位)[24][25] - **企业端成本压力**:据OpenRouter分析,不同工作负载下使用GPT-5.5的成本增幅为49%至92%,部分被输出tokens减少19%至34%所抵消 [25] 供给约束与商业模式创新 - **算力稀缺催生预留定价**:供给增速跟不上需求,推动AI算力服务模式向类云计算转变,例如OpenAI推出“保证容量”方案,企业可通过1到3年合约锁定算力并获得折扣 [28][29] - **人才成为关键约束**:顶尖AI研究员(如Andrej Karpathy加入Anthropic)的流向被视为比算力更能预示前沿能力发展的指标 [29] - **算力租赁市场升温**:花旗追踪的Blackwell系列芯片租赁价格自2025年下半年以来持续攀升,反映市场对下一代训练算力的强劲需求 [8]
Claude Opus 4.8来了,两个史上首次改写历史
36氪· 2026-05-29 16:46
Opus 4.7发布刚43天,Opus 4.8就来了!编程实力暴增,全面霸榜。Claude Code一口气放出上百个agent并行干活,一个人11天就能重写75万行代码、99.8%测试通 过。更狠的Claude Mythos,几周后就来。 文 | 摩西 桃子 来源| 新智元(ID:AI_era) 封面来源 | 企业官网 猝不及防,Anthropic深夜杀回来了! 就在刚刚,Claude Opus 4.8正式登场,一举夺回全球AI王座。 而且价格还一分没涨,跟上一代一模一样。 无论是编程、人类最后考试(HLE),还是在智能体、计算机使用任务中,Opus 4.8几乎无可匹敌。 在衡量真实世界Agent能力的硬核榜单GDPval-AA上,Opus 4.8拿下了1890 Elo,断层第一。 比上一代Opus 4.7高137分,比GPT-5.5高121分。换算成对战胜率,赢面高达67%。 不仅如此,完成同样的任务,要比4.7少用15%的步骤,少输出35%的token。 可谓是,又快,又强,又便宜。 知名博主Mark Kretschmann一句话点破它的来头——Opus 4.8可能就是蒸馏的Mythos。 但到了Opus ...
Claude Opus 4.8 多项能力跨越式提升,还没涨价!马斯克:干得漂亮
程序员的那些事· 2026-05-29 15:48
北京时间 5 月 29 日凌晨 1 点,Anthropic 推出全新旗舰大模型 Claude Opus 4.8,新版在 Opus 4.7 基础上完成全方位优化, 定价保持不变 ,目前已面向全球用户全面 上线。 新版本在编码、智能体运行、逻辑推理及专业知识处理等多项基准测试中表现亮眼,综合协作能力显著提升。 | | Opus 4.8 | Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro | | --- | --- | --- | --- | --- | | Agentic coding SWE-Bench Pro | 69.2% | 64.3% | 58.6% | 54.2% | | Agentic terminal coding Terminal-Bench 2.1 | 74.6% | 66.1% | 78.2% | 70.3% | | Multidisciplinary reasoning | 49.8% no tools | 46.9% no tools | 41.4% no tools | 44.4% no tools | | Humanity's Last Exam | 57.9 ...
60000亿,全球最牛兄妹诞生
投资界· 2026-05-29 15:23
公司核心融资与估值动态 - 公司完成H轮融资650亿美元 投后估值达到9650亿美元 约合人民币6.5万亿元 超越OpenAI成为全球估值最高的AI独角兽 [2][11] - 公司估值在短期内飙升 从2025年初的615亿美元 到今年2月G轮后的3800亿美元 再到三个月后H轮的9650亿美元 [8] - 本轮融资由Altime ter Capital、Drago neer、Greenoaks和Sequoia Capital领投 并有Capital Group、Coatue、D1 Capital Partners、GIC、ICONIQ、XN等共同参与 超大规模数据中心承诺投资150亿美元 其中亚马逊投资50亿美元 [14] 公司发展历程与战略 - 公司由Dario Amodei和Daniela Amodei兄妹于2021年创立 二人此前均为OpenAI核心成员 并带领另外五位核心成员一同出走 [2][7] - 公司选择从企业客户切入市场 与OpenAI的C端路径不同 目前年化营收已突破470亿美元 [8] - 公司联合创始人分工明确 Dario Amodei担任CEO 主导研究和产品方向 Daniela Amodei担任总裁 负责运营、商业化和人才体系 [8] 公司技术进展与产品发布 - 公司同步发布了新模型Claude Opus 4.8 定价与上一代保持一致 但快速模式价格降至原来的三分之一 [16] - 公司计划在未来几周内推出比Opus水平更高的新模型Claude Mythos [16] - 公司创始人Dario Amodei深度参与并推动了GPT-2、GPT-3的研发 也是基于人类反馈的强化学习(RLHF)的共同发明人之一 [7] 行业竞争格局与资本动向 - 行业融资竞赛激烈 赌注越来越大 能参与竞争的玩家越来越少 [3] - 公司与OpenAI的投资人结构存在重叠 MGX、黑石、富达、Sequoia Capital、T. Rowe Price和淡马锡等机构同时出现在双方的股东名单上 [17] - OpenAI已开始加速推进IPO 目标时间指向2026年第四季度 而公司的H轮融资可能是其上市前的最后一轮融资 [17] 行业宏观观察与成本趋势 - 行业训练成本急剧上升 公司正在花100亿美元训练下一个模型 尽管每个模型都赚钱 但公司整体仍在亏钱 而两年前前沿模型的训练成本还不到1亿美元 [22] - 行业头部参与者认为当前存在估值泡沫 但同时也承认AI正在重塑世界 是至关重要的投资领域 [20][21][22] - 行业竞争已演变为由资本、算力、能源、芯片和基础设施共同支撑的超级工程 [22]
Claude Opus 4.8 发布,回答出现了 Qwen 和 DeepSeek,难道也蒸馏了~
菜鸟教程· 2026-05-29 11:30
产品发布与性能升级 - 公司发布Claude Opus 4.8版本,该版本在Opus 4.7基础上,判断能力更精准,对自身任务进展的反馈也更如实,同时可独立完成任务的时长大幅提升[1] - 在多项基准测试中,Opus 4.8表现优于前代及主要竞争对手:Agentic coding SWE-Bench Pro得分69.2%,高于4.7的64.3%;Agentic terminal coding Terminal-Bench 2.1得分74.6%,高于4.7的66.1%;Multidisciplinary reasoning Humanity's Last Exam无工具得分49.8%,有工具得分57.9%,均高于前代;Agentic computer use OSWorld-Verified得分83.4%;Knowledge work GDPval-AA得分1890;Agentic financial analysis Finance Agent v2得分53.9%[3] - 产品新增网页端功能,支持用户自定义模型任务投入强度,以兼顾速度与质量[8] - 产品推出Claude Code功能,上线动态工作流,可处理超大型代码项目,并行运行大量子智能体[8] - API功能升级,消息数组支持实时更新系统指令,使开发更灵活[8] - 产品推出“极速模式”,速度达原版2.5倍,价格降至前代的1/3[8] 定价策略与商业模式 - 产品常规模式定价维持不变,输入为每百万tokens 5美元,输出为每百万tokens 25美元[3] - 产品新推出的“极速模式”定价为输入每百万tokens 10美元,输出每百万tokens 50美元[8] - 公司后续规划推出低成本平替模型,以及更强的Mythos系列模型,并将在近期逐步开放[8] 公司融资与估值 - 近期公司完成650亿美元融资,估值已达到9000亿至9650亿美元,超越OpenAI成为AI领域估值最高的初创公司[6] - 公司的估值在过去一年多时间里呈爆炸式增长,从不到2000亿美元快速冲向万亿美元门槛[7] 行业技术趋势与竞争格局 - 有用户发现Claude Opus 4.8在回答中文“你是什么模型”时,会错误地声称自己是“通义千问(Qwen)”或“DeepSeek”,引发对其在迭代中可能对Qwen模型进行了深度蒸馏的猜测[7][9][10][13] - 此身份识别异常现象在API接口调用中也同样出现[17][18] - 行业观察认为,大模型技术发展可能正走向一个相互蒸馏的世界,即模型间相互训练、学习、发布能力并反向逼近[19] - 随着技术发展,大模型的推理、代码、多模态能力可能会越来越趋同[20] - 当前不同模型在代码、中文、长文本等能力上各有擅长的差异,未来可能随着关键突破被快速复制、蒸馏、工程化和开源化而逐渐被拉平[21][22] - 最终,各模型间的能力差距可能越来越小,真正的差异化竞争将转向用户体验层面,如价格、响应速度、稳定性、上下文处理能力、API限流政策和服务可靠性等[23][24][25][27] - 行业终极竞争态势可能演变为模型高度同质化,用户难以区分,选择标准完全基于体验和成本[29]
鸿蒙生态设备累计数已超13亿台;比亚迪发布4nm智驾芯片
21世纪经济报道· 2026-05-29 10:59
巨头动态与监管 - SpaceX星舰V3在成功首飞五天后,被美国联邦航空管理局下令停飞并要求进行事故调查,原因是认定其第12次试飞中发生了一起事故 [2] - Meta宣布全面落地付费订阅服务体系,首次为Meta AI聊天机器人推出付费服务,旨在将AI投入转化为真实收入,并拓宽除广告之外的营收渠道 [5] - IBM宣布计划未来五年向量子计算领域投资超过100亿美元,目标是在2029年前建成全球首台能稳定无误执行复杂计算任务的大型量子计算机 [11] 人工智能与模型进展 - Anthropic发布旗舰模型Claude Opus 4.8,在定价不变的前提下对多项能力进行升级,快速模式运行速度较前代提升约2.5倍,模型成本降至前代的三分之一 [2] - 人工智能公司Anthropic完成新一轮650亿美元融资,投后估值达9650亿美元,超越OpenAI,资金将用于扩充算力以满足Claude增长需求 [10] - 腾讯AI智能平台ima宣布其知识库接入WorkBuddy等Agent产品,实现知识沉淀、跨产品调用与执行的完整闭环 [5] - DeepSeek服务在5月28日上午出现部分中断,影响网页对话及API服务,事件在约半小时后得到恢复 [4] 硬件与芯片技术 - 比亚迪发布中国首款4nm车规级智驾芯片“璇玑A3”,3颗芯片总算力超过2100 TOPS,支持L3/L4自动驾驶 [10] - 腾讯云自研编解码芯片“沧海”在硬件视频编码比赛中多项指标领先超30%,新一代沧海V2芯片已成功“点亮”并进入量产周期,计划于2026年下半年提供服务 [8] - 阿里巴巴达摩院发布GPU版本“敏迭”求解器,可求解亿级变量线性规划问题,该技术应用于电力调度、金融管理等关键领域 [9] 生态建设与市场拓展 - 鸿蒙生态设备累计数已超过13亿台,开源鸿蒙社区代码量突破1.4亿行,贡献者超过13000名 [3] - NBA官方正式宣布入驻B站,将带来NBA赛场精彩内容,此前已有包括凯文·杜兰特在内的多位球星入驻,多场经典比赛全场回放已上线 [6][7] - 美图手机被反映出现系统证书过期等问题,客服坦言已无专门技术团队处理老机型问题,且无售后点 [8]
Opus 4.8 刚发布,Redis 之父质疑跑分:DHH 盛赞的 GPT-5.5,正在动摇编码王座
AI前线· 2026-05-29 10:35
模型升级核心 - Anthropic发布旗舰模型Claude Opus 4.8,升级重点围绕增强开发者工作流的能力,包括dynamic workflows和更便宜的fast mode [1] 核心功能与特性 - **Dynamic Workflows**: 允许Claude编写JavaScript脚本进行任务编排,可调度数十到数百个并行subagents运行,单次运行并发上限为16个,总数上限为1000个 [1][5][8] - **思考强度控制**: 用户可调高或调低Claude在任务中投入的推理资源,以平衡回答质量、速度和消耗速率 [10][11] - **Fast Mode降价**: Opus 4.8的fast mode输出速度约为正常速度的2.5倍,价格降至每百万输入token 10美元、每百万输出token 50美元,相比Opus 4.7的30美元/150美元降低了3倍 [12][13] 模型性能与基准测试 - Opus 4.8在多项基准测试中超过前代模型Opus 4.7,并领先于GPT-5.5和Gemini 3.1 Pro [2][24] - 在agentic coding (SWE-Bench Pro)上得分为69.2%,高于Opus 4.7的64.3%、GPT-5.5的58.6%和Gemini 3.1 Pro的54.2% [24][25] - 在agentic computer use (OSWorld-Verified)上得分为83.4%,高于GPT-5.5的78.7%和Gemini 3.1 Pro的76.2% [24][25] - 在agentic terminal coding (Terminal-Bench 2.1)上得分为74.6%,低于GPT-5.5的78.2% [24][25] 模型对齐与可靠性 - Anthropic强调Opus 4.8在支持用户自主性、按照用户最佳利益行事方面有提升,在衡量亲社会特质的指标上达到新高 [17] - 模型的欺骗率以及配合滥用请求的比例,相比前代模型显著更低 [18] - 相比前代模型,Opus 4.8大约低四倍概率会对自己写出的代码中的缺陷视而不见、不加说明,在执行agentic任务时更可靠、判断更敏锐 [21] 定价与市场定位 - Opus 4.8常规模式价格与Opus 4.7相同,为每百万输入token 5美元、每百万输出token 25美元 [2] - 在常规模式下,Opus 4.8价格低于主要竞争对手OpenAI的GPT-5.5(每百万输入token 5美元、每百万输出token 30美元) [15][16] 行业竞争与反馈 - 有行业观点认为,Anthropic将GPT-5.5纳入基准测试对比可能是一个战略错误,因为尽管Opus 4.8在某些测试中得分更高,但GPT-5.5的编码能力在开发者社区获得了更强的正面体感反馈,这导致了厂商说法与实际体验之间的错位 [26][27][28] - 有观点认为Opus 4.8是一个很强的模型,但Anthropic正越来越像是在追赶OpenAI,而非定义节奏,GPT-5.5似乎再次抬高了基准 [30][31] 产品演进历史 - 2025年5月,Anthropic发布Opus 4,称其为世界上最好的编码模型 [32] - 2025年11月,Opus 4.5发布,帮助公司重新夺回编码领域的领先地位 [33] - Opus 4.6因定价调整引发争议,其支持近100万token上下文,但请求超过约20万token即按更高的长上下文价格计费 [34] - Opus 4.7发布后,有用户反馈其出现自相矛盾的回答和性能下降,引发了关于模型质量、安全权衡及变相涨价的讨论 [35]