Workflow
Sonnet 4.6
icon
搜索文档
Claude Opus 4.6与Sonnet 4.6上线百万上下文窗口;上海推出全国首个虚实融合具身智能训练场丨AIGC日报
创业邦· 2026-03-15 14:06
人工智能模型与定价更新 - 人工智能公司Anthropic宣布其Claude Opus 4.6和Sonnet 4.6模型现已以标准价格提供完整的100万令牌上下文窗口 [2] - 此次更新实行统一价格,Opus 4.6模型定价为每百万令牌输入5美元/输出25美元,Sonnet 4.6模型定价为每百万令牌输入3美元/输出15美元,且无需支付长上下文附加费 [2] 人工智能行业人才流动 - Thinking Machines Lab的创始成员Devendra Chaplot宣布加入埃隆·马斯克创立的AI初创公司xAI,将与团队共同研发超级智能 [2] 人工智能基础设施与场景建设 - 上海推出了全国首个虚实融合具身智能训练场,旨在加快智能机器人融入实体经济,该训练场已为上百台异构机器人提供数据采集和技术验证服务 [2] - 上海正会同本地龙头企业如上海电气、上汽集团以及市级养老院等,共同打造一批工业和康养等实际应用场景 [2] 人工智能应用与安全讨论 - 360集团创始人周鸿祎在谈及使用类似OpenClaw(“龙虾”)的AI助手时指出,赋予其过多权限存在安全风险,类比为将保险柜钥匙交给助理 [2] - 周鸿祎强调,此类AI助手自身可能存在幻觉或被欺骗的风险,且可能存在恶意制作的Skill(技能),其安全问题需要持续发现和解决,而非仅依靠将数据上传云端或使用国产数据库就能一劳永逸 [2]
GPT-5.4发布,最适合OpenClaw的天选模型登场了。
数字生命卡兹克· 2026-03-06 06:38
GPT-5.4模型发布与性能概览 - OpenAI发布了GPT-5.4 Thinking和GPT-5.4 Pro模型,现已集成至ChatGPT、API和Codex平台,该模型融合了公司在推理、编码和智能体工作流方面的最新进展[1] - 在关键基准测试中,GPT-5.4 Thinking在GDPval知识工作任务评估中取得83.0%的得分,优于Claude Opus 4.6的78.0%和GPT-5.3 Codex的70.9%[13][15][16] - 在软件工程能力测试SWE-Bench Pro中,GPT-5.4 Thinking以57.7%的得分与GPT-5.3 Codex的56.8%基本持平[13][17] - 在操作系统使用能力测试OSWorld-Verified中,GPT-5.4 Thinking获得75.0%的得分,超过Claude Opus 4.6的72.7%[13][19] - 在智能体核心能力测试Toolathlon中,GPT-5.4 Thinking以54.6%的得分显著领先于Claude Opus 4.6的44.8%[13][22][23] GPT-5.4的模型能力定位与优势 - GPT-5.4被定位为优秀的智能体基座模型,其能力构成被概括为:GPT-5.3 Codex级别的代码能力、超越GPT-5.2的世界知识、更强的工具使用能力以及极具成本效益的Codex订阅额度[11][24] - 该模型解决了此前GPT-5.3 Codex“不说人话”和世界知识薄弱的痛点,同时保持了顶级的编程能力,使其在需要结合业务理解和代码执行的复杂任务中表现更佳[2][3][11][16] - 模型支持100万token的上下文窗口,较GPT-5.3的40万token有大幅提升,这对维持智能体在长任务中的上下文理解至关重要,尽管超过27万token后计费会翻倍[25] - GPT-5.4是OpenAI首个内置原生计算机使用能力的主线模型,能出色地编写通过Playwright等库操作计算机的代码,并能根据屏幕截图发出指令,实现了代码与视觉能力的结合[27] 技术特性与成本分析 - 新引入了“工具搜索”功能,模型不再一次性接收所有工具定义,而是按需查找并追加,OpenAI内部测试显示该配置在保持相同准确率的同时将总体token使用量减少了47%[30][31][34] - 发布了新的`playwright-interactive`技能,允许Codex以代码和视觉两种方式调试Web和Electron应用[27][28] - API定价方面,GPT-5.4的输入价格为每百万token 2.50美元,输出价格为每百万token 15美元,虽高于GPT-5.2,但显著低于Claude Opus 4.6的5美元/25美元(输入/输出)[38][39] - 对于大多数用户而言,通过20美元的ChatGPT Plus订阅即可使用GPT-5.4,并能利用Codex平台慷慨的额度,这相比必须通过昂贵API调用的Claude模型具有巨大成本优势[11][36][39] 市场影响与生态整合 - GPT-5.4的发布被视为对Claude Opus 4.6在智能体模型领域主导地位的有力挑战,其综合能力与成本优势可能改变开发者的模型选型偏好[2][11][39] - OpenAI对第三方工具调用Codex额度持开放支持态度,这与Anthropic封禁OpenClaw等行为形成对比,有利于其构建更开放的开发者生态[7][9] - 模型已迅速集成至ChatGPT和Codex平台,社区用户正积极推动其在OpenClaw等流行智能体框架上的支持,预计将很快完成适配[40][49][52] - 初步体验显示,GPT-5.4在自然语言表达上更接近“人话”,在任务理解和沟通上有了明显改善,尽管在部分领域(如前端审美、写作风格)与顶尖竞品相比仍有提升空间[42][43][45][47]
\HALO\交易:拥抱AI基建,不被取代
长江证券· 2026-03-01 16:13
核心观点 - 近期美股市场,特别是纳斯达克指数和软件板块的下跌,主要源于市场对“AI大模型颠覆软件行业”的叙事性担忧,而非基本面恶化 [2][5] - 报告认为,AI大模型与软件公司之间本质上是合作关系,而非颠覆关系,软件公司凭借深厚的垂直行业积累,其长期价值有望被市场重新认识 [2][6][7] - 当前市场环境类似于科网泡沫时期的1998年,泡沫正在加速形成。在配置上,建议关注由AI资本开支驱动的硬件景气方向,以及具备“HALO”(重资产、低淘汰率)属性的资产,以获取确定性溢价 [8][50] 市场表现与下跌原因分析 - **指数与板块分化显著**:自2026年初至报告期,纳斯达克指数在三大指数中表现最弱。同时,北美硬件股(如费城半导体指数)与软件股走势出现明显分化,软件板块下跌更为严重 [5][14][21] - **下跌的驱动因素**: - **软件端**:市场担忧非上市的AI大模型公司(如Anthropic, OpenAI)会对现有软件公司带来颠覆式创新,即“AI吞噬软件”的叙事冲击 [5][14] - **硬件端**:市场担忧云服务提供商(CSP)的资本开支(CapEx)投入可能因盈利未兑现而无法持续,而硬件股股价已计入乐观预期,存在不及预期风险 [5][14] - **估值变化反映叙事冲击**:北美软件公司市盈率(PE-TTM)出现显著下杀。例如,Salesforce的PE-TTM从2026年1月2日的32.91倍下降至2月26日的25.06倍;Applovin从73.94倍降至45.01倍;多邻国从21.13倍降至13.11倍;Adobe从19.57倍降至14.91倍;Servicenow从88.40倍降至65.40倍。这反映出下跌更多源于对行业终局的担忧,而非基本面恶化 [5][23] - **整体市场估值与动量**:截至2026年2月26日,标普500指数的PE-TTM为28.61倍,处于过去5年均值加1倍标准差的高位。近期指数回撤与动量因子走弱高度相关 [19][21] AI与软件的关系:合作而非颠覆 - **产业合作导向明确**:Anthropic在2026年2月24日的发布会上明确表示其与软件公司是合作关系,并发布多项集成产品,包括升级Claude Cowork以集成到企业软件、推出企业级插件平台(与Factset、标普等合作)、以及接入Google Workspace、Salesforce Slack等主流办公软件连接器,实现跨应用协同 [6][26] - **大模型能力持续提升**:Anthropic推出的Sonnet 4.6模型在多项基准测试中性能提升,例如在Agentic coding(SWE-bench Verified)测试中达到79.6%,在Agentic computer use(OSWorld-Verified)测试中达到72.5%,性价比接近更高阶的Opus模型 [27][30] - **AI渗透率仍处早期**:生成式AI的渗透率当前仍不足30%,技术趋势仍处于上半场。渗透率提升的核心驱动力来自大模型能力迭代创造的toC需求和企业降本增效的toB需求 [31][33] - **软件公司护城河仍在**:“AI吞噬软件”的叙事目前缺乏实际依据。软件公司凭借垂直行业积累、数据、工作流集成等竞争优势,长期有望改善市场认知 [7][43] 投资方向:关注景气缺口与“HALO”资产 - **类比历史阶段**:参考科网泡沫,当前AI产业演进阶段更类似于1998年,处于泡沫加速形成期 [8][50] - **关注AI硬件景气方向**:海外CSP大厂持续进行数据中心和AI芯片的资本开支,带动相关硬件板块高景气。建议关注因需求快速增长而供给扩产缓慢、存在供需错配的领域,如**电力设备、存储、光模块**等 [8][44] - **布局“HALO”属性资产**:“HALO”指Heavy Asset, Low Obsolescence(重资产,低淘汰率)。这类资产初始资本开支需求大、资金壁垒高、技术进步慢,在AI演进中被颠覆的风险较低。具体方向包括**工业金属、半导体设备、晶圆代工、被动电子元器件**等 [8][44] - **产业链层级与缺口**:AI产业链分为能源层、芯片层、基础设施层、模型层和应用层。其中,美国在**能源层**供给缺口较大,中国在**芯片层**供给缺口较大,**基础设施层**的资产在全球范围内都较为稀缺 [45] - **中长期战略看好AI应用**:报告战略性看好AI应用领域的长期发展前景 [8]
华尔街见闻早餐FM-Radio|2026年2月18日
搜狐财经· 2026-02-18 07:53
市场表现与宏观动态 - 美股市场日内显著震荡,标普500指数盘中一度下跌接近1%,尾盘回升最终收涨0.10%至6843.22点,道指涨0.07%,纳指涨0.14% [1][6] - 软件股ETF下挫2.2%,苹果股价上涨超过3%,甲骨文股价下跌超过3.8% [1] - 美债收益率小幅上行,10年期美债收益率上涨0.95个基点至4.0578%,2年期收益率涨2.49个基点至3.4325% [1][7] - 美元指数呈倒V走势盘中曾涨近0.5%,英镑一度跳水约1% [1] - COMEX黄金期货下跌2.93%至4897.80美元/盎司,失守4900美元关口,COMEX白银期货跌5.74% [1][7] - WTI 3月原油期货跌0.89%至62.33美元/桶,布伦特4月原油期货跌1.79%至67.42美元/桶 [7] 人工智能与科技行业 - Anthropic发布新模型Sonnet 4.6,其操作电脑能力在16个月内提升五倍,基准测试得分72.5%,基本持平最新旗舰Opus 4.6,定价仅为每百万token输入3美元、输出15美元 [3][14] - 苹果公司正加速开发三款新型可穿戴设备,包括AI眼镜、挂饰及摄像头版AirPods,这些设备将围绕Siri构建,其中智能眼镜计划最早于2027年发布 [3][15] - Meta宣布未来数年将部署数百万颗英伟达AI芯片,并首次在其独立计算机核心部件采用英伟达的Grace CPU,部署将涵盖当前Blackwell架构及即将推出的Vera Rubin设计 [3][15] - 摩尔线程宣布已在旗舰级AI训推一体GPU MTT S5000上完成对阿里大模型Qwen3.5的全面适配 [19] 机器人技术进展 - 宇树机器人在春晚完成高动态高协同集群控制技术的全球首秀,机器人在快速奔跑中完成了穿插变阵和武术动作 [2][11] - 宇树科技在算法层面升级强化学习框架,硬件层面提升核心关节电机功率密度并升级灵巧手,系统层面全新开发集群自动控制系统,确保数十台机器人的毫秒级同步 [11][12] - 春晚历史上首个“干活儿”机器人“小盖”展示了端到端自主完成盘核桃、捡玻璃碎片、叠衣服、串烤肠等五项高难度动作的能力 [12] 能源与大宗商品 - 伊朗外长称伊美就谈判“指导原则”达成一致,布伦特原油价格一度下跌近3% [3][13] - 伊朗谈判新策略曝光,重点转向资源置换,包括与美联合开发油气田和矿区,以及采购美国民用飞机,以换取制裁解除 [3][13] - 必和必拓上半财年净利润同比增长近30%,其铜业务贡献了公司51%的基础息税折旧摊销前利润,首次超越铁矿石成为最大利润来源 [21] - 群联电子CEO警告,英伟达等巨头的需求正吞噬全球存储产能,上游原厂态度强势,这轮缺货周期或将持续至2027年甚至2030年 [17] 公司资本运作与持仓变动 - 伯克希尔哈撒韦第四季度连续第三个季度减持苹果,持仓市值减少28亿美元,同时大幅减持亚马逊230万股(降幅77%),并首次新进超过506万股纽约时报,市值3.52亿美元 [4][16] - 高瓴资本旗下HHLR Advisors第四季度继续加仓拼多多和阿里巴巴,同时减持富途控股与Webull,并退出百度、网易等持仓,小幅布局比特币ETF和台积电 [5][16] - 闪迪启动30.8亿美元二级市场股票发行,股价盘后下跌,此次发行由现有股东出售股份,西部数据将以闪迪股份交换其持有的债务 [3][15] 产业投资与战略 - 特朗普宣布5500亿美元日本投资正式启动,首批三个“大项目”聚焦得州油气战略、俄亥俄州发电和佐治亚州关键矿产领域 [3][14] - 加拿大宣布新国防工业战略,目标在未来十年将70%的联邦国防合同授予加拿大企业,基本实现在国内采购和维护大部分军事装备 [20]
华尔街见闻早餐FM-Radio | 2026年2月18日
华尔街见闻· 2026-02-18 07:39
市场表现与宏观动态 - 美股市场日内显著震荡,标普500指数盘中一度下跌接近1%,尾盘回升最终收涨0.10%至6843.22点,道指涨0.07%,纳指涨0.14% [2][6] - 美债收益率小幅上行,10年期美债收益率上涨0.95个基点至4.0578%,2年期收益率上涨2.49个基点至3.4325% [2][7] - 美元呈倒V走势盘中曾涨近0.5%,英镑一度跳水约1%,因英国失业率创五年新高导致英国央行降息概率上升 [2] - 受亚洲市场春节休市影响,贵金属缺乏买盘支撑,COMEX黄金期货跌2.93%至4897.80美元/盎司,COMEX白银期货跌5.74%至73.525美元/盎司 [2][7] - 伊美就谈判“指导原则”达成一致,原油一度跌近3%,WTI 3月原油期货跌0.89%至62.33美元/桶,布伦特4月原油期货跌1.79%至67.42美元/桶 [2][4][7] 人工智能与科技行业 - Anthropic发布Sonnet 4.6模型,其操作电脑能力在16个月内提升五倍,基准测试得分达72.5%,基本持平其最新旗舰Opus 4.6,但定价仅为旗舰模型的五分之一 [4][14] - 苹果公司加速开发三款新型可穿戴设备,包括AI眼镜、挂饰及摄像头版AirPods,这些设备将围绕Siri构建并依靠摄像头系统,智能眼镜计划最早于2027年发布 [5][14] - Meta宣布未来数年将部署数百万颗英伟达AI芯片,并首次在其独立计算机核心部件采用英伟达的Grace CPU,部署将涵盖基于Blackwell及未来Vera Rubin架构的AI加速器 [5][15] - 摩尔线程宣布已在旗舰级AI训推一体GPU MTT S5000上完成对阿里最新大模型Qwen3.5的全面适配,展示了其MUSA生态的成熟度 [19] - 群联电子CEO警告,由英伟达等巨头需求驱动的存储超级周期“一辈子只有一次”,上游原厂态度强势甚至要求“预付3年全额货款”,缺货周期或将持续至2027年甚至2030年 [17] 能源与大宗商品 - 伊朗外长称伊美就谈判“指导原则”达成一致,伊朗谈判新策略曝光,包括与美联合开发油气田、矿区以及采购美国民用飞机,以换取制裁解除 [4][13] - 特朗普宣布5500亿美元日本投资正式启动,首批项目聚焦油气、发电、关键矿产领域,旨在巩固美国能源主导地位并结束对外依赖 [4][13] - 必和必拓上半财年净利润同比增长近30%,其铜业务贡献了公司51%的基础息税折旧摊销前利润,首次超越铁矿石成为最大利润来源 [21] 公司动态与持仓变动 - 伯克希尔哈撒韦第四季度继续减持苹果,持仓市值减少28亿美元,同时大幅减持亚马逊230万股(降幅77%),并首次新进买入纽约时报超过506万股,市值3.52亿美元 [5][15] - 高瓴资本旗下HHLR Advisors第四季度继续加仓拼多多和阿里巴巴,同时明显减持富途控股与Webull,并退出了百度、网易等持仓,组合集中度进一步提升 [5][16] - 闪迪启动30.8亿美元二级市场股票发行,导致其股价盘后下跌,此次发行由现有股东出售股份,西部数据将以闪迪股份交换其持有的债务 [5][15] 机器人技术与应用 - 宇树机器人在春晚完成武术表演,展示了高动态高协同集群控制技术的全球首秀,机器人在快速奔跑中完成了穿插变阵和武术动作 [3][12] - 宇树科技针对春晚节目在算法、硬件及系统层面进行了全面升级,包括升级强化学习框架、提升关节电机功率密度,并全新开发了集群自动控制系统以实现毫秒级同步 [12] - 春晚历史上首个“干活儿”机器人“小盖”展示了盘核桃、叠衣服等五项高难度技能,其实现依赖于端到端的自主感知、决策与执行,而非传统预编程 [12] 娱乐与消费 - 中国春节档票房突破10亿元,其中《飞驰人生3》票房已超4.8亿元,AI预测其总票房将达43.67亿元 [18] - 春节档票房排名第二、第三的分别为《惊蛰无声》(票房1.8亿元,AI预测21亿元)和《熊出没·年年有熊》(票房近1.4亿元,AI预测13.6亿元) [18] 其他行业与政策 - 加拿大宣布新国防工业战略,目标在未来十年将70%的联邦国防合同授予加拿大企业,基本实现在国内采购和维护大部分军事装备 [20]