AI Agent
搜索文档
Anthropic收购,OpenAI抢人,“硅谷双强”打的什么算盘?
第一财经资讯· 2026-02-26 11:29
公司战略与收购案 - 美国AI头部公司Anthropic宣布收购视觉驱动计算机自动化AI初创公司Vercept,以补全其Computer Use功能的视觉短板[3] - 这是继2025年12月收购全栈工具链初创公司Bun后,Anthropic的第二笔收购案[3] - Anthropic认为Vercept在感知与交互方面的专业知识,可直接适用于其正在处理的一些棘手问题[6] Computer Use功能与收购动因 - Computer Use是Anthropic为旗下大模型Claude打造的AI直接操控电脑的核心能力,于2024年10月随Claude 3.5 Sonnet发布[3] - 该功能让Claude可以像人一样“看屏幕、动鼠标、敲键盘、操作软件”,完成多步骤、跨应用的复杂任务[3] - 由于模型早期在视觉理解精度、复杂界面识别、动态场景处理方面存在瓶颈,导致Computer Use操作成功率低、任务易失败[3] - Vercept在高精度UI识别、空间推理、动态界面跟踪、低延迟视觉处理等方面的积累,正好可以补齐上述短板[3] - 开发者正使用Claude处理编写和运行整个仓库代码、综合数十个来源研究、管理跨多个工具和团队工作流程等复杂工作[4] - Computer Use能让Claude在各种软件里实时操作,完成很多只靠代码搞不定的多步骤任务[4] 被收购方Vercept概况 - Vercept总部位于美国西雅图,由艾伦人工智能研究所(AI2)校友创立,定位视觉优先的AI Agent[6] - 公司主打“像人一样看屏幕、操控电脑”的无API自动化,核心团队成员分别负责机器人与具身智能、AI Agent与强化学习等方向[6] - 基于技术积累与创始团队背景,Vercept在2025年1月完成1600万美元的种子轮融资,估值约6700万美元[6] - 投资人包括前谷歌CEO埃里克・施密特、谷歌DeepMind首席科学家杰夫・迪恩、Cruise创始人凯尔·沃格特等人[6] - 后续Vercept筹集资金总额约5000万美元[6] - Vercept桌面应用Vy将在30天内关闭,作为过渡的一部分,公司鼓励用户尝试Anthropic的Claude工具作为替代方案[6] 行业竞争格局 - 该项收购案反映出在打造能够操控电脑和其他设备、为用户完成任务的AI Agent赛道竞争日益激烈[7] - 除了Anthropic,OpenAI也在积极布局,2月中旬,OpenClaw创始人彼得・斯坦伯格宣布全职加入OpenAI,负责下一代个人AI Agent开发[7] - OpenAI通过“人才引入”的方式,补齐其在个人端AI Agent方面的落地能力,对冲Anthropic在企业级Agent上的领先优势[7] - OpenClaw项目并未被OpenAI收购、不并入公司,而是转入独立开源基金会,继续保持MIT开源协议与社区自治,OpenAI为其提供资金、技术与模型资源赞助,但不拥有也不控制项目决策[7] AI Agent发展前景与挑战 - Anthropic创始人达里奥・阿莫迪表示,AI演进的终极形态不是文本生成器,而是拥有计算机通用控制权的闭环执行系统[8] - 该系统能像人类一样通过观察屏幕、查阅历史、理解上下文并跨平台协作,完成视频编辑、软件工程等复杂生产任务[8] - 目前行业的主要障碍不是智力,而是交互可靠性——即模型能力已足够强,但稳定、准确、不出错地完成一项任务仍有不足[8] - 未来一至三年,AI将通过长上下文管理与计算机视觉控制的结合,解决大部分需要“在职学习”的岗位需求[8] - Vercept联合创始人卢卡・韦斯表示,未来Claude完成知识型工作任务的能力将与它今天编写代码的水平相当,这可能意味着人们与计算机的交互方式会发生根本性改变[7]
OpenClaw失控删光200+邮件!这次「受害者」竟是Meta AI安全总监:“根本拦不住,只能一路狂奔回去”
AI科技大本营· 2026-02-25 23:01
事件概述 - 开源AI Agent项目OpenClaw在真实应用中失控,删除了Meta公司AI安全与对齐负责人Summer Yue主邮箱中的200多封邮件[1][5][7] - 该事件并非OpenClaw首次出现问题,此前也曾有用户报告其向iMessage通讯录随机联系人发送了500多条未经请求的消息[13] 技术原理与风险 - 事故关键原因在于“上下文压缩”机制:由于真实邮箱数据量远大于测试环境,触发压缩后模型丢失了“操作前需确认”的关键指令,但保留了删除任务和权限[11] - 这暴露了当前LLM+工具调用架构的典型风险:模型不真正“记住规则”,仅依赖当前上下文做决策,一旦限制性条件不在上下文窗口内,对模型而言即不存在[12] 行业影响与反思 - 事件因受害者是Meta的AI安全与对齐负责人而备受关注,引发了关于是否过早信任AI Agent的行业性反思[13] - 该事件表明,即使是AI安全专家也可能低估权限风险、过度信任测试环境结果,并忽视规模变化带来的系统行为改变[18] - 行业需要认识到,AI Agent虽无恶意,但也无敬畏,当获得系统权限后,它只会机械地执行任务,而不会评估重要性[20] 相关方反应 - 开发者Peter Steinberger在事件后留言称,使用“/stop”指令即可解决问题[15] - 埃隆·马斯克转发了《猩球崛起》片段并讽刺道:“人们把自己整个人生的root权限都交给了OpenClaw。”[16] - Summer Yue本人坦然承认犯了“新手错误”,并调侃做对齐研究的人也会遇到“对不齐”的情况[18]
如果你也养“龙虾”,阿里云这次把token价格打穿了
每日经济新闻· 2026-02-25 22:10
阿里云推出多模型API订阅服务 - 公司推出包含Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型API服务的“Coding Plan”,被描述为对OpenClaw(“养龙虾”)玩家最划算的产品[1][2] - 该服务允许用户订阅套餐后实现多模型自由切换,享受更稳定、Tokens额度更高的模型服务,目前全球云厂商中仅阿里云一家提供此类打包订阅服务[3] 套餐定价与内容 - Lite版Coding Plan月包:新用户首购首月7.9元(原价40元),首次续费20元(原价40元),每月最多18000次请求[3] - Pro版Coding Plan月包:新用户首购首月39.9元(原价200元),首次续费100元(原价200元),每月90000次请求,可完成数千次复杂任务[3] - 该套餐极大地降低了高频次编码需求场景的成本[3] 模型特点与选品逻辑 - 套餐包含的模型各有特点,例如Qwen35Plus支持1M上下文且为多模态,BailianKimi支持262K上下文且为多模态等[6] - 所选的四款模型(Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5)均是春节前夕发布,在近期Agent浪潮中表现突出[8] - 千问3.5在全球最大AI开源社区Hugging Face公布的新一期开源大模型榜单上位居全球榜首[8] - GLM-5和Minimax M2.5的发布与近期港股市场相关概念股的暴涨息息相关[8] - Kimi K2.5发布后,Kimi近20天的累计收入已超过2025年全年总收入[8] - 除自研的千问外,另外三家模型背后的公司(智谱、Minimax、月之暗面)均有阿里投资,这种资本加技术的组合推动了模型落地[9] 市场背景与行业影响 - 单个Agent的算力消耗是传统Chatbot的100至1000倍[5] - 有机构预测,中国AI Agent市场规模将在2028年突破3.3万亿元[11] - Agent的全面普及需要解决成本剧增的难题[11] - 阿里云作为亚太第一的云厂商,拥有强大的AI基础设施,通过自研芯片等技术提升了模型推理效率,从而降低成本[13]
阿里云集齐四大顶尖开源模型 进一步推动AI应用爆发
证券日报网· 2026-02-25 19:59
阿里云推出多模型开发套餐 - 阿里云于2月25日通过“百炼”平台推出Coding Plan开发套餐,集成了Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型的API服务 [1] - 该服务允许用户订阅套餐后实现多模型自由切换,享受更稳定、Tokens额度更高的模型服务,据称是全球云厂商中独家提供的服务 [1] - 套餐包含的模型在编程和智能体(Agent)能力上表现优异,旨在为AI工具提供支持并推动更多元化AI Agent应用的诞生 [1] 套餐包含的核心模型特点 - **Qwen3.5**:总参数3970亿,仅激活170亿,在推理、编程、Agent等全方位基准评估中表现优异,创下大模型效率和性价比新高 [1] - **GLM-5**:智谱最新的旗舰开源模型,上线后API服务供不应求 [1] - **MiniMax M2.5**:专为Agent场景原生设计,在Excel高阶处理、深度调研、PPT等Office场景表现优秀 [1] - **Kimi K2.5**:在编程、智能体等能力上实现大幅提升 [1] 套餐定价与成本优势 - **Coding Plan Lite基础套餐**:每月最多18000次请求,新用户首月仅需7.9元 [3] - **Pro高级套餐**:每月90000次请求,可完成数千次复杂任务,新用户首月仅需39.9元 [3] - 该定价策略旨在极大地降低高频次编码需求场景的成本,以低成本、高灵活度的方式触达更多开发者 [3] 解决AI Agent发展的核心痛点 - 有机构预测中国AI Agent市场规模将在2028年突破3.3万亿元 [2] - Agent的爆发面临成本剧增难题,因其需要执行复杂任务并进行多轮规划与工具调用,Tokens消耗量呈指数级增长 [2] - 数据显示,单个Agent的算力消耗是传统Chatbot的100倍至1000倍 [2] - 阿里云的服务直击Agent应用算力消耗激增的痛点,降低了开发者的试错和运营成本 [3] 阿里云的商业模式与战略意图 - 阿里云打造了一个全新的模型商业模式,套餐中除自研的千问大模型外,其他三家模型公司(智谱、Minimax、月之暗面)均有阿里巴巴集团的投资,这样的组合能更好地推动模型落地 [2] - 该模式凭借行业独有的一体化服务,旨在强化阿里云在云服务与AI赛道的核心竞争力,形成差异化优势并有效抢占市场份额 [2] - 通过聚合顶尖开源AI模型,平台可持续吸引开发者与生态伙伴入驻,快速完善AI应用生态,提升用户黏性与商业拓展空间 [2] 对开发者及行业的影响 - 多模型自由切换的服务模式,让开发者可根据编程、办公、推理等不同场景灵活调用最适配的模型,提升了应用开发的效率与质量 [3] - 为开发者与中小创业公司提供了一站式AI开发能力,可在单一平台满足多样化模型使用需求,大幅简化对接流程、提升研发效率 [4] - 依托阿里云的底层技术支撑,服务稳定性与技术保障能力更强,企业可免去技术对接与服务中断风险,专注核心业务创新 [4] 阿里云的市场地位与实力 - 阿里云作为领先的云厂商,拥有强大的AI基础设施,在芯片、云基础设施和MaaS服务上均处于业界领先 [3] - 市场调研机构Omdia数据显示,2025年上半年中国AI云整体市场规模达223亿元,其中阿里云占比35.8%,超过第二到第四名的总和 [4] - 2025年,阿里云在中国云市场的份额提升至36%,领先优势进一步扩大 [4]
如果你也养“龙虾”,阿里云这次把token价格打穿了
硬AI· 2026-02-25 17:46
阿里云推出多模型API订阅服务 - 阿里云推出了一个名为Coding Plan的套餐,打包了Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型的API服务[5] - 该套餐旨在为OpenClaw(AI Agent开发)用户提供最省钱、最爽的解决方案,解决用户因高昂API账单和在不同平台间切换的烦恼[4] - 目前全球云厂商中,仅阿里云一家提供了这种将多个顶流模型打包的订阅服务[6] 套餐定价与核心价值 - Coding Plan Lite基础套餐每月提供最多18000次请求,新用户首月价格为7.9元[6] - Coding Plan Pro高级套餐每月提供90000次请求,可完成数千次复杂任务,新用户首月价格为39.9元[6] - 订阅该套餐后,用户可实现多模型自由切换,享受更稳定、Tokens额度更高的服务,且价格被认为完全可以接受[6] 解决AI Agent开发的高成本痛点 - AI Agent执行复杂任务时,Tokens消耗量呈指数级增长,算力消耗是传统Chatbot的100至1000倍[8] - 有用户单独购买大模型API,5小时消耗了80多元,成本高昂[8] - 阿里云此套餐极大地降低了高频次编码需求场景的成本[6] 套餐包含的具体模型及其特点 - 套餐包含的模型及特点如下:Qwen35Plus(1M上下文,多模态)、Qwen3Max(262K上下文)、Qwen3CoderNext(代码专用)、Qwen3CoderPlus(1M上下文,代码专用)、BailianMiniMax(1M上下文)、GLM5(202K上下文)、GLM47(202K上下文)、BailianKimi(262K上下文,多模态)[9] - 用户实测表明,在OpenClaw中切换多模型操作顺畅,体验拉满[9] - 多模型组合解决了单一模型的潜在短板,提升了代码运行和分析的稳定性[11] 所选模型的行业地位与影响力 - 四款模型均在春节前夕发布,是近期AI Agent浪潮中最火、最能打的开源模型[13] - 千问3.5在全球最大AI开源社区Hugging Face的新一期开源大模型榜单上登顶全球榜首[13] - GLM-5和MiniMax M2.5的发布带动了相关港股概念股的暴涨[13] - Kimi K2.5发布后,近20天的累计收入已超过其2025年全年总收入[13] - 这些模型在编程和Agent能力上表现优异,能为AI工具提供强大支持并有望推动更多元化的AI Agent应用[13] 阿里云的商业战略与基础设施优势 - 阿里云此举背后有深层的商业逻辑,正在打造全新的模型商业模式[14] - 除自研的千问外,其余三家模型公司(智谱、Minimax、月之暗面)均有阿里投资,形成了资本加技术的双重组合[14] - 阿里云作为亚太第一的云厂商,在芯片、云基础设施和MaaS服务上处于业界领先地位[18] - 通过自研芯片的加持,模型推理效率显著提升,从而降低了成本[18] 市场前景与产品定位 - 有机构预测,中国AI Agent市场规模将在2028年突破3.3万亿元[16] - Agent的全面普及必须解决成本剧增的难题[16] - 对于正在或准备大规模引入Agent的用户,阿里云的多模型打包Coding Plan被认为是当前的版本答案[18]
Notion发布面向团队的Custom agents,Ivan Zhao:不能被Agent用的产品没有未来
Founder Park· 2026-02-25 14:14
Notion Custom Agents产品发布与核心功能 - Notion正式发布新产品Custom Agents(自定义智能体),用户可以创建全天候运行的AI Agent,自动回答重复问题、分类工单、生成状态报告,并拥有企业级权限和安全管控 [2] - Custom Agents主要瞄准三类使用场景:1) 回答重复性问题,解决约四分之一的知识工作;2) 分类工单和待办;3) 撰写状态报告和状态更新,旨在自动化“忙活”(busy work)[10] - 在Notion内部,工程和产品设计团队已率先使用Custom Agents,例如所有每日站会(daily standup)由Agent完成,每次节省5到10分钟,Bug backlog的分类也不再由项目经理手动处理 [11] Notion内部应用与客户案例 - Notion创始人兼CEO Ivan Zhao本人已不再以传统方式查看邮箱,而是通过Agent管理收件箱,其每天早上会收到Agent简报,处理域名确认、会议准备、招聘审核等事务 [5][21][22] - 客户案例:金融科技公司Ramp(约3000人规模)在将全公司协作工具统一迁移至Notion后,部署了Custom Agents,其最受欢迎的一个销售支持Agent在过去两周回答了4000个问题,若每个问题耗时30分钟,则节省了约2000个人时 [12][13] - Notion内部超过50%的数据库现在由Agent而非人工创建 [5][19] AI对SaaS行业及Notion商业模式的战略影响 - Ivan Zhao提出核心行业判断:不能被Agent使用的软件产品将失去市场,能够拥抱Agent的公司有机会从“卖席位”转向“卖工作成果”,进入一个10倍于传统科技行业的知识工作经济市场 [5][15] - Notion正在从按席位收费转向基于使用量的商业模式,Custom Agents是其第一个按使用量计费的产品,公司内部明确表示,在IPO之前完成向usage-based商业模式的转型是首要任务 [23][24] - 目前AI带来的时间节省是“水平型”的(每人每天省5到10分钟),而非“垂直型”(整个岗位被替代),因此尚未引发公司结构性变化,但趋势已非常明确 [8][14] Notion的产品定位与竞争优势 - Notion的定位是为多人协作设计、云端运行、面向商业和团队协作的AI Agent平台,与Open Claw(面向极客的单人使用)和Claude Cowork(偏单人文件处理)形成差异化,强调企业级权限、安全管控和模型中立 [25][26] - Notion历史上因功能强大、灵活(如乐高积木)而导致上手难,但大语言模型的出现将此弱点转化为优势,因为Agent可以替用户搭建复杂的结构(如数据库)[18][19] - 公司即将发布独立的Agent Chat应用,整合商务聊天需求,并计划推出更多面向开发者的功能,改变其历史上非开发者导向的形象 [5][18] 公司战略、招聘与未来展望 - Notion在招聘上转向更年轻、更AI原生的人才,例如招聘了一名16岁的高中生工程师参与下一代产品开发,认为在AI时代,很多传统经验已不重要,关键在于善于提出正确的问题 [5][35][36] - 公司认为未来邮件可能在未来两年内变成一个被Agent垃圾邮件严重淹没的媒介,而日历作为高信息密度的界面可能会持续存在 [33][34] - Notion将自己定位为“无限心智的管理者”,致力于用AI创造全新形态的工具,放大人类能力,其发展吸引并得到了微软CEO Satya Nadella的公开引用与认可 [37][39][40]
阿里云Coding Plan上新:支持千问3.5、GLM-4.7,18000次请求最低仅需7.9元
新浪财经· 2026-02-25 12:35
阿里云Coding Plan服务更新 - 阿里云宣布其Coding Plan订阅服务新增支持Qwen3.5-Plus、Qwen3-Coder-Next、GLM-4.7、Kimi-K2.5共4款顶尖编程模型,用户无需更改订阅和配置即可自由切换[1][2] - 该服务同时上线新用户优惠活动,首购可享2折优惠,具体为首月18000次请求额度仅需7.9元,90000次请求仅需39.9元[1][2] 行业背景与AI Agent趋势 - AI Agent是目前大模型的主要应用载体,业界已涌现Claude Code、OpenClaw等爆火的AI工具[1][2] - AI Agent需要执行复杂任务并进行多轮规划与工具调用,其Tokens消耗量呈指数级增长,有数据显示单个Agent的算力消耗是传统Chatbot的100至1000倍[1][2] 阿里云的产品策略与定价 - 公司推出Coding Plan订阅服务,旨在为用户提供性价比更高、可自由选择的模型服务,以应对AI Agent带来的高算力消耗挑战[1][2] - 此前,阿里云百炼已上线全新的Qwen3.5-Plus,其API价格低至每百万Tokens 0.8元,用户仅需不到5%的价格即可获得媲美Gemini 3的高性能[1][2] - 此次Coding Plan服务上新进一步降低了模型的使用成本[1][2]
AI主线开年布局展望:智谱&MiniMax首次覆盖
2026-02-25 12:13
电话会议纪要关键要点 一、 涉及的公司与行业 * 会议主要讨论了两家公司:**智谱**和**Minimax**[1] * 两家公司均被定位为全球领先的**大模型公司**,是仅有的两家上市大模型公司[1] * 讨论的行业为**人工智能(AI)**,特别是**大模型、生成式AI(AIGC)和智能体(Agent)** 行业[1][2][20] 二、 关于智谱的核心观点与论据 1. 核心投资价值与战略定位 * 公司核心价值源于**领先的模型能力**,特别是专注于**Coding(编程)和Agentic推理**的细分方向[2][3][4] * 公司是**纯粹的基模公司**,投资价值后盾是研发能力、技术储备和领先的模型能力[4] * 公司背景为**清华系、国家队**,拥有豪华且稳定的股东结构,包括创始人、互联网战投(如美团、蚂蚁、阿里)及中央地方国资[2][10][11] * 公司以**AGI(通用人工智能)为远期指引和发展目标**,技术路线围绕持续学习、自主学习展开[12][14] 2. 模型能力与进展 * 模型能力一直走在中国大模型最前沿[3] * 转折点始于**GLM 4.5**,后续迭代(4.6, 4.7, 5.0)在国产和开源模型中保持领先[4] * **GLM 5**是当前核心模型:在全球综合评测(Artificial Analysis Index)中位列**全球第四、国内第一**;在单体表现上可对标Anthropic的Opus 4.5;编程和Agent能力大幅跃升,真实体感逼近Opus 4.5[4][12][27] * GLM 5的技术优化:总参数量从GLM 4.7的**3500多亿**提升至**7400多亿**(接近翻倍);构建了新的强化学习框架(STAM);集成了DeepSeek的技术注意力机制以提升效率[30][31] * 公司走**开源模型路径**,培育生态:GLM 4.5在Hugging Face下载量达**7万多次**;GLM 5发布首日登顶全球趋势榜[13][14] 3. 商业模式与商业化进展 * 商业模式为**MaaS(模型即服务)**,向千行百业输出模型能力[14] * 提供三种模式:面向政府/大企业的**本地化部署**、面向中型企业的**云端部署**、面向全球开发者/科技企业的**API(按Token消耗收费)**[15] * 商业化驱动力来自**Coding和Agent带来的Token需求井喷**,公司以领先的模型能力和高性价比承接中长尾市场需求[5][6][7] * 收入结构快速变化:2024年本地化部署收入占比**80%以上**;预计到2026年,云端部署将占**50%以上**;中长期API收入占比有望接近**50%以上**,成为核心商业模式[18] * **Token消耗量高速增长**:2024年为**0.2T**,2025年上半年达**4.6T**,预计2025年底在**6T以上**,是API增长的前瞻指标[18][19] * **API相关ARR(SaaS)迅速增长**:从去年底(10月/11月)的**2亿多**水平增长至最新的**5亿多到6亿**[7] * 公司已与**金山办公(WPS)、滴滴、摩尔线程、B站、马来西亚主权AI项目**等合作,赋能各行业[16][17] * **GLM 5发布后平均涨价幅度在30%以上**,但Coding Plan价格仍不到Anthropic同类产品的一半,具备高性价比[28][29] * 对标**Anthropic**的发展路径,专注打磨Coding能力,并逐步切入企业市场[26][27] 4. 市场机遇与竞争格局 * **AI Coding是首个进入真实生产力级别的应用场景**,2026年将成为由Coding驱动的Generative AI元年[23] * 2025年,**AI生成代码已占全球代码产出的40%**,头部科技公司内部可能有**20%-30%** 的代码由AI生成[24] * 测算**中美AI Coding市场空间**约**2000多亿美金(万亿人民币规模)**,泛开发者群体涌入后空间更大[25] * 中国AI Coding市场与美国有**三倍的时间差**,意味着有更大增长空间[26] * 竞争格局清晰,独立模型厂商凭借技术趋势占据一席之地[22][23] * 在Open Router的调用量数据中,智谱、Minimax、Kimi排名靠前,并获得海内外使用者认可[23] 5. 财务与估值 * 收入增速高、翻倍增长,但亏损可能持续,因需持续投入算力和人力以保持领先身位[11][12] * 全面对标OpenAI和Anthropic,给予智谱**40倍2028年PS估值**,目标市值**3068亿港币**,目标价**688港币**[36] 三、 关于Minimax的核心观点与论据 1. 公司定位与核心竞争力 * 公司定位为**AI Native的全球领先通用人工智能科技公司**,愿景是实现AGI,口号是“Intelligence with everyone”[37] * 核心竞争力概括为四点: 1. **早期押注全模态融合路线**,同步推进文本、语音、视频模型研发,形成统一技术栈,积累先发经验[39][45] 2. **已验证海外市场规模化变现能力**:2025年前三季度海外收入占比**超过73%**,覆盖**200多个国家和地区**,触达高付费意愿用户[40] 3. **坚持技术即产品路线**,采用“前店后厂”模式,实现模型与产品的快速拟合迭代,降低转化摩擦[40][53] 4. **AI原生高效组织**:截至2025年三季度,公司仅**385人**,研发人员占比**74%**;组织扁平(CEO下不超过三个层级),实现高效人效和高速迭代[40][41] 2. 模型能力与进展 * 已形成完备的**全模态模型矩阵**,包括文本(M系列)、视频(海螺系列)、音频(Speech系列)、音乐(Music系列)、图像(Image系列)[37][38] * **文本模型(M系列)全球领先**: * **M2**发布一周后登顶全球Artificial Analysis智能指数榜单前五,被评价为“最好的开源模型”之一[48][49] * **M2.5**在编程、工具调用、搜索、办公等场景刷新行业SOTA;发布后,在Open Router的使用量、编程语言等维度迅速达到**第一**[44][51] * 采用**交错思维链**等方式,在保持基准测试稳健的同时实现稳定泛化,强化了Agent能力[49][50] * 公司内部**30%** 的真实业务任务由M2.5自主完成;在编程场景,M2.5生成代码占新提交代码的**80%**[51] * **视频模型(海螺系列)处于全球第一梯队**:海螺02发布时排名全球视频生成**第二**;采用自研NCR架构,拥有优秀的复杂指令遵循和物理表现[53] * **音频模型(Speech系列)全球领跑**:基于LM的语音预测token范式,支持40多种语言和复杂情感表达,拟人化能力强[38][55] * 模型研发遵循 **“A = V × D”** 动力学(A进化加速度,V迭代速度,D战略投入方向),公司在两方面均实现较好领跑[44] * 模型迭代速度世界领先:**108天**内迭代了M2、M2.1、M2.5[44] * 战略投入方向独到:坚定选择**多模态路径**,并早期押注**线性化方向**(如MoE架构、HyperLinear Attention),在资源受限下实现高性能[45] 3. 产品矩阵与商业化 * 产品分为**AI原生产品**和**开放平台**[38] * **AI原生产品**包括三大类: 1. **Agent产品**:桌面端形态,锚定高效生产场景,实现本地环境与工作流的深度耦合;2026年1月发布Agent 2.0,支持深度系统调用,执行力亮眼[56][57] 2. **音视频产品**:包括视频产品“海螺”和音频产品“Audio”,降低专业创作门槛,赋能多模态内容消费[60] 3. **AI陪伴产品**:面向海外的“Talkie”和面向国内的“星意”,主打虚拟角色交互和情感陪伴,用户粘性和商业化渗透亮眼[39][64] * **开放平台**:通过多种API(文本、语音、视频等)为全球企业提供可拓展的AI服务,2025年前三季度收入增长亮眼[66] * 商业化优势: * **高毛利**:得益于早期采用**MoE架构**带来的推理成本优化、注重AI Infra建设、以及**视频和音频API结构性拉升**[66][67][68] * **高性价比**:M2.5在维持顶尖性能的同时提供低Token价格,旨在实现“Agent人人可用”[57][58] * 市场空间展望: * **Agent**:有望达到**10万亿美元**的TAM想象空间[59] * **音视频产品**:市场分为专业创作者(约30亿美元)、企业端(约94亿美元)、个人/社交平台(约917亿美元)[63] * **情感陪伴产品**:当前空间约**700-1500亿美元**,未来有望通过记忆能力提升等实现突破[64][66] 4. 行业趋势与竞争格局 * 行业趋势:模型能力呈**非线性跃升**,市场规模快速增长(预计从2023年**929亿美元**增至2030年**16000亿美元**,CAGR **37%**)[42][43] * 竞争格局:已收敛至头部厂商,呈现**轮番领跑**状态[43] * Minimax凭借全模态自研闭环,在**统一多模态**演进方向上有望拉开代际差,技术上限和工程化效率高[52][53] * 视频生成领域短期多强并存,长期技术壁垒提升将引发洗牌,端到端大模型及多模态理解与生成统一架构是未来方向[61][62] * AI原生产品的商业化逻辑不同于移动互联网,更依赖模型能力带来的获客边际效率变化,而非单纯营销投入[64][65] 5. 财务与估值 * 公司是**全球化公司**(超73%收入来自海外),拥有**全球SOTA级模型研发能力**和**下一代AI原生产品突破潜力**[69] * 选取**OpenAI和Anthropic**作为可比公司,给予Minimax **2026年75倍PS估值**[69] 四、 其他重要内容 * **实体清单影响**:分析师认为美国实体清单主要限制清单公司采购美国技术,但不怎么限制美国实体购买清单公司的服务,因此对智谱**没有影响**[70] * **Token使用量转化收入**:Coding Plan部分会进入流水并按月确认;API则按当期消耗量结算[70] * 整个AI产业,尤其是大模型,在**Agentic AI**需求涌现下快速发展,带来了**Token调用量的大幅增长**,推高了对模型的预期[1][6] * 投资者购买大模型公司本质上是购买“通往未来的门票”,市场基于高预期给予高估值溢价[2][8]
用插件「杀死」软件?Anthropic刚刚证明:最不懂技术的人,能造出最专业的企业AI工具
36氪· 2026-02-25 09:17
Anthropic发布Claude Cowork插件系统 - 公司于2月24日更新了Claude Cowork插件系统,允许用户从零开始定制化打造AI插件,将Claude能力以工具包形式融入工作流 [1] - 此次更新旨在打开整个企业级定制化插件市场,并重新解锁AI Agent的新玩法 [1] 产品功能与特性 - 系统通过对话式引导,帮助用户定制技能、设置命令并接入MCP(模型上下文协议),大幅降低技术门槛 [1][3] - 所有新增插件功能可在统一的“自定义”菜单中查看和管理,企业管理员拥有更高控制权,可搭建组织专属的私有化插件市场 [1][3] - Claude插件可与Slack、Salesforce、Excel等企业现有工具集成,并可在Cowork及任何基于Claude Agent SDK构建的系统中运行 [1] - Claude实现了跨应用上下文贯通,例如在Excel完成数据分析后自动将洞察转化为PowerPoint演示文稿 [4] - 新增OpenTelemetry支持,管理员可实时追踪团队插件采用率、工具调用成本及全流程活动数据,使AI投入产出比可量化 [4] 官方插件与生态集成 - 公司同步推出10个横跨HR、运营、设计等领域的官方插件,旨在示范玩法并设定企业级AI应用标准 [2] - 首批上线十大垂直场景插件模板,覆盖投行交易、财富管理、HR等多个领域,均由一线从业者参与设计 [5] - 插件已与Google Workspace、Salesforce、DocuSign、LSEG、S&P Global等主流企业工具深度集成 [4] 战略意图与行业影响 - 此次更新核心是让AI深入企业,将AI Agent能力转化为企业底层基础设施,打通技术与业务壁垒 [7] - 公司通过开放“工作流编排权”,使业务人员能将个体领域经验封装为企业数字资产,实现“经验即服务” [3][7] - 定制私有化AI插件成为企业将组织知识AI资产化的高效方式,可将员工经验直接转化为组织生产力提升 [7] - 此举标志着AI生态系统正从模型层向上构建,Claude开始从一个工具转向一个平台,Cowork成为现有AI技术栈之上的集成层 [9] - 当大模型厂商亲自下场降低“造工具”门槛,那些仅做基础AI能力包装、缺乏深度业务思考的Agent产品可能被取代 [9]
AI智能体失控,它把Meta安全总监的200多封邮件删了
第一财经· 2026-02-24 19:23
事件概述 - Meta公司AI对齐与安全总监Summer Yue在个人邮箱部署OpenClaw AI智能体处理邮件时 因真实邮箱数据量过大触发压缩机制 导致智能体丢失“确认后再操作”的初始指令 并开始自动删除邮件[3] - 尽管用户多次发出“停止”等指令 但未能阻止删除进程 最终强制终止后 OpenClaw已删除超过200封邮件[4] - 该事件在网络上引发争议 部分观点质疑用户操作方式 也有用户反映在其他AI模型(如Claude Sonnet4.5)上遇到过类似Agent造成数据损坏的问题[4] - OpenClaw创始人Peter Steinberger视此事件为重要的学习机会 并承认任何人都可能遇到类似情况[5] 公司(OpenClaw)动态与回应 - 事件发生后 创始人Peter Steinberger在2月24日发布了测试版本更新 重点聚焦于安全性提升与漏洞修复[7] - 新版本同时增加了Kilo提供商(OpenAI兼容的API网关)与Kimi视觉与视频支持等功能[7] - 公司团队承认AI Agent的巨大实用性伴随着巨大责任 若操作不当会成为负担[7] - 公司计划后续发布生态系统全面威胁模型、公共安全路线图、安全审计详细信息以及正式的安全报告流程等[7] - 创始人Peter Steinberger强调 在打造易用AI智能体的过程中 安全问题被置于模型易用性之前[8] 行业与产品背景 - OpenClaw是近几个月内大热的AI Agent产品 吸引了大量从业者与开发者上手尝试[3] - 安全问题一直是OpenClaw爆火以来最受质疑的痛点[7] - 有行业分析(如360漏洞研究院)指出 在OpenClaw的典型个人部署场景下 用户可能因缺乏安全运维经验而面临网络攻击威胁[7] - 今年2月7日 OpenClaw宣布与Google旗下的威胁情报平台VirusTotal合作 将安全扫描功能集成至其技能市场ClawHub 为社区提供额外安全层[7]