Vy
搜索文档
Anthropic为Claude装上“眼睛”
36氪· 2026-02-26 20:54
Anthropic的战略收购与产品布局 - Anthropic收购视觉优先AI智能体公司Vercept,旨在补齐其AI模型在视觉理解精度上的短板[2] - 此次收购是Anthropic继2024年12月收购编码代理引擎Bun后的第二笔公开收购,两笔收购均指向让Claude不仅能写代码,还能在各类软件中实时操作的目标[4] - Vercept产品Vy将于3月25日关闭,团队正式加盟Anthropic[4] Vercept的技术优势与团队背景 - Vercept脱胎于艾伦人工智能研究所,创始团队背景强大:CEO Kiana Ehsani曾负责AI2机器人与具身智能团队,联合创始人Luca Weihs深耕AI Agent与强化学习,Ross Girshick是计算机视觉领域的先驱人物[3] - 公司成立仅一年多,累计融资5000万美元,投资阵容包括前谷歌CEO施密特、DeepMind首席科学家杰夫•迪恩等[3] - 其产品Vy采用视觉优先方案,通过视觉模型理解屏幕元素再模拟鼠标键盘操作,能操控任何有屏幕的软件[3] - 在UI元素识别基准ScreenSpot v1上,其自研模型准确率高达92%,而OpenAI同类模型仅为18.3%[3] Anthropic的核心产品与市场表现 - Anthropic最核心的产品是Claude系列大语言模型,按能力分为三个层级:旗舰级Claude Opus系列、平衡性能与成本的Claude Sonnet系列、轻量级Claude Haiku系列[5][6] - 基于上述模型,公司开发了AI编程助手Claude Code和办公场景智能体Claude Cowork[6] - Anthropic的年化营收在2025年年底超过90亿美元,其中Claude Code的年化收入已达25亿美元[6] - 公司自成立以来累计融资额已超300亿美元,2026年2月完成300亿美元G轮融资后,投后估值飙升至3800亿美元,成为全球估值第二高的AI独角兽[5] Computer Use能力与模型性能进展 - Computer Use是Anthropic为Claude打造的核心能力,使其能直接操控电脑完成多步骤、跨应用的复杂任务,于2024年10月随Claude 3.5 Sonnet发布[2] - 在2024年底,Claude Sonnet模型在OSWorld评估中的准确率不足15%,而新一代Claude Sonnet 4.6模型准确率已提升至72.5%,在浏览复杂电子表格、跨标签页填写表单等任务上已接近人类水平[4] - Computer Use与Vercept的Vy均主打"像人一样看屏幕、操控电脑"的无API自动化,是公司进军AI智能体领域的关键一步[2]
Anthropic收购 OpenAI抢人 “硅谷双强”打的什么算盘?
第一财经· 2026-02-26 12:57
公司战略与收购案 - Anthropic宣布收购视觉驱动计算机自动化AI初创公司Vercept,以补全其Computer Use功能的视觉短板 [3] - 这是继2025年12月收购全栈工具链初创公司Bun后,Anthropic的第二笔收购案 [3] - Vercept在高精度UI识别、空间推理、动态界面跟踪、低延迟视觉处理方面的积累,可解决Claude模型早期在视觉理解精度、复杂界面识别、动态场景处理方面的瓶颈,提升操作成功率 [3] 被收购方Vercept概况 - Vercept总部位于美国西雅图,由艾伦人工智能研究所(AI2)校友创立,定位为视觉优先的AI Agent [4] - 公司核心团队分别负责机器人与具身智能、AI Agent与强化学习等方向 [4] - Vercept在2025年1月完成1600万美元种子轮融资,估值约6700万美元 [4] - 后续Vercept筹集资金总额约5000万美元 [4] - Vercept的桌面应用Vy将在30天内关闭,用户被鼓励尝试Anthropic的Claude工具作为替代 [5] Computer Use功能与技术整合 - Computer Use是Anthropic为旗下大模型Claude打造的AI直接操控电脑的核心能力,于2024年10月随Claude 3.5 Sonnet发布 [3] - 该功能让Claude可以“看屏幕、动鼠标、敲键盘、操作软件”,完成多步骤、跨应用的复杂任务 [3] - Anthropic认为Vercept在感知与交互方面的专业知识,可直接适用于其正在处理的一些棘手问题 [5] - 开发者正使用Claude处理编写和运行整个仓库的代码、综合数十个来源的研究、管理跨多个工具和团队的工作流程等复杂工作 [4] 行业竞争格局 - Anthropic与OpenAI在打造能够操控电脑为用户完成任务的AI Agent赛道竞争日益激烈 [6] - OpenAI通过“人才引入”方式,吸纳OpenClaw创始人彼得·斯坦伯格全职加入,负责下一代个人AI Agent开发,以对冲Anthropic在企业级Agent上的领先优势 [6] - OpenAI为OpenClaw项目提供资金、技术与模型资源赞助,但项目保持独立开源,不并入公司 [6] 行业前景与公司愿景 - Anthropic创始人认为,AI演进的终极形态是拥有计算机通用控制权的闭环执行系统,而非文本生成器 [7] - 当前行业主要障碍是交互可靠性,即稳定、准确、不出错地完成任务的能力仍有不足,而非智力 [7] - 未来一至三年,AI将通过长上下文管理与计算机视觉控制的结合,解决大部分需要“在职学习”的岗位需求 [7] - Vercept联合创始人认为,Claude完成知识型工作任务的能力将与其当前编写代码的水平相当,可能根本性改变人机交互方式 [6]
速递|Anthropic买下被Meta挖角联合创始人的旧部,人机交互AI初创Vercept
Z Potentials· 2026-02-26 12:15
核心交易事件 - 人工智能公司Anthropic于周三宣布收购AI初创公司Vercept [1] - 这是Anthropic继去年12月收购编程智能体引擎Bun之后的最新收购动作,旨在推动其Claude Code产品的规模化发展 [1] - Vercept的产品Vy是一款云端计算机使用Agent,能够远程操作苹果MacBook,其团队专注于为人工智能时代重新构想个人电脑 [1] - 交易完成后,Vercept将终止运营其产品,Anthropic公司将于3月25日正式关闭该产品线 [1] 交易团队与人员动向 - Vercept的三位联合创始人Ehsani、Luca Weihs和Ross Girshick将随团队并入Anthropic [2] - 并非所有联合创始人都将加入,其中一位联合创始人马特·戴特克去年以2.5亿美元薪酬加入Meta的超级智能实验室 [1] - 另一位联合创始人及投资人奥伦·埃齐奥尼(艾伦人工智能研究所创始负责人)不会加入Anthropic,并对此次交易公开表达了失望 [2] - Vercept毕业于西雅图专注于人工智能的孵化器A12,该机构源自艾伦人工智能研究所,其联合创始人也与艾伦研究所有深厚渊源 [1] 投资者背景与争议 - Vercept的天使投资人阵容包括谷歌前CEO埃里克·施密特、谷歌DeepMind首席科学家杰夫·迪恩、Cruise创始人凯尔·沃格特以及Dropbox联合创始人阿拉什·费尔多西 [2] - 联合创始人埃齐奥尼在领英上指责主要投资者Bannon应对Vercept未能聘请合适的商业人才“负部分责任” [3] - 投资者Bannon随后在领英上谴责埃齐奥尼的言论,称其贬低了创始人的工作,双方还互相指责对方存在撒谎和法律威胁 [3] - 尽管投资者公开争吵,但背景动机是争夺下一个大型AI赢家的赌注极高 [3] 交易影响与各方态度 - 交易条款未公开,但投资人埃齐奥尼表示他已获得投资回报,不过仍对初创公司运营仅一年多就放弃努力感到失望 [4] - Anthropic对获得这些研究人员表现出强烈兴趣,尤其考虑到其中一位已加入Meta [4] - 将加入Anthropic的联合创始人兼首席执行官Ehsani表示,加入Anthropic是为了与卓越团队携手,加速将愿景变为现实,这个决定“轻而易举” [4]
Anthropic收购,OpenAI抢人,“硅谷双强”打的什么算盘?
第一财经资讯· 2026-02-26 11:29
公司战略与收购案 - 美国AI头部公司Anthropic宣布收购视觉驱动计算机自动化AI初创公司Vercept,以补全其Computer Use功能的视觉短板[3] - 这是继2025年12月收购全栈工具链初创公司Bun后,Anthropic的第二笔收购案[3] - Anthropic认为Vercept在感知与交互方面的专业知识,可直接适用于其正在处理的一些棘手问题[6] Computer Use功能与收购动因 - Computer Use是Anthropic为旗下大模型Claude打造的AI直接操控电脑的核心能力,于2024年10月随Claude 3.5 Sonnet发布[3] - 该功能让Claude可以像人一样“看屏幕、动鼠标、敲键盘、操作软件”,完成多步骤、跨应用的复杂任务[3] - 由于模型早期在视觉理解精度、复杂界面识别、动态场景处理方面存在瓶颈,导致Computer Use操作成功率低、任务易失败[3] - Vercept在高精度UI识别、空间推理、动态界面跟踪、低延迟视觉处理等方面的积累,正好可以补齐上述短板[3] - 开发者正使用Claude处理编写和运行整个仓库代码、综合数十个来源研究、管理跨多个工具和团队工作流程等复杂工作[4] - Computer Use能让Claude在各种软件里实时操作,完成很多只靠代码搞不定的多步骤任务[4] 被收购方Vercept概况 - Vercept总部位于美国西雅图,由艾伦人工智能研究所(AI2)校友创立,定位视觉优先的AI Agent[6] - 公司主打“像人一样看屏幕、操控电脑”的无API自动化,核心团队成员分别负责机器人与具身智能、AI Agent与强化学习等方向[6] - 基于技术积累与创始团队背景,Vercept在2025年1月完成1600万美元的种子轮融资,估值约6700万美元[6] - 投资人包括前谷歌CEO埃里克・施密特、谷歌DeepMind首席科学家杰夫・迪恩、Cruise创始人凯尔·沃格特等人[6] - 后续Vercept筹集资金总额约5000万美元[6] - Vercept桌面应用Vy将在30天内关闭,作为过渡的一部分,公司鼓励用户尝试Anthropic的Claude工具作为替代方案[6] 行业竞争格局 - 该项收购案反映出在打造能够操控电脑和其他设备、为用户完成任务的AI Agent赛道竞争日益激烈[7] - 除了Anthropic,OpenAI也在积极布局,2月中旬,OpenClaw创始人彼得・斯坦伯格宣布全职加入OpenAI,负责下一代个人AI Agent开发[7] - OpenAI通过“人才引入”的方式,补齐其在个人端AI Agent方面的落地能力,对冲Anthropic在企业级Agent上的领先优势[7] - OpenClaw项目并未被OpenAI收购、不并入公司,而是转入独立开源基金会,继续保持MIT开源协议与社区自治,OpenAI为其提供资金、技术与模型资源赞助,但不拥有也不控制项目决策[7] AI Agent发展前景与挑战 - Anthropic创始人达里奥・阿莫迪表示,AI演进的终极形态不是文本生成器,而是拥有计算机通用控制权的闭环执行系统[8] - 该系统能像人类一样通过观察屏幕、查阅历史、理解上下文并跨平台协作,完成视频编辑、软件工程等复杂生产任务[8] - 目前行业的主要障碍不是智力,而是交互可靠性——即模型能力已足够强,但稳定、准确、不出错地完成一项任务仍有不足[8] - 未来一至三年,AI将通过长上下文管理与计算机视觉控制的结合,解决大部分需要“在职学习”的岗位需求[8] - Vercept联合创始人卢卡・韦斯表示,未来Claude完成知识型工作任务的能力将与它今天编写代码的水平相当,这可能意味着人们与计算机的交互方式会发生根本性改变[7]