Anthropic为Claude装上“眼睛”
36氪·2026-02-26 20:54

Anthropic的战略收购与产品布局 - Anthropic收购视觉优先AI智能体公司Vercept,旨在补齐其AI模型在视觉理解精度上的短板[2] - 此次收购是Anthropic继2024年12月收购编码代理引擎Bun后的第二笔公开收购,两笔收购均指向让Claude不仅能写代码,还能在各类软件中实时操作的目标[4] - Vercept产品Vy将于3月25日关闭,团队正式加盟Anthropic[4] Vercept的技术优势与团队背景 - Vercept脱胎于艾伦人工智能研究所,创始团队背景强大:CEO Kiana Ehsani曾负责AI2机器人与具身智能团队,联合创始人Luca Weihs深耕AI Agent与强化学习,Ross Girshick是计算机视觉领域的先驱人物[3] - 公司成立仅一年多,累计融资5000万美元,投资阵容包括前谷歌CEO施密特、DeepMind首席科学家杰夫•迪恩等[3] - 其产品Vy采用视觉优先方案,通过视觉模型理解屏幕元素再模拟鼠标键盘操作,能操控任何有屏幕的软件[3] - 在UI元素识别基准ScreenSpot v1上,其自研模型准确率高达92%,而OpenAI同类模型仅为18.3%[3] Anthropic的核心产品与市场表现 - Anthropic最核心的产品是Claude系列大语言模型,按能力分为三个层级:旗舰级Claude Opus系列、平衡性能与成本的Claude Sonnet系列、轻量级Claude Haiku系列[5][6] - 基于上述模型,公司开发了AI编程助手Claude Code和办公场景智能体Claude Cowork[6] - Anthropic的年化营收在2025年年底超过90亿美元,其中Claude Code的年化收入已达25亿美元[6] - 公司自成立以来累计融资额已超300亿美元,2026年2月完成300亿美元G轮融资后,投后估值飙升至3800亿美元,成为全球估值第二高的AI独角兽[5] Computer Use能力与模型性能进展 - Computer Use是Anthropic为Claude打造的核心能力,使其能直接操控电脑完成多步骤、跨应用的复杂任务,于2024年10月随Claude 3.5 Sonnet发布[2] - 在2024年底,Claude Sonnet模型在OSWorld评估中的准确率不足15%,而新一代Claude Sonnet 4.6模型准确率已提升至72.5%,在浏览复杂电子表格、跨标签页填写表单等任务上已接近人类水平[4] - Computer Use与Vercept的Vy均主打"像人一样看屏幕、操控电脑"的无API自动化,是公司进军AI智能体领域的关键一步[2]