Anthropic为Claude装上“眼睛”

Anthropic的战略收购与产品布局 - Anthropic收购视觉优先AI智能体公司Vercept，旨在补齐其AI模型在视觉理解精度上的短板[2] - 此次收购是Anthropic继2024年12月收购编码代理引擎Bun后的第二笔公开收购，两笔收购均指向让Claude不仅能写代码，还能在各类软件中实时操作的目标[4] - Vercept产品Vy将于3月25日关闭，团队正式加盟Anthropic[4] Vercept的技术优势与团队背景 - Vercept脱胎于艾伦人工智能研究所，创始团队背景强大：CEO Kiana Ehsani曾负责AI2机器人与具身智能团队，联合创始人Luca Weihs深耕AI Agent与强化学习，Ross Girshick是计算机视觉领域的先驱人物[3] - 公司成立仅一年多，累计融资5000万美元，投资阵容包括前谷歌CEO施密特、DeepMind首席科学家杰夫•迪恩等[3] - 其产品Vy采用视觉优先方案，通过视觉模型理解屏幕元素再模拟鼠标键盘操作，能操控任何有屏幕的软件[3] - 在UI元素识别基准ScreenSpot v1上，其自研模型准确率高达92%，而OpenAI同类模型仅为18.3%[3] Anthropic的核心产品与市场表现 - Anthropic最核心的产品是Claude系列大语言模型，按能力分为三个层级：旗舰级Claude Opus系列、平衡性能与成本的Claude Sonnet系列、轻量级Claude Haiku系列[5][6] - 基于上述模型，公司开发了AI编程助手Claude Code和办公场景智能体Claude Cowork[6] - Anthropic的年化营收在2025年年底超过90亿美元，其中Claude Code的年化收入已达25亿美元[6] - 公司自成立以来累计融资额已超300亿美元，2026年2月完成300亿美元G轮融资后，投后估值飙升至3800亿美元，成为全球估值第二高的AI独角兽[5] Computer Use能力与模型性能进展 - Computer Use是Anthropic为Claude打造的核心能力，使其能直接操控电脑完成多步骤、跨应用的复杂任务，于2024年10月随Claude 3.5 Sonnet发布[2] - 在2024年底，Claude Sonnet模型在OSWorld评估中的准确率不足15%，而新一代Claude Sonnet 4.6模型准确率已提升至72.5%，在浏览复杂电子表格、跨标签页填写表单等任务上已接近人类水平[4] - Computer Use与Vercept的Vy均主打"像人一样看屏幕、操控电脑"的无API自动化，是公司进军AI智能体领域的关键一步[2]