接连两位大咖出走,谷歌到底出了什么BUG?
谷歌谷歌(US:GOOG) 虎嗅APP·2026-06-20 21:51

文章核心观点 - 谷歌在AI领域,特别是在AI Agent产品上,正面临模型迭代缓慢、产品体验不佳、组织架构混乱导致的全栈优势丧失等问题,尽管其拥有强大的硬件、模型和用户入口基础 [5][17] - 行业竞争格局显示,OpenAI和Anthropic在AI Agent(如Codex和Claude Code)的产品化、商业化及用户增长上表现强劲,而谷歌的对应产品Antigravity则发展滞后 [5][40][41] 谷歌全栈优势的丧失 - 谷歌曾凭借自研TPU芯片(第七代Ironwood,一个pod提供42.5 ExaFlops算力)、统一的DeepMind研究体系以及Chrome、Android、YouTube等数十亿日活的用户入口,构建了强大的全栈优势 [9][10][11] - 文生图产品Nano Banana的成功得益于其低风险、短链路的特性,能够通过全栈快速迭代并收集用户反馈,从而在作图能力上超越GPT-4o [13][14][15] - 然而,在需要跨模型、权限、执行环境和承担长期责任的AI Agent产品上,谷歌的全栈能力出现协调问题,优势无法复刻 [15][16] 组织架构混乱导致产品线重叠与低效 - 谷歌内部至少有Google DeepMind、Google Labs、Google Cloud等多个互不统属的组织负责AI Agent相关能力,各自有不同的KPI和汇报线,导致资源分散 [21][23][25][26] - 这造成了产品线混乱:多个功能重叠的AI编程工具(如Gemini CLI、Jules、Code Assist、Firebase Studio、Antigravity)由不同团队开发,拥有不同品牌、入口和收费模式,甚至存在互相替代的情况 [18][19][20] - 缺乏统一的产品负责制,例如Antigravity由Google DeepMind孵化、Google Labs维护,又需接入Google Cloud体系,最终导致无人对其长期成功负责 [26][27][29] 评测导向与任务交付能力的脱节 - 谷歌的叙事过度依赖模型在受控环境下的基准测试(benchmark)分数,但行业已更看重模型在真实、长链条任务中的交付能力 [30][39] - 真实任务(如修复复杂bug)涉及多个步骤和外部工具调用,即使单步正确率达95%,连续20步全部成功的概率也仅约36% [34][35] - AI Agent产品的核心护城河在于错误恢复、状态保存、权限确认等可靠机制,而谷歌的Antigravity 2.0缺乏此类完整机制 [36][38] 行业竞争与商业化差距 - 竞争对手产品增长迅速:OpenAI的Codex桌面App上线首周下载量超100万,两个月后周活用户达400万;Anthropic的Claude Code在2026年2月暗示其年化收入已突破20亿美元 [40] - 商业化模式落后:Claude Code和Codex均有清晰的企业按人头付费模式,而谷歌的Antigravity 2.0发布一个多月后仍无明确企业版定价,仅通过Gemini Enterprise Agent赠送额度,未能形成有效的收费产品 [41][42]

接连两位大咖出走,谷歌到底出了什么BUG? - Reportify