接连两位大咖出走，谷歌到底出了什么BUG？

文章核心观点 - 谷歌在AI领域，特别是在AI Agent产品上，正面临模型迭代缓慢、产品体验不佳、组织架构混乱导致的全栈优势丧失等问题，尽管其拥有强大的硬件、模型和用户入口基础 [5][17] - 行业竞争格局显示，OpenAI和Anthropic在AI Agent（如Codex和Claude Code）的产品化、商业化及用户增长上表现强劲，而谷歌的对应产品Antigravity则发展滞后 [5][40][41] 谷歌全栈优势的丧失 - 谷歌曾凭借自研TPU芯片（第七代Ironwood，一个pod提供42.5 ExaFlops算力）、统一的DeepMind研究体系以及Chrome、Android、YouTube等数十亿日活的用户入口，构建了强大的全栈优势 [9][10][11] - 文生图产品Nano Banana的成功得益于其低风险、短链路的特性，能够通过全栈快速迭代并收集用户反馈，从而在作图能力上超越GPT-4o [13][14][15] - 然而，在需要跨模型、权限、执行环境和承担长期责任的AI Agent产品上，谷歌的全栈能力出现协调问题，优势无法复刻 [15][16] 组织架构混乱导致产品线重叠与低效 - 谷歌内部至少有Google DeepMind、Google Labs、Google Cloud等多个互不统属的组织负责AI Agent相关能力，各自有不同的KPI和汇报线，导致资源分散 [21][23][25][26] - 这造成了产品线混乱：多个功能重叠的AI编程工具（如Gemini CLI、Jules、Code Assist、Firebase Studio、Antigravity）由不同团队开发，拥有不同品牌、入口和收费模式，甚至存在互相替代的情况 [18][19][20] - 缺乏统一的产品负责制，例如Antigravity由Google DeepMind孵化、Google Labs维护，又需接入Google Cloud体系，最终导致无人对其长期成功负责 [26][27][29] 评测导向与任务交付能力的脱节 - 谷歌的叙事过度依赖模型在受控环境下的基准测试（benchmark）分数，但行业已更看重模型在真实、长链条任务中的交付能力 [30][39] - 真实任务（如修复复杂bug）涉及多个步骤和外部工具调用，即使单步正确率达95%，连续20步全部成功的概率也仅约36% [34][35] - AI Agent产品的核心护城河在于错误恢复、状态保存、权限确认等可靠机制，而谷歌的Antigravity 2.0缺乏此类完整机制 [36][38] 行业竞争与商业化差距 - 竞争对手产品增长迅速：OpenAI的Codex桌面App上线首周下载量超100万，两个月后周活用户达400万；Anthropic的Claude Code在2026年2月暗示其年化收入已突破20亿美元 [40] - 商业化模式落后：Claude Code和Codex均有清晰的企业按人头付费模式，而谷歌的Antigravity 2.0发布一个多月后仍无明确企业版定价，仅通过Gemini Enterprise Agent赠送额度，未能形成有效的收费产品 [41][42]