谷歌AI往事：隐秘的二十年，与狂奔的365天

公司近期业绩与产品表现 - Gemini应用月活跃用户从上一季度的4.5亿大幅提升至6.5亿[2] - Gemini 3在各类主流基准上展现统治级表现，Nano Banana Pro模型将AI生图精度与想象力提升到新高度[2][43] - 公司进入罕见的产品加速期，接连发布视频模型Veo 3、虚拟世界生成模型Genie 3等“王炸”产品[43][44] 公司AI技术发展历史与积淀 - 公司二十多年间的AI投资贯穿现代深度学习绝大部分关键节点，从拉里·佩奇对“终极搜索引擎”的想象，到“猫论文”、DeepMind、TPU[4][6] - 在Transformer论文发表前十年，世界上几乎所有知名AI人才都曾在公司工作过[5] - 公司首次语言模型实验始于2000年左右，开发出拼写纠错功能，并进化出内部昵称为PHIL的概率语言模型[10][11] 关键技术突破与商业影响 - 2012年“猫论文”使用16000个CPU核心训练九层神经网络，通过无监督学习识别YouTube视频中的猫，证明无监督学习可行性[14][15] - “猫论文”技术催生推荐系统机制，被应用于YouTube并奠定其全球最大视频平台基础，后续被Facebook、Instagram、字节跳动效仿，创造数千亿美元收入[15][17] - 公司开发出Transformer架构，其模型彻底碾压基于LSTM的谷歌翻译方案，证明模型规模越大效果越好[34] 重要收购与人才战略 - 2014年以5.5亿美元收购DeepMind，获得最豪华AI研究团队，但收购间接导致OpenAI、Anthropic、xAI等公司诞生[22][23][24] - 收购DeepMind后，公司向英伟达订购4万块GPU，订单价值1.3亿美元，后继续花费数亿美元购买GPU[25][27] - 为应对ChatGPT威胁，公司将Google Brain和DeepMind合并为Google DeepMind，并召回谢尔盖·布林等顶级人才参与Gemini项目[42] 自研芯片与基础设施 - 为解决GPU成本过高和算力不足问题，公司自研TPU芯片，专门针对神经网络矩阵乘法进行优化，效率远高于当时GPU[28][29][30] - TPU通过降低计算精度提高效率，避免公司向英伟达支付高额溢价（英伟达GPU系统毛利率高达75%至80%）[31] - 自研TPU使公司建立规模几乎与英伟达相当的芯片研发体系，服务于自身和谷歌云客户[30] 战略误判与危机应对 - 公司早期已开发出与ChatGPT接近的聊天机器人Mina，但因失控风险、收入模式冲突和法律风险未发布[36][37] - ChatGPT的出现使公司意识到AI从持续性创新转变为颠覆性创新，对构成生存威胁，内部发布红色警报[41][42] - 公司决定结束多模型并存局面，集中资源打造多模态旗舰模型Gemini，并于2023年5月宣布计划后，同年12月发布公共测试版本[42][43]