Gemini如何逆风翻盘?谷歌首席AI架构师:从承认落后开始,找回自己的节奏
华尔街见闻·2025-11-27 21:16

谷歌AI战略转型 - 谷歌从承认在AI领域落后于竞争对手到通过Gemini 3实现系统性领先,完成技术复兴 [1][2] - 公司首席AI架构师指出,承认落后是内部共识转折和创新的真正起点 [2] - 通过组织重构和基础设施激活,公司在短短两年内扭转局面,重塑行业领先地位 [2][9] 技术架构与多模态战略 - 多模态被视为底层架构必然选择,而非锦上添花,因为世界理解需要融合文本、图像、音频和视频等多维信息 [4] - 谷歌选择从架构级别统一多模态,进行模型结构、token化方式、训练损失和推理路径的底层重构,使模型在图表解析和跨模态任务上拉开差距 [4] - 多模态意义在于增强模型对世界的理解,而非仅生成美观图片 [4] 组织与运营模式变革 - 公司从串行流水线模式转变为并行系统,产品、工程、安全团队从训练第一天就深度协同,打破迭代缓慢和链路割裂问题 [5] - 组织重构让Gemini迭代节奏首次追上竞争对手,模型更稳定、更懂用户意图,能执行真实任务 [5][6] - 对于拥有20万员工的大公司,组织重构难度远高于单次模型迭代 [6] 产品体验与能力提升 - 用户体验改善主因是可用性成为核心目标,包括指令理解能力大幅提升、国际化适配进入核心能力集、工具链与代码执行能力跃升 [7][8] - 模型变好是系统工程成熟后的必然效果,而非单点智力提升 [8] - 公司强调模型在真实世界中的落地应用广度是衡量进步最重要标准,覆盖科研、教育、法律、工程等多元场景 [12] 基础设施与竞争优势 - 基础设施是公司核心优势,包括TPU、全球数据中心、跨产品分发能力、成熟安全体系及Search与Android庞大入口,形成难以复制的网络效应 [9] - Gemini提升本质是基础设施重新被激活,支撑公司快速重返行业中心 [9] - 全栈能力和各层专家协同使模型设计能与硬件、网络和大规模运行环境深度结合 [72] 未来竞争方向与商业价值 - 下一阶段AI竞争从语言智能转向行动智能,重点是多步骤任务完成能力,涉及工作流自动化、开发者工具链、企业任务智能化等领域 [10][11] - 行动模型是平台,商业价值远高于作为产品的对话模型 [11] - AI正从语言模型转向任务操作系统,Gemini目标成为此类系统底层能力 [11] 创新机制与长期发展 - 公司认为创新枯竭是最大风险,而非技术本身,强调不存在终极配方或标准化解决方案 [13][74] - 通过Gemini项目内部探索新架构、新想法,并与谷歌Research、学术界广泛合作,保持多维创新能力 [74][75] - 工程思维成为核心,安全、信任等要素从基础开始嵌入开发过程,而非最后补丁 [35] 全球化协同与规模效应 - Gemini开发凝聚全球团队心血,涵盖欧洲、亚洲等多地研发网络,实现全谷歌协同 [39][40] - 产品团队从研发初期深度参与,确保模型就绪时所有产品同步升级,形成标准流程 [40] - 公司庞大资源从阻力转化为优势,通过独特能力和协同机制支撑大规模创新 [83]