狙击Open AI！谷歌一个月内连发「数弹」

产品发布与核心定位 - 谷歌于12月18日发布Gemini 3 Flash，定位为Gemini 3系列中速度最快、性价比最高的模型 [1] - 该模型突破了轻量化模型性能打折的传统印象，在保持高速和低成本的同时，部分性能甚至优于旗舰模型 [1][5] - 谷歌CEO表示，该模型在性能和效率上均突破了帕累托极限，性能超越上一代旗舰模型Gemini 2.5 Pro，同时速度提升3倍，价格更低 [3] 性能表现与基准测试 - 在编程能力基准测试SWE-bench Verified中，Gemini 3 Flash得分高达78%，超越了自家旗舰Gemini 3 Pro（76.2%）和竞争对手Claude Sonnet 4.5（77.2%）[4] - 在多模态理解基准MMMU-Pro上，Gemini 3 Flash得分81.2%，超过GPT-5.2（79.5%），并大幅领先Claude Sonnet 4.5（68.0%）[4] - 在数学基准AIME 2025（无工具）测试中，得分为95.2%，与Gemini 3 Pro（95.0%）相当 [5] - 根据大模型竞技场Imarena.ai数据，该模型在文本、图像和编程领域排名前5，在数学和创意写作类别排名第2 [6] 定价策略与成本优势 - Gemini 3 Flash的输入定价为0.5美元/百万Tokens，输出定价为3美元/百万Tokens [5][6] - 其输出价格显著低于主要竞争对手，Claude Sonnet 4.5输出为15美元/百万Tokens，GPT-5.2输出为14美元/百万Tokens，约为Gemini 3 Flash定价的5倍 [6] - 开发者预计，若从GPT-4o或Gemini 3 Pro切换至Gemini 3 Flash，应用运行成本可降低50%-70% [8] 效率与技术进步 - 在典型流量测试中，Gemini 3 Flash平均使用的令牌数量比上一代Gemini 2.5 Pro少30% [7] - 该模型保留了Gemini 3系列在复杂推理、多模态、智能体和编程任务方面的突破性性能，同时具备Flash级别的低延迟和高效率 [7] - 在开发者进行的Python对比测试中，Gemini 3 Flash完成任务仅需9秒，速度快于GPT-5 Mini（35秒）和DeepSeek-V3.2（41秒），且效果更优 [7] 市场策略与影响 - 这是谷歌一个月内在大模型领域的第四次重大更新 [2] - Gemini 3 Flash将面向所有用户推出，包括免费用户，并在Gemini App中替代Gemini 2.5 Flash成为新的默认模型 [8] - 谷歌表示，Flash系列一直是内部最受欢迎的版本，此前的Flash 2和2.5处理了数百万开发者构建的数十万个应用程序中的数万亿个tokens [9] - 自Gemini 3系列发布以来，谷歌内部API每天处理超过1万亿个tokens，用户广泛用于代码模拟、学习复杂主题和构建交互式游戏等 [8] - 凭借此次发布，谷歌旨在巩固其在大模型领域的领先地位，并给竞争对手OpenAI带来压力 [9]