产品发布与核心定位 - 谷歌于12月18日发布Gemini 3 Flash,定位为Gemini 3系列中速度最快、性价比最高的模型 [1] - 该模型突破了轻量化模型性能打折的传统印象,在保持高速和低成本的同时,部分性能甚至优于旗舰模型 [1][5] - 谷歌CEO表示,该模型在性能和效率上均突破了帕累托极限,性能超越上一代旗舰模型Gemini 2.5 Pro,同时速度提升3倍,价格更低 [3] 性能表现与基准测试 - 在编程能力基准测试SWE-bench Verified中,Gemini 3 Flash得分高达78%,超越了自家旗舰Gemini 3 Pro(76.2%)和竞争对手Claude Sonnet 4.5(77.2%)[4] - 在多模态理解基准MMMU-Pro上,Gemini 3 Flash得分81.2%,超过GPT-5.2(79.5%),并大幅领先Claude Sonnet 4.5(68.0%)[4] - 在数学基准AIME 2025(无工具)测试中,得分为95.2%,与Gemini 3 Pro(95.0%)相当 [5] - 根据大模型竞技场Imarena.ai数据,该模型在文本、图像和编程领域排名前5,在数学和创意写作类别排名第2 [6] 定价策略与成本优势 - Gemini 3 Flash的输入定价为0.5美元/百万Tokens,输出定价为3美元/百万Tokens [5][6] - 其输出价格显著低于主要竞争对手,Claude Sonnet 4.5输出为15美元/百万Tokens,GPT-5.2输出为14美元/百万Tokens,约为Gemini 3 Flash定价的5倍 [6] - 开发者预计,若从GPT-4o或Gemini 3 Pro切换至Gemini 3 Flash,应用运行成本可降低50%-70% [8] 效率与技术进步 - 在典型流量测试中,Gemini 3 Flash平均使用的令牌数量比上一代Gemini 2.5 Pro少30% [7] - 该模型保留了Gemini 3系列在复杂推理、多模态、智能体和编程任务方面的突破性性能,同时具备Flash级别的低延迟和高效率 [7] - 在开发者进行的Python对比测试中,Gemini 3 Flash完成任务仅需9秒,速度快于GPT-5 Mini(35秒)和DeepSeek-V3.2(41秒),且效果更优 [7] 市场策略与影响 - 这是谷歌一个月内在大模型领域的第四次重大更新 [2] - Gemini 3 Flash将面向所有用户推出,包括免费用户,并在Gemini App中替代Gemini 2.5 Flash成为新的默认模型 [8] - 谷歌表示,Flash系列一直是内部最受欢迎的版本,此前的Flash 2和2.5处理了数百万开发者构建的数十万个应用程序中的数万亿个tokens [9] - 自Gemini 3系列发布以来,谷歌内部API每天处理超过1万亿个tokens,用户广泛用于代码模拟、学习复杂主题和构建交互式游戏等 [8] - 凭借此次发布,谷歌旨在巩固其在大模型领域的领先地位,并给竞争对手OpenAI带来压力 [9]
狙击Open AI!谷歌一个月内连发「数弹」