刚刚,让谷歌翻身的Gemini 3,上线Flash版
机器之心·2025-12-18 08:03

谷歌发布Gemini 3 Flash模型 - 谷歌发布高速、低成本模型Gemini 3 Flash,作为其大模型领域收官之作,并已将其设为Gemini应用和搜索AI模式中的默认模型 [2][3] - 该模型距离前代Gemini 2.5 Flash发布仅六个月,但在性能上实现了显著跃升,并在部分指标上达到了Gemini 3 Pro和GPT-5.2等前沿模型的水平 [3] - 新模型在全球范围内向数以百万计的用户开放,覆盖Gemini应用、搜索AI模式、Google AI Studio、Vertex AI和Gemini Enterprise等渠道 [7][12][33] 模型性能与基准测试 - 在Humanity's Last Exam基准测试中,Gemini 3 Flash在不使用工具的情况下得分为33.7%,接近Gemini 3 Pro的37.5%和GPT-5.2的34.5%,远高于前代Gemini 2.5 Flash的11% [6][10] - 在GPQA Diamond科学知识基准测试中,Gemini 3 Flash取得90.4%的高分,接近Gemini 3 Pro的91.9%和GPT-5.2的92.4% [10][13] - 在多模态推理基准MMMU Pro上,Gemini 3 Flash以81.2%的分数达到当前最先进水平,与Gemini 3 Pro的81.0%不相上下 [11][13] - 在代码智能体能力基准测试SWE-bench Verified上,Gemini 3 Flash取得78.0%的成绩,超越了Gemini 3 Pro的76.2% [13][20] - 在视觉推理基准ARC-AGI-2上,Gemini 3 Flash以33.6%的成绩超过了Gemini 3 Pro的31.1% [13][14] - 精简后的模型体积缩小了3-4倍,但性能已超越6个月前的前沿模型 [14] 模型效率、速度与成本 - Gemini 3 Flash被定位为全球性价比最高的模型,在智能与成本上具有优势 [4] - 模型具备极致的原生速度,响应时间基本在1秒以内,与搜索引擎一样快 [7] - 在最高思考等级下,模型能动态调节思考深度,平均使用的token数量比Gemini 2.5 Pro减少约30% [14] - 根据基准测试,Gemini 3 Flash在性能超越Gemini 2.5 Pro的同时,速度提升达到3倍,而成本仅为其一小部分 [16] - 在定价方面,Gemini 3 Flash的输入费用为每100万token收费0.50美元,输出费用为每100万token收费3.00美元 [13][23] - 该价格显著低于Gemini 3 Pro的输入2.00美元/百万token和输出12.00美元/百万token,也低于GPT-5.2 Extra high的输入1.75美元/百万token和输出14.00美元/百万token [13] 应用场景与开发者工具 - 模型专为高频迭代开发打造,提供低延迟和Gemini 3 Pro级别的代码能力,适合高并发、快节奏的工作流 [19] - 其推理、工具使用及多模态能力非常适合复杂的视频分析、数据抽取和视觉问答,能支撑游戏内助手或A/B测试等需要快速响应和深度推理的应用场景 [21] - 企业客户如JetBrains、Bridgewater Associates和Figma已开始使用该模型推动业务转型,认可其推理速度、效率及媲美更大规模模型的能力 [25] - 开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及全新的智能体开发平台Google Antigravity访问该模型 [12][33] 消费者应用与市场影响 - Gemini 3 Flash已成为Gemini应用的默认免费模型,取代了2.5 Flash,大幅提升全球用户日常任务处理效率 [28] - 用户可利用其多模态能力快速理解视频和图像,并在几秒钟内将其转化为实用计划,或通过语音指令在几分钟内从零开始构建功能完善的应用程序 [28][30] - 模型正逐步推广,旨在成为谷歌搜索功能中AI模式的默认模型,以搜索的速度提供全面、结合实时网络信息的回复与分析 [32] - 行业观察认为,新模型预示着AI模型新时代的到来,并可能被谷歌用来增强或替代搜索引擎,或逐渐移植到移动端侧 [8]