产品发布与定位 - 谷歌正式发布Gemini 3 Flash模型,直接对标OpenAI和Anthropic的旗舰模型 [1] - 该模型被定位为“为速度而生的前沿智能”,核心卖点是速度快、价格低且性能在线 [1] - 谷歌通过快速迭代产品(紧随Gemini 3 Pro与Deep Think之后发布Flash)来挤压竞争对手的市场空间 [4] 性能与基准测试 - 官方宣称Gemini 3 Flash比前代Gemini 2.5 Pro速度快3倍 [1] - 在GPQA Diamond博士级推理测试中,Gemini 3 Flash获得90.4%的分数,与更大体积的前沿模型表现相当 [5] - 在Humanity‘s Last Exam高难度测试中,无需工具辅助获得33.7%的分数 [5] - 在MMMU Pro多模态理解与推理测试中,Gemini 3 Flash获得81.2%的分数,达到业界最先进水平,与自家Gemini 3 Pro(81.0%)表现相当 [5] - 在SWE-bench Verified编码测试中,Gemini 3 Flash获得78.0%的分数,高于自家Gemini 3 Pro的76.2% [6][15] - 在AIME 2025数学测试中,Gemini 3 Flash获得95.2%的分数(无工具),略高于Gemini 3 Pro的95.0% [6] - 在部分复杂任务(如复刻macOS界面、复古拟物风相机应用设计)中,其生成效果在视觉细节和交互精致度上明显逊于Gemini 3 Pro [19][21] 定价与成本 - Gemini 3 Flash的定价为Gemini 3 Pro的四分之一 [1] - 具体价格为:输入每百万Token 0.5美元,输出每百万Token 3美元 [6][26] - 音频输入价格为每百万Token 1美元 [26] - 与前代相比,其Token消耗比Gemini 2.5 Pro少了三成 [8] - 如果使用上下文缓存,重复Token的成本可再节省90%;使用Batch API异步处理可再节省50%成本 [28] 技术特点与能力 - Gemini 3 Flash是一个推理型模型,能根据任务复杂度灵活调整“思考”时间,具备自适应能力 [12] - 该模型具备多模态能力,能处理视觉、音频等输入,适合需要即时反馈的交互场景 [15] - 它具备代码执行能力,不仅能理解图片内容,还能在工具链支持下对图片进行处理与操作 [15] - 模型提供两种模式:Gemini 3 Flash (Fast) 主打快速响应;Gemini 3 Flash (Thinking) 具备轻量化模型推理能力,通过模拟人类思考过程提升复杂问题准确率 [4] 应用场景与集成 - 应用场景强调实时性、迭代效率和可执行性,例如在游戏中做实时辅助推理、在UI设计中生成动画并做A/B对比、根据图片生成交互式注释等 [17][19] - 谷歌将Gemini 3 Flash集成到其“全家桶”产品中,包括Gemini应用、搜索AI模式、Vertex AI、Google AI Studio等,并向全球用户免费开放体验 [26] - 企业用户可以通过Vertex AI和Gemini Enterprise调用该模型 [26] - 该模型被嵌入谷歌搜索的AI模式,能更好地理解复杂问题细节,抓取实时信息,输出视觉清晰、有条理的综合答案 [23] 市场竞争与行业影响 - 谷歌凭借极具竞争力的定价和性能,试图在“质量-成本-速度”三个维度上实现兼顾,对竞争对手OpenAI和Anthropic构成压力 [6][28] - 谷歌的核心竞争优势在于其庞大的用户流量(搜索、YouTube、Gmail、Google Maps等每日数十亿用户的产品)和深厚的基础设施积累(TPU、数据中心、分布式训练等),能通过将AI能力无感嵌入高频应用来培养用户依赖 [28][30] - 谷歌采取“两条腿走路”的策略:一方面向企业提供API服务,另一方面将AI能力直接集成到面向海量普通用户的产品中 [30] - 巨头间的竞争推动了模型能力增强和价格下降,使开发者能进行低成本创新,普通用户能享受更智能的服务 [30]
刚刚,Gemini 3 再次大更新!全球免费享 Pro 级智商,奥特曼又要失眠了