谷歌发布Gemini 3 Flash模型 - 谷歌推出Gemini 3家族新成员Flash模型,旨在以更低成本、更快速度向全球数百万用户提供接近旗舰模型的AI能力 [1][3] - 该模型发布当天即取代Gemini 2.5 Flash,成为Gemini App和谷歌搜索AI模式的默认驱动模型 [1] - 谷歌将其定位为“老黄牛式”模型,专注于快速高效,以支持批量任务 [3][10] 模型性能与基准测试表现 - 在评估代理编程能力的SWE-bench Verified基准测试中,Gemini 3 Flash解决率达78%,优于Gemini 3 Pro的76.2%,仅次于GPT-5.2的80% [1][5] - 在多模态推理基准MMMU-Pro中,Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在内的所有竞争对手 [8] - 在博士级科学知识基准GPQA Diamond上,Gemini 3 Flash得分为90.4%,虽低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他对手得分均低于90% [9] - 在跨领域专业知识测试Humanity's Last Exam中,不使用工具时得分为33.7%,低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%,但远超Gemini 2.5 Flash的11% [8] - 在数学基准AIME 2025上,不使用工具时得分为95.2%,略高于Gemini 3 Pro的95.0% [10] 成本与速度优势 - 定价为每百万输入token 0.50美元,每百万输出token 3.00美元,成本仅为Gemini 3 Pro的四分之一 [1][3][15] - 运行速度达到Gemini 2.5 Pro的三倍 [1][3] - 在处理需要思考的任务时,平均使用的token数量比Gemini 2.5 Pro少30%,有助于降低总体使用成本 [12] - 配备标准上下文缓存功能,能在重复使用token的应用中实现高达90%的成本削减 [15] 市场竞争与行业影响 - 谷歌与OpenAI的竞争日趋白热化,谷歌11月发布Gemini 3系列促使OpenAI本月初拉响红色警报 [3][4] - 虽然ChatGPT在11月下旬仍垄断90%的移动端会话,但Gemini在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率最近均超过ChatGPT [4] - 自Gemini 3发布以来,谷歌API每天处理的token数量已超过1万亿 [4] - 行业认为这场竞赛已演变为谷歌与OpenAI的二元对抗,对AI技术及整个经济产生重大影响,任何公司都可能迅速从领先者沦为陪跑者 [4] 产品部署与企业应用 - 模型即日起面向全球用户推出,覆盖消费者、开发者和企业三大群体 [17] - 在Gemini App中,全球用户可免费使用该模型,谷歌搜索AI模式也将其设为默认模型 [1][17] - 开发者可通过Google AI Studio、Gemini CLI、Vertex AI等平台获取预览版本 [17] - 多家知名企业已开始使用,包括桥水基金、Salesforce、Workday、Figma、Cursor、Harvey和Latitude等 [17][18][19] - 桥水基金AIA Labs负责人表示,该模型能处理大量非结构化多模态数据集而不牺牲概念理解 [18] - 软件开发公司JetBrains表示,该模型提供了接近Gemini 3 Pro的质量,同时推理延迟和成本显著降低 [18]
连月挑战OpenAI!谷歌发布更高效Gemini 3 Flash,App默认模型,上线即加持搜索