连月挑战OpenAI！谷歌发布更高效Gemini 3 Flash，App默认模型，上线即加持搜索

谷歌发布Gemini 3 Flash模型 - 谷歌推出Gemini 3家族新成员Flash模型，旨在以更低成本、更快速度向全球数百万用户提供接近旗舰模型的AI能力 [1][3] - 该模型发布当天即取代Gemini 2.5 Flash，成为Gemini App和谷歌搜索AI模式的默认驱动模型 [1] - 谷歌将其定位为“老黄牛式”模型，专注于快速高效，以支持批量任务 [3][10] 模型性能与基准测试表现 - 在评估代理编程能力的SWE-bench Verified基准测试中，Gemini 3 Flash解决率达78%，优于Gemini 3 Pro的76.2%，仅次于GPT-5.2的80% [1][5] - 在多模态推理基准MMMU-Pro中，Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在内的所有竞争对手 [8] - 在博士级科学知识基准GPQA Diamond上，Gemini 3 Flash得分为90.4%，虽低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%，但其他对手得分均低于90% [9] - 在跨领域专业知识测试Humanity's Last Exam中，不使用工具时得分为33.7%，低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%，但远超Gemini 2.5 Flash的11% [8] - 在数学基准AIME 2025上，不使用工具时得分为95.2%，略高于Gemini 3 Pro的95.0% [10] 成本与速度优势 - 定价为每百万输入token 0.50美元，每百万输出token 3.00美元，成本仅为Gemini 3 Pro的四分之一 [1][3][15] - 运行速度达到Gemini 2.5 Pro的三倍 [1][3] - 在处理需要思考的任务时，平均使用的token数量比Gemini 2.5 Pro少30%，有助于降低总体使用成本 [12] - 配备标准上下文缓存功能，能在重复使用token的应用中实现高达90%的成本削减 [15] 市场竞争与行业影响 - 谷歌与OpenAI的竞争日趋白热化，谷歌11月发布Gemini 3系列促使OpenAI本月初拉响红色警报 [3][4] - 虽然ChatGPT在11月下旬仍垄断90%的移动端会话，但Gemini在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率最近均超过ChatGPT [4] - 自Gemini 3发布以来，谷歌API每天处理的token数量已超过1万亿 [4] - 行业认为这场竞赛已演变为谷歌与OpenAI的二元对抗，对AI技术及整个经济产生重大影响，任何公司都可能迅速从领先者沦为陪跑者 [4] 产品部署与企业应用 - 模型即日起面向全球用户推出，覆盖消费者、开发者和企业三大群体 [17] - 在Gemini App中，全球用户可免费使用该模型，谷歌搜索AI模式也将其设为默认模型 [1][17] - 开发者可通过Google AI Studio、Gemini CLI、Vertex AI等平台获取预览版本 [17] - 多家知名企业已开始使用，包括桥水基金、Salesforce、Workday、Figma、Cursor、Harvey和Latitude等 [17][18][19] - 桥水基金AIA Labs负责人表示，该模型能处理大量非结构化多模态数据集而不牺牲概念理解 [18] - 软件开发公司JetBrains表示，该模型提供了接近Gemini 3 Pro的质量，同时推理延迟和成本显著降低 [18]