Gemini 3 Flash 倒反天罡了：关键性能居然超过了 Pro

12 月 17 日，Google 正式发布 Gemini 3 Flash。一个定价只有 Claude 1/5、GPT 1/4 的"轻量模型"，在编码上超过 Claude Sonnet 4.5，在推理和多模态上全面碾压，和 GPT-5.2 也互有胜负。 | | Gemini 3 Flash | Claude Sonnet 4.5 | GPT-5.2 | | --- | --- | --- | --- | | 输入价格 | $0.5 |$ 3 | $1.75 | | 输出价格 | दें र | $15 |$ 14 | | SWE-bench 编码 | 78% | 77.2% | 80% | | GPQA 科学推理 | 90.4% | 83.4% | 92.4% | | MMMU-Pro 多模态 | 81.2% | 68.0% | 79.5% | MMMU-Pro，多模态的评估效果：更夸张的是，它甚至超过了自家旗舰：在 SWE-bench 上，Gemini 3 Flash 78%，Gemini 3 Pro 76.2%，这也是 Flash 系列诞生以来超过同代 Pro 模型的第一次。数据可能还是有点抽象，直 ...