Gemini 3 Flash 倒反天罡了:关键性能居然超过了 Pro
12 月 17 日,Google 正式发布 Gemini 3 Flash。一个定价只有 Claude 1/5、GPT 1/4 的"轻量模型",在编码上超过 Claude Sonnet 4.5,在推理和多模态上 全面碾压,和 GPT-5.2 也互有胜负。 | | Gemini 3 Flash | Claude Sonnet 4.5 | GPT-5.2 | | --- | --- | --- | --- | | 输入价格 | 3 | $1.75 | | 输出价格 | दें र | 14 | | SWE-bench 编码 | 78% | 77.2% | 80% | | GPQA 科学推理 | 90.4% | 83.4% | 92.4% | | MMMU-Pro 多模态 | 81.2% | 68.0% | 79.5% | MMMU-Pro,多模态的评估效果: 更夸张的是,它甚至超过了自家旗舰:在 SWE-bench 上,Gemini 3 Flash 78%,Gemini 3 Pro 76.2%,这也是 Flash 系列诞生以来超过同代 Pro 模型的第 一次。 数据可能还是有点抽象,直 ...