凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o
机器之心·2025-07-30 08:48
机器之心报道 编辑:张倩 继前段时间密集发布了三款 AI 大模型后,Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一个新版本: Qwen3-30B-A3B-Instruct-2507 。 这个新版本是一个 非思考模式 (non-thinking mode)的新模型。它的亮点在于, 仅激活 30 亿(3B)参数,就能展现出与业界顶尖闭源模型,如谷歌的 Gemini 2.5-Flash(非思考模式)和 OpenAI 的 GPT-4o 相媲美的超强实力 ,这标志着在模型效率和性能优化上的一次重大突破。 下图展示了该模型的性能数据,可以看出,与更新前的版本相比,新版本在多项测试中都实现了跨越式提升,比如 AIME25 从之前的 21.6 提升到了 61.3,Arena- Hard v2 成绩从 24.8 提升到了 69.0。 下图展示了新版本和 DeepSeek-V3-0324 等模型的性能对比结果,可以看到,在很多基准测试中,新版本模型可以基本追平甚至超过 DeepSeek-V3-0324。 | | Deepseek-V3- | | Gemini-2.5-Flash | Qwen3-235B ...