Qwen全面升级非思考模型,3B激活、256K长文、性能直逼GPT-4o
量子位·2025-07-30 17:44
henry 发自 凹非寺 量子位 | 公众号 QbitAI Happy QwensWeek果然名不虚传。 Qwen的基础模型接连开源,现在 全新非思考模型Qwen3-30B-A3B-Instruct-2507也闪电上线。 仅激活 3B 参数,就能取得媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型的超强性能。 相较前代的非思考模型Qwen3-30B-A3B Non-Thinking,这次"小更新"使模型的通用能力方面得到了关键提升。 其中,模型的推理能力(AIME25)提升了183.8%,而对其能力(Arena-Hard v2)则提升了178.2%。此外,模型的长文本处理能力也由前 代的128K提升至256K。 作为Qwen3系列Qwen3-30B-A3B 的高质量指令微调版本 ,其不再有块,完全以非思考模式运行。 可以说,这款新模型就像Qwen团队说的:" 更轻、更强、更好用! " 这么一波操作下来,网友都觉得"太疯狂":哥,你慢点! | Guillaume � @glevd · 11h | | | | | --- | --- | --- | --- | | Th ...