最强开源模型!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用
硬AI·2025-04-29 08:18
点击 上方 硬AI 关注我们 Qwen3系列包括两个专家混合 (MoE) 模型和另外六个模型。阿里巴巴表示,最新发型的旗舰模型Qwen3- 235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini- 2.5-Pro等顶级模型相比,表现出极具竞争力。 此外,被称为"专家混合"(MoE,Mixture-of-Experts)模型的Qwen3-30B-A3B的激活参数数量是QwQ- 32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。这 类系统模拟人类解决问题的思维方式,将任务划分为更小的数据集,类似于让一组各有所长的专家分别负 责不同部分,从而提升整体效率。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Deepseek-R1 | Grok 3 Beta | Gemini2.5-Pro | OpenAl-o3-mini | | --- | --- | --- | --- | --- | --- | --- | --- | | | ...