Workflow
最强开源模型!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用
硬AI·2025-04-29 08:18

阿里巴巴发布Qwen3系列模型 - 阿里巴巴开源通义千问3.0(Qwen3)系列模型,包括两个专家混合(MoE)模型和六个Dense模型,支持119种语言并降低部署成本 [3][6] - Qwen3系列集成两种思考模式("思考模式"和"非思考模式"),可根据任务复杂度灵活调整推理深度 [9][10][11] - 训练数据量达36万亿token,是Qwen2.5的两倍,分三阶段预训练以增强语言、知识和长上下文处理能力 [14][15][16] 性能表现与模型架构 - 旗舰模型Qwen3-235B-A22B在代码、数学等基准测试中媲美DeepSeek-R1、OpenAI o1等顶级模型 [6][7] - MoE模型Qwen3-30B-A3B激活参数仅为QwQ-32B的10%,性能更优;小模型Qwen3-4B可匹敌Qwen2.5-72B-Instruct [6] - 模型架构包括2350亿总参数(220亿激活)的Qwen3-235B-A22B和300亿总参数(30亿激活)的Qwen3-30B-A3B,均开源 [7][8] 成本优势与AGI目标 - Qwen3旗舰模型部署成本仅为DeepSeek-R1的25%-35%,节省65%-75% [20] - 混合推理模型支持"思考预算"控制,优化成本效益 [12][20] - 阿里巴巴将Qwen3视为实现通用人工智能(AGI)的关键里程碑,计划扩展数据规模、模型大小和模态范围 [22] 行业反响与开源影响 - 开源社区高度评价Qwen3性能,称其32B模型与Gemini 2.5 Pro相当 [26][27] - 阿里巴巴通过开源推动AI生态发展,用户可基于Qwen-Agent工具链高效调用模型能力 [17][18]