Qwen3大模型
搜索文档
给阿里千问一个“客观估计”——围绕QWen3的大模型横评
阿尔法工场研究院· 2025-11-20 10:21
导语:Qwen3 旗舰模型已进入全球第一梯队、国内Top 2–3的行列:综合能力略低于Gemini3、GPT-5.1和Kimi K2 Thinking,但与Grok 4.1、Claude Opus 4.1属于同档。 阿里近期发布的千问 App 引发了外界的关注,其背后的 Qwen3 大模型与国际和国内几大模型的性能对比,到底水平如何?对用户来说又该如何 根据不同的任务来选择不同的大模型?今天给大家做个对比与总结。 Qwen3 的基本面 阿里在 今 年推出 的第三代大模型 Qwen3 ,是千问 App 的核心底座。它有几个关键特点: 一、体量和架构 Dense 模型:从 0.6B 一直到 32B; MoE 旗舰: Qwen3- 235B-A22B ( 235B 总参数、 22B 活跃参数),相当于 " 参数巨舰 + 算力省电 "。 二、训练规模 训练数据约 36 万亿 token ,覆盖 119 种语言 / 方言 。 对数学、代码、 STEM 推理做了额外强化。提供 " Thinking 模式 " ,类似 GPT-o1 / DeepSeek-R1 那种显式推理版。 三、应用形态 包括文本对话、写作、代码、多模态 ...