Workflow
Qwen3真香!通义App满血接入,一手实测在此
量子位·2025-04-30 12:10

开源大模型Qwen3发布 - 开源大模型Qwen3发布后引发全球关注,被称为"开源界新王者"[1][6] - 模型包含8款混合推理模型,参数量从0.6B到235B全面覆盖[11] - 32B模型性能超越OpenAI o1和DeepSeek R1,在编程基准测评中超过Gemini 2.5 Pro[11] - 支持119种语言和方言,加强对MCP支持[11][56] 模型性能表现 - 在代码生成测试中,Qwen3-235B模型用时1分钟生成100多行代码[19] - 逻辑推理测试中,Qwen3正确解答经典过河问题[42][43] - 解答普特南数学竞赛难题用时5分38秒,快于Grok 3的8分钟[50][53] - 多语言能力测试显示可翻译莎士比亚作品,参考优秀译本避免侵权[58][59] 应用场景拓展 - 通义App集成Qwen3后支持多种智能体玩法[10][14] - 可实现旅游规划、购物比价、AI写歌等功能[64][69][71] - 开发者社区反应热烈,Reddit等平台讨论热度高[80][81] - 模型生成速度快,体验丝滑,擅长推理和代码实现[75] 技术发展历程 - Qwen系列5个月内快速迭代,从QwQ到Qwen3实现技术突破[82] - 采用Apache 2.0协议,更加开放和商用友好[83] - 代表中国开源力量的发展速度,与DeepSeek形成行业格局变化[81][82] 实测数据对比 - 代码能力测试中Qwen3-235B得分为95.6,优于Grok 3 Beta Think的96.4[24] - 在AIME'25测试中Qwen3-235B得分为81.5,高于OpenAl-o1的70.2[24] - CodeForces Elo Rating显示Qwen3-235B为2056,接近Gemini2.5-Pro的2001[24] - 32B密集模型在AIME'24测试中得分为81.4,优于OpenAl-o1的74.3[7]