Workflow
阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507

模型性能提升 - 新模型Qwen3-30B-A3B-Thinking-2507在推理能力、通用能力及上下文长度上较4月29日开源的Qwen3-30-A3B模型有显著提升 [1] - 在AIME25评测中得分85.0,LiveCodeBench v6评测中得分66.0,两项核心推理能力超越Gemini2.5-Flash和Qwen3-235B-A22B [3] - 知识水平(GPQA、MMLU-Pro)较上一版本进步显著 [3] 通用能力表现 - 在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等评测中均超越Gemini2.5-Flash和Qwen3-235B-A22B [3] - 原生支持256K tokens上下文理解,可扩展至1M tokens [3] - 思考长度增加,官方推荐在高度复杂推理任务中设置更长思考预算以发挥潜力 [5] 模型部署与可用性 - 已在魔搭社区、HuggingFace上开源,轻量体积适合消费级硬件本地部署 [5] - 在Qwen Chat同步上线新模型 [5]